Está en la página 1de 125

Area de Ciencias Basicas

ESPECIALIZACION EN
ESTADISTICA APLICADA
Universidad del Norte

Gua resumida sobre


Metodos Estadsticos
Teora y practica

Dr. rer. nat Humberto LLinas Solano


Profesor de la Universidad del Norte

Barranquilla - Colombia
2005
Contenido

1 Estadstica descriptiva 4
1.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Medidas estadsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Analisis exploratorio de datos . . . . . . . . . . . . . . . . . . . . . . . 9
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Probabilidad 20
2.1 Experimentos, espacios muestrales y eventos . . . . . . . . . . . . . . . 20
2.2 Tecnicas de conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Introduccion a la probabilidad . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3 Distribuciones de probabilidad 31
3.1 Variables aleatorias discretas . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Variables aleatorias continuas . . . . . . . . . . . . . . . . . . . . . . . 32
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4 Distribuciones especiales 36
4.1 La distribucion uniforme (discreta) . . . . . . . . . . . . . . . . . . . . 36
4.2 La distribucion binomial . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.3 La distribucion de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.4 La distribucion hipergeometrica . . . . . . . . . . . . . . . . . . . . . . 39
4.5 Las distribuciones binomial negativa y geometrica . . . . . . . . . . . . 41
4.6 La distribucion uniforme (continua) . . . . . . . . . . . . . . . . . . . . 42
4.7 La distribucion normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.8 Las distribuciones gamma y exponencial . . . . . . . . . . . . . . . . . 45
4.9 Resumen de las distribuciones especiales . . . . . . . . . . . . . . . . . 48
CONTENIDO 2

Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

5 Distribuciones conjuntas 54
5.1 Vectores aleatorios discretos . . . . . . . . . . . . . . . . . . . . . . . . 54
5.2 Vectores aleatorios continuos . . . . . . . . . . . . . . . . . . . . . . . 56
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

6 Distribuciones muestrales 61
6.1 Conceptos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.2 Distribuciones muestrales de algunos estadsticos . . . . . . . . . . . . 62
6.3 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

7 Intervalos de confianza 71
7.1 Estimacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.2 Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7.3 Intervalos de confianza para algunos parametros . . . . . . . . . . . . . 72
7.4 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
7.5 Determinacion del tamano de una muestra . . . . . . . . . . . . . . . . 77
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

8 Pruebas de hipotesis 84
8.1 Conceptos de la prueba de hipotesis . . . . . . . . . . . . . . . . . . . 84
8.2 Pruebas para algunos parametros poblacionales . . . . . . . . . . . . . 86
8.3 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

A Gua rapida para trabajar con Statgraphics 97


A.1 Analisis de un solo conjunto de datos . . . . . . . . . . . . . . . . . . . 97
A.2 Analisis simultaneo de dos o mas conjuntos de datos . . . . . . . . . . 97
A.3 Graficos de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
A.4 Diagramas de presentacion . . . . . . . . . . . . . . . . . . . . . . . . 98
A.5 Variables numericas multidimensionales . . . . . . . . . . . . . . . . . . 99
A.6 Distribuciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . 99
A.7 Inferencias basadas en una sola muestra . . . . . . . . . . . . . . . . . 99
A.8 Inferencias basadas en dos muestras . . . . . . . . . . . . . . . . . . . 100
A.9 Bondad de ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

B Gua rapida para trabajar con SPSS 101


B.1 Definicion de las variables . . . . . . . . . . . . . . . . . . . . . . . . . 101
B.1.1 Transformacion de una variable . . . . . . . . . . . . . . . . . . 102
B.1.2 Recodificacion de una Variable . . . . . . . . . . . . . . . . . . 103
B.1.3 Filtrado de datos . . . . . . . . . . . . . . . . . . . . . . . . . 103
B.2 Analisis exploratorio de datos . . . . . . . . . . . . . . . . . . . . . . . 104
B.3 Inferencia sobre una o mas poblaciones . . . . . . . . . . . . . . . . . . 105

C Uso de la calculadora en la estadstica 106


Contenido 3

D Apendice de tablas 108


D.1 La funcion de distribucion binomial . . . . . . . . . . . . . . . . . . . . 108
D.2 La funcion de distribucion de Poisson . . . . . . . . . . . . . . . . . . . 110
D.3 La funcion de distribucion normal . . . . . . . . . . . . . . . . . . . . . 112
D.4 La funcion gamma incompleta . . . . . . . . . . . . . . . . . . . . . . 114
D.5 Valores crticos para la distribucion t de Student . . . . . . . . . . . . . 115
D.6 Valores crticos para la distribucion chi-cuadrada . . . . . . . . . . . . . 116
D.7 Valores crticos para la distribucion F . . . . . . . . . . . . . . . . . . . 118
D.8 Algunos numeros aleatorios uniformemente distribuidos . . . . . . . . . 122

Bibliografa & Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123


CAPITULO 1

Estadstica descriptiva

1.1 Introduccion
1. Por que usted necesita conocer estadstica?
Tres razones fundamentales:

(a) Presentar y describir la informacion en forma adecuada.


(b) Inferir conclusiones sobre poblaciones grandes basandose solamente en la
informacion obtenida de subconjuntos de ellas.
(c) Utilizar modelos para obtener pronosticos confiables.

2. Terminos
Poblacion, muestra, datos, parametro, estadstico, Censo.

3. Metodos estadsticos.
Metdos estadsticos = estadstica descriptiva + estadstica inferencial.

4. Organizacion de datos.
Por el tipo de dato, de acuerdo a escalas de medidas, mediante tablas y mediante
representaciones graficas.

5. Organizacion de datos de acuerdo al tipo.


Existen dos tipos de datos: categoricos (o cualitativos) y numericos (cuantita-
tivos). Estos ultimos se clasifican a su vez en discretos y continuos.

6. Organizacion de datos de acuerdo a escalas de medidas.


Nominal, ordinal, de intervalo y de razon. Ver LLinas [11] o Weimer [23] para
mayores detalles.

7. Organizacion de datos mediante tablas.


Se necesita concepto: Frecuencias absoluta, relativa, acumulada y acumulada
relativa. Dos tipos de tablas:
1.1 Introduccion 5

(a) Tablas de frecuencias agrupadas.


Tablas con datos + frecuencias.

Ejemplo 1.1.1 La tabla de frecuencias (no agrupada) para el conjunto de datos


3 5 7 6 4 3 7 6 6 7 5 7 es
Dato 3 4 5 6 7
Frecuencia 2 1 2 3 4

(b) Tablas de frecuencias no agrupadas.


Intervalos de clase, lmites de clase, fronteras de clase, Marcas de clase, ampli-
tud w. Para hallar numero de clases c: Regla de Sturges (c = (3, 3) log n + 1)

o c = n.

Ejemplo 1.1.2 (Datos con un solo lugar decimal) Forme una distribucion
de frecuencias considerando los siguientes datos:

8,9 10,2 11,5 7,8 10,0 12,2 13,5 14,1 10,0 12,2
6,8 9,5 11,5 11,2 14,9 7,5 10,0 6,0 15,8 11,5

SOLUCION:
Paso 1. El rango R es 9,8.
Paso 2. Por regla de Sturges, c = 5 (aproximar al entero mas cercano).
Paso 3. w = Rc = 2 (aproximar al entero siguiente).
Paso 4. Como la unidad de medida es 0,1 (por tener los datos un solo lugar decimal)
y como el punto medio de cada unidad de medida es 0,05, entonces,

Frontera inf. de primera clase = dato menor 0, 05 = 5, 95.

En consecuencia, la tabla es

Clase Cuenta Frecuencia Marcas de clase X


5,95 - 7,95 |||| 4 6,95
7,95 - 9,95 || 2 8,95
9,95 - 11,95 ||||| ||| 8 10,95
11,95 - 13,95 ||| 3 12,95
13,95 - 15,95 ||| 3 14,95

8. Organizacion de datos mediante representaciones graficas.


Hay graficas de varios tipos, entre los cuales se encuentran los siguientes: el
diagrama circular o de pastel, el pictograma, el diagrama de barras, el diagrama de
caja y bigote, el histograma, el polgono (de frecuencia o de frecuencias relativas),
la ojiva (o polgono de frecuencias acumuladas o polgono de frecuencias relativas
acumuladas) y el diagrama de tallo y hojas.
1.2 Medidas estadsticas 6

9. Histograma

%)

40 20
(en %)

acum.
Frec. acum.
rel. (en

16
30
12
Frec.rel.

20

Frec.
8
Frec.

10
4
0 0
5,95 7,95 9,95 11,95 13,95 15,95 5,95 7,95 9,95 11,95 13,95 15,95
Fronteras
Fronteras Fronteras
Fronteras

(a) Histograma de frecuencias relativas (b) Histograma de frecuencias acumu-


ladas

10. Polgono y ojiva.

8 20
Frecuencias

acum.

16
6
Frec. acum.
Frecuencias

12
4
Frec.

8
2
4

0 0
4,95 6,95 8,95 10,95 12,95 14,95 16,95 5,95 7,95 9,95 11,95 13,95 15,95
Marcas de Fronteras superiores
Marcas declase
clase Fronteras superiores

(c) Polgono de frecuencias (d) Ojiva

1.2 Medidas estadsticas


1. Medidas de tendencia central o de centralizacion.
La media aritmetica (ponderada), la mediana, la moda, el rango medio (promedio
de los datos mayor y menor), la media geometrica, la media armonica y la media
cuadratica. En LLinas [11] se hace una descripcion completa de estas medidas.

2. Medidas de colocacion o de posicion relativa.


La mediana, los percentiles, deciles y . En LLinas [11] se hace una descripcion
completa de estas medidas.

3. Medidas de dispersion o de variabilidad.


El rango (diferencia entre datos mayor y menor), el rango intercuartil (diferencia
entre el tercer y el primer cuartil), la varianza, la desviacion estandar y el coeficiente
de variancion de Pearson (desviacion estandar dividida entre la media, multiplicada
por 100 por ciento). En LLinas [11] se explican con detalles todas estas medidas.
1.2 Medidas estadsticas 7

4. Aplicaciones de la desviacion estandar poblacional.


Se utilizan dos reglas:

(a) Regla de Tchebychev (valida para cualquier poblacion).


Por lo menos el 100(1 1/k2)% de los valores de la poblacion se encuentran
en el intervalo [ k; + k].
k 1,5 2 2,5 3 3,5 4
100(1 1/k2)% 55,6% 75% 84% 88,9% 91,18% 93,7%
(b) Regla emprica (valida solo para poblaciones de forma acampanada).
El 68% de los datos de la poblacion se encuentran en [ ; + ] y el
95% de los datos en [ 2; + 2].

Ejemplo 1.2.1 Un inspector de control de calidad selecciona aleatoriamente 14 clavos


de una caja de 100 clavos de 1 pulgada (una pulg.=2,54 cm). Las longitudes, en cm,
son

2, 54 2, 55 2, 50 2, 60 2, 51 2, 52 2, 70 2, 40 2, 36 2, 53 2, 54 2, 52 2, 51 2, 55.

Si el inspector decide excluir los clavos que estan fuera del intervalo x 2s, entonces,
a lo mas el 25% estaran fuera del intervalo. Se verifica la regla de Tchebychev?

5. Coeficiente de variacion de Pearson.


 
desviacion estandar de los datos
CV = 100%.
media aritmetica de los datos

Ejemplo 1.2.2 Los siguientes datos representan el promedio de millas por galon
diario por cinco das para un determinado auto: 20, 25, 30, 15, 35. Por consiguiente,
el tamano relativo de la dispersion media alrededor de la media con relacion a la
media es 31,6%.

Ejemplo 1.2.3 El gerente de operaciones de un servicio de paquetera desea adquirir


una nueva flota de autos. Cuando los paquetes se guardan con eficiencia en el inte-
rior de los autos (durante la preparacion de las entregas), se deben considerar dos
restricciones principales: el peso (en libras) y el volumen (en pies cubicos) de cada
paquete. Ahora, en una muestra de 200 paquetes, el peso promedio es 26 libras con
una desviacion estandar de 3,9 libras. Ademas, el volumen promedio de cada paquete
es 8,8 pies cubicos con una desviacion estandar de 2,2 pies cubicos. Por consiguiente,
con relacion a la media, el volumen de un paquete es mucho mas variable que su peso.
Por que?

Ejemplo 1.2.4 Un inversionista potencial piensa adquirir acciones en una de dos


companas A o B, listadas en la Bolsa de Valores de Nueva York. Si ninguna de las
companas ofrece dividendos a sus clientes y ambas tienen igual clasificacion (segun
varios servicios de inversion) en terminos de crecimiento potencial, el posible inver-
sionista quizas considere la volatilidad (variabilidad) de ambas acciones para ayudar
en la decision de inversion. En los ultimos meses, el precio promedio de las acciones en
la compana A fue de 50 dolares con una desviacion estandar de 10 dolares. Ademas,
durante el mismo periodo, el precio promedio de las acciones en la compana B fue
de 12 dolares con una desviacion estandar de 4 dolares. Entonces, en relacion con la
media, el precio de las acciones B es mucho mas variable que el de las acciones A.
1.2 Medidas estadsticas 8

6. Medidas de formas.
Coeficiente de sesgo y medida de curtosis.

7. Simetra y asimetra.
Una distribucion de frecuencias sera simetrica o asimetrica segun lo sea su repre-
sentacion grafica.1

Si una distribucon no es simetrica, se dice que es asimetrica a la derecha (positi-


vamente) o a la izquierda (negativamente).2

En la figura 1.1 se ilustra el caso en que la distribucion de frecuencias tiene una


sola moda.

(e) Distribucion simetrica (f) Distribucion asimetrica a la derecha

(g) Distribucion asimetrica a la izquierda

Fig. 1.1: Comparacion de tres distribuciones unimodales cuya forma difiere.

8. Coeficiente de sesgo Ap.


Se define como:
Media aritmetica Moda
Ap = .
Desviacion estandar
Cuando Ap = 0, se dice que la distibucion es simetrica; cuando Ap < 0, se
dice que la distribucion es sesgada negativamente o a la izquierda y
1
En cualquier distribucion simetrica, la media coincide con la mediana.
2
En las medidas asimetricas unimodales la mediana esta entre la media y la moda.
1.3 Analisis exploratorio de datos 9

cuando Ap > 0, se dice que la distribucion es sesgada positivamente o a la


derecha.

9. Relacion emprica entre media, mediana y moda.


Para distribuciones campanoides, unimodales y moderadamente asimetricas se
cumple aproximadamente la relacion emprica

Media Moda 3(Media aritmetica Mediana),

Con lo anterior, el coeficiente de asimetra de Pearson la podemos calcular tambien


a traves de la formula
3(Media aritmetica Mediana)
Ap = .
Desviacion estandar

10. Medidas de curtosis o apuntamiento.


Se aplican a distribuciones campaniformes, es decir, unimodales simetricas o con
ligera asimetra.

1.3 Analisis exploratorio de datos


Muchos autores presentan el diagrama de tallo y hoja como tecnica del analisis ex-
ploratorio de datos. Consiste en desarrollar un resumen de cinco numeros y construir un
diagrama de caja y bigotes.

1. Resumen de cinco numeros.


Consiste en cinco cantidades que se emplean para resumir los datos: valor mnimo,
primer cuartil (Q1), Mediana (Q2), tercer cuartil (Q3) y valor maximo.

2. Situaciones para reconocer la simetra de los datos.


Si la distribucion es simetrica:

La distancia de Q1 a la mediana es igual a la distancia de la mediana a Q3.


La distancia del valor mnimo a Q1 es igual a la distancia de Q3 al valor
maximo.
La mediana y el rango medio son iguales. (Estas medidas son iguales a la
media de los datos.)

3. Situaciones para reconocer la no simetra de los datos.


Si la distribucion no es simetrica:

En las distribuciones sesgadas a la derecha, la distancia de Q3 al valor maximo


excede la distancia del valor mnimo a Q1. Ademas, la mediana es menor
que el rango medio.
En las distribuciones sesgadas a la izquierda, la distancia del valor mnimo a
Q1 excede la distancia de Q3 al valor maximo. Ademas, el rango medio es
menor que la mediana.
1.3 Analisis exploratorio de datos 10

Diagrama de caja y bigotes


Mediana

Valor atpico
(moderado)
1,5 R.I 1,5 R.I
+ + +

Media Valores atpicos


3 R.I (extremos)

Primer
2200
2,200 2,400 Tercer 2600
2400 2,600 2800
2,800 3000
3,000
cuartil cuartil
Salarios mensuales

Fig. 1.2: Diagrama de caja y bigotes

4. Diagrama de caja y bigotes.


(R.I. significa el rango intercuartil, los segmentos horzontales son los llamados
bigotes y los valores que estan por fuera de los bigotes se llaman valores atpicos).

5. Diagramas de cajas multiples (o comparativos).


La figura 1.3 contiene los diagramas de caja de las calificaciones en un examen
de matematicas para quince estudiantes de primer curso de primaria, quince de
segundo y quince de tercero.

Primero

Segundo

Tercero

40 50 60 70 80 90 100
Calificaciones
Calificaciones

Fig. 1.3: Diagrama de caja y bigotes de las calificaciones en un examen

En el diagrama puede apreciarse que no hay valores atpicos en ninguno de los tres
grupos. Los estudiantes del tercer curso consiguieron la mejor mediana, pero sus
calificaciones tienen una variabilidad considerablemente mayor que la de los otros
grupos. Otro hecho que llama la atencion es la gran cantidad de calificaciones
Cap. 1. Ejercicios 11

bajas obtenidas por los estudiantes de primer curso. Finalmente, podemos afirmar
que las distribuciones de frecuencias de los tres conjuntos de datos estan sesgadas
a la izquierda.

Ejercicios
1. Diga si la afirmacion dada es verdadera o falsa. Justifique siempre su respuesta. En caso
que sea falso, de un contraejemplo.
(a) Si la desviacion estandar de un conjunto de datos es 0, entonces, los datos son iguales.
(b) No existen datos de tal forma que sean iguales el rango y la varianza.
(c) Existen datos con desviacion estandar negativa.
(d) En una distribucion simetrica, la media, la mediana y la moda son iguales.
(e) La desviacion estandar esta dada por las mismas unidades que la media.
(f) Toda informacion numerica proporciona datos cuantitativos.
(g) Toda informacion no numerica ofrece datos cuantitativos.
(h) Cuando todos los datos son categoricos, la moda es la unica medida de tendencia
central que se puede utilizar.
(i) Si el primer cuartil en el primer examen de estadstica fue de 3,0, entonces, este valor
indica que el 25% de los estudiantes ganaron el examen.
2. Clasifique los datos siguientes en cuantitativos (numericos) y cualitativos (categoricos).
En caso de ser numerico, como discretos o continuos:
(a) Estaturas en centmetros de cuatro jugadores de futbol.
(b) Las temperaturas promedios diarias en el ultimo mes.
(c) Clasificacion etnica de 30 empleados.
(d) Numeros telefonicos de ciertas personas.
(e) Distancia (en metros) recorrido por un atleta en una temporada.
(f) Peso perdido (en kilogramos) por 10 personas debido a una dieta.
(g) Fecha de cumpleanos de determinadas personas.
(h) Calificaciones (E, S, A, D, I) de unos estudiantes de bachillerato.
3. Se clasifico a los estudiantes de un programa universitario de acuerdo a con el semestre
que cursa y su preferencia deportiva. Los resultados estan registrados en la siguiente tabla.

Primero Segundo Tercero Cuarto


Futbol 15 14 5 9
Beisbol 12 22 6 6
Voleivol 5 5 9 5
Basquetbol 26 7 6 7
Natacion 7 8 4 2

(a) Que porcentaje de los estudiantes de primer semestre prefieren el futbol?


(b) Que porcentaje de los aficionados a la natacion son de segundo semestre?
(c) Que porcentaje del total de los estudiantes prefieren el basquetbol?
(d) Que porcentaje de los estudiantes son de cuarto semestre?
Cap. 1. Ejercicios 12

(e) Que porcentaje del total de estudiantes son de tercer o cuarto semestre?
(f) Que porcentaje prefiere la natacion, el voleibol o el beisbol?

4. Los siguientes datos representan las cuentas telefonicas mensuales, en miles de pesos, de
25 residentes de un pequeno pueblo:

21,48 21,15 25,12 23,47 27,81 19,80 36,05 28,50 26,66


20,35 30,22 25,49 20,80 23,83 25,35 23,48 25,81 21,07
26,83 30,96 33,38 20,77 19,98 35,87 22,02

(a) Que porcentaje del grupo pago mas de 21.000 pesos?


(b) Que porcentaje pago mas de 22.000 pesos pero menos de 27.000 pesos?

5. Los datos que se indican a continuacion representan el costo (en miles de pesos) de la
energa electrica durante un determinado mes del ano para una muestra aleatoria de 50
apartamentos en cierta ciudad importante:

128 144 168 109 167 141 149 206 175 123
153 197 127 82 96 171 202 178 147 102
135 191 137 129 158 108 119 183 151 114
111 148 213 130 165 157 185 90 116 172
143 187 166 139 149 95 163 150 154 130

(a) Obtenga una tabla de frecuencias con 7 intervalos de clase.


(b) Grafique el correspondiente histograma de frecuencias, el polgono de frecuencias
relativas y la ojiva con frecuencias acumuladas relativas.
(c) Alrededor de que cantidad parece concentrarse el costo mensual de energa electrica?
(d) Segun su opinion, cual de las graficas representa mejor la distribucion de los costos
de energa electrica?

6. Responda las siguientes preguntas. Justifique sus respuestas.


(a) Que escala de medida se requiere para la mediana? Y para la moda?
(b) En que condiciones coinciden la media, la mediana y la moda de una muestra?
(c) En que caso sera demasiado grande la diferencia entre la media y la mediana?
7. Una empresa de servicio electrico de una ciudad le realiza la lectura del contador de luz a
un usuario, obteniendo los siguientes datos:

Fecha Lectura
Agosto 27 00553 Kwh
Agosto 30 00571 Kwh
Septiembre 4 00605 Kwh

El recibo de pago le llego al usuario con lectura de 00638 Kwh, realizada el 9 de septiembre,
pero la empresa no dejo constancia de lectura, hecho que motivo el reclamo del usuario
alegando que le estaban cobrando de mas. Tiene la razon el usuario? Explique.
8. Los neumaticos de cierta marca tiene una duracion de vida con media de 29.000 kilometros
y desviacion tpica de 3.000 kilometros.
(a) Encontrar un intervalo en el que se pueda garantizar que se encuentra por lo menos
el 75% de los tiempos de vida de los neumaticos de esta marca.
Cap. 1. Ejercicios 13

(b) Usando la regla imprica y suponiendo que la poblacion tiene forma acampanada,
encontrar un intervalo en el cual se estime que se encuentra aproximadamente el 95%
de los tiempos de vida de los neumaticos de esta marca.
9. Los valores de presion sangunea se reportan a veces a los 5 mm Hg mas cercanos (100,
105, 110, etc.). Suponga que los valores reales de presion sangunea para nueve individuos
seleccionados al azar son:

130,0 113,7 122,0 108,3 131,5 133,2 118,6 127,4 138,4

(a) Cual es la mediana de los valores reportados de presion sangunea?


(b) Suponga que la presion del octavo individuo es 127,6 en lugar de 127,4 (un pequeno
cambio en su valor). Como afectara esto a la mediana de los valores reportados?
Que dice esto sobre la sensibilidad de la mediana para redondear o agrupar los datos?

10. La propagacion de grietas por fatiga en diversas partes de aeronaves ha sido objeto de
profundo estudio en anos recientes. Los datos que aparecen a continuacion constan de
tiempo de propagacion (horas de vuelo/104 ) para llegar a un tamano de grieta dado en
agujeros sujetadores que se usan en aeronaves militares:
0,915 0,937 0,983 1,007 0,736 0,863 0,865 0,913
1,132 1,140 1,153 1,253 1,394 1,011 1,064 1,109

(a) Calcule los valores de la media y mediana muestrales.


(b) En cuanto se puede reducir la observacion muestral mas grande, sin afectar el valor
de la mediana?

11. Una manifestacion interesante de la variacion surge cuando se efectuan los analisis de
emision de gases en los vehculos automotores. Los requisitos de costo y tiempo del
procedimiento federal de prueba (PFT) en cierto pais evitan la difusion de su uso en los
programas de inspeccion vehicular. Como resultado, muchas agencias han desarrollado
analisis menos costosos y mas rapidos con la esperanza de reproducir los resultados.
Segun un artculo de una prestigiosa revista, se dice que la eceptacion del PFT como
patron de excelencia ha conducido a la creencia de que las mediciones repetidas en el
mismo vehculo daran resultados identicos (o casi). Los autores del artculo aplicaron el
PFT a siete vehculos caracterizados como grandes emisores. Los resultados de uno de
esos vehculos son los siguientes:
HC (g/mi) 32,2 32,5 13,8 18,3
CO (g/mi) 232 236 118 149

(a) Calcule las desviaciones estandar muestrales de las observaciones de HC y CO. Parece
justificada la creencia general?
(b) Compare los coeficientes de variacion de cada conjunto de datos para determinar
cuales presentan mayor o menor variacion.

12. Un taller de mecanica acepta una orden por 10.000 ruedas de 2 pulgadas de diametro.
Las especificaciones de tamano del producto podran ser mantenidas solo si el diametro
medio es de 2 pulgadas y la desviacion estandar es muy pequena. En este caso, cual es
el margen de tolerancia permitido para la desviacion estandar?
13. A continuacion se presentan algunas medidas estadsticas (mediana, primer y tercer cuartil)
y una tabla de frecuencia agrupada, para las edades de un grupo de personas que hay
en una sala de concierto. A partir de estos datos, responder las preguntas que aparecen
abajo. Mediana = 20, primer cuartil = 17,5 y tercer cuartil = 23.
Cap. 1. Ejercicios 14

Frecuencia Frecuencia Frec. acum.


Edades Frecuencia relativa acumulada relativa
11,5 - 14,5 2 0,0500 2 0,0500
14,5 - 17,5 8 0,2000 10 0,2500
17,5 - 20,5 11 0,2750 21 0,5250
20,5 - 23,5 10 0,2500 31 0,7750
23,5 - 26,5 8 0,2000 39 0,9750
26,5 - 29,5 1 0,0250 40 1,0000

(a) Cual era el numero exacto de personas que haban en la sala del concierto?
(b) Cual es la media aproximada de las personas que asistieron al concierto?
(c) Que edad tienen el 77,5% de las personas?
(d) Que porcentaje de personas tienen una edad entre 11,5 y 20,5?
(e) Que porcentaje de personas tienen una edad mayor de 23,5?
(f) Cuantas personas tienen una edad entre 17,5 y 20,5?
(g) Cuantas personas tienen una edad mayor que 14,5?
(h) Que interpretacion tiene el valor de la mediana y el de los cuartiles?

14. Los siguientes datos representan los rendimientos porcentuales anuales en cuentas de
mercado de dinero de una muestra de 15 bancos comerciales en el area metropolitana de
una ciudad a una determinada fecha:
Nombre del Banco Rendimiento Nombre del banco Rendimiento
Banco su cuenta 3,10 Banco el Pais 2,28
The Bank 2,63 Banco la Clave 3,01
Mein Bank 2,79 Banco del Norte 2,53
Your Bank 3,25 Banco del Sur 2,00
El Banco del pueblo 1,90 Banco Nacional 3,05
Aero Bank 2,79 Nuestro Banco 2,02
Union Bank 2,90 Banco el dinero 3,05
Bank del cliente 2,73

(a) Proporcione el resumen de cinco numeros.


(b) Construya el diagrama de caja y bigotes y describa la forma.
(c) Si alguien le dijera:los rendimientos del mercado de dinero no varan mucho de un
banco a otro, con base en estos datos, que dira?

15. Una de las metas de toda administracion es ganar lo mas posible en relacion con el
capital invertido en la empresa. Una medida del exito en alcanzarla es el retorno sobre
la aportacion, que es la relacion de la ganancia neta entre el valor de las acciones. A
continuacion se muestran los porcentajes de ganancia sobre las acciones para 25 empresas.

11,4 15,8 52,7 17,3 12,3 9,0 19,6 22,9 41,6


5,1 17,3 31,1 6,2 19,2 14,7 9,6 8,6 11,2
16,6 5,0 30,3 12,8 12,2 14,5 9,2

Forme el resumen de cinco numeros, trace un diagrama de caja y bigotes y determine si


hay valores atpicos. Como podra un analista financiero usar esta informacion?
s 16. Considere la variable anchura que contiene el conjunto de datos que encontramos en el
archivo calles.sf3 y que corresponde al ancho de 112 calles de Madrid (Espana).
Cap. 1. Ejercicios 15

(a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera frontera
inferior sea 0 y la ultima frontera superior sea 40. A partir de ella, responda las
siguientes preguntas:
i. Cuantas calles tienen un ancho entre 5 y 25 kilometros?
ii. Que porcentaje de calles tienen un ancho entre 10 y 30 kilometros?
iii. Cuantas calles tienen un ancho mayor de 20 kilometros?
iv. Que porcentaje de calles tienen un ancho mayor 25 kilometros?
v. Cuantas calles tienen un ancho menor de 15 kilometros?
vi. Que porcentaje de calles tienen un ancho menor de 35 kilometros?
(b) Con 8 clases (en donde la primera frontera inferior sea 0 y la ultima frontera superior
sea 40), construir los histogramas de frecuencias absolutas y de frecuencias absolutas
acumuladas, los polgonos de frecuencia y de frecuencias relativas y las ojivas de fre-
cuencias acumuladas y de frecuencias relativas acumulada. A partir de estos graficos,
responda las siguientes preguntas:
i. Aproximadamente cuantas calles tienen un ancho mayor que 16,9 kilometros?
ii. Aproximadamente cuantas calles tienen un ancho menor que 12,5 kilometros?
iii. Que porcentaje aproximado de calles tienen un ancho mayor de 7,7 kilometros?
iv. Que porcentaje aproximado de calles tienen un ancho menor de 13,8 kilometros?
(c) Estudie la simetra de la distribucion de los datos.
(d) Existen valores atpicos? Cuantos? Cuales?
(e) Existe alguna transformacion que mejora la simetra? Y la presencia de valores
atpicos? Indique en caso positivo la transformacion seleccionada.
s 17. En el archivo de datos autos.sf3 mostramos las distancias recorridas (dadas en millas
por galon) de 154 modelos de automoviles sacados al mercado entre los anos 1978 y
1982 por diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses
(origen=3). Tambien aparecen los respectivos cilindrajes de los autos, las potencias, etc.
(a) Construya un diagrama de caja y bigotes para los datos de la distancia recorrida y a
partir de el, responda las siguientes preguntas: Entre cuales valores vara la distancia
recorrida? Cuanto recorre el 50% central de los autos? Hay valores atpicos? Es
simetrica o asimetrica la distribucion de los datos? En caso de ser asimetrica, es
asimetrica a la izquierda o a la derecha? Cuales son los valores de la media y de la
mediana?
(b) Estudie el grado de simetra de los datos de la distancia recorrida de cuatro maneras
diferentes (compare sus respuestas):
i. Utilizando las medidas estadsticas (media, mediana, moda, sesgo, etc. )
ii. Construyendo un histograma de frecuencias con 5 clases.
iii. Construyendo un un histograma con 13 clases. Porque este histograma resulta
mas adecuado que el que construyo con 5 clases?
iv. Construyendo un grafico de simetra con la opcion graphical options . . . symmetry
plot de Statgraphics.
s 18. Se han medido los diametros (en milmetros) de 50 tornillos y se han obtenido los resultados
que mostramos en el archivo tornillos.sf3.
(a) Forme la tabla de frecuencias con 6 clases para los datos y, a partir de ella, responda
las siguientes preguntas:
i. Cuantos tornillos tienen un diametro entre 29 y 32 milmetros?
Cap. 1. Ejercicios 16

ii. Que porcentaje de tornillos tienen un diametro entre 30 y 34 milmetros?


iii. Cuantos tornillos tienen un diametro mayor de 32 milmetros?
iv. Que porcentaje de tornillos tienen un diametro mayor 34 milmetros?
v. Cuantos tornillos tienen un diametro menor de 31 milmetros?
vi. Que porcentaje de tornillos tienen un diametro menor de 33 milmetros?
(b) Con 6 clases, construir los histogramas de frecuencias absolutas y de frecuencias
absolutas acumuladas, los polgonos de frecuencia y de frecuencias relativas y las
ojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir de
estos graficos, responda las siguientes preguntas:
i. Aproximadamente cuantos tornillos tienen un diametro mayor que 34,4 milmetros?
ii. Aproximadamente cuantos tornillos tienen un diametro menor que 32,2 milmetros?
iii. Que porcentaje aproximado de tornillos tienen un diametro mayor de 31,6
milmetros?
iv. Cuantos tornillos tienen un diametro menor de 32,8 milmetros?
(c) Estudie la simetra de la distribucion de los datos.

s 19. Los datos del archivo fotocopia.sf3 muestran el gasto en fotocopias (en miles de pesos)
de 70 estudiantes universitarios durante un determinado ano.
(a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera frontera
inferior sea 0 y la ultima frontera superior sea $ 1.400.000. A partir de ella, responda
las siguientes preguntas:
i. Cuantos estudiantes han gastando entre $ 175.000 y $ 525.00 en el ano?
ii. Que porcentaje de estudiantes han gastando entre $ 700.000 y $ 1.225.000 en
el ano?
iii. Cuantos estudiantes han gastando mas de $ 1.050.000 en el ano?
iv. Que porcentaje de estudiantes han gastando mas de $ 350.000 en el ano?
v. Cuantos estudiantes han gastando menos de $ 875.000 en el ano?
vi. Que porcentaje de estudiantes han gastando menos de $ 525.000 en el ano?
(b) Con 8 clases (en donde la primera frontera inferior sea 0 y la ultima frontera superior
sea $ 1.400.000), construir los histogramas de frecuencias absolutas y de frecuencias
absolutas acumuladas, los polgonos de frecuencia y de frecuencias relativas y las
ojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir de
estos graficos, responda las siguientes preguntas:
i. Aproximadamente cuantos estudiantes han gastando mas de $ 767.810 en el
ano?
ii. Aproximadamente cuantos estudiantes han gastando menos de $ 391.821 en el
ano?
iii. Que porcentaje aproximado de estudiantes han gastando mas de $ 601.583 en
el ano?
iv. Cuantos estudiantes han gastando menos de $ 1.104.220 en el ano?
(c) Estudie la simetra de la distribucion de los datos.
(d) Existen valores atpicos? Cuantos? Cuales?
(e) Realice una transformacion logartmica de los datos e interprete los resultados. Co-
mente las diferencias con los datos sin transformar.
s 20. En el archivo de datos doscientos.sf3 proporcionamos las sesenta y nueve mejores marcas
de todos los tiempos en la prueba de 200 metros lisos masculinos (las marcas se dan en
segundos), as como el nombre del atleta y la fecha en que se consiguio la marca.
Cap. 1. Ejercicios 17

(a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera frontera
inferior sea 19,2 segundos y la ultima frontera superior sea 20,2 segundos. A partir
de ella, responda las siguientes preguntas:
i. Cuantos atletas han recorrido entre 19,325 y 19,7 segundos?
ii. Que porcentaje de atletas han recorrido entre 19,45 y 19,95 segundos?
iii. Cuantos atletas han recorrido mas de 19,7 segundos?
iv. Que porcentaje de atletas han recorrido mas de 19,45 segundos?
v. Cuantos atletas han recorrido menos de 19,95 segundos?
vi. Que porcentaje de atletas han recorrido menos de 19,825 segundos?
(b) Con 8 clases (en donde la primera frontera inferior sea 19,2 segundos y la ultima fron-
tera superior sea 20,2 segundos.), construir los histogramas de frecuencias absolutas
y de frecuencias absolutas acumuladas, los polgonos de frecuencia y de frecuencias
relativas y las ojivas de frecuencias acumuladas y de frecuencias relativas acumulada.
A partir de estos graficos, responda las siguientes preguntas:
i. Aproximadamente cuantos atletas han recorrido mas de 19,818 segundos?
ii. Que porcentaje aproximado de atletas han recorrido mas de 19,845 segundos?
iii. Que porcentaje aproximado de atletas han recorrido mas de 19,782 segundos?
iv. Aproximadamente cuantos atletas han recorrido menos de 20,03 segundos?
(c) Estudie la simetra de la distribucion de los datos.
(d) Se detecta algo peculiar en la distribucion de estos datos?
(e) Se detecta algun valor potencialmente atpico? Cual es?

s 21. En el archivo de datos Cavendish.sf3 presentamos 29 medidas de la densidad de la tierra


obtenidas por Henry Cavendish en 1798 empleando una balanza de torsion. La densidad
de la tierra se proporciona como un multiplo de la densidad del agua.
(a) Utilice los diagramas de tallo y hojas y de cajas para determinar si existe algun valor
atpico.
(b) Proponga, razonando la respuesta, un valor para la densidad de la tierra.

s 22. En el archivo de datos autos.sf3 mostramos las distancias recorridas (dadas en millas
por galon) de 154 modelos de automoviles sacados al mercado entre los anos 1978 y
1982 por diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses
(origen=3). Tambien aparecen los respectivos cilindrajes de los autos, las potencias, etc.
(a) Considere por separado los conjuntos de distancias recorridas de los modelos de cada
uno de los cinco anos.
i. Analice grafica y numericamente cada uno de estos conjuntos.
ii. Utilizando la opcion Plot . . . Exploratory Plots . . . Multiple Box-and-Whishker
Plot . . . Data=distancia . . . Level codes=year . . . obtenga los diagramas de cajas
(multiples) de los cinco conjuntos de distancias recorridas con respecto a cada
uno de los anos. Que se observa? Conoce alguna razon que pueda explicar
lo que resulta de los analisis numericos y de la observacion de los diagramas de
cajas?
(b) Ahora, construya el diagrama de caja multiple de la distancia recorrida de los au-
tomoviles segun su cilindrada.
i. Teniendo en cuenta cada uno de los diagramas, responda las preguntas formu-
ladas en la parte (a).
Cap. 1. Ejercicios 18

ii. Compare entre s los distintos diagramas y responda las siguientes preguntas:
Donde es mas fuerte la asimetra? Donde es menor? Donde no existe? Vara
bastante los valores de la media y de la mediana para los diferentes grupos?
(c) Construya el diagrama de caja multiple de la potencia de los automoviles segun su
origen y responda las preguntas formuladas en el inciso anterior.
s 23. En el archivo de datos gemelos.sf3 mostramos los resultados de tests de inteligencia
realizados a parejas de gemelos monozigoticos. Los gemelos monozigoticos se forman
por la division en dos de un mismo ovulo ya fecundado y, por tanto, tienen la misma
carga genetica. Al mismo tiempo, por razones obvias, es muy frecuente que compartan el
entorno vital y es difcil separar ambos factores. En el conjunto de datos, los datos de la
columna A corresponden al gemelo criado por sus padres naturales, los de la columna B al
criado por un familiar u otra persona. Mediante la opcion Compare . . . Two Samples . . .
Two Sample Comparison . . . Sample 1=A . . . Sample 2=B . . . Ok, resuelva lo siguiente:
(a) Compare la simetra de los datos de la columna A y B.
(b) Construya un diagrama de caja multiple para los datos de la columna A y B y describa
sus interesantes propiedades.
(c) Como interpreta el coeficiente de variacion de ambos conjuntos de datos?

s 24. En 1893 Lord Rayleigh investigo la densidad del nitrogeno empleando en su obtencion
distintas fuentes. Previamente haba comprobado la gran discrepancia existente entre la
densidad del nitrogeno producido tras la eliminacion del oxgeno del aire y el nitrogeno
producido por la descomposicion de ciertos compuestos qumicos. Los datos del archivo
Rayleigh.sf3 muestran esta diferencia de forma clara. Esto llevo a Lord Rayleigh a in-
vestigar detenidamente la composicion del aire libre de oxgeno y al descubrimiento de un
nuevo elemento gaseoso, el argon.

(a) Analice numerica y graficamente estos datos. Preste especial atencion a los diagramas
de tallo y hojas y al diagrama de cajas. Hay alguna peculiaridad de la poblacion de
pesos que se manifieste en un diagrama y no en el otro?
(b) Realice diagramas de cajas dividiendo los datos en los pesos obtenidos a partir de aire
y los obtenidos a partir de compuestos qumicos del nitrogeno. Que se observa?

s 25. Una de las medidas de seguridad de los reactores nucleares frente a desajustes en el proceso
de generacion de energa o de extraccion de esta es el disparo del reactor. Esta medida
consiste en la detencion del proceso de fusion mediante la insercion en el nucleo del reactor
de venenos neutronicos. El numero de disparos no previstos de un reactor en un periodo es
un indicador de problemas de comportamiento y de fiabilidad en la planta. En el archivo
de datos disparos.sf3 proporcionamos, para dos anos diferentes (1984 y 1993), el numero
de disparos no previstos en sesenta y seis reactores nucleares de los Estados Unidos de
Norteamerica.
(a) Analice numerica y graficamente, por separado, el numero de disparos de reactor en
cada uno de los dos anos considerados.
(b) Compare graficamente las distribuciones de ambas variables Se aprecian diferencias
importantes entre ellas? Que conclusiones le merece esta comparacion?
s 26. Sea una variable X que presenta los valorees x1 , x2 , x3 , x4 , x5 con frecuencias absolutas
n1 = 1, n2 = 2, n3 = 8, n4 = 5 y n5 = 6.
(a) Representar la variable X mediante digramas de barras horizontales.
(b) Hacer la representacion con barras horizontales apiladas.
Cap. 1. Ejercicios 19

(c) Representar la variable X mediante digramas de barras verticales.


(d) Representar la variable X mediante un diagrama de barras varticales con la lnea base
situada a la altura del punto 4.
(e) Representar la variable X mediante un diagrama de barras horizontales con rectangulos
de error representados por lneas y definidos por la variable Y cuyos valores son 1,5;
2,5; 3,5; 3 y 2.
s 27. La encuesta de poblacion activa elaborada por una empresa referente al cuarto trimestre
de 1.970 presenta para el numero de activos por ramas los siguientes datos:

RAMA DE ACTIVIDAD MILES DE ACTIVOS


Agricultura, caza y pesca 3706,3
Fabriles 3437,8
Construccion 1096,3
Comercio 1388,3
Transporte 648,7
Otros servicios 2454,8

(a) Realizar un grafico de sectores con porcentajes del numero de activos por ramas.
(b) Realizar el grafico conlas etiquetas de las ramas de actividad sobre los sectores.
(c) Desplazar el sector relativo a la rama con menor numero de activos.
CAPITULO 2

Probabilidad

2.1 Experimentos, espacios muestrales y eventos


1. Experimentos determinsticos y aleatorios.

(a) Experimento: cualquier accion que genera observaciones.


(b) Experimento determinstico: al repetirse bajo las mismas condiciones,
genera siempre los mismos resultados (como, por ejmplo, las leyes fsicas).
(c) Experimento aleatorio (o estocastico): Al repertirse bajo las mismas
condiciones, no genera siempre los mismos resultados.

2. Espacio muestral, evento y evento elemental.

(a) Espacio muestral : Conjunto de todos los posibles resultados de un


experimento aleatorio.
(b) Evento: cualquier subconjunto de .
(c) Evento elemental: evento con un solo elemento.

2.2 Tecnicas de conteo


Conteo por enumeracion de elementos, conteo a traves de diagramas de arbol, teorema
fundamental del conteo, principio de adicion, conteo de permutaciones y el conteo de
combinaciones.

1. Permutacion.
Arreglo ordenado de una cantidad finita de objetos distintos.

2. Situaciones especiales (relacionadas con permutaciones).

Permutaciones sin repeticion de n objetos tomados todos a la vez.


Permutaciones sin repeticion de n objetos tomados de k en k (k n).
2.2 Tecnicas de conteo 21

Permutaciones circulares.
Permutaciones con repeticion de n objetos tomados de k en k (k es cualquier
numero natural).
Permutaciones de n objetos de los cuales hay n1 de un primer tipo, n2 de
un segundo tipo, . . ., nk de un k-esimo tipo, donde n1 + n2 + + nk = n.
Maneras de hacer una particion de un conjunto.

Solo ilustraremos la primera.

3. Permutaciones sin repeticion de n objetos tomados todos a la vez.


El numero de permutaciones de un conjunto de n elementos distintos es igual1 a
n! := 1 2 (n 1) n, siendo 0! := 1.

Ejemplo 2.2.1 Suponga que una empresa dispone de ocho maquinas atornilladoras
y de ocho espacios en el area de produccion. Entonces, hay 8! = 40.320 maneras de
ordenar las ocho maquinas en los ocho espacios disponibles.

4. Combinacion.
Cualquier escogencia de k objetos de un conjunto de n objetos distintos, sin
importar el orden en que los k objetos son escogidos (una combinacion puede ser
con repeticion o sin repeticion).

5. Formula para calcular el numero de combinaciones.


El numero de combinaciones de k objetos seleccionados, sin repeticion, de un
conjunto de n elementos, es2
   
n n! n
:= , siendo := 1.
k k!(n k)! 0

Y el numero de combinaciones de k objetos seleccionados con repeticion, de un


conjunto de n elementos, es
   
n+k1 (n + k 1)! n
= , siendo := 1.
k k!(n 1)! 0

Ejemplo 2.2.2 (Combinaciones tomadas de 2 en 2, sin repeticion) Hay 10 posi-


bles formas de escoger dos letras de un total de 5, cuando el orden no importa y la
seleccion es sin repeticion.

Ejemplo 2.2.3 (Combinaciones tomadas de 2 en 2, con repeticion) Hay 15 posi-


bles formas de escoger dos letras de un total de 5, cuando el orden no importa y la
seleccion es con repeticion.
1
El smbolo ! se conoce con el nombre de factorial. Cuando escribamos, por ejemplo, 5!
leeremos 5 factorial. Algunos valores factoriales son los siguientes:

1! = 1, 2! = 2 1 = 2, 3! = 3 2 1 = 6, 4! = 4 3 2 1 = 24, etc.

2 n

Los numeros k
se conocen con el nombre de coeficiente binomial.
2.3 Introduccion a la probabilidad 22

2.3 Introduccion a la probabilidad

En general, hay 4 formas de calcular o estimar la probabilidad, a saber, mediante


los siguientes metodos (que se relacionan todos entre s): axiomatico, de la fre-
cuencia relativa, clasico y subjetivo.

Solo explicaremos brevemente los metodos emprico y clasico.

6. Propiedades de la probabilidad.

(a) P() = 0 y P() = 1.


(b) Si los eventos A, B y C son mutuamente excluyentes,3 entonces, P(A B
C) = P(A) + P(B) + P(C).
(c) P(A) = 1 P(A), siendo A el complemento de A.
(d) 0 P(A) 1.
(e) P(A) = P(A B) + P(A B).
(f) Teorema de adicion para 2 eventos o formula de Silvester:

P(A B) = P(A) + P(B) P(A B).

(g) Teorema de adicion para 3 eventos o formula de Silvester:

P(ABC) = P(A)+P(B)+P(C)P(AB)P(AC)P(BC)+P(ABC).

7. Metodo emprico.
Utiliza datos que se han observado empricamente, registra la frecuencia con que
ha ocurrido algun evento en el pasado y estima la probabilidad de que el evento
ocurra nuevamente con base en estos datos historicos.

8. Frecuencia relativa de un evento.


Supongamos que un experimento aleatorio se repite n veces y que un evento
A asociado con estas n repeticiones ocurre exactamente k veces. Entonces, la
k
frecuencia relativa del evento A es fn = n .

Ejemplo 2.3.1 La tabla 2.1 muestra experimentos hechos por tres investigadores:
Observese que en cada una de las investigaciones, la frecuencia relativa del numero de
caras es aproximadamente 0,5, que es la probabilidad de obtener una cara.

9. Probabilidad emprica.
Sea A un evento asociado con un experimento. Entonces, la probabilidad P(A) es
aproximadamente igual a la frecuencia relativa de A si efectuamos el experimento
muchas veces.
Al usar esta definicion, tener en cuenta:

Esta probabilidad es solo una estimacion del valor real.


3
Es decir, todas las posibles intersecciones son vacas.
2.3 Introduccion a la probabilidad 23

Frecuencia
Hecho Numero de Numero relativa
por Lanzamientos de caras de caras
Buffon 4.040 2.048 0,5069
K. Pearson 12.000 6.019 0,5016
K. Pearson 24.000 12.012 0,5005

Fig. 2.1: Lanzamientos de una moneda realizada por 3 investigadores

A mayor numero de experimentos mejor sera la estimacion.


Los experimentos deben repetirse siempre bajo las mismas condiciones.

10. Probabilidad (clasica) un evento elemental.


Sea un espacio muestral finito y no vaco. Entonces,
1
P(evento elemental) = . (2.1)
Numero de elementos de
Ejemplo 2.3.2 Consideremos el experimento de lanzar una moneda. Entonces, la
probabilidad de obtener cara, simbolizado por P(C), y la de obtener sello, simbolizado
por P(S), esta dado por P(C) = P(S) = 12 = 0, 5. Estas probabilidades las interpreta-
mos de la siguiente manera: En un gran numero de lanzamientos aparecera una cara
aproximadamente en la mitad de los lanzamientos y sello en la otra mitad. O tambien
podemos decir: si la moneda se lanza repetidamente, entonces, el 50% (que resulta de
multiplicar 0,5 por 100) de las veces resultara cara y en el otro 50%, sello.

11. Probabilidad (clasica) de un evento.


Sea finito, no vaco y supongamos que (2.1) se cumple para cada evento ele-
mental de . Entonces, para cada evento A de , tenemos
Numero de elementos de A
P(A) = . (2.2)
Numero de elementos de
Ejemplo 2.3.3 Dos dados no falsos se lanzan. Sea B el evento de obtener por lo
menos un 11. Entonces, la probabilidad de que la suma sea por lo menos un 11 es
3 1
P(B) = 36 = 12 .

Ejemplo 2.3.4 En la primera epoca del desarrollo de un yacimiento de petroleo, una


empresa estimo en 0,1 la probabilidad de que las reservas economicamente recuper-
ables excedieran los 2.000 millones de barriles. La probabilidad de que las reservas
excediesen los 1.000 millones de barriles se estimo en 0,5. Dada esta informacion, la
probabilidad estimada de que las reservas se encuentren entre 1.000 y 2.000 millones
de barriles es 0, 5 0, 1 = 0, 4.

Ejemplo 2.3.5 Un estante tiene 6 libros de matematicas y 4 de fsica. Si todos


los libros de matematicas son diferentes y los libros de fsica tambien, entonces, la
probabilidad de que 3 libros determinados de matematicas esten juntos es P(A) =
8! 3!
10! = 0, 0666.
2.3 Introduccion a la probabilidad 24

Ejemplo 2.3.6 Una caja de doce lapiceros tiene dos que estan defectuosos. Se ex-
traen tres lapiceros sin reemplazo. Entonces, la probabilidad de que dos salgan defec-
10
tuosos es P(A) = 220 = 0, 045.

12. Probabilidad condicional de A dado B.


Se define como P(A/B) = P(AB)
P(B) si P(B) > 0.

Ejemplo 2.3.7 Una persona lanza una moneda tres veces. Entonces, la probabilidad
de obtener 3 caras dado que salio por lo menos una cara es 1/8 1
7/8 = 7 .

13. Teorema de multiplicacion para 2 eventos.


Si A y B son dos eventos de un espacio muestral 6= y si P(B A) > 0,
entonces,

P(B A) = P(B/A) P(A) o por P(B A) = P(A/B) P(B).

Ejemplo 2.3.8 Supongamos que una caja tiene diez bolas, de los cuales tres estan
defectuosas. Se sacan dos bolas, una detras de la otra y sin reemplazo. Sean A el
evento la primera bola sacada esta defectuosa y B el evento la segunda bola sacada
esta defectuosa. Entonces, la probabilidad de sacar una bola defectuosa seguida de
otra defectuosa es
3 2
P(A B) = P(A) P(B/A) = .
10 9

14. Teorema de multiplicacion para 3 eventos.


Si P(A1 A3) > 0, entonces,

P(A1 A3) = P(A1) P(A2/A1) P(A3/A1 A2).

Como podemos observar claramente, en este teorema hemos considerando que A1 es el evento
que primero sucede, luego sucede A2 ; posteriormente, A3 .

Ejemplo 2.3.9 Una caja contiene 6 fichas rojas, 4 blancas y 5 azules. Halle la
probabilidad de que se extraigan en el orden roja (R), blanca (B) y azul (A) si las
fichas no se reemplazan es P(R B A) = 0, 044.

15. Teorema de la probabilidad total.


Si los eventos A1, A2, . . ., An forman una particion4 de un espacio muestral y
si P(Ai) > 0 para todo i = 1, . . . , n, entonces, para cada evento B de , se tiene
que

P(B) = P(B/A1) P(A1) + P(B/A2) P(A2) + + P(B/An) P(An).

Ejemplo 2.3.10 La caja I contiene 3 fichas rojas(R) y 2 azules (A), en tanto que la
caja II contiene 2 fichas rojas y 8 azules. Se lanza una moneda no falsa de tal forma
que si cae cara, entonces, se saca una ficha de la caja I y, por el contrario, si cae sello,
se saca una ficha de la caja II. Supongamos que quien lanza la moneda no revela si
resulta cara o sello (de tal forma que la caja de la cual se saco una ficha no se revela).
4
Es decir, todas las posibles intersecciones son vacas y la union de todos los eventos son iguales
a .
2.3 Introduccion a la probabilidad 25

Fig. 2.2: Diagrama para la situacion del ejemplo 2.3.10

Entonces, la probabilidad de haber sacado una ficha roja es


P(R) = P(R/I) P(I) + P(R/II) P(II) = 0, 4.

Ejemplo 2.3.11 Un editor enva propaganda de un libro de estadstica al 70% de


aquellos profesores que estan a cargo de esa materia. El 40% de aquellos que recibieron
la propaganda se decidieron a utilizar el libro, inclusive, el 20% de los que no recibieron
la propaganda tambien utilizaran el libro. Entonces, la probabilidad de utilizar el
libro es 0,34 (se aplica el teorema de la probabilidad; tambien se puede calcular la
probabilidad con ayuda del diagrama de arbol que aparece en la figura 2.3).

Fig. 2.3: Diagrama para la situacion del ejemplo 2.3.11

16. Regla o teorema de Bayes.


Sea A1, A2, . . . , An una particion5 de un espacio muestral . Entonces, para
cada evento B con P(B) > 0 y para todo k = 1, . . . , n, se tiene
P(B/Ak) P(Ak)
P(Ak/B) = .
P(B/A1) P(A1) + P(B/A2) P(A2) + + P(B/An) P(An)

Para poder aplicar la regla de Bayes, recomendamos dibujar siempre un diagrama


de arbol.
5
Es decir, todas las posibles intersecciones son vacas y la union de todos los eventos son iguales
a .
2.3 Introduccion a la probabilidad 26

Ejemplo 2.3.12 Considere la situacion del ejemplo 2.3.10. Entonces, la probabilidad


de haber escogido la caja I (es decir, que el resultado de la moneda sea cara) es
3 1
P(R/I) P(I) 5 2 3
P(I/R) = = 3 1 1 1
= = 0, 75.
P(R/I) P(I) + P(R/II) P(II) 5 2 + 5 2
4

Ejemplo 2.3.13 Un analista de bolsa examina las perspectivas de las acciones de un


gran numero de companas. Cuando se investigo el comportamiento de estas acciones
un ano antes, se descubrio que el 15% experimentaron un crecimiento superior al de la
media, el 40% inferior y el 45% restante se mantuvieron alrededor de la media. El 30%
de los valores que crecieron por encima de la media fueron clasificados como buenas
adquisiciones por el analista, al igual que el 15% de las que crecieron alrededor de
la media y el 20% de las que tuvieron un crecimiento inferior. Al aplicar el teorema
de Bayes, la probabilidad de que un valor clasificado como buena adquisicion por
el analista crezca por encima de la media del mercado es igual a 0,3658.

Ejemplo 2.3.14 En cierta ciudad, aproximadamente el 10% de los habitantes esta


afectado por una rara enfermedad (A), para la cual se ha desarrollado una prueba de
diagnostico. A traves de esta prueba se ha determinado que el 85% de los individuos
que padecen la enfermedad, presentan un resultado positivo (B), mientras que el
20% de los individuos sin la enfermedad muestran un resultado de prueba positivo.
Supongamos que se hace una prueba en un individuo seleccionado al azar. Todas
las probabilidades mencionadas en el problema se pueden identificar en el siguiente
diagrama de arbol que se muestra en la figura 2.4.

Fig. 2.4: Diagrama de arbol para los datos del ejemplo 2.3.12.

(a) La probabilidad de que el resultado sea positivo es

P(B) = P(A) P(B/A) + P(A) P(B/A) = 0, 085 + 0, 18 = 0, 265.

(b) Si el resultado es positivo, entonces, la probabilidad de que el individuo tenga


2.4 Independencia 27

la enfermedad es (por el teorema de Bayes):

P(A B) 0, 085
P(A/B) = = = 0, 3207.
P(B) 0, 265

2.4 Independencia
1. Independencia.
A, B son (estocasticamente) independientes, si y solo si P(A/B) = P(A) y son
dependientes en cualquier otro caso. Es decir, el evento A es independiente del
evento B si la probabilidad de A no se ve afectada por la ocurrencia o no de B.

2. Teorema de multiplicacion para eventos independientes.


Dos eventos A, B de un espacio muestral 6= son independientes si y solo si

P(A B) = P(A)P(B).

3. Teorema de independencia.
Sean A, B eventos de un espacio muestral 6= . Entonces, las siguientes cuatro
proposiciones son equivalentes:

(a) A y B son independientes. (b) A y B son independientes.


(c) A y B son independientes. (d) A y B son independientes.

Ejercicios
1. Una universidad realiza tres tipos de pruebas a 100 aspirantes y obtiene los siguientes
resultados: 2 fracasaron en las tres pruebas; 7, en la primera y en la segunda; 8, en la
segunda y en la tercera; 10, en la primera y en la tercera; 25, en la primera; 30, en
la segunda; 25, en la tercera. Determine el numero de aspirantes que conforman los
siguientes eventos:
(a) Fracasaron exactamente en una prueba.
(b) Aprobaron las tres pruebas.
(c) Fracasaron en la primera y en la tercera, pero no en la segunda.
(d) Fracasaron en la segunda y en la tercera, pero no en la primera.
(e) Fracasaron en al menos una prueba.
(f) Aprobaron al menos una prueba
(g) Aprobaron la segunda o la tercera, pero no la primera.
2. Un equipo de futbol ha determinado contratar un futbolista de talla internacional para el
proximo campeonato. Sean A, B y C eventos que representan el hecho de que el futbolista
contratado ha jugado en el Real Madrid, en el Milan y en el Bayern de Munich, respecti-
vamente. Utilice las operaciones de union, interseccion y complemento para describir, en
terminos de A, B y C, dibuje un diagrama de Venn y sombree la region correspondiente
a cada uno.
(a) Por lo menos el futbolista ha jugado en uno de los tres equipos mencionados ante-
riormente.
Cap. 2. Ejercicios 28

(b) El futbolista ha jugado en los tres equipos mencionados anteriormente.


(c) El futbolista ha jugado en el Real Madrid y no en el Milan.
(d) El futbolista solo ha jugado en el Bayern de Munich.
(e) El futbolista ha jugado exactamente en uno de los tres equipos mencionados ante-
riormente.
3. Los estudiantes de un curso de estadstica se clasifican como estudiantes de administra-
cion, economa o ingeniera; como repitente o no repitente y tambien como hombre o
mujer. Encuentre el numero total de clasificaciones posibles para los estudiantes de dicho
curso.
4. Supongamos que 7 personas se quieren organizar en una fila. De cuantas maneras
diferentes pueden hacerlo?
5. La mayor accionista de una determinada empresa decide que en el futuro se divida el pre-
supuesto de publicidad entre tres agencias. Seis son las agencias que se estan considerando
para este trabajo. Cuantas son las posibles elecciones de tres agencias?
6. Las placas para autos en Barranquilla antes tenan dos letras y cuatro numeros. El sistema
de nomenclatura cambio y ahora son de tres letras y tres numeros. Con el sistema actual,
aumento o disminuyo el numero de placas que se pueden emitir? En que porcentaje?
7. En una comunidad el 30% de las personas son fumadoras, 55% son bebedoras y 20%
tanto fumadoras como bebedoras. Calcule la probabilidad de que una persona elegida al
azar (a) fume pero no beba, (b) ni fume ni beba, (c) fume o no beba. Interprete siempre
sus resultados.
8. Para un control de calidad se seleccionan aleatoriamente dos abanicos sin reemplazo de un
lote. Si uno de los dos abanicos esta defectuoso, todo el lote se rechaza. Si una muestra
de 200 abanicos contiene cinco defectuosos calcule la probabilidad de que la muestra sea
rechazada.
9. La siguiente tabla recoge las proporciones de adultos en cierta ciudad, clasificadas en
aquellos que fuma o no fuman y aquellos que tiene problemas de salud.

Problemas Fuman No fuman


S 0,15 0,09
No 0,18 0,58

(a) Cual es la probabilidad de que un adulto de esta poblacion elegido al azar tenga
problemas de salud?
(b) Cual es la probabilidad de que un adulto de esta poblacion elegido fume?
(c) Cual es la probabilidad de que un adulto de esta poblacion elegido al azar que no
fume tenga problemas de salud?

10. En cierta empresa, 31% de los empleados son europeos, 42% son asiaticos y 27% son
latinoamericanos. De los empleados europeos, 34% son mujeres; de los asiaticos, 42%
son mujeres; mientras que de los latinoamericanos, 72% son mujeres.
(a) Cual es la probabilidad de que un empleado seleccionado al azar sea una (mujer)
europea? (Hombre) asiatico?
(b) Cual es la probabilidad de que un empleado seleccionado al azar sea una mujer?
Hombre?
(c) Si un empleado seleccionado al azar es una mujer, cual es la probabilidad de que sea
europea? Asiatica? Latinoamericana?
Cap. 2. Ejercicios 29

(d) Repita el inciso anterior, teniendo en cuenta que el empleado seleccionado sea un
hombre.
11. Una empresa fabrica computadores, cuyo disco duro tienen capacidad de 20 GB y otros
con capacidad de 30 GB. En el mes anterior, 35% de los computadores vendidos han sido
los que tienen disco duro de 20 GB. De los compradores de computadores con disco duro
de 20 GB, 45% compran los que tienen una memoria RAM de 356 MB, mientras que
el 30% de los compradores de computadores con disco duro de 30 GB tambien lo hacen
as. Si sabemos que un comprador seleccionado al azar ha comprado un computador con
memoria RAM de 356 MB, cual es la probabilidad de que tenga un computador con disco
duro de 30 GB?
12. Una prestigiosa Universidad de Barranquilla utiliza tres hoteles locales para proporcionar
hospedaje nocturno a sus profesores invitados. Supongamos que a 25% de los profesores
se les asignan habitaciones en el Hotel Las Nieves, al 45% en el Hotel El Mar y al 30%
en el Hotel San Felipe. Si hay una decorado especial en 3% de la habitaciones del Hotel
Las Nieves, 5% del Hotel El Mar y en 8%de las habitaciones del Hotel San Felipe, cual
es la probabilidad de que
(a) a un cliente se le asigne una habitacion con decorado especial?
(b) a una persona con una habitacion que tiene un decorado especial se le haya acomodado
en el Hotel El Mar?
13. Una emisora de bonos municipales tiene tres categoras de clasificacion (A, B y C).
Suponga que el ano pasado, de los bonos municipales que se emitieron en cierto pais,
70% tuvieron clasificacion A, 20% clasificacion B y 10% clasificacion C. De los bonos
municipales con clasificacion A, 50% fueron emitidos en ciudades, 40% en suburbios y
10% en areas rurales. De los bonos municipales con clasificacion B, 60% fueron emitidos
en ciudades, 20% en suburbios y 20% en areas rurales. De los bonos municipales con
clasificacion C, 90% fueron emitidos en ciudades, 5% en suburbios y 5% en areas rurales.
(a) Que proporcion de bonos municipales emiten las ciudades? Los suburbios? Las
areas rurales?
(b) Si una ciudad emitiera un nuevo bono municipal, cual seria la probabilidad de que
tuviera clasificacion A?
14. Se les pregunto a los suscriptores de un periodico local si lean regularmente, ocasional-
mente o nunca la seccion de deportes y, tambien, si haban practicado futbol durante el
ano anterior. La proporciones obtenidas en la encuesta figuran en la siguiente tabla.

Futbol Lee regularmente Lee ocasionalmente Nunca lee


S 0,21 0,16 0,31
No 0,10 0,04 0,18

(a) Cual es la probabilidad de que un suscriptor elegido al azar nunca lea la seccion de
deportes?
(b) Cual es la probabilidad de que un suscriptor elegido al azar haya jugado futbol durante
el ano pasado?
(c) Cual es la probabilidad de que un suscriptor que nunca lea la seccion de deportes
haya jugado futbol durante el ano pasado?
(d) Cual es la probabilidad de que un suscriptor que ha jugado futbol durante el ano
pasado nunca lea la seccion de deportes?
(e) Cual es la probabilidad de que un suscriptor que no lea regularmente la seccion de
deportes haya jugado futbol durante el ano pasado?
Cap. 2. Ejercicios 30

15. Suponga que las proporciones de fenotipos sanguneos en determinada poblacion son los
siguientes: A : 35%, B : 28%, AB : 13% y O : 24%. Supongamos que los fenotipos de
dos personas seleccionadas al azar son independientes entre s. Cual es la probabilidad
de que ambos fenotipos sean O?
16. Se clasifican muestras de hule de espuma de tres proveedores de acuerdo a si cumplen o
no con las especificaciones. Los resultados de 100 muestras se resumen a continuacion:

Proveedor S cumple No cumple


1 17 3
2 18 10
3 50 2

Si A denota el evento de que una muestra es del proveedor 1 y si B denota el evento de


que una muestra cumple con las especificaciones, determine si A y B son independientes.
Son independientes A y B?
17. Se selecciono una muestra de 570 encuestados en una cierta ciudad para recoger in-
formacion acerca del comportamiento de los consumidores. Entre las preguntas estaba:
Disfruta usted comprando ropa? De 270 hombres, 165 respondieron que s. De 300
mujeres, 224 respondieron que s.
(a) Suponga que el participante elegido es mujer. Cual es la probabilidad de que no
disfrute comprando ropa?
(b) Suponga que el participante elegido disfruta comprando la ropa. Cual es la proba-
bilidad de que la persona sea hombre?
(c) Los eventos disfrutar comprando ropa y sexo del participante, son estadsticamente
independientes? Explique.
18. Una compana de seguros estima que el 30% de los accidentes de automovil son debidos
al estado de embriaguez del conductor y que el 20% provocan heridos. Ademas, el 40% de
los accidentes que dan lugar a heridos son debidos al estado de embriaguez del conductor
(a) Cual es la probabilidad de que un accidente elegido al azar haya sido causado por el
estado de embriaguez del conductor y haya dado lugar a heridos?
(b) Son los sucesos debido al estado de embriaguez del conductor y da lugar a heridos
independientes?
(c) Si un accidente elegido al azar es causado por el estado de embriaguez del conductor,
cual es la probabilidad de que haya dado lugar a heridos?
(d) Cual es la probabilidad de que un accidente elegido al azar haya sido provocado por
el estado de embriaguez del conductor y no haya dado lugar a heridos?
CAPITULO 3

Distribuciones de probabilidad

3.1 Variables aleatorias discretas


1. Variable aleatoria.
X : R. Se clasifica en discreta o continua.

2. Variable aleatoria discreta.


Tiene una cantidad o finita o (infinita) enumerable de valores.

3. Funcion de probabilidad f de X.
Una funcion f : R [0, 1] tal que

P(X = x), si x = x1, x2, . . .;
f(x) =
0, de otra forma.

Es claro que:

(a) f(x) 0 para todo valor x real.


P
(b) f(x) = 1.
xR

(c) La grafica de f es un histograma de probabilidad.

4. Funcion de distribucion acumulada de X.


Una funcion F : R [0, 1] definida por
X
F(t) = P(X t) = f(x), para todo t real.
x; xt

5. Propiedades de F.

(a) 0 F(t) 1.
(b) F es creciente y escalonada.
(c) F() = 1 y F() = 0.
3.2 Variables aleatorias continuas 32

6. Comentarios generales.

(a) P(X = a) no siempre es cero.


(b) P(a < X b) = F(b) F(a).
(c) P(a X b) 6= F(b) F(a).
(d) P(a X b) 6= P(a < X b).

7. Como se calcula f a partir de F?


Si a es el valor maximo posible de X que es estrictamente menor que a, entonces,

f(a) = F(a) F(a)

8. Esperanza y varianza.
X X
E(X) = xk f(xk), V(X) = (xk )2 f(xk).
k k

9. Propiedades de la esperanza y varianza.

(a) E(aX + b) = aE(X) + b.


(b) V(aX + b) = a2V(X).
 2
(c) V(X) = E(X2) E(X) .

3.2 Variables aleatorias continuas


1. Variable aleatoria.
X : R. Se clasifica en discreta o continua.

2. Variable aleatoria continua.


Tiene una cantidad infinita no enumerable de valores.

3. Funcion de densidad f de X.
Una funcion f : R [0, ) que cumple las dos condiciones:
Rb
(a) P(a X b) = f(x) dx, para todo a y b reales.
a

R
(b) El area bajo toda la grafica de f es 1, es decir, f(x) dx = 1.

La grafica de f es una curva.

4. Funcion de distribucion acumulada de X.


Una funcion F : R [0, 1] definida por

Zt
F(t) = P(X t) = f(x) dx, para todo t real.

Cap. 3. Ejercicios 33

5. Propiedades de F.

(a) 0 F(t) 1.
(b) F es creciente y continua.
(c) F() = 1 y F() = 0.

6. Comentarios generales.

(a) P(X = a) siempre es cero.


(b) P(a < X b) = F(b) F(a).
(c) P(a X b) = F(b) F(a).
(d) P(a X b) = P(a < X b) = P(a X < b) = P(a < X < b).

7. Como se calcula f a partir de F?


f(x) = F (x), para todo valor de x en donde exista la derivada.

8. Esperanza y varianza.

Z
Z
E(X) = x f(x) dx, V(X) = (x )2 f(x) dx.

9. Propiedades de la esperanza y varianza. Las mismas que en el caso discreto.

Ejercicios
1. Son las siguientes afirmaciones verdaderas o falsas? Justifique cada respuesta.
(a) Toda variable aleatoria es un numero.
(b) Si f es la funcion de probabilidad de una variable aleatoria discreta X y 0 es un posible
valor de X, entonces, f(0) = 0.
(c) Para cualquier variable aleatoria discreta X se cumple que P(X = 1) = 1, en donde 1
es un posible valor de X.
(d) Si F es la funcion de distribucion acumulada de una variable aleatoria X discreta,
entonces, F es una funcion escalonada.
(e) Si X es una variable aleatoria discreta con funcion de distribucion acumulada F, en-
tonces, se cumple que P(3 X < 5) = F(5) F(3).
(f) Si f es la funcion de densidad de una variable aleatoria continua X, entonces, f(x) =
P(X = x), para todo numero real x.
(g) Para cualquier variable aleatoria continua X se cumple que P(X = 1) = 1.
(h) Si F es la funcion de distribucion acumulada de una variable aleatoria X continua,
entonces, F es una funcion escalonada
(i) Si X es una variable aleatoria continua con funcion de distribucion acumulada F,
entonces, se cumple que P(4 X < 8) = F(8) F(4).
(j) Si X es cualquier variable aleatoria y si la variable aleatoria X + 4 tiene esperanza 1,
entonces, la esperanza de X es 5.
Cap. 3. Ejercicios 34

2. Una pizzera, que atiende pedidos por correo, tiene cinco lneas telefonicas. Sea X la
variable aleatoria que representa al numero de lneas en uso en un momento especfico.
Supongamos que la funcion de probabilidad f de X esta dada en la siguiente tabla:

Valor x de X 0 1 2 3 4 5
f(x) 0,20 0,25 0,10 0,15 0,09 0,21

Calcule la probabilidad de cada uno de los siguientes eventos:


(a) A = a lo sumo 2 lneas estan en uso.
(b) B = menos de 4 lneas estan en uso.
(c) C = por lo menos 3 lneas estan en uso.
(d) D = entre 2 y 4 (ambos inclusive) lneas estan en uso.
(e) E = entre 2 y 5 (ambos inclusive) lneas no estan en uso.
(f) F = por lo menos 3 lneas no estan en uso.
3. La funcion de probabilidad de la variable aleatoria X que representa al numero de imper-
fecciones por 4 metros de un papel especial en rollos continuos de ancho uniforme, esta
dada por

x 0 1 2 3 4
f(x) 0,21 0,28 0,10 0,25 0,16

Determine la funcion de distribucion acumulada de X y representela graficamente.


4. Una fabricante de lapiceros tiene un programa de control de calidad que incluye la in-
speccion de lapiceros recibidos para revisar que no tengan defectos. Supongamos que, en
cierto da, el recibe lapiceros en lotes de cinco y se seleccionan dos lapiceros de un lote
para inspeccionarlos. Podemos representar los posibles resultados del proceso de seleccion
por pares. Por ejemplo, el par (3, 4) representa la seleccion de los lapiceros 3 y 4 para
inspeccionarlos.
(a) Haga una lista de los resultados diferentes.
(b) Supongamos que los lapiceros 3 y 4 son los unicos defectuosos de un lote de cinco y
se van a escoger dos lapiceros al azar. Defina la variable aleatoria X como el numero
de de lapiceros defectuosos observado entre los inspeccionados. Encuentre la funcion
de probabilidad de X.
(c) Encuentre la funcion de distribucion acumulada F de X y representela graficamente.
5. Al invertir en unas acciones particulares, una persona puede tener una ganancia en un ano
de $8.000.000 con probabilidad de 0,4 o tener una perdida de $2.000 con probabilidad de
0,6. Cual es la ganancia esperada de esta persona? Interprete su respuesta.
6. El numero total de horas, medidas en unidades de 10 horas, que una familia utiliza una
lavadora en un perodo de 6 meses es una variable continua X con funcion de densidad

x,
si 0 < x < 1,
f(x) = 2 x si 1 x < 2,


0, de otro modo.

(a) Haga un bosquejo de la grafica de f.


(b) Cual es la probabilidad de que en un perodo de 6 meses, una familia utilice su
lavadora menos de 15 horas? Entre 5 y 12 horas?
Cap. 3. Ejercicios 35

7. Suponga que la temperatura de reaccion (en grados centgrados) de cierto proceso qumico
es una variable aleatoria continua X con funcion de densidad

1 x, si k x k,
f(x) =
0, de otra manera.

(a) Halle el valor de k para que f sea en realidad una densidad y, luego, trace la grafica
de f.
(b) Calcule la probabilidad de que la temperatura de reaccion sea estrictamente positiva.
(c) Calcule la probabilidad de que la temperatura de reaccion se encuentre entre 0 y 1/2
grados centgrados.
(d) Calcule probabilidad de que la temperatura de reaccion sea menor que 1/4 grados
centgrados o mayor que 1/4 grados centgrados.

8. Un maestro universitario nunca termina su clase antes de que suene la campana y siempre
termina su clase por lo menos 2 minutos despues de que suena la campana. Sea X el
tiempo (en minutos) que transcurre entre la campana y el termino de la clase, y suponga
que la funcion de densidad de X es

kx2 , si 0 x 2,
f(x) =
0, de otra manera.

(a) Encuentre el valor de k y luego grafique f.


(b) Cual es la probabilidad de que la clase termine por lo menos 1 minuto despues de
que suene la campana?
(c) Cual es la probabilidad de que la clase continue entre 60 y 90 segundos despues de
que suene la campana?
(d) Cual es la probabilidad de que la clase continue por lo menos 90 segundos despues
de que suene la campana?

9. Un vendedor recibe un salario anual de 12.000.000 de pesos, mas un 5% del valor de


las ventas que realiza. Las ventas anuales pueden representarse mediante una variable
aleatoria con media 20.000.000 de pesos y desviacion tpica de 2.000.000 de pesos. Halle
la media y la desviacion del ingreso anual de este vendedor.
CAPITULO 4

Distribuciones especiales

1. Distribuciones especiales discretas:


Uniforme discreta, de Bernoulli, binomial, de Poisson, hipergeometrica, binomial
negativa, geometrica, etc.

2. Distribuciones especiales continuas:


Uniforme continua, normal, gamma, exponencial, t de Student, Chi-cuadrada, F
de Weibull, etc.

4.1 La distribucion uniforme (discreta)


1. Definicion.
Una variable aleatoria discreta X con los valores enteros sobre el intervalo [a, b]
tiene distribucion uniforme discreta sobre el conjunto de los numeros en-
1
teros que estan en el intervalo [a, b], cuando se tiene que P(X = x) = ba+1 ,
para todo x entero que esta en el intervalo [a, b]. Ademas,

a+b (b a + 1)2 1
E(X) = y V(X) = .
2 12

4.2 La distribucion binomial


1. Experimento de Bernoulli.
Aquel con solo dos resultados posibles: exito y fracaso y en donde un exito
ocurre con probabilidad p, siendo 0 < p < 1.

2. Experimento binomial.
Es un experimento de Bernoulli que se ejecuta n veces, de tal manera que las
diferentes ejecuciones se efectuen independientemente unas de las otras.

3. Distribucion binomial.
Si se realiza n veces un experimento de Bernoulli con probabilidad de exito p y si
4.3 La distribucion de Poisson 37

X denota al numero total de exitos obtenidos, entonces, la probabilidad de que se


obtengan k exitos es
 k
P(X = k) = n k p (1 p)
nk
, k = 0, 1, 2, . . . , n.

La correspondiente distribucion de X se conoce con el nombre de distribucion


binomial con parametros n y p. Ademas, E(X) = np y V(X) = np(1 p).

Fig. 4.1: Distribucion binomial para varios n pero fijo np = 3.

Ejemplo 4.2.1 Una moneda no falsa es lanzada 10 veces. Consideraremos el evento


cara como un exito y sello como un fracaso. Es claro que p = 0, 5, n = 10 y
las condiciones basicas que caracterizan a la distribucion binomial se satisfacen. Por
consiguiente,

(a) La probabilidad de tener exito exactamente 7 veces es 0,1172.


(b) La probabilidad de tener a lo mas 7 exitos es 0,945.
(c) La probabilidad de tener por lo menos 3 exitos es 0,945 y la probabilidad de
ningun exito es 9.766 104 .

4.3 La distribucion de Poisson


1. Experimento y proceso de Poisson.

Consideremos las siguientes variables aleatorias:

(a) El numero de partculas emitidas por cierta sustancia radioactiva en un de-


terminado lapso de tiempo.
(b) El numero de llamadas que llegan a una central telefonica en cierto intervalo
de tiempo.
4.3 La distribucion de Poisson 38

(c) El numero de ordenes de devolucion de piezas que recibe una empresa en


una semana.
(d) El numero de veces que falla una pieza de un equipo durante un perodo de
tres meses.
(e) El numero de huelgas anuales en un empresa.

Cada una de estas variables aleatorias esta asociada a unos procesos llamados
procesos de Poisson.

2. Distribucion de Poisson.
Consideremos un proceso de Poisson con parametro > 0 (es decir, es el numero
promedio de ocurrencias por unidad de tiempo) y sea X el numero de eventos
que ocurren en un intervalo de tiempo [0, t]. Entonces, la probabilidad de que
ocurran k eventos en el intervalo [0, t] esta dada por
1 k
P(X = k) = e , k = 0, 1, 2, 3, . . . .
k!

siendo e la base del logaritmo natural. La correspondiente distribucion de X se


conoce con el nombre de distribucion de Poisson con parametro . E(X) =
V(X) = .

Fig. 4.2: Distribuciones de Poisson para varios valores del parametro .

Ejemplo 4.3.1 Los sabados por la manana, los clientes entran en una pequena tienda
de un centro comercial suburbano a una tasa esperada de 0,50 por minuto. Halle la
probabilidad de que el numero de clientes que entran en un intervalo especfico de 10
minutos es (a) 3, (b) a lo mas 3.
SOLUCION:
Las hipotesis del proceso de Poisson parecen ser razonables en este contexto. Damos
por sentado que los clientes no llegan en grupos (o podemos contar al grupo entero
como un solo cliente) y que la entrada de un cliente no aumenta ni disminuye la
4.4 La distribucion hipergeometrica 39

probabilidad de que llegue otro. Para obtener , observamos que auna tasa media de
0,50 por minuto durante un periodo de 10 minutos, podemos esperar = (0, 50)(10) =
5 entradas. Sea X la variable aleatoria que representa al numero de clientes que entran
en un intervalo especfico de 10 minutos. Por tanto, (a) P(X = 3) = 0, 1403 y (b)
P(X 3) = 0, 2650.

Ejemplo 4.3.2 La distribucion de Poisson ha resultado ser muy util en problemas


de lneas de espera o colas. Los clientes llegan a una maquina fotocopiadora a una
tasa media de 2 cada 5 minutos. En la practica, se pueden representar los procesos
de llegada de esta clase mediante una distribucion de Poisson. Asumiendo que este es
el caso,

(a) La probabilidad de que no haya llegadas en un perodo de cinco minutos es 0,135.


(b) La probabilidad de que haya 1 llegada es 0,271.
(c) La probabilidad de que haya estrictamente mas de dos llegadas es 0,323.

3. Teorema de aproximacion de la binomial a la Poisson.


Sea X una variable aleatoria binomial con parametros n y p. Si n es grande
(n 100), p pequena (p 0, 01) y np tiene un tamano moderado (np 20),
entonces, la distribucion binomial con parametros n y p puede aproximarse bien por
la distribucion de Poisson con parametro = np. Es decir, bajo estas condiciones
se cumple que

b(k; n; p) p(k; np), k = 0, 1, 2, 3, . . .

o, que es equivalente,

B(k; n; p) P(k; np), k = 0, 1, 2, 3, . . . .

Ejemplo 4.3.3 Una cierta compana electronica produce 15.000 unidades de un tipo
especial de tubo al vaco. Se ha observado que, en promedio, 3 tubos de 300 son
defectuosos. La compana empaca los tubos en cajas de 600. Cual es la probabilidad
de que en una caja de 600 tubos hayan (a) 5 tubos defectuosos, (b) por lo menos 3
defectuosos y (c) a lo mas 1 defectuoso?
SOLUCION:
Sea X la variable aleatoria que representa al numero de tubos defectuosos. Entonces,
X es una variable binomial con parametros n = 600 y p = 0, 01. Aplicando el teorema
de aproximacion, tenemos (a) P(X = 5)0, 161, (b) P(X 3) = 0, 938 y (c) P(X 1) =
0, 017.

4.4 La distribucion hipergeometrica


1. Experimento hipergeometrico.

En general, un experimento hipergeometrico con parametros n, M y N


esta basado en las siguientes suposiciones (vease la figura 4.3):

(H1) La poblacion o conjunto donde deba hacerse el muestreo es una poblacion


finita con N elementos.
4.4 La distribucion hipergeometrica 40

(H2) Cada elemento de la poblacion puede ser caracterizado como un exito o un


fracaso.
(H3) Hay M exitos en la poblacion.
(H4) Se elige una muestra sin reemplazo de n individuos, de tal forma que sea
igualmente probable seleccionar cada subconjunto de tamano n.

Fig. 4.3: Esquema grafico de un experimento hipergeometrico

2. Distribucion hipergeometrica.
Sea X el numero de exitos obtenidos en una muestra escogida al azar al realizar un
experimento hipergeometrico con parametros n, M y N. Entonces, la probabilidad
de elegir de manera exacta k exitos en n intentos esta dada por

M NM

k nk
P(X = k) = N
 , donde k = 0, 1, 2, . . . , n y n N. (4.1)
n

La correspondiente distribucion de X se conoce con el nombre de distribucion


hipergeometrica con parametros n, M y N.
   
M Nn M M
E(X) = n y V(X) = n 1 .
N N1 N N

n
Las distribuciones binomial e hipergeometrica coinciden cuando N 0, 05.

Ejemplo 4.4.1 Una cantidad de 8 componentes electricas estan sujetas a un control


de calidad. Fue encontrado que 3 de las componentes no estaban defectuosas y las
componentes que quedaban s lo estaban. Si una muestra aleatoria de 3 componentes
son escogidas de este lote, cual es la probabilidad de que (a) exactamente 2 de ellas
esten defectuosas?, (b) a lo mas 1 de ellas este defectuosa?
SOLUCION:
Sea X la variable aleatoria que representa al numero de componentes defectuosas.
Aplicando la distribucion hipergeometrica con parametros n = 3, N = 8 y M = 3,
tenemos que (a) P(X = 2) = 0, 26786 y (b) P(X 1) = 0, 714286.

Ejemplo 4.4.2 Una compana recibe un pedido de 20 artculos. Dado que la in-
speccion de cada artculo es cara, se sigue la poltica de analizar una muestra de 6
artculos de cada envo (seleccionada sin reemplazo y sin orden), aceptando la remesa
si no hay mas de un artculo defectuoso en la muestra. Entonces, la probabilidad de
que sea aceptado un pedido con cinco artculos defectuosos es de 0,516.
4.5 Las distribuciones binomial negativa y geometrica 41

4.5 Las distribuciones binomial negativa y geometrica


1. Experimento binomial negativo.
Un experimento binomial negativo con parametros r y p esta caracterizado
por las siguientes condiciones:
(BN1) El experimento consta de una serie de experimentos de Bernoulli y que son
independientes entre s.
(BN2) La probabilidad de exito p de cada experimento de Bernoulli es siempre la
misma.
(BN3) El experimento continua hasta que un total de r exitos se haya observado,
siendo r un entero no negativo dado.
2. Distribucion binomial negativa.
Sea X el numero de fracasos que preceden al r-esimo exito en un experimento
binomial negativo con parametros r y p. Entonces, la probabilidad de que hayan
k fracasos antes del r-esimo exito esta dada por
 
k+r1 r
P(X = k) = p (1 p)k, k = 0, 1, 2, . . . .
r1

La correspondiente distribucion de X se conoce con el nombre de distribucion


binomial negativa con parametros r y p. Ademas,
r(1 p) r(1 p)
E(X) = y V(X) = .
p p2
Ejemplo 4.5.1 Una pareja desea tener exactamente dos ninas en su familia. Tendran
hijos (ninos y ninas) hasta que se satisfaga esta condicion. Suponga que la probabili-
dad de que el hijo que nazca varon es igual a 0,5 y que X es la variable aleatoria que
representa a numero de varones que nacen antes de que nazca la segunda hembra.
Entonces,

(a) La probabilidad de que la familia tenga k hijos varones es P(X = k) = (k +


1) (0, 5)k+2 .
(b) La probabilidad de que la familia tenga a lo mas 4 hijos es P(X 2) = 0, 688.
(c) Se esperara esta familia tenga E(X) = 2 varones.
(d) Se esperara que esta familia tenga E(X + 2) = 4 hijos.

3. Distribucion geometrica.
Caso especial de la distribucion binomial negativa con parametros r = 1 y p.

Sea X el numero de fracasos que preceden al primer exito en un experimento


binomial negativo con parametros 1 y p. Entonces, la probabilidad de que haya k
fracasos antes del primer exito esta dada por
P(X = k) = bn(k; 1, p) = p (1 p)k, k = 0, 1, 2, . . . .

La correspondiente distribucion de X se conoce con el nombre de distribucion


geometrica con parametros p. Ademas, E(X) = 1p 1p
p y V(X) = p2 .
4.6 La distribucion uniforme (continua) 42

4.6 La distribucion uniforme (continua)


1. Definicion.
Una variable aleatoria continua X tiene distribucion uniforme con los parametros
a y b con a < b si posee la densidad

1
, si a x b,
f(x) = ba
0, de otro modo.

La media y la varianza de X vienen dadas, respectivamente, por

a+b (a b)2
E(X) = , V(X) = .
2 12

4.7 La distribucion normal


1. Densidad con parametros R y 2 > 0.
Esta dada por

1 (x) 2

(x) = e 2 2 , para todo x R.
22

La funcion de distribucion acumulada normal la simbolizaremos por .

2. Propiedades de la distribucion normal.

(a) Si X es normal con y 2, entonces, E(X) = y V(X) = 2.


(b) Hay toda una familia de distribuciones normales. Cada distribucion normal
especfica se distingue por y (comparese con la figura 4.4).
(c) En la figura 4.4 podemos observar que:
i. La densidad normal es creciente para x < y decreciente para x > .
Es decir, el punto mas alto de la densidad normal se obtiene cuando
x = (vease la figura 4.4a,b).
ii. La densidad normal es simetrica con respecto a .
iii. Las colas, es decir, los extremos o los lados de la densidad normal se
prolongan al infinito en ambas direcciones y nunca tocan el eje horizontal
(vease la figura 4.4a,b).
iv. La desviacion estandar determina el ancho de la curva.
(d) La media, la mediana y la moda son todas iguales (vease la figura 4.4a).
(e) En la figura 4.4c) ilustramos la grafica de la distribucion acumulada normal
para 1 < 2.

3. La distribucion normal estandar.


Aquella con esperanza 0 y varianza 1.

4. Propiedades de la distribucion normal estandar.


4.7 La distribucion normal 43

(a) con = 1 y = 3, 0 y 3. (b) con = 0 y = 0, 3, 1 y 3.

(c) con 1 < 2 .

Fig. 4.4: Graficas de y para diferentes valores de los parametros y .

Simetrica con respecto a 0.


De la figura 4.5: El area de la region I es igual al area de la region II.

5. Conversion a la distribucion normal estandar.


Sea X una variable aleatoria que tiene distribucion normal con parametros y 2.
Entonces,
Z
(a) La variable Z = tiene distribucion normal estandar.
 
(b) Para todo a real, se cumple que P(X a) = P Z a .

Ejemplo 4.7.1 Una compana fabrica focos con vida media de 500 horas y desviacion
estandar de 100. Si se supone que los tiempos de vida util de los focos se distribuyen
normalmente, esto es que los tiempos de vida forman una distribucion normal, en-
tonces, la probabilidad de que cierta cantidad de focos duren entre 650 y 780 horas
es aproximadamente 0,0642.

6. Teorema de aproximacion de la binomial a la normal.


Consideremos un experimento binomial con parametros n y p. Entonces, si (a)
n 30 o (b) np 5 y n(1 p) 5, entonces, la distribucion binomial se puede
4.7 La distribucion normal 44

Fig. 4.5: Las areas de las regiones I y II son iguales en la distibucion normal estandar

aproximar a la distribucion normal con = np y 2 = np(1 p). Si X es una


variable aleatoria que tiene distribucion binomial con parametros n y p, entonces,
!
k + 0, 5 np
P(X k) = B(k; n; p) p .
np(1 p)

Ejemplo 4.7.2 Un fabricante sabe por experiencia que, de 17.000 productos, el 4%


es rechazado por defectos. Si un nuevo lote de 800 unidades se van a inspeccionar,
entonces, la probabilidad aproximada de que menos de 35 unidades sean rechazadas
es aproximadamente 0,6736.

7. Las medidas de curtosis y la distribucion normal.


Con la curtosis se estudia la deformacion, en sentido vertical, respecto a la normal,
de una distribucion (vease la figura 4.6).

(a) Platicurtica. (b) Mesocurtica. (c) Liptocurtica.

Fig. 4.6: Diversos tipos de curvas clasificadas de acuerdo a su apuntamiento.

8. Medidas de curtosis.
Sea X una variable aleatoria continua o discreta. Entonces, el coeficiente de
curtosis de X se define como la diferencia de la division de la cuarta potencia
de la esperanza de la variable X E(X) y el cuadrado de la varianza de X y 3, es
decir, 
E [X E(X)]4
= 3.
[V(X)]2
4.8 Las distribuciones gamma y exponencial 45

De igual manera, el coeficiente de curtosis de un conjunto de datos x1, . . .,


xn con frecuencias f1, . . . , fn se define como la diferencia de la division entre la
media aritmetica de los datos (x1 x)4, . . ., (xn x)4 y el cuadrado de la varianza
de los datos originales. Es decir,
 
f1(x1 x)4 + + fn(xn x)4 /N
= 3,
(Varianza de los datos x1, . . ., xn)2

siendo N := f1 + + fn. El coeficiente de curtosis estandarizado,


simbolizado por s se define como el cociente entre el coeficiente de curtosis y
la raiz cuadrada de 6/N. Es decir,

s = p .
6/N

Una distribucion es mesocurtica (apuntamiento igual al de la normal ) cuando = 0; es lep-


tocurtica (apuntamiento mayor que el de la normal) si > 0 y es platicurtica (apuntamiento
menor que el de la normal) si < 0.

4.8 Las distribuciones gamma y exponencial


1. La funcion gamma y sus propiedades.
La funcion gamma : (0, ) R se define como
Z
() := et t1 dt, para todo > 0.
0

2. Propiedades de la funcion gamma.


(a) Para cualquier > 0, se cumple que ( + 1) = ().
(b) Para cualquier numero natural n, tenemos que (n) = (n 1)!.

(c) 12 = .
3. La distribucion gamma.
Una variable aleatoria X tiene distribucion gamma con parametros > 0 y
> 0 si su funcion de densidad esta dada por

1
x1 ex/ para x > 0
f(x; ; ) =: ()
0, de otra manera.

Cuando = 1, la distribucion se conoce con el nombre de distribucion gamma


estandar. Ademas, E(X) = y V(X) = 2.
4. La distribucion gamma incompleta.
Sea X una variable aleatoria que tiene distribucion gamma estandar con parametro
. La siguiente funcion F recibe el nombre de funcion gamma incompleta
Zt
1
F(t; ) = ex x1 dx, x > 0,
()
0
4.8 Las distribuciones gamma y exponencial 46

(a) = 1, 2, 3 y = 1.

(b) = 2 y = 2, 1, 12 .

Fig. 4.7: Densidad f de la distribucion gamma para diferentes valores de y .

Hay tablas muy completas para la funcion gamma incompleta. En el apendice presentamos
una pequena tabulacion de esta funcion para = 1, 2, . . . , 10 y x = 1, 2, . . . , 15 (vease la
tabla D.4 del apendice).

5. Calculo de probabilidades a partir de la gamma.

Ejemplo 4.8.1 Suponga que el tiempo de reaccion X a cierto estmulo en un indi-


viduo seleccionado al azar tiene distribucion gamma estandar con parametro = 2.
Sea F la funcion gamma incompleta de X. Teniendo en cuenta la tabla D.4 del apendice,
entonces, la probabilidad de el tiempo de reaccion se encuentre entre 3 y 5 (ambos
inclusive) es P(3 X 5) = F(5; 2) F(3; 2) = 0, 159.

La funcion gamma incompleta tambien la podemos utilizar para calcular probabil-


idades en las que aparezcan distribuciones gamma que no sean estandar.
4.8 Las distribuciones gamma y exponencial 47

Teorema 4.8.2 Sea X una variable aleatoria que tiene distribucion gamma
con parametros y . Si F es la funcion gamma incompleta de una variable
aleatoria gamma estandar con parametro , entonces, para todo t > 0, se
cumple que  
t
P(X t) = F ; .

Ejemplo 4.8.3 Suponga que el tiempo X de supervivencia en semanas de un raton


macho seleccionado al azar y expuesto a 240 rads de radiacion gamma tiene una
distribucion gamma con = 8 y = 15. Determine la probabilidad de que un raton
sobreviva (a) entre 60 y 120 semanas y (b) por lo menos 30 semanas.
SOLUCION:
Sea F la funcion gamma incompleta de una variable aleatoria gamma estandar con
parametro = 8. Entonces, la probabilidad de que un raton sobreviva entre 60 y 120
semanas es
   
120 60
P(60 X 120) = F ;8 F ; 8 = 0, 496.
15 15

6. La densidad exponencial con parametro > 0.


Esta dada por 
0, para x < 0,
f(x; ) = x
e , para x 0.

La distribucion exponencial es un caso especial de la distribucion gamma en la que


= 1 y se ha reemplazado por 1/. En este caso, E(X) = 1 y V(X) = 12 .

Fig. 4.8: Distribucion exponencial para = 2, 1, 12 , siendo = 1/.

Ejemplo 4.8.4 El tiempo de atencion al cliente en un servicio de informacion de


una biblioteca sigue una distribucion exponecial, con un tiempo de servicio medio de
5 minutos. Entonces, la probabilidad de que una consulta de un cliente dure mas de
10 minutos es 0,135335.
4.9 Resumen de las distribuciones especiales 48

4.9 Resumen de las distribuciones especiales


En las tablas 4.1 y 4.2 (al final de este captulo) presentamos un resumen de las dis-
tribuciones continuas y discretas, respectivamente, mas importantes.

NOMBRE FUNCION PARAMETROS E(X) V(X)


1 a+b (ab)2
Uniforme f(x) = ba , a<b 2 12
a<x<b
(x) 2

Normal f(x) = 1 ,e 2 2 R, 2
22
xR 2 > 0
x2
Normal f(x) = 12 e 2 , 0 1
estandar xR
Gamma f(x) = 1() x1 ex/, > 0, 2
x>0 >0
1 1
Exponencial f(x) = ex, >0 2
x>0
 (n+1)/2
x2 n
t de Student f(x) = an 1 + n , nN 0, n2 ,
n2 n3
( n+1
2 )
an := ( n
, xR
2)
n

1 n 1 x/2
Chi-cuadrada an x
2 e , n>0 n 2n

n

an := 2n/2 2 , x>0
m
an x 2 1 n 2n2 (m+n2)
F de Fisher f(x) = (n+mx)(m+n)/2
m, n N n2 , m(n2)2 (n4)
,
n3 n5
( m+n
2 )
mm/2 nn/2
an := ( m n
, x>0
2 ) (2)

Tabla 4.1: Resumen de distribuciones continuas


Cap. 4. Ejercicios 49

Ejercicios
1. Con el proposito de establecer el grado de aceptacion de su producto, una empresa selec-
ciona una muestra de 1.000 consumidores de una poblacion de 1.000.000, de forma tal que
cada uno de los elementos de la poblacion tiene la misma probabilidad de ser seleccionado.
A cada consumidor seleccionado se le pregunta si prefiere el producto producido por esta
empresa o no. Es este un experimento binomial? Explique su respuesta.
2. Un fabricante de celulares, desea controlar la calidad de su producto y rechazar cualquier
lote en el que la proporcion de celulares defectuosos sea demasiado alta. Con este fin, de
cada lote grande (digamos, 20.000 celulares) selecciona y prueba 25. Si por lo menos 3
de estos estan defectuosos, todo el lote sera rechazado.
(a) Cual es la probabilidad de que un lote sea rechazado si 5% de los celulares estan
defectuosos?
(b) Cual es la probabilidad de que un lote sea rechazado si 10% de los celulares estan
defectuosos?
(c) Cual es la probabilidad de que un lote sea rechazado si 30% de los celulares estan
defectuosos?
3. Una empresa se dedica a la instalacion de nuevos paquetes computacionales. Se ha
comprobado que en el 10% de 250 instalaciones es necesario volver para realizar algu-
nas modificaciones. En una semana determinada se realizaron 10 instalaciones. Asumir
independencia en los resultados de esas instalaciones.
(a) Cual es la probabilidad de que sea necesario volver en cinco casos?
(b) Cual es la probabilidad de que no sea necesario volver en ninguno los casos?
(c) Cual es la probabilidad de que sea necesario volver en mas de un caso?
4. En un lote de 1.000 bombillas fabricadas por una compana, 10 son defectuosas. Utilice
la aproximacion de la distribucion binomial por la de Poisson para calcular la probabilidad
de que en una muestra de 20 bombillas, (a) 2, (b) 0, (c) por lo menos 3 sean defectuosas.
5. En cierto estudio se reporta que de cada 100 personas, una fuma. Consideremos una
muestra aleatoria de 2.000 personas.
(a) Cual es la distribucion aproximada del numero de quienes fuman?
(b) Utiliza la aproximacion de la parte (a) para calcular la probabilidad aproximada de
que entre 8 y 20 (ambos inclusive) personas fumen.
(c) Utiliza nuevamente la aproximacion de la parte (a) para calcular la probabilidad apro-
ximada de que estrictamente entre 12 y 30 personas fumen.
6. Suponga que los buses llegan a cierto terminal de transporte, segun un proceso de Poisson,
con tasa = 8 buses por hora, de modo que el numero de llegadas por un periodo de t
horas es una variable aleatoria de Poisson con parametro = 8t.
(a) Cual es la probabilidad de que exactamente 5 buses pequenos lleguen durante un
perodo de una hora? Por lo menos 5? A lo mas 10?
(b) Cuales son el valor esperado y la desviacion estandar del numero de buses que llegan
durante un perodo de 90 minutos?
(c) Cual es la probabilidad de que por lo menos 20 buses lleguen durante un perodo de
2 horas y media? De que a lo sumo 10 lleguen durante este perodo?
Cap. 4. Ejercicios 50

7. Un fabricante de computadores se preocupa por el mal funcionamiento de cierto programa


estadstico en un modelo en particular. El mal funcionamiento puede producir en raras
ocasiones un bloqueo en el sistema operativo. Suponga que la distribucion del numero de
computadores por ano que tienen un mal funcionamiento del paquete estadstico es la de
Poisson con = 5.
(a) Cual es la probabilidad de que a lo mas dos computadores por ano tenga un bloqueo
en el sistema operativo?
(b) Cual es la probabilidad de que mas de un computador por ano tenga un bloqueo en
el sistema operativo?
8. Una empresa recibe un pedido de 1.000 artculos. Se analiza una muestra aleatoria de
15 artculos y se acepta el pedido si menos de tres resultan defectuosos. Cual es la
probabilidad de aceptar un envo que contenga un 5% de artculos defectuosos?
9. Cada uno de los 13 computadores de cierta marca ha sido devuelto a un proveedor de-
bido al mal funcionamiento de ciertos programas bajo un determinado sistema operativo.
Supongamos que 7 de estos 13 tienen problemas con la memoria RAM y los otros 6 tienen
problemas con los ejecutables EXE. Si se examinan al azar y sin reemplazo 6 de estos
computadores, cual es la probabilidad de que (a) exactamente 3, (b) a lo mas 2, (c)
estrictamente entre 2 y 5 computadores tengan problemas con la memoria RAM?
10. Una determinada empresa esta interesada en evaluar su procedimiento de inspeccion actual
en embarques de 50 artculos identicos. El procedimiento es tomar una muestra de cinco
y pasar el embarque si no se encuentra mas de dos defectuosos. Que proporcion del 20%
de embarques defectuosos se aceptara?
11. El 10% de los motores armados en una fabrica de montaje estan defectuosos. Si se
seleccionan en forma aleatoria uno por uno y se prueba, calcule la probabilidad de localizar
el tercer motor sin defecto (a) en el quinto ensayo,(b) en el quinto ensayo o antes.
12. De acuerdo con un estudio geologico, en un pozo de exploracion petrolera hay 0,2 de pro-
babilidad de encontrar petroleo. Calcule la probabilidad de localizar petroleo por primera
vez en el tercer pozo que se perfore.
13. Se sabe que en cierto proceso de fabricacion, en promedio, uno de cada 100 artculos esta
defectuoso. Cual es la probabilidad de que el sexto artculo que se inspecciona sea el
primer defectuoso que se encuentra.
14. Suponga que el tiempo de reaccion X (en minutos) a cierto medicamento tiene una
distribucion uniforme continua en el intervalo [5, 5]. Calcule la probabilidad de que la
temperatura de reaccion
(a) sea estrictamente menor que 0
(b) se encuentre entre 2, 5 y 2, 5.
(c) se encuentre entre k y k + 4 si k satisface 5 < k < k + 4 < 5.
15. El tiempo X (minutos) para que un profesor prepare un cuestionario tiene una distribucion
uniforme continua en el intervalo [20, 40].
(a) Escriba la funcion de densidad, la funcion de distribucion acumulada y trace sus
respectivas graficas.
(b) Cual es la probabilidad de que el tiempo de preparacion exceda a 35 minutos?
(c) Cual es la probabilidad de que el tiempo de preparacion se encuentre a 2 minutos
del tiempo medio?
Cap. 4. Ejercicios 51

(d) Para cualquier k tal que 25 < k < k + 2 < 35, cual es la probabilidad de que el
tiempo de preparacion este entre k y k + 2 minutos?
16. Se regula una maquina despachadora de cafe para que sirva un promedio de 200 mililitros
por vaso. Si la cantidad de bebida se distribuye normalmente con una desviacion estandar
de 15 mililitros,
(a) que fraccion de los vasos contendran mas de 191 mililitros?
(b) Cual es la probabilidad de que un vaso contenga entre 209 y 224 mililitros?
(c) Cuantos vasos probablemente se derramaran si se utilizan vasos de 230 mililitros
para las siguientes 1.000 bebidas?
(d) Por debajo de que valor obtendremos un 25% de las bebidas mas pequenas?
17. La vida promedio de cierta maquinaria electrica es 10 anos con una desviacion estandar
de dos anos. El fabricante reemplaza gratis todas las maquinarias que fallen dentro del
tiempo de garanta. Si esta dispuesto a reemplazar solo 3% de las maquinarias que fallan
y si la duracion de una maquinaria sigue una distribucion normal, de que duracion debe
ser la garanta que ofrezca?
18. Los coeficientes de inteligencia de 600 aspirantes a cierta beca escolar en una universidad
extranjera se distribuyen aproximadamente normal con media de 115 y desviacion estandar
de 12. Si la universidad requiere un coeficiente de inteligencia de al menos 95, cuantos
de estos aspirantes seran rechazados sobre esta base sin importar sus otras calificaciones?
19. Suponga que 90% de todas los trabajadores que hay en una determinada empresa no
fuman. Considere una muestra aleatoria de 200 trabajadores y represente con X a la
cantidad de trabajadores que fuman. Cual es la probabilidad aproximada de que X (a)
sea a lo sumo 30? (b) sea mas de 30? (c) este entre 15 (inclusive) y 25 (no inclusive)?
20. Suponga que solo 80% de todos las personas mayores de 18 anos que viven en cierto
pueblo cerca del mar saben nadar. Se selecciona al azar una muestra de 200 personas
mayores de 18 anos del pueblo. Cual es la probabilidad de que
(a) entre 50 y 100 (ambos inclusive) de las personas mayores de 18 anos del pueblo no
sepan nadar?
(b) menos de 140 de las personas mayores de 18 anos del pueblo sepan nadar? Y mas
de 150?
21. Suponga que el tiempo (en horas) tomado por una cocinea para preparar una deliciosa
comida es una variable aleatoria X que tiene una distribucion gamma con parametros
= 2 y = 1/2. Cual es la probabilidad de que tarde (a) a lo sumo 1 hora, (b) por lo
menos 2 horas,(c) entre 0,5 y 1,5 horas para preparar la comida?
22. Un reconocido cientfico ha determinado que el tiempo de supervivencia (en semanas)
de un animal cuando se le somete a cierta exposicion de radiacion gamma tiene una
distribucion gamma con = 5 y = 10.
(a) Cual es el tiempo medio de supervivencia de un animal seleccionado al azar del tipo
que se utilizo en el experimento?
(b) Cual es la desviacion estandar del tiempo de supervivencia?
(c) Cual es la probabilidad de que un animal sobreviva mas de 30 semanas?
23. El tiempo de respuesta de una computadora es una aplicacion importante de las distribu-
ciones gamma y exponencial. Suponga que un estudio de cierto sistema de computadoras
revela que el tiempo de respuesta en segundos tiene una distribucion exponencial con una
media de tres segundos. Cual es la probabilidad de que el tiempo de respuesta (a) exceda
5 segundos, (b) no exceda 10 segundos?
Cap. 4. Ejercicios 52

24. Suponga que la vida de cierto tipo de batera tiene una tasa de falla constante anunciada
de 0,01 por hora y que tiene distribucion exponencial.
(a) Cual es el tiempo medio de falla?
(b) Cual es la probabilidad de que pasen 300 horas antes de que se observen dos fallas?

s 25. Utilizando la opcion Plot. . .Probability Distributions. . .Binomial de Statgraphics, realizar:


(a) Los ejemplos 3.5.4 y 3.5.6 de [11].
(b) Los ejercicios 37, 39 (partes b y c), 43 (partes a,b,c y d) y 51 de [11].

s 26. Utilizando la opcion Plot. . .Probability Distributions. . .Poisson de Statgraphics, realizar


los ejemplos 3.6.2, 3.6.3, 3.6.4, 3.6.5, 3.6.9 y 3.6.10 de [11].
s 27. Utilizando la opcion Plot. . .Probability Distributions. . .Poisson de Statgraphics, realizar
los ejercicios 53, 55, 57, 61 (incisos a y c) y 63 de [11].
s 28. Utilizando la opcion Plot. . .Probability Distributions. . .Hypergeometric de Statgraphics,
realizar:
(a) Los ejemplos 3.7.1, 3.7.3, 3.7.4 y 3.7.5 de [11].
(b) Los ejercicios 65, 67, 69, 73 y 77 (inciso b) de [11].

s 29. Utilizando la opcion Plot. . .Probability Distributions. . .Negative Binomial de Statgraphics,


realizar:
(a) El ejemplo 3.8.2 (incisos b y c) de [11].
(b) Los ejercicios 80 y 84 de [11].

s 30. Utilizando la opcion Plot. . .Probability Distributions. . .Geometric de Statgraphics, reali-


zar:
(a) El ejemplo 3.8.6 (incisos a,b) de [11].
(b) Los ejercicios 81, 85, 87 y 89 de [11].

s 31. Utilizando la opcion Plot. . .Probability Distributions. . .Uniform de Statgraphics, realizar:


(a) Los ejemplos 4.3.2 y 4.3.3 de [11].
(b) Los ejercicios 24, 25 (inciso b), 26 y 28 (incisos a y b) de [11].

s 32. Utilizando la opcion Plot. . .Probability Distributions. . .Normal de Statgraphics, realizar:


(a) Los ejemplos 4.4.2, 4.4.4, 4.4.6 y 4.4.7 de [11].
(b) Los ejercicios 30 (incisos a, b, c y d), 32 (incisos b y c), 35, 36 y 41 (incisos a y b)
de [11].

s 33. Utilizando la opcion Plot. . .Probability Distributions. . .Gamma de Statgraphics, realizar:


(a) Los ejemplos 4.5.8 y 4.5.12 de [11].
(b) Los ejercicios 50, 51, 53 y 55 (inciso c) de [11].

s 34. Utilizando la opcion Plot. . .Probability Distributions. . .Exponential de Statgraphics, re-


alizar:
(a) Los ejemplos 4.5.15 y 4.5.16 de [11].
(b) Los ejercicios 57, 58, 59 (inciso b), 60, 61 y 63 (inciso b) de [11].
Cap. 4. Ejercicios
NOMBRE FUNCION PARAMETROS E(X) V(X)
n n
1 1 P 1 P 2
Uniforme f(xk) = n, x1 < x 2 < < x n n xk n xk
k=1 k=1
 n 2
1 P
k = 1, 2, . . . , n nN n xk
k=1
De dos f(x1) = p, x1 < x2 x1p + x2(1 p) (x1 x2)2p(1 p)
puntos f(x2) = 1 p 0<p<1
Bernoulli f(0) = p, p p p(1 p)
f(1)= 1 p
Binomial f(k) = n k
k p (1 p)
nk 0<p<1 np np(1 p)
k = 0, 1, 2, . . . , n nN
1 k
Poisson f(k) = k! e >0
k = 0, 1, 2, 3, . . .
(M NM
k ) ( nk ) M Nn
 M M

Hiper- N M N0, N N, n N n N N1 n N 1 N
(n )
geometrica k N0, k n, k M nMN
 r r(1p) r(1p)
Binomial f(k) = k+r1
r1 p (1 p)
k r > 0, p p2
negativa k = 0, 1, 2, . . . 0<p<1
1p 1p
Geometrica f(k) = p (1 p)k 0<p<1 p p2
k = 0, 1, 2, . . .

Tabla 4.2: Resumen de distribuciones dicretas

53
CAPITULO 5

Distribuciones conjuntas

5.1 Vectores aleatorios discretos


1. Vectores aleatorios.
Vectores (es decir, tuplas ordenadas), digamos, de la forma (X1 , X2 , . . . , Xn ) cuyas com-
ponentes X1 , X2 , . . ., Xn son variables aleatorias. Pueden ser discretos, continuos o
mixtos.
2. Vectores aleatorios discretos.
Si todas las componentes del vector son discretas.
3. Funcion de probabilidad conjunta f de (X, Y).
Una funcion f : R2 [0, 1] tal que

f(xi , yk ) := P(X = xi , Y = yk ), para todo i, j = 1, 2, . . ..

Es claro que:

(a) f(xi , yk ) 0 para todo valor xi de X y para todo valor yk de Y.


PP
(b) f(xi , yk ) = 1.
i k

4. Funcion de distribucion acumulada de X.


Una funcion F : R2 [0, 1] definida por
X X
F(x, y) = P(X x, Y y) = f(xi , yk ).
xi con yk con
xi x yk y

para todo x y y reales.


5. Funcion de probabilidad marginal.
(a) De la variable X:
X
fX (xi ) := P(X = xi ) = f(xi , yk ), para todo i = 1, 2, . . ..
k
5.1 Vectores aleatorios discretos 55

(b) De la variable Y:
X
fY (yk ) := P(Y = yk ) = f(xi , yk ) para todo k = 1, 2, . . ..
i

6. Funcion de dist. acumulada marginal.


X X
FX (t) := P(X t) := fX (xi ), FY (t) := P(Y t) := fY (yk ).
xi t yk t

7. Funcion de probabilidad condicional de Y, dado X = x.

f(x, y)
h(y/x) = , para todo y real.
fX (x)

8. Independencia.
X y Y independientes f(x, y) = fX (x) fY (y).
9. Covarianza de X y Y.
Si X y Y tienen varianza finita, entonces,

Cov(X, Y) := E [X E(X)][Y E(Y)] = E(XY) E(X)E(Y).

10. Coeficiente de correlacion de X y Y.


Si X y Y tienen varianza finita y positiva, entonces,

Cov(X, Y)
Corr(X, Y) := p .
V(X) V(Y)

11. Propiedades.
(a) X, Y independientes Cov(X, Y) = 0. (Recproco no es cierto)
(b) X, Y independientes Corr(X, Y) = 0. (Recproco no es cierto)
(c) 1 Corr(X, Y) 1.
(d) Corr(X, Y) = 1 o 1 existen m, r reales con m 6= 0, tales que Y = mX + r.

12. Esperanza y varianza condicional de Y dado que X = x.


X X 2
E(Y/X = x) = y h(y/x), V(Y/X = x) = (y E(Y/X = x) h(y/x).
y y

13. Propiedades de la esperanza y de la varianza condicional.



(a) E(Y) = E E(Y/X) .
 2   2
(b) V(Y/X) = E Y E(Y/X) = E(Y 2 /X) E(Y/X) .
 
(c) E V(Y/X) = E(Y 2 ) E [E(Y/X)]2 .
 
(d) V E(Y/X) = E [E(Y/X)]2 [E(Y)]2 .
 
(e) V(Y) = E V(Y/X) V E(Y/X) .
5.2 Vectores aleatorios continuos 56

5.2 Vectores aleatorios continuos


1. Vector aleatorio.
Vectores (es decir, tuplas ordenadas), digamos, de la forma (X1 , X2 , . . . , Xn ) cuyas com-
ponentes X1 , X2 , . . ., Xn son variables aleatorias. Pueden ser discretos, continuos o
mixtos.
2. Vectores aleatorios continuos.
Si todas las componentes del vector son continuas.
3. Funcion de densidad conjunta f de (X, Y).
Una funcion f : R2 [0, ) que cumple las dos condiciones:
Rb Rd
(a) P(a X b, c Y d) = f(x, y) dx dy.
ac

R
R
(b) El volumen bajo toda la superficie de f es 1, es decir, f(x, y) dx dy = 1.

4. Funcion de distribucion acumulada de X.


Una funcion F : R2 [0, 1] definida por
Zt Zs
F(s, t) = P(X s, Y t) = f(x, y) dx dy,

para todo s y t reales.


5. Funcion de densidad marginal.
(a) De la variable X:

Z
fX (x) := f(x, y) dy, para todo x real.

(b) De la variable Y:

Z
fY (y) := f(x, y) dx, para todo y real.

6. Funcion de dist. acumulada marginal.

Zt Zt
FX (t) := P(X t) := fX (x) dx, FY (t) := P(Y t) = fY (y) dy.

7. Funcion de probabilidad condicional de Y, dado X = x.

f(x, y)
h(y/x) = , para todo y real.
fX (x)

8. Independencia.
Igual que en el caso discreto.
9. Covarianza de X y Y.
Igual que en el caso discreto.
Cap. 5. Ejercicios 57

10. Coeficiente de correlacion de X y Y.


Igual que en el caso discreto.
11. Propiedades.
Igual que en el caso discreto.
12. Esperanza y varianza condicional de Y dado que X = x.

Z
Z
2
E(Y/X = x) = y h(y/x) dy, V(Y/X = x) = y E(Y/X = x) h(y/x) dy.

13. Propiedades de la esperanza y de la varianza condicional.


Las mismas que en el caso discreto.

Ejercicios
1. Un investigador sospecha que en cierto pas, el numero diario de cigarrillos que fuman
los estudiantes durante la semana de examenes finales (variable X) puede depender del
numero de examenes que el estudiante debe realizar en el da (variable Y). La tabla de
abajo muestra las probabilidades conjuntas estimadas en un estudio:

f(x, y) Y=0 1 2 3
X=0 0,09 0,07 0,01 0,06
1 0,06 0,01 0,07 0,07
2 0,14 0,03 0,06 0,07
3 0, 04 0,04 0,04 0,14

(a) Halle la funcion de probabilidad marginal de X y la de Y.


(b) Cual es la probabilidad que un estudiante seleccionado al azar fume por lo menos 2
cigarrillos y tenga que hacer 3 examenes en un da?
2. Un agente inmobiliario esta interesado en averiguar cual es la relacion entre el numero
de lneas de un anuncio en prensa sobre un apartamento y el volumen de demanda de
informacion por parte de posibles inquilinos. Representemos el volumen de demanda
mediante la variable aleatoria X, que toma el valor 0 si despierta poco interes, 1 para
un interes moderado, y 2 si despierta un fuerte interes. Sea Y la variable aleatoria que
representa al numero de lneas del anuncio. El agente estima que la funcion de probabilidad
conjunta es la que aparece en la tabla de abajo.
f(x, y) Y=3 4 5
X=0 0,08 0,07 0,04
1 0,13 0,22 0,10
2 0,10 0,15 0,11

(a) Si F es la funcion acumulada conjunta de X y Y, halle F(1, 4) e interprete el resultado.


(b) Halle la funcion de probabilidad marginal de Y y, con ello, halle la probabilidad de que
Y = 5.
3. Una vinatera cuenta con instalaciones para atender a clientes que llegan en automovil y
a quienes llegan caminando. En un da seleccionado aleatoriamente, sean X y Y, respec-
tivamente, los perodos de tiempo que se utilizan para cada caso. La funcion de densidad
conjunta de X y Y es

2
(x + 2y), si 0 x 1, 0 y 1,
f(x, y) = 3
0, de otro modo.
Cap. 5. Ejercicios 58

(a) Verifique si f satisface las propiedades de una funcion de densidad conjunta.


(b) Halle la funcion de densidad marginal de X y y la de Y.

4. Un centro de servicios trabaja con dos lneas. En un da seleccionado al azar, sean X y Y


las respectivas proporciones de tiempo de que la primera y segunda lneas esten en uso.
Suponga que X y Y tienen funcion de densidad conjunta

3 2
(x + y2 ), si 0 x 1 y 0 y 1.
f(x, y) = 2
0, de otro modo.

(a) Determine la probabilidad de que ninguna lnea este ocupada mas de la mitad del
tiempo.
(b) Calcule la probabilidad de que la primera lnea este ocupada mas del 65% del tiempo.

5. Sean X y Y dos variables aleatorias continuas con funcion de densidad conjunta



k(6 x y), si 0 < x < 2 y 2 < y < 4,
f(x, y) =
0, de otro modo.

Halle el valor de k y encuentre P(1 < Y < 3/X = 2).


6. La tabla siguiente muestra, para los poseedores de entre una y tres tarjetas de credito, las
probabilidades conjuntas del numero de tarjetas de que dispone (variable X) y el numero
de compras a credito realizadas durante una semana (variable Y).

f(x, y) Y=0 1 2 3 4
Y=1 0,03 0,07 0,04 0,06 0,10
2 0,08 0,03 0,09 0,07 0,08
3 0,13 0,02 0,07 0,08 0,05

(a) Para una persona elegida aleatoriamente de este grupo, cual es la funcion de proba-
bilidad del numero de compras semanales?
(b) Para una persona de este grupo que posea tres tarjetas, cual es la funcion de pro-
babilidad del numero de compras semanales?
(c) Son estadsticamente independientes el numero de tarjetas disponibles y el numero
de compras realizadas?

7. Sea X el tiempo de reaccion (en segundos) de un producto a cierto estimulante y Y


la temperatura, en grados celsius, a la que la reaccion comienza a suceder. Estas dos
variables aleatorias tienen la funcion de densidad conjunta

kxy, si 0 < x < 1 y 0 < y < 1.
f(x, y) =
0, de otro modo,

(a) Halle el valor de k.


(b) Encuentre la densidad marginal de X y la de Y.
(c) Encuentre la funcion de distribucion acumulada de Y.
(d) Encuentre la probabilidad de que la pieza 2 tenga una duracion de vida entre 0,5 y 3
anos.
(e) Son X y Y son independientes?
Cap. 5. Ejercicios 59

8. Mara y Josefa, dos distinguidas profesoras entregan sus examenes finales a la secretaria
de matematicas para que sean pasados al computador. Sea X = numero de errores en la
escritura del examen de la profesora Mara y Y el numero de errores en el de la profesora
Josefa. Suponga que X y Y son independientes y que cada una tiene distribucion de
Poisson con parametro 2.
(a) Cual es la funcion de probabilidad conjunta de X y Y?
(b) Cual es la probabilidad de que a lo sumo se cometa en total un error en ambos
examenes?
9. Una persona tiene dos bateras para un reloj en particular. Sean X y Y las variables
aleatorias que representan a las duracion de la primera y segunda bateras, respectivamente
(ambas en horas). Ademas, X y Y son independientes y cada una tiene una distribucion
exponencial con parametro 1.
(a) Cual es la funcion de probabilidad conjunta de X y Y?
(b) Cual es la probabilidad de que cada batera dure a lo sumo 20 horas?
(c) Cual es la probabilidad que la duracion total de las dos bateras sea a lo sumo 30
horas?
(d) Cual es la probabilidad que la duracion total de las dos bateras este entre 20 y 30
horas?
10. Sean X y Y variables aleatorias que denotan las longitudes de dos dimensiones de una
pieza maquinada, respectivamente. Si X y Y son independientes y, ademas, la distribucion
de X es normal con media 10,5 milmetros y varianza 0,0025 milmetros cuadrados, y
la distribucion de Y es normal con media 3,2 milmetros y varianza 0,0036 milmetros
cuadrados, determine la probabilidad de que (a) 10, 4 < X < 10, 6, (b) 3, 15 < Y < 3, 25.
11. Sea X el numero de veces en que cierta secretaria se levanta de su puesto para ir al bano:
1, 2 o 3 veces en una hora dada. Sea Y el numero de veces en que el jefe le llama la
atencion a la secretaria. Supongamos que la funcion de probabilidad conjunta de X y Y
esta dada por

f(x, y) X=1 2 3
Y=1 0,01 0,09 0,05
2 0,10 0,06 0,18
3 0,07 0,10 0,34

(a) Encuentre la funcion de probabilidad marginal de X y la de Y.


(b) Son X y Y independientes?
(c) Encuentre P(Y = 2/X = 3) e interprete su valor.
(d) Encuentre la covarianza de las variables X y Y.

12. Una profesora ha realizado un examen parcial que tiene dos partes. Para un estudiante
seleccionado al azar, sea X el numero de puntos ganados en la primera parte, Y el numero
de puntos ganados en la segunda parte y suponga que la funcion de probabilidad conjunta
de X y Y esta dada por

f(x, y) Y=0 1,0 2,0 2,5


X=0 0,06 0,02 0,04 0,02
1,5 0,15 0,10 0,01 0,20
2,5 0,14 0,01 0,10 0,15
Cap. 5. Ejercicios 60

(a) Si la nota final del examen parcial es el numero total de puntos ganado en las dos
partes, cual es la nota final esperada por el estudiante?
(b) Si se registra el maximo de las dos calificaciones, cual es la nota final esperada por
el estudiante?
(c) Calcule la covarianza y el coeficiente de correlacion para X y Y.

13. De una caja que contiene 3 focos rojos y 4 focos amarillos se selecciona una muestra
aleatoria de 2 focos sin reemplazo y al mismo tiempo. Si X es el numero de focos rojos y
Y el de focos amarillos en la muestra, encuentre:
(a) La funcion de distribucion conjunta de X y Y.
(b) P(X + Y 1) e interprete este valor.
(c) La funcion de probabilidad condicional de Y, sabiendo que X = 2.
(d) La probabilidad de que Y = 0, sabiendo que X = 2.
(e) Encuentre la covarianza de las variables X y Y.
14. Si X y Y son variables aleatorias independientes con densidades marginales
 
8 2y
3 , si 1 < x < 2. 3 , si 1 < y < 2.
fX (x) = 3x y fY (y) =
0, de otro modo, 0, de otro modo,

respectivamente, encuentre el coeficiente de correlacion de X.


s 15. Utilizando la opcion Plot. . .Probability Distributions de Statgraphics, realizar los ejercicios
8 (inciso b), 9 (incisos b, c y d) y 10.
s 16. Suponga que X1 , X2 y X3 son variables aleatorias representan el espesor (en milesimas de
milmetro) de un sustrato, una capa activa y una capa de recubrimiento de un producto
qumico. Suponga que X1 , X2 y X3 son independientes y que tienen una distribucion
normal con medias 1 = 10.000, 2 = 1.000, 3 = 80 y desviaciones estandar 1 = 250,
2 = 20 y 3 = 4, respectivamente. Las especificaciones para el espesor del sustrato, la
capa activa y la capa de recubrimiento deben estar son 9.200 < x1 < 10.800, 950 < x2 <
1.050 y 75 < x3 < 85, respectivamente.
(a) Utilizando la opcion Plot. . .Probability Distributions de Statgraphics, determine que
proporcion de los productos qumicos cumple con todas las especificaciones.
(b) Cual de los tres espesores es el que tiene la menor probabilidad de cumplir con las
especificaciones?
s 17. Cierta fabrica manufacturera tiene tres departamentos de produccion independientes (y
solo tres). Las toneladas de producto obtenidas en un da determinado en el primer depar-
tamento siguen una distribucion gamma de parametros = 2 y = 1, las obtenidas en
el segundo departamento siguen una gamma con = 3 y = 1 las obtenidas en el tercer
departamento siguen una gamma con = 4 y = 1. Utilice la opcion Plot. . .Probability
Distributions de Statgraphics para calcular la probabilidad de que la fabrica produzca en
un da determinado mas de 4 toneladas de producto en total.
CAPITULO 6

Distribuciones muestrales

6.1 Conceptos basicos


1. Tecnicas de muestreo aleatorio.
Muestreo aleatorio simple, muestreo estratificado, muestreo por conglomerados y muestreo
sistematico. Solo se tratara el muestreo aleatorio simple.
2. Muestreo aleatorio simple.
Un procedimiento de muestreo aleatorio simple es aquel en el que todas las posibles
muestras del mismo tamano tienen la misma probabilidad de ser escogidas. A las mues-
tras obtenidas por procedimientos de este tipo se las denomina muestras aleatorias
simples.

Este metodo se usa con tanta frecuencia que, en muchos casos, el adjetivo simple se elimina
de ambos terminos definidos anteriormente.

Ejemplo 6.1.1 Se asume que una cadena nacional de comidas rapidas desea selec-
cionar aleatoriamente 5 de los 10 estados de un pas para tomar muestras sobreel gusto
de los consumidores. Una muestra aleatoria simple garantizara que las 10 5 = 252
muestras de tamano 5 tengan la misma probabilidad de ser utilizada en el estudio.
En este caso, la probabilidad de escoger una muestra aleatoria simple de tamano 5
sera 0,00397 y la probabilidad de escoger una muestra aleatoria simple de tamano 7
sera 0,00833. .

3. Tablas de numeros aleatorios.


Una tabla de numeros aleatorios consiste en una tabla de numeros que se hace
y se presenta en tal forma que cada uno de los numeros 0 a 9 aparecen en ella con una
frecuencia aproximadamente igual. Es decir, cada uno de estos numeros aparecen en la
tabla con la misma probabilidad.
4. Estadsticos y distribuciones muestrales.
Supongamos que se ha extrado una muestra aleatoria de una poblacion y que se desea
hacer inferencia sobre ciertas caractersticas de la distribucion de la poblacion. Esta in-
ferencia estara basada en algun estadstico muestral, es decir, en alguna funcion
particular de la informacion muestral.
6.2 Distribuciones muestrales de algunos estadsticos 62

Matematicamente, un estadstico muestral puede definirse de la siguiente manera: Sean


X1 , . . . , Xn variables aleatorias de tal forma que el vector aleatorio (X1 , . . . , Xn ) conforme
una muestra aleatoria extraida de alguna poblacion. Entonces, un estadstico muestral
para esta muestra es un funcon que depende solo de las variables aleatorias X1 , . . . , Xn .

5. Ejemplos tpicos de estadsticos.


La media muestral, la mediana muestral, la moda muestral, el rango muestral, la varianza
muestral, la desviacion estandar muestral y la proporcion muestral, entre otros.
6. Distribucion muestral.
La distribucion de un estadstico muestral recibe el nombre de distribucion muestral,
o distribucion en el muestreo y se define como la distribucion de probabilidades de
los valores que puede tomar el estadstico a lo largo de todas las posibles muestras con el
mismo numero de observaciones que pueden ser extradas de la poblacion.

6.2 Distribuciones muestrales de algunos estadsticos


Al final de este captulo se presentan unas tablas que ilustran la forma de las distribuciones
muestrales de algunos estadsticos. Algunos comentarios:
En la tabla 6.1 aparece un resumen acerca de la distribucion muestral de la media muestral.
En la tabla 6.2 aparece un resumen de la distribucion muestral de la diferencias de medias
muestrales (muestras independientes).
Al definir X1 X2 =: X y al considerar el problema de determinar la distribucion muestral de
X para el caso en que las muestras sean dependientes o pareadas, los diferentes supuestos
que se deben tener en cuenta coinciden con los que aparecen en la tabla 6.1.
En la tabla 6.3 aparece un resumen de la distribucion muestral de la proporcion muestral
y de la diferencia de proporciones muestrales.
En la tabla 6.4 aparece un resumen de la distribucion muestral de la varianza muestral y
de la razon de varianzas muestrales. Importante, tener en cuenta que, para la distribucion
chi-cuadrada con grados de libertad se cumple que, si > 40, entonces,
r !3
2 2
2, 1 + z .
9 9
6.3 Aplicaciones 63

6.3 Aplicaciones
Ejemplo 6.3.1 Supongamos que el incremento porcentual de los salarios de los funcionarios
de todas las corporaciones medianas se distribuye siguiendo una normal con media 12, 2%
y desviacion tpica 3, 6%. Se toma una muestra aleatoria de nueve observaciones de esta
poblacion de incrementos porcentuales de salario. Cual es la probabilidad de que la media
muestral sea mayor del 10%?
SOLUCION:
Como no conocemos el tamano de la poblacion, supondremos que esta es infinita. Tenemos
que = 12, 2, = 3, 6 y n = 9. Entonces,

P(X > 10) = 1 P(Z 1, 83) = 0, 9664.

Ejemplo 6.3.2 Una empresa emplea 1.500 personas. La cantidad promedio gastada, du-
rante un ano determinado, en servicios medicos personales por empleado fue de 2.575 dolares
y la desviacion tpica de 525 dolares. Cual es la probabilidad de que una muestra aleatoria
de 100 empleados (seleccionados sin reemplazo) arroje una media comprendida entre 2.500
y 2.700 dolares?
SOLUCION:
Tenemos que N = 1.500, = 2.575, = 525 y n = 100. Teniendo en cuenta que la poblacion
dada es finita y que la varianza poblacional se conoce, entonces, la probabilidad requerida
es

P(2.500 < X < 2.700) = P(Z < 2, 46) P(Z < 1, 48) = 0, 9237.

Ejemplo 6.3.3 Suponga que de una poblacion normal con media 20 se toma una muestra
de tamano 16. Si la desviacion estandar muestral es 4, encuentre la probabilidad de que la
media muestral sea estrictamente mayor que 21,753.
SOLUCION:
Tenemos que = 20, s = 4 y n = 16. Debido a que la poblacion es normal con varianza
desconocida y a que n < 30, entonces, la distribucion muestral de la media muestral es la t
de Student con n 1 = 15 grados de libertad. Entonces, la pobabilidad pedida sera

P(X > 21, 753) = P(t15 > 1, 753) = 0, 05 = 5%.

Ejemplo 6.3.4 Se toma una muestra de 250 casas de una poblacion de edificios antiguos
para estimar la proporcion de casas de este tipo cuya instalacion electrica resulta insegura.
Supongamos que, de hecho, el 30% de todos los edificios de esta poblacion tienen una
instalacion insegura. Hallar la probabilidad de que la proporcion de edificios de la muestra
con instalacion insegura este entre 0,25 y 0,35.
SOLUCION:
Tenemos que p = 0, 30 y n = 250. Por consiguiente, la probabilidad requerida es

P(0, 25 < p < 0, 35) = P(Z < 1, 72) P(Z < 1, 72) = 0, 9146.

Ejemplo 6.3.5 Los hombres y mujeres adultos radicados en una ciudad grande del norte
de cierto pais difieren en sus opiniones sobre la promulgacion de la pena de muerte para
personas culpables de asesinato. Se cree que el 12% de los hombres adultos estan a favor de
la pena de muerte, mientras que solo el 10% de las mujeres adultas lo estan. Si se pregunta
a dos muestras aleatorias, una de 150 hombres y otra de 100 mujeres, su opinion sobre
la promulgacion de la pena de muerte para personas culpables de asesinato, determine la
probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de
mujeres.
SOLUCION:
6.3 Aplicaciones 64

Representemos con p1 el porcentaje de hombres a favor de la pena de muerte y con p2 el


de mujeres. Por lo tanto, la probabilidad pedida sera

P(p1 p2 0, 03) = P(Z 0, 25) = 0, 4013.

Ejemplo 6.3.6 La tabla de abajo recoge los datos de consumo de gasolina correspondiente
a una muestra aleatoria de 8 automoviles norteamericanos de dos modelos diferentes. Se
formaron pares con las dos muestras y cada elemento de un determinado par fue conducido
por la misma ruta y por el mismo piloto.

xi (auto A) 19,4 18,8 20,6 17,6 19,2 20,9 18,3 20,4


yi (auto B) 19,6 17,5 18,4 17,5 18,0 20,0 18,8 19,2

(a) Determine la media y la desviacion muestral de las diferencias en el consumo de gasolina.


(b) Suponiendo que la distribucion de las diferencias poblacionales es normal con media
-0,807, encuentre la probabilidad de que el consumo promedio de gasolina del auto A
sea mayor que el del auto B.

SOLUCION:
(a) Haciendo di = xi yi , tenemos que d = 0, 775 y sd = 0, 903.
(b) Tenemos que A B = 0, 807. Sean XA y XB las variables que representan al
consumo promedio de gasolina de los autos A y B, respectivamente. Nos piden calcular
P(XA > XB ) o, que es lo mismo, P(XA XB > 0). Hagamos D = XA XB . Entonces,
teniendo en cuenta la tabla t de Student (con n 1 = 7 grados de libertad) encontramos
que

P(D > 0) = P(t > 2, 3645) = 0, 025.

Ejemplo 6.3.7 En un estudio para comparar los pesos promedios de ninos y ninas de sexto
grado en una escuela de instruccion media, se usara una muestra aleatoria de 20 ninos y otra
igual de 25 ninas. Se sabe que, tanto para ninos y ninas, los pesos siguen una distribucion
normal. El promedio de los pesos de todos lo ninos de sexto grado de esa escuela es de 100
libras y su desviacion estandar es de 14,142, mientras que el promedio de los pesos de todas
las ninas del sexto grado es de 85 libras y su desviacion estandar es de 12,247. Encuentre
la probabilidad de que el promedio de los pesos de los 20 ninos sea al menos 20 libras mas
grande que el de los de las 25 ninas.
SOLUCION:
Supongamos que X1 representa el promedio de los pesos de 20 ninos y X2 , el promedio de
los pesos de una muestra de 25 ninas. Nos piden calcular P(X1 X2 > 20). Como las dos
poblaciones en cuestion son normales y con varianzas conocidas, entonces,

P(X1 X2 > 20) = P(Z 1, 25) = 0, 1056.

Ejemplo 6.3.8 Suponga que dos drogas A y B, de las que se dice que reducen el tiempo
de respuesta de las ratas a determinado estmulo, se estan comparando en un experimento
de laboratorio. El experimentador supone que las respectivas poblaciones de los tiempos
de respuesta al estmulo estan distribuidos normalmente y tienen varianzas iguales. Se
administra la droga A a 12 ratas y la droga B a 13. Cuando se lleva a cabo el experimento,
la reduccion promedio de tiempo de respuesta al estmulo por parte de las ratas que estan
recibiendo la droga A es 30,45 milisegundos con una desviacion tpica de 5 milisegundos.
Los datos correspondientes a la droga B son 24,9 y 6 milisegundos. Cual es la probabilidad
de que la diferencia entre la reduccion promedio de tiempo de respuesta al estmulo por
6.3 Aplicaciones 65

parte de las ratas que estan recibiendo la droga A y la reduccion promedio de tiempo de
respuesta al estmulo por parte de las ratas que estan recibiendo la droga B sea menor o
igual a la que se observo en el experimento? Suponga que no hay diferencia alguna entre las
dos drogas con respecto a la reduccion promedio en tiempos de respuestas y que las drogas
son igualmente efectivas.
SOLUCION:
Sean XA y XB la reduccion promedio de tiempo de respuesta al estmulo por parte de las ratas
que estan recibiendo la droga A y la droga B, respectivamente. Como las dos poblaciones en
cuestion son normales y los tamanos de las muestras son grandes (observe que los tamanos
de ambas muestras son mayores o iguales que 30), entonces,

P(XA XB 5, 55) = P(Z 1, 31) = 0, 9049.

Ejemplo 6.3.9 Repita el ejemplo 6.3.8, pero ahora suponiendo que las poblaciones no
tienen distribucion normal y que los tamanos muestrales son menores que 30, digamos
nA = 12 y nB = 13.
SOLUCION:
Como las dos poblaciones en cuestion son normales y los tamanos de las muestras son
pequenas (observese que los tamanos muestrales son estrictamente menores que 30), en-
tonces:
La distribucion muestral de XA XB es aproximadamente la t de Student con 23
grados de libertad.
Debido a que no hay diferencia alguna entre las dos drogas con respecto a la reduccion
promedio en tiempos de respuestas y que las drogas son igualmente efectivas, entonces,
A = B . Por consiguiente, la media de la distribucion muestral de XA XB es 0.
La varianza muestral combinada s2 es 30,74.
Por consiguiente,

P(XA XB 5, 55) = P(t 2, 5) = 0, 01.

Ejemplo 6.3.10 Repita el ejemplo 6.3.8, pero ahora suponiendo que las poblaciones no
tienen distribucion normal, que los tamanos muestrales son menores que 30 (digamos nA =
12 y nB = 13) y que las varianzas poblacionales son diferentes.
SOLUCION:
En este caso:
La distribucion muestral de XA XB es aproximadamente la t de Student con 23
grados de libertad.
De nuevo, la media de la distribucion muestral de XA XB es 0.
Por consiguiente,

P(XA XB 5, 55) = P(t 2, 52) 0, 01.

Ejemplo 6.3.11 En una prueba sobre la efectividad de dos tipos de pldoras para dormir,
A y B, se utilizaran dos grupos independientes de personas con insomnio. A un grupo de
tamano 61 se le administrara la pldora A y al otro grupo, de tamano 41, se le administrara
la B, registrandose el numero de horas de sueno de cada individuo participante en el estudio.
Suponiendo que el numero de hora de sueno de quienes usan cada tipo de pldora se distribuye
normalemente y que 2A = 2B , entonces, la probabilidad de que la razon de las varianzas
muestrales de A y B sea mayor que 1,64 esta dada por

P(s2A /s2B > 1, 64) = P F(60, 40) > 1, 64 = 0, 05.
Cap. 6. Ejercicios 66

Ejercicios
1. Un fabricante declara que la duracion de las bujas que el fabrica sigue una distribucion
normal con una media de 36.000 kilometros y una desviacion estandar de 4.000 kilometros.
Para una muestra aleatoria de dieciseis bujas, se obtuvo una duracion media de 34.500
kilometros. Si la afirmacion del fabricante es correcta, cual es la probabilidad de obtener
una media muestral tan pequena como esta o menor?
2. Los tiempos requeridos para que unos trabajadores terminen cierta labor, se distribuyen
normalmente con media de 30 minutos y una desviacion estandar de 9 minutos. Si de la
planta de trabajadores se toma una muestra aleatoria de 25, encuentre la probabilidad de
que la media del tiempo requerido para concluir la tarea en la muestra, este entre 28 y 33
minutos.
3. Un estudio de transito revela que el numero promedio de ocupantes de un auto es 1,75.
En una muestra de 50 autos con desviacion estandar 0,65, seleccionada de una poblacion
normal, encuentre la probabilidad de que el numero promedio de ocupantes sea mayor que
2.
4. Una muestra aleatoria de seis autos de un determinado modelo consumen las siguientes
cantidades en kilometros por litro:
18, 6 18, 4 19, 2 20, 8 19, 4 20, 5.

Determine la probabilidad de que el consumo de gasolina medio muestral de los au-


tomoviles de este modelo sea menor que 17,6 kilometros por litro, suponiendo que la
distribucion de la poblacion es normal con media 17.
5. Se desea estudiar una muestra de 20 personas para saber la proporcion de ellas que tienen
mas de 40 anos. Sabiendo que la proporcion en la poblacion es del 40%, cual es la
probabilidad de que la proporcion en la muestra sea menor del 50%?
6. Hallar la probabilidad de que en 200 lanzamientos de una moneda no falsa, el numero de
caras este comprendido en el 40% y el 60%.
7. Se identificaron dos poblaciones de alumnos de ultimo ano de un colegio. La variable de
interes en la investigacion consista en los puntajes obtenidos en una prueba de rendimiento
en estadstica que hicieron los estudiantes de las dos poblaciones. Los investigadores
suponan que los puntajes de las dos poblaciones estaban distribuidos normalmente con
las siguientes medias y varianzas: 1 = 50, 21 = 40, 2 = 40, 22 = 60. Una muestra
aleatoria de tamano n1 = 10 se saca de la poblacion 1 y una de tamano n2 = 12 de
poblacion 2. Cual es la probabilidad de que la diferencia entre las medias muestrales este
entre 5 y 15?
8. Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de respuesta de
las ratas a determinado estmulo, se estan comparando en un experimento de laboratorio.
El experimentador supone que las respectivas poblaciones de los tiempos de respuesta
al estmulo estan distribuidos normalmente y tienen varianzas iguales. Se administra la
droga A a 12 ratas y la droga B a 13. Cuando se lleva a cabo el experimento, la reduccion
promedio de tiempo de respuesta al estmulo por parte de las ratas que estan recibiendo
la droga A es 30,45 milisegundos con una desviacion tpica de 5 milisegundos. Los datos
correspondientes a la droga B son 24,9 y 6 milisegundos. Cual es la probabilidad de que
la diferencia entre la reduccion promedio de tiempo de respuesta al estmulo por parte de
las ratas que estan recibiendo la droga A y la reduccion promedio de tiempo de respuesta
al estmulo por parte de las ratas que estan recibiendo la droga B sea menor o igual a la
que se observo en el experimento? Suponga que no hay diferencia alguna entre las dos
drogas con respecto a la reduccion promedio en tiempos de respuestas y que las drogas
son igualmente efectivas.
Cap. 6. Ejercicios
FORMA DE LA ES 2 TAMANO DE DISTRIBUCION Z O t?
POBLACION? CONOCIDA? LA MUESTRA? MUESTRAL?
x
1. Si No importa Normal Z=
/ n
2. Normal Grande Normal Z= x

/ n
No (n 30)
3. Pequeno t de Student,
x
(n < 30) =n1 t=
s/ n
grados de libertad
x
4. No Grande Normal Z=
/ n
normal Si (n 30)
5. o Pequeno Callejon sin
desconocida (n < 30) salida
x
6. Grande Normal Z=
s/ n
No (n 30)
7. Pequeno Callejon sin
(n < 30) salida

Tabla 6.1: Resumen de la distribucion muestral de la media muestral

67
Cap. 6. Ejercicios
FORMA SON 21 y 22 SON 21 y 22 TAMANO DISTRIBUCION Z O t?
DE AMBAS CONOCIDAS? IGUALES? DE AMBAS MUESTRAL?
POBLACIONES? MUESTRAS?
(X1 X2 )(1 2 )
1. No Si No importa Grandes Normal Z= r
2 2
1 + n2
normal n1 2
(n1 30, n2 30)
(X1 X2 )(1 2 )
2. No No importa Grandes Normal Z= r
s2 s2
1 + n2
n1 2
(n1 30, n2 30)
(X1 X2 )(1 2 )
3. Si No importa No importa Normal Z= r
2 2
1 + n2
Normal n1 2
(x1 x2 )(1 2 )
4. Si Pequeno t de Student con t= r ,
s2 s2
No n
+n
1 2
(n1 < 30, n2 < 30) = n 1 + n2 2
(n1 1)s21 +(n2 1)s22
grados de libertad s2 = n1 +n2 2
5. No Pequeno t de Student con
 2
s2
1 s2
n1
+ n2
2 (x1 x2 )(1 2 )
(n1 < 30, n2 < 30) = (s 2 /n 1 ) 2 (s 2 /n 2 ) 2
t= r
1 2 s2 s2
n 1 1
+ n 1 + n2
2 1 n1 2
(redondear al en-
(tero mas cercano)

Tabla 6.2: Resumen de la distribucion muestral de la diferencias de medias muestrales

68
Cap. 6. Ejercicios
ESTADISTICO? SUPUESTO? DISTRIBUCION Z?
MUESTRAL?
1. Proporcion n 30 Normal Z= q pp
p(1p)
2. muestral np 5, n(1 p) 5 Normal n

3. Diferencia de n1 30, n2 30 Normal (p p2 ) (p1 p2 )


Z = r 1
p 1 (1p 1 ) p (1p )
4. proporciones n1p1 5, n1(1 p1) 5, Normal n
1
+ 2 n 2
2
muestrales n2p2 5, n2(1 p2) 5

Tabla 6.3: Resumen de la distribucion muestral de la proporcion muestral y de la diferencia de proporciones muestrales

69
Cap. 6. Ejercicios
ESTADISTICO? FORMA DE LA DISTRIBUCION 2 O F?
POBLACION? MUESTRAL?
1. Varianza Normal Chi-cuadrada con
(n1)s2
muestral =n1 2 = 2
grados de libertad
s21 /21
2. Razon de Ambas F de Fisher con F= s22 /22
varianzas normales 1 = n1 1, 2 = n2 1
muestrales grados de libertad Regla:
1
F1(a, b) = F (b,a)

Tabla 6.4: Resumen de la distribucion muestral de la varianza muestral y de la razon de varianzas muestrales

70
CAPITULO 7

Intervalos de confianza

7.1 Estimacion
1. Terminos basicos.
(a) La estimacion estadstica es el proceso mediante el cual intentamos determinar
el valor de un parametro de la poblacion, sin hacer un censo, a partir de la informacion
de una muestra.
(b) Una estimacion es el valor numerico que creemos que tiene el parametro.
(c) el estimador es el estadstico de la muestra, utilizada para hacer una estimacion.
(d) Un estimador puntual de un parametro poblacional es una funcion de la muestra
que da como resultado un unico valor.
(e) Un valor en particular de un estimador puntual se llama una estimacion puntual
del parametro.
2. Pautas para escoger un estimador.
(a) Insesgamiento.
b es un estimador insesgado de , si E()
b = . Evidentemente, si E()
b 6= ,
el estimador se dice que es sesgado. LLamaremos sesgo a la diferencia entre la
media del estimador b y el parametro , es decir,

b = E()
Sesgo () b .

La media, la varianza y la proporcion muestrales son estimadores insesgados de los


correspondientes parametros poblacionales, pero la desviacion tpica muestral no es
un estimador insesgado de la desviacion tpica poblacional.
(b) Eficiencia.
Sean b1 y b2 dos estimadores insesgados de , obtenidos en muestras del mismo
b1 es mas eficiente que
tamano. Entonces, b2 si V(
b1 ) < V(
b2 ).

Al tomar muestras de una poblacion de una poblacion normal, la media muestral


es mas eficiente que la mediana.
7.2 Intervalos de confianza 72

(c) Estimador insesgado de mnima varianza.


b es un estimador insesgado de y no hay ningun otro estimador insesgado que
Si
tenga menor varianza, entonces, se dice que b es el estimador insesgado de
mnima varianza de . Algunos ejemplos de estimadores insesgados de mnima
varianza son:
i. La media muestral cuando la muestra proviene de una distribucion normal.
ii. La varianza muestral cuando la muestra proviene de una una distribucion normal.
iii. La proporcion muestral binomial.
(d) Consistencia.
Un estimador puntual b de es consistente para si sus valores tienden a acer-
carse al parametro poblacional conforme se incrementa el tamano de la muestra.
De otro modo, el estimador se llama inconsitente.

Al muestrear de una poblacion normal, la desviacion tpica muestral es consistente


para la desviacion tpica poblacional (esto tambien es cierto para el caso de la me-
dia y la varianza para sus correspondientes parametros poblacionales). Tambien la
proporcion muestral es consistente para la proporcion poblacional.

7.2 Intervalos de confianza


1. Estimador y estimacion por intervalos.
(a) Un estimador por intervalos de un parametro poblacional es una regla (basada
en la informacion muestral) para determinar un rango, o un intervalo, en el cual
posiblemente se encuentre dicho parametro.
(b) La estimacion correspondiente se denomina estimacion por intervalos.
2. Intervalo de confianza.
Sea un parametro desconocido. Supongamos que con ayuda de la informacion muestral,
podemos encontrar dos variables aleatorias U y V, con U menor que V, tales que P(U <
< V) = 1 , para un (0, 1). Entonces,
(a) La fraccion 1 recibe el nombre de grado de confianza , se llama nivel
de significancia y el intervalo de U hasta V es un estimador por intervalos
de del (1 )100%.
(b) Si u y v representan a un valor particular de U y V, respectivamente, entonces, el
intervalo de u a v de denomina intervalo de confianza del (1 )100% para .
Si se extraen muestras aleatorias de la poblacion un numero elevado de veces, el parametro
estara contenido en un (1)100% de los intervalos calculados de este modo. El intervalo
de confianza obtenido de esta manera se escribe u < < v.

7.3 Intervalos de confianza para algunos parametros


Al final de este captulo se presentan unas tablas que ilustran la forma de los intervalos de
confianza para algunos parametros. Algunos comentarios:
En la tabla 7.1 aparece un resumen acerca los intervalos de confianza para la media
poblacional.
En la tabla 7.2 aparece un resumen acerca los intervalos de confianza para la diferencias
de medias poblacionales (muestras independientes).
7.3 Intervalos de confianza para algunos parametros 73

Los diferentes supuestos que se deben tener en cuenta para poder determinar el intervalo de
confianza para el correspondiente parametro poblacional (para el caso en que las muestras
escogidas sean dependientes o pareadas) coinciden con los que aparecen en la tabla 7.1.
En la tabla 7.3 aparece un resumen acerca los intervalos de confianza para la proporcion
poblacional y para la diferencia de proporciones poblacionales.
En la tabla 7.4 aparece un resumen acerca los intervalos de confianza para varianza pobla-
cional y para la razon de varianzas poblacionales. Importante, tener en cuenta que, para
la distribucion chi-cuadrada con grados de libertad se cumple que, si > 40, entonces,
r !3
2 2
2, 1 + z .
9 9
7.4 Aplicaciones 74

7.4 Aplicaciones
Ejemplo 7.4.1 Un fabricante produce bolsas de azucar refinado. El peso del contenido de
estas bolsas tiene una distribucion normal con desviacion tpica 15 gramos. Los contenidos
de una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos. Calcular un
intervalo de confianza del 95% para el verdadero peso medio de todas las bolsas de azucar
producidas por el fabricante.
SOLUCION:
Dado que buscamos un intervalo de confianza del 95%, tenemos que 1 = 95%, por lo
que = 5% = 0, 05. Debido a que Z/2 = Z0,025 = 1, 96, el intervalo de confianza del 95%
para la media poblacional es
94, 14 < < 105, 88.
Con esto podemos concluir que, con una confianza del 95%, el verdadero peso medio de
todas las bolsas de azucar producidas por el fabricante se encuentra entre 94,12 y 105,88
gramos.

Ejemplo 7.4.2 Una muestra aleatoria de seis autos colombianos de un determinado modelo
consumen las siguientes cantidades en kilometros por litro: 18,6; 18, 4; 19,2; 20,8; 19,4 y 20,5.
Calcule un intervalo de confianza del 90% para el consumo de gasolina medio poblacional
de los autos de este modelo, suponiendo que la distribucion de la poblacion en cuestion es
normal.
SOLUCION:
En este caso, n = 7, x = 19, 48 y s = 0, 98 kilometros por litro y t/2 = t0,05 = 2, 015 con
n 1 = 6 grados de libertad. Entonces, el intervalo buscado sera

18, 67 < < 20, 29.

Por lo tanto, con una confianza del 95%, podemos afirmar que el consumo de gasolina medio
poblacional se encuentra entre 18,67 y 20,29 kilometros por litro.

Ejemplo 7.4.3 En una muestra aleatoria de 85 soportes para la pieza de un motor de


automovil, 10 tienen un pequeno defecto. Calcule un intervalo de confianza del 95% para la
proporcion p de piezas de motor en la poblacion que tienen un pequeno defecto.
SOLUCION:
Debido a que n = 85, entonces, una estimacion puntual de la proporcion de piezas de
motor en la poblacion que tienen un pequeno defecto es p = 10 85 = 0, 12. Debido a que
Z/2 = Z0,025 = 1, 96, entonces, un intervalo de confianza para p es

0, 05 < < 0, 19.

Es decir, con una confianza del 95%, podemos afirmar que la verdadera proporcion de piezas
de motor en la poblacion que tienen un pequeno defecto esta entre el 5% y el 19%.

Ejemplo 7.4.4 Considerese el proceso de fabricacion de soportes para piezas de motores


descrito en el ejemplo 7.4.3. Supongase que se hace una modificacion al proceso de acabado
de la superficie y que, de manera subsecuente, se toma una segunda muestra aleatoria
de 85 ejes. Si el numero de soportes defectuosos en esta segunda muestra es 8, calcule un
intervalo de confianza del 95% para la diferencia en la proporcion de los soportes defectuosos
producidos por ambos procesos.
SOLUCION:
En este caso, tenemos que
10 8
n1 = 85, p1 = = 0, 12, n2 = 85, p2 = = 0, 09.
85 85
7.4 Aplicaciones 75

Debido a que Z/2 = Z0,025 = 1, 96, entonces, un intervalo de confianza para la diferencia
entre las proporciones poblacionales p1 p2 es

0, 06 < p1 p2 < 0, 12.

Ese intervalo de confianza incluye al cero, as que, con base en los datos muestrales, parece
poco probable que los cambios hechos en el proceso de acabado de la superficie hayan
reducido el numero de soportes defectuosos para piezas producidos por el proceso.

Ejemplo 7.4.5 Para una muestra aleatoria de 321 fumadores, el numero medio de horas
de absentismo laboral al mes fue de 3,01 y la desviacion tpica muestral fue de 1,09 horas al
mes. Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado,
el numero medio de horas fue de 2,88 y la desviacion tpica muestral fue de 1,01 horas al
mes. Calcular un intervalo de confianza del 99% para la diferencia entre las dos medias
poblacionales.
SOLUCION:
Dado que los tamanos muestrales son grandes, podemos utilizar las varianzas muestrales en
lugar de las varianzas poblacionales desconocidas. Tenemos:

n1 = 321, x1 =3,01, s1 = 1, 09;


n2 = 94, x2 =2,88, s2 = 1, 01

y para un intervalo de confianza del 95%, se tiene que Z/2 = Z0,025 = 1, 96. Por consi-
guiente, el intervalo es
0, 11 < 1 2 < 0, 37.
Dado que el cero esta dentro del intervalo de confianza, no hay suficiente evidencia en los
datos como para rechazar la idea de que ambas poblaciones tienen la misma media.

Ejemplo 7.4.6 En un estudio sobre los efectos de la planificacion en el rendimiento fi-


nanciero de los bancos, se extrajo una muestra aleatoria de seis instituciones financieras que
contaban con un sistema de planificacion formal, y se comprobo que el porcentaje medio
anual de crecimiento de los ingresos netos en dicha muestra era de 9,972 con una desviacion
tpica de 7,470. La media de dicho crecimiento en otra muestra aleatoria independiente
de nueve bancos que no recurran a la planificacion fue de 2,098 con una desviacion tpica
de 10,834. Suponiendo que las dos poblaciones son normales y tienen la misma varianza,
calcular un intervalo de confianza del 90% para la diferencia de medias.
SOLUCION:
Los datos muestrales son
n1 = 6, x1 = 9, 972, s1 = 7, 470;
n2 = 9, x2 = 2, 098, s2 = 10, 834.

Debido a que el valor de la varianza muestral combinada es s2 = 93, 7 y a que t/2 =


t0,05 = 1, 771 con 13 grados de libertad, entonces, el intervalo de confianza del 90% para la
diferencia de los incrementos medios porcentuales es

1, 161 < 1 2 < 16, 909.

El intervalo incluye el cero, lo cual sugiere que no existe evidencia suficiente en la muestra
como para rechazar la idea de la igualdad de medias entre ambas poblaciones.

Ejemplo 7.4.7 El departamento de zoologa de cierto instituto llevo a cabo un estudio para
estimar la diferencia en la cantidad de cierta sustancia qumica medida en dos estaciones
diferentes de un ro. La sustancia se mide en miligramos por litro. Se reunieron 15 muestras
7.4 Aplicaciones 76

de la estacion 1 y 12 muestras de la estacion 2. Las 15 muestras de la estacion 1 tuvieron


un contenido promedio de sustancia qumica de 3,84 miligramos por litro y una desviacion
estandar de 3,07 miligramos por litro, mientras que las 12 muestras de la estacion 2 tuvieron
un contenido promedio de 1,49 miligramos por litro y una desviacion estandar de 0,80
miligramos por litro. Encuentre un intervalo de confianza del 95% para la diferencia en el
contenido promedio real de sutancia en estas dos estaciones. Suponga que las observaciones
vienen de poblaciones normalmente distribuidas con varianzas diferentes.
SOLUCION:
Tenemos que

n1 = 15, x1 = 3, 84, s1 = 3, 07, n2 = 12, x2 = 1, 49, s2 = 0, 80.

Como las varianzas poblacionales se suponen diferentes, solo podemos encontrar un intervalo
de confianza de 95% aproximado basado en la distribucion t de Student con 16 grados de
libertad. Debido a que t/2 = t0,025 = 2, 120 para = 16 grados de libertad, entonces, el
intervalo buscado es
0, 60 < 1 2 < 4, 10.
Por ello tenemos una confianza del 95% de que el intervalo de 0,60 a 4,10 miligramos por
litro contiene la diferencia de los contenidos promedio reales de sustancia para estos dos
lugares. Como el 0 no esta incluido en el intervalo, podemos afirmar que estos dos contenidos
promedios son diferentes.

Ejemplo 7.4.8 Una muestra aleatoria de tabletas para el dolor de estomago tiene una
desviacion tpica de 0,8% en la concentracion del ingrediente activo. Hallar un intervalo de
confianza del 90% para la varianza y para la desviacion poblacional.
SOLUCION:
Tenemos que n = 15 y s = 0, 8. Debido a que 2 = 20,05 = 23, 68 y 21 = 20,95 = 6, 57
2 2
con 14 grados de libertad, el intervalo de confianza del 90% para la varianza poblacional
viene dado por
0, 378 < 2 < 1, 364.
Por consiguiente, con una confianza del 90%, la varianza poblacional de la concentracion
del ingreso activo esta entre 0,378 y 1,364. Dado que la desviacion tpica es igual a la
raz cuadrada, podemos obtener un intervalo de confianza del 90% para la desviacion tpica
poblacional tomando races cuadradas. El resultado es

0, 61 < < 1, 17.

Por tanto, nuestro intervalo de confianza del 90% para la desviacion tpica poblacional de
la concentracion porcentual del ingrediente activo de estas tabletas va del 61% al 1,17%.

Ejemplo 7.4.9 En el ejemplo 7.4.7 se construyo un intervalo de confianza para la diferencia


en el contenido medio de sustancia qumica, que se mide en miligramos por litro, en dos
estaciones sobre un ro mediante la suposicion de que poblaciones en cuestion son normales
con varianzas diferentes. Justifique esta suposicion mediante la construccion de un intervalo
de confianza del 98% para 1 /2 , donde 1 y 2 son las desviaciones poblacionales del
contenido de sustancia qumica en las estaciones 1 y 2, respectivamente.
SOLUCION:
Del ejemplo 7.4.7 se tiene que

n1 = 15, x1 = 3, 84, s1 = 3, 07, n2 = 12, x2 = 1, 49, s2 = 0, 80.

Para un intervalo de confianza del 98%, = 0, 02. Por tanto, al interpolar en la tabla
de la distribucion F que aparece en el apendice, encontramos que F0,01 (14, 11) 4, 30 y
7.5 Determinacion del tamano de una muestra 77

F0,01 (11, 14) 3, 87. Por tanto, el intervalo de confianza del 98% para 1 /2 es
1
1, 851 < < 7, 549.
2
Como este intervalo no permite la posibilidad de que 1 /2 sea igual a 1, es correcto suponer
que 1 6= 2 o 21 6= 22 en el ejemplo 7.4.7

7.5 Determinacion del tamano de una muestra


1. Tamano muestral de los intervalos de confianza para la media.
Si se utiliza x como una estimacion de , entonces, se puede tener una confianza de
(1 )100% de que el error |x | no excedera una cantidad especfica e cuando el
tamano de la muestra es (redondear al entero mas cercano):
 2
Z/2
n= .
e

Cuando 2 sea desconocida, se toma una muestra preliminar de tamano n 30, se calcula
la desviacion muestral s (para proporcionar una estimacion de la desviacion poblacional )
y se reemplaza por s.

Ejemplo 7.5.1 La longitud de barras de metal producidas por una cadena es una
variable aleatoria con distribucion normal y desviacion estandar 1,8 milmetros. Basandose
en una muestra aleatoria de 9 observaciones, se calcuo el siguiente intervalo del 99%
para la longitud media poblacional:

194, 65 197, 75.

Supongamos que un director de produccion cree que el intervalo es demasiado amplio,


y exige un intervalo con el mismo nivel de confianza, pero cuya longitud a cada lado
de la media muestral no sea superior a 0,5 milmetros. Cuantas observaciones debe
tener la muestra para construir tal intervalo?
SOLUCION:
Tenemos que e = 0, 50, = 1, 8 y Z/2 = Z0,005 = 2, 575. Por tanto, para satisfacer la
peticion del director, se necesita una muestra aleatoria de al menos 86 observaciones.
Este gran incremento en el tamano muestral representa el costo adicional de conseguir
una mayor precision en la estimacion de la verdadera media, reflejada en un intervalo
de confianza mas corto.

2. Tamano de la muestra para estimar proporciones poblacionales.


Si se utiliza p como una estimacion de p, entonces, se puede tener una confianza de
(1 )100% de que el error |p p| no excedera una cantidad especfica e cuando el
tamano de la muestra es
Z2/2 p(1 p)
n= .
e2
Si p es desconocida, hecemos p = 0, 5.

Ejemplo 7.5.2 Supongase que, basado en 142 observaciones, se ha construido el


siguietne intervalo de confianza del 95% para la proporcion de directores de recursos
humanos que consideraban que el expediente academico era muy importante en la
evaluacion de un candidato:
0, 533 p 0, 693.
Cap. 7. Ejercicios 78

Supongamos ahora que queremos construir un intervalo de confianza del 95% cuya
longitud a cada lado de la proporcion muestral no sea superior a 0,06. Cuantas ob-
servaciones necesitamos?
SOLUCION:
Tenemos que e = 0, 06 y Z/2 = Z0,025 = 1, 95. Debido a que desconocemos la esti-
macion p de p, hacemos p = 0, 5 y, con ello, podemos concluir que un numero mnimo
de 267 observaciones garantiza un intervalo de confianza con la longitud exigida.

Ejercicios
1. Un biologo desea hacer una estimacion con un intervalo de confianza del 95% de la canti-
dad promedio de agua que consume cierta especie animal en condiciones experimentales.
De alguna manera, el investigador logra determinar que la poblacion de valores de con-
sumo diario de agua esta distribuida normalmente. Una muestra aleatoria de 36 animales
arroja una media de 16,5 gramos con una desviacion estandar de 2 gramos.
2. esuelva nuevamente el ejercicio 1 pero utilizando un grado de confianza del 99%. Compare
los resultados encontrados en ambos ejercicios.
3. Los contenidos de 7 recipientes similares de acido sulfurico son 9,8; 10,2; 10,4; 9,8; 10,0;
10,2 y 9,6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los
recipientes, suponiendo que la poblacion de valores tiene distribucion normal.
4. Las empresas de busqueda de ejecutivos se especializan en ayudar a las empresas a ubicar
y asegurar talento para la alta gerencia. Tales firmas son responsables de la ubicacion de
muchos de los mejores directores ejecutivos de la nacion. Una reconocida revista reporto
que uno de cada cuatro directores ejecutivos es una persona con mas de 35 anos de
edad. Si en una muestra aleatoria de 350 compnas de cierto pais, 77 tienen directores
ejecutivos con mas de 35 anos de edad, un intervalo de confianza del 99% apoyara la
afirmacion?
5. Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de es-
tadstica de sexo masculino y femenino. De 120 hombres, 107 esperaban disfrutar de un
trabajo de tiempo completo en un maximo de 6 anos. De 141 mujeres encuestadas, 73
tenan esta esperanza. Hallar un intervalo de confianza del 95% para la diferencia entre
las proporciones poblacionales.
6. Se llevan a cabo pruebas de resistencia a la tension sobre dos diferentes clases de tubos
de aluminios utilizados en la fabricacion de alas de aeroplanos comerciales. Los datos
obtenidos son como se muestran a continuacion:
Clase de Tamano de Media de la resistencia Desviacion
tubo la muestra a la tension (kg/mm2 ) estandar (kg/mm2 )
Tubo 1: n1 = 10, x1 = 87, 6, s1 = 1, 09;
Tubo 2: n2 = 12, x2 = 74, 5, s2 = 1, 5

Si 1 y 2 representan los promedios verdaderos de las resistencias a la tension para las


dos clases de tubos, encuentre un intervalo de confianza del 90% para la diferencia de las
medias 1 2 .
7. Un biologo deseaba estudiar los efectos de ciertas drogas sobre el consumo de agua en
una especie particular de animales de laboratorio. La droga A que contiene un agente
que produce sed, se administro a una muestra aleatoria simple de nA = 25 animales. La
droga B que no contiene tal agente, se administro a una muestra aleatoria independiente
de nB = 22 animales similares. El biologo registro la cantidad de agua consumida por
cada animal durante un periodo de tiempo determinado despues de la administracion de
Cap. 7. Ejercicios 79

las drogas. Las cantidades promedio de agua consumida por animal en cada uno de los dos
grupos fueron respectivamente de xA = 50 mililitros (ml) y xB = 25 ml y las desviaciones
tpicas de sA = 5, 3 ml y de sB = 5, 6 ml. Construya un intervalo de confianza del 95%
para 1 2 suponiendo que las poblaciones en cuestion son normales con varianzas
iguales.
8. Un fabricante de detergente lquido esta interesado en la uniformidad de la maquina
utilizando para llenar las botellas. De manera especfica, es deseable que la desviacion
estandar del proceso de llenado sea menor que 0,5 onzas de lquido. De otro modo,
existe un porcentaje mayor del deseable de botellas con un contenido menor de detergente.
Supongase que la distribucion del volumen de llenado es aproximadamente normal. Al
tomar una muestra aleatoria de 20 botellas, se obtiene una varianza muestral s2 = 0, 00153
(onzas de fluido)2 . Calcule un intervalo de confianza del 90% para .
9. Una compana fabrica propulsores para uso en motores de turbina. Una de las operaciones
consiste en esmerilar el terminado de una superficie particular con una aleacion de titanio.
Pueden emplearse dos procesos de esmerilado, y ambos pueden producir partes que tienen
la misma rigurosidad superficial promedio. Al ingeniero de manufactura le gustara selec-
cionar el proceso que tenga la menor variabilidad en la rigurosidad de la superficie. Para
ello toma una muestra de n1 = 12 partes del primer proceso, la cual tiene una desviacion
estandar muestral de s1 = 5, 1 micropulgadas, y una muestra aleatoria de n2 = 15 partes
del segundo proceso, la cual tiene una desviacion estandar muestral de s2 = 4, 7 microp-
ulgadas. Se desea encontrar un intervalo de confianza del 90% para el cociente de las dos
varianzas 21 /22 . Supongase que los dos procesos son independientes y que la rigurosidad
de la superficie esta distribuida normalmente.
Cap. 7. Ejercicios
FORMA DE LA ES 2 TAMANO DE DISTRIBUCION INTERVALO DE
POBLACION? CONOCIDA? LA MUESTRA? MUESTRAL? CONFIANZA?
1. Si No importa Normal x Z/2 n < < x + Z/2 n
2. Normal Grande Normal x Z/2 sn < < x + Z/2 sn
No (n 30)
3. Pequeno t de Student,
(n < 30) =n1 x t/2 sn < < x + t/2 sn
grados de libertad
4. No Grande Normal x Z/2 n < < x + Z/2 n
normal Si (n 30)
5. o Pequeno Callejon sin
desconocida (n < 30) salida
6. Grande Normal x Z/2 sn < < x + Z/2 sn
No (n 30)
7. Pequeno Callejon sin
(n < 30) salida

Tabla 7.1: Resumen acerca los intervalos de confianza para la media poblacional

80
Cap. 7. Ejercicios
FORMA 21 y 22 21 y 22 TAMANO DISTRIBUCION INTERVALO DE
DE AMBAS CONO- IGUALES? DE AMBAS MUESTRAL? CONFIANZA?
POBLA- CIDAS? MUESTRAS?
CIONES? q 2
22
1. No Si No importa Grandes Normal (x1 x2) Z/2 n11 + n2q< 1 2 <
normal 2 2
(n1 30, n2 30) < (x1 x2) + Z/2 n11 + n22
q 2
s s2
2. No No importa Grandes Normal (x1 x2) Z/2 n11 + n22 < 1 2 <
q 2
s s2
(n1 30, n2 30) < (x1 x2) + Z/2 n11 + n22
q 2
2
3. Si No importa No importa Normal (x1 x2) Z/2 n11 + n22 < 1 2 <
q 2
Normal 2
< (x1 x2) + Z/2 n11 + n22
q
s2 s2
4. Si Pequeno t de Student con (x1 x2) t/2 n +n < 1 2 <
1 q
2
No s2 s2
(n1 < 30, n2 < 30) = n 1 + n2 2 < (x1 x2) + t/2 n1 + n2 ,
grados de libertad
(n1 1)s21 +(n2 1)s22
s2 = n1 +n2 2
5. No Pequeno t de Student con
 2
s2
1 s2 q 2
+ n2
n1 2 s s22
(n1 < 30, n2 < 30) = (s 2 /n 1 ) 2 (s 2 /n 2 ) 2
(x1 x2) t/2 n11 + < 1 2 <
n2
1 + n 2
n 1 1 2 1 q 2
s s2
(redondear al en- < (x1 x2) + t/2 n11 + n22
(tero mas cercano)

Tabla 7.2: Resumen acerca los intervalos de confianza para la diferencias de medias poblacionales

81
Cap. 7. Ejercicios
ESTADISTICO? SUPUESTOS? DISTR. INTERVALO DE
MUESTRAL? CONFIANZA?
1. Proporcion n 30 Normal q q
2. muestral np 5, Normal p Z/2 p(1p)
n < p < p + Z/2
p(1p)
n
n(1 p) 5
3. n1 30, Normal q
Diferencia de
p1 (1p1 ) p2 (1p2 )
proporciones n2 30 (p1 p2) Z/2 n1 + n2 < p1 p2 <
muestrales q
4. n1p1 5, Normal < (p1 p2) + Z/2 p1 (1p
n1
1)
+ p2 (1p2 )
n2
n1(1 p1) 5,
n2p2 5,
n2(1 p2) 5

Tabla 7.3: Resumen acerca los intervalos de confianza para la proporcion poblacional y para la diferencia de proporciones poblacionales

82
Cap. 7. Ejercicios
ESTADISTICO? FORMA DE LA DISTRIBUCION INTERVALO DE
POBLACION? MUESTRAL? CONFIANZA?
1. Varianza Normal Chi-cuadrada con
(n1)s2 (n1)s2
muestral =n1 2
< 2 < 21
2 2
grados de libertad
s21 1 21 s21
2. Razon de Ambas F de Fisher con s22
F (1 ,2 ) < 2
< s22
F 2 (2, 1)
2
varianzas normales 1 = n1 1, 2 = n2 1
muestrales grados de libertad Regla:
1
F1(a, b) = F (b,a)

Tabla 7.4: Resumen acerca los intervalos de confianza para varianza poblacional y para la razon de varianzas poblacionales

83
CAPITULO 8

Pruebas de hipotesis

8.1 Conceptos de la prueba de hipotesis


1. Hipotesis estadsticas.
(a) hipotesis estadstica: afirmacion sobre uno o mas parametros de una o mas
poblaciones.
(b) la hipotesis nula H0 : la hipotesis que se debe comprobar.
(c) La hipotesis alternativa H1 : se establece como el complemento de H0 .
2. Comentarios.
(a) H0 siempre se refiere a un valor especfico del parametro de poblacion (como, por
ejemplo, ), no al estadstico muestral (como X).
(b) H0 siempre debe contener un signo igual respecto al valor especificado del parametro
poblacional (por ejemplo,1 H0 : = 36, H0 : 36 o H0 : 36).
(c) H1 nunca debe contener un signo igual respecto al valor especificado de parametro
de poblacion (por ejemplo, H0 : 6= 36, H0 : < 36 o H0 : > 36).
3. Errores de tipo I y de tipo II.

Decision sobre H0 H0 es verdadera H0 es falsa


Aceptar H0 Decision correcta Error de tipo II
1 se llama grado de confianza Probabilidad =
Rechazar H0 Error de tipo I Decision correcta
se llama nivel de significancia 1 se llama potencia

Fig. 8.1: Errores de tipo I y II y sus correspondientes probabilidades

1
En general, si es un parametro poblacional y si k es cualquier numero real, entonces, la
hipotesis alternativa H1 : 6= k se llama alternativa bilateral y las hipotesis alternativas
H1 : < k y H1 : > k, alternativas unilaterales.
8.1 Conceptos de la prueba de hipotesis 85

4. Estadstico de prueba y region crtica.


Un estadstico de prueba es un estadstico (es decir, una funcion que solo depende de
la informacion muestral) que se utiliza para determinar si se rechaza, o no, la hipotesis nula.

La region crtica es el conjunto de todos los valores del estadstico de prueba para los
cuales la hipotesis nula sera rechazada.

Entonces, la hipotesis nula sera rechazada si y solo si el valor observado o calculado del
estadstico de prueba se ubica en la region de rechazo.
5. Valor P o p-valor.
El p-valor o valor p es el mnimo nivel de significancia bajo la cual H0 es rechazada.
Tenemos que
(a) P-valor Rechazar H0 al nivel .
(b) P-valor > No rechazar H0 al nivel .
6. Comentarios acerca de los terminos aceptar y rechazar.
Al aceptar una hipotesis nula, no estamos asegurando necesariamente que haya mucho
en su favor. Una afirmacion mas precisa, aunque mas pedante, sobre la situacion puede ser
los datos disponibles no proporcionan suficiente evidencia para rechazar la hipotesis nula,
dado que queremos fijar en la probabilidad de rechazar una hipotesis nula que es cierta.

Por esta razon, algunos autores prefieren la frase no se rechaza la hipotesis nula en
lugar de se acepta la hipotesis nula. Nosotros seguiremos usando aceptar como una
manera eficiente de expresar esta idea, pero es importante tener en cuenta la interpretacion
de la frase.

La situacion es muy similar a la de un tribunal de justicia, donde el acusado, al prinicipio,


goza de la presuncion de inocencia, y la acusacion debe presentar evidencia contraria lo
suficientemente clara como para conseguir un veredicto de culpabilidad.

En el contexto de la prueba de hipotesis clasica, la hipotesis nula se considera cierta


inicialmente. La tarea de persuadirnos de lo contrario corresponde a los datos de la
muestra.
8.2 Pruebas para algunos parametros poblacionales 86

8.2 Pruebas para algunos parametros poblacionales

CONTRASTES PARA LA MEDIA POBLACIONAL

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de medias.
2. Las distribuciones a utilizar seran la normal o la t de Student con = n 1 grados de
libertad.
3. La region crtica es la region sombreada que aparece en la figura 8.2.
4. A los valores a, b, c y d que aparecen en la figura 8.2 se les llamara valores crticos.

HIPOTESIS HIPOTESIS REGION VALOR


NULA? ALTERNATIVA? CRITICA? CRITICO?
1. H0 : k H1 : < k Figura 8.2(a) a = Z o a = t
2. H0 : k H1 : > k Figura 8.2(b) b = Z o b = t
3. H0 : = k H1 : 6= k Figura 8.2(c) c = Z/2 y d = Z/2
o
c = t/2 y d = t/2

Tabla 8.1: Resumen acerca contrastes relacionadas con la media poblacional

0,4 0,4 0,4

0,3 0,3 0,3

0,2 0,2 0,2

0,1 0,1 0,1

0 0 0
-5 -3 -1
a
1 3 5 -5 -3 -1 1
b
3 5 -5 -3
c
-1
d1 3 5

(a) H1 : < k (b) H1 : > k (c) H1 : 6= k

Fig. 8.2: Region crtica para diferentes pruebas relacionadas con medias
8.2 Pruebas para algunos parametros poblacionales 87

CONTRASTES PARA LA DIFERENCIA DE MEDIAS POBLACIONALES


(MUESTRAS INDEPENDIENTES)

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de difer-
encia de medias.
2. Utilizaremos la normal o la t de Student (los grados de libertad dependen de la situacion
que tengamos en el problema).
3. La region crtica es la region sombreada que aparece en la figura 8.3.
4. A los valores a, b, c y d que aparecen en la figura 8.3 se les llamara valores crticos.

HIPOTESIS HIPOTESIS REGION VALOR


NULA? ALTERNATIVA? CRITICA? CRITICO?
1. H0 : 1 2 k H1 : 1 2 < k Figura 8.3(a) a = Z o a = t
2. H0 : 1 2 k H1 : 1 2 > k Figura 8.3(b) b = Z o b = t
3. H0 : 1 2 = k H1 : 1 2 6= k Figura 8.3(c) c = Z/2 y d = Z/2
o
c = t/2 y d = t/2

Tabla 8.2: Resumen acerca contrastes relacionadas con la media poblacional

0,4 0,4 0,4

0,3 0,3 0,3

0,2 0,2 0,2

0,1 0,1 0,1

0 0 0
-5 -3 -1
a
1 3 5 -5 -3 -1 1
b
3 5 -5 -3
c
-1
d1 3 5

(a) H1 : 1 2 < k (b) H1 : 1 2 > k (c) H1 : 1 2 6= k

Fig. 8.3: Region crtica para diferentes pruebas relacionadas con medias pobla-
cionales

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS


POBLACIONALES (MUESTRAS DEPENDIENTES O PAREADAS)

Al definir X1 X2 =: X y al considerar el problema de determinar la distribucion muestral de


X, los diferentes supuestos que se deben tener en cuenta, coinciden con los que aparecen en la
tabla 6.1 y los contrstes son los mismos que los que ilustran en la tabla 8.2.
8.2 Pruebas para algunos parametros poblacionales 88

INTERVALO DE CONFIANZA PARA LA PROPORCION POBLACIONAL

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de pro-
porciones muestrales.
2. La distribucion a utilizar sera la normal.
3. La region crtica es la region sombreada que aparece en la figura 8.4.
4. A los valores a, b, c y d que aparecen en la figura 8.4 se les llamara valores crticos.

HIPOTESIS HIPOTESIS REGION VALOR


NULA? ALTERNATIVA? CRITICA? CRITICO?
1. H0 : p k H1 : p < k Figura 8.4(a) a = Z
2. H0 : p k H1 : p > k Figura 8.4(b) b = Z
3. H0 : p = k H1 : p 6= k Figura 8.4(c) c = Z/2 y d = Z/2

Tabla 8.3: Resumen acerca contrastes relacionadas con la proporcion poblacional

0,4 0,4 0,4

0,3 0,3 0,3

0,2 0,2 0,2

0,1 0,1 0,1

0 0 0
-5 -3 -1
a
1 3 5 -5 -3 -1 1
b
3 5 -5 -3
c
-1
d1 3 5

(a) H1 : p < k (b) H1 : p > k (c) H1 : p 6= k

Fig. 8.4: Region crtica para diferentes pruebas relacionadas con proporciones pobla-
cionales

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES


POBLACIONALES

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de difer-
encia de proporciones muestrales.
2. La distribucion a utilizar sera la normal.
3. La region crtica es la region sombreada que aparece en la figura 8.7.
4. A los valores a, b, c y d que aparecen en la figura 8.7 se les llamara valores crticos.
8.2 Pruebas para algunos parametros poblacionales 89

HIPOTESIS HIPOTESIS REGION VALOR


NULA? ALTERNATIVA? CRITICA? CRITICO?
1. H0 : p1 p2 k H1 : p1 p2 < k Figura 8.7(a) a = Z
2. H0 : p1 p2 k H1 : p1 p2 > k Figura 8.7(b) b = Z
3. H0 : p1 p2 = k H1 : p1 p2 6= k Figura 8.7(c) c = Z/2 y d = Z/2

Tabla 8.4: Resumen acerca contrastes relacionadas con la diferencia de proporciones


poblacionales

0,4 0,4 0,4

0,3 0,3 0,3

0,2 0,2 0,2

0,1 0,1 0,1

0 0 0
-5 -3 -1
a
1 3 5 -5 -3 -1 1
b
3 5 -5 -3
c
-1
d1 3 5

(a) H1 : p1 p2 < k (b) H1 : p1 p2 > k (c) H1 : p1 p2 6= k

Fig. 8.5: Region crtica para diferentes pruebas relacionadas con diferencia de pro-
porciones poblacionales

CONTRASTES PARA LA VARIANZA POBLACIONAL

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de la


varianza muestral
2. La distribucion a utilizar sera la chi-cuadrada con = n 1 grados de libertad.
3. La region crtica es la region sombreada que aparece en la figura 8.6.
4. A los valores a, b, c y d que aparecen en la figura 8.6 se les llamara valores crticos.
5. Es importante tener en cuenta que, para la distribucion chi-cuadrada con grados de
libertad se cumple que, si > 40, entonces,
r !3
2 2 2
, 1 + z .
9 9

HIPOTESIS HIPOTESIS REGION VALOR


NULA? ALTERNATIVA? CRITICA? CRITICO?
1. H0 : 2 k H1 : 2 < k Figura 8.6(a) a = 21
2. H0 : 2 k H1 : 2 > k Figura 8.6(b) b = b = 2
3. H0 : 2 = k H1 : 2 6= k Figura 8.6(c) c = 1(/2) y d = 2/2
2

Tabla 8.5: Resumen para pruebas relacionadas con la varianza poblacional


8.2 Pruebas para algunos parametros poblacionales 90

0,4 0,4 0,4

0,3 0,3 0,3

0,2 0,2 0,2

0,1 0,1 0,1

0 0 0
-5 -3 -1
a
1 3 5 -5 -3 -1 1
b
3 5 -5 -3
c
-1
d1 3 5

(a) H1 : 2 < k (b) H1 : 2 > k (c) H1 : 2 6= k

Fig. 8.6: Region crtica para pruebas relacionadas con la varianza poblacional

CONTRASTES PARA LA RAZON DE VARIANZAS POBLACIONALES

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de la razon
de varainzas muestrales.
2. La distribucion a utilizar sera la F de Fisher con 1 = n1 1 y 2 = n2 1 grados de
libertad.
3. La region crtica es la region sombreada que aparece en la figura 8.7.
4. A los valores a, b, c y d que aparecen en la figura 8.7 se les llamara valores crticos.

HIPOTESIS HIPOTESIS REGION VALOR


NULA? ALTERNATIVA? CRITICA? CRITICO?
1. H0 : 21 22 H1 : 21 < 22 Figura 8.7(a) a = F1
2. H0 : 21 22 H1 : 21 > 22 Figura 8.7(b) b = F
3. H0 : 21 = 22 H1 : 21 6= 22 Figura 8.7(c) c = F1(/2) y d = F/2

Tabla 8.6: Resumen de pruebas relacionadas con razon de varianzas

0,4 0,4 0,4

0,3 0,3 0,3

0,2 0,2 0,2

0,1 0,1 0,1

0 0 0
-5 -3 -1
a
1 3 5 -5 -3 -1 1
b
3 5 -5 -3
c
-1
d1 3 5

(a) H1 : 21 < 22 (b) H1 : 21 > 22 (c) H1 : 21 6= 22

Fig. 8.7: Region crtica para pruebas relacionadas con razon de varianzas
8.3 Aplicaciones 91

8.3 Aplicaciones
Ejemplo 8.3.1 Como parte de un proceso de ensamblaje, se usa un taladro para hacer
agujeros en una lamina de metal. Cuando el taladro funciona adecuadamente, los diametros
de estos agujeros tienen una distribucion normal con media de 2 centmetros y desviacion
tpica de 0,06 centmetros. Periodicamente, se miden los diametros de una muestra aleato-
ria de agujeros para controlar que el taladro funciona adecuadamente. Asumamos que la
desviacion tpica no vara. Una muestra aleatoria de nueve medidas da un diametro medio
de 1,95 centmetros. Probar la hipotesis de que la media poblacional es 2 centmetros frente
a la alternativa de que no es as. Use un nivel de significancia de 0,05.
SOLUCION:
Sea el diametro medio poblacional (en centmetros). Entonces, queremos contrastar las
hipotesis
H0 : = 2 versus H1 : 6= 2.
Tenemos que la poblacion es normal, = 0, 06 (conocida), n = 6 y x = 1, 95. El valor del
estadstico de prueba esta dado por Z = 2, 50 y para una prueba al nivel del 5%, tenemos
que = 0, 05 y Z/2 = Z0,025 = 1, 96. Entonces, se rechaza la hipotesis nula al nivel de
significancia del 5%.

Ejemplo 8.3.2 De una muestra aleatoria de 802 clientes de supermercados, suponga que
378 pagaron sus artculos con tarjetas de credito. Contrastar el nivel del 10%, la hipotesis
nula de que al menos la mitad de los compradores pagan sus artculos con tarjetas de credito
frente a la alternativa de que la proporcion poblacional es menor de la mitad.
SOLUCION:
Sea p la proporcion poblacional de compradores que pagan sus artculos con tarjetas de
credito. Queremos probar la hipotesis
H0 : p 0, 50 versus H1 : p < 0, 50.
Tenemos que p0 = 0, 50, n = 802 ( 30), p = 378/802 = 0, 471. El valor del estadstico
de prueba es Z = 1, 64. Para una prueba al nivel del 10%, tenemos que = 0, 10 y
Z = Z0,10 = 1, 28. Entonces, se rechaza la hipotesis nula al nivel de significancia del 10%.

Ejemplo 8.3.3 Un rector de cierta universidad afirma que la proporcion de hombres que
tienen auto en el campus es mayor a la proporcion de mujeres que tienen auto en el campus.
Un profesor de estadstica se interesa en la afirmacion y entrevista aleatoriamente a 100
hombres y a 100 mujeres. Encuentra que 34 hombres y 27 mujeres tienen autos en el
campus. Puede concluirse con un nivel del 5% que la afirmacion del rector es falsa?
SOLUCION:
Sean p1 y p2 las proporciones poblacionales de hombres y mujeres, respectivamente, que
tienen auto en el campus. Entonces, queremos contrastar la hipotesis nula
H0 : p1 p2 0 versus H1 : p1 p2 > 0.
Los datos muestrales son
34 27
n1 = 100, p1 = = 0, 34, n2 = 100, p2 = = 0, 27.
100 100
Con estos valores, el estimador comun bajo la hipotesis nula es p0 = 0, 305 y el estadstico
de prueba esta dado por Z = 1, 075. Para una prueba al nivel del 5%, tenemos que = 0, 05
y Z = Z0,05 = 1, 64. Entonces, al nivel de significancia del 5%, no se rechaza la hipotesis
nula de que la proporcion de hombres que tienen auto en el campus es menor o igual a la
proporcion de mujeres que tienen auto en el campus. Es decir, los datos muestran que la
afirmacion del rector es falsa.
8.3 Aplicaciones 92

Ejemplo 8.3.4 En un establecimiento escolar suburbano, se selecciono al azr una mues-


tra aleatoria de 25 alumnos de quinto grado (grupo 1) de una poblacion de estudiantes
perteneciente a familias en que ambos padres trabajan. Se selecciono tambien una muestra
aleatoria al azar de 15 estudiantes (grupo 2) del mismo grado y establecimiento escolar entre
aquellos estudiantes que pertenecen a familias en que solamente el padre trabaja. El analisis
de los puntajes de rendimiento escolar (en escala de 1 a 100) de los dos grupos dio los sigu-
ientes resultados: un puntaje promedio de 78 para el grupo 1 y de 85 para el grupo 2. La
experiencia muestra que las poblaciones de puntajes para ambos grupos estan distribuidas
en forma aproximadamente normal, con varianzas de 21 = 81 y 22 = 25. Utilizando un
nivel de significancia del 5% y con base en estos datos, determinar si se puede concluir que la
media de la poblacion de la que se selecciono el grupo 1 es inferior a la media de la poblacion
de la que se selecciono el grupo 2.
SOLUCION:
Sean 1 y 2 las respectivas medias poblacionales de puntajes promedios. Al plantear las
hipotesis del problema, obtenemos
H0 : 1 2 o su equivalente H0 : 1 2 0;
H1 : 1 < 2 o su equivalente H1 : 1 2 < 0.
Ahora, tenemos que
n1 = 25, x1 = 78, 21 = 78;
n2 = 15, x2 = 85, 22 = 85.
El valor del estadstico de prueba esta dado por Z = 3, 16. Para una prueba al nivel del
5%, tenemos que = 0, 05 y Z = Z0,05 = 1, 64. Entonces, se rechaza la hipotesis nula al
nivel de significancia del 5%. Por lo tanto, se concluye que en ese establecimiento escolar,
los puntajes promedios generales de rendimiento de los estudiantes de quinto grado que
pertenecen a familias en que ambos padres trabajan son inferiores a los de los estudiantes
que pertenecen a familias en que solamente el padre trabaja.

Ejemplo 8.3.5 Se llevo a cabo un experimento para comparar el deterioro abrasivo de dos
materiales laminados diferentes. Se probaron doce piezas del material 1, exponiendo cada
una a una maquina para medir el deterioro. De la misma manera, se probaron diez piezas
del material 2. En cada caso, se observo la profundidad del deterioro. Las muestras del
material 1 dieron un deterioro promedio (registrado) de 85 unidades con una desviacion
estandar muestral de 4, mientras que las muestras del material 2 dieron un promedio de 81
y una desviacion estandar muestral de 5. Puede concluirse en el nivel de significancia del
5% que el deterioro abrasivo del material 1 excede al del material 2 por mas de 2 unidades?
Asuma que las poblaciones son aproximadamente normales con varianzas iguales.
SOLUCION:
Sean 1 y 2 las respectivas medias poblacionales para las piezas de los materiales 1 y 2.
Queremos contrastar la hipotesis
H0 : 1 2 = 0 versus H1 : 1 2 > 0.
Tenemos que
n1 = 12, x1 = 85, s1 = 4;
n2 = 10, x2 = 81, s2 = 5.
La varianza poblacional comun se estima como s2 = 20, 05. Ademas, el valor del estadstico
de prueba esta dado por t = 1, 04. Para una prueba al nivel del 5%, tenemos que = 0, 05
y t = t0,05 = 1, 725 con 20 grados de libertad. Entonces, no puede rechazarse la hipotesis
nula de igualdad de medias frente a la alternativa unilateral al nivel del 5%. Por lo tanto,
no se esta en condiciones de concluir que el deterioro abrasivo del material 1 excede al del
material 2 por mas de dos unidades.
8.3 Aplicaciones 93

Ejemplo 8.3.6 El departamento de zoologa de cierto instituto llevo a cabo un estudio para
estimar la diferencia en la cantidad de cierta sustancia qumica medida en dos estaciones
diferentes de un ro. La sustancia se mide en miligramos por litro. Se reunieron 15 muestras
de la estacion 1 y 12 muestras de la estacion 2. Las 15 muestras de la estacion 1 tuvieron
un contenido promedio de sustancia qumica de 3,84 miligramos por litro y una desviacion
estandar de 3,07 miligramos por litro, mientras que las 12 muestras de la estacion 2 tuvieron
un contenido promedio de 1,49 miligramos por litro y una desviacion estandar de 0,80
miligramos por litro. Al nivel del 5% determine si los contenidos promedios reales de sutancia
en estas dos estaciones son diferentes. Suponga que las observaciones vienen de poblaciones
normalmente distribuidas con varianzas diferentes.
SOLUCION:
Sean 1 y 2 las respectivas medias poblacionales para contenidos promedios reales de
sutancia en las dos estaciones. Queremos contrastar la hipotesis

H0 : 1 2 = 0 versus H1 : 1 2 6= 0.

Tenemos que

n1 = 15, x1 = 3, 84, s1 = 3, 07, n2 = 12, x2 = 1, 49, s2 = 0, 80.

El valor del estadstico de prueba esta dado por t = 2, 846. Para una prueba al nivel del 5%,
tenemos que = 0, 05 y t/2 = t0,025 = 2, 120 con 16 grados de libertad. Entonces, puede
rechazarse la hipotesis nula de igualdad de medias frente a la alternativa bilateral al nivel
del 5%. Por lo tanto, podemos concluir que los contenidos promedio reales de sustancia
para estos dos lugares son diferentes (comparese este resultado con el obtenido en el ejemplo
7.4.7).

Ejemplo 8.3.7 Con el fin de cumplir las normas establecidas, es importante que la varianza
en el porcentaje de impurezas de unas remesas de productos qumicos no supere el 4%.
Una muestra aleatoria de 20 envos dio una varianza muestral de 5,62 en el porcentaje de
impureza. Al nivel del 10%, contrastar la hipotesis nula de que la varianza de la poblacion
no es mayor que 4. Supongase que la distribucion de la poblacion es normal.
SOLUCION:
Sea 2 la varianza poblacional de la concentracion de impureza. Queremos contrastar la
hipotesis
H0 : 4 versus H1 : > 4.
Tenemos que s2 = 5, 62, n = 20 y 20 = 4. El valor del estadstico de prueba esta dado
por 2 = 26, 695. Para una prueba al nivel del 10%, tenemos que = 0, 10 y 2 (19) =
20,10 (19) = 27, 20 con 19 grados de libertad. Entonces, no puede rechazarse la hipotesis
nula al nivel del 10%. Por lo tanto, los datos no contienen una evidencia particularmente
importante contra la hipotesis de que la varianza poblacional del porcentaje de impureza no
es mayor que 4.

Ejemplo 8.3.8 Se compararon las varianzas de los vencimientos de dos tipos de bonos.
Para una muestra aleatoria de 17 bonos del primer tipo, la varianza de los vencimientos (en
anos al cuadrado) fue de 123,35. Para una muestra aleatoria independiente de 11 bonos
del segundo tipo, la varianza de los vencimientos fue de 8,02. Al nivel del 2%, determinar
si las dos varianzas poblacionales son diferentes. Asuma que las dos poblaciones tienen
distribucion normal.
SOLUCION:
Sean 21 y 22 las respectivas varianzas poblacionales. Queremos contrastar la hipotesis

H0 : 21 = 22 versus H1 : 21 6= 22 .
Cap. 8. Ejercicios 94

Para este ejemplo,


n1 = 17, s21 = 123, 35, n2 = 11, s22 = 8, 02.
El valor del estadstico de prueba esta dado por F = 15, 38. Para una prueba al nivel
del 2%, tenemos que = 0, 02 e, interpolando, F/2 (16, 10) = F0,01 (16, 10) = 4, 53 con
1 16 y 2 = 10 grados de libertad. Podemos rechazar la hipotesis nula al nivel del 5%.
Por consiguiente, hay abrumadora evidencia de que las varianzas en los vencimientos son
diferentes para estos dos tipos de bonos.

Ejercicios
1. Una muestra aleatoria de 100 muertes registradas en cierto pas durante el ano pasado
mostro una vida promedio de 71,8 anos. Suponiendo una desviacion estandar poblacional
de 8,9 anos, parecera esto indicar que la vida promedio hoy en da es mayor que 70 anos?
Utilice un nivel de significancia del 5%.
2. Un doctor afirma que el 12% de todas las citas son canceladas durante un periodo de seis
semanas. Se sabe que fueron canceladas 21 de las 200 citas del doctor. Haga una prueba
con un nivel de significancia del 5% para determinar si la verdadera proporcion de todas
las citas que son canceladas es diferente del 12%.
3. De una muestra aleatoria de 203 anuncios publicados en revistas colombianas, 52 eran
de deportes. De una muestra aleatoria independiente de 270 anuncios publicados en
revistas brasileras, 56 eran de deportes. Usando un nivel del 5%, constrastar frente a una
alternativa bilateral, la hipotesis nula de que las proporciones de anuncios comicos de las
revistas colombianas y americanas son iguales.
4. Se llevo a cabo un estudio entre expertos matematicos para conocer su opinion sobre
las mujeres matematicas. Se les pidio que evaluaran en una escala de 1 (totalmente en
desacuerdo) a 5 (totalmente de acuerdo) la afirmacion: Las mujeres matematicas tienen
la misma oferta de trabajo que los hombres. Para una muestra aleatoria de 186 hombres
de esta profesion, la respuesta media fue de 4.059 con una desviacion tpica de 0,839. Para
una muestra aleatoria independiente de 172 mujeres matematicas, la respuesta media fue
3.680 con una desviacion tpica de 0,966. Utilize un nivel de significancia del 5% para
contrastar la hipotesis nula de que las dos medias poblacionales son iguales frente a la
alternativa de que la verdadera media es mayor para los hombres.
5. Se llevo a cabo un estudio que pretenda valorar el efecto de la presencia de un moderador
sobre el numero de ideas generadas por un grupo. Se observaron cuatro miembros, con y
sin moderadores. Para una muestra aleatoria de cuatro grupos con moderador, el numero
medio de ideas generadas por grupo fue de 78, con una desviacion tpica de 24,4. Para
una muestra aleatoria independiente de cuatro grupos sin moderardor, el numero medio de
ideas generadas por grupo fue de 63,5, con una desviacion tpica de 20,2. Asumiendo que
las distribuciones poblacionales son normales con igual varianza, contrastar la hipotesis
nula de que las medias poblacionales son iguales frente a la alternativa de que la verdadera
media es mayor para los grupos con moderador. Use un nivel de significancia del 10%.
6. La varianza calculada de los puntajes en lectura de los estudiantes de tercer grado del
sistema escolar A, obtenidos durante 10 anos, es 1,44. Una muestra aleatoria de 21
estudiantes de tercer grado de otro sistema escolar (B) con quienes se practico la misma
prueba de lectura, arrojo una varianza de s2 = 1, 05. Proporcionan estos datos evidencia
suficiente como para concluir, al nivel de significancia 0,05, que los puntajes de los alumnos
de tercer grado del sistema B son menos variables de que los de los estudiantes del sistema
A? Suponga que los puntajes de los estudiantes de tercer del sistema B estan normalmente
distribuidos.
Cap. 8. Ejercicios 95

7. Al probar la diferencia en el desgaste abrasivo de los dos materiales en el ejemplo 8.3.5, se


asumio que las varianzas poblacionales desconocidas eran iguales. Es esta justificacion
correcta? Utilice un nivel de significancia del 10%.
8. En 1879, A.A. Michelson hizo 100 determinaciones de la velocidad de la luz en el aire
empleando una modificacion del metodo propuesto por el fsico frances Foucault. Los
datos estan en miles de km/s. Los datos estan recogidos en la primera columna del
archivo luz.sf. Suponiendo que los datos corresponden a una distribucion normal,
(a) estimar la media y la desviacion tpica de la distribucion.
(b) Obtener un intervalo de confianza del 95% para la media y la desviacion tpica de la
distribucion.
(c) Contrastar2 la hipotesis nula H0 : = 299.782, 5Km/s frente a H1 : 6= 299.782, 5
con = 0, 05.
9. En 1879, el fsico norteamericano Albert A. Michelson tomo 100 medidas de la velocidad
de la luz en el aire empleando una modificacion del metodo propuesto por el fsico frances
Foucault. Las medidas que tomo se proporcionan en la primera columna del archivo
luz.sf3 (en miles de km/s).
(a) Analice numerica y graficamente estos datos. Genere el histograma, el diagrama de
cajas y el diagrama de tallo y hojas y proporcione los principales estadsticos que
caracterizan a este conjunto de datos.
(b) Contraste la normalidad de los datos graficamente (grafico probabilista normal).
(c) Admitiendo que estos datos proceden de una distribucion normal proporcione los
valores de los estimadores de la misma por el metodo de maxima verosimilitud.
10. Simon Newcomb midio el tiempo que una senal luminosa tardaba en recorrer una distancia
de 7.400 metros. Los datos se proporcionan en nanosegundos (hay 109 nanosegundos en
un segundo) y estan recogidos en la segunda columna del archivo luz.sf3.
(a) Analice numerica y graficamente estos datos. Se detecta algun valor atpico mediante
los diagramas de cajas y de tallo y hojas?
(b) Transforme estos datos a velocidades y analcelos Se detecta algun valor atpico
mediante los diagramas de cajas y de tallo y hojas?
(c) Si hubiere valores atpicos elimnelos del analisis y compruebe la normalidad de los
datos restantes mediante diferentes graficos.
(d) Admitiendo que estos datos proceden de una distribucion normal, proporcione los
valores de los estimadores de la misma por el metodo de maxima verosimilitud.
(e) Compare graficamente los datos de la velocidad de la luz de Newcomb y de Michelson
(diagramas de cajas e histogramas).
11. Se ha registrado el numero de ninas en familias de 12 hijos nacidas entre 1879 y 1936 para
unas comunidades de granjeros que habitaban en los Estados Unidos de Norteamerica y
Canada. Los datos se muestran en el archivo demografia.sf3.
(a) Analice numerica y graficamente estos datos. Admitiendo equiprobabilidad de nacimiento
de nino y nina en cualquier embarazo que tipo de distribucion deberan seguir estos
datos?
(b) Estime la fraccion media de ninas en ese tipo de familias.
2
Actualmente se toma 299.792,5 km/s como la velocidad de la luz en el vaco.
Cap. 8. Ejercicios 96

12. Los circuitos integrados se construyen sobre obleas de silicio, que son discos de 20 cm de
diametro y muy poco espesor (entre 200-300 micras). En una de las etapas iniciales de
fabricacion se toman obleas de silicio y se introducen en una esmeriladora (grinder) hasta
conseguir el espesor deseado. En el archivo obleas.sf3 se presentan 150 medidas de espesor
de obleas de silicio, que corresponden a una planta holandesa de fabricacion de circuitos
integrados de Philips. El espesor deseado es 245 micras. Realizar la estimacion puntual
y obtener los intervalos de confianza para la media y la desviacion tpica ( = 0, 01)
suponiendo distribucion normal. Contrastar la hipotesis nula H0 : = 245 micras frente
a H1 : 6= 245 con = 0, 05.
13. Los laboratorios Merck llevaron a cabo un experimento para evaluar el efecto de un nuevo
medicamento. Se inyecto a diecinueve ratas de pantano una dosis de 12,5 mg de la droga.
Se eligieron al azar, de la camada de cada una de estas ratas, un macho y una hembra
para tirarlos a una piscina. Cada rata era colocada en un extremo de la piscina y se la
dejaba nadar hasta que escapaba por el otro extremo. Si no consegua escapar al cabo
de un cierto tiempo se le daba otra oportunidad. El experimento se repeta hasta que
la rata consegua escapar tres veces. El archivo de datos merck.sf3 presenta el numero
de pruebas necesarias para que cada animal consiguiese los tres exitos. Hay evidencia
de diferencias en el numero de intentos que necesitan machos y hembras para superar la
prueba?
14. En el archivo de datos gemelos.sf3 mostramos los resultados de tests de inteligencia
realizados a parejas de gemelos monozigoticos. Los gemelos monozigoticos se forman
por la division en dos de un mismo ovulo ya fecundado y, por tanto, tienen la misma
carga genetica. Al mismo tiempo, por razones obvias, es muy frecuente que compartan el
entorno vital y es difcil separar ambos factores. En el conjunto de datos, los datos de la
columna A corresponden al gemelo criado por sus padres naturales, los de la columna B
al criado por un familiar u otra persona.
(a) Analice numerica y graficamente, por separado, los datos correspondientes a cada
uno de estos dos tipos de gemelos.
(b) Calcule el coeficiente de correlacion entre los cocientes de inteligencia de ambos tipos
de gemelos.
(c) Estudie si existen diferencias significativas entre los promedios de inteligencia de am-
bos tipos de gemelos.
15. El Insitol es un alcohol cclico de estructura compleja que se utiliza para combatir la
depresion. Tambien se ha utilizado en investigacion psiquiatrica contra el panico. Para
probar esta teora se ha realizado un estudio doblemente ciego placebo con 21 pacientes a
los que se haba diagnosticado panico. Los pacientes apuntaban en un diario sus ataques
de panico. En el archivo insitol.sf3 se muestran los datos correspondientes a una semana
durante la cual se les haba administrado una dosis de placebo y otra semana en la cual
se les haba administrado Insitol. Estudie si el uso de Insitol reduce significativamente el
numero de ataques de panico.
16. Se ha investigado la relacion entre la temperatura media del aire y la temperatura de la
envoltura de gusanos en el Artico. En diferentes das se han tomado las temperaturas
medias del aire y dentro de la envoltura de estos gusanos (grados centgrados). Los datos
del archivo gusanos.sf3 indican que la temperatura del gusano dentro de la envoltura es
superior a la temperatura del aire exterior.
(a) Estime la diferencia media entre las temperaturas de la envoltura y del aire exterior.
(b) Contraste si la temperatura dentro de la envoltura es superior en al menos cuatro
grados centgrados a la temperatura media del aire.
A

Gua rapida para trabajar con


Statgraphics

A.1 Analisis de un solo conjunto de datos


1. Abrir el archivo de datos calles.sf3.
2. Seleccionamos Describe . . . Numeric Data . . . One-Variable Analysis.
3. Elegimos Data = Longitud y pulsamos la opcion OK.
4. Sale la llamada ventana del analisis. Los conos principales de esta ventana son:
Input dialog (cono de dialogos): para seleccionar o cambiar variables dentro del
archivo y analisis seleccionado.
Tabular options (cono de opciones tabulares): medidas estadsticas, percentiles,
tablas de frecuencia, inferencias, etc.
Graphical options (cono de opciones graficas): diagramas de dispersion, histogra-
mas, etc.
Save results (cono de salvar resultados): permite salvar los resultados del analisis.
5. Transformacion de una variable:1 OneVariable Analysis, activar el boton Transform y, en
Operators, elegir logaritmo.

A.2 Analisis simultaneo de dos o mas conjuntos de datos


1. Compare . . . Two Samples . . . Two Sample Comparison . . .
2. Para obtener diagramas de cajas multiples: Compare . . . Multiple Samples . . . Multiple-
Sample Comparison . . . Multiple Data Columns . . . Ok . . . Samples= (en esta ultima
opcion mencionar los datos que queremos comparar)
3. Para obtener diagramas de cajas multiples: Plot . . . Exploratory Plots . . . Multiple Box-
and-Whishker Plot . . . Data=distancia . . . Level codes=year . . .
1
Por ejemplo, si quisieramos trabajar con el logaritmo de la variable escribimos LOG(longitud)
en vez de longitud
A.3 Graficos de dispersion 98

A.3 Graficos de dispersion


Con la opcion Plot. . .Scatterplots se pueden realizar:
1. Graficos univariantes (Univariate Plot). Por ejemplo, abrir archivo de datos autos.sf3 y
utilizar la variable mpg.
2. Graficos bidimensionales X-Y simples (X-Y plot) y multiples (Multiple X-Y Plot). Por
ejemplo, abrir archivo de datos autos.sf3 y hacer Y=mpg y X=potencia. Sobre la grafica,
pulsar boton derecho del raton y elegir Pane options. Aparece una pantalla con varios
campos. Elegir Point Codes=model.
3. Graficos tridimensionales X-Y-Z simples (X-Y-Z plot) y multiples (Multiple X-Y-Z Plot).
Por ejemplo, abrir archivo de datos autos.sf3 y hacer X=accel, Y=cilindro, Z=price.
Sobre la zona grafica: boton derecho, Pane options, Point Codes=origin.
4. Graficos de matriz (Matriz Plot).
5. Graficos en coordenadas polares (Polar Coordinates Plot).

A.4 Diagramas de presentacion


Con la opcion Plot. . .Business Charts se pueden realizar (abrir siempre el archivo autos.sf3):
1. Graficos de barras simples (Barchart). Por ejemplo, realizar un grafico de barras para la
variable origin del archivo autos.sf3, que contiene el pas de origen de los autos. Los
valores de la variable origin son 1 para los autos norteamericanos, 2 para autos europeos y
3 para autos japoneses. En esta opcion sale, entre otros, el campo Counts (Frecuencias)
que permite introducir la variable que contiene las frecuencias absolutas de los valores de
la variable a graficar. Como las frecuencias absolutas de de los valores de la variable origin
son: 85 para autos norteamericanos, 26 para autos europeos y 44 para autos japoneses,
entonces, por esta razon, debemos escribir en este campo join3(85;26;44). Ademas, el
campo Labels (Etiquetas) permite introducir el nombre de la variable que contiene las
etiquetas a utilizar para cada barra del grafico. Como las etiquetas de los valores de la
variable origin estan contenidas carmakers, que son America, Europe y Japan, hacemos
Labels=carmakers.
2. Graficos de barras multiples (Multiple Barchart). Por ejemplo, realizaremos un grafico
de barras dobles para las variables origin y year del archivo autos.sf3, que contienen el
pas de origen de los autos y el ano de construccion, respectivamente. Los valores de la
variable year son los intervalos 1978, [1979,1980] y [1981,1982]. Aparecen, entre otros,
los siguientes campos:
Columns (Columnas): En este campo se introducen las variables que contienen las
frecuencias absolutas de los valores de las variables a graficar, o una expresion de
Statgtraphics que contiene operadores y que genera sus valores. Como las frecuen-
cias absolutas de de los valores de la variable origin son: 85 para autos norteamer-
icanos, 26 para autos europeos y 44 para autos japoneses, y como las frecuencias
absolutas de los valores de la variable year son: 36 para 1978, 58 para [1979,1980]
y 61 para [1981,1982], entonces, por esta razon, debemos escribir en este campo
join3(85;26;44) y join3(36;58;61).
Labels (Etiquetas): Hacemos Labels=carmakers.
3. Graficos de sectores (Piechart). Por ejemplo, realizaremos un grafico de sectores para la
variable origin del archivo autos.sf3, que contienen el pas de origen de los autos y el ano
de construccion, respectivamente. Los valores de la variable origin son 1 para los autos
A.5 Variables numericas multidimensionales 99

norteamericanos, 2 para autos europeos y 3 para autos japoneses. Aparecen, entre otros,
los siguientes campos:
Counts (Frecuencias): En este campo se introducen las variables que contienen las
frecuencias absolutas de los valores de las variables a graficar, o una expresion de
Statgtraphics que contiene operadores y que genera sus valores. Como las frecuen-
cias absolutas de de los valores de la variable origin son: 85 para autos norteameri-
canos, 26 para autos europeos y 44 para autos japoneses, entonces, por esta razon,
debemos escribir en este campo join3(85;26;44).
Labels (Etiquetas): En este campo se debe introducir el nombre de la variable que
contiene las etiquetas a utilizar para cada grupo de barras del grafico. Como las
etiquetas de los valores de la variable origin estan contenidas carmakers, que son
America, Europe y Japan, hacemos Labels=carmakers.
4. Graficos de componentes de lneas (Component Line Chart)
5. Graficos de escogencias alta y baja (High-Low-Chose Chart).

A.5 Variables numericas multidimensionales


Seleccione la siguiente secuencia de opciones: Describe. . .Numeric Data. . .Multiple-Variable
Analysis y aparecen todas las variables del archivo. Aparece una ventana de dialogo en cuyo
campo Data introducimos la variables origin, price y year. Luego, pulsamos el boton OK.

A.6 Distribuciones de probabilidad


Plot . . . Probability Distributions. Escogemos la distribucion deseada. Los valores de los
parametros que definen la distribucion (estan fijados por defecto por el programa) los pode-
mos modificar si pulsamos el boton derecho del raton y escogemos la opcion Analysis Options.

A.7 Inferencias basadas en una sola muestra


1. Se escoge Describe . . . Numeric Data . . . One Variable Analysis. Elegimos la variable que
va a ser objeto del analisis y pulsar OK. Al pulsar el cono Tabular options aparecen, entre
otros:
Confidence Intervals.
Calcula intervalos para la media (Confidence Interval for Mean) y la desviacion tpica
(Confidence Interval for Standard Deviation) de la distribucion. Pulsando el boton
derecho del raton y escogiendo Pane Options se puede modificar el nivel de confianza
(Confidence Level) y el tipo de intervalo (Interval Type).
Hypothesis Testing
Se realizan los contrastes de la media y de la desviacion tpica. Pulsando el boton
derecho del raton y escogiendo Pane options se pueden modificar el valor del
parametro para la hipotesis nula (por ejemplo Mean = 0 ), del nivel de signifi-
cancia (Alpha) y de la hipotesis alternativa:
2. Calculo de la curva de potencia.
Describe . . . Hypothesis Test . . . Normal Mean y en Null Hypothesis se elige el valor
de la media bajo la hipotesis nula. En la casilla Sample Sigma se escoge el valor de la
desviacion tpica de la poblacion. El tamano de muestra se fija a traves de Sample Size.
Seleccionando el cono de graficos se selecciona la unica grafica posible (curva de potencia
- Power Curve) y se pulsa OK.
A.8 Inferencias basadas en dos muestras 100

A.8 Inferencias basadas en dos muestras


1. Elegir Compare . . . Two Samples, en donde aparecen cuatro (4) opciones: Two Sample
Comparison, Paired-Sample Comparison, Hypotesis Tests, Sample-Size Determination.
2. Cuando seleccionamos Two Sample Comparison2 el programa pide al usuario que especi-
fique las dos columnas de datos a comparar (Sample 1 y Sample 2 ). Seleccionando
Tabular options aparece, entre otros:
Comparison of Means: Intervalo de confianza para la diferencia de medias y contraste
de igualdad de medias.
Comparison of Standard Deviations: Intervalo de confianza para el cociente de
varianzas y contraste de igualdad de varianzas.
Kolmogorov-Smirnov Test: Prueba de hipotesis para saber si las distribuciones de
ambas muestras son identicas.

A.9 Bondad de ajuste


1. Se selecciona Describe. . . Distribution Fitting . . .Uncensured Data. Al pulsar OK se ob-
tiene, entre otras, la salida de las contrastes de bondad de ajuste.
2. Si, estando situados sobre esta salida, pulsamos el boton derecho del raton y elegimos
la opcion Analysis Options del menu emergente resultante, obtenemos la caja de dialogo
Probability Distributios Options, que presenta todas las posibles distribuciones a considerar
para el ajuste (observamos que por defecto el ajuste se realiza a una distribucion normal).
3. Tambien aparecen los siguientes campos:
Number of Trials (numero de ensayos).
Se rellena con el numero de tiradas cuando la distribucion elegida para el ajuste es
binomial;
Number of Successes (numero de eventos).
Se rellena con el numero de exitos cuando la distribucion elegida es una binomial
negativa.
Population Size (tamano de la poblacion).
Se rellena con el tamano de la poblacion cuando la distribucion elegida es una
hipergeometrica.
4. La opcion tabular Tests for Normality : realiza los contrastes de normalidad.
5. Opcion tabular Goodness-of-Fit Tests: realiza los contrastes de la bondad de ajuste de
los datos a una distribucion dada.

2
El procedimiento es identico cuando seleccionamos la opcion Paired-Sample Comparison
B

Gua rapida para trabajar con


SPSS

B.1 Definicion de las variables


Para definir cada variable hay dos procedimientos:
Hacer doble clic sobre el encabezamiento de la variable o
Seleccionar, en la parte inferior, la pestana vista de variables.
Cuando se hace esto, observamos que hay una fila para cada variable del conjunto de datos
y que existen 10 columnas: Nombre, Tipo, Anchura, Decimales, Etiqueta, Valores, Perdidos,
Columnas, Alineacion y Medida. La definicion de una variable se basa en las opciones que se
ofrecen en esa ventana:
1. Asignar un nombre a cada variable, cumpliendo las siguientes reglas:
Nombres con no mas de 8 caracteres (el primero debe ser una letra o @).
No utilizar smbolos como &, /, $, etc.
No utilizar nunca espacios en blanco.
No utilizar expresiones como ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO,
o WITH.
2. Asignar un tipo a cada variable, indicando el maximo numero de dgitos que deseamos
para anotar las observaciones de la variable y el tipo de la variable con la que vamos a
trabajar (alfanumerica, fecha, moneda o numerica) indicando en este caso el numero de
cifras decimales con que queremos que aparezca en el editor. SPSS permite trabajar con
los siguientes tipos de variables:
Numericas: formato numerico estandar.
Coma: comas de separacion cada tres posiciones. Un punto para la parte decimal.
Punto: al contrario que el anterior.
Notacion Cientfica: uso de la E para exponente.
Cadena: variable alfanumerica (de mas de 8 caracteres se considera larga).
B.1 Definicion de las variables 102

Ademas estan los formatos de fecha, dolar y moneda personalizada.


Si no escogemos el tipo, el sistema lo asigna automaticamente, siendo el formato por
defecto: Numerica 8.2 que significa: Anchura: 8 y Decimales: 2; es decir, una amplitud
de columna de 8 espacios, siendo los 2 ultimos para los decimales.
3. Asignar una Etiqueta a cada variable de no mas de 120 caracteres (entre 30 y 40 es el
valor recomendado) que nos permita tener mas informacion sobre esa variable.
4. Asignar Valores: se trata de asignar etiquetas a los valores de cada variable. No es
obligatorio, pero s muy util en algunos casos.
5. Definir Perdidos: permite definir los valores de los datos especificados como perdidos
por el usuario. Situese en el campo correspondiente a Perdidos de cualquier variable y
pulse sobre el recuadro coloreado, aparece: Los codigos asignados a los valores ausentes
deben de ser coherentes con el tipo de variables declarado: numericos para las numericas
y alfanumericos para las alfanumericas (maximo 9 caracteres). Se pueden introducir hasta
3 valores perdidos (individuales) de tipo discreto, un rango de valores perdidos o un
rango mas un valor de tipo discreto. Solo pueden especificarse rangos para las variables
numericas. Estos valores ausentes son denominados por SPSS valores ausentes definidos
por el usuario (user-defined missing values), a diferencia de los definidos por el sistema
(system-missing values o sysmis). Estos ultimos corresponden a los que establece el
sistema para los espacios en blanco y caracteres ilegales que puedan haber en el archivo
de datos. Aparecen en los listados representados por comas.
6. Definir Columnas: consiste en especificar la amplitud de la columna. Podemos hacerlo
tambien desde el propio archivo de datos.
7. Definir Alineacion: seleccionar la justificacion de las entradas de la columna: Izquierda,
Derecha y Centrado.
8. Especificar medida. Se puede seleccionar uno de los tres niveles de medida:
Escala: los valores de datos son numericos en una escala de intervalo. Las variables
de escala deben ser numericas.
Ordinal: los valores de datos representan categoras con un cierto orden intrnseco
(bajo, medio, alto; totalmente de acuerdo, de acuerdo, en desacuerdo). Las variables
ordinales pueden ser de cadena o valores numericos. Notar que para variables de
cadena ordinales, se asume que el orden alfabetico de los valores de cadena indica el
orden correcto de las categoras; en el caso de bajo, medio y alto el orden sera alto,
bajo y medio (orden que no es correcto), por lo que es mas fiable utilizar codigos
numericos para representar datos ordinales que usar etiquetas de estos codigos.
Nominal: los valores de datos representan categoras sin un cierto orden intrnseco.
Las variables nominales pueden ser de cadena o valores numericos que representan
categoras diferentes, por ejemplo 1 = Hombre y 2 = Mujer.

B.1.1 Transformacion de una variable


Elegimos Transformar . . . Calcular, y realizamos los siguientes pasos:
1. Asignar un nombre y un tipo (por defecto sera numerica) a la nueva variable en el cuadro
de texto de la Variable de destino.
2. Definir la expresion numerica que va a permitir calcular los valores de la misma. Para ello
utilizaremos los nombres de las variables del archivo (podemos escribirlos o seleccionarlos
del listado que aparece), constantes, operadores y funciones.
3. Pulsar Aceptar.
B.1 Definicion de las variables 103

Para construir estas expresiones pueden usarse operadores aritmeticos como +, , *, /, ** y


funciones como SQRT, EXP, LG10, LN, ARTAN, COS, SIN, ABS, MOD10, TRUNC, RND,
entre otras:
MOD10 (Resto resultante de dividir entre 10).
TRUNC (Parte entera de un numero).
RND (Redondeo al entero mas cercano).
Pulsando el boton derecho sobre le nombre de la funcion, aparece su descripcion. El argumento
de las funciones debe ir entre parentesis. Existen funciones particulares como UNIFORM y
NORMAL, que se utilizan para la generacion de variables aleatorias. Son de bastante utilidad
en estudios de simulacion.

Es importante tener cuidado con el orden de utilizacion de los operadores y no olvidar que
los valores antiguos pierden su vigencia al recodificar una variable sobre el mismo nombre.

El boton SI . . . permite realizar modificaciones similares, pero sujetas a que se verifique una
condicion logica. Se incluiran aquellos casos que verifiquen la condicion. Los que no la cumplan
pasaran a ser valores ausentes definidos por el sistema.

Una expresion logica es una expresion que puede ser evaluada como verdadera o falsa en funcion
de los valores de las variables en ella relacionadas. El nexo de las variables son los operadores de
relacion: = , >= , <= , < , > , ~= . Es posible formar expresiones complejas, utilizando los
operadores logicos: AND (&), OR ( | ), NOT (~).

B.1.2 Recodificacion de una Variable


A partir de una variable podemos crear otra cuyos valores sean una recodificacion de los de
la primera. Esta recodificacion podemos hacerla tanto en la misma variable como en variables
diferentes. Para ello, seleccionaremos Transformar . . . Recodificar . . . En distintas variables. Se
abre una ventana en la que deberemos asignar un nombre (y una etiqueta si queremos) a la
nueva variable.1

B.1.3 Filtrado de datos


El programa SPSS permite seleccionar determinados casos para un proximo proceso, bien tempo-
ralmente o de forma permanente, sobre la base de un criterio logico o de una decision aleatoria.
Para ello seleccionaremos el menu Datos . . . Seleccionar casos. La seleccion de individuos puede
ser temporal (filtrados) o permanente (eliminados). En la seleccion permanente eliminamos del
archivo activo los individuos deseados, mientras que en la temporal, la seleccion es recuperable
(los casos son filtrados). En esta ultima situacion, los individuos (casos) del archivo que no
satisfacen la condicion apareceran marcados como excluidos mediante una lnea que cruza en
diagonal su numero de fila. Aparece tambien una variable llamada filter $ que el sistema crea
para controlar el filtrado de datos.

Especificaciones:
Todos los casos: indica que quiere procesar todos los casos del archivo de datos de trabajo.
Si se satisface la condicion: indica que quiere procesar solo los casos que satisfagan una
condicion logica. Para especificar o cambiar la condicion, pulse en Si. Esta alternativa
crea la variable filter $, que el sistema crea para controlar el filtrado de datos.
1
Cuidado!, si se selecciona . . . borraras la variable original.
B.2 Analisis exploratorio de datos 104

Muestra aleatoria de casos: indica que queremos seleccionar los casos de forma aleatoria
para su procesamiento. Si ha tecleado las especificaciones de muestreo, estas apareceran
junto al boton de comando Muestra. Si no, o si quiere cambiarlas, pulse en Muestra(vease
mas adelante). Esta alternativa tambien crea la variable filter $.
Basandose en el rango del tiempo o de los casos: permite seleccionar los casos deseados
siempre que sean consecutivos.
Usar variable de filtro: indica que quiere utilizar los valores de una variable numerica
existente para controlar el filtrado de casos. Seleccione la variable de la lista de la izquierda.
Los casos cuyo valor sea 0, o ausentes, en la variable de filtro se excluyen del analisis.

B.2 Analisis exploratorio de datos


Primero abrir el archivo de datos.
1. Tablas de frecuencias: Analizar . . . Estadsticos descriptivos . . . Frecuencias. SPSS
tambien cuenta con el menu alternativo Analizar . . . Tablas personalizadas que posibilita
alterar el formato del resultado.
2. Estadsticos: Analizar . . . Estadsticos descriptivos . . . Descriptivos donde hay que selec-
cionar la variable o variables de interes y despues Opciones para escoger los estadsticos
que interesan. Sin embargo con este menu no se pueden obtener los percentiles. Para
obtenerlos hay que usar Analizar . . . Estadsticos descriptivos . . . Frecuencias y entrar en
la opcion Estadsticos en donde se seleccionan los percentiles deseados.
3. Graficos de sectores: Graficos . . . Sectores y seleccionaremos una o varias variables
apareciendo un cuadro de dialogo, cuyas opciones pasamos a comentar:
(a) Resumenes para grupos de casos: Genera un grafico en el que cada sector corre-
sponde a un valor de la variable seleccionada. El tamano del sector se determina por
la opcion Los sectores representan, esta opcion aparece en el cuadro de dialogo que
surge despues de pulsar el boton Definir del cuadro anterior. Tambien es posible que
los sectores representen otra cosa, como la media de los valores de otra variable, el
valor maximo, etc.; esto se consigue con la opcion Otra funcion resumen. Se puede
tambien editar el grafico haciendo doble clic sobre el, con posibilidad de cambiar
colores, tramas, desgajar sectores, etc.
(b) Resumenes para distintas variables. Permite que los sectores representen variables
en lugar de grupos de casos. Cada sector representa una funcion de una determinada
variable (por ejemplo, la suma de los valores de sus casos).
(c) Valores individuales de los casos. Se resume una unica variable, los casos ya son
valores agrupados de la variable. Cada sector representa el valor de un caso individ-
ual. Con Graficos . . . Interactivos . . . Sectores podemos obtener representaciones
con efectos mas llamativos.
4. Diagramas de barras: Graficos . . . Barras y Graficos . . . Interactivos . . . Barras.
5. Histogramas: Graficos . . . Histograma o Graficos . . . Interactivos . . . Histograma.
6. Graficos de tallo y hojas: Analizar . . . Estadsticos descriptivos . . . Explorar.
7. Diagramas de caja: Graficos . . . Diagrama de cajas.
8. Diagramas de dispersion: Graficos . . . dispersion . . . simple o Graficos . . . Interactivos
. . . Diagrama de dispersion, en donde aparece un cuadro de dialogo en el que se puede
elegir que variable ocupara el eje X y que otra el eje Y.
B.3 Inferencia sobre una o mas poblaciones 105

B.3 Inferencia sobre una o mas poblaciones


Primero abrir el archivo de datos.
1. Analisis de una muestra: Analizar . . . Comparar medias . . . Prueba T para una muestra.
Aparece una pantalla en cuyo campo Contrastar Variables introducimos las varaibles que
queremos contrastar. En esta ventana, seleccione Opciones, para introducir el grado de
confianza deseado (por defecto es del 95%). Al final se pulsa Aceptar.
2. Analisis de dos muestras emparejadas o relacionadas (Prueba T para muestras
relacionadas). Para efectuar la prueba T para muestras relacionadas se necesita una
columna en los datos para cada una de las variables a comparar. Seleccionamos Analizar
. . . Comparar medias . . . Prueba T para muestras relacionadas. Aparece la ventana en
donde seleccionamos las variables en cuya comparacion estamos interesados. Al hacer
la primera seleccion en la columna de variables, esta aparece en el recuadro selecciones
actuales como variable 1, y al realizar la segunda seleccion aparecera como variable 2. En
ese momento, ya seleccionadas las dos, es cuando las podemos introducir en la columna
variables relacionadas. Se pulsa Aceptar.
3. Analisis de dos muestras independientes (Prueba T para muestras independientes).
El programa necesita una columna en el editor de datos que contenga los valores de la
variable cuyas medias en las dos poblaciones se desea comparar, y otra que indica la
poblacion o grupo a que pertenece cada individuo. A continuacion, seleccionamos Analizar
. . . Comparar medias . . . Prueba T para muestras independientes. Aparece una ventana en
donde, en primer lugar seleccionamos una variable numerica y con el puntero la situamos
en la ventana de Contrastar variables. A continuacion, seleccionamos una unica variable
de agrupacion y pulsamos Definir grupos. En esta ventana debemos especificar los dos
grupos de la variable de contraste, eligiendo entre:
Usar valores especificados. Escribimos un valor para el Grupo 1 y otro para el Grupo
2. Los casos con otros valores quedaran excluidos.
Punto de corte. Escribimos un numero que divida los valores de la variable de
agrupacion en dos conjuntos.
Si la variable de agrupacion es de cadena corta, por ejemplo, SI y NO, podemos escribir
una cadena para el Grupo 1 y otra para el Grupo 2. Los casos con otras cadenas quedaran
excluidos del analisis. Una vez completada la ventana y tras pulsar Continuar, volvemos
a la ventana de Prueba T para muestras independientes. Pulsando el boton Opciones
podemos introducir un valor entre 1 y 99 para el coeficiente de confianza de un intervalo,
cuyo valor por defecto es del 95%. Tras pulsar el boton Aceptar.
4. Pruebas de normalidad. Analizar . . . Estadsticos descriptivos . . . Explorar. Aparece la
ventana Explorar. En el caso de una muestra situamos la variable en la ventana Depen-
dientes, y dejamos Factores en blanco. Para dos muestras independientes, situamos la
variable a contrastar en la ventana Dependientes, y la variable que forma los grupos en la
de Factores. Para dos muestras emparejadas situamos una variable con la diferencia de las
dos originales en la ventana Dependientes, y dejamos Factores en blanco. A continuacion,
debemos pulsar el boton Graficos y en la nueva ventana escoger la opcion de Histograma
y activar la opcion de Graficos con pruebas de normalidad.
C

Uso de la calculadora en la
estadstica

Las explicaciones las basaremos en la utilizacion de las calculadoras Casio fx-82MS, fx-83MS,
fx-85MS, fx-270MS, fx-300MS y fx-350MS.

Calculos estadsticos
Para realizar calculos estadsticos en la calculadora, tenga en cuenta los siguientes comentarios:
Utilice mode 2 para ingresar el modo estadstico SD.

Utilice shift clr 1 = para borrar la memoria.


Ingrese los datos usando la secuencia de tecla siguiente: <Dato> dt .
Tenga en cuenta la tabla siguiente para los calculos que se necesiten:

Para llamar este tipo de valor: Realice esta operacion:


P 2
x shift s-sum 1
P
x shift s-sum 2
n shift s-sum 3
x shift s-var 1
n shift s-var 2
n1 shift s-var 3
P P
Ejemplo C.0.1 Calcule n, x, x2 , x, n y n1 para los datos siguientes: 55, 54, 51,
55, 53, 53, 54 y 52.
SOLUCION:
Primero, ingresamos al modo SD con las teclas mode 2.

Luego, borramos la memoria con la secuencia de teclas shift clr 1 =.


Posteriormente, ingresamos los datos: 55 dt 54 dt 51 dt 55 dt 53 dt 53 dt
54 dt 52 dt
Por ultimo, calculamos las medidas estadsticas pedidas:
107

P 2
Suma de los cuadrados de los valores x = 22.805 shift s-sum 1 =
P
Suma de valores x = 427 shift s-sum 2 =
Numero de datos n = 8 shift s-sum 3 =
Media aritmetica x = 53, 375 shift s-var 1 =
Desviacion estandar poblacional n = 1, 316956719 shift s-var 2 =
Desviacion estandar muestral n1 = 1, 407885953 shift s-var 3 =

Precauciones con el ingreso de datos


dt dt ingresa el mismo dato dos veces.

Tambien puede ingresar multiples entradas del mismo dato usando shift ; . Por ejem-
plo, para ingresar el dato 110 diez veces presiones 110 shift ; 10 dt .
Mientras ingresa datos o despues de completar el ingreso de datos, puede usar las teclas
y para ir visualizando a traves de los datos que ha ingresado.

Si ingresa multiples ingresos del mismo dato usando shift ; para especificar la fre-
cuencia de datos (numero de temes de datos) como se describe anteriormente, pasando
a traves de los datos muetra el tem de dato y una pantalla separada para la frecuencia
de datos (freq).
Los datos visualizados pueden editarse, si as lo desea. Ingrese el valor nuevo y presione
la tecla = para reemplazar el valor antiguo por el valor nuevo. Esto tambien significa
que si desea realizar alguna otra operacion (calculo, llamada de resultados de calculos es-
tadsticos, etc.), siempre debera presionar primero la tecla ac para salir de la presentacion
de datos.
Presionando la tecla dt en lugar de = despues de cambiar un valor sobre la presentacion,
registra el valor que ha ingresado como un elemento de dato nuevo, y deja el valor antiguo
tal como esta.
Puede borrar el valor del dato visualizado usando y , y luego presionando shift
cl . Borrando un valor de dato ocasiona que todos los valores siguientes se desplacen
hacia arriba.
Despues de ingresar los datos en el modo SD, no podra visualizar o editar mas los datos
temes de datos individuales, despues de cambiar a otro modo.
D

Apendice de tablas

D.1 La funcion de distribucion binomial


La funcion tabulada es la funcion de distribucion acumulada
Xn  
n k
B(k; n, p) = p (1 p)nk
k
k=0

para n = 5, 10, 15, 20 y 25.

(a) Tabla binomial para n = 5


p
k 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95
0 0,774 0,590 0,328 0,237 0,168 0,078 0,031 0,010 0,002 0,001 0,000 0,000 0,000
1 0,977 0,919 0,737 0,633 0,528 0,337 0,188 0,087 0,031 0,016 0,007 0,000 0,000
2 0,999 0,991 0,942 0,896 0,837 0,683 0,500 0,317 0,163 0,104 0,058 0,009 0,001
3 1,000 1,000 0,993 0,984 0,969 0,913 0,812 0,663 0,472 0,367 0,263 0,081 0,023
4 1,000 1,000 0,999 0,999 0,998 0,990 0,969 0,922 0,832 0,763 0,672 0,410 0,226
5 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

(b) Probabilidades binomiales acumuladas para n = 10


p
k 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95
0 0,599 0,349 0,107 0,056 0,028 0,006 0,001 0,000 0,000 0,000 0,000 0,000 0,000
1 0,914 0,736 0,376 0,244 0,149 0,046 0,011 0,002 0,000 0,000 0,000 0,000 0,000
2 0,988 0,930 0,678 0,526 0,383 0,167 0,055 0,012 0,002 0,000 0,000 0,000 0,000
3 0,999 0,987 0,879 0,776 0,650 0,382 0,172 0,055 0,011 0,004 0,001 0,000 0,000
4 1,000 0,998 0,967 0,922 0,850 0,633 0,377 0,166 0,047 0,020 0,006 0,000 0,000

5 1,000 1,000 0,994 0,980 0,953 0,834 0,623 0,367 0,150 0,078 0,033 0,002 0,000
6 1,000 1,000 0,999 0,996 0,989 0,945 0,828 0,618 0,350 0,224 0,121 0,013 0,001
7 1,000 1,000 1,000 1,000 0,998 0,988 0,945 0,833 0,617 0,474 0,322 0,070 0,012
8 1,000 1,000 1,000 1,000 1,000 0,998 0,989 0,954 0,851 0,756 0,624 0,264 0,086
9 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,994 0,972 0,944 0,893 0,651 0,401
D.1 La funcion de distribucion binomial 109

(c) Probabilidades binomiales acumuladas para n = 15


p
k 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95
0 0,463 0,206 0,305 0,013 0,005 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,829 0,549 0,167 0,080 0,035 0,005 0,000 0,000 0,000 0,000 0,000 0,000 0,000
2 0,964 0,816 0,398 0,236 0,127 0,027 0,004 0,000 0,000 0,000 0,000 0,000 0,000
3 0,995 0,944 0,648 0,461 0,297 0,091 0,018 0,002 0,000 0,000 0,000 0,000 0,000
4 0,999 0,987 0,836 0,686 0,515 0,217 0,059 0,009 0,001 0,000 0,000 0,000 0,000

5 1,000 0,998 0,939 0,852 0,722 0,403 0,151 0,034 0,004 0,001 0,000 0,000 0,000
6 1,000 1,000 0,982 0,943 0,869 0,610 0,304 0,095 0,015 0,004 0,001 0,000 0,000
7 1,000 1,000 0,996 0,983 0,950 0,787 0,500 0,213 0,050 0,017 0,004 0,000 0,000
8 1,000 1,000 0,999 0,996 0,985 0,905 0,696 0,390 0,131 0,057 0,018 0,000 0,000
9 1,000 1,000 1,000 0,999 0,996 0,966 0,849 0,597 0,278 0,148 0,061 0,002 0,000

10 1,000 1,000 1,000 1,000 0,999 0,991 0,941 0,783 0,485 0,314 0,164 0,013 0,000
11 1,000 1,000 1,000 1,000 1,000 0,998 0,982 0,909 0,703 0,539 0,352 0,056 0,005
12 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,973 0,873 0,764 0,602 0,184 0,036
13 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,995 0,965 0,920 0,833 0,451 0,171
14 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,995 0,987 0,965 0,794 0,537

(d) Probabilidades binomiales acumuladas para n = 20


p
k 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95
0 0,358 0,122 0,012 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,736 0,392 0,069 0,024 0,008 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000
2 0,925 0,677 0,206 0,091 0,035 0,004 0,000 0,000 0,000 0,000 0,000 0,000 0,000
3 0,984 0,867 0,411 0,225 0,107 0,016 0,001 0,000 0,000 0,000 0,000 0,000 0,000
4 0,997 0,957 0,630 0,415 0,238 0,051 0,006 0,000 0,000 0,000 0,000 0,000 0,000

5 1,000 0,989 0,804 0,617 0,416 0,126 0,021 0,002 0,000 0,000 0,000 0,000 0,000
6 1,000 0,998 0,913 0,786 0,608 0,250 0,058 0,006 0,000 0,000 0,000 0,000 0,000
7 1,000 1,000 0,968 0,898 0,772 0,416 0,132 0,021 0,001 0,000 0,000 0,000 0,000
8 1,000 1,000 0,990 0,959 0,887 0,596 0,252 0,057 0,005 0,001 0,000 0,000 0,000
9 1,000 1,000 0,997 0,986 0,952 0,755 0,412 0,128 0,017 0,004 0,001 0,000 0,000

10 1,000 1,000 0,999 0,996 0,983 0,872 0,588 0,245 0,048 0,014 0,003 0,000 0,000
11 1,000 1,000 1,000 0,999 0,995 0,943 0,748 0,404 0,113 0,041 0,010 0,000 0,000
12 1,000 1,000 1,000 1,000 0,999 0,979 0,868 0,584 0,228 0,102 0,032 0,000 0,000
13 1,000 1,000 1,000 1,000 1,000 0,994 0,942 0,750 0,392 0,214 0,087 0,002 0,000
14 1,000 1,000 1,000 1,000 1,000 0,998 0,979 0,874 0,584 0,383 0,196 0,011 0,000

15 1,000 1,000 1,000 1,000 1,000 1,000 0,994 0,949 0,762 0,585 0,370 0,043 0,003
16 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,984 0,893 0,775 0,589 0,133 0,016
17 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,965 0,909 0,794 0,323 0,075
18 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,992 0,976 0,931 0,608 0,264
19 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,997 0,988 0,878 0,642
D.2 La funcion de distribucion de Poisson 110

(e) Probabilidades binomiales acumuladas para n = 25


p
k 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95
0 0,277 0,072 0,004 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,642 0,271 0,027 0,007 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
2 0,873 0,537 0,098 0,032 0,009 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
3 0,966 0,764 0,234 0,096 0,033 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000
4 0,993 0,902 0,421 0,214 0,090 0,009 0,000 0,000 0,000 0,000 0,000 0,000 0,000

5 0,999 0,967 0,617 0,378 0,193 0,029 0,002 0,000 0,000 0,000 0,000 0,000 0,000
6 1,000 0,991 0,780 0,561 0,341 0,074 0,007 0,000 0,000 0,000 0,000 0,000 0,000
7 1,000 0,998 0,891 0,727 0,512 0,154 0,022 0,001 0,000 0,000 0,000 0,000 0,000
8 1,000 1,000 0,953 0,851 0,677 0,274 0,054 0,004 0,000 0,000 0,000 0,000 0,000
9 1,000 1,000 0,983 0,929 0,811 0,425 0,115 0,013 0,000 0,000 0,000 0,000 0,000

10 1,000 1,000 0,994 0,970 0,902 0,586 0,212 0,034 0,002 0,000 0,000 0,000 0,000
11 1,000 1,000 0,998 0,980 0,956 0,732 0,345 0,078 0,006 0,001 0,000 0,000 0,000
12 1,000 1,000 1,000 0,997 0,983 0,846 0,500 0,154 0,017 0,003 0,000 0,000 0,000
13 1,000 1,000 1,000 0,999 0,994 0,922 0,655 0,268 0,044 0,020 0,002 0,000 0,000
14 1,000 1,000 1,000 1,000 0,998 0,966 0,788 0,414 0,098 0,030 0,006 0,000 0,000

15 1,000 1,000 1,000 1,000 1,000 0,987 0,885 0,575 0,189 0,071 0,017 0,000 0,000
16 1,000 1,000 1,000 1,000 1,000 0,996 0,946 0,726 0,323 0,149 0,047 0,000 0,000
17 1,000 1,000 1,000 1,000 1,000 0,999 0,978 0,846 0,488 0,273 0,109 0,002 0,000
18 1,000 1,000 1,000 1,000 1,000 1,000 0,993 0,926 0,659 0,439 0,220 0,009 0,000
19 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,971 0,807 0,622 0,383 0,033 0,001

20 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,991 0,910 0,786 0,579 0,098 0,007
21 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,967 0,904 0,766 0,236 0,034
22 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,991 0,968 0,902 0,463 0,127
23 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,993 0,973 0,729 0,358
24 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,996 0,928 0,723

D.2 La funcion de distribucion de Poisson


La funcion tabulada es la funcion de distribucion acumulada
Xn   k
n
P(k; ) = e
k k!
k=0

para algunos valores de .

(a) Tabla de Poisson para 1



k 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
0 0,905 0,819 0,741 0,670 0,607 0,549 0,497 0,449 0,407 0,368
1 0,995 0,982 0,963 0,938 0,910 0,878 0,844 0,809 0,772 0,736
2 1,000 0,999 0,996 0,992 0,986 0,977 0,966 0,953 0,937 0,920
3 1,000 1,000 1,000 0,999 0,998 0,997 0,994 0,991 0,987 0,981

4 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,999 0,998 0,996
5 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999
6 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000
D.2 La funcion de distribucion de Poisson 111

(b) Tabla de Poisson para 2 20



k 2 3 4 5 6 7 8 9 10 15 20
0 0,135 0,050 0,018 0,007 0,002 0,001 0,000 0,000 0,000 0,000 0,000
1 0,406 0,199 0,092 0,040 0,017 0,007 0,003 0,001 0,000 0,000 0,000
2 0,677 0,423 0,238 0,125 0,062 0,030 0,014 0,006 0,003 0,000 0,000
3 0,857 0,647 0,433 0,265 0,151 0,082 0,042 0,021 0,010 0,000 0,000
4 0,947 0,815 0,629 0,440 0,285 0,173 0,100 0,055 0,029 0,001 0,000

5 0,983 0,916 0,785 0,616 0,446 0,301 0,191 0,116 0,067 0,003 0,000
6 0,995 0,966 0,889 0,762 0,606 0,450 0,313 0,207 0,130 0,008 0,000
7 0,999 0,988 0,949 0,867 0,744 0,599 0,453 0,324 0,220 0,018 0,001
8 1,000 0,996 0,979 0,932 0,847 0,729 0,593 0,456 0,333 0,037 0,002
9 1,000 0,999 0,992 0,968 0,916 0,830 0,717 0,587 0,458 0,070 0,005

10 1,000 1,000 0,997 0,986 0,957 0,901 0,816 0,706 0,583 0,118 0,011
11 1,000 1,000 0,999 0,995 0,980 0,947 0,888 0,803 0,697 0,185 0,021
12 1,000 1,000 1,000 0,998 0,991 0,973 0,936 0,876 0,792 0,268 0,039
13 1,000 1,000 1,000 0,999 0,996 0,987 0,966 0,926 0,864 0,363 0,066
14 1,000 1,000 1,000 1,000 0,999 0,994 0,983 0,959 0,917 0,466 0,105

15 1,000 1,000 1,000 1,000 0,999 0,998 0,992 0,978 0,951 0,568 0,157
16 1,000 1,000 1,000 1,000 1,000 0,999 0,996 0,989 0,973 0,664 0,221
17 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,995 0,986 0,749 0,297
18 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,998 0,993 0,819 0,381
19 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,997 0,875 0,470

20 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,917 0,559
21 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,947 0,644
22 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,967 0,721
23 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,981 0,787
24 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,989 0,843

25 1,000 1,000 1,000 0,994 0,970 0,902 0,586 0,212 0,034 0,994 0,888
26 1,000 1,000 1,000 0,998 0,980 0,956 0,732 0,345 0,078 0,997 0,922
27 1,000 1,000 1,000 1,000 0,997 0,983 0,846 0,500 0,154 0,998 0,948
28 1,000 1,000 1,000 1,000 0,999 0,994 0,922 0,655 0,268 0,999 0,966

29 1,000 1,000 1,000 1,000 1,000 0,998 0,966 0,788 0,414 1,000 0,978
30 1,000 1,000 1,000 1,000 1,000 1,000 0,987 0,885 0,575 1,000 0,987
31 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,946 0,726 1,000 0,992
32 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,978 0,846 1,000 0,995

33 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,993 0,926 1,000 0,997
34 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,971 1,000 0,999
35 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,991 1,000 0,999
36 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 1,000 1,000
D.3 La funcion de distribucion normal 112

D.3 La funcion de distribucion normal


Rz 2
La funcion tabulada es la funcion (z) = et /2
dt. Observe que (z) es la probabilidad

de que una variable aleatoria Z, distribuida normalmente con media 0 y varianza 1, sea menor o
igual a z. Es decir, (z) = P(Z z).

(a) Areas de curva normal estandar para valores negativos de Z


z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3.1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010

-2,9 0,0019 0,0018 0,0017 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048

-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183

-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559

-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0722 0,0708 0,0694 0,0681
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379

-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776

-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,2 0,4207 0,4168 0,4129 0,4009 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
D.3 La funcion de distribucion normal 113

(b) Areas de curva normal estandar para valores positivos de Z


z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9278 0,9292 0,9306 0,9319

1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936

2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9948 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9961 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9971 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986

3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
D.4 La funcion gamma incompleta 114

D.4 La funcion gamma incompleta


La funcion tabulada es
Zt
1
F(t; ) = ex x1 dx, x > 0,
()
0


t 1 2 3 4 5 6 7 8 9 10
1 0,632 0,264 0,080 0,019 0,004 0,001 0,000 0,000 0,000 0,000
2 0,865 0,594 0,323 0,143 0,053 0,017 0,005 0,001 0,003 0,000
3 0,950 0,801 0,577 0,353 0,185 0,084 0,034 0,012 0,004 0,001

4 0,982 0,908 0,762 0,567 0,371 0,215 0,111 0,051 0,021 0,008
5 0,993 0,960 0,875 0,735 0,560 0,384 0,238 0,133 0,068 0,032
6 0,998 0,983 0,938 0,849 0,715 0,554 0,394 0,256 0,153 0,084

7 0,999 0,993 0,970 0,918 0,827 0,699 0,550 0,401 0,271 0,170
8 1,000 0,997 0,986 0,958 0,900 0,809 0,687 0,547 0,407 0,283
9 1,000 0,999 0,994 0,979 0,945 0,884 0,793 0,676 0,544 0,413

10 1,000 1,000 0,997 0,990 0,971 0,993 0,870 0,780 0,667 0,542
11 1,000 1,000 0,999 0,995 0,985 0,962 0,921 0,857 0,768 0,659
12 1,000 1,000 1,000 0,998 0,992 0,980 0,954 0,911 0,845 0,758

13 1,000 1,000 1,000 0,999 0,996 0,989 0,974 0,946 0,900 0,834
14 1,000 1,000 1,000 1,000 0,998 0,994 0,986 0,968 0,938 0,891
15 1,000 1,000 1,000 1,000 0,999 0,997 0,992 0,982 0,963 0,930
D.5 Valores crticos para la distribucion t de Student 115

D.5 Valores crticos para la distribucion t de Student


Para > 120, tenemos que t () z .

0,4

0,3

0,2

0,1

0
-5 -3 -1 1 3 5
t


0,10 0,05 0,025 0,01 0,005 0,001 0,0005

1 3,078 6,314 12,706 31,821 63,657 318,31 636,620


2 1,886 2,920 4,303 6,965 9,925 22,326 31,598
3 1,638 2,353 3,182 4,541 5,841 10,213 12,924
4 1,533 2,132 2,776 3,747 4,604 7,173 8,610
5 1,476 2,015 2,571 3,365 4,032 5,893 6,869

6 1,440 1,943 2,447 3,143 3,707 5,208 5,959


7 1,415 1,895 2,365 2,998 3,499 4,785 5,408
8 1,397 1,860 2,306 2,896 3,355 4,501 5,041
9 1,383 1.833 2,262 2,821 3,250 4,297 4,781
10 1,372 1,812 2,228 2,764 3,169 4,144 4,587

11 1,363 1,796 2,201 2,718 3,106 4,025 4,437


12 1,356 1,782 2,179 2,681 3,055 3,930 4,318
13 1,350 1,771 2,160 2,650 3,012 3,852 4,221
14 1,345 1,761 2,145 2,624 2,977 3,787 4,140
15 1,341 1,753 2,131 2,602 2,947 3,733 4,073

16 1,337 1,746 2,120 2,583 2,921 3,686 4,015


17 1,333 1,740 2,110 2,567 2,898 3,646 3,965
18 1,330 1,734 2,101 2,552 2,878 3,610 3,922
19 1,328 1,729 2,093 2,539 2,861 3,579 3,883
20 1,325 1,725 2,086 2,528 2,845 3,552 3,850

21 1,323 1,721 2,080 2,518 2,831 3,527 3,819


22 1,321 1,717 2,074 2,508 2,819 3,505 3,795
23 1,319 1,714 2,069 2,500 2,807 3,485 3,767
24 1,318 1,711 2,064 2,492 2,797 3,467 3,745
25 1,316 1,708 2,060 2,485 2,787 3,450 3,725

26 1,315 1,706 2,056 2,479 2,779 3,435 3,707


27 1,314 1,703 2,052 2,473 2,771 3,421 3,690
28 1,313 1,701 2,048 2,467 2,763 3,408 3,674
29 1,311 1,699 2,045 2,462 2,756 3,396 3,659
30 1,310 1,697 2,042 2,457 2,750 3,385 3,646

32 1,309 1,694 2,037 2,449 2,738 3,365 3,622


34 1,307 1,691 2,032 2,441 2,728 3,348 3,601
36 1,306 1,688 2,028 2,434 2,719 3,333 3,582
38 1,304 1,686 2,024 2,429 2,712 3,319 3,566
40 1,303 1,684 2,021 2,423 2,704 3,307 3,551

50 1,299 1,676 2,009 2,403 2,678 3,262 3,496


60 1,296 1.671 2,000 2,390 2,660 3,232 3,460
120 1,282 1,658 1,980 2,358 2,617 3,160 3,373
(= z) 1,282 1,645 1,960 2,326 2,576 3,090 3,291
D.6 Valores crticos para la distribucion chi-cuadrada 116

D.6 Valores crticos para la distribucion chi-cuadrada

0,4

0,3

0,2

0,1

0

-5 -3 -1 12 3 5
X

(a) Valores crticos 2()



0,995 0,99 0,98 0,975 0,95 0,90 0,80 0,75 0,70 0,50

1 0,000 0,000 0,000 0,001 0,00393 0,0158 0,0642 0,102 0,148 0,4550
2 0,010 0,0201 0,0404 0,0506 0,103 0,211 0,446 0,575 0,713 1,386
3 0,0717 0,115 0,185 0,216 0,352 0,584 1,005 1,213 1,424 2,366
4 0,207 0,297 0,429 0,484 0,711 1,064 1,649 1,923 2,195 3,357
5 0,412 0,554 0,752 0,831 1,145 1,610 2,343 2,675 3,000 4,351

6 0,676 0,872 1,134 1,237 1,635 2,204 3,070 3,455 3,828 5,348
7 0,989 1,239 1,564 1,690 2,167 2,833 3,822 4,255 4,671 6,346
8 1,344 1,646 2,032 2,180 2,733 3,490 4,594 5,071 5,527 7,344
9 1,735 2,088 2,532 2,700 3,325 4,168 5,380 5,899 6,393 8,343
10 2,156 2,558 3,059 3,247 3,940 4,865 6,179 6,737 7,267 9,342

11 2,603 3,053 3,609 3,816 4,575 5,578 6,989 7,584 8,148 10,341
12 3,074 3,571 4,178 4,404 5,226 6,304 7,807 8,438 9,034 11,340
13 3,565 4,107 4,765 5,009 5,892 7,042 8,634 9,299 9,926 12,340
14 4,075 4,660 5,368 5,629 6,571 7,790 9,467 10,165 10,821 13,339
15 4,601 5,229 5,985 6,262 7,261 8,547 10,307 11,036 11,721 14,339

16 5,142 5,812 6,614 6,908 7,962 9,312 11,152 11,912 12,624 15,338
17 5,697 6,408 7,255 7,564 8,672 10,085 12,002 12,792 13,531 16,338
18 6,844 7,633 8,567 8,907 10,117 11,651 13,716 14,562 15,352 18,338
19 6,844 7,633 8,567 8,907 10,117 11,651 13,716 14,562 15,352 18,338
20 7,434 8,260 9,237 9,591 10,851 12,443 14,578 15,452 16,266 19,337

21 8,034 8,897 9,915 10,283 11,591 13,240 15,445 16,344 17,182 20,337
22 8,643 9,542 10,600 10,982 12,338 14,041 16,314 17,240 18,101 21,337
23 9,260 10,196 11,293 11,688 13,091 14,848 17,187 18,137 19,021 22,337
24 9,886 10,856 11,992 12,401 13,848 15,659 18,062 19,037 19,943 23,337
25 10,520 11,524 12,692 13,120 14,611 16,473 18,940 19,939 20,867 24,337

26 11,160 12,198 13,409 13,844 15,379 17,292 19,820 20,843 21,792 25,336
27 11,808 12,879 14,125 14,573 16,151 18,114 20,703 21,749 22,719 26,336
28 12,461 13,565 14,847 15,308 16,928 18,939 21,588 22,657 23,647 27,336
29 13,121 14,256 15,574 16,047 17,708 19,768 22,475 23,567 24,577 28,336
30 13,787 14,953 16,306 16,791 18,493 20,599 23,364 24,478 25,508 29,336

31 14,457 15,655 17,538 19,280 21,433


32 15,134 16,362 18,291 20,072 22,271
33 15,815 17,073 19,046 20,866 23,110
34 16,501 17,789 19,806 21,664 23,952
35 17,191 18,508 20,569 22,465 24,796

36 17,887 19,233 21,336 23,269 25,643


37 18,584 19,960 22,105 24,075 26,492
38 19,289 20,691 22,878 24,884 27,343
39 19,994 21,425 23,654 25695 28,196
40 20,706 22,164 24,433 26,509 29,050
D.6 Valores crticos para la distribucion chi-cuadrada 117

(b) Valores crticos 2() (continuacion)



0,30 0,25 0,20 0,10 0,05 0,025 0,02 0,01 0,005 0,001

1 1,074 1,323 1,642 2,706 3,841 5,024 5,412 6,635 7,879 10,827
2 2,408 2,773 3,219 4,605 5,991 7,378 7,824 9,210 10,597 13,815
3 3,665 4,108 4,642 6,251 7,815 9,348 9,837 11,345 12,838 16,268
4 4,878 5,385 5,989 5,779 9,488 11,143 11,668 13,277 14,860 18,465
5 6,064 6,626 7,289 9,236 11,070 12,832 13,388 15,086 16,750 20,517

6 7,231 7,841 8,558 10,645 12,592 14,449 15,033 16,812 18,548 22,457
7 8,383 9,037 9,803 12,017 14,067 16,013 16,622 18,475 20,278 24,322
8 9,524 10,219 11,030 13,362 15,507 17,535 18,168 20,090 21,955 26,125
9 10,656 11,389 12,242 14,684 16,919 19,023 19,679 21,666 23,589 27,877
10 11,781 12,549 13,442 15,987 18,307 20,483 21,161 23,209 25,188 29,588

11 12,899 13,701 14,631 17,275 19,675 21,920 22,618 24,725 26,757 31,264
12 14,011 14,845 15,812 18,549 21,026 23,337 24,054 26,217 28,300 32,909
13 15,119 15,984 16,985 19,812 22,362 24,736 25,472 27,688 29,819 34,528
14 16,222 17,117 18,151 21,064 23,685 26,119 26,873 29,141 31,319 36,123
15 17,322 18,245 19,311 22,307 24,996 27,488 28,259 30,578 32,801 37,697

16 18,418 19,369 20,465 23,542 26,296 28,845 29,633 32,000 34,267 39,252
17 19,511 20,489 21,615 24,769 27,587 30,191 30,995 33,409 35,718 40,790
18 20,601 21,605 22,760 25,989 28,869 31,526 32,346 34,805 37,156 42,312
19 21,689 22,718 23,900 27,204 30,144 32,852 33,687 36,191 38,582 43,820
20 22,775 23,828 25,038 28,412 31,410 34,170 35,020 37,566 39,997 45,315

21 23,858 24,935 26,171 29,615 32,671 35,479 36343 38,932 41,401 46,797
22 24,939 26,039 27,301 30,813 33,924 36,781 37,659 40,289 42,796 48,268
23 26,018 27,141 28,429 32,007 35,172 38,076 38,968 41,638 44,181 49,728
24 27,096 28,241 29,553 33,196 36,415 39,364 40,270 42,980 45,558 51,179
25 28,172 29,339 30,675 34,382 37,652 40,646 41,566 44,314 46,928 52,620

26 29,246 30,434 31,795 35,563 38,885 41,923 42,856 45,642 48,290 54,052
27 30,319 31,528 32,912 36,741 40,113 43,194 44,140 46,963 49,645 55,476
28 31,391 32,620 34,027 37,916 41,337 44,461 45,419 48,278 50,993 56,893
29 32,461 33,711 35,139 39,087 42,557 45,722 46,693 49,588 52,336 58,302
30 33,530 34,800 36,250 40,256 43,773 46,979 47,962 50,892 53,672 59,703

31 41,422 44,985 48,231 52,190 55,000


32 42,585 46,194 49,480 53,486 56,328
33 43,745 47,400 50,724 54,774 57,646
34 44,903 48,602 51,966 56,061 58,964
35 46,059 49,802 53,203 57,340 60,272

36 47,212 50,998 54,437 58,619 61,581


37 48,363 52,192 55,667 59,891 62,880
38 49,513 53,384 56,896 61,162 64,181
39 50,660 54,572 58,119 62,426 65,473
40 51,805 55,758 59,342 63,691 66,766
D.7 Valores crticos para la distribucion F 118

D.7 Valores crticos para la distribucion F


1
Siempre se cumple que F (a, b) = F1 (b,a) .

0,4

0,3

0,2

0,1

0
-5 -3 -1 1 3 5
f

(a) Valores crticos F(1, 2) para = 0, 05


1
2 1 2 3 4 5 6 7 8 9

1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5


2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00


5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68


8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02


11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71


14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54


17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42


20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34


23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28


26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25

28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24


29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12


60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04

120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96
3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88
D.7 Valores crticos para la distribucion F 119

(b) Valores crticos F(1, 2) para = 0, 05


1
2 10 12 15 20 24 30 40 60 120

1 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3
2 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53

4 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
6 4,06 4,00 3,94 3,87 384 3,81 3,77 3,74 3,70 3,67

7 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71

10 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30

13 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07

16 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92

19 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81

22 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73

25 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67

28 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
30 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62

40 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39

120 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
D.7 Valores crticos para la distribucion F 120

(c) Valores crticos F(1, 2) para = 0, 01


1
2 1 2 3 4 5 6 7 8 9

1 4052 4999,5 5403 5625 5764 5859 5928 5981 6022


2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35

4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66


5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98

7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72


8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94


11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39

13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19


14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89

16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78


17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60

19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52


20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40

22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35


23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26

25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22


26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15

28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12


29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07

40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89


60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72

120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56
6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41
D.7 Valores crticos para la distribucion F 121

(d) Valores crticos F(1, 2) para = 0, 01


1
2 10 12 15 20 24 30 40 60 120

1 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 99,40 99,42 99,43 99,45 99,46 99,47 99,47 99,48 99,49 99,50
3 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13

4 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46
5 10,05 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02
6 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88

7 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
8 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86
9 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31

10 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91
11 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60
12 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36

13 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17
14 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00
15 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87

16 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,84 2,75
17 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,75 2,65
18 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,66 2,57

19 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,58 2,49
20 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42
21 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,46 2,36

22 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,40 2,31
23 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,35 2,26
24 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,21

25 3,13 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,27 2,17
26 3,09 2,96 2,81 2,66 2,58 2,50 2,42 2,33 2,23 2,13
27 3,06 2,93 2,78 2,63 2,55 2,47 2,38 2,29 2,20 2,10

28 3,03 2,90 2,75 2,60 2,52 2,44 2,35 2,26 2,17 2,06
29 3,00 2,87 2,73 2,57 2,49 2,41 2,33 2,23 2,14 2,03
30 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01

40 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80
60 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60

120 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38
2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1,00
D.8 Algunos numeros aleatorios uniformemente distribuidos 122

D.8 Algunos numeros aleatorios uniformemente distribui-


dos
85387 51571 57714 00512 61319 69143 08881 01400 55061 82977
84176 03311 16955 59504 54499 32096 79485 98031 99485 16788
27258 51746 67223 98182 43166 54297 26830 29842 78016 73127
99398 46950 19399 65167 35082 30482 86223 41061 21717 48126

72752 89364 02150 85418 05420 84341 02395 27655 59457 55438
69090 93551 11649 54688 57061 77711 24201 16895 64936 62347
39620 54988 67846 71845 54000 26134 84526 16619 82573 01737
81725 49831 35595 29891 46812 57770 03326 31316 75412 80732

87968 85157 84752 93777 62772 78961 30750 76089 23340 64637
07730 01861 40610 73445 70321 26467 53533 20787 46971 29134
32825 82100 67406 44156 21531 67186 39945 04189 79798 41087
34453 05330 40224 04116 24597 93823 28171 47701 77201 68257

00830 34235 40671 66042 06341 54437 81649 70494 01883 18350
24580 05258 37329 59173 62660 72513 82232 49794 36913 05877
59578 08535 77107 19838 40651 01749 58893 99115 05212 92309
75387 24990 12748 71766 17471 15794 68622 59161 14476 75074

02465 34977 48319 53026 53691 80594 58805 76961 62665 82855
49689 08342 81912 92735 30042 47623 60061 69427 21163 68543
60958 20236 79424 04055 54955 73342 14040 72431 99469 41044
79956 98409 79548 39569 83974 43707 77080 08645 20949 56932

04316 01206 08715 77713 20572 13912 94324 14656 11979 53258
78684 28546 06881 66097 53530 42509 54130 30878 77166 98075
69235 18535 61904 99246 84050 15270 07751 90410 96675 62870
81201 04314 92708 44984 83121 33767 56607 46371 20389 08809

80336 59638 44368 23433 97794 10343 19235 82633 17186 63902
65076 87960 92013 60169 49176 50140 39081 04638 96114 63463
90879 70970 50789 59973 47771 94567 35590 23462 33993 99899
50555 84355 97066 82748 98298 14385 82493 40182 20523 69182

48658 41921 86514 46786 74097 62825 46457 24428 09245 86069
26373 19166 88223 32371 11570 62078 92317 13378 05734 71778
20878 80883 26027 29101 58382 17109 53511 95536 21759 10630
20069 60582 55749 88068 48589 01784 42930 40310 34613 97359

46819 38577 20520 94145 99405 47064 25248 27289 41289 54972
83644 04459 73252 58414 94180 09321 59747 07379 56255 45615
08636 31363 56033 49076 88908 51318 39104 56556 23112 63317
92058 38678 12507 90343 17213 24545 66053 76412 29545 89932

05038 18443 87138 05076 25660 23414 84837 87132 84405 15346
41838 68590 93646 82113 25498 33110 15356 81070 84900 42660
15564 81618 99186 73113 99344 13213 07235 90064 89150 86359
74600 40206 15237 37378 96862 78638 14376 46607 55909 46398

78275 77017 60310 13499 35268 47790 77475 44345 14615 25231
30145 71205 10355 18404 85354 22199 90822 35204 47891 69860
46944 00097 39161 50139 60458 44649 85537 90017 18157 13856
85883 21272 89266 94887 00291 70963 28169 95130 27223 35387

83606 98192 82194 26719 24499 28102 97769 98769 30757 81593
66888 81818 52490 54272 70549 69235 79684 96412 65186 87974
63673 73966 34036 44298 60652 05947 05833 37914 57021 58566

37944 16094 39797 63253 64103 32222 65925 64693 34048 75394
93240 66855 29336 28345 71398 45118 01454 72128 09715 29454
40189 76776 70842 32675 81647 75868 21288 12849 94990 21513
Bibliografa &Referencias

[1] Anderson, D.; Sweeney, D.; Williams, T., Estadstica para administracion y
economa. International Thomson Editores, 1999.
[2] Berk, K.; Carey, P., Analisis de datos con Microsoft Excel. International Thomson
Editores, 2001.
[3] Berenson, M.; Levine, D.; Krehbiel, T., Estadstica para administracion. Prentice
Hall, 2001.
[4] Canavos, G,, Probabilidad y Estadstica: Aplicaciones y Metodos. Mc Graw-Hill, 1988.
[5] DeGroot, M., Probabilidad y Estadstica. Addison-Wesley Iberoamericana, 1988.
[6] Devore, J., Probabilidad y estadstica para ingeniera y ciencias. International Thomson
Editores, 2001.
[7] Freund. J., Estadstica elemental. Prentice Hall, 1994.
[8] Kreyszig, E., Introduccion a la estadstica matematica: Principios y metodos. Ed. Limusa,
1991.
[9] Levin, R.; Rubin, D., Estadstica para Administracion y Economa. Prentice Hall, 2004.
[10] Lizasoain, L.; Joaristi, L., Gestion y analisis de datos con SPSS. International Thom-
son Editores, 2003.
[11] LLinas, H.; Rojas, C., Estadstica descriptiva y distribuciones de probabilidad. Ediciones
Uninorte, 2005.
[12] LLinas, H., Gua resumida sobre Metodos Estadsticos: Teora y pactica. Notas de clases
para la Especializacion en Estadstica Aplicada, 2005.
[13] Milton, S.; Arnold, J., Probabilidad y estadstica con aplicaciones para ingeniera y
ciencias computacionales. Mc Graw-Hill, 2003.
[14] Montgomery, D.; Runger, G. , Probabilidad y estadstica aplicadas a la ingeniera.
Ed. Limusa, 2002.
[15] Newbold, P., Estadstica para los Negocios y la Economa. Prentice Hall, 1998.
[16] Perez, C., Estadstica practica con Statgraphics. Prentice Hall, 2002.
Bibliografa & Referencias 124

[17] Perez, C., Tecnicas estadsticas con SPSS. Prentice Hall, 2001.
[18] Pitman, J., Probability. Berlin-Heidelberg-New York: Springer-Verlag, 1993.
[19] Ross, S., A first Course in Probability. Prentice Hall, 2002.
[20] Visauta, B., Analisis estadstico con SPSS para windows. Mc Graw-Hill, 2002.
[21] Wackerly, D.; Mendenhall, W.; Scheaffer, R., Estadstica matematica con apli-
caciones. International Thomson Editores, 2002.
[22] Walpole, R.; Myers, R.; Myers, S., Probabilidad y Estadstica para ingenieros.
Prentice Hall, 1999.
[23] Weimer, R., Estadstica. Ed. Cecsa, 1996.

También podría gustarte