Está en la página 1de 341

UNIVERSIDAD POLITCNICA DE VALENCIA

ESTADSTICA BSICA

PARA

INGENIERA



Mara Teresa Carot Snchez
Gonzalo Clemente Marn
Jos Mara Sanz Juan




DEPARTAMENTO DE ESTADSTICA E INVESTIGACIN
OPERATIVA APLICADAS Y CALIDAD

Enero 2013
Contenido
-2-


Contenido
-3-
CONTENIDO

1. INTRODUCCIN

1.1. LA METODOLOGA ESTADSTICA ............................................................ 9
1.2. EL MTODO CIENTFICO ........................................................................ 12
1.3. SOFTWARE ESTADSTICO ...................................................................... 14
1.4. REDONDEO DE LOS DATOS ................................................................... 15
1.5. ALFABETO GRIEGO ................................................................................. 17
2. ESTADSTICA DESCRIPTIVA

2.1. INTRODUCCIN ........................................................................................... 19
2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL ......................................... 22
2.2.1. Tablas de frecuencias ............................................................................ 23
2.2.2. Histogramas ........................................................................................... 23
2.2.3. Polgono de frecuencias ......................................................................... 25
2.2.4. Diagrama de puntos ............................................................................... 25
2.2.5. Grfico de tartas..................................................................................... 26
2.2.6. Grfico de Pareto ................................................................................... 26
2.2.7. Medidas de posicin .............................................................................. 27
2.2.8. Medidas de dispersin ........................................................................... 29
2.2.9. Diagrama e tallos y hojas ....................................................................... 31
2.2.10. Diagrama de caja-y-bigotes.................................................................. 32
2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL ........................................... 33
2.3.1. Tablas de frecuencia de doble entrada .................................................. 33
2.3.2. Frecuencias marginales ......................................................................... 36
2.3.3. Frecuencias condicionales ..................................................................... 37
2.3.4. Representaciones grficas de las distribuciones bidimensionales .......... 38
2.3.5. Covarianza muestral .............................................................................. 40
2.3.6. Regresin lineal ..................................................................................... 40
2.4. PROBLEMAS Y CUESTIONES DE EXMENES ........................................... 41

3. PROBABILIDADES

3.1. INTRODUCCIN ........................................................................................... 47
3.2. PROBABILIDAD ............................................................................................. 48
3.2. ESPACIOS DE PROBABILIDADES ............................................................... 48
3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES ..................................... 52
Probabilizacin de Espacios Muestrales Discretos .......................................... 52
Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria ...... 53
Combinatoria ................................................................................................... 53
Contenido
-4-
3.5. PROBABILIDAD CONDICIONADA ................................................................ 54
3.6. TEOREMA DE LA INTERSECCIN .............................................................. 56
3.7. TEOREMA DE LA PARTICIN TOTAL ......................................................... 56
3.8. SUCESOS INDEPENDIENTES ..................................................................... 57
3.9. TEOREMA DE BAYES ................................................................................... 58
3.10. PROBLEMAS PROPUESTOS ..................................................................... 59
Probabilidad condicional .................................................................................. 61
3.11. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 66

4. CONCEPTO DE VARIABLE ALEATORIA

4.1. DEFINICIN DE VARIABLE ALEATORIA UNIDIMENSIONAL ...................... 77
4.2. FUNCIN DE DISTRIBUCIN ...................................................................... 78
4.3. VARIABLES DISCRETAS .............................................................................. 79
4.4. VARIABLES CONTINUAS ............................................................................. 81
Funcin de densidad ....................................................................................... 81
Transformacin de variables aleatorias ........................................................... 84
4.5. ESPERANZA MATEMTICA ......................................................................... 85
Esperanza matemtica .................................................................................... 85
Momentos ........................................................................................................ 86
4.6 PARMETROS DE TENDENCIA .................................................................... 88
Valor medio ..................................................................................................... 88
Mediana ........................................................................................................... 89
Cuartiles .......................................................................................................... 89
Moda ............................................................................................................... 90
4.7. VARIANZA. CONCEPTO Y PROPIEDADES ................................................. 90
Desviacin tpica.............................................................................................. 91
4.8. OTROS PARMETROS DE UNA DISTRIBUCIN ........................................ 91
Rango o Recorrido ........................................................................................... 91
Coeficiente de variacin ................................................................................... 92
Coeficiente de asimetra ................................................................................. 92
Coeficiente de apuntamiento o de curtosis ...................................................... 92
4.9. DISTRIBUCIONES BIDIMENSIONALES ....................................................... 93
Concepto ......................................................................................................... 93
Funcin de distribucin .................................................................................... 94
Funcin de densidad ....................................................................................... 95
Funcin de densidad marginal ......................................................................... 96
Funcin de densidad condicional ..................................................................... 98
Independencia de variables aleatorias ............................................................. 99
Esperanza de vectores aleatorios .................................................................. 100
Momentos ...................................................................................................... 101
Matriz de varianzas-covarianzas .................................................................... 102
Contenido
-5-
Combinacin lineal de variables aleatorias .................................................... 106
Curva de regresin condicional ...................................................................... 106
Recta de regresin mnimo cuadrtica ........................................................... 107
4.10. PROBLEMAS PROPUESTOS ................................................................... 109
4.11. PROBLEMAS Y CUESTIONES DE EXMENES ....................................... 113

5. PRINCIPALES DISTRIBUCIONES DISCRETAS

5.1. DISTRIBUCIN DICOTMICA ............................................................... 121
5.2. DISTRIBUCIN BINOMIAL ..................................................................... 122
5.3. DISTRIBUCIN HIPERGEOMTRICA ................................................... 123
5.4. DISTRIBUCIN DE POISSON ................................................................ 125
5.5. DISTRIBUCIN BINOMIAL-NEGATIVA .................................................. 126
5.6. DISTRIBUCIN MULTINOMIAL .............................................................. 127
5.7. PROBLEMAS PROPUESTOS ................................................................. 129
5.8. PROBLEMAS Y CUESTIONES DE EXMENES .................................... 143

6. PRINCIPALES DISTRIBUCIONES CONTINUAS

6.1. DISTRIBUCIN UNIFORME ................................................................... 149
6.2. DISTRIBUCIN EXPONENCIAL ............................................................. 150
Tasa de fallos ................................................................................................ 152
6.3. DISTRIBUCIN NORMAL UNIDIMENSIONAL ....................................... 154
6.3.1. Variable normal tipificada ..................................................................... 155
6.3.2. Variable normal general ....................................................................... 158
6.3.3. Teorema central del lmite .................................................................... 160
Aproximacin de la binomial a la normal ....................................................... 161
Aproximacin de la Poisson a la normal ........................................................ 162
Correccin por continuidad ............................................................................ 163
6.4. LA DISTRIBUCIN NORMAL BIDIMENSIONAL ..................................... 165
Distribuciones marginales .............................................................................. 166
Distribuciones condicionales .......................................................................... 166
6.5. PROBLEMAS PROPUESTOS .................................................................... 169
Distribucin uniforme ..................................................................................... 169
Distribucin exponencial ................................................................................ 170
Distribucin Normal ........................................................................................ 172
Distribuciones bidimensionales ...................................................................... 182
6.6. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 185


Contenido
-6-
7. DISTRIBUCIONES DERIVADAS DE LA NORMAL

7.1. DISTRIBUCIN CHI-CUADRADO .......................................................... 191
7.2. DISTRIBUCIN t ................................................................................... 192
7.3. DISTRIBUCIN F.................................................................................... 194
7.4. PROBLEMAS PROPUESTOS ................................................................ 195


8. DISTRIBUCIONES EN EL MUESTRO

8.1. POBLACIN, MUESTREO Y MUESTRA ................................................ 197
8.2. DISTRIBUCIN DE LA VARIANZA MUESTRAL ..................................... 201
8.3. DISTRIBUCIN DE LA MEDIA MUESTRAL ........................................... 203
8.4. DISTRIBUCIN DEL COCIENTE DE VARIANZAS ................................. 204
8.5. DISTRIBUCIN DE LA PROPORCIN .................................................. 206
8.6. DISTRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES ........ 207
8.7. DISTRIBUCIN DE LA DIFERENCIA DE PROPORCIONES ................. 208
8.8. VARIANZA EN POBLACIONES FINITAS ................................................ 210
8.9. PROBLEMAS PROPUESTOS ................................................................ 211
8.10. PROBLEMAS Y CUESTIONES DE EXMENES .................................... 212


9. INTRODUCCIN A LA INFERENCIA ESTADSTICA

9.1 ESTIMACIN PUNTUAL......................................................................... 217
9.2. ESTIMACIN POR INTERVALOS DE CONFIANZA ............................... 220
9.2.1. Intervalo de confianza para la media poblacional ................................. 221
9.2.2. Intervalo de confianza para la varianza poblacional ............................. 223
9.2.3. Intervalo de confianza para el cociente de varianzas poblacionales.... 224
9.2.4. Intervalo de confianza para la proporcin ............................................ 225
9.2.5. Intervalo de confianza para la diferencia de proporciones .................... 227
9.2.6. Intervalo de confianza para la diferencia de medias poblacionales ...... 228
9.3. TEST DE HIPTESIS ............................................................................. 230
Conceptos ..................................................................................................... 230
Obtencin de los tests .................................................................................. 234
9.4. TEST DE HIPTESIS PARMETRICOS ..................................................... 235
9.4.1. Contrastes de la media de una poblacional normal ............................. 235
9.4.2. Test de hiptesis para la varianza poblacional ..................................... 240
9.4.3. Test de hiptesis para el cociente de varianzas poblacionales ............ 241
9.4.4. Contrastes de proporciones ................................................................. 242
9.4.5. Test de hiptesis para la diferencia de medias poblacionales con
Contenido
-7-
muestras independientes ............................................................................... 246
9.4.6. Test para la diferencia de medias poblacionales con datos apareados
...................................................................................................................... 247
9.4.7.Test para la diferencia de proporciones ................................................ 248
9.4.8. Test de ajuste a una distribucin .......................................................... 250
9.4.9. Test de independencia ......................................................................... 252
9.5. PROBLEMAS PROPUESTOS ..................................................................... 255
Test de hiptesis ............................................................................................ 256
Tabla de contingencia .................................................................................... 260
Test de ajuste a una distribucin .................................................................... 261
9.6. PROBLEMAS Y CUESTIONES DE EXMENES ......................................... 262

10. ANLISIS DE LA VARIANZA

10.1. ANLISIS DE LA VARIANZA (I). UN FACTOR CONTROLADO................. 271
10.1.1. Generalidades ................................................................................... 271
10.1.2. Modelo terico. Hiptesis del modelo ................................................ 273
10.1.3. Hiptesis nula ................................................................................... 276
10.1.4. Ecuacin fundamental ....................................................................... 277
10.1.5. Test F ................................................................................................ 277
10.1.6. Comparacin de medias. Test L.S.D. (diferencia mnima significativa)
...................................................................................................................... 278
10.2. ANLISIS DE LA VARIANZA (II). DOS FACTORES CONTROLADOS ...... 280
10.2.1. Introduccin. Planes factoriales ......................................................... 280
10.2.2. Anova para dos factores con repeticiones ......................................... 281
10.2.3. Concepto de Interaccin ................................................................... 281
10.2.4. Modelo y supuestos tericos ............................................................. 283
10.2.5. Hiptesis Nulas ................................................................................. 284
10.2.6. Descomposicin de las Sumas de Cuadrados. Test F ...................... 284
10.2.7. Comparacin de Medias. Test L.S.D. ................................................ 284
10.2.8. Validacin del modelo ........................................................................ 287
10.2.9. Igualdad de las varianzas ................................................................... 287
10.2.10. Estimacin de los efectos ................................................................. 288
10.2.11. Predicciones .................................................................................... 289
10.3. PROBLEMAS Y CUESTIONES DE EXAMEN ............................................ 290


11. REGRESIN LINEAL

11.1. HIPTESIS DEL MODELO ..................................................................... 301
11.2. ESTIMACIN DE LOS COEFICIENTES DE REGRESIN ..................... 303
11.3. CONTRASTES DE SIGNIFICACIN DE LOS COEFICIENTES .............. 305
Contenido
-8-
11.4. VALIDACIN DEL MODELO .................................................................. 310
11.5. INTERVALOS DE PREDICCIN ............................................................. 313
11.6. BONDAD DE AJUSTE ............................................................................ 315
11.7. PROBLEMAS Y CUESTIONES DE EXMENES .................................... 317


ANEXO A. Tablas de las principales distribuciones de
probabilidad

DISTRIBUCIN DE POISSON ........................................................................... 328
DISTRIBUCIN NORMAL TIPIFICADA .............................................................. 331
DISTRIBUCIN DE PEARSON ........................................................................ 332
DISTRIBUCIN t de Student ............................................................................. 335
DISTRIBUCIN F de snedecor ........................................................................... 338

BIBLIOGRAFA ......................................................................... 341


1. Introduccin
-9-
1. INTRODUCCIN
Contenido
1.1. LA METODOLOGA ESTADSTICA ............................................................ 9
1.2. EL MTODO CIENTFICO ........................................................................ 12
1.3. SOFTWARE ESTADSTICO ...................................................................... 14
1.4. REDONDEO DE LOS DATOS ................................................................... 15
1.5. ALFABETO GRIEGO ................................................................................. 17


1.1. LA METODOLOGA ESTADSTICA

La estadstica es la ciencia que se ocupa de recoger los datos, analizarlos, resumirlos
e interpretarlos, y todo eso para convertir los datos en informacin, de manera que
nos sirva para tomar buenas decisiones o bien para resolver problemas.
Cuando alguien habla de hacer una estadstica quiere decir que le gustara
saber aspectos como cules son los valores ms frecuentes, cules son el mximo y
el mnimo, cul es la distribucin de sus frecuencias, porcentajes de algunos valores,
la tendencia a lo largo del tiempo o bien hacer predicciones de valores futuros.
La materia prima de la estadstica son los datos, y estos se pueden obtener de
tres maneras:

1) De datos histricos: a partir de los registros, formularios, facturas, etc. Por
ejemplo, ventas de un determinado producto.
2) Datos experimentales: se hacen pruebas para ver cmo funciona un
proceso. Por ejemplo, qu relacin hay entre el rendimiento y la temperatura
de un proceso.
3) A partir de encuestas: es muy comn intentar conocer a una poblacin a
partir de una pequea parte de la misma elegida al azar. Por ejemplo, para
conocer las opiniones de los alumnos de la UPV, en lugar de preguntar a los
37000 ms de alumnos, es ms econmico preguntar a una parte
representativa de la poblacin a estudiar.

Esta tercera forma se la que vamos a seguir en primer lugar en el inicio de
esta materia en la ETSII.

Un ejemplo de encuesta es la que se muestra a continuacin:
1. Introduccin
-10-



Los pasos que seguimos son:

EL OBJETO DE ESTA ENCUESTA ES OBTENER DATOS PARA LA REALIZACIN DE EJERCICIOS EN LAS CLASE DE
ESTADSTICA.

Pregunta 1. Indique su peso en kgs.

[________]

Pregunta 2. Indique su altura en cms.

[________]

Pregunta 3. Qu medios de transporte emplea para venir a la UPV?

1. Coche propio
2. Coche compartido
3. Bus
4. Metro o tranva
5. Bicicleta
6. Andando
7. Tren
8. Moto
9. Otro

Pregunta 4. Tiempo diario dedicado al estudio, en horas, de lunes a viernes

[________]

Pregunta 5. Tiempo dedicado al estudio durante el fin de semana (sbado y domingo), en horas.

[________]

Pregunta 6. Tiempo que tarda en llegar al Politcnico por las maanas, en minutos.

[________]

Pregunta 7. Qu deportes practica en la UPV?

1. Ftbol
2. Ftbol sala
3. Baloncesto
4. Tenis
5. Natacin
6. Bici
7. Gimnasia
8. Artes marciales
9. Vela
10. Marcha
11. Montaismo
12. Otros

Pregunta 8. Nota de entrada en la Universidad

[________]

Pregunta 9. Dispone de conexin a internet desde casa?

1. Si
2. No

Pregunta 10. En general, las instalaciones y servicios ofertados por la UPV son,

1. Muy malos
2. Malos
3. Regular
4. Buenos
5. Muy buenos

Pregunta 11. Edad.

[________]

Pregunta 12. Sexo.

1. Hombre
2. Mujer MUCHAS GRACIAS POR SU COLABORACIN
1. Introduccin
-11-
1) Repartir el cuestionario a los alumnos y cumplimentarlo.
2) Introducir los datos al ordenador. Para esto podemos desarrollar un programa
de captura de los datos aprovechando el Access de Microsoft, o mejor un
programa que est preparado por la captura de los datos de los encuestas,
como puede ser el DYANE 4.
3) Una vez introducido los datos, hay que revisarlos por si hay alguien error o
valor raro que no fuera correcto.
4) Hacer anlisis descriptivos de los datos:
a) Resumen de todos los valores,
b) Resumen en forma grfica.
5) Contestar a varias preguntas, aplicando la metodologa estadstica pertinente.

Ejemplos de preguntas puede ser:

a) Cul es la nota media de acceso a la Universidad?
b) Cul es la proporcin de alumnos que cogen la bici para venir al Poli?
c) Cul distribucin de edades que hay en la clase?
d) Cul es la relacin que hay entre el peso y la altura de los alumnos?
e) La altura de los alumnos es diferente si es chico o chica?
f) etc.

La metodologa estadstica que aplican se resume en la figura siguiente

1. Introduccin
-12-
Metodologa
estadstica
Recogida
de los datos
Organizacin y
representacin
Estadstica
predictiva
Descriptiva
Inferencia
estadstica
Distribucin de
frecuencias
Histogramas
Tendencia central
Dispersin
Pruebas de hiptesis
Analisis de la
variancia
Diseo de
Experimentos
Anlisis de
correlacin
Analisis de
regressin
Estimacin
Modelos
Clculo de
probabilidades
Variable
aleatoria
Distribuciones


Figura 1. 1. La metodologa estadstica

La inferencia estadstica se el proceso de conocer las propiedades de una poblacin
a partir de una muestra representativa de la misma.
La Estadstica tiene su fundamento en el clculo de probabilidades.

1.2. EL MTODO CIENTFICO

La Estadstica utiliza el mtodo cientfico para desarrollar sus teoras. El mtodo
cientfico se basa en observar la naturaleza y formular una hiptesis de su
funcionamiento, y segn esta teora se producirn una serie de consecuencias. Si lo
que observamos no est en contradiccin con estas consecuencias, aceptamos la
hiptesis inicial. sta es aceptada hasta que encontramos una prueba que lo
invalida, y entonces debemos formular otra hiptesis y empezar de nuevo el proceso.

En la estadstica las etapas que seguimos se muestran en la Figura 1.2.:

1. Introduccin
-13-
Planteamiento del
problema
Formulacin del
modelo
Recogida de los
datos
Estimacin de los
parmetros
Hiptesis del
modelo
Es vlido?
Prediccin y
control
SI
NO


Figura 1. 2. El mtodo cientfico

Por ejemplo, queremos ver la prediccin del peso de una persona sabiendo su
altura. Se trata de un problema de regresin y el proceso que seguimos es parecido
al de la figura anterior.

1. Introduccin
-14-
1.3. SOFTWARE ESTADSTICO

Para el tratamiento de los datos es muy interesante disponer de unos programas en
ordenador que nos facilita todo el desarrollo.
Es muy frecuente almacenar los datos con una hoja de EXCEL y a partir de
sta, cualquier software estadstico es capaz de leer la hoja de EXCEL y disponer los
datos para su tratamiento y anlisis.
La misma hoja de EXCEL tiene un complemento de anlisis de los datos. La
ventaja es que en cualquier empresa podemos disponer de la EXCEL y hacer un
anlisis bsico de los datos. Adems, uno mismo puede desarrollar programas
especficos por el tratamiento de los datos haciendo uso de los macros y del
VisualBasic que lleva incorporado el EXCEL.
El software que vamos a utilizar en esta materia es:
1. Statgraphics para Windows. El que damos en las prcticas de estadstica es la
versin 5.1 en ingls. En la UPVNET, dentro de los programas cientficos,
hay disponible la ltima versin del Statgraphics que se denomina Centurion,
y sta la podemos poner en ingls o en castellano.
2. EXCEL. Empleamos las funciones estadsticas o bien los complementos que
lleva la propia EXCEL. Es interesante cargar el complemento de Anlisis de
Datos, y tambin se pueden emplear las tablas dinmicas para extraer
informacin de un conjunto de datos.
3. DYANE 4. Es un programa muy til para el anlisis de las encuestas. Se
puede utilizar por la grabacin de los datos y despus hacer la exportacin a
un fichero en formato txt y pasarlo a formato de EXCEL.
4. MATHCAD 2000. Este software utilizamos para hacer los clculos
matemticos, pero tambin lleva todas las funciones estadsticas.
5. Lenguaje R. Es un programa de libre distribucin que se puede descargar de
http://cran.r-project.org. Es muy interesante, sobre todo para principiantes, el
cargar la librera Rcmdr. De esta forma no hace falta saberse los comandos
del R, ya que se presenta con mens como si fuera el Statgraphics.

Otro software estadstico muy bueno y que est disponible para toda la
comunidad de la UPV es el SPSS. Se lanza accediendo a UPVNET y a la carpeta de
programas cientficos. La nica limitacin es el nmero de usuarios que estn
utilizndolo al mismo tiempo. Eso depende de las licencias que haya contratado la
UPV.
Programas estadsticos adicionales son:
1. SAS. Dicen que es el mejor, pero tambin el ms caro.
1. Introduccin
-15-
2. BMDP. Fue el primero que haba y estaba programado en Fortran.
Actualmente hay una versin por Windows y an hay gente que le utiliza.
3. MINITAB. Este programa lo utilizan muchas empresas para sus clculos
estadsticos.

Actualmente todas las calculadoras cientficas disponen de las funciones
estadsticas ms bsicas. Es importante leer las instrucciones de las calculadoras
para utilizar esas funciones. Muchas veces hemos perdido el manual de la
calculadora, pero se puede obtener una copia accediendo a la WEB.

1.4. REDONDEO DE LOS DATOS

La estadstica hace mucho uso de clculos a partir de los datos. Por eso es
importante tener en cuenta las siguientes reglas por el redondeo de los datos:
Cifras significativas:
1. La primera cifra significativa es el 1er dgito a partir de la izquierda que
es diferente de 0.
2. Cifras significativas es el nmero de dgitos contados a partir de la
primera incluida.
Ejemplos: 34,5 tiene 3 cifras significativas; 3,450 tiene 4 cifras
significativas; 0,0023 tiene 2 cifras significativas; 0,00230 tiene 3
cifras significativas.
Redondeo de un nmero que est justo a la mitad del intervalo: la regla que
se solo seguir es redondear el nmero par ms prximo que antecede al 5.
Las mquinas redondean hacia arriba a partir del 5. Ejemplos: 33,45 se
redondea a 33,4; 33,35 podra redondearse a 33,4 33,3; pero est ms
prximo el valor de 33,4. Si fuera 33,445 se redondea a 33,4, ya que tiene
menos distancia al valor de 33,4.

Cifras significativas en la presentacin de datos: se sigue la regla de los 2
dgitos de variacin. Ejemplo, si los datos son: 4,562 ; 4,673 ; 4,726; 4,364 ;
4,891; se pueden representar como: 4,56; 4,67; 4,73; 4,36; 4,89

Cifras significativas de una probabilidad: 3 cifras (o bien 4). Ejemplo:
Probabilidad de que llueva el fin de semana se del 10,5% 0,105; o bien
10,54 0,1054.
Decimales para el clculo de parmetros: Ejemplo de datos originales 3,4; 3,5;
3,1; 3,3; 3,9; 3,5; 3,5

1. Introduccin
-16-
3. Media aritmtica: 1 cifra ms. Ejemplo: 3,46
4. Desviacin tpica: 1 cifra ms. Ejemplo: 0,24
5. Variancia: 2 cifras ms. Ejemplo: 0,0595 bien 0,060
6. Recorrido: mismas cifras. Ejemplo: 0,8
7. Modo: mismas cifras. Ejemplo 3,5
8. Coeficiente de variacin: 3 cifras. Ejemplo: 7,06% bien 0,0706
9. Coeficiente de correlacin: 2 cifras. Ejemplo: r=0,23 y la R cuadrado
es 0,23^2=5,29%
10. Coeficientes de regresin: y=a+bx. Por ejemplo, si y tiene dos
decimales, cada uno de los sumandos debe tener como mnimo 3
decimales. As a se expresar con 3 decimales, y b, en caso de
que x tenga valores hasta 100, debe estar expresado en 5 cifras
decimales porque al multiplicar por la cantidad x nos da un nmero
con 3 cifras decimales. Ejemplo: a=1,246; b=0,37152; x=75;
Y=1,246+0,37152*75=1,246+27,864=29,11

Cifras a guardar en los clculos:
1. En los clculos de sumas y restas de nmeros, el resultado final no
tiene ms cifras significativas despus del lugar decimal que el de
con menor nmero de ellas despus de la coma decimal. Ejemplo:
3,32+1,7= 5,0 ; 73,52-63=11,63 si no es exacto; 37,512-24 =
37,512 si 24 es exacto.
2. En los clculos con multiplicacin, divisin y extraccin de races de
nmeros, el resultado final no puede tener ms cifras significativas
que los datos con menor nmero de ellas. Ejemplo 72,34x 5,45 =
394; 1,547/0,032 = 46; (4,89)^0,5 = 2,21; 7,381x40= 295,2 si 40 es
exacto.



1. Introduccin
-17-

1.5. ALFABETO GRIEGO

Debido a la notacin que se emplea en estadstica, es til conocer el alfabeto griego
que exponemos en la siguiente tabla.

Mays. Mins. Nombre Equivalente latino Comentario
A Alfa a Probabilidad
B Beta b Probabilidad
Gamma c
Delta d
psilon e error
Zeta f
Eta
Theta Parmetro poblacional en general
Iota i
Kappa k
Lambda l Parmetro de una exponencial o de
Poisson
Mu m media
Nu n
Xi
Omicron o
Pi p
Rho r
Sigma s Desviacin tpica
Tau t
Upsilon u


Fi v
Chi x
Psi y
Omega z

1. Introduccin
-18-

2. Estadstica Descriptiva
-19-
2. ESTADSTICA DESCRIPTIVA
Contenido
2.1. INTRODUCCIN ........................................................................................... 19
2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL ......................................... 22
2.2.1. Tablas de frecuencias ............................................................................. 23
2.2.2. Histogramas ............................................................................................ 23
2.2.3. Polgono de frecuencias .......................................................................... 25
2.2.4. Diagrama de puntos ................................................................................ 25
2.2.5. Grfico de tartas ...................................................................................... 26
2.2.6. Grfico de Pareto .................................................................................... 26
2.2.7. Medidas de posicin ................................................................................ 27
2.2.8. Medidas de dispersin ............................................................................. 29
2.2.9. Diagrama e tallos y hojas ........................................................................ 31
2.2.10. Diagrama de caja-y-bigotes ................................................................... 32
2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL ........................................... 33
2.3.1. Tablas de frecuencia de doble entrada .................................................... 33
2.3.2. Frecuencias marginales........................................................................... 36
2.3.3. Frecuencias condicionales ...................................................................... 37
2.3.4. Representaciones grficas de las distribuciones bidimensionales ........... 38
2.3.5. Covarianza muestral ................................................................................ 40
2.3.6. Regresin lineal ....................................................................................... 40
2.4. PROBLEMAS Y CUESTIONES DE EXMENES ........................................... 41


2.1. INTRODUCCIN

Gran parte de la Estadstica trata sobre la recopilacin de datos, anlisis de los
mismos, y la extraccin de conclusiones con objeto de resolver problemas.
Los datos que se presentan en la prctica pueden ser de tres tipos bsicos:
1) Datos cualitativos, que expresan una cualidad del objeto, como puede ser
bueno, malo, o tambin un color, blanco, negro, azul, etc..
2) Datos cuantitativos discretos, que expresan algo que podemos contar,
por ejemplo, nmero de defectos que tiene una pieza mecnica, nmero de
terminales en funcionamiento, nmero de accidentes de coche en una semana, etc..
3) Datos cuantitativos continuos, es decir, pueden medirse sobre una
escala continua y llevan comas decimales, por ejemplo, el dimetro de un eje, tiempo
que tarda una transaccin en ejecutarse, etc...
Decimos que los datos observados corresponden a valores de una variable
que representamos por X. Si disponemos de n datos, se representan por
x
,...,
x
,
x
,
x n 3 2 1

2. Estadstica Descriptiva
-20-
y si son todos los datos de la variable X, se denomina poblacin y se representan por
x
,...,
x
,
x
,
x N 3 2 1

La simple enumeracin de estos datos no nos da mucha informacin acerca
del fenmeno que estamos observando, por lo cual siempre se prefiere condensar la
informacin de modo que su interpretacin sea ms sencilla.
La forma de condensacin puede ser grfica o numrica. Para una sola
variable vamos a estudiar los procedimientos ms usuales.
Escala de los datos
Otra clasificacin de los datos se refiere a la escala con que estn medidos. sta
puede ser de cuatro tipos:
a) Escalas No Mtricas (cualitativas)
i. Escala nominal. Cuando la asignacin de los valores es totalmente
arbitraria. Por ejemplo, el cdigo de sexo, 1=hombre; 2=mujer.
ii. Escala ordinal. Cuando la asignacin de los valores guarda una cierta
relacin de importancia, pero las diferencias no tienen sentido. Por
ejemplo, nivel de estudios: 1=Primaria, 2=Secundaria, 3=Bachiller,
4=Graduado.
b) Escalas Mtricas (cuantitativas)
i. Escala de intervalo. Cuando la asignacin guarda un orden de
importancia y la diferencia entre intervalos tiene sentido. Se
caracteriza porque el origen de los datos es arbitrario. Por ejemplo,
grado de acuerdo con una afirmacin, la codificacin puede ser:
1. Totalmente en desacuerdo
2. Ms bien en desacuerdo.
3. Indiferente.
4. Ms bien de acuerdo.
5. Totalmente de acuerdo
Pero la codificacin tambin podra haber sido con los cdigos -2, -1,
0, 1, 2.
ii. Escala de ratio o de razn. Cuando el origen de los datos no es
arbitrario y tiene sentido las operaciones de multiplicacin y de
divisin. Por ejemplo, el peso, la altura, la longitud, etc.


Actividad 2.1.
- En la encuesta que hay en el tema 1, para cada pregunta decir qu
tipo de escala utiliza la codificacin de los datos.


2. Estadstica Descriptiva
-21-
Mtodos estadsticos empleados para analizar la dependencia o la interdependencia
entre los datos observados
TCNICA DE ANLISIS MULTIVARIANTE
A) Relaciones de dependencia
Una variable dependiente/Mltiples
variables dependiente
Mltiples dependientes/mltiples
independientes
1. Anlisis de regresin mltiple
2. Anlisis de regresin logstica
binaria
3. Anlisis de clasificacin mltiple
4. AID (Automatic interaction
detection)
5. CHAID (Chi Square Automatic
Interaction Detection)
6. Anlisis conjunto categrico
7. Anlisis conjunto ordinal
1. Anlisis discriminante multiple
2. Anlisis de correlaciones
cannicas
3. Redes neuronales artificiales
B) Relaciones de interdependencias
Entre variables Entre casos objetos
1. Anlisis de componentes
principales
2. Anlisis factorial de
correspondencias
3. Anlisis multidimensional
1. Anlisis de grupos (anlisis
cluster)

MTODOS DE DEPENDENCIA ENTRE VARIABLES
Mtodo Relacin funcional
Anlisis de
regresin
simple
1 1
X Y =
(mtrica) (mtrica, no mtrica)
Anlisis de
regresin
mltiple
n 2 1 1
X X X Y + + + =
(mtrica) (mtrica, no mtrica)
Anlisis de la
varianza
n 2 1 1
X X X Y + + + =
(mtrica) (no mtrica)
Anlisis
multivariante de
la varianza
n 2 1 m 2 1
X X X Y Y Y + + + = + + +
(mtrica) (no mtrica)
2. Estadstica Descriptiva
-22-
MTODOS DE DEPENDENCIA ENTRE VARIABLES
Mtodo Relacin funcional
Anlisis
discriminante
mltiple
n 2 1 1
X X X Y + + + =
(no mtrica) (mtrica)
Anlisis conjunto
n 2 1 1
X X X Y + + + =
(no mtrica, mtrica) (mtrica)
Correlacin
cannica
n 2 1 m 2 1
X X X Y Y Y + + + = + + +
(mtrica, no mtrica) (mtrica, no mtrica)
Modelo de
ecuaciones
estructurales
n 1 12 11 1
X X X Y + + + =
n 2 22 21 2
X X X Y + + + =
n 3 32 31 3
X X X Y + + + =
(mtrica, no mtrica) (mtrica, no mtrica)


2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL

Si observamos una variable X y disponemos de n datos, en la forma
x
,...,
x
,
x n 2 1
, una
manera sencilla de representarlos es mediante una tabla o un histograma de
frecuencias.
Llamamos "frecuencia absoluta" de un valor, al nmero de veces que aparece
dicho valor. La "frecuencia relativa" es el nmero de veces que aparece el valor
dividido por el nmero total de datos observados. Esto es:
nes observacio de total nmero
aparece que veces de nmero
= relativa Frecuencia
El campo de existencia de una variable es el conjunto de posibles valores que
pueden tomar los datos.

2. Estadstica Descriptiva
-23-
2.2.1. Tablas de frecuencias

Una vez ordenados los datos de menor a mayor y agrupados en intervalos, se puede
formar la siguiente tabla de frecuencias,

N
Lmites
del
intervalo
Valor
de
clase
Frecuencia
Frecuencia
relativa
Frecuencia
acumulada
Frecuencia
acumulada
relativa
1
1
n
n
n
1

1
n
n
n
1


2 1
n n +
n
n n
2 1
+


i
i i
b x a s <
i
x
i
n
i
i
f
n
n
=
i 2 1
n n n + + +
n
n n n
i 2 1
+ + +



k
k
n
n
n
k

n 1
Sumas n 1



2.2.2. Histogramas

El histograma de frecuencias divide el campo de existencia de la variable en una
serie de intervalos, que por lo general, son de igual longitud, determinando
exactamente los lmites de cada intervalo.
Para cada intervalo contamos el nmero de datos que pertenecen al mismo, y
en un diagrama X-Y, tomando como eje X la variable, y como ordenadas el nmero
de datos que hay en cada intervalo, representamos unos rectngulos con base igual
2. Estadstica Descriptiva
-24-
a la longitud del intervalo de clase y con altura igual al nmero de datos de dicha
clase.
Con el histograma podemos ver qu intervalos son ms frecuentes que otros.
Para ello es importante el nmero de subdivisiones que hagamos, ya que si son
pocas, no veremos nada, y si son muchas, tampoco. Por lo general, el nmero de
intervalos se sita entre 5 y 20. Tambin est la opcin de tomar como nmero de
intervalos la raz cuadrada del nmero de datos.
Si en lugar de poner como altura de los rectngulos la frecuencia absoluta,
ponemos la frecuencia relativa, se tiene el "histograma de frecuencias relativas", cuya
forma es exactamente la misma que el histograma de frecuencias absolutas, slo que
hay un cambio de escalas en la ordenada.
Al punto medio de cada intervalo se le llama valor de clase y representa a
dicho intervalo.
Si empezando por la izquierda del histograma, vamos acumulando las
frecuencias de los siguientes rectngulos, y los representamos, tendremos una figura
con una serie de rectngulos escalonados. Esta figura recibe el nombre de
"histograma de frecuencias acumuladas", el cual puede ser de frecuencias absolutas
o relativas, segn lo que vayamos acumulando.
Si la variable es discreta, el valor de la clase coincide con el valor discreto,
entonces recurrimos a un "diagrama de barras", colocando encima de cada valor una
barra de longitud igual a la frecuencia del valor. Lo mismo hacemos si las clases
corresponden a valores de una variable cualitativa (tipo de defecto,)

Figura 2. 1 Ejemplo de histograma.


2. Estadstica Descriptiva
-25-
2.2.3. Polgono de frecuencias

Un polgono de frecuencias se obtiene uniendo los puntos medios de la base superior
de cada rectngulo. Al igual que con los histogramas, tendremos cuatro tipos de
polgonos de frecuencias.
Histogram
43 53 63 73 83 93 103
Peso
0
3
6
9
12
15
18
f
r
e
q
u
e
n
c
y

Figura 2. 2 Polgono de frecuencias

2.2.4. Diagrama de puntos

Cuando hay pocos datos se pueden representar con un diagrama de puntos, el cual
se forma haciendo coincidir un punto grueso con cada valor de X que aparece. En
caso de que haya dos iguales, se coloca un punto encima de otro.

Figura 2. 3 Diagrama de puntos

2. Estadstica Descriptiva
-26-
2.2.5. Grfico de tartas
Otra representacin tpica para variables cualitativas es el grfico de tartas o en
crculo, en el cual cada clase se representa por un sector de rea proporcional a su
frecuencia. La frecuencia puede ser absoluta o relativa. En este ltimo caso se
interpreta que el 100% de la tarta se reparte entre las clases existentes.

Figura 2. 4 Grfico de tartas

2.2.6. Grfico de Pareto

El grfico de Pareto es un histograma de frecuencias pero ordenado de mayor
frecuencia a menor frecuencia. De esta forma se intenta destacar el hecho de que
unas pocas clases representan casi el total de los datos aparecidos. Esto recibe el
nombre de la ley del 20-80%, que se aplican en distintos aspectos de la economa.


Figura 2. 5 Grfico de Pareto

2. Estadstica Descriptiva
-27-
Adems de dar grficamente la situacin de los valores de una variable X, nos
interesa bsicamente contestar a dos preguntas:
1) Dnde est situada la variable?
2) Cul es su campo de variabilidad?
Para poder realizar comparaciones necesitamos unos valores numricos.
Aquellos que contestan a la primera pregunta se llaman "parmetros de posicin", y
los de la segunda pregunta, "parmetros de dispersin".

2.2.7. Medidas de posicin

Los parmetros de posicin que vamos a ver son: la media, la mediana, y la moda.
Si de una variable X, tenemos un conjunto de valores
x
,...,
x
,
x n 2 1
, se define la
media como:
n
x
= x
i
n
=1 i


Este valor coincide con la media aritmtica, pero como aqu slo son un parte
de los posibles valores de X, se denomina "media muestral".
Cuando el conjunto de valores de que disponemos son todos los de la
variable X, al conjunto de ellos se denomina "Poblacin", y su media recibe el nombre
de "media poblacional", representndola con el smbolo :
N
x
= m =
i
N
=1 i


La media muestral representa el centro de masas de un histograma, y
corresponde al valor medio que toman los datos.
Es una medida poco robusta, ya que ante la aparicin de un valor anmalo, la
media se ve bastante modificada.
La "mediana" expresa aquel valor que por debajo de l hay 50% de los datos,
y por encima el 50% de los datos. Se representa por X
~
, para una muestra, y el valor
depende de si el nmero de datos es impar o par. Si es impar la mediana coincide
con el valor central, previamente ordenados los valores de menor a mayor, y si es
2. Estadstica Descriptiva
-28-
par, se toma el punto medio de los valores centrales. De aqu que empleemos la
expresin:

impar es n si
2
x
+
x
impar es n si
X
= X
~
1) + ([n/2] (n/2)
)
2
1 + n
(

La "mediana poblacional" se representa por
~
.
La mediana es una medida robusta, esto es, se modifica poco ante la
aparicin de un dato anmalo.
La "moda" es aquel valor de X que se repite ms, es decir, el de ms
frecuencia. Si solamente hay una moda, se denomina "unimodal"; si hay varias, se
llama "multimodal". Vienen a ser los picos que forman un histograma de frecuencias
no acumulado.
En una distribucin simtrica, coinciden los tres parmetros, pero si hay una
cola hacia la derecha, lo que se llama "asimetra positiva", ocurre que:
moda < mediana < media
f(x)
moda
mediana
media
Asimtrica positiva
s
x
~
x
Pearson . Asim . Coef

=

y si la cola es hacia la izquierda, es "asimetra negativa", y ocurre que
moda > mediana > media
2. Estadstica Descriptiva
-29-
f(x)
x
moda
mediana
media
Asimtrica negativa
s
x
~
x
Pearson . Asim . Coef

=

Se define el "percentil p%" como aqul valor de X que deja a su izquierda un
p% de los datos. Si p = 25%, se le llama "primer cuartil" Q
1
, si p= 50%, es el
"segundo cuartil " Q
2
, que coincide con la mediana, y para p=75% es el "tercer
cuartil" Q
3
. Los cuartiles dividen a los datos en 4 partes con igual nmero de ellos.
f(x)
x
25%
25%
25% 25%
Q1
Q2 Q3
CUARTILES


2.2.8. Medidas de dispersin

Las principales medidas que empleamos son: la varianza, la desviacin tpica, el
rango, y el coeficiente de variacin.
La varianza poblacional se representa por
o
2
, y se define con todos los datos
de la poblacin:
2. Estadstica Descriptiva
-30-
N
) -
x
(
=
2
i
N
=1 i 2

o


Para el conjunto de valores
x
,...,
x
,
x
,
x n 3 2 1
de la variable X, la "varianza" es:
1 - n
) x -
x
(
=
s
2
i
n
1 = i 2


Dicho valor nos sirve para hacer estimaciones de la varianza poblacional y recibe el
nombre de "cuasivarianza o varianza muestral corregida:
La varianza es una medida cuyas unidades estn al cuadrado. Para hacerlas
homogneas con las unidades de los datos y de la media se define la "desviacin
tpica muestral" como la raz cuadrada con signo positivo de la varianza muestral.
As:
s
+ = s
2

Cuanto mayor es la varianza, mayor es la dispersin de los datos.
Otra idea de la variabilidad de los datos la proporciona el "recorrido", que se
define como la diferencia entre el mximo y el mnimo de los valores observados. Se
expresa como:
x
-
x
= R
min ax m

Si n=2 la informacin que dan R y
s
2
acerca de la dispersin de los datos es
la misma, ya que utilizan los mismos datos, pero para n=3, R ya no emplea uno de
ellos, pero an es una buena aproximacin. Para n>10, el rango ya no es til para ver
la dispersin de los datos, y entonces se preferir el empleo de
s
2
.
El "coeficiente de variacin" es una medida adimensional de la dispersin, se
define como el cociente entre la desviacin tpica y la media, esto es:
100
x
s
= C.V. o bien 100 CV

o
=
y permite comparar la dispersin de dos conjuntos de datos.
As, por ejemplo, dos grupos de datos pueden tener la misma dispersin, sea
s=1, pero si la media de uno es de 10, y la del otro de 1000, lgicamente hay mayor
variacin relativa en el primero que en el segundo. Este coeficiente de variacin nos
da una idea de la "precisin" de los datos.
2. Estadstica Descriptiva
-31-
Otras medidas de dispersin son.
- El recorrido intercuartlico: Q
3
-Q
1

- Desviaciones:
i. Media de las desviaciones absolutas respecto a la media:
D
m
=
n
x x
n
1 i
i
=


ii. Mediana de las desviaciones absolutas respecto de la
mediana: MEDA= x
~
x mediana
i


MEDIDA DE ASIMETRA
El coeficiente de asimetra es,
s
/n ) x -
x
(
= g
3
3
1
n
1 = i
1


Si CA = 0 se trata de una distribucin simtrica; si CA<= la distribucin es
asimtrica hacia la izquierda; y si CA>0 la distribucin es asimtrica hacia la derecha.

MEDIDA DEL APLANAMIENTO
El coeficiente de aplanamiento es,
s
/n ) x -
x
(
= g
4
4
i
n
1 = i
2


Si CC=3 tiene el mismo aplanamiento (curtosis) que una campana de Gauss;
si CC>3 la distribucin es ms puntiaguda que la campana de Gauss; y si CC<3, la
distribucin es ms plana que la campana de Gauss.

2.2.9. Diagrama e tallos y hojas

El histograma de frecuencias es una buena herramienta para identificar la forma,
posicin y dispersin de los datos, pero hay una prdida de informacin, ya que los
datos individuales se pierden al representarlos en un grfico de rectngulos. Para ello
se emplean otros mtodos que dan la misma idea que el histograma, sin perder la
informacin individual de cada dato.
2. Estadstica Descriptiva
-32-
Se trata de dividir los nmeros en dos partes. La parte de la izquierda, que
llamamos "tallo", y la parte de la derecha, que llamamos "hojas". As el nmero 123,
tenemos el 12, que constituye el tallo, y el 3, que es la hoja. De esta forma para una
misma lnea agrupamos todos los nmeros que tienen el mismo tallo, as, por
ejemplo, para el 128, se agrupa junto al anterior como:
38 | 12
separando el tallo de las hojas mediante una barra vertical. Si tenemos el 115,
aparece otro tallo, y ahora la figura es:
38 | 12
5 | 11

De esta manera no perdemos los datos individuales, a la vez que se va
formando algo parecido a un histograma de frecuencias.
Cuando se quiere subdividir ms las clases, los diez dgitos de la derecha se
van agrupando de dos en dos, formando 5 nuevas clases. As:
Clase * = el 0 y el 1.
Clase T = el 2 y el 3.
Clase F = el 4 y el 5.
Clase S = el 6 y el 7.
Clase . = el 8 y el 9.
Tambin se puede hacer una agrupacin en dos: una del 0 al 4, y otra del 5 al
9.

2.2.10. Diagrama de caja-y-bigotes

Otra forma de representar los datos es mediante un diagrama de una Caja, cuyos
lados vienen dados por el primer cuartil y el tercer cuartil, y en su interior se dibuja el
segundo cuartil, esto es, la mediana. Partiendo de cada lado se dibujan unas lneas
que llegan hasta el 10 percentil, por un lado, y el 90 percentil por el otro. Para datos
extensos, se dibuja el 5 y el 95 percentiles. Concretamente, en el STATGRAPHICS
los bigotes se calculan con una longitud de 1,5 veces la anchura del rectngulo, y los
extiende hasta el ltimo punto que est dentro del bigote. De esta forma aquellos
puntos que quedan fuera de los bigotes, se consideran puntos anmalos, esto es,
puntos que posiblemente no pertenecen a la distribucin considerada.
2. Estadstica Descriptiva
-33-
La anchura de la Caja contiene el 50% de los datos, lo cual da una idea de la
dispersin, y la posicin de la mediana, junto con la longitud de los bigotes nos da
una idea de la simetra o no de los datos.
Este diagrama es muy til para comparar dos grupos de datos y observar de
forma grfica si hay diferencia o no entre ellos.
Box-and-Whisker Plot
45 55 65 75 85
Peso

Figura 2. 6 Diagrama de Caja y bigotes


2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL
2.3.1. Tablas de frecuencia de doble entrada

Cuando para cada elemento de la poblacin, o bien para cada unidad de estudio, se
observan dos caractersticas, y clasificamos cada unidad segn las dos
caractersticas, asignndola a una de las celdillas que resultan de dividir cada
caracterstica en un conjunto de intervalos, y contamos el nmero de unidades que
resultan en cada celdilla, se tiene una tabla de doble entrada o tambin se llama una
tabla de contingencia.
Como ejemplos tenemos:
- De cada alumno de una clase tomamos nota de su peso y su altura y lo
clasificamos en su celdilla correspondiente.
- Cada persona se puede clasificar segn que haya tomado o no la vacuna
contra la gripe y segn que haya o no contrado la enfermedad.
2. Estadstica Descriptiva
-34-
- En una fbrica donde hay tres turnos de produccin se cuenta el nmero de
defectos de calidad que hay en los coches producidos y se clasifican stos
en funcin del turno en que han sido producidos(1, 2 3) y del nmero de
defectos que contienen (0, 1, 2, 3 >=4)
Las caractersticas observadas se representan por (X,Y) siendo X la primera
de ellas, por ejemplo el peso, e Y la segunda, por ejemplo la altura. Para las
unidades observadas 1, 2,..., n tenemos los valores
) y ,
x
( ),..., y ,
x
( ), y ,
x
(
n
n
2
2
1
1
. Estas caractersticas, que tambin llamamos
variables muestrales, pueden ser ambas cualitativas, por ejemplo,
defectuoso- correcto, o tipo de defecto; o ser ambas cuantitativas, caso del
peso-altura, o bien una de ellas cualitativa y la otra cuantitativa, en cuyo
caso se dice que es una variable bidimensional mixta.
Si la primera caracterstica podemos tener I intervalos, los cuales representan
I filas de una matriz, y para la segunda caracterstica tenemos J columnas de una
matriz, entonces se tiene una tabla de doble entrada de la siguiente forma:
Tabla 2.1. Tabla de frecuencias



1

2



j



J

total
1
2

i nij

ni-


I
total n j -

n - -


Donde se tiene la siguiente notacin:
nij
= nmero de elemento en la celdilla ij.
ni-
= nmero de elementos de la fila i.
n j -
= nmero de elementos de la columna j.
n - -
= nmero total de elemento observados.
2. Estadstica Descriptiva
-35-
La frecuencia absoluta de cada celdilla es
nij
y la frecuencia relativa es:
n
n
=
n
n
= ) y ,
x
( f
ij ij
j
i
r
- -

La suma de las frecuencias relativas de todas las casillas es igual a la unidad,
esto es:
1 =
n
n
=
n
n
y
x
f
ij
j i
j
i
r
j i
)= , (


Como ejemplo de una tabla de doble entrada, supongamos que un fabricante
de automviles dispone de tres turnos de fabricacin de coches, y para cada turno
cuenta aquellos coches que han tenido 0 defectos de calidad, 1, 2,3, ms de 4
defectos de calidad. Para un da de produccin ha obtenido la siguiente tabla de
doble entrada


Tabla 2.2. Ejemplo de tabla de frecuencias


nmero de defectos de calidad
0 1 2 3 >=4 Total
turno
A 310 50 30 40 20 450
B 390 40 60 50 10 550
C 220 60 90 10 20 400
Total 920 150 180 100 50 1400

La tabla de frecuencias relativas es:

Tabla 2.3. Tabla de frecuencias relativas


nmero de defectos de calidad
0 1 2 3 >=4 Total
turno
A .221 .036 .021 .029 .014

B .279 .029 .043 .036 .007

C .157 .043 .064 .007 .014

Total

2. Estadstica Descriptiva
-36-

2.3.2. Frecuencias marginales

Si a partir de una tabla de doble entrada solamente queremos estudiar una de las
caractersticas, tomaremos las frecuencias que aparecen en el lado derecho de la
tabla, si deseamos estudiar la primera caracterstica, o bien la fila que el margen de
abajo, si deseamos estudiar las segunda caracterstica. Cada una de esas
frecuencias son las llamadas frecuencias marginales, ya que aparecen justamente
en los mrgenes de las tablas de doble entrada.
As la frecuencia relativa de la clase
xi
es:
n
n
= )
x
( f
i
i
r
- -
-

y la frecuencia relativa de la clase y
j
es:
n
n
= ) y ( f
j
j r
- -
-

Lgicamente se cumple que:
1 =
n
n
=
n
n
x
f
i
i
i
r
i
)= (
- -
- -
- -
-


y
1 =
n
n
=
n
n
y f
.j
j
j r
j
)= (
- -
- -
- -


Por ejemplo la distribucin de frecuencias marginales del nmero de defectos
de calidad es:

2. Estadstica Descriptiva
-37-
Tabla 2.4. Tabla de frecuencias marginales


nmero de defectos de calidad
0 1 2 3 >=4 Total
turno
A

.321
B

.393
C

.286
Total .657 .107 .129 .071 .036


2.3.3. Frecuencias condicionales

En otras situaciones se quiere conocer la distribucin de una variable para un valor
dado de la otra. Por ejemplo, en la tabla de doble entrada para una valor de y
j
se
desea conocer la distribucin de las casillas que aparecen en esa columna. Dicha
distribucin recibe el nombre de distribucin de frecuencias condicionales, y su valor
para cada casilla es:
n
n
= ) y /
x
( f
j
ij
j
i
r
-

Como es lgico, la suma de todas las frecuencias condicionales para ese
valor de y
j
es igual a la unidad.
1 =
n
n
=
n
n
y
x
f
j
j
j
ij
i
j
i
r
i
)= / (
-
-
-



Por ejemplo para el turno B la distribucin de frecuencias condicionales es:
2. Estadstica Descriptiva
-38-
Tabla 2.5. Tabla de frecuencias condicionales


nmero de defectos de calidad
0 1 2 3 >=4 Total
turno
A

B .709 .073 .109 .091 .018 1.000
C

Total


2.3.4. Representaciones grficas de las distribuciones bidimensionales

Cuando se tienen los datos como ) y ,
x
( ),..., y ,
x
( ), y ,
x
(
n
n
2
2
1
1
una forma inmediata de
representacin son unos ejes coordenados en los que cada punto representado
corresponde a un elemento observado con la primera coordenada igual al valor de X
y la segunda coordenada igual al valor de Y. Por ejemplo, si de cada alumno de la
clase se ha observado el peso y la altura, cada punto representa a un alumno.
El inters de estas representaciones se basa en la necesidad de contestar a
las preguntas de:
- Existe una relacin lineal entre las dos caractersticas?
- Cul es el grado de relacin lineal que hay?
- Se puede predecir un valor a partir del otro?
El diagrama que resulta recibe el nombre de diagrama de dispersin. Un
ejemplo de diagrama de dispersin aparece en la Figura 2.7.
2. Estadstica Descriptiva
-39-
Plot of Peso vs Altura
150 160 170 180 190 200
Altura
45
55
65
75
85
P
e
s
o

Figura 2. 7 Grfico de Dispersin

Otra forma de representacin es el histograma en tres dimensiones. Este
consiste en representar en un sistema de ejes X-Y-Z, las celdillas de la tabla de doble
entrada como formando un suelo de baldosas en el plano X-Y, y encima de cada
baldosa, que corresponde con cada casilla, una columna de altura proporcional a la
frecuencia relativa de cada una de ellas. Un ejemplo de histograma en tres
dimensiones es el que aparece en la Figura 2.8.


Figura 2. 8 Histograma en 3 dimensiones


2. Estadstica Descriptiva
-40-
El volumen del edificio que resulta se dice que es igual a la unidad. La
proyeccin de ese edificio sobre el plano X-Z resulta el histograma de frecuencias
relativas de X, y la proyeccin del edificio sobre el plano Y-Z resulta el histograma de
frecuencias relativas de la caracterstica Y.

2.3.5. Covarianza muestral

Mediante el grfico de dispersin o el histograma tridimensional, se puede observar si
hay una relacin lineal entre las variables, es decir, si para valores altos de una de
ellas, la otra tambin toma valores elevados. En este caso la relacin lineal es en
sentido positivo, y grficamente los puntos tienden a situarse alrededor de una recta
de pendiente positiva.
Cuando para valores altos de X se observan valores bajos de Y se dicen que
la relacin lineal es negativa.
Para dar una idea numrica de la relacin lineal entre las dos variables, se
define la covarianza muestral
sxy
como:
) y - y )( x -
x
(
1 n
1
=
s
i
i
i
2
xy


Como
sxy
tiene dimensiones, por ejemplo para (peso, altura) puede ser
kgs.cms, con objeto de tener una medida adimensional, se emplea el coeficiente de
correlacin muestral
rxy
que se define por:
s s
s
=
r
y x
2
xy
xy

rxy
es un valor que siempre est entre -1 y +1. Cunto ms se acerca a la
unidad en valor absoluto, mayor es la relacin lineal que hay entre las dos variables.
Si vale cero, no hay ninguna relacin lineal entre las dos variables

2.3.6. Regresin lineal

Si observamos una relacin lineal entre los valores de X e Y, podemos ajustar un
recta que sea la que minimice, para el conjunto de todos los casos, la suma de
cuadrados entre el valor observado y el predicho por dicha recta.
2. Estadstica Descriptiva
-41-
La ecuacin de la recta de regresin de ajuste por mnimos cuadrados del
valor de Y conocido un valor de x, viene dada por,
) x x (
s
s
r y y
x
y
xy
=
O bien,
) x x (
s
s
y y
2
x
xy
=

2.4. PROBLEMAS Y CUESTIONES DE EXMENES

2.4.1.- En las pruebas de acceso del ltimo ao se seleccionaron al azar 120
alumnos de tres tipos de colegio y se tomaron en cuenta las notas obtenidas por cada
uno de ellos. Con estos datos se defini la variable aleatoria bidimensional (Tipo de
colegio, Calificaciones obtenidas) como muestra la tabla siguiente:

SUSPENSOS APROBADOS NOTABLES SOBRESALIENTES Total
fila
-----------------------------------------------------
PUBLICO | 3 | 15 | 22 | 6 | 46
-----------------------------------------------------
PRIVADO | 3 | 24 | 8 | 5 | 40
-----------------------------------------------------
CONCERTADO | 4 | 8 | 17 | 5 | 34
-----------------------------------------------------
Total columna 10 47 47 16 120

a) Completar la tabla anterior calculando las probabilidades de la distribucin
bidimensional conjunta de la variable (Tipo de colegio, Calificaciones) (0,5
puntos)

b) Completar la tabla siguiente con las distribuciones unidimensionales
marginales de las variables Tipo de colegio y Calificaciones (1 punto)
2. Estadstica Descriptiva
-42-

SUSPENSOS APROBADOS NOTABLES SOBRESALIENTES Total
fila
-----------------------------------------------------
PUBLICO | 3 | 15 | 22 | 6 | 46
-----------------------------------------------------
PRIVADO | 3 | 24 | 8 | 5 | 40
-----------------------------------------------------
CONCERTADO | 4 | 8 | 17 | 5 | 34
-----------------------------------------------------
Total columna 10 47 47 16 120


c) Completar la tabla siguiente con la distribucin condicional de las
calificaciones en los colegios privados (0,5 puntos)

SUSPENSOS APROBADOS NOTABLES SOBRESALIENTES Tot fila
-----------------------------------------------------
PUBLICO | 3 | 15 | 22 | 6 | 46
-----------------------------------------------------
PRIVADO | 3 | 24 | 8 | 5 | 40
-----------------------------------------------------
CONCERTADO | 4 | 8 | 17 | 5 | 34
-----------------------------------------------------
Total columna 10 47 47 16 120
2. Estadstica Descriptiva
-43-
SOLUCIN
Las frecuencias de cada casilla (en porcentaje) son:
SUSPENSOS APROBADOS NOTABLES SOBRESAL. Total
fila
PBLICO 3/120 15/120 22/120 6/120
PRIVADO 3/120 24/120 8/120 5/120
CONCERTADO 4/120 8/120 17/120 5/120
Total columna 120

Las distribuciones marginales (en porcentaje) son:
SUSPENSOS APROBADOS NOTABLES SOBRESAL. Total fila
PBLICO 46/120
PRIVADO 40/120
CONCERTADO 34/120
Total columna 10/120 47/120 47/120 5/120 120


La distribucin condicional de las notas para los colegios privados (en porcentaje) es:
SUSPENSOS APROBADOS NOTABLES SOBRESAL. Total
fila
PBLICO
PRIVADO 3/40 24/40 8/40 5/40 40
CONCERTADO
Total columna


2.4.2.- A partir del diagrama siguiente, que representa los datos de consumo
elctrico mensual entre enero 2010 y junio 2011, elija la respuesta correcta a las
2. Estadstica Descriptiva
-44-
siguientes preguntas:
Box-and-Whisker Plot
Consumo
20 30 40 50 60 70

1. El consumo medio ha sido: (0,25 puntos)
a. 49.4
b. 56.5
c. 43.5


2. El 75% de los meses se consumi: (0,25 puntos)
a. Menos de 56.5 .
b. Ms de 56.5 .
c. Entre 43.5 y 56.5 .


3. El consumo mnimo observado en estos 20 meses fue de: (0,25 puntos)
a. 20 .
b. 39 .
c. 42.5 .

4. La distribucin tiene una asimetra (0,25 puntos)
a. Positiva, porque el tercer cuartil es mayor que el primer cuartil.
b. Negativa, porque el tercer cuartil es mayor que el primer cuartil.
c. Se puede decir que la distribucin es simtrica.



5. El 50% de los meses se consumi: (0,25 puntos)
a. Ms de 56.5 .
b. Menos de 43.5 .
2. Estadstica Descriptiva
-45-
c. Entre 43.5 y 56.5 .
2.4.3.- Una empresa decide realizar un estudio sobre el consumo de un determinado
material, necesario para el proceso de fabricacin que lleva a cabo, en funcin del da
de la semana, en vistas a optimizar su stock semanal del producto y la deteccin de
posibles anomalas. Se han analizado un total de 57 das, de lunes a viernes. Con
estos datos de consumo se realiza el diagrama Box-Whisker mltiple que se muestra
a continuacin:
Lunes
Martes
Mircoles
Jueves
Viernes
Grf ico de Cajas y Bigotes
0 100 200 300 400 500
CONSUMO
D
I
A



2. Estadstica Descriptiva
-46-

A la vista de los diagramas, responder a las siguientes preguntas justificando
convenientemente las respuestas.

1. La mayor dispersin de consumo se produce: (0.25
puntos)
a. Los lunes
b. Los martes
c. Los mircoles
d. Todos tiene la misma dispersin ya que el consumo es independiente
del da

Pues el rango intercuartlico es mayor.

2. La mayor asimetra se presenta: (0.25 puntos)
a. Los jueves y es positiva
b. Los martes y es negativa
c. Los martes y es positiva
d. Los jueves y es negativa

Pues ese da se da la mayor distancia entre la mediana y la media, y
media > mediana.

3. En trminos medios, los das de menor consumo son: (0.25
puntos)
a. Los mircoles
b. Los viernes
c. Los martes
d. No se dispone de datos suficientes

Pues la media es la que est ms a la izquierda de todos los das.

4. Cul de las siguientes afirmaciones es cierta? (0.25
puntos)
a. El 75% de los lunes se consume por encima de 300
b. El 75% de los lunes se consume por debajo de 300
c. El 25% de los mircoles se consume por debajo de 260
d. El 25% de los mircoles se consume por encima de 180

El lmite derecho de la caja de los lunes, que corresponde al tercer
cuartil, est en 300.



3. Probabilidades
-47-
TEMA 3. PROBABILIDADES

Contenido
3.1. INTRODUCCIN ........................................................................................... 47
3.2. PROBABILIDAD ............................................................................................. 48
3.2. ESPACIOS DE PROBABILIDADES ............................................................... 48
3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES ..................................... 52
Probabilizacin de Espacios Muestrales Discretos ............................................ 52
Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria ........ 53
Combinatoria ..................................................................................................... 53
3.5. PROBABILIDAD CONDICIONADA ................................................................ 54
3.6. TEOREMA DE LA INTERSECCIN............................................................... 56
3.7. TEOREMA DE LA PARTICIN TOTAL .......................................................... 56
3.8. SUCESOS INDEPENDIENTES ...................................................................... 57
3.9. TEOREMA DE BAYES ................................................................................... 58
3.10. PROBLEMAS PROPUESTOS ..................................................................... 59
Probabilidad condicional.................................................................................... 61
3.11. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 66



3.1. INTRODUCCIN

El objeto central del Clculo de probabilidades y de la estadstica, lo constituyen los
llamados fenmenos aleatorios. Los fenmenos aleatorios son aquellos fenmenos
reales que se caracterizan por la impredecibilidad de sus resultados y por la llamada
regularidad estadstica.

El clculo de probabilidades se ha desarrollado en situaciones en las cuales
se realiza un experimento y se observa un resultado. Pero dicho resultado no se
puede predecir de antemano con exactitud. A estos experimentos los llamamos
Experimentos Aleatorios. Este concepto tiene otras caractersticas comunes. La
primera de ellas es que no podemos saber de antemano su resultado, a lo sumo
podemos describir un conjunto de posibles resultados. Segundo es que dicho
experimento lo podemos repetir exactamente en las mismas condiciones y el
resultado ser totalmente distinto. No obstante, a medida que el nmero de
repeticiones del experimento va aumentando se presenta un comportamiento
caracterstico de la frecuencia con que aparece cada resultado, que llamamos
"regularidad estadstica"

3. Probabilidades
-48-
Si llamamos n al nmero de repeticiones del experimento aleatorio, v a la
frecuencia absoluta, es decir, al nmero de veces que ocurre un determinado
resultado y a f
r
su frecuencia relativa, tendremos que:
n
= f
r
v


Por definicin de fenmeno aleatorio, cuando n crece f
r
tiende a estabilizarse
alrededor de un cierto valor. Cuando el fenmeno aleatorio tiene esta propiedad,
diremos que posee la caracterstica de la Regularidad Estadstica.

3.2. PROBABILIDAD

Al repetir el experimento aleatorio, se observa que unos resultados aparecen ms
que otros, por lo cual cabe hablar de la posibilidad de que un suceso aparezca ms
veces que otro. Esto es, a cada suceso asociamos una medida de la posibilidad de
que tenga lugar. A esta medida se llama probabilidad de ocurrencia del suceso.

Tres puntos de vista o enfoques de la probabilidad:
- Frecuencialista: la probabilidad de un suceso es el lmite al que tiende la
frecuencia relativa con que se presenta dicho suceso.
- Objetivas: es el grado de evidencia de una proposicin cualquiera.
- Subjetiva: es el grado de creencia personal en la veracidad de una
proposicin.

3.2. ESPACIOS DE PROBABILIDADES


Figura 3. 1 Espacio muestral

E= Espacio muestral
x
x
x
x
x
A
A=suceso compuesto
x=suceso elemental
3. Probabilidades
-49-
Al conjunto de los posibles resultados del experimento aleatorio se denomina
"Espacio muestral". Grficamente lo solemos representar por un crculo, tal como
aparece en la Figura 3. 1.

Si los resultados se pueden contar, o se pueden contabilizar, aunque sea para
un nmero infinito, el espacio muestral es discreto.

Si el espacio muestral es incontable, caso de un nmero real en el intervalo
de la recta real, se dice que el espacio muestral es "continuo".

Ejemplos de espacio muestrales son:

- Nmero de puntos al lanzar un dado (discreto y finito),
- Nmero de accionamiento de un interruptor hasta su fallo (discreto e infinito
numerable),
- Medida del peso de un paquete de arroz (contnuo).

Al espacio muestral lo representamos por la letra E.



Actividad 3.1:
- Cul es el espacio muestral al lanzar un dado?
- Cul es el espacio muestral al lanzar una moneda?
- Cul es el espacio muestral al medir el peso de un paquete de arroz?.



Un suceso A, es cualquier subconjunto contenido en el espacio muestral. Si el
suceso es un posible resultado del experimento aleatorio, lo llamamos "suceso
elemental". Cualquier otro subconjunto se denomina "suceso compuesto".

Otros sucesos que se definen a partir del espacio muestral son:

1) Suceso vaco. El que tericamente nunca va a aparecer. Lo representamos por
| . (ej. Obtener 7 puntos al lanzar un dado normal)

2) Suceso cierto. El que siempre aparece. El suceso E siempre aparece, ya que al
realizar el experimento aleatorio siempre tendr lugar algn resultado del espacio
muestral.

3) Suceso complementario. Dado el suceso E Ae , el complementario A ocurre
cuando no aparece el A.
3. Probabilidades
-50-

4) Sucesos mutuamente excluyentes. Cuando dados dos sucesos
A
,
A 2 1
, si
ocurre uno de ellos no ocurre el otro, es decir, no se pueden dar al mismo
tiempo.

5) Suceso unin. Dados dos sucesos
A
,
A 2 1
, se llama suceso unin
A A 2 1

cuando aparece el
A1
o el
A2
ambos a la vez. Tambin recibe el nombre de
adicin.

6) Suceso interseccin. Dados los sucesos E
A
,
A 2 1
e se llama interseccin
A A 2 1
, cuando sucede
A1
y
A2
a la vez.

Al igual que con el conjunto de nmeros se establecen unas operaciones que
dan lugar a otros nmeros, con los sucesos pertenecientes al espacio muestral, y
mediante operaciones de complementacin, unin e interseccin, dan lugar a otros
sucesos. El conjunto de dichos sucesos se dice que forman una o -lgebra si se
cumplen las dos condiciones siguientes:

1) Si F Ae el suceso A tambin pertenece a F.

2) Si F ,....
A
,
A 2 1
e , el suceso unin infinita tambin pertenece a F.

Recordar las propiedades conmutativas y asociativas de la unin y de la
interseccin, y la propiedad distributiva de cada una de estas operaciones respecto
de la otra.

Realmente la probabilidad es una aplicacin del espacio muestral en la recta
real. Dado un espacio muestral E, y una o -algebra F, decimos que la aplicacin
9 F : P es una probabilidad, si y solo si se cumplen los siguientes axiomas:

1) 0 P(A) F A > e

2) 1 = P(E)

3) )
A
P(
A A A
F; ,....
A
,
A i
i
i j
j i
i 2 1
= ) P( es =

=
e |
A partir de estos axiomas se demuestran las siguientes propiedades:

1) Probabilidad del suceso contrario: P(A) - 1 = ) A P(

2) Probabilidad del suceso vaco: 0 = 1 - 1 = P(E) - 1 = ) P(|
3. Probabilidades
-51-

3) Inclusin. Si P(B) P(A) B, A s c

4) 1 P(A) 0 F, A s s e , ya que cualquier E Ac .

5) Probabilidad de la unin: B) P(A - P(B) + P(A) = B) P(A

Grficamente se observa en la Figura 3. 2.


Figura 3. 2 Unin de sucesos

La demostracin es:

| = B) A ( A y B), A ( A = B A

la probabilidad ser la suma de probabilidades,

B) A P( + P(A) = B) P(A

pero tambin el suceso B se puede poner como

B) A ( B) (A = B

como son conjuntos disjuntos

B) A P( + B) P(A = P(B)

de donde despejando B) A P( queda:

B) P(A - P(B) + P(A) = B) P(A
E= Espacio muestral
B
A
AB
3. Probabilidades
-52-
Como generalizacin de la unin de tres o ms sucesos, tenemos la
expresin general de la unin de sucesos:
C) B P(A + C) P(B - C) P(A - B) P(A - P(C) + P(B) + P(A) = C) B P(A

Observar la correspondencia que hay entre probabilidades y la frecuencia
relativa de un suceso A.

A la tripleta (E,F,P) se denomina espacio probabilstico.



Actividad 3.2:
- Un submarino lanza tres torpedos contra un barco. Cada uno de los torpedos
tiene una probabilidad de 0,7 de alcanzar el barco. Cul es la probabilidad
de hundir el barco?
- Si de una baraja de 40 cartas extraemos 3 al azar, cul es la probabilidad
de que salgan 2 oros?
o Con reposicin,
o Sin reposicin.



3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES

Podemos asimilar, desde un punto de vista mecnico, la probabilidad como la
cantidad de masa de 1 gramo que se reparte en el espacio muestral. De forma que la
probabilidad de un suceso corresponde con la cantidad de masa que incluye dicho
suceso dentro del espacio muestral. Si el espacio muestral es discreto, la cantidad de
masa de un gramo se encuentra repartida en un serie de puntos discretos. Si el
espacio muestral es continuo, la masa se reparte de forma continua en el espacio
muestral, aunque puede haber zonas donde haya ms cantidad de masa que en
otras.

Probabilizacin de Espacios Muestrales Discretos

Cuando el espacio muestral es discreto, cada resultado elemental tiene asignado un
peso, probabilidad, de manera que la suma de pesos elementales debe dar la unidad,
ya que la unin de todos ellos forma el espacio muestral E, y cada suceso elemental
es excluyente respecto a cualquier otro suceso elemental.

Si el espacio muestral discreto es finito y, adems cada uno de los resultados
es igualmente probable, entonces el peso, o probabilidad, que asignamos a cada
3. Probabilidades
-53-
suceso elemental es 1/n de resultados que hay. Pero si es un espacio muestral
discreto infinito pero numerable, como la suma debe dar 1, no puede pesar igual un
resultado que otro, no obstante se debe cumplir que la suma infinita de los pesos
converja a la unidad.

En cualquiera de los casos anteriores, la probabilidad de un suceso
compuesto es la suma de las probabilidades de los resultados individuales que lo
integran.

Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria

Para el caso de un espacio muestral discreto finito y simtrico, esto es, que cada
posible resultado tiene el mismo peso, la probabilidad de un suceso se puede calcular
sumando las probabilidades de los sucesos elementales que incluye, lo cual equivale
a aplicar la regla de:
posibles casos
favorables casos
= A) P(suceso
y para hacer un recuento de casos favorables y casos posibles debemos acudir a la
combinatoria, donde habr que distinguir si influye el orden, variaciones, o no influye
el orden, combinaciones, y dentro de cada uno de ellos, si los elementos se pueden
repetir no. As tenemos el siguiente esquema:

Combinatoria

Variaciones sin repeticin de m elementos tomados de n en n.:
- 1) + n - 2)...(m - 1)(m - m(m =
V n m,

- n! =
Pn


Variaciones con repeticin de m elementos tomados de n en n:
-
m
=
V
n
n m,

- n = ... + + donde
!... !
n!
=
P

,... , n,
| o
| o
| o


Combinaciones sin repeticin de m elementos tomados de n en n:
-
n)! - (m n!
m!
=
n
m
=
C n m,
|
|
.
|

\
|


Combinaciones con repeticin de m elementos tomados de n en n.:

3. Probabilidades
-54-
-
|
|
.
|

\
|
n
1 - n + m
=
C

n m,



La probabilizacin de espacios muestrales contnuos se lleva a cabo mediante
una funcin llamada funcin de densidad.


Actividad 3.3:
- Con las letras a, b, c, d
o Cuntas palabras de 2 letras se pueden formar?
o Cuntas palabras de 3 letras se pueden formar?
o Cuntas palabras de 4 letras se pueden formar?
o Si podemos repetir las letras, cuntas palabras de 2 letras se pueden
tener?
o Si no podemos repetir las letras, cuntas combinaciones de 2 letras
podra obtener?
o Si ahora podemos repetir las letras, Cuntas palabras podemos
obtener?



3.5. PROBABILIDAD CONDICIONADA

Dado un espacio muestral E, si conocemos que ha ocurrido un suceso E Ae , el
espacio muestral realmente se ha reducido ahora a dicho suceso A conocido, con lo
cual las probabilidades de los sucesos pertenecientes a E se modifican de acuerdo
con el conocimiento de A, y entonces el peso de cualquier E Be viene dado por la
parte comn de B con A en relacin al total de A, que en el nuevo espacio muestral
es el suceso cierto.

Si partimos del espacio de probabilidades (E,F,P) y conocemos el suceso
0 P(A) con F, A = e , definimos la probabilidad de suceso C condicionado a que ha
ocurrido el suceso A, como:

P(A)
A) P(B
= P(B/A) = (B)
PA



3. Probabilidades
-55-


Actividad 3.4:
- Al lanzar un dado, cul es la probabilidad de sacar un 2?
- Si antes de mostrar el dado, yo lo veo y digo que es un nmero par, cul es
la probabilidad de que ahora sea el 2?



Esta medida as definida cumple los axiomas de probabilidad, esto es:

1) 0 P(B/A) >

2) 1 = P(A/A)

3) Si /A)
B
P( + /A)
B
P( = /A)
B B
P( ; =
B B 2 1 2 1 2 1
| .

Como es una probabilidad, rene todas las propiedades de la misma, es decir:

1) P(B/A) - 1 = /A) B P( .

2) 0 = /A) P(| .

3) /A)
B
P( /A)
B
P( ,
B B
Si
2 1 2 1
s c .

4) 1 P(B/A) 0 F, B s s e .

5) /A)
B B
P( - /A)
B
P( + /A)
B
P( = /A)
B B
P(
2 1 1 2 1

1


6) La definicin de probabilidad condicional se puede aplicar a la propia probabilidad
condicional:
(B)
P
B) (C
P
= (C/B)
P
A
A
A

B) P(A
C) B P(A
=
P(A)
B) P(A
P(A)
A) B P(C
=




A) P(C/B = P(C/B/A)


3. Probabilidades
-56-
3.6. TEOREMA DE LA INTERSECCIN

La probabilidad de la interseccin de dos sucesos se puede obtener de la propia
definicin de probabilidad condicionada como:
) P(B).P(B/A = ) P(A).P(B/A = B) P(A

Para el caso de ser tres sucesos, la probabilidad de la interseccin es:
B) ).P(C/A P(A).P(B/A = C) B P(A

Lo anterior tambin se aplica a probabilidades condicionales, as:

C) /A P(A/C).P(B = B/C) P(A

Si A y B son independientes tambin lo son los sucesos complementarios, as
como entre todos ellos.


3.7. TEOREMA DE LA PARTICIN TOTAL

Dado un espacio muestral E, recibe el nombre de particin al conjunto de sucesos
A
,....,
A
,
A
,
A n 3 2 1
tales que:

1) | =
A
.....
A A A n 3 2 1
siendo j i =
A A j i
= | , es decir son mutuamente
excluyentes.

2) La unin de dichos sucesos forman el espacio muestral, esto es:
E =
A
,.....,
A A n 2 1


Grficamente se representa en la Figura 3. 3.

Figura 3. 3 Teorema de la particin
E= Espacio muestral
B
A
i
B
A
1
A
2

A
n
A
i

3. Probabilidades
-57-


Si definimos otro suceso B incluido en E, a su vez queda dividido por la
particin efectuada sobre E, de modo que se puede reconstruir B mediante

B)
A
( .... B)
A
( B)
A
( = B
n 2 1


Los conjuntos B
Ai
son mutuamente excluyentes, luego la probabilidad del
suceso B tambin es:

)
A
)P(B/
A
P( = B)
A
P( = P(B)
i i
i
i
i




3.8. SUCESOS INDEPENDIENTES

Dados dos sucesos A y B, se dicen que son independientes, si el que aparezca uno
de ellos no tiene nada que ver ni influye para nada en la aparicin del otro. Es decir,
que la probabilidad de uno de ellos condicionada al la presencia del otro no se ve
modificada. Matemticamente, dos sucesos A y B son independientes si y solo si se
cumple que:
P(A) = P(A/B)

P(B) = P(B/A)

Por la definicin de probabilidad condicional, si A y B son independientes:

P(A) =
P(B)
B) P(A
= P(A/B)


de donde
P(A).P(B) = B) P(A

Todo ello se puede generalizar a ms sucesos, de esta forma si
A
,....
A
,
A n 2 1

son independientes, la probabilidad de la interseccin es el producto de
probabilidades:

)
A
)....P(
A
).P(
A
).P(
A
P( = )
A
.....
A A A
P(
n 3 2 1 n 3 2 1




Actividad 3.5:
- Cul es la probabilidad de que al lanzar dos monedas una sea cara y la otra
cruz?
3. Probabilidades
-58-
- Cul es la probabilidad de que al sacar sin reemplazamiento dos cartas de
una baraja de 40, una de ellas sea oros?
- Cul es la probabilidad de que al sacar 4 cartas haya 2 oros y 1 espada?
- Un temario de oposicin tiene 50 temas. El tribunal elige 3 al azar y tenemos
que elegir uno de ellos. Si nos estudiamos 10 de los 50 temas, cul es la
probabilidad de aprobar?


3.9. TEOREMA DE BAYES

Efectuada una particin sobre el espacio muestral E, y dado el suceso B que est
incluido en E, deseamos calcular la probabilidad condicional de un suceso
Ai
,
sabiendo que ha ocurrido el suceso B. Al suceso B tambin se le llama el efecto, y los
sucesos 1..n) = (i
Ai
expresan las distintas causas que pueden producir el efecto B.
El teorema de Bayes permite calcular la probabilidad de que habindose presentado
el efecto B, sea debido a una de las causas
Ai
.

Para su clculo aplicamos la definicin de probabilidad condicional:
P(B)
B)
A
P(
= /B)
A
P(
i
i



Para el denominador aplicamos la frmula de la probabilidad total, y el
numerador, como B y
Ai
no son independientes, lo podemos expresar como
producto de probabilidades, una de ellas condicional. As se tiene:
)
A
)P(B/
A
P(
)
A
).P(B/
A
P(
=
B)
A
P(
B)
A
P(
= /B)
A
P(
i i
i
i i
i
i
i
i



rbol de Bayes

Este tipo de problemas es muy interesante resolverlos mediante el rbol de
Bayes que se muestra a continuacin,
3. Probabilidades
-59-
B
B
) A ( P
1
) A ( P
2
1
A
2
A
) A / B ( P
1
) A / B ( P
2
) A / B ( P ) A ( P ) B A ( P
1 1 1
=
) A / B ( P ) A ( P ) B A ( P
2 2 2
=



Actividad 3.6:
- En la urna U1 hay 2 bolas blancas y 2 negras, y en la urna U2 hay 3
blancas y 1 negra. Tomamos una bola de la urna U1 y la pasamos a la
urna U2. Despus sacamos una bola al azar de la urna 2 que resulta
ser blanca. Cul es la probabilidad de que la bola que haya pasado
de la urna U1 a la urna U2 sea negra?


Actividad 3.7:
- Tres componentes de un sistema estn situados en serie. Si cada uno
de ellos tiene una probabilidad de funcionar del 90%, Cul es la
probabilidad de que funcione todo el sistema?
- Y si los componentes estn situados en paralelo?
- Y si los dos primeros estn en paralelo y la tercero esta en serie?



3.10. PROBLEMAS PROPUESTOS

3.10.1. Se inspeccionan 4 componentes y se definen los siguientes sucesos:

A =" las cuatro componentes son defectuosas"
3. Probabilidades
-60-
B =" exactamente dos componentes funcionan correctamente"
C =" A lo sumo tres componentes son defectuosas"

A qu son equivalentes los siguientes sucesos?

a) BC b) BC c) ACd) AC.

Solucin: a) C b) B c) E d) C


3.10.2. En una ciudad se publican tres peridicos A, B y C. Supongamos que el
60% de las familias de la ciudad estn suscritas al peridico A, el 40% estn
suscritas al peridico B y el 30% al peridico C. Supongamos tambin que el
20% de las familias estn suscritas a los peridicos A y B, el 10% a A y C, el
20% a B y C y el 5% a los tres peridicos A, B y C.

a. Qu porcentaje de familias de la ciudad estn suscritas al menos a
uno de estos tres peridicos?
b. Qu porcentaje de familias de la ciudad estn suscritas nicamente a
uno de los tres peridicos?

Solucin: a) 0.85 b) 0.45.


3.10.3. Cul es la probabilidad de obtener en la lotera primitiva?

a) un pleno,
b) cinco y el complementario,
c) cinco aciertos,
d) cuatro aciertos,
e) tres aciertos.

Solucin: a) 7.15E-8 b) 4.29E-7 c) 1.80E-5 d) 9.68E-4 e) 0.017


3.10.4. Una caja contiene 100 chips, de los cuales 75 funcionan correctamente y
25 son defectuosos. Se seleccionan aleatoriamente 12 chips. Calcular la
probabilidad de que al menos un chip seleccionado sea defectuoso.

Solucin: 0.9751.


3.10.5. Si las letras a,a,e,i,i,c,d,t,t,s,s se ordenan aleatoriamente, cul es la
probabilidad de que formen la palabra "estadistica"?.
3. Probabilidades
-61-

Solucin: 4.008E-7.


3.10.6. Los alumnos que se presentan a este examen realizan 3 actividades
culturales. El 60% de ellos va al cine, el 40% al teatro y el 30% a museos.
Adems el 25% van al cine y al teatro, el 20% al cine y a museos, el 10% a
museos y teatros y el 2% realiza las tres actividades. Qu porcentaje de
alumnos realizan al menos una de las tres actividades?

a) 06700
b) 07900
c) 07500
d) 07700


Probabilidad condicional

3.10.7. Cuatro marcas de ordenadores A, B, C y D presentan una oferta para un
cierto contrato. Un anlisis de los xitos obtenidos anteriormente por estas firmas
en contratos similares nos permite establecer que las probabilidades de llevarse
este contrato para cada una de las marcas son:

P(A) = 0.35 P(B) = 0.15 P(C) = 0.3 P(D) = 0.2

Antes de resolverse el contrato, la firma B retira su oferta. Hallar las nuevas
probabilidades de llevarse el contrato para A, C y D.

Solucin: P(A) = 0.411, P(C) = 0.352, P(D) = 0.235.


3.10.8. Se hizo una encuesta a cien clientes de un almacn, de los cuales
sesenta dijeron que visitaban el almacn por un anuncio del peridico y el resto
no haban visto el anuncio. As mismo, cuarenta clientes hicieron compra, y de
ellos treinta haban visto el anuncio.

a) Cul es la probabilidad de que una persona que no vio el anuncio, hiciera
compra?
b) Cul es la probabilidad de que una persona que vio el anuncio, comprase?

Solucin: a) 1/4 b) 1/2.


3. Probabilidades
-62-
3.10.9. Se dispone de una caja que contiene 5.000 chips, de los cuales 1.000
han sido fabricados por la compaa X y el resto por la compaa Y. El 10% de
los chips fabricados por la compaa X y el 5% de los fabricados por la compaa
Y son defectuosos. Si un chip seleccionado al azar es defectuoso, calcular la
probabilidad de que proceda de la compaa X.

Solucin: 1/3.


3.10.10. Un sistema recibe energa elctrica el 30% del tiempo, energa hidrulica
el 60% y energa mecnica el 10% restante. Cuando funciona elctricamente la
probabilidad de avera es 0.002, cuando lo hace hidrulicamente es 0.001 y
cuando lo hace mecnicamente es 0.05. Hallar la probabilidad de avera.

Solucin: 0.0062.

3.10.11. Una compaa utiliza un test para la contratacin del personal. El test lo
aprueban el 60% de los aspirantes. De los que pasan el test el 80% completan la
formacin. En una prueba, se emple a aquellos aspirantes que no aprobaron el
test. La formacin fue terminada con xito solo por el 50% de este grupo. Si no
se usar ningn test, que porcentaje de aspirantes podra esperarse que
completarn la formacin.

Solucin: 0.68.


3.10.12. Dos cajas contienen cerrojos grandes y cerrojos pequeos. Supongamos
que una caja tiene 60 cerrojos grandes y 40 cerrojos pequeos y que la otra caja
tiene 10 grandes y 20 pequeos. Seleccionamos una caja al azar y extraemos un
cerrojo de la misma. Calcular la probabilidad de que el cerrojo sea grande.

Solucin: 7/15.


3.10.13. Un lote de circuitos contiene un 2% de defectuosos. Cada circuito es
comprobado antes de su uso. El tster no es totalmente fiable ya que la
probabilidad de que el tster indique que un circuito es correcto siendo correcto
es 0.95 y la probabilidad de que el tster indique que es defectuoso siendo
defectuoso es 0.94. Si el tster ha indicado que un circuito es defectuoso, cul
es la probabilidad de que efectivamente sea defectuoso?

Solucin: 0.2772.


3. Probabilidades
-63-
3.10.14. De todos los estudiantes de una universidad, el 70% son mujeres y el
30% son hombres. Si el 20% de las mujeres y el 25% de los hombres fuman.
Determinar la probabilidad de que un estudiante elegido al azar sea:

a) una mujer que fuma,
b) un hombre que fuma,
c) un fumador,
d) siendo fumador sea mujer.

Solucin: a) 0.14 b) 0.075 c) 0.215 d) 0.651.


3.10.15. Un canal de comunicacin binario transporta informacin con dos tipos
de seal representados por 0 y 1. Debido a los ruidos, un 0 transmitido es
recibido a veces como 1 y un 1 transmitido es recibido a veces como 0. Para un
canal dado la probabilidad de que un 0 transmitido sea recibido como 0 es 0.94 y
la probabilidad de que un 1 transmitido sea recibido como 1 es 0.91. Por otra
parte la probabilidad de transmitir un 0 es 0.45. Si se enva una seal, calcular:


a) la probabilidad de que se reciba un 1,
b) la probabilidad de que se reciba un 0,
c) la probabilidad de que se haya transmitido un 1, sabiendo que se ha recibido
un 1,
d) la probabilidad de que se haya transmitido un 0, sabiendo que se ha recibido
un 0.
e) la probabilidad de que haya un error en la transmisin.

Solucin: a) 0.5275 b) 0.4725 c) 0.9488 d) 0.8952 e) 0.0765.


3.10.16. Sea un canal de comunicacin, con tres tipos de seal 1,2 y 3 .Para i
=1,2,3, T
i
es el suceso "el dgito i es transmitido y R
i
es el suceso "el dgito i es
recibido". Sabemos que:

P(R
1
/T
1
)=1- P(R
2
/T
1
)=/2 P(R
3
/T
1
)=/2
P(R
1
/T
2
)=/2 P(R
2
/T
2
)=1- P(R
3
/T
2
)=/2
P(R
1
/T
3
)=t/2 P(R
2
/T
3
)=t/2 P(R
3
/T
3
)=1-t

Sabemos tambin que el 3 se transmite tres veces ms que el 1, y el 2 dos veces
ms que el 1.

a) Si se recibe un 1, cul es la probabilidad de que se haya enviado un 1?.
b) Calcular la probabilidad de que una transmisin sea errnea.
3. Probabilidades
-64-

Solucin: a)(2-2)/(2-2+2+3t) b) (/6)+(/3)+(t/2)


3.10.17. Supongamos dos lneas de fabricacin del mismo producto. La primera
lnea fabrica 20 unidades/hora, de las cuales el 90% son apropiadas para una
segunda operacin. La segunda lnea produce 90 unidades/hora, de las cuales
slo el 20% son apropiadas. Todas las unidades van a un almacn comn. Si al
extraer una pieza al azar, ha resultado ser apropiada, cul es la probabilidad
de que provenga de la primera lnea?

Solucin: 0.5


3.10.18. Por un canal de comunicacin se transmite una de las sucesiones de
letras AAAA, BBBB o CCCC con probabilidades P1, P2 y P3 (P1+P2+P3 =1).
Cada letra transmitida se recibe correctamente con una probabilidad n y cada
una de las otras dos opciones errneas (las otras dos letras) se reciben con
probabilidad (1-n)/2. Se supone que las letras se distorsionan
independientemente unas de otras (incluso dentro de la misma secuencia). Se
pide:

a) Hallar la probabilidad de que se haya transmitido AAAA si se ha recibido
ABCA.
b) Establecer la decisin a tomar al recibir ABCA cuando n=0.7 y P1=P2=1/8.
c) Cul es la probabilidad de que una secuencia recibida contenga al menos un
error?

Solucin: a) 2nP1/(2nP1+(1-n)P2+(1-n)P3) b) La decisin es que sea transmitido
CCCC c) 0.76


3.10.19. El Departamento de Control tcnico (DCT) realiza la clasificacin de los
aparatos fabricados. Cada aparato tiene, independientemente de los dems,
defectos con una probabilidad p. Durante una comprobacin el DCT revela la
existencia de defectos con una probabilidad igual a a. Adems, durante la
comprobacin un aparato en buen estado puede comportarse como defectuoso
con una probabilidad b. Todos los aparatos que en la comprobacin se
comportan incorrectamente son rechazados.

a) Hallar la probabilidad
0
q de que un aparato no desechado tenga defectos y la
probabilidad
1
q de que un aparato desechado tenga defectos.
b) Para qu condiciones
0
q >
1
q ?

3. Probabilidades
-65-
Solucin: a) q
0
=(1-a)p/((1-a)p+(1-b)(1-p)) y q
1
=ap/(ap+b(1 -p)) b) b>a


3.10.20. En los ensayos de cierto equipo se ha determinado que la probabilidad
de buen funcionamiento de un rel, en ausencia de perturbaciones es 0.99,
si slo hay sobrecalentamiento se sita en 0.95, si slo hay vibraciones en 0.9 y
si se dan ambas circunstancias baja a 0.8. Se supone que ambas
perturbaciones se presentan independientemente.

a) Hallar la probabilidad de que el rel falle en un ambiente donde la probabilidad
de sobrecalentamiento es 0.2 y la de vibraciones de 0.1.
b) Sabemos que se ha producido un fallo. Se ha detectado que ha habido
sobrecalentamiento. Cul es la probabilidad de que tambin hayan habido
vibraciones? Y si no se supiera nada sobre el sobrecalentamiento, cul
sera la probabilidad de que hubiera habido vibraciones?
c) Si se trabaja ahora en un entorno donde sobrecalentamiento y vibraciones no
son independientes, sino que, con las probabilidades del apartado a), la
probabilidad de que se den ambas a la vez es 0.05, cul es la probabilidad
de que el rel funcione correctamente?

Solucin: a) 0.0282 b) 0.3077 0.4255 c) 0.97


3.10.21. Si A y B son dos sucesos independientes entonces: (determinar la
respuesta incorrecta)

a) A y B no siempre son independientes.
b) P(A) P(A/B) =
c) ) A P( ) B / A P( =
d) ) A P( /B) A P( =



3.10.22. La probabilidad de que funcione una mquina cuando no existe ni
sobrecalentamiento ni vibraciones es del 99%. Si hay vibraciones y no
sobrecalentamiento, la probabilidad de que funcione es del 95%. Si hay
sobrecalentamiento y no vibraciones, la probabilidad de que funcione es del 90%.
Y si existen vibraciones y sobrecalentamiento a la vez, la probabilidad de que
funcione es del 80%. Calcular la probabilidad de que dicha mquina funcione un
da cualquiera en una fbrica en la cual la probabilidad de que existan
vibraciones es del 20% y la probabilidad de que exista sobrecalentamiento es del
15%.

a) 08965
3. Probabilidades
-66-
b) 09667
c) 09208
d) 08999


3.10.23. Un proceso de fabricacin puede estar ajustado o desajustado. Cuando
est ajustado produce un 1% de piezas defectuosas y cuando est desajustado
un 10%. El proceso est desajustado el 25% del tiempo. En un momento
determinado, se toma una muestra de 10 piezas y no aparece ninguna
defectuosa. Calcular la probabilidad de que est ajustado en ese momento.

a) 0.8582
b) 0.8861
c) 0.9121
d) 0.9362


3.10.24. Dados dos sucesos A y B pertenecientes al mismo espacio muestral E, la
probabilidad de que ocurra A es de 0.85 y la probabilidad de que ocurra B de
0.25. Entonces:

a) A y B son siempre dependientes pero no excluyentes.
b) A y B son siempre mutuamente excluyentes pero no dependientes.
c) B est siempre incluido en A.
d) ninguna de las anteriores es cierta


3.10.25. Existe un test de control de piezas que rechaza piezas buenas un 5% de
las veces y piezas malas un 95%. Se sabe que en un proceso de fabricacin en
el que se aplica este test, la probabilidad de que una pieza que ha sido
rechazada sea buena es del 0.9%. Qu porcentaje de piezas defectuosas se
estn produciendo en dicho proceso?

a) 85.28%
b) 90.32%
c) 14.73%
d) 79.89%


3.11. PROBLEMAS Y CUESTIONES DE EXMENES


3.11.1. Para el siguiente esquema de fiabilidad, donde al lado de cada elemento
3. Probabilidades
-67-
figura la probabilidad de funcionamiento del elemento,
A
B
C
D
E
0,95
0,98
0,87
0,85
0,90


calcular la probabilidad de funcionamiento de todo el sistema. (1 punto)

Solucin cuestin 2:

La probabilidad de funcionamiento del primer grupo es:

99987 , 0 )] 87 , 0 1 )( 98 , 0 1 )( 95 , 0 1 [( 1 )] R 1 )( R 1 )( R 1 [( 1 R
C B A 1 S
= = =

Y la probabilidad de funcionamiento del segundo grupos es:

985 , 0 )] 90 , 0 1 )( 85 , 0 1 [( 1 )] R 1 )( R 1 [( 1 R
E D 2 S
= = =

Y la probabilidad de funcionamiento de todo el sistema es,

9849 , 0 985 , 0 99987 , 0 R R R
2 S 1 S SYS
= = =

3.11.2. El departamento de recursos humanos de una gran empresa tiene
clasificados a sus empleados por grupos de edad. Un total de 220 estn entre 18 y
40 aos, 150 entre 41 y 55 aos y 50 con ms de 56 aos. De los ms jvenes el
20% tienen titulacin superior, el 30% otras titulaciones y el resto no tiene
estudios. El 15% del grupo de edad intermedia tiene titulacin superior, el 40%
otras titulaciones y el resto no tiene estudios. El grupo de mayor edad hay un 2%
con titulacin superior, 20% con otras titulaciones y el resto sin estudios.
a) Cul es la probabilidad de que al seleccionar al azar a un trabajador sea del
grupo de los mayores y no tenga estudios? (0,5 puntos)
b) Cul es la probabilidad de que al elegir al azar un expediente sea de un
titulado superior? (0,5 puntos)
c) Si los expedientes se encuentran ahora agrupados en tres carpetas, una para
cada grupo de edad y se cogen al azar 6 trabajadores de una carpeta tambin
elegida al azar y resulta que solo 2 de ellos no tienen ningn tipo de estudio
Cul es la probabilidad de que la carpeta elegida sea la de los jvenes? (1
punto)
Solucin cuestin 5:
3. Probabilidades
-68-

El rbol de Bayes es,


0
,
2
18-40
41-55
>=56
S
M
SE
S
M
SE
S
M
220/420
150/420
50/420
0,2
0,3
0,5
0,15
0,4
0,45
0,02
0,78
SE
C1
C2
C3
C4
C5
C6
C7
C8
C9


a) La probabilidad de que sea mayor de 56 y sin estudios es justamente el camino 9,
esto es,

0929 , 0 78 , 0
420
50
9 C ) s SinEstudio 56 Edad ( P = = = >
b) La probabilidad de que al elegir uno al azar sea titulado superior es la suma de
los caminos 1, 4 y 7, esto es:

16 , 0 02 , 0
420
50
15 , 0
420
150
2 , 0
420
220
7 4 1 ) ( = + + = + + = C C C Superior P
c) Ahora el rbol de probabilidades es,
3. Probabilidades
-69-
2 de 6 sin estudios (c1)
2 de 6 sin estudios (c2)
2 de 6 sin estudios (c3)
otros
otros
otros
1/3
1/3
1/3
p1
1-p1
p2
1-p2
p3
1-p3
2344 , 0 ) 5 , 0 1 ( 5 , 0
2
6
) 2 ) 5 , 0 ; 6 ( B ( P 1 p
4 2
=
|
|
.
|

\
|
= = =
2780 , 0 ) 45 , 0 1 ( 45 , 0
2
6
) 2 ) 45 , 0 ; 6 ( B ( P 1 p
4 2
=
|
|
.
|

\
|
= = =
0214 , 0 ) 78 , 0 1 ( 78 , 0
2
6
) 2 ) 78 , 0 ; 6 ( B ( P 1 p
4 2
=
|
|
.
|

\
|
= = =
18-40
41-55
>=56


La probabilidad pedida es,

P(jvenes/hay 2 de 6 sin estudios)=
4391 , 0
0214 , 0
3
1
2780 , 0
3
1
2344 , 0
3
1
2344 , 0
3
1
3 C 2 C 1 C
1 C
=
+ +
=
+ +



3.11.3. Un fabricante de motores produce un 20% de defectuosos. El coste es de
5.000 por unidad y el precio de venta es de 10.000 euros. Si el motor es
defectuoso debe devolverse lo cobrado y pagar una indemnizacin de 7.000 .
a) Calcular el beneficio medio por motor si vende todos los motores tal como
salen de fbrica. (1 punto)
b) Se puede hacer una prueba de control de calidad A que cuesta 3.000 . y que
determina con toda seguridad si el motor es o no es defectuoso. Estudiar si es
rentable la prueba. (1 punto)
c) Se puede utilizar una prueba alterativa B, que conduce a conclusiones
errneas en un 5% de los casos. Calcular el precio mximo que puede
pagarse por dicha prueba. (1 punto)
d) En qu porcentaje de los casos en los que la prueba B indique que el motor
es correcto se tendr que pagar indemnizacin. (1 puntos)

NOTA: se asume que cuando la prueba indica que el motor es defectuoso no se
vende el mismo, mientras que si la prueba indica que el motor es correcto, se vende.

a) E(B) = 0.85000 + 0.2(-5000-7000)= 4000 2400 = 1600 euros

b) E(B) = 0.8(5000-3000) + 0.2(-5000-3000)=1600 1600 = 0 euros. Como 0
euros es menos que 1600 euros, NO ES RENTABLE hacer la prueba.

3. Probabilidades
-70-

c)




















E(B)=0.80.95(5000-x)-0.80.05(5000+x)-0.20.95(5000+x)-0.20.05(12000-
x)=1600

Despejando,

2530-x=1600, de donde el precio mximo a pagar por la prueba es 930 euros.

d)

MD=Motor defectuoso
MC=Motor correcto
PC=Prueba correcta


Por el teorema de Bayes,

P(MD/PC)= P(PC/MD)P(MD)/P(PC)=0.050.2/0.77=1.3%

Donde, por el teorema de la probabilidad total,

P(PC)= P(PC/MD)P(D)+P(PC/MC)P(MC)=0.050.2+0.950.8=0.01+0.76=0.77

Motor Correcto

0.8
Motor Defectuoso

0.2
Prueba Correcto
0.95
Prueba
Defectuoso
0.05
Prueba
Defectuoso
0.95
Prueba Correcto
0.05
B=10000-5000-x
B=-5000-x
B=-5000-x
B=-5000-7000-x
3. Probabilidades
-71-

3.11.4. Una empresa electrnica fabrica una placa base para un determinado tipo de
ordenador. Se sabe que el porcentaje de placas base defectuosas de toda la
produccin es del 2%. El coste de fabricacin de cada placa es de 100 y se
vende cada una a 300. Si al instalar en el ordenador se detecta que no funciona
bien, se debe reemplazar por otra que seguro que no es defectuosa, pero cuyo
coste de fabricacin es de 150. La empresa puede realizar un test antes de
venderla, pero este test, cuando la placa es correcta, falla en el 1% de los casos, y
cuando la placa realmente est mal, acierta en el 90% de los casos. Se pide:

a) Sabiendo que el test dice que una placa est bien, calcular la probabilidad de
que dicha placa realmente sea defectuosa. (0,75 puntos)
b) Calcular el porcentaje de veces que se equivoca el test. (0,75 puntos)
c) Si el test resulta positivo, se instala la placa tal y como est (aun pudiendo ser
defectuosa). Si el test resulta negativo, una reparacin de 10 asegura que la
placa estar bien. Cul es el precio mximo que debemos pagar por el test
para que, en promedio, sea rentable?(2 puntos)
d) Si la placa base internamente consta de 10 componentes idnticas e
independientes, que asumimos que estn montados en serie, y un requisito es
que la probabilidad de no fallo de la placa base es del 80%, cul debe ser la
probabilidad de no fallo de cada componente? (0,75 puntos)

Solucin Cuestin 1:


C
D
+
-
+
-
C1
C2
C3
C4
0,98
0,02
0,99
0,01
0,1
0,9

a) 0021 , 0
9722 , 0
002 , 0
1 , 0 02 , 0 99 , 0 98 , 0
1 , 0 02 , 0
3 C 1 C
3 C
) / D ( P = =
+
=
+
= +


b) P(Error)=P(C2+C3)=0,980,01+0,020,1=0,0118. Es decir, el 1,18 % de las veces
se equivoca el test.

c) El beneficio es

3. Probabilidades
-72-
C
D
+
-
+
-
C1
C2
C3
C4
0,98
0,02
0,99
0,01
0,1
0,9
=0,9702
=0,0098
=0,002
=0,018
B1=300-100=200
B2=-100+300-10=190
B3=300-100-150=50
B4=-100+300-10=190



El valor medio del beneficio es,

E(B) = 2000,9702+(190)0,0098+500,002+(190)0,018 = 199,442

Sin hacer el test, el rbol con los beneficios es,

C
D
B1=300-100=200
B2=300-100-150=50


Y el valor medio del beneficio es,

E(B)=0,98200+0,0250=197

El precio mximo del test es 199,332-197=2,442 .

d)

Para que funcione el sistema deben funcionar todos los elementos, por lo que la
probabilidad de funcionamiento del sistema es,

3. Probabilidades
-73-
8 , 0 ) C ( P ) C ( P ) C ( P ) C ( P ) C C C ( P ) S ( P
10
10 2 1 10 2 1
= = = =

De donde 9779 , 0 8 , 0 ) C ( P
10 / 1
= = debe ser la de cada componente.


3.11.5. Los componentes de un determinado producto estn dispuestos segn la
figura de abajo, donde al lado de cada elemento se indica la probabilidad de no
fallo del mismo.
1
2
3
4
5
0,85 0,75
0,93
0,95
?

a) Cul debe ser la probabilidad de no fallo del componente 4 para que en
conjunto la probabilidad de no fallo sea del 90%?
(1.5 puntos)


SOLUCIN:

Llamando de R la probabilidad de no fallo de cada componente, la fiabilidad del
sistema es,
5 4 3 2 1 sys
R )) R 1 )( R 1 ( 1 ))( R 1 )( R 1 ( 1 ( R =

Sustituyendo valores,

95 . 0 )) R 1 ( 25 . 0 1 )( 07 . 0 15 . 0 1 ( 90 . 0
4
=

95 . 0 )) R 1 ( 25 . 0 1 ( 9895 . 0 90 . 0
4
=

9574 . 0 ) R 1 ( 25 . 0 1
4
=
1703 . 0
25 . 0
9574 . 0 1
) R 1 (
4
=

=
De donde la probabilidad de no fallo del componente 4 es 8297 . 0 R
4
=

3.11.6. Para comprobar si un motor elctrico es correcto o defectuoso el
Departamento de Calidad aplica dos pruebas independientes y sucesivas. La
primera prueba tiene una probabilidad de acertar en el diagnstico del 90%, y la
segunda prueba, cuando el motor es correcto acierta el 95% de los casos, pero
cuando el motor es defectuoso se equivoca en el 7% de las veces. Sabiendo que
3. Probabilidades
-74-
la proporcin de motores defectuosos es del 5%, se pide:

a) Si una cualquiera de las pruebas, pero no ambas, dice que el motor es correcto,
qu proporcin de casos realmente ser correcto el motor?
(1 punto)
b) Cul de las dos pruebas tiene mayor probabilidad de error?
(1 punto)


SOLUCIN:
a) El rbol de probabilidades es,

C
D
+
-
+
-
0
.
0
7
+
-
+
-
+
-
+
-
0.95
0.05
0.90
0.10
0.10
0.90
0.95
0.05
0.95
0.05
0.93
0.07
0.093
C1
C2
C3
C4
C5
C6
C7
C8

La probabilidad que nos piden es,
945 . 0
141 . 0
1331 . 0
0032 . 0 0047 . 0 0903 . 0 0428 . 0
0903 . 0 0428 . 0
07 . 0 90 . 0 05 . 0 93 . 0 10 . 0 05 . 0 95 . 0 10 . 0 95 . 0 05 . 0 90 . 0 95 . 0
95 . 0 10 . 0 95 . 0 05 . 0 90 . 0 95 . 0
7 C 6 C 3 C 2 C
3 C 2 C
) 1 / C ( P
= =
+ + +
+
=
=
+ + +
+
=
+ + +
+
= +

b) La probabilidad de error de la primera prueba es del 10%, y la de la segunda
prueba, rbol de probabilidades es,
3. Probabilidades
-75-
C
D
+
-
+
-
0.95
0.05
0.95
0.05
0.07
0.93
C1
C2
C3
C4


La probabilidad de error viene dada por la suma de probabilidades de los caminos 2 y
3. Esto es,
051 . 0 07 . 0 05 . 0 05 . 0 95 . 0 3 C 2 C ) Error ( P = + = + =

Por lo que la prueba 1 es la de mayor probabilidad de error.

3. Probabilidades
-76-

4. Concepto de variable aleatoria
-77-
4. CONCEPTO DE VARIABLE ALEATORIA
Contenido
4.1. DEFINICIN DE VARIABLE ALEATORIA UNIDIMENSIONAL ...................... 77
4.2. FUNCIN DE DISTRIBUCIN ....................................................................... 78
4.3. VARIABLES DISCRETAS .............................................................................. 79
4.4. VARIABLES CONTINUAS ............................................................................. 81
Funcin de densidad ......................................................................................... 81
Transformacin de variables aleatorias ............................................................. 84
4.5. ESPERANZA MATEMTICA ......................................................................... 85
Esperanza matemtica ...................................................................................... 85
Momentos ......................................................................................................... 86
4.6 PARMETROS DE TENDENCIA .................................................................... 88
Valor medio ....................................................................................................... 88
Mediana ............................................................................................................ 89
Cuartiles ............................................................................................................ 89
Moda ................................................................................................................. 90
4.7. VARIANZA. CONCEPTO Y PROPIEDADES ................................................. 90
Desviacin tpica ............................................................................................... 91
4.8. OTROS PARMETROS DE UNA DISTRIBUCIN ........................................ 91
Rango o Recorrido ............................................................................................ 91
Coeficiente de variacin .................................................................................... 92
Coeficiente de asimetra ................................................................................... 92
Coeficiente de apuntamiento o de curtosis ........................................................ 92
4.9. DISTRIBUCIONES BIDIMENSIONALES ....................................................... 93
Concepto ........................................................................................................... 93
Funcin de distribucin ..................................................................................... 94
Funcin de densidad ......................................................................................... 95
Funcin de densidad marginal........................................................................... 96
Funcin de densidad condicional ...................................................................... 98
Independencia de variables aleatorias .............................................................. 99
Esperanza de vectores aleatorios ................................................................... 100
Momentos ....................................................................................................... 101
Matriz de varianzas-covarianzas ..................................................................... 102
Combinacin lineal de variables aleatorias ...................................................... 106
Curva de regresin condicional ....................................................................... 106
Recta de regresin mnimo cuadrtica ............................................................ 107
4.10. PROBLEMAS PROPUESTOS ................................................................... 109
4.11. PROBLEMAS Y CUESTIONES DE EXMENES ....................................... 113

4.1. DEFINICIN DE VARIABLE ALEATORIA UNIDIMENSIONAL

Dado un espacio de probabilidades (E,F,P) vemos que podemos asignar una
probabilidad a cada F Ae , pero en lugar de manejar frases para designar a los
sucesos, es ms cmodo numerizar los posibles resultados del experimento
aleatorio, de esta forma todas las frases se corresponden con nmeros. Estos
4. Concepto de variable aleatoria
-78-
nmeros sern variables y como su resultado es impredecible las llamamos variables
aleatorias.
Ms concretamente, dado un espacio probabilstico (E,F,P) diremos que la
aplicacin
R E : X
es una variable aleatoria unidimensional, si y solo si, la
antiimagen de cualquier intervalo
x] , - =]
I x

pertenece a la sigma-lgebra F. La
representacin grfica de una variable aleatoria aparece en la Figura 4.1
.

Figura 4. 1.Variable aleatoria.

Todos los conjuntos de la forma x] , - ] , ms sus complementarios y los que
se pueden obtener por operaciones de unin e interseccin, forman lo que se llama
un conjunto de Borel en R, y cualquier conjunto est probabilizado, ya que su
antiimagen pertenece a F, el cual est probabilizado por la medida P. Esto es, la
probabilidad asignada a un conjunto de la recta real es la probabilidad de su
antiimagen. As:
x) P(X = x) P(X(e) = )]
I
(
O
P[ = )
I
p(X = )
I
P(
x x x x
s s e
Llamando a )
I
(
O x x
el original por la aplicacin X del conjunto
I x
.

4.2. FUNCIN DE DISTRIBUCIN

Dada una variable aleatoria X, se llama funcin de distribucin de esta variable a la
funcin F(x) definida como sigue:
x) P(X = x) P(X(e) = )
I
P( = F(x) R x
x
s s e
4. Concepto de variable aleatoria
-79-
Esta funcin F(x) tiene las siguientes propiedades:
1) R x e es 1 F(x) 0 s s , pues es una probabilidad.
2) El 1 = F(x)
lim
+ x
.
3) El 0 = F(x)
lim
- x
.
4) La F(a) - F(b) = b]) ]a, P(xe , ya que como b < a se cumple que
b] , - =] b] a]+]a, , - ]
| = b] ]a, a] , - ]
y por el axioma tercera de la probabilidad,
F(a) - F(b) = b) X < P(a s
luego,
b] , - ] P(x = b]) ]a, P(x + a]) , - ] P(x e e e
5) F(x) es no decreciente. De la propiedad anterior:
b) X < P(a + F(a) = F(b) s
6) F(x) es siempre continua por la derecha y si 0 = a) = P(X , tambin es
continua por la izquierda. Si 0 a) = P(X = es discontinua por la izquierda con un salto
igual a a) = P(X .
Una analoga mecnica que resulta til es pensar que la cantidad de masa
(tiza) de 1 gramo se reparte a lo largo de la recta real, y entonces la funcin de
distribucin en un punto se define como la cantidad de masa que existe a su
izquierda, incluyendo dicho punto.

4.3. VARIABLES DISCRETAS

Una variable aleatoria es discreta cuando toma un conjunto finito de valores. Tambin
se llama categrica.
4. Concepto de variable aleatoria
-80-
La cantidad de masa se encuentra almacenada en un conjunto de puntos de
la recta real. La funcin de probabilidad P(x) define la cantidad de masa de cada
punto. La funcin de distribucin tiene unos saltos en los puntos discretos de masa.
Si la v.a. es discreta, la cantidad de masa est repartida en una serie de
puntos discretos de la recta real, cada uno de ellos con 0 )
x
P(
i
= . La funcin de
distribucin es la suma de todas las masas que hay a la izquierda, esto es:
)
x
P( = F(x)
i
x xi

s

La forma grfica es una funcin escalonada donde en cada punto donde
existe la variable, hay un salto igual a la probabilidad en dicho punto.

Actividad 4.1:
- Dibujar la funcin de probabilidad de la variable aleatoria del dado.
- Dibujar la funcin de distribucin de la variable aleatoria del dado.
- Cunto vale P(X=6)?
- Cunto vale F(2,5)?
- Cunto vale F(3)?
- Cunto vale P(X>=5)?
- Cunto vale P(x<5)?
- Calcular la funcin de distribucin de la variable aleatoria suma de puntos al lanzar
dos dados.


Prob. de Evento,Ensayos
0,1,10
Binomial Distribucin
x
p
r
o
b
a
b
i
l
i
d
a
d
0 2 4 6 8 10
0
0,1
0,2
0,3
0,4


Figura 4. 2. Funcin de probabilidad discreta
4. Concepto de variable aleatoria
-81-

Figura 4. 3. Funcin de distribucin discreta

4.4. VARIABLES CONTINUAS

Para una variable continua, la grfica no presenta ningn salto. Se trata del lmite de
la variable aleatoria discreta.

Funcin de densidad

Diremos que X es una v.a. continua, si existe una funcin f(x) no negativa, tal que
para todo a de la recta real se cumple que:
f(x)dx = (a) F
a
-
x
}


Esta funcin f(x) se denomina funcin de densidad.
Tambin decimos que X es continua si la F(x) es continua en todo punto y
derivable respecto de x, excepto a lo sumo en un nmero finito de puntos o
intervalos. La derivada de la funcin de distribucin es la funcin de densidad,
dx
dF(x)
= f(x)
Por la definicin matemtica de derivada, se tiene que:
Prob. de Evento,Ensayos
0,1,10
Binomial Distribucin
x
p
r
o
b
a
b
i
l
i
d
a
d

a
c
u
m
u
l
a
t
i
v
a
0 2 4 6 8 10
0
0,2
0,4
0,6
0,8
1
4. Concepto de variable aleatoria
-82-
x
F(x) - x) + F(x
=
dx
dF(x)
= f(x)
0 x
A
A
A
lim

El numerador del lmite expresa la cantidad de masa que hay en un intervalo
de longitud x A . Cuando 0 x A , el lmite expresa la cantidad de masa que hay
encima de un incremento infinitesimal, esto es, la cantidad de masa por unidad de
longitud, lo que en mecnica recibe el nombre de una densidad, y de ah el nombre
de funcin de densidad para designar f(x) .
Para una variable aleatoria continua, la probabilidad de exactamente un punto
es 0 = a) = P(X , es decir, no hay probabilidad pero si hay densidad de probabilidad
encima del punto.
La cantidad de masa en el intervalo b] =]a, I es:
b) < X P(a = b) X <= P(a = f(x)dx = F(a) - F(b) = b) X < P(a
b
a
s s s
}

Si X es continua, la cantidad de masa en toda la recta real es:
) F(- - ) F(+ = 1 = f(x)dx
+
-

}


la cantidad de masa en un diferencial de longitud es:
f(x)dx
La funcin de densidad se puede tomar como el lmite de un histograma de
frecuencias cuando la base de los rectngulos es infinitesimal.
Para una variable discreta no existe la funcin de densidad, y la funcin que
expresa la cantidad de masa que hay en cada punto la denominamos "funcin de
probabilidad".

Actividad 4.2:
- Si X est distribuida uniformemente entre 1 y 3:
o Cunto vale la funcin de distribucin en un punto cualquiera a?
o Cunto vale la funcin de densidad en un punto cualquiera a?
- Si X est distribuida de forma triangular como se expresa en la figura siguiente,


4. Concepto de variable aleatoria
-83-
0
3
x
f(x)

Figura 4. 4 Distribucin triangular

o Calcular la funcin de densidad y la funcin de distribucin en un punto
cualquiera a
o Cul ser la probabilidad de que un punto est entre 1,5 y 2,5?

- Si X est distribuida de forma triangular como se expresa en la figura siguiente,
0
4
2
x
f(x)

Figura 4. 5 Distribucin en tringulo issceles

o Calcular la funcin de densidad y la funcin de distribucin en un punto
cualquiera a
o Cul ser la probabilidad de que un punto est entre 1,5 y 2,5?


4. Concepto de variable aleatoria
-84-

Figura 4. 6. Funcin de densidad

Figura 4. 7. Funcin de distribucin

Transformacin de variables aleatorias

En muchas ocasiones una variable aleatoria se obtiene como una funcin de
otra variable aleatoria, esto es una transformacin del tipo Y=g(X), y deseamos
conocer la distribucin de la nueva variable aleatoria Y sabiendo la distribucin de X.
Para ello aplicamos la definicin de la funcin de distribucin de Y,
) a Y ( P ) a ( F
y
s =
Y sustituyendo la expresin de Y en funcin de X, tenemos que,
( ) ) a ( g F )) a ( g X ( P ) a ) X ( g ( P ) a Y ( P ) a ( F
1
x
1
y

= s = s = s =
Media
10
Exponencial Distribucin
0 10 20 30 40 50 60
x
0
0,02
0,04
0,06
0,08
0,1
d
e
n
s
i
d
a
d
Media
10
Exponencial Distribucin
0 10 20 30 40 50 60
x
0
0,2
0,4
0,6
0,8
1
p
r
o
b
a
b
i
l
i
d
a
d

a
c
u
m
u
l
a
t
i
v
a
4. Concepto de variable aleatoria
-85-
Una vez conocida la funcin de distribucin de Y, podemos obtener todas las
dems caractersticas de la variable Y.
e
X
Y
Y=g(X(e))
X(e)
Espacio muestral

Figura 4. 8. Transformacin de variables

Por ejemplo, supongamos que el coste de una determinada materia prima
flucta en el mercado segn una funcin de densidad de,
12 x 10 5
2
x
) x ( f s s =
Pero el precio de venta de dicha materia prima es Y=1,3*X+20. La
probabilidad de que el precio de venta sea menor de 34 es,
148 , 0 dx 5
2
x
) 77 , 10 X ( P
)
30 , 1
20 34
X ( P ) 34 20 X 30 , 1 ( P ) 34 Y ( P
77 , 10
10
=
|
.
|

\
|
= s
=

s = s + = s
}


4.5. ESPERANZA MATEMTICA
Esperanza matemtica

Actividad 4.3:
- Un casino plantea el siguiente juego de azar. Se hace una apuesta del resultado de
lanzar un dado. Se lanza una dado, si sale un 1, el casino dar 1000, si sale un 2
un 3, el casino dar 500, y si sale un 4, un 5 un 6, el casino dar 100. Cunto
tendremos que pagar por cada apuesta para participar en el juego?

4. Concepto de variable aleatoria
-86-
Dada la variable aleatoria X y una funcin uniforme g(x) , llamamos Esperanza
matemtica de dicha funcin, a la expresin:
Si la v.a. es discreta, la esperanza matemtica es:
)
x
)P(
x
g( = E[g(x)]
i i
xi


y si la v.a. es continua, es:
g(x)f(x)dx = E[g(x)]
}
+


donde f(x) es la funcin de densidad de una variable aleatoria continua.
El concepto de esperanza matemtica es el valor que cabe esperar de la
funcin g(x), si repetimos el experimento aleatorio hasta el infinito.

Actividad 4.4:
- Calcular el valor medio de la suma de puntos al lanzar dos dados.



La esperanza matemtica es un operador lineal, esto es, sea X una variable aleatoria,
y (x) g y (x) g
2 1
dos funciones uniformes de la misma, entonces la esperanza
matemtica de una combinacin lineal de dichas funciones es:
(x)] g E[ b + (x)] g E[ a = (x)] g b + (x) g E[a
2 1 2 1

La expresin se deduce a partir de la definicin de integral de Rieman-Stieljes.

Momentos

Dada la v.a. X, para el caso particular de que la funcin g(x) sea
x
= g(x)
v
, la
esperanza matemtica de dicha funcin se denomina momento respecto al origen de
orden v , y se escribe:
Si la v.a. es discreta, se tiene:
4. Concepto de variable aleatoria
-87-
) P(
x x
= )
X
E( =
i i
xi
v v
v o


y si la v.a. es continua,
f(x)dx
x
= )
X
E( =
_
v v
v o
}

El primer momento respecto al origen, recibe el nombre de media, o valor
medio, de la v.a. X, y se representa por la letra (griega).
Caso discreto es:
) P(
x x
=
i i
xi


Caso continuo es:
xf(x)dx =
+
-
}


Si la funcin g(x) es ahora ) - (X = g(x)
v
, donde a cada valor de X le hemos
restado su media, es decir hemos centrado la variable, entonces la esperanza
matemtica de dicha funcin se denomina "momento centrado de orden v , y su
expresin es:
Si la v.a. es discreta:
) P(x ) -
x
( = ) - E(X =
i i
xi
v

v
v



y si la v.a. es continua,
f(x)dx ) - (x = ) - E(X =
v
+

v
v

}

donde f(x) es la funcin de densidad, de la v.a. X.
El momento centrado de orden uno es siempre nulo, ya que
0 - = dx ) x ( f - dx ) x ( xf = dx ) x ( )f - (x = ) - E(X =
1
=
} } }
+

+

+


ya que dx ) x ( f
}
+

expresa toda la cantidad de masa que hay en la recta real.
4. Concepto de variable aleatoria
-88-
Todo momento centrado se puede poner en funcin de momentos respecto al
origen, desarrollando el polinomio y tomando valores medios.

4.6 PARMETROS DE TENDENCIA

Valor medio

Ya hemos definido el valor medio como
dx ) x ( xf = E(X) =
+
-
}


y expresa, mecnicamente, el centro de gravedad de la distribucin de masas.
Es una medida "poco robusta", ya que un valor extremo modifica totalmente el
centro de masas. Grficamente se puede asimilar al punto de apoyo de una barra,
donde arriba situamos una serie de pesos, ya sea de forma puntual, caso de v.a.
discreta, o continua, caso de v.a. continua.
Tiene las siguientes propiedades:
1) Si multiplicamos la v.a. por una constante a, el valor medio queda
multiplicado por dicha constante.
a. = E(aX)
2) El valor medio de una constante es la misma constante.
a = E(a)
3) El valor medio de una suma de variables aleatorias es la suma de sus
medias.

n 2 1
n 2 1 n 2 1
... + + = )
X
E( ...+ + )
X
E( + )
X
E( = )
X
...+ +
X
+
X
E(
4) El valor medio de una combinacin lineal de variables aleatorias es la
combinacin lineal de sus medias, esto es:

=
n
n
2
2
1
1
n n 2 2 1 1 n n 2 2 1 1
a
...+ +
a
+
a
=
)
X a
E ...+ + )
X a
E( + )
X a
E( = )
X a
....+ +
X a
+
X a
E(

4. Concepto de variable aleatoria
-89-
Si el espacio muestral es discreto y simtrico, con n elementos,
n
1
= )
x
P(
i
y
el valor medio es

n
=
n
1
= ) P(
x
x x x
= E(x)
i
i
i
i
i i
i




Actividad 4.5:
- Calcular el valor medio de la variable aleatoria nmero de puntos al lanzar un dado.
- Calcular el valor medio de la distribucin uniforme entre a y b.
- Calcular el valor medio de la distribucin triangular.
- Calcular el valor medio de la distribucin exponencial.


Mediana

Expresa el punto por debajo del cual est el 50% de los valores y por encima el 50 %
de los valores. Matemticamente, es aquel valor de x para el cual F(x), la funcin de
distribucin, vale 0,5.
0,5 = )
x
F(
med

A aquel valor de x por debajo del cual hay una cantidad de masa de p%, se le
llama percentil p. De esta forma:
p = )
x
F(
p

La mediana es el percentil 50%.
La mediana es una medida muy robusta, ya que para un valor extremo
apenas se modifica.
Cuartiles
Si la cantidad de masa la dividimos en 4 partes, a cada uno de los puntos de
la divisin se le llama "cuartil". As el "tercer cuartil" es el que tiene por debajo de l
una cantidad de masa del 75%, es decir las 3/4 de los valores de x.

4. Concepto de variable aleatoria
-90-
Moda

Como su nombre indica, es el valor ms frecuente, es decir, el mximo valor de
)
x
P(
i
, para una distribucin discreta, o el valor mximo de la curva f(x). Esta curva
puede tener varios mximos, y entonces la distribucin se denomina "multimodal".

4.7. VARIANZA. CONCEPTO Y PROPIEDADES

Se define como el momento centrado de orden 2, es decir:
2 2 2
) X ( E ) X ( D ) X var( = = = o
Si la v.a. es discreta:
)
x
P( ) -
x
( = ) - E(X =
i
2
i
x
2
2
i

o


y si la v.a. es continua:
f(x)dx ) - (x = ) - E(X =
2
+
-
2
2

o
}


Como todos los valores estn elevados al cuadrado, siempre es una cantidad
positiva. Cuanto mayor sea dicha cantidad, mayor dispersin hay en los datos.
Esta medida tiene las siguientes propiedades:
1) La varianza de una constante es cero.
0 = a) - E(a = (a)
D
2

2) La varianza de una constante por la v.a. X es la constante al cuadrado por
la varianza de la variable aleatoria X.
(X)
D a
= (a.X)
D
2 2 2

(X)
D a
= ) - E(X
a
= ] ) - (X
a
E[ = ) a - E(aX = (aX)
D
2 2
2
x
2
2
x
2
2
x
2

3) La varianza de b + X a es:
(X)
D a
= b) + (aX
D
2 2 2

4) La varianza en funcin de los momentos respecto al origen vale:
4. Concepto de variable aleatoria
-91-
= ) + x 2 -
X
E( = ) - E(X = (X)
D
2
2
2
2

o o

2
1 2
2
2
- = + E(X) 2 - )
X
E( =
( ) E(X) - )
X
E( = (X)
D
2
2 2

Desviacin tpica

La varianza es una medida al cuadrado y por lo tanto no se puede comparar con la
medida X. Para poder hacer comparaciones empleamos la raz cuadrada en signo
positivo de la varianza, a la cual denominamos desviacin tpica, y se expresa por:
o
o
2
+ = var(x) + = D(X) =
Si la desviacin tpica es grande, indica que hay una gran dispersin en los
datos.
Tanto la varianza como la desviacin tpica son medidas poco robustas, ya
que para valores extremos (muy altos o muy bajos) se modifica en gran manera su
valor.

Actividad 4.6
- Calcular la variancia de la variable aleatoria del dado.
- Calcular la variancia de la distribucin uniforme entre a y b.
- Calcular la variancia de la distribucin triangular.
- Calcular la variancia de la distribucin exponencial.



4.8. OTROS PARMETROS DE UNA DISTRIBUCIN
Rango o Recorrido

Otra idea de la dispersin de los datos la indica la diferencia entre el mximo y el
mnimo, a la cual denominamos "Recorrido" o "Rango" de variacin de la v.a. X.
4. Concepto de variable aleatoria
-92-
Coeficiente de variacin

Es el cociente entre la desviacin tpica y la media de la v.a.

o
= C.V.
Sirve para comparar dispersiones de dos distribuciones, cuando stas tienen
diferentes situaciones en la recta real.

Coeficiente de asimetra

Para ver si una distribucin es asimtrica, empleamos el momento centrado de orden
3, ya que si existe simetra respecto de la media, los valores por encima de la media
tienden a compensarse con los valores por debajo de la media, y su valor ser nulo.
De lo contrario, habr un valor + si la asimetra es hacia la derecha de la media, o un
valor "-", si la asimetra es hacia la izquierda.
Pero como son valores al cubo, para que sea una medida adimensional,
dividimos por el cubo de la desviacin tpica. Se representa por
o

3
3
i
N
1 i=
1) - /(N ) x - (x
= CA


Coeficiente de apuntamiento o de curtosis

Para conocer el mayor o menor grado de apuntamiento de la distribucin, se emplea
el momento de orden 4, y para que sea adimensional, lo dividimos por la desviacin
tpica elevada a la cuarta. Se representa por:
o

4
4
i
N
1 i=
1) - /(N ) x - (x
= CC


Si es igual a 3, es el caso estndar, >3, est por encima del caso estndar, y <3 est
por debajo del caso estndar.

4. Concepto de variable aleatoria
-93-

4.9. DISTRIBUCIONES BIDIMENSIONALES
Concepto

Si al realizar un experimento observamos dos o ms valores, por ejemplo, al extraer
una persona al azar podemos anotar el peso, la altura, la edad, etc. Las dos, tres o
ms caractersticas observadas constituyen una variable aleatoria bidimensional o n-
dimensional.
La v.a. bidimensional se define como una aplicacin del espacio muestral en
el plano
R
2
, de manera que a cada punto del espacio muestral le corresponde un
punto en el plano
R
2
.
Al igual que en el caso unidimensional, podemos pensar que la masa de 1
gramo se encuentra ahora repartida en el plano, de manera que para cualquier punto
del plano, la antiimagen del conjunto de puntos del plano,
{ }
x X
,
x X
)/
x
,
x
( =
I 2 2 1 1 2 1 x , x 2 1
s s
es un suceso perteneciente a la o-lgebra F, y por lo tanto, probabilizable.
Si las dos coordenadas son puntos discretos, entonces se dice que la v.a.
bidimensional es discreta, y si ambas son continuas, la v.a. bidimensional es
continua. Puede ser que una sea discreta y la otra continua, en cuyo caso cabe
hablar de v.a. mixtas.
Grficamente se representa en la Figura 4.9

4. Concepto de variable aleatoria
-94-

Figura 4. 9. Definicin de variable aleatoria bidimensional
Funcin de distribucin

Dada una v.a. bidimensional, definimos la funcin de distribucin )
x
,
x
F(
2 1
como
)
I
(e))
X
(e),
X
P(( = )
x X
;
x X
P( = )
x
,
x
F(
x , x 2 1 2 2 1 1 2 1
2 1
e s s
es decir, es la cantidad de masa que existe por debajo y a la izquierda del punto
)
x
,
x
(
2 1
, incluyendo dicho punto.
Esta funcin tiene las siguientes propiedades:
1) 1 )
x
,
x
F( 0
2 1
s s .
2) 0 = )
x
,
x
F(
2 1
- x
lim
1


0 = )
x
,
x
F(
2 1
- x
lim
2


3) 1 = )
x
,
x
F(
2 1
+ x
+ x
lim
2
1



4) La cantidad de masa en el rectngulo de la Figura 4.10 es:

4. Concepto de variable aleatoria
-95-

Figura 4. 10. Funcin de distribucin

)
a
,
a
F( + )
b
,
a
F( - )
b
,
a
F( - )
b
,
b
F( = )
b X
<
a
;
b X
<
a
P(
2 1 1 2 2 1 2 1 2 2 2 1 1 1
s s
5) )
x
,
x
F(
2 1
es siempre continua por la derecha y discontinua por la izquierda
de )
x
,
x
(
2 1
en aquellos puntos de probabilidad no nula.
6) Para v.a. discretas se obtiene sumando todas las masas que hay por
debajo y a la izquierda de punto )
x
,
x
(
2 1
, incluyendo dichos valores.

Funcin de densidad

Si la variable aleatoria es continua, la cantidad de masa que hay por debajo y a la
izquierda del punto )
x
,
x
(
2 1
equivale a calcular el volumen de masa en cada punto, la
de una funcin de punto, a la que llamamos funcin de densidad, de tal forma que:
1 =
x
d
x
)d
x
,
x
f( y 0 )
x
,
x
f(
2 1 2 1
+
-
+
-
2 1
} }

>
La funcin de distribucin se obtiene a partir de la funcin de densidad como:
x
d
x
)d
x
,
x
f( = b) F(a,
2 1 2 1
b
-
a
-
} }


4. Concepto de variable aleatoria
-96-
O tambin por derivacin parcial de la funcin de distribucin, obtenemos la
funcin de densidad:
x x
)
x
,
x
F(
= )
x
,
x
f(
2 1
2 1
2
2 1
c c
c

Como significado fsico, es la cantidad de masa por unidad de superficie.
La cantidad de masa debajo de una rea A viene dada por
x
d
x
)d
x
,
x
f( = A) )
x
,
x
P(
2 1 2 1
A
2 1 }
} e
Para un rectngulo es:
x
d
x
)d
x
,
x
f( = )
b X a
;
b X a
P(
2 1 2 1
b
a
b
a
2 2 2 1 1 1
2
2
1
1
} }
s s s s
Al igual que en el caso unidimensional, cuando la v.a. es continua no existe
cantidad de masa en un punto, pero s que hay densidad encima de l.

Funcin de densidad marginal

Dada la v.a. bidimensional )
X
,
X
(
2 1
con funcin de distribucin )
x
,
x
F(
2 1
, y en el
caso continuo, funcin de densidad )
x
,
x
f(
2 1
, deseamos saber la distribucin de una
de ellas, sin tener en cuenta la otra. A ello se llama distribucin marginal, ya que en
una tabla de doble entrada se calculaba en el margen derecho o en el margen inferior
de la tabla, de ah el trmino de "marginal".
La distribucin marginal de
X1
se obtiene imponiendo la condicin de que
X2
pueda tener cualquier valor entre - y + . As la funcin de distribucin
marginal de
X1
es:
x
d
x
)d
x
,
x
f( = )
x
,
x
F( = )
x
F(
1 2 2 1
+
-
x
-
2 1
+ x
1
1
2
(

} }



lim

y la funcin de densidad marginal es:
x
)d
x
,
x
f( = )
x
f(
2 2 1
+
-
1
}


4. Concepto de variable aleatoria
-97-
Para variables discretas se tiene que la funcin de probabilidad es,
)
x
,
x
P( = )
X
P(
2j 1i
j
1i


Fsicamente, viene a ser la proyeccin de toda la cantidad de masa que haba
en el plano, sobre un solo eje, ya sea el
X1
, o el
X2
.

X1
X2
x1

Figura 4. 11 Distribucin marginal de X
1

Actividad 4.7:
1. Para la siguiente distribucin bidimensional, calcular:
o P(X
1
=1).
o PX
2
=2).
o P(X
1
<=2).
o P(X
1
=2,X
2
=2)


Figura 4. 12 Distribucin marginal de X1


X
1
1 2 3
1
2
X
2
0,28
0,24
0,18
0,15
0,09
0,06
4. Concepto de variable aleatoria
-98-
Funcin de densidad condicional

En otras ocasiones nos interesa conocer, para un determinado valor de la variable,
como se distribuye la otra. Por ejemplo, para aquellas personas que pesan 70 kg.,
cul es la distribucin de sus alturas. A esta distribucin se llama "distribucin
condicional".
Fsicamente equivale a realizar un corte infinitesimal que pasa por el punto
condicionante y paralelo al otro eje. Pero como la cantidad de masa que se toma ya
no vale la unidad, debemos hacer una redistribucin de manera que siga valiendo la
unidad.
La funcin de distribucin se define como el lmite de:
h) +
x X x
P(
h) +
x X x x X
P(
= h) +
x X
<
x
/
x X
P( = )
x
/
x
F(
1 1 1
1 1 1 2 2
0 h
1 1 1 2 2
0 h
1 2
s s
s s s
s s

lim lim

Si la v.a. )
X
,
X
(
2 1
es discreta, la probabilidad condicionada se obtiene
imponiendo la condicin de que la suma de pesos debe ser la unidad, y para ello
nada ms que dividir cada peso )
x
,
x
P(
2 1
por el total, que corresponde a la
distribucin unidimensional. Esto es,
)
x
/
x
)P(
x
P(
)
x
/
x
).P(
x
P(
=
)
x
P(
)
x
/
x
).P(
x
P(
=
)
x
P(
)
x
,
x
P(
= )
x
/
X
P(
2j 1 2j
j
2 1 2
1
2 1 2
1
1 2
1 2


Si la v.a. )
X
,
X
(
2 1
es continua, anlogamente es
x
)d
x
/
x
)f(
x
f(
)
x
/
x
).f(
x
f(
=
)
x
f(
)
x
/
x
)f(
x
f(
=
)
x
f(
)
x
,
x
f(
= )
x
/
x
f(
2 2 1 2
2 1 2
1
2 1 2
1
2 1
1 2
}

cuya expresin es semejante al Teorema de Bayes.
Si la v.a. bidimensional es mixta se tiene en cuenta si la condicionante es
discreta o continua, y si la condicionada es discreta o continua.
Grficamente, y empleando la analoga mecnica, es fcil deducir cada
expresin. Recordar que una v.a. discreta no tiene funcin de densidad. Al pasar de
discretas a continuas, la regla sencilla es que donde pone "P" se cambia a "f", de
funcin de densidad, y donde pone un , se cambia a } .

4. Concepto de variable aleatoria
-99-

X1

X2
x1+h

x1


Figura 4. 13Distribucin condicional de X
2
/x
1

Actividad 4.8:
- Para la siguiente distribucin bidimensional calcular:
o P(X
2
<=1/X
1
=2)
o P(X
2
=1/x
1
<=2)
o P(X
1
<=2/X
2
=2)

Figura 4. 14 Distribucin condicional


Independencia de variables aleatorias

Dada una variable aleatoria bidimensional )
X
,
X
(
2 1
diremos que las v.a. marginales
X
,
X 2 1
son independientes, cuando para cualquier
2
R )
x
,
x
(
2 1
e se cumple que los
sucesos ]
x
, - ]
1
y ]
x
, - ]
2
son independientes, lo cual significa que:
)
x X
).P(
x X
P( = )
x X x X
P(
2 2 1 1 2 2 1 1
s s s s

X
1
1 2 3
1
2
X
2
0,28
0,24
0,18
0,15
0,09
0,06
4. Concepto de variable aleatoria
-100-
Esto equivale a decir que la funcin de distribucin conjunta es igual al
producto
)
x
(
F
).
x
(
F
= )
x
,
x
F(
2 2 1 1 2 1

Si la v.a. es continua, y las marginales son independientes, la funcin de
densidad es el producto de funciones de densidad marginales.
)
x
( f ).
x
( f = )
x
,
x
f(
2
2
1
1
2 1

Tambin se cumple que:
)
x
f( =
)
x
f(
)
x
).f(
x
f(
=
)
x
f(
)
x
,
x
f(
= )
x
/
x
f(
2
1
2 1
1
2 1
1 2

es decir, semejante a la probabilidad condicional.
Si las variables aleatorias marginales no son independientes, la funcin de
densidad conjunta se puede calcular como:
)
x
/
x
).f(
x
f( = )
x
/
x
).f(
x
f( = )
x
,
x
f(
2 1 2 1 2 1 2 1


Esperanza de vectores aleatorios

Dada la v.a. )
X
,
X
(
2 1
y una funcin uniforme )
x
,
x
g(
2 1
se define esperanza
matemtica de dicha funcin, al valor medio que cabe esperar de dicha funcin, al
extraer infinitos valores de la v.a. bidimensional. Su expresin es
Si la v.a. es discreta,
)
x
,
x
)P(
x
,
x
g( = )]
x
,
x
E[g(
2j 1i 2j 1i
j i
2 1


y si la v.a. es continua,
x
d
x
)d
x
,
x
)f(
x
,
x
g( = )]
x
,
x
E[g(
2 1 2 1 2 1
R
2 1
2
}
}
Adems de la propiedad de ser operador lineal, si las variables
X
,
X 2 1
son
independientes y )
x
( g y )
x
( g
2
2
1
1
son funciones uniformes de
X
y
X 2 1
,
respectivamente, entonces el valor medio del producto es el producto de valores
medios:
4. Concepto de variable aleatoria
-101-
)]
x
( g E[ )]
x
( g E[ = )]
x
( g )
x
( g E[
2
2
1
1
2
2
1
1

La media de la suma de v.a., sean varias independientes no, son suma de
valores medios.
Para distribuciones condicionales, el valor medio de una funcin es:
x
)d
x
/
x
( f )
x
g( = )
x
)/
x
E[g(
1 2 1
c
1
+
-
2 1
}


Pudiendo variar los lmites de integracin para cada valor de
x2
.


Momentos

Si la funcin )
x
,
x
g(
2 1
es ahora
x
.
x
= )
x
,
x
g(
v
2
u
1 2 1
, a su esperanza matemtica se le
llama momento respecto al origen de orden u+v, su expresin es:
Si la v.a. es discreta
) , P( .
x x X X
=
2j 1i
v
2j
u
1i
j i
v u,
o

Si la v.a. es continua,
x
d
x
)d
x
,
x
f(
x
.
x 2 1 2 1
v
2
u
1 v u,
} } =
o

Si en la funcin
x x
= )
x
,
x
g(
v
2
u
1 2 1
, a cada valor de 1,2) = (i
Xi
le restamos su
media, su esperanza matemtica recibe el nombre de momento centrado de orden
u+v, y se expresa por
)
x
d
x
d ) x ( f ) -
x
( ) -
x
( = ] ) -
X
.( ) -
X
E[( =
2 1
v
2
2
u
1
1
v
2
2
u
1
1
v u,
} }
Algunos casos particulares son:

o
x
1,0
1
=

o
x
0,1
2
=
0 =
1,0

4. Concepto de variable aleatoria
-102-
0 =
0,1

o

2
x 2,0 1
=
o

2
x 0,2 2
=
Todo momento centrado se puede poner en funcin de los momentos
respecto al origen, desarrollando los polinomios y aplicando el operador valores
medio.

Matriz de varianzas-covarianzas

El momento centrado
11 1,1
= cuya expresin es:
) X , X cov( = ) -
X
)( -
X
E( =
2 1 12
2
2
1
1
11
=
o

recibe el nombre de covarianza y expresa el grado de relacin lineal que existe entre
X
y
X 2 1
. Por ejemplo, si la distribucin de los valores es como la que aparece en la
Figura 4. 15.
I
IV
II
III
X1
X2
1
2

Figura 4. 15. Concepto de covariancia

4. Concepto de variable aleatoria
-103-
X
1
1 2 3
1
2
X
2
0,28
0,24
0,18
0,15
0,09
0,06
0,52 0,33 0,15
0,45
0,55
Tomando como punto de referencia el ) , (
2 1
, centro de gravedad de masas,
y trazando dos rectas paralelas a los ejes coordenados, dividimos el plano en 4
regiones, marcadas con I, II, III y IV. En la regin I todos los valores de
X1
son
mayores que
m1
, a igual que los de
m2
, por lo que los productos ) -
x
)( -
x
(
2
2
1
1

sern positivos. En la regin III, tanto
X1
como
X2
estn por debajo de sus medias,
por lo cual el producto ) -
x
)( -
x
(
2
2
1
1
tambin ser positivo. En cambio en las
regiones II y IV, los productos son negativos. Como se observa en la figura, hay
muchos ms productos positivos que negativos, por lo cual la cantidad
11
ser
positiva, indicando una relacin lineal en sentido positivo, es decir, a medida que
aumenta una componente, aumenta el valor de la otra componente. Si la cantidad
0 <
11
indica que al aumentar una componente tiende a disminuir la otra.
Si 0 =
11
no hay ningn tipo de relacin lineal entre las variables marginales.
Si las variables son independientes 0 =
11
, pero no a la inversa.
La covarianza tambin se puede representar por:



Actividad 4.9:
- Para la siguiente distribucin bidimensional, calcular la covariancia entre X
1
y X
2
.

63 , 1 15 , 0 3 33 , 0 2 52 , 0 1 ) X ( E
1
= + + =

45 , 1 55 , 0 2 45 , 0 1 ) X ( E
2
= + =

)
X
E( )
X
E( - )
X

X
E( = )
X
,
X
cov( = =
2 1 2 1 2 1 12
11
o

4. Concepto de variable aleatoria


-104-
54 , 2 09 , 0 2 3 06 , 0 1 3
18 , 0 2 2 15 , 0 1 2 28 , 0 2 1 24 , 0 1 1 ) X X ( E
2 1
= + +
+ + + =
1765 , 0 45 , 1 63 , 1 54 , 2
) X ( E ) X ( E ) X X ( E ) X , X cov(
2 1 2 1 2 1
= =
=
Figura 4. 16 Covarianza


A la matriz ] [ = V
ij o
siempre que i+j=2, recibe el nombre de matriz de
varianzas-covarianzas. Los elementos de la diagonal son las varianzas de las
distribuciones marginales.

Actividad 4.10:
- Cules son los elementos de una matriz de varianza-covarianzas de 3 variables
aleatorias?




Coeficiente de correlacin
La covarianza es una cantidad al cuadrado, y para que sea adimensional, se divide
por sus desviaciones tpicas, recibiendo el nombre de "coeficiente de correlacin".
)
X
).D(
X
D(
)
X
,
X
cov(
=
2 1
2 1
12


Siempre se cumple que )
X
(
D
).
X
(
D
)
X
,
X
(
cov 2
2
1
2
2 1
2
s

12
es una cantidad que siempre est entre -1 y +1. Si +1 =
12
, hay una
relacin lineal perfecta en sentido positivo entre las variables
X
,
X 2 1
, y si es
negativa, hay una relacin lineal perfecta en sentido negativo.
Si 0 =
12
, significa que no hay correlacin lineal entre las v.a.
X
,
X 2 1
.

La matriz cuyo trmino general es el
ij
se llama matriz de correlacin.


4. Concepto de variable aleatoria
-105-
X
1
1 2 3
1
2
X
2
0,28
0,24
0,18
0,15
0,09
0,06

Actividad 4.11:
- Calcular el coeficiente de correlacin de la distribucin bidimensional siguiente,

-

19 , 3 15 , 0 3 33 , 0 2 52 , 0 1 ) X ( E
2 2 2 2
1
= + + =

( ) 533 , 0 63 , 1 19 , 3 ) X ( E ) X ( E ) X var(
2 2
1
2
1 1
= = =

65 , 2 55 , 0 2 45 , 0 1 ) X ( E
2 2 2
2
= + =

( )
548 , 0 45 , 1 65 , 2
) X ( E ) X ( E ) X var(
2
2
2
2
2 2
= =
=

327 , 0
548 , 0 533 , 0
1765 , 0
) X )var( X var(
) X , X cov(
2 1
2 1
= =
= =

Figura 4. 17 Coeficiente de correlacin


4. Concepto de variable aleatoria
-106-
Combinacin lineal de variables aleatorias

Si la variable aleatoria Y viene dada por una combinacin lineal de las v.a. X
1
, X
2
de
la forma
)
X
(
D a
+ )
X
(
D a
= )
X a X a
(
D 2
2 2
2 1
2 2
1 2 2 1 1
2

El valor medio de la v.a. Y es,
Y Si las v.a. X
1
, X
2
son dependiente, la varianza de una combinacin lineal de
variables aleatorias es:
= )
a
-
a
-
X a
+
X a
E( = )
X a
+
X a
(
D
2
2
2
1
1 2 2 1 1 2 2 1 1
2

= ) ) -
X
(
a
+ ) -
X
(
a
E( =
2
2
2 2
1
1 1

= )] -
x
)( -
x
(
a a
2 + ) -
x
(
a
+ ) -
x
(
a
E[ =
2
2
1
1 2 1
2
2
2
2
2
2
1
1
2
1

= ) -
x
)( -
x
E(
a a
2 +
a
+
a
=
2
2
1
1 2 1
2
2
2
2
2
1
2
1

o o

)
x
,
x
cov(
a a
2 +
a
+
a
=
2 1 2 1
2
2
2
2
2
1
2
1 o o



Actividad 4.12:
- Una variable X
1
tiene de valor medio 4 y desviacin tpica 2. Otra variable aleatoria X
2

tiene un valor medio de 3 y una desviacin tpica de 1, y la covariancia que hay entre
las dos variables se de 1,8. Calcular la variancia de la nueva variable aleatoria
Y=2X
1
-X
2
.


Curva de regresin condicional

Dada una distribucin bidimensional ) , (
2 1
x x ,se define la curva de regresin
condicional de
1 2
/ x x , como el lugar geomtrico de los puntos medios de las
distribuciones condicionales de
1 2
/ x x . Se expresin matemtica es:
}
+

= = ) ( ) / ( ) / (
1 2 1 2 2 1 2
x h dx x x f x x x E
c

4. Concepto de variable aleatoria
-107-
X
1
1 2 3
1
2
X
2
0,28
0,24
0,18
0,15
0,09
0,06
Esta curva h(x
1
) es la que minimiza los errores de prediccin de
2
x conocido
1
x . Se expresa tambin como ) (
1 2
x h x = .
De forma anloga se obtendra la curva de regresin condicional de
2 1
/ x x ,
sin ms que intercambiar los subndices.

Actividad 4.12:
- Calcular el E(X
2
/X
1
=2) para la siguiente distribucin bidimensional.


54 , 1
18 , 0 15 , 0
18 , 0
2
18 , 0 15 , 0
15 , 0
1
) 2 x / x ( P x ) 2 x / X ( E
i 2
x
1 i 2 i 2 1 2
=
+
+
+
=
= = =


Figura 4. 18 Esperanza condicional



Recta de regresin mnimo cuadrtica

Si en lugar de una curva queremos encontrar la recta que minimiza la suma de los
cuadrados de los errores de prediccin de
2
x conocido
1
x , se tiene la recta de
regresin mnimo cuadrtica. Esta recta viene dada por
) x (
) x , x cov(
x
1 1
2
1
2 1
2 2

o
+ =
4. Concepto de variable aleatoria
-108-
De forma anloga se obtiene la recta de regresin mnimo cuadrtica de
2 1
/ x x .

Actividad 4.13:
- Calcular la recta de regresin mnima-cuadrtica de la siguiente distribucin
bidimensional:

) 63 , 1 x (
533 , 0
1765 , 0
45 , 1 X

1 2
+ =
1 2
x 331 , 0 91 , 0 X

+ =
Figura 4. 19 Recta de regresin mnimo cuadrtica

X1
X2
) x (
) x , x cov(
x
1 1 2
1
2 1
2 2

o
+ = r.r.m.c
) x / X ( E ) x ( h x
1 2 1 2
= =
c.r.c.

Figura 4. 20 Curva y rrmc

X
1
1 2 3
1
2
X
2
0,28
0,24
0,18
0,15
0,09
0,06
4. Concepto de variable aleatoria
-109-

4.10. PROBLEMAS PROPUESTOS

4.10.1. Si X es la variable aleatoria nmero de puntos al lanzar un dado,
determinar su valor medio y su varianza.
Solucin: E(x) = 7/2 D
2
(x) = 224/9

4.10.2. Si se selecciona al azar un nmero entero entre 1 y 100, cul es el valor
esperado?
Solucin: 50.5

4.10.3. Las lecturas sobre sensores son analgicas (continuas), y deben ser
convertidas a una escala discreta para permitir su procesamiento digital. Sea X la
lectura de un sensor. En un caso muy sencillo, supongamos que si la lectura
iguala o supera un valor lmite t=1/2, el valor almacenado es 1 y en caso
contrario es 0. Si la funcin de densidad de X es:

s < +
s s
=
otroscasos
x x
x x
x f
0
2 1 2
1 0
) (
Hallar la funcin de probabilidad de la variable aleatoria Y que indica el valor
almacenado.
Solucin: P(Y=0)=1/8 P(Y=1 )=7/8

4.10.4. El tiempo, X, que tarda una mquina en elaborar un producto tiene como
funcin de densidad:

>
=

otroscasos
x e
x f
x
0
0 2
) (
2

Si el mecanismo tarda 3 minutos o menos, el beneficio del fabricante es 100 euros. Si
tarda ms de tres minutos el beneficio es -200 euros. Si Y es el beneficio, hallar su
funcin de probabilidad y su funcin de distribucin.

4.10.5. Un fabricante de motores produce un 30% de defectuosos. El coste es
de 4.000 . por unidad y el precio de venta es de 9.000 e.. Si el motor es
defectuoso debe devolverse lo cobrado y pagar una indemnizacin de 6.000 .
a) Calcular el beneficio medio por motor.
4. Concepto de variable aleatoria
-110-
b) Se puede hacer una prueba de control de calidad A que cuesta 2.000 . y que
determina con toda seguridad si el motor es o no es defectuoso. Estudiar si es
rentable la prueba.
c) Se puede utilizar una prueba alterativa B, que conduce a conclusiones
errneas en un 10% de los casos. Calcular el precio mximo que puede
pagarse por dicha prueba.
Solucin: a)500 b)300 c)990

4.10.6. La longitud de una cierta pieza se distribuye con la siguiente funcin de
densidad:

s s
s s
=
valores otros
x x k
x k
x f
0
5 . 2 2 ) 2 (
2 1
) (
2

y se consideran correctas las piezas de longitud comprendida entre 1'5 y 2'1.Se
pide:
a) valor de la constante k
b) proporcin esperada de piezas correctas
c) funcin de distribucin de la variable longitud de la pieza
Solucin: a) k=0'694 b) 0'4163

4.10.7. Sea X una variable aleatoria continua cuya funcin de densidad es:
| |
| |

e
e +
=
3 , 0 0
3 , 0 ) 1 (
) (
2
x
x x k
x f

Hallar:
a) El valor de la constante k.
b) Probabilidad de que X est comprendida entre 1 y 2.
c) Probabilidad de que X sea menor que uno.
d) Sabiendo que X es mayor que 1, probabilidad de que sea menor que 2.
Solucin: a) 1/12 b) 5/18 c) 1/9 d) 5/16
4. Concepto de variable aleatoria
-111-


4.10.8. Dada la funcin de densidad de la variable aleatoria X:

s s
s s
=
valores otros
x
x x
x f
0
2 1 x - 2
1 0
) (

Hallar su funcin de distribucin.
Solucin: 2 x 1 si
2
) x 2 (
1 ) x ( F ; 1 x 0 si
2
x
) x ( F
2
x
2
x
s s

= s s =

4.10.9. La variable X est definida en el intervalo ]-, a] con funcin de densidad
f(x). La expresin:
}


a
dx x f x ) (
facilita:
a) el valor de la funcin de distribucin en el punto x=a.
b) el valor de la desviacin tpica de X.
c) es una expresin que vale 1.
d) es el valor medio de la variable X.

4.10.10. Se realiza un estudio sobre la duracin de las llamadas en una centralita
telefnica y se estima que su funcin de densidad de la variable es:

>
=

valores otros
x e
x f
x
0
0
2
1
) (
2

Hallar el valor esperado de la longitud de una llamada telefnica en esa estacin.
Solucin: E(x)=2

4.10.11. Dada una variable aleatoria continua cuya funcin de densidad es:
4. Concepto de variable aleatoria
-112-

s s
=
es otrosvalor
x x
x f
0
2 1 5 . 0
) (
Hallar su esperanza matemtica.
Solucin: 19/12.

4.10.12. Dada una variable aleatoria continua cuya funcin de densidad es:

< <
=
valores otros
x
x
x f
0
1 0
2
1
) (
Hallar su varianza.
Solucin: 4/45.

4.10.13. De una estacin parte un tren cada 20 minutos. Un viajero llega de
imprevisto. Calcular:
a) Probabilidad de que espere el tren menos de 7 minutos
b) Valor medio del tiempo de espera
c) Probabilidad de que espere exactamente 12 minutos.
Solucin: a) 7/20 b) 10 c) 0.

4.10.14. Se intenta estudiar el porcentaje de tiempo en el que se esta utilizando
un ordenador en un determinado departamento a lo largo de las semanas de
trabajo. Supongamos que el porcentaje de utilizacin del ordenador sigue una
funcin de densidad de probabilidad dada por:

s s
=
res otros valo
x x
x f
0
1 0 3
) (
2

Calcular el promedio y la varianza del porcentaje de utilizacin del ordenador.
Solucin: 0.75 0.0375

4.10.15. Un almacenista compra a principio de semana N kg. de un producto
perecedero a 200 pts/kg. y lo revende a 300 pts/kg. La demanda se distribuye
exponencialmente con media 100 kg/semana, y aquellos kilos que no vende se
estropean y pierden. Calcular cuntos kilos del producto debe comprar a la
semana para maximizar su beneficio.
4. Concepto de variable aleatoria
-113-
Solucin: N= 40.55 Kg.

4.10.16. Un revendedor de entradas sabe que la demanda diaria en la reventa de
las mismas se distribuye aleatoriamente, siendo Prob(D> d)= e
-0.05 d
. Si el
revendedor compra en taquilla a 200 ptas. y revende con un beneficio del 20%,
pero debe quedarse con las que no puede vender, calcular cuntas entradas
debe comprar al da para maximizar su beneficio.
Solucin: 4 entradas diarias

4.10.17. Si X es una variable aleatoria que mide la duracin real de una lmpara,
X=EXP(), determinar el valor medio de su duracin.
Solucin: 1/

4.10.18. Dada la funcin de densidad de la variable X:

s s

s s
s s
=
otros 0
6 x 5
5
x 6
5 x 1
5
1
1 x 0
5
x
) x ( f
determinar su valor medio.
Solucin: E(x) = 3

4.11. PROBLEMAS Y CUESTIONES DE EXMENES

4.11.1 El espesor de una plancha de acero sigue una distribucin aleatoria segn la
figura de abajo. La plancha de acero es adecuada para su uso siempre que el
espesor sea mayor de 1,75 mm y menor de 3 mm. Se pide:
f(x)
x 1
2 3,5

4. Concepto de variable aleatoria
-114-

a) Calcular la funcin de densidad en cada punto.
b) Calcular el E(X).
c) Calcular la proporcin de planchas defectuosas.
Solucin:
a) Como el rea total bajo la funcin de densidad tiene que ser la unidad, la altura
de la figura debe ser,
1 h ) 2 5 , 3 (
2
h ) 1 2 (
= +


De donde h=1/2.
La funcin de densidad ser:

e =
e +
=
resto 0
] 5 , 3 ; 2 [ x 2 / 1 h
] 2 , 1 [ x bx a
) x ( f
Aplicando la frmula de la ecuacin de una recta que pasa por 2 puntos, se tiene
1 2
0 h
1 x
0 y

h
1 x
y
=

y se tiene que
2
1
2
x
h hx ) x ( f y = = =
b) El valor medio viene dado por,
48 , 2
2 2
x
2 2
x
2 3
x
dx
2
1
x dx )
2
1
2
x
( x dx ) x ( f x ) x ( E
5 , 3
2
2
2
1
2 3
5 , 3
2
2
1
=
(

+
(

= + = =
+
- -


c) El porcentaje de defectuosas ser la suma del porcentaje de piezas por debajo
del lmite inferior de tolerancias ms el porcentaje de piezas defectuosas por
encima del lmite superior de tolerancias. Esto es,
39 , 0 25 , 0 14 , 0 dx
2
1
dx
2
1 x
) 3 X ( P ) 75 , 1 X ( P p p p
5 , 3
3
75 , 1
1
2 1
= + = +

= > + < = + =
} }

4.11.2 El contenido de arroz en gramos dentro de un paquete sigue una
distribucin con funcin de densidad,
caso otro en 0 ) x ( f
254 x 239 para
150
x
2
35 , 5
1
) x ( f
=
s s |
.
|

\
|
=


a) Calcular la media y la dispersin del contenido de arroz en cada paquete.
b) Si el contenido de arroz es menor de 245 gr. se considera que es un paquete
defectuoso. Calcular el porcentaje de paquetes defectuosos.
4. Concepto de variable aleatoria
-115-
c) Si el contenido de arroz pesa menos de 245 gramos, el coste es de
2
x 25 , 1 , y
si es mayor a 245 el coste es de x 3 , 1 . Calcular el valor medio del coste del
contenido de arroz de un paquete.
Solucin:
a) El valor medio es,
15 , 246 dx )
150
x
2 (
35 , 5
1
x ) X ( E
254
239
= =
}

Y la varianza se calcula como,
( )
2 2 2
) X ( E ) X ( E ) X ( D =
Siendo
}
= =
254
239
2 2
2 , 60608 dx )
150
x
2 (
35 , 5
1
x ) X ( E
( ) 38 , 18 15 , 246 2 , 60608 ) X ( E ) X ( E ) X ( D
2 2 2 2
= = =
Y la desviacin tpica es 29 , 4 ) X ( D =
b) El porcentaje de paquetes defectuosos es,
434 , 0 dx )
150
x
2 (
35 , 5
1
) 245 X ( P
245
239
= = <
}

c) El valor medio del coste es,
} }
= + =
254
245
245
239
2
31920 dx )
150
x
2 (
35 , 5
1
x 3 , 1 dx )
150
x
2 (
35 , 5
1
x 25 , 1 ) c ( E

4.11.3 El espesor, X, de una determinada pieza sigue una distribucin
aleatoria, segn la siguiente funcin de densidad,
caso otro en 0 ) x ( f
15 x 5 si
50
x 15
) x ( f
=
s s

=

Sabiendo que la tolerancia del espesor es de 103 mm, se pide:
a) Calcular la proporcin de piezas defectuosas.
b) Por trmino medio, cunto vale el espesor de cada pieza?
c) Calcular la varianza del espesor de la pieza.
d) Calcular el valor de la media y el valor de la desviacin tpica del espesor
medio de 5 piezas tomadas al azar.
e) Si la pieza es correcta, el beneficio es de 10 /unidad, pero si es mayor que la
tolerancia superior se tiene una prdida de 2(X-13) /unidad, y en caso de
ser menor que la tolerancia inferior, la prdida es de 2(7-X)/unidad. Calcular
4. Concepto de variable aleatoria
-116-
el beneficio medio que obtendramos al producir 5000 piezas.
Solucin:
a) La proporcin de piezas correctas es,
60 , 0
100
8
100
2
50 2
) x 15 (
dx
50
x 15
dx ) x ( f p 1
2 2
13
7
2 13
7
13
7
= +

=
(

= =
} }

De donde la proporcin de defectuosas es del p=0,40.
b) La media de X es,
333 , 8
150
5
100
5 15
150
15
100
15 15
150
x
2 50
x 15
dx )
50
x
x
50
15
( dx
50
x 15
x ) x ( E
3 2 3 2
15
5
3 2
15
5
2 15
5
= + =
(

= =

=
} }

c) La varianza es,
( )
2 2 2
) X ( E ) X ( E ) X ( D =
75
200
5
150
5 15
200
15
150
15 15
200
x
150
x 15
dx )
50
x
x
50
15
( dx
50
x 15
x ) x ( E
4 3 4 3
15
5
4 3
15
5
3
2
15
5
2 2
= + =
(

= =

=
} }

Y la varianza es,
611 , 5 33 , 8 75 ) x ( D
2 2
= =
d) Llamando a Y el espesor medio, ste es,
5
x x x x x
y
5 4 3 2 1
+ + + +
=
La media de y es,
333 , 8 ) x ( E
5
) x ( E 5
) y ( E = = =
Y la desviacin tpica es,
059 , 1
25
611 , 5 5
5
) x ( D ) x ( D ) x ( D ) x ( D ) x ( D
) y ( D
2
5
2
4
2
3
2
2
2
1
2
= =
+ + + +
=
e) El valor medio del beneficio viene dado por,
4. Concepto de variable aleatoria
-117-
pieza / 2 , 5 dx
50
x 15
) 13 x ( 2 dx
50
x 15
10 dx
50
x 15
) x 7 ( 2 ) B ( E
15
13
13
7
7
5
=

=
} } }


4.11.4 Sea una variable aleatoria X que representa el espesor, en milmetros,
de las arandelas que produce una mquina. Si la variable X tiene una
funcin de densidad dada por:

e
=
contrario caso 0
), 1 . 2 , 9 . 1 ( x x 5 . 2
) x ( f
Determinar:
a) La funcin de distribucin.
a) La probabilidad de que una arandela tenga un espesor igual a 1.95 mm.
b) P(1.95 < X < 2.05).
c) El valor a tal que P(X < a) = 0.25 e interpretar el resultado.
d) Sabiendo que la media de X es 2, calcular su varianza.
Solucin:
a)

>
e =
<
=
}
2.1 x 1
(1.9,2.1) x 51 . 4 1.25x 2.5xdx
1.9 x 0
) x ( F
2
x
1.9

b) P(X=1.95)=0
c) 5 . 0 xdx 5 . 2 ) 05 . 2 X 95 . 1 ( P
1 . 2
9 . 1
= = < <
}

d) 25 . 0 5 . 2
9 . 1
=
}
a
xdx 25 . 0 ) 9 , 1 a ( 25 . 1
2 2
= a=1.95
01 . 0 4 01 . 4 2 xdx 5 . 2 x )] X ( E [ ) X ( E
2
1 . 2
9 . 1
2 2 2 2
= = = = o
}


4.11.5 En el almacn de un taller de fontanera hay tubos de cobre de 1.25
pulgadas de dimetro interior cortados a diferentes longitudes y
amontonados los trozos en un contenedor. Asumimos que la longitud de
los tubos cortados que se utilizan es una variable aleatoria cuya funcin de
densidad es:
4. Concepto de variable aleatoria
-118-

e
=
contrario caso
x k x
x f
0
), 20 . 2 , 40 . 0 ( /
) (
Supuestos:
I. Todos los tubos se compran a un proveedor pagando un coste de 3 /m
II. Los tubos se eligen del contenedor al azar para proceder a su montaje en la
construccin de una caldera de vapor
III. El coste de montaje de los tubos (preparacin, limpieza, soldadura, etc.)
asciende a 10 /m de tubo montado
IV. Al cliente se le cobra segn los metros montados a razn de 50 /m
V. Los tubos de longitud inferior a 0.50 m se desechan directamente y no se
montan
VI. Los tubos de longitud comprendida entre 0.5 y 2.00 m se montan enteros
VII. A los tubos con longitud mayor de 2.00 m, se les corta previamente el exceso
sobre los 2.00 m que se pierde y no se cobra. Los 2 m restantes se montan
como en el apartado anterior
Calcular:
a) El valor medio de la longitud de los tubos del contenedor.
b) El valor medio del beneficio por tubo del almacn.
Solucin:
f(x)
0,40 2,2 X

4. Concepto de variable aleatoria
-119-
a) Recordando que

1 ) 4 , 0 2 , 2 (
2
1
2
1
1 ) (
2 2
2 , 2
4 , 0
2
2 , 2
4 , 0
= =
(

= =
} }
k
x
k
dx
k
x
tendremos dx x f
x

despejando k=2,34
5077 , 1 ) 4 , 0 2 , 2 (
k 3
1
x
k 3
1
dx
k
x
x dx ) x ( xf ) X ( E
3 3
2 , 2
4 , 0
3
x
2 , 2
4 , 0
= =
(

= = =
} }

b)
}
= =
x
dx x f x B B E Beneficio E ) ( ) ( ) ( ) (

B= (cobrado-pagado) en cada caso
B
1
=0 -3x = -3x para (0,4 X 0,5)
B
2
=50x-(3+10)x= 37x para (0,5 X 2.0)
B
3
=(50 . 2)-(3x+2 . 10)= 80-3x para (2,0X 2,2)

} } } }
= + + = = =
2 , 2
0 , 2
0 , 2
5 , 0
5 , 0
4 , 0
34 , 2
) 3 80 (
34 , 2
37
34 , 2
) 3 ( ) ( ) ( ) ( ) ( dx
x
x dx
x
x dx
x
x dx x f x B B E Beneficio E
x


tubo euros x
x x x
/ 7077 , 54 2274 , 13 5064 , 41 0261 , 0
2
80
34 , 2
1
3 3 , 2
37
3 34 , 2
3
2 , 2
0 , 2
3
2
0 , 2
5 , 0
3
5 , 0
4 , 0
3
= + + =
(

+
(

+
(

=


4.11.6 La longitud de una determinada pieza es una variable aleatoria con
funcin de densidad,
caso otro en ) x ( f
mm x mm para
x
k ) x ( f
0
200 100
3
300
=
s s

=

Consideramos que la pieza es correcta cuando su longitud est entre 105 mm y 190
mm. Se pide:
a) Calcular el porcentaje de piezas defectuosas.
b) Calcular la funcin de distribucin de la variable aleatoria longitud de la pieza.
c) Si la longitud de la pieza es mayor de 190 la prdida que se produce es de
10, si la longitud es menor de 105 mm la prdida es de
2
30 x , y si la pieza
es correcta el beneficio es de x 200 . Por trmino medio, cul ser el
beneficio por cada pieza producida?
4. Concepto de variable aleatoria
-120-
Solucin:
La constante k la calculamos con la condicin de que la integral de la funcin de
densidad para todo su campo de existencia es igual a la unidad.
1 dx
x
) x 300 (
k
200
100
=

}

Integrando,
1 30000
6
k
2
100
2
200

3
k
2
) x 300 (

3
k
2 2
200
100
2
= =
(

=
(

-

De donde k=0.0002
a) La proporcin 1-p de piezas correctas es,
}
=

=
190
105
864 , 0 dx
3
) x 300 (
0002 , 0 p 1
Y la proporcin de piezas defectuosas es p=1-0,864=0,136.
b) La funcin de distribucin para x entre 100 y 200 es,
] ) x 300 ( 40000 [
6
0002 , 0
2
) x 300 (
3
0002 , 0
dx
3
) x 300 (
0002 , 0 ) x ( F
2
x
100
2
X
100
=
(

=
}

F(x) = 0 para x<100
F(x)= 1 para x>200
c) El valor medio de cada pieza producida es,
pieza / 4060
dx
3
) x 300 (
0002 , 0 ) 10 ( dx
3
) x 300 (
0002 , 0 x 200
dx
3
) x 300 (
0002 , 0 ) x 30 ( ) B ( E
200
190
190
105
105
100
2
=
=

=
} }
}


5. Principales distribuciones discretas
-121-
5. PRINCIPALES DISTRIBUCIONES DISCRETAS
Contenido
5.1. DISTRIBUCIN DICOTMICA ............................................................. 121
5.2. DISTRIBUCIN BINOMIAL ................................................................... 122
5.3. DISTRIBUCIN HIPERGEOMTRICA ................................................. 123
5.4. DISTRIBUCIN DE POISSON .............................................................. 125
5.5. DISTRIBUCIN BINOMIAL-NEGATIVA ................................................ 126
5.6. DISTRIBUCIN MULTINOMIAL ........................................................... 127
5.7. PROBLEMAS PROPUESTOS .............................................................. 129
5.8. PROBLEMAS Y CUESTIONES DE EXMENES .................................. 143

A continuacin vamos a estudiar las principales distribuciones discretas que aparecen
en la prctica. Para cada una de ellas definimos:
1) La funcin de probabilidad.
2) Valor medio.
3) Varianza.
4) Suma de variables aleatorias del mismo tipo.
5) Convergencia a otras variables.

5.1. DISTRIBUCIN DICOTMICA
Diremos que X es una v.a. dicotmica de parmetro "p", y la representamos por
D(p) X
si toma nicamente dos valores posibles:
X = 1 , con probabilidad "p",
X = 0 , con probabilidad "q",
donde 1 = q + p .
Se suele asociar el "1" con la presencia de un cierto suceso, y "0" por su
ausencia. Por ejemplo, una pieza mecnica puede ser defectuosa, 1, o no tener
defecto, 0. Al lanzar una moneda aparece la cara, y lo asociamos con el "1", y en
caso contrario, lo asociamos con el "0".
5. Principales distribuciones discretas
-122-
El valor medio de X se calcula como:
p = 0.q + 1.p = 0.P(0) + 1.P(1) = ) P( x x = E(X)
i i
xi


La varianza la calculamos a partir de los momentos respecto al origen, as
o o
2
1 2
2
- = (X)
D

de donde
p = .q
0
+ .p
1
= )
x
P(
x
= )
X
E( = p; =
2 2
i
2
i
2
2 1

o o

p.q = p) - p.(1 = p - p =
2
2
o


5.2. DISTRIBUCIN BINOMIAL
Al repetir un experimento aleatorio n veces, de forma independiente, el nmero de
veces que aparece un suceso A, de probabilidad P(A), se denomina variable
aleatoria binomial, y se representa por,
p) B(n, X
Al realizar una vez el experimento aleatorio puede ocurrir el suceso A o el
suceso contrario. Al efectuar n repeticiones, una posible secuencia puede ser:
A .......A A A A A A
Supongamos que queremos calcular la probabilidad de que al repetir n veces
el experimento aleatorio, aparezcan v veces el suceso A, esto es ) = P(X v . Ello
significa en una secuencia de aparicin de los sucesos, hay v -veces el A y, por lo
tanto, v - n veces el suceso A, con una cantidad de masa de
) A P(
P(A)
- n v
v
, y como
cada secuencia, con igual nmero de A son mutuamente excluyentes, el total de
secuencias viene dado por:
)! - (n !
n!
v v

Luego la probabilidad de obtener exactamente v veces el suceso A, es
) p - (1 p
n
= ) = P(X
- n v v
v
v
|
|
.
|

\
|

que recibe el nombre de "frmula binomial".
5. Principales distribuciones discretas
-123-
Tambin se puede considerar la variable binomial como una suma de "n"
variables aleatorias dicotmicas independientes, ya que al sumar el nmero de 1's
nos da el nmero de veces que aparece el suceso A. A partir de esta suma de
variables se pueden calcular las caractersticas de la binomial.
De este modo, el valor medio de la binomial es:
n.p = p = )
X
E( = )
X
....+ +
X
+
X
E( = E(X)
n
1
i
n
1
n 2 1

La varianza de la binomial es:
npq = pq
X D
= )
X
...+ +
X
+
X
(
D
= (X)
D
n
=1 i
i
2
n
=1 i
n 2 1
2 2
)= (


Si p) ,
n
B(
X 1 1
y p) ,
n
B(
X 2 2
e independientes, la suma de estas dos v.a.
es otra binomial de parmetros p) ;
n
+
n
B(
X
+
X 2 1 2 1
.

Actividad 5.1:
- Probabilidad de que al lanzar 5 monedas salgan dos caras.



5.3. DISTRIBUCIN HIPERGEOMTRICA
Sea E una poblacin finita cuyos elementos son de dos tipos: el A o el A. El nmero
de veces que aparece el suceso A al realizar n extracciones sin reemplazamiento, se
denomina v.a. hipergeomtrica y se representa por:
p) n, H(N, X
Por ejemplo, supongamos un lote de N piezas, de las cuales hay
N1

defectuosas y
N2
correctas. Si tomamos n piezas al azar del lote y contamos el
nmero de piezas defectuosas que aparecen de entre esas "n", dicho nmero se
denomina variable hipergeomtrica.
5. Principales distribuciones discretas
-124-
N1
N2
n
v
n-v

Figura 5. 1. Distribucin hipergeomtrica

Se suele representar por el esquema que aparece en la Figura 5. 1 5. 1.
La funcin de probabilidad es:
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
n
N
+
N
- n
N N
= ) = P(X
2 1
2 1
v v
v
Se demuestra que el valor medio de esta v.a. es:
np = E(X)
y que su varianza es:
1 - N
n - N
npq. = (x)
D
2

Observar que cuando N es muy grande en relacin al tamao n de la muestra,
la varianza, tomando lmites, tiende a
npq = (X)
D
2

esto es la varianza de la binomial. Por ello cuando se cumple la condicin de que
10
n
N
>>
la variable hipergeomtrica se aproxima a la binomial B(n,p). Es decir, las
extracciones sin reemplazamiento equivalen a extracciones con reemplazamiento, ya
5. Principales distribuciones discretas
-125-
que al ser el tamao de la poblacin muy grande en relacin al tamao de la muestra,
hay muy pocas posibilidades de que un mismo elemento sea elegido dos veces.

Actividad 5.2:
- Probabilidad de que al extraer al azar 3 cartas de una baraja de 40 cartas, dos de
ellas sean oros.

- En un contenedor hay 500 motores y se sabe que el 5% de ellos son defectuosos. Si
extraemos al azar 10 motores cul es la probabilidad de que en esos 10 hayan 2
motores defectuosos?


5.4. DISTRIBUCIN DE POISSON

Si observamos el nmero de defectos que aparecen en una pieza mecnica, estos
pueden ser 0,1,2,3..., y en teora pueden haber hasta infinitos defectos. Es decir, se
trata de un espacio muestral infinito numerable.
Un modelo matemtico que se ajusta bastante bien al nmero de defectos es
la distribucin de Poisson, la cual aparece como consecuencia del lmite de una v.a.
binomial p) B(n, cuando 0 p , n y se mantiene constante el producto de
= n.p .
Para obtener la funcin de probabilidad de la v.a. de Poisson, partimos de la
frmula de la binomial, y hacemos tender el lmite para cuando 0 p y n , as:
= ) p - (1 p
n
= ) = P(X
- n v v
v
v
|
|
.
|

\
|
) p - (1 p
!
1) + - 1)...(n - n(n
= ) p - (1 p
)! - (n !
n!
=
- n - n v v v v
v
v
v v

Haciendo tender 1 q 0, p , n , y queda
!
.
e
= ) = P(X
-
v

v
v

La media es

o
= = E(X)
1

y la varianza es
5. Principales distribuciones discretas
-126-

o o
= - + = - = (X)
D
2 2 2
1 2
2

Si ) PS(
X 1 1
y ) PS(
X 2 2
e independientes, la suma de v.a. de Poisson
da lugar a otra distribucin de Poisson de parmetro suma de parmetros.
Otra forma en que aparece la distribucin de Poisson es contando el nmero
de sucesos hasta un cierto tiempo "t", cuya expresin es:
!
) t (
e
= ) =
X
P(
t -
t
v

v
v


donde t es el promedio de sucesos que ocurren en un tiempo t.
Para obtener los distintos valores de ) = P(X v se emplea el baco de
Poisson.

Actividad 5.3:
o En una fbrica donde hay muchas mquinas se sabe que por trmino medio se
averan 2 al da. Se pide:
o Probabilidad de que en un da se averen 4 mquinas.
o Probabilidad de que se averen 4 mquinas en 5 das.
o De una determinada pliza de seguros se sabe que reclaman por trmino medio 4 al
mes. Si por cada pliza hay que indemnizar con 1000, cunto dinero tenemos que
preparar para poder pagar al final del mes con una probabilidad del 95%?


5.5. DISTRIBUCIN BINOMIAL-NEGATIVA

El nmero de veces que hay que repetir un experimento aleatorio hasta que aparece
"r" veces el suceso A de probabilidad p, se llama variable aleatoria binomial
negativa, y se representa por:
p) BN(r, X
La funcin de probabilidad ) = P(X v , se calcula pensando que para que en la
repeticin nmero v haya aparecido el suceso A "r" veces, en los 1 - v primeros
tiene que haber aparecido de cualquier forma r-1 veces el suceso A, y en la repeticin
v el suceso A, de aqu:
5. Principales distribuciones discretas
-127-
q p
1 - r
1 -
= .p q p
1 - r
1 -
= ) = P(X
r - r r - 1 - r v v
v v
v
|
|
.
|

\
|
|
|
.
|

\
|

El valor medio de esta variable aleatoria es:
p
r
= E(X)
y su varianza
p
rq
= (X)
D
2
2

Un caso particular interesante es cuando r=1, esto es, el nmero de veces
que hay que repetir un experimento aleatorio hasta que aparece por primera vez el
suceso A. A este caso particular tambin recibe el nombre de "distribucin
geomtrica" o "distribucin de Pascal".
El valor medio y la varianza son:

p
x E
1
) ( =

2
2
) (
q
p
X D =

Actividad 5.4:
- Cuntas veces, por trmino medio, hemos de tirar un dado para que salga por
primera vez el 1?
- Cuntas veces por trmino medio hemos de tirar un dado para que salga por
segundo vez el 1?


5.6. DISTRIBUCIN MULTINOMIAL

La distribucin multinomial es una generalizacin de la binomial. En lugar de contar la
aparicin de un suceso cada vez que realizamos un experimento aleatorio, contamos
ms de un suceso. De esta forma, nombrando a A
1
, A
2
,..., A
k
los distintos sucesos
que pueden aparecer al efectuar el experimento aleatorio, designamos con x
1
el
5. Principales distribuciones discretas
-128-
nmero de veces que aparece el suceso A
1
, x
2
el nmero a veces que aparece el
suceso A
2
, y x
k
el nmero de veces que aparece el suceso A
k
, al repetir n veces el
experimento aleatorio,
La variable k-dimensional (x
1
, x
2
, ...,x
k
) recibe el nombre de variable aleatoria
multinomial, con funcin de probabilidad,
k
k
k
k k
p p p
n
x x x P
v v v
v v v
v v v = = = =
2 1
2 1
2 1
2 2 1 1
! ... ! !
!
) ;...; ; (
siendo p
i
la probabilidad que aparezca el suceso A
i
al realizar una vez el experimento
aleatorio, y cumplindose que:
1 ...
....
3 2 1
3 2 1
= + + + +
= + + + +
k
k
p p p p
n v v v v

Cuando k=2 se trata de la variable binomial, que tal como dice el nombre cuenta
dos sucesos aleatorios.
El valor medio de cada marginal viene dado por:
i i
np x E = ) (
La variancia de cada marginal es:
i i i
q np x D = ) (
2

La covariancia (mide la relacin lineal que hay entre dos variables) entre dos
marginales es:
j i j i
p np x x = ) , cov(
Por ejemplo, si lanzamos n veces un dado, la variable aleatoria que cuenta el
nmero de 1's, 2's, 3's, 4's, 5's y 6's, es una variable aleatoria multinomial.


Actividad 5.5:
1. De 20 barajas de 40 cartas, saco al azar 8 cartas. Cul es la probabilidad de que
sean 2 oros, 1 espadas, 2 copas y 3 espadas.


5. Principales distribuciones discretas
-129-

5.7. PROBLEMAS PROPUESTOS

5.7.1.- Si X es la variable aleatoria nmero de veces que hay que lanzar un dado
hasta obtener por primera vez un seis, determinar su valor medio.
Solucin: 6

5.7.2.- Un interruptor debe ser reemplazado despus del primer fallo. La probabilidad
de que funcione adecuadamente en cualquier utilizacin es 0,995. Si X indica el
nmero de veces que el interruptor ha funcionado correctamente hasta su
reemplazamiento, calcular su valor medio y su varianza.
Solucin: E(X) = 199 Var(X) = 39800

5.7.3.- Sea X el nmero de veces que se ha lanzado un dado hasta conseguir un
seis. Hallar:
a) Funcin de probabilidad de X,
b) Valor esperado de X.
Solucin: a) P(X = k) =(5/6)
k-1
(1/6) k =1,2, . . b) 6

5.7.4.- Una nave de fabricacin est integrada por un nmero considerable de
mquinas idnticas y se sabe por experiencia que el promedio de las que se averan
semanalmente es de 5.
a. Calcular la probabilidad de que hayan ms de 3 averiadas en la misma
semana.
b. Cul es el nmero de mquinas de reserva que se precisan en una semana
para tener una probabilidad al menos de 0,99 de que al averiarse cualquier
mquina podr sustituirse.
Solucin: a) 0,7340 b) 11

5.7.5.- En una central telefnica de una ciudad se reciben un promedio de 4 llamadas
por minuto, en las horas de mximo trfico. Si la instalacin tiene una capacidad tal
que puede atender a los sumo 12 llamadas por minuto, cul es la probabilidad de
que en un minuto determinado no sea posible dar lnea a todos los clientes que lo
5. Principales distribuciones discretas
-130-
soliciten?
Solucin: 0,0003

5.7.6.- Un servicio de mantenimiento de aviones realiza diferentes tipos de
reparaciones. Las solicitudes de reparacin para un sistema particular recibidas en un
perodo de tiempo pueden considerarse que constituyen un proceso de Poisson.
Concretamente:
SISTEMA N MEDIO DE REPARACIONES
EN UNA SEMANA
motor
1
= 2.0
diseo
2
= 0.5
hidrulica
3
= 1.3
tren de aterrizaje
4
= 0.2

a) Cul es la probabilidad de que el nmero total de reparaciones solicitadas en
una semana sea mayor o igual que tres y menor o igual que 7?
b) Si el promedio de reparaciones de diseo se duplica y el promedio de
reparaciones de motor se reduce a la mitad, cul es la probabilidad de que
en dos semanas el nmero total de reparaciones sea menor o igual que 8?
Solucin: a) 0.7108 b) 0.7291

5.7.7.- Los fallos de fluido elctrico en una estacin de trabajo siguen una distribucin
de Poisson y tienen un promedio de 1,5 fallos al mes.
a) Cul es el nmero de fallos esperado en un ao?
b) Cul es la probabilidad de que se produzcan ms de 20 fallos en un ao?
c) Cul es la probabilidad de que el prximo fallo ocurra antes de 2 meses?
d) Cul es la probabilidad de que ocurra antes de tres meses pero no antes de
2 meses?
Solucin: a) 18 b) 0,2776 c) 0,9502 d) 0,0387

5.7.8.- Las mquinas de 5 fbricas diferentes se rompen con una frecuencia media de
5. Principales distribuciones discretas
-131-
1.2, 3.2, 0.7, 3.5 y 2.4 veces al da. Los procesos de rotura en los diferentes sitios son
independientes, y cada proceso se asume que satisface las condiciones de un
experimento de Poisson:
a) Cul es la probabilidad de que el nmero total de roturas en un da dado
exceda de 12 unidades?,
b) Despus de una rotura en cualquier fbrica cul es la probabilidad de que la
prxima rotura (sea cual sea la fbrica) ocurra en las dos horas siguientes?
Solucin: a) 0.3113 b) 0.60

5.7.9.- Se ha fabricado una partida de transistores con un 20% de unidades
defectuosas. Si X es una variable aleatoria que indica el nmero de transistores
defectuosos obtenidos al seleccionar 4 transistores de la partida, obtener su funcin
de probabilidad.
Solucin:
x x
x
x P


|
|
.
|

\
|
=
4
) 8 . 0 ( ) 2 . 0 (
4
) (

5.7.10.- Un sistema multiproceso utiliza 12 procesadores y ha sido configurado de
modo que puede satisfacer todas sus funciones, aunque mas lentamente, si
funcionan 9 procesadores. Si la probabilidad de que funcione cada procesador
durante el tiempo de ejecucin de un trabajo es 0,8 y los fallos de los procesadores
son independientes cul es la probabilidad de que el sistema funcione hasta que se
complete el trabajo?
Solucin: 0.7946

5.7.11.- Una compaa de seguros, que cuenta con 10.000 asegurados, determina
que el 0,005% de la poblacin fallece cada ao de un cierto tipo de accidente:
a) Calcular la probabilidad de que la compaa de seguros tenga que pagar a los
beneficiarios de 3 o ms de los asegurados contra tal tipo de accidente en un
ao determinado.
b) Cul es el nmero de accidentes al ao por trmino medio?
Solucin: a) 0,0144 b) 0,5


5. Principales distribuciones discretas
-132-
5.7.12.- Se seleccionan por separado tres muestras aleatorias en una lnea de
produccin en la cual el 5% de las unidades son defectuosas. Las dos primeras
muestras tienen un tamao igual a 20 y la tercera un tamao igual a 10. Cul es la
probabilidad de que el nmero de unidades defectuosas encontradas entre las tres
muestras sea mayor o igual que 1 y menor o igual que 4?.
Solucin: 0.81944

5.7.13.- Una partida de bujas con alta proporcin de inservibles (20%) sale al
mercado en paquetes de 4 unidades y en cajas de 10 paquetes. Calcular la
probabilidad de que:
a) Elegido un paquete al azar contenga 2 o ms bujas inservibles.
b) Elegida una caja al azar contenga ms de 10 bujas inservibles.
c) Elegida una caja al azar contenga 3 paquetes sin bujas inservibles.
Solucin: a) 0'1808 b) 0'1608 c) 0'2062

5.7.14.- Una mquina de fabricacin de tornillos produce por trmino medio 2
tornillos defectuosos por cada 85, empaquetndose stos en cajas de 170 unidades.
Cul es la probabilidad de que tomadas al azar 7 cajas, en slo 2 de ellas no haya
ningn tornillo defectuoso?
Solucin: 0'0064

5.7.15.- Una fbrica encuentra que el 20% de los diskettes que produce son
defectuosos. Si se eligen diez diskettes al azar de un lote, hallar la probabilidad de
que:
a) Hayan exactamente dos defectuosos.
b) Que dos o ms sean defectuosos.
Solucin: a) 0.3 b) 0.62419

5.7.16.- Cada hora se toman 50 unidades de la produccin de una mquina. Si la
muestra contiene dos o ms unidades defectuosas, se ajusta la mquina. Si esta
produce un 2% de unidades defectuosas, calcular el tiempo medio entre sucesivos
ajustes.

5. Principales distribuciones discretas
-133-
Solucin: (3'784-1) horas

5.7.17.- Una industria recibe piezas en lotes de un gran nmero de unidades. Se
desea reparar un plan de control de calidad de tal forma que tomando al azar n
unidades del lote, si se observa alguna defectuosa se rechaza el lote. Determinar n
para que si el lote tiene un 5% de unidades defectuosas, la probabilidad de
aceptarlos sea menor de 0,01.
Solucin: 90.

5.7.18.- Un cargamento de 20 acelermetros altamente sensibles deben ser
aceptados o rechazados en base a una muestra de 5 unidades seleccionadas
aleatoriamente del lote. El cargamento ser rechazado si en la muestra hay ms de
una unidad defectuosa. Cul es la probabilidad de que el cargamento sea aceptado
si se sabe que el 10% de las unidades no cumplen las especificaciones?.
Solucin: 0,9473


5.7.19.- Un comerciante compra rels elctricos en lotes de 1.000 unidades. En cada
lote se seleccionan 15 unidades, y el lote se acepta si el nmero de unidades
defectuosas es menor o igual que 3. El fabricante sabe que hay un 10% de unidades
defectuosas en cada lote, cul es la probabilidad de que sea rechazado un lote?
Solucin: 0,0555


5.7.20.- En una fbrica el nmero de accidentes por semana sigue una distribucin
de Poisson de parmetro =2. Se pide:
a) Probabilidad de que en una semana haya algn accidente
b) Probabilidad de que hayan 4 accidentes en el transcurso de 2 semanas
c) Probabilidad de que hayan 2 accidentes en una semana y otros 2 en la
siguiente
d) Es lunes, y ya ha habido un accidente. Calcular la probabilidad de que en esa
semana no haya ms de tres accidentes.

5. Principales distribuciones discretas
-134-
Solucin: a) 0'8646 b) 0'1954 c) 0'0733 d) 0'8348

5.7.21.- Un partida de diamantes industriales con una proporcin de inservibles de
15% sale al mercado en paquetes de 4 unidades y en cajas de 10 paquetes, elegida
una caja al azar calcular la probabilidad de que contenga 2 paquetes con al menos un
diamante defectuoso.
a) 00567
b) 01860
c) 02456
d) 00836

5.7.22.- Una lnea de fabricacin est compuesta por un nmero considerable de
robots Cul es el nmero de robots de reserva que se precisan en una semana para
tener una probabilidad al menos del 90% de que al averiarse cualquier robot podr
sustituirse?. Se sabe por experiencia que el promedio de averas es de 95 a la
semana.
a) 10
b) 16
c) 13
d) 14

5.7.23.- En una empresa de electrnica se reciben componentes en lotes de gran
tamao. Un lote se considera correcto si tiene menos de un 1 de piezas
defectuosas. Se toma una muestra de tamao n y si no aparece ninguna defectuosa
se acepta el lote. Calcular el tamao de muestra mnimo que se debe tomar si
queremos cometer un error de segunda especie con probabilidad menor del 8%
cuando el porcentaje de piezas defectuosas en el lote sea del 1%
a) 230
b) 240
c) 252
d) 265

5. Principales distribuciones discretas
-135-

5.7.24.- De un paquete de bolgrafos en los que hay un 18% que no funcionan, cul
es la probabilidad de tener que probar 6 de ellos hasta encontrar 3 que funcionen?.
a) 0.0116
b) 0.0326
c) 0.0097
d) 0.0177

5.7.25.- El nmero medio de defectos por metro cuadrado de una superficie cermica
es de 0.29, cul es la probabilidad de que una superficie de 50 m
2
encontremos 12
o mas defectos?
a) 0.9389
b) 0.2911
c) 0.8200
d) 0.7799


5.7.26.- La probabilidad de que en un telar se produzca al menos una avera en un
da, es del 5%. Calcular, por trmino medio, el nmero de averas que se producirn
semanalmente.
a) 0.359
b) 20.97
c) 0.0513
d) 0.0073


5.7.27.- En un lote de 40 diamantes industriales para mquinas de corte, existe una
probabilidad del 25 % de que un diamante no cumpla las caractersticas fsicas para
ser utilizado. Cuntos diamantes debemos tomar para tener una probabilidad de
0.98785 de que al menos uno nos va a ser til?
5. Principales distribuciones discretas
-136-

a) 8
b) 7
c) 5
d) 3


5.7.28.- Un plan de muestreo de materias primas en lotes de 1000 unidades, consiste
en tomar 10 piezas al azar, y si aparece alguna defectuosa se rechaza el lote.
Calcular la proporcin de piezas defectuosas en un lote que tenga una probabilidad
de ser rechazado, segn dicho plan de muestreo, de 0.1.
a) 0.3162
b) 0.2056
c) 0.0513
d) 0.0104


5.7.29.- Se denomina fiabilidad de un sistema informtico a la probabilidad de que
funcione satisfactoriamente. Supongamos que esta formado por 50 componentes
cuya funcin requiere el correcto funcionamiento de al menos 40 de ellos. La
probabilidad de que cada componente funcione despus de 100 horas es 0.9 y los
componentes se averan independientemente. cual es la fiabilidad del sistema
informtico despus de 100 horas?
Solucin: 0.985


5.7.30.- De una Base de Datos se cogen 20 registros para su verificacin. Se
considera que la Base de Datos es correcta cuando no hay ningn registro
defectuoso. Cual es la probabilidad de aceptar cuando la Base de Datos tiene un
10% de registros defectuosos?


5. Principales distribuciones discretas
-137-
Solucin: 0.12


5.7.31.- Se tiene constatado que 1/3 de una Base de Datos de Clientes de un
empresa son extranjeros. Tomando una muestra al azar de 10 registros de la Base
de Datos, estudiar:
a) Probabilidad de que hayan 2 empresas extranjeras.
b) Probabilidad de que hayan ms de 3 empresas extranjeras.
c) Probabilidad de que hayan como mximo cinco empresas extranjeras.
Solucin: a) 0.1951 b) 0.44 c) 0.9235


5.7.32.- El control de calidad de las carcasas de ordenadores, se realiza tomando 2
unidades y contando el n de defectos que aparecen. El promedio de defectos que se
ha tenido hasta el presente es de 1.3 (entre las dos unidades). Cul es la
probabilidad de que, sin cambios en el proceso, aparezca una muestra con ms de 5
defectos?
Solucin: 0.002


5.7.33.- Si de cada 200 diskettes hay uno con virus, cuntos discos debemos
verificar para tener una probabilidad de 0.85 de encontrar al menos uno con virus?
Solucin: 379

5.7.34.- En un proceso de fabricacin de componentes electrnicos se produce un
0.5% de unidades defectuosas. Dichas componentes se expiden en cajas de 3.000
unidades.
a) Cul puede ser la poblacin de estudio?, y la variable aleatoria?, cmo se
distribuye?
b) Se desea acompaar cada caja con un certificado garantizando que la caja
contiene como mnimo C componentes correctas. cul es el mximo valor que
puede darse a C si se desea que la probabilidad de cumplir la garanta sea
5. Principales distribuciones discretas
-138-
superior al 99%?
Solucin: a) X= B(3000, 0.005) , N(15, 3.863) b) 2976 unidades


5.7.35.- Una persona rellena sus quinielas completamente al azar,
a) Cuntas tendra que rellenar si deseara tener una probabilidad superior al
95% de acertar al menos 13 resultados?
b) Si rellena 100.000 quinielas de la misma forma cul es la probabilidad de
obtener al menos dos veces una de 14 aciertos?
c) Y si rellena 1.000.000 quinielas?
Solucin: a) 494.018 quinielas b) 0.000308 c) 0.01992


5.7.36.- Una empresa de software desea vender un nuevo programa de aplicacin en
empresas, para ello enva publicidad postal a una muestra de 40 empresas,
invitndoles a conocer la ltima novedad de la empresa y ofrecerles un obsequio a
cambio. Los expertos estiman que un 30% de las empresas respondern a la
invitacin pero que, de stas, slo un 20% adquirir el programa. Calcula la
probabilidad de que despus de la demostracin nadie haya decidido comprar el
programa.
Solucin: 0.084


5.7.37.- Una determinada normativa oficial exige que para unos envos de disquetes,
el porcentaje de defectuosos no puede exceder del 10%; con el fin de controlar el
cumplimiento de dicho requisito un servicio de control inspecciona cada partida
seleccionando N disquetes al azar y rechazando el envo si encuentra ms de 2
defectuosos.
a) Calcular cunto debe valer N para que la probabilidad de aceptar un envo
que no satisfaga el requisito de calidad exigido sea inferior al 5 %.
b) Los disquetes se agrupan en cajas de 10 unidades que se envan en
paquetes de 50 cajas. Una caja se considera defectuosa si tiene ms de 1
disquete defectuoso. Si un envo tiene un 10% de disquetes defectuosos cul
es la probabilidad de que un paquete no tenga ninguna caja defectuosa? (definir
5. Principales distribuciones discretas
-139-
las poblaciones y variables aleatorias de estudio en cada caso).
Solucin: a) N= 62 unidades b) p= 0.0000002062


5.7.38.- Para controlar la calidad de las partidas de cierto tipo de piezas que se
reciben en una factora se utiliza el siguiente plan de muestreo en dos etapas:
1 - Se toma una primera muestra de 50 piezas. La partida se acepta si todas las
piezas resultan correctas y se rechaza si hay ms de 2 defectuosas.
2- En el resto de los casos se toma una muestra de otras 50 piezas,
aceptndose definitivamente la partida si en el total de las dos muestras hay
menos de 3 piezas defectuosas y rechazndose en el caso contrario.
a) Qu probabilidad tiene el plan anterior de aceptar una partida que tenga un
1% de piezas defectuosas?.
b) Si todas las partidas que llegan a la factora tienen un 1% de piezas
defectuosas, en promedio qu nmero de piezas se examinarn por partida?
Solucin: a) 0.9285 b) 69.04 unidades revisadas

5.7.39.- Se sabe que una mecangrafa comete en promedio un error cada 1000
caracteres tecleados. Calcular la probabilidad de que en un escrito que contiene 3000
letras haya ms de dos errores.
Solucin: 0.577

5.7.40.- Una pea juega a las quinielas 1000 boletos cada semana manteniendo 6
partidos fijos rellenando al azar los resultados (1, X 2) de los 8 restantes.
Supongamos que la pea acierta siempre los resultados de los 6 fijos:
a) Cmo se distribuye la variable aleatoria X: nmero de aciertos en una
quiniela?
b) Un boleto resulta premiado si ha acertado al menos 12 resultados, cmo se
distribuye la variable aleatoria Y: nmero de boletos premiados obtenidos en una
semana?
c) La pea juega todos los aos de la forma indicada las 40 jornadas en las que
hay quinielas, cmo se distribuye la variable aleatoria Z: nmero de semanas
en que la pea obtiene algn premio a lo largo del ao? (definir tambin la
poblacin y sucesos de estudio en todos los casos, y no considerar el partido del
5. Principales distribuciones discretas
-140-
pleno al 15, es decir slo 14 partidos).
Solucin: a) X: B(14, 0.33) b) Y: B(1000, 0.0196) N(19.66, 4.43) c) Z: B(40,1)


5.7.41.- Un campo de naranjos es atacado por una plaga de mosca del Mediterrneo
y se sabe que cada mosca deposita sus huevos (es decir "pica") en una sola naranja.
Suponiendo que en el huerto hay 200.000 naranjas y que es atacado por 50.000
moscas
a) Cul es la probabilidad de que una naranja tenga ms de una picada?.
b) Si las naranjas del huerto se vendieran en bolsas de 10 unidades cul sera
la probabilidad de que hubiera 10 naranjas sanas en la bolsa? (definir las
poblaciones y variables aleatorias de estudio en cada caso, as como los
supuestos para las que estn justificadas las distribuciones propuestas).
Solucin: a) 0.0265 b) 0.082


5.7.42.- Se sabe que el 1 por mil de las ostras que se encuentran en determinada
zona tiene una perla en su interior. Para hacer una determinada joya se precisan 5
ostras. cul es el nmero mnimo de ostras que hay que coger si se desea tener una
probabilidad superior al 95% de reunir las 5 perlas necesarias?.
Solucin: 9000 ostras

5.7.43.- Una determinada pieza de una mquina sufre a lo largo de su funcionamiento
impactos accidentales que la van deteriorando progresivamente. Estos impactos, no
apreciables exteriormente, se presentan siguiendo un proceso de Poisson de
parmetro =0.4 impactos por hora.
Se sabe que, a causa del deterioro ocasionado, la pieza falla al recibir el
decimoquinto impacto. Con el fin de evitar el fallo de la pieza, que puede
ocasionar serios daos a toda la mquina, la seccin de mantenimiento ha
decidido sustituir sistemticamente la pieza por otra nueva tras cada Z horas de
funcionamiento.
Cunto debe valer como mximo Z, si se desea que la probabilidad de fallo de
una pieza sea inferior a 0.05?

5. Principales distribuciones discretas
-141-
Solucin: 21.57


5.7.44.- La prdida espontnea de informacin de un "bit" almacenado en una
memoria de clculo se denomina fallo S. Este tipo de fallo no es muy frecuente
apareciendo en promedio uno por cada milln de horas y por "bit" almacenado. Sin
embargo, cuando el "chip" est expuesto a partculas alfa (ncleos de Helio), lo que
ocurre de forma natural en el ambiente, esta probabilidad de fallo S se ve
incrementada, siendo igual a 1 fallo por cada 1000 horas.
Si "chips" que contienen 6000 "bits" son expuestos a partculas alfa:
a) Qu distribucin sigue la variable aleatoria X: nmero de fallos S por hora en
un "chip"? Cul es la poblacin objeto de estudio? Justifica las respuestas.
b) Cul es la probabilidad de que en una hora haya al menos un fallo S en un
"chip"?. Sera anormal que hubiera cinco o ms fallos S en una hora? Justifica
la respuesta obteniendo la probabilidad del suceso correspondiente.
c) Si un mdulo contiene dos "chips" de estas caracterstica, sera extrao que
en dicho mdulo hubiera ms de 20 fallos S en una hora? Justifica la respuesta
obteniendo la probabilidad del suceso correspondiente.
d) Cul es la mediana de la distribucin del nmero de fallos S por mdulo y
por hora? Qu indica? Cul crees que ser el coeficiente de asimetra de esta
distribucin? Justifica las respuestas.
Solucin: a) 0.998 b) 9 0.715 c) 0.01 d) 12 y CA=0


5.7.45.- Para poder aceptar las partidas de diskettes que ofrece un nuevo proveedor,
una multinacional exige que el porcentaje de diskettes con algn sector defectuoso
no puede exceder el 2.5%.
Con el fin de controlar el cumplimiento de este requisito, un servicio de control en
recepcin inspecciona cada envo, seleccionando N diskettes al azar y rechazando
dicho envo si encuentra ms de dos diskettes defectuosos.
a) Calcular cunto debe valer N para que la probabilidad de aceptar un envo
que no satisfaga el requisito exigido sea inferior al 5%. (Utilizar aproximacin de
Poisson).
b) Los diskettes se comercializan en paquetes de 10 unidades, y a su vez los
paquetes se envan en cajas de 15 paquetes cada una. Un paquete se considera
5. Principales distribuciones discretas
-142-
defectuoso si tiene ms de 1 diskette daado. Si un envo tiene un 8% de
diskettes defectuosos:
b1) Cmo se distribuye la variable aleatoria X: nmero de paquetes
defectuosos en una caja?
b2) Sobre qu poblacin estar definida X?
b3) Cul es la probabilidad de que una caja no tenga ningn paquete
defectuoso?
Solucin: a) N>248 b3) 0.044


5.7.46.- Un canal binario simtrico transmite los dgitos 0 y 1. Se supone que hay una
probabilidad de 0,2 de que al transmitir uno de los nmeros se reciba otro a causa de
ruidos o perturbaciones. supongamos que se enva un mensaje importante y para
transmitir "0" enviamos "000" y anlogamente para "1" enviamos "111". Se supone
que el receptor al traducir la seal recibida utiliza la regla de la mayora.
Ejemplo:
Si se recibe "110" se traduce como 1
Si se recibe "010" se traduce como 0
... ... ...
Cul es la probabilidad de que al traducir una seal sea errnea?
Solucin: 10.4%

5. Principales distribuciones discretas
-143-
5.8. PROBLEMAS Y CUESTIONES DE EXMENES

5.8.1.- En un taller se ha recibido un envo de 150 tuercas de rosca mtrica 5, 2500
tuercas de rosca mtrica 6 y 2350 tuercas de rosca mtrica 7. Por un error del
proveedor vienen todas mezcladas en una nica caja.
a) Si tomamos 10 tuercas al azar, calcular la probabilidad de que haya
exactamente 5 de rosca mtrica 6. (0,5 puntos)
b) Ahora separamos una caja con 100 tuercas elegidas al azar Cul es la
probabilidad de que haya ms de 2 y menos de 5 tuercas de rosca mtrica 5?
(0,5 puntos)
c) Si un operario necesita exactamente 4 tuercas de rosca mtrica 6. Si las va
cogiendo una a una al azar Cul es la probabilidad de que tenga que sacar
exactamente 7 tuercas hasta conseguir las 4 necesarias? (0,5 puntos)
d) Si un operario coge un puado de 10 tuercas Cul es la probabilidad de que
haya exactamente 5 de rosca mtrica 6 y otras 5 de rosca mtrica 7? (0,5
puntos)
e) Si necesitamos exactamente 5 tuercas de rosca mtrica 5 Cuntas
deberemos coger aleatoriamente para garantizarnos una probabilidad del 90%
de que conseguiremos las 5 necesarias? (1 punto)

SOLUCIN
a) Llamando a X= nmero de roscas de mtrica 6, sta sigue una distribucin
binomial de parmetros,
) 5 , 0 ; 10 ( )
5000
2500
; 10 ( B p n B X = =
La probabilidad pedida es
2461 , 0 5 , 0 252 5 , 0 5 , 0
5
10
) 5 (
10 5 5
= =
|
|
.
|

\
|
= = X P
b) Llamando ahora a X= nmero de roscas de mtrica 5, sta sigue una distribucin
binomial de parmetros,
) 03 , 0 ; 100 ( )
5000
150
; 100 ( B p n B X = =
Y esta distribucin, como n>30 y p<0,1 y np<5, se puede aproximar a una distribucin
de Poisson de parmetros ) 3 ( Ps = . La probabilidad pedida es,

5. Principales distribuciones discretas
-144-
3911 , 0 4232 , 0 8153 , 0 ) 2 X ( P ) 4 X ( P ) 5 X 2 X ( P = = s s = < >
c) Si llamamos a X= nmero de tuercas que sacamos hasta tener 4 de mtrica 5,
sta es una distribucin binomial negativa de parmetros,
) 5 , 0 p ; 4 r ( BN X = =
La probabilidad de que exactamente X sea 7 es,
r r
) p 1 ( p
1 r
1
) X ( P
v

|
|
.
|

\
|

v
= v =
1563 , 0 5 , 0 20 ) 5 , 0 1 ( 5 , 0
1 4
1 7
) 7 X ( P
7 4 7 4
= =
|
|
.
|

\
|

= =


d) En este caso la X se trata de una distribucin multinomial de parmetros,

) 47 , 0 p 5 , 0 p 03 , 0 p ; 10 n ( M X
3 2 1
= = = =
Y la probabilidad pedida es,
1806 , 0 47 , 0 5 , 0 03 , 0
! 5 ! 5 ! 0
! 10
) 5 , 5 , 0 (
5 5 0
3 2 1
= = = = = X X X P
e) El nmero de roscas de mtrica 5 que hay en n elegidas al azar, sigue una
distribucin binomial de parmetros,
) 03 , 0 ( ) 03 , 0 ; ( n Ps p n B X = ~ =
La condicin impuesta es que 9 , 0 ) 5 ) 03 , 0 ( ( > > n Ps P , y su contraria es
10 , 0 ) 4 ) 03 , 0 ( ( s s n Ps P
Buscando en las tablas se tiene que 8 n 03 , 0 = = de donde,
267 67 , 266
03 , 0
8
= = > n


5.8.2.-
a) En la empresa FORD ESPAA S.A. se lleva a cabo el control de calidad del
proceso de imprimacin de las carroceras contando los defectos de todo tipo
(rayas, manchas, pelusas, crteres,) que aparecen en las carroceras antes
5. Principales distribuciones discretas
-145-
de proceder al lijado de dichos defectos como paso previo al pintado de las
carroceras. El ingeniero de calidad de la planta propone un plan de control de
calidad consistente en contar los defectos en 2 carroceras y rechazar que el
proceso sea correcto si en total aparecen ms de C defectos. Cul debe ser
ese valor C si queremos que cuando el promedio de defectos por carrocera
sea de 1,45 aceptemos el proceso como correcto en el 99% de los casos?(1,5
puntos)
b) En la misma empresa se inspeccionan las grapas de sujecin de la tapicera
cogiendo n grapas y aceptando el lote si en ellas aparece como mximo 5
defectuosas. Cul debe ser el nmero de grapas a inspeccionar si queremos
que un lote con solo un 1% de grapas defectuosas sea aceptado con una
probabilidad mayor del 99%? (1,5 puntos)
SOLUCIN
a) El nmero de defectos en una carrocera es una variable X=Ps() y en dos
carroceras Y=X
1
+X
2
=Ps(2).
Segn la propuesta habr que calcular un C tal que
P(Ps(2
x
1,45)C)=0,99.
En las tablas de la variable de Poisson esto ocurre para C=7
b) El nmero de grapas defectuosas en una muestra de n grapas es X=B(n,
P)Ps(nP) (despus comprobaremos la aproximacin)
Habr que buscar n para que
P(Ps(n0,01)5)=0,99
En las tablas de la Poisson, para =1,70 tenemos p(Ps(1,70)5)=0,9920 (>0,99)
Luego =1,70=n0,01n=170
Justificacin: n=170 >50, p=0,01<0,10 y nP=1,70< 5 luego vale la aproximacin


5.8.3.- El director de una fbrica, un Graduado en Tecnologas Industriales, debe
decidir el nmero de operarios de una cierta seccin de la fbrica que va a
contratar. Dichos operarios procesan unidades de un cierto producto, que llegan a
su seccin cada maana a primera hora. El nmero de unidades de dicho
producto que llega a la seccin cada da se distribuye segn una Poisson con
media 5. Cada operario puede procesar una y slo una unidad por da. Las
unidades que no se procesen se acumulan en un contenedor nico y sern
eliminadas mediante el uso de una mquina recicladora, lo que genera un coste
5. Principales distribuciones discretas
-146-
igual a 1000 por da que se utilice (independientemente del nmero de unidades
que tenga que reciclar).

a) Cuntos operarios tendr que contratar como mnimo para asegurarse que,
con una probabilidad del 95%, todas las unidades que llegan en un da
cualquiera sern procesadas? (1.25 puntos)

b) Suponiendo que se dispone de 9 operarios, cul es la probabilidad de que se
tenga que usar la mquina recicladora ms de 5 veces en un ao? Cul ser,
en promedio, el gasto de la fbrica en la mquina recicladora por ao?
(Suponer que la fbrica opera 300 das al ao). (1.25 puntos)

c) En promedio, cuntos das pasarn a partir de hoy hasta que la mquina
recicladora tenga que actuar por primera vez? Y por segunda vez? (0.5
puntos).
SOLUCIN
a) X=Ps(5)
Hay que buscar a/ P(Ps(5)a)0,95 segn baco P(Ps(5)9)=0,97 a=9
trabajadores

b) Segn los datos anteriores P(Ps(5)>9)=0,03 que es la probabilidad de que en
un da tengamos que utilizar la recicladora por uno o ms equipos reciclados
El nmero de das en 300 que se utiliza la recicladora X=B(n=300, P=0,03)=Ps(9)
P(X>5)=1-P(X5)=1-P(Ps(9)5)=1-0,12=0,88
El coste anual de la recicladora es Y=1000X y su valor medio
E(Y)=1000E(X)=1000 x 9 =9000 Euros/ao
c) Das hasta 1 vez X=Bn(r=1, P=0,03) E(X)=r/P= 1/0,03=33,33
Das hasta 2 vez X=Bn(r=2, P=0,03) E(X)=r/P= 2/0,03=66,66
5. Principales distribuciones discretas
-147-

5.8.4.- Una empresa de telefona mvil factura un 5% de llamadas de duracin
superior a 10 minutos.
a) Calcular la probabilidad de que en 15 llamadas elegidas al azar haya
exactamente 1 con duracin superior a 10 minutos (1 punto)
b) Cul es el promedio de llamadas que tendremos que verificar hasta
encontrar 10 con duracin inferior a 10 minutos? (1 punto)
SOLUCIN
a) El nmero de llamadas con duracin superior a 10 en una muestra de n=15
llamadas, si sabemos que hay un 5% de llamadas con duracin superior a ese tiempo
ser una variable
X=B(n=15; P=0,05)
3658 , 0 ) 05 , 0 1 ( 05 , 0
1
15
) 1 (
14 1
=
|
|
.
|

\
|
= = X P La

b) El nmero de llamadas hasta obtener 10 con una duracin inferior a 10 ser una
variable X=BN(r=10;P=0,95)
y su valor medio E(X)=r/P=10/0,95=10,526
5. Principales distribuciones discretas
-148-

6. Principales Distribuciones Continuas
-149-
TEMA 6. PRINCIPALES DISTRIBUCIONES CONTINUAS

Contenido
6.1. DISTRIBUCIN UNIFORME ................................................................... 149
6.2. DISTRIBUCIN EXPONENCIAL ............................................................. 150
Tasa de fallos .................................................................................................. 152
6.3. DISTRIBUCIN NORMAL UNIDIMENSIONAL ....................................... 154
6.3.1. Variable normal tipificada ...................................................................... 155
6.3.2. Variable normal general......................................................................... 158
6.3.3. Teorema central del lmite ..................................................................... 160
Aproximacin de la binomial a la normal ........................................................ 161
Aproximacin de la Poisson a la normal .......................................................... 162
Correccin por continuidad .............................................................................. 163
6.4. LA DISTRIBUCIN NORMAL BIDIMENSIONAL ..................................... 165
Distribuciones marginales ............................................................................... 166
Distribuciones condicionales ........................................................................... 166
6.5. PROBLEMAS PROPUESTOS .................................................................... 169
Distribucin uniforme ....................................................................................... 169
Distribucin exponencial.................................................................................. 170
Distribucin Normal ......................................................................................... 172
Distribuciones bidimensionales ....................................................................... 182
6.6. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 185


6.1. DISTRIBUCIN UNIFORME

La variable aleatoria X sigue una distribucin uniforme en el intervalo [a;b] cuando
cualquier punto del mismo tiene la misma densidad de probabilidad. De este modo la
funcin de densidad es constante en todo el intervalo de definicin de la variable, tal
y como se expresa en la figura de abajo,


Figura 6. 1. Funcin de densidad de la distribucin uniforme

b

a

f
x
(x)

X

6. Principales Distribuciones Discretas
-150-
El valor de la altura de la funcin de densidad tiene que ser de tal forma que el rea
bajo dicha funcin y el eje de abscisas sea la unidad. De aqu que la funcin de
densidad sea,

a b
1
) x ( f

=

La funcin de distribucin viene dada por,
a b
a x
dx
a b
1
x dx ) x ( f ) x ( F
x
a
x
a

= =
} }


El valor medio es,
} }
+
=

=
(

= =
b
a
2 2
b
a
2
b
a
2
a b
) a b ( 2
a b
2
x
a b
1
dx
a b
1
x dx ) x ( f x ) X ( E

Y la varianza se calcula como,
( )
12
) a b (
) X ( E ) X ( E ) m X ( E ) X ( D
2
2 2 2
x
2

= = =



Actividad 6.1:
- A partir de un valor al azar entre 0 y 1, obtener un valor al azar de una
uniforme entre 1 y 6.



6.2. DISTRIBUCIN EXPONENCIAL

Sea X una v.a. no negativa con funcin de densidad



a esta v.a. se denomina distribucin exponencial, y se representa por ) ( X EXP .


El valor medio y la varianza son:

1
= E(X)

2
2
1
= (X)
D

y la funcin de distribucin es:
s + < x 0 para
e
= f(x)
x -

6. Principales Distribuciones Continuas


-151-





Figura 6. 2. Funcin de densidad exponencial



Figura 6. 3. Funcin de distribucin de la exponencial


Cuando veamos la distribucin de Poisson, definamos el "proceso de
Poisson" como aquel que cuenta el nmero de sucesos hasta un tiempo t, cuya
funcin de probabilidad es:

El tiempo aleatorio entre dos sucesos viene dado por la distribucin
exponencial. As, llamando a "T" la v.a. que indica el tiempo hasta el siguiente
!
) t .(
e
= ) = P(X(t)
t -
v

v
v


x
1
F
X
(x)
6/ 4/ 3/ 2/ 1/ 5/ 0
0 1/ 2/ 3/ 4/ 5/ 6/
X

f
X
(x)
6. Principales Distribuciones Discretas
-152-
suceso, se cumple que ese tiempo ser mayor que uno en concreto "t", siempre y
cuando de o a t, no haya ocurrido nada, esto es:

y la funcin de distribucin es:

que es la funcin de distribucin de la exponencial y es un modelo matemtico muy
empleado en el clculo los tiempos de vida de un elemento en su periodo de vida til.

Otra caracterstica de la exponencial es la falta de memoria, es decir,
sabiendo que es mayor que cierto valor, la probabilidad de que sea mayor que otro
valor ms avanzado es independiente de lo anterior al primer valor, esto es:



Actividad 6.2:
- A partir de un valor al azar de una uniforme entre 0 y 1, obtener un valor al
azar de una exponencial de media 20.
- Cul es la probabilidad de obtener un valor menor que la media de una
distribucin exponencial?
- Cunto vale la mediana de una distribucin exponencial de media 20?



Tasa de fallos

Se trata del nmero de fallos por unidad de tiempo que tiene lugar en una poblacin
de muchos elementos. Matemticamente se define como un lmite de la probabilidad
que un elemento falle en el intervalo de t a t+At, cuando sabemos que el elemento
estaba funcionando en el instante t, todo eso dividido por incremento de t y cuando
este incremento tiende a cero. La expresin que resulta es:


e
=
0!
) t .(
e
= 0) = P(X(t) = t) > P(T
t -
0
t -


e
- 1 = t) > P(T - 1 = (t)
F
t -
T


e
=
e
e
=
t) > P(X
s) + t > P(X
= t) > s/X + t > P(X
s -
t
s) + (t -


6. Principales Distribuciones Continuas
-153-


La funcin R(t) = P(T>t) es la probabilidad que el elemento est en
funcionamiento durante un tiempo t, y se define como la fiabilidad de dicho elemento.

La tasa de fallos h(t) viene a ser la velocidad de extincin de los elementos de
una poblacin. Si dibujamos la funcin h(t) tomando como abscisas el tiempo, la
forma es como se ve en la Figura 6. 4.


h(t)=
Tasa de fallos
(funcin de azar)
t=tiempo
precoces
accidentales
fatiga

Figura 6. 4. Tasa de fallos


A esta curva se llama curva en baera. En ella se distinguen claramente tres zonas:

1. Zona A, de fallos precoces o infantiles. Es la etapa de fallos en garanta. Al
principio hay muchos elementos que fallan y poco a poco va decreciendo la
velocidad de fallos.
2. Zona B, de fallos accidentales. Los fallos en esta etapa son accidentales o
debidos al azar. Es la etapa de madurez o periodo de vida til y la tasa de
fallos h(t) es constante en el tiempo.
3. Zona C, de fallos por envejecimiento. A partir de una determinada edad
aparecen fallos por desgaste o envejecimiento de los elementos.

La distribucin exponencial es representativa de los fallos accidentales, donde h(t)
es constante. As, para la distribucin exponencial la tasa de fallo es:




6. Principales Distribuciones Discretas
-154-
Y es la constante de esa tasa de fallo, que expresa el nmero de fallos por
unidad de tiempo. Tener en cuenta que la media de la variable exponencial es
justamente la inversa de esa tasa de fallos.

En las otras dos zonas, la tasa de fallo se puede aproximar por medio de una
ecuacin lineal de la forma
h(t)=|(t)
|-1
De manera que:

- Si = 1, h(t) = y se trata de la distribucin exponencial.
- Si > 1, h(t) es creciente y es representativo de la zona por
envejecimiento. La distribucin que sigue los tiempos de fallo es una
Weibull.
- Si <1, h(t) es decreciente y es representativo de la zona infantil. La
distribucin del tiempo de fallo es tambin una Weibull.

La tasa de fallo tiene mucha importancia en la Ingeniera de Fiabilidad y del
Mantenimiento


6.3. DISTRIBUCIN NORMAL UNIDIMENSIONAL

La distribucin ms importante, tanto por aspectos tericos como prcticos, es la
distribucin normal, la ms empleada y la que modeliza el mayor nmero de
comportamientos de la vida real.

La primera vez que se emple la distribucin normal fue durante el siglo XVIII
en la observacin de los errores de medicin, de forma que sus valores se ajustaban
bastante bien a una curva en forma de campana. La primera vez que se utiliz esta
distribucin fue debido a Moivre en 1733, para demostrar la aproximacin de la
binomial a la distribucin normal. Esta distribucin fue conocida tambin por Laplace
hacia el ao 1775, para demostrar que la suma de los efectos de muchas variables
cada una con poca importancia en relacin a las dems, era una distribucin normal.
No obstante debido a un error histrico, se atribuy a Gauss, cuya primera referencia
apareci en 1809, y por ello tambin se le da el nombre de "campana de Gauss" o
distribucin Gaussiana.

En un principio se pensaba que todas las distribuciones seguan una campana
de Gauss, de ah su nombre de "normal" o "estndar" para referirse a ella, ya que era
lo normal es que apareciera.


6. Principales Distribuciones Continuas
-155-
6.3.1. Variable normal tipificada

Aquella variable continua, con campo de existencia en toda la recta real, y con
funcin de densidad

+ < x < - para
e
2
1
= f(x)
x
2
1
-
2
t


se denomina variable "normal tipificada", y se representa por N(0;1) X .

f(x) es una funcin de densidad, ya que 0 f(x) > y se demuestra que su
integral para todo el campo de existencia vale la unidad. La forma de la funcin f(x)
aparece en la Figura 6. 5.



Figura 6. 5. Funcin de densidad de la normal N(0;1)


El rea que hay bajo la curva f(x), la cual tiene forma de campana, y la recta
real vale la unidad.
1 = f(x)dx
+
-
}



Del estudio de la curva f(x) se deducen las siguientes propiedades:

1) Asntotas.



2) Simtrica respecto a x=0.
-3 -2 -1 2 1 3 0
f
Z
(z)
Z
o
6. Principales Distribuciones Discretas
-156-
f(-x) = f(x)

3) Tiene un mximo en el punto x=0.

4) Para 0 < x es creciente y para 0 > x es decreciente.

5) En -1 = x y +1 = x hay puntos de inflexin, y es cncava para 1 |> x | , y convexa
en aquellos puntos en que 1 |< x | .

Todas estas propiedades corroboran la forma de campana que tiene la
funcin de densidad.

La media es y la varianza son:

0 = = E(X)
1
o



de ah la notacin de N(0;1) para caracterizar a la distribucin, donde 0 corresponde
a la media, y 1 a la desviacin tpica.

Una de las caractersticas de la distribucin Normal es que la distribucin de
probabilidades es siempre la de la figura 6.6


-3o
9973%
9544%
6826%
-2o -1o +2o +1o +3o
X


Figura 6.6. reas bajo la campana de Gauss
La funcin de distribucin de la N(0;1) es

dx
e
2
1
= F(x)
x
2
1
-
x
-
2
t
}



y para cada valor de x se obtiene un valor. Como la integral no es inmediata, se ha
tabulado su valor para cada punto x, de esta manera tenemos las reas a la izquierda
para cada punto, segn la Figura 6..
6. Principales Distribuciones Continuas
-157-



Figura 6.7. Funcin de distribucin de la normal N(0;1)


Los valores de la normal tipificada o estndar, tambin se representan por z, y
mediante el smbolo z
o
expresamos aquel valor de la abscisa que tiene a su derecha
una probabilidad o , segn la Figura 6. 6


Figura 6. 6. rea a la derecha de un valor de la normal N(0;1)

De la Figura 6. 5 se deduce que
o o
o
o
- 1 = f(x)dx = f(x)dx
z
-
+
z
} }





Actividad 6.3:
- Calcular las siguientes probabilidades de una normal tipificada:
o P(Z<1)
-3 -2 -1 2 1 3 0
f
Z
(z)
Z
o
o
z
o
-3 -2 -1 2 1 3 0
f
Z
(z)
Z
o
F
Z
(z)
6. Principales Distribuciones Discretas
-158-
o P(Z>2)
o P(-1<Z<+1)
o P(-1.25<Z<2.37)


- Calcular los siguientes valores de la normal tipificada:
o P(Z<a)=0.60
o P(Z>a)=0.35
o P(-a<Z<+a)=0.95
o Z
0.05

o Z
0.90




6.3.2. Variable normal general

Dada la v.a. normal tipificada N(0;1) X , si aplicamos la transformacin lineal
b + aX = Y

resulta la distribucin normal general, cuyo campo de existencia es toda la recta real.

El valor medio de Y es,

y
= b = b + 0 a = b + E(X) a = b) + X E(a = E(Y)

es decir, el coeficiente b coincide con la media de la distribucin.

La varianza de Y es
2
Y
2 2 2 2 2
= .1
a
= (X)
D a
= b) + (aX
D
= (Y)
D
o
de donde "a" puede ser positivo o negativo, pero su mdulo coincide con la
desviacin tpica de y, as:
o |= a | esto es o + = X Y
La variable Y se representa por ) ; N( Y o , ya que conociendo o y
conocemos todas sus caractersticas.

La funcin de densidad de Y es, a partir de la frmula del cambio de variable,

dx
dy
1
(x(y)) f =
dy
dx
(x(y)) f = (y) f
x x y

| |
- y
= x
o


6. Principales Distribuciones Continuas
-159-
despejando x,
e
2
1
=
| a |
1
.
e
2
1
= (y) f
2
2
2
2
) - (y
2
1
-
) - (y
2
1
-
y
o

t o t


Se observa que esta funcin es simtrica respecto de , y tiene los puntos de
inflexin en o .


La funcin de distribucin es:

dy
e
2 .
1
= F(y)
- y
2
1
-
y
-
2
|
.
|

\
|

}
o

t o


Como para cada valor de o y habra que tener una tablas con todas las
reas a la izquierda, lo que se hace es tipificar la variable y calcular el rea de la
normal tipificada. "Tipificar" o "estandarizar" una variable significa restar su valor
medio y dividirla por la desviacin tpica. As,

|
.
|

\
|
s s
o

o
- a - Y
P = a) P(Y


y la variable
o
- Y
tiene una distribucin N(0;1) , por lo tanto:

|
.
|

\
|
|
.
|

\
|
s s
o

|
o
- a
=
- a
N(0;1) P = a) P(Y


y
o
expresa el valor de Y que deja a su derecha un rea de o .



Actividad 6.4:
- De una variable aleatoria normal de media 15 y desviacin tpica 1.5, calcular
las siguientes probabilidades:
P(Y<16)
P(Y>12.5)
P(12<Y<17)




La combinacin lineal de un conjunto de variables normales e independientes, es a
6. Principales Distribuciones Discretas
-160-
su vez otra distribucin normal. Esto es, si
X
,...,
X
,
X n 2 1
son v.a. normales
) ; N(
X i
i
i o
, e independientes,

X a
....+ +
X a
+
X a
= Y
n n 2 2 1 1


entonces Y sigue una distribucin normal con


n
n
2
2
1
1
y
a
+ ... +
a
+
a
=
o o o
2
n
2
n
2
2
2
2
2
1
2
1
2
a
....+ +
a
+
a
= (Y)
D



6.3.3. Teorema central del lmite

Si Y es una suma de n variables aleatorias independientes que satisfacen ciertas
condiciones generales, entonces para n suficientemente grande, Y se distribuye
segn una v.a. normal.

Ms concretamente, el teorema central del lmite dice que si
X
,...
X
,
X n 2 1
es
una secuencia de n v.a. independientes con
i
i
= )
X
E( y
oi i
2
= )
X
(
D
, y
X
...+ +
X
+
X
= Y
n 2 1
, entonces la suma tipificada

o

2
i
n
=1 i
i
n
- Y
=
S



converge a una distribucin normal N(0;1) .

Cada
Xi
representa una aportacin a la suma Y, la cual es de pequea
importancia en relacin a las dems, pero la suma de muchos factores de pequea
importancia cada uno de ellos, da lugar a la distribucin normal.

Un caso particular del teorema central del lmite es cuando todas las variables
aleatorias son independientes y tienen la misma distribucin. Esta propiedad se
recoge como el Teorema de Lindenberg-Levy.

Dicho teorema dice que para una sucesin de variables aleatorias
independientes
X
,...,
X
,
X n 2 1
, la suma tipificada converge a una distribucin normal
N(0;1).


6. Principales Distribuciones Continuas
-161-
De esta forma, si E(X
i
)= y D
2
(X
i
)=o
2
, la media y la varianza de
Y=X
1
+X
2
++X
n
es:


n 2 1
n 2 1
+ ... + + = ]
X
+ ... +
X
+
X
E[ = E(Y)
o
2
n 2 1
2 2
n = )
X
...+ +
X
+
X
(
D
= (Y)
D

n = D(Y) o
De aqu que:
n
n - Y
=
Sn
o


converge a una N(0;1).


Aproximacin de la binomial a la normal

Hemos visto que la v.a. binomial se puede considerar como la suma de n variables
aleatorias dicotmicas D(p) cada una de ellas con igual distribucin. En
consecuencia, si n , entonces podemos aplicar el teorema de Lindenberg-Levy,
y la suma tipificada converge a una distribucin normal N(0;1).

De esta forma

X
....+ +
X
+
X
= Y p) B(n, Y
n 2 1

pq = )
X
(
D
p = )
X
E( D(p)
X i
2
i i



de donde np ) Y ( E = y npq ) Y ( D
2
= por lo que
N(0;1)
npq
np - Y
=
Sn

Ello equivale a decir que:

) npq N(np; > - - - - - - - - - - p) B(n,

La aproximacin a la normal es bastante buena cuando se dan las siguientes
condiciones:

1) 30 > n .
2) 9 , 0 p 1 , 0 < <
3) 5 p n >


6. Principales Distribuciones Discretas
-162-


Figura 6. 7. Aproximacin de la Binomial a la Normal


Aproximacin de la Poisson a la normal

La distribucin de Poisson de parmetro , por su propiedad aditiva, se
puede considerar como la suma de variables independientes de parmetro "1", y
en consecuencia tambin podemos aplicar el teorema de Lindenberg-Levy. De este
modo:

X
... +
X
+
X
= Y ; ) PS( Y
2 1

1 = )
X
(
D
; 1 = )
X
E( ; PS(1)
X i
2
i i


cuando
N(0;1)
- y
=
1
1 - Y
=
Sn



lo cual es equivalente a

) , N( > -- - - - - - - - - - ) PS(

La aproximacin es bastante buena a partir de 5 > .

B(10,01)
B(40,02)
Distribucin Binomial
x
P
X
(x)
0 10 20
0
0,1
0,2
0,3
0,4
6. Principales Distribuciones Continuas
-163-


Figura 6. 8. Aproximacin de la Poisson a la Normal


Correccin por continuidad

Al aproximar la distribucin binomial o la de Poisson a una normal, estamos pasando
de una variable discreta a otra continua, y al calcular probabilidades se comete un
error que puede ser apreciable cuando np o bien estn entre 5 y 25. Cuando np o
bien son elevados, el error cometido no es muy importante.

Por ejemplo, supongamos que X sigue una distribucin de Poisson de
parmetro =8, y nos piden calcular la probabilidad P(X>10). Aplicando la distribucin
de Poisson,

1841 , 0 8159 , 0 1
! c
8 e
1 ) 10 X ( P 1 ) 10 X ( P
10
0 c
c 8
= = = s = >

=




Mediante la aproximacin a la normal es,
2398 , 0 ) 7071 , 0 Z ( P
8
8 10
Z P ) 10 X ( P = > = |
.
|

\
|
> = >
La diferencia con el valor exacto de la Poisson es muy apreciable.

Grficamente es,

Ps(10)
Ps(2)
Distribucin de Poisson
x
0 5 10 15 20 25
0
0,05
0,1
0,15
0,2
0,25
0,3
P
X
(x)
6. Principales Distribuciones Discretas
-164-
Histogram for X
10
X
0
4
8
12
16
f
r
e
q
u
e
n
c
y
11 9
10,5
Error sin la correccin por continuidad
rea exacta de 0,1841

Figura 6. 9. Correccin por continuidad

El error sera menor si al efectuar la aproximacin a la variable continua, en
lugar de calcular el rea a la derecha de 10, tomramos el rea a la derecha de 10,5,
y as el clculo es,
1884 , 0 ) 8839 , 0 (
8
8 5 , 10
) 5 , 10 ( ) 10 ( = > =
|
|
.
|

\
|
> = > = > Z P Z P X P X P

Y esto es mucho mejor aproximacin al valor exacto de 0,1841 que sin hacer
esta correccin por continuidad.

De esta forma, si el rea pedida hubiera sido,
) ( b X a P < <

Al pasar a una variable continua, y teniendo en cuenta que las desigualdades
puede ser estrictas o no, para el caso anterior la correccin por continuidad es,
) 5 , 0 5 , 0 ( s s + b X a P

Grficamente es,



6. Principales Distribuciones Continuas
-165-
a b
P(a<X<b)
9
10 11
9,5 10,5
P(X=10)

Figura 6. 10. Correccin por continuidad


6.4. LA DISTRIBUCIN NORMAL BIDIMENSIONAL

Para una variable aleatoria n-dimensional y

la funcin de densidad conjunta de la


normal general es:

( )
e
| V det
) - y ( V ) - y (
2
1
-
1/2
1 -

t

|
2
1
= ) y f(
n


y en el caso de dos dimensiones, el vector de medias

es:
b
= ) y E( =
b
= ) y E( =
2
2 2
1
1 1


y la matriz V de varianzas-covarianzas es:
(
(

o o
o o
22 12
12 11
= V

Calculando la inversa de V y el determinante de V , la funcin de densidad
bidimensional es:

e
- 1 2
1
= ) y , y f(
2
2 2
2
2
2 2
1
1 1
1
1 1
2
2
- y
+
- y - y
2 -
- y
) - 2(1
1
-
2
2 1
2 1
)

(
(

|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
o

o

o

o o
t


6. Principales Distribuciones Discretas
-166-
Si 0 = la funcin de densidad conjunta se puede expresar como producto
de funciones de densidad marginales y de ah que y e y
2 1
sean independientes. Esta
implicacin solamente se cumple para las variables normales.
Lo anterior equivale a decir que si la matriz de varianzas-covarianzas tiene
todos sus elementos nulos excepto en la diagonal, todas las marginales son
independientes entre si.



Figura 6. 11. Distribucin normal bidimensional


Distribuciones marginales

Las distribuciones marginales siguen otra distribucin normal, es decir,

) , N(
Y
e ) ; N(
Y 2
2
2 1
1
1 o

o


Hay que pensar que la proyeccin de la campana de Gauss sobre cualquiera
de los planos de
Y

Y 2 1
define otra campana de Gauss.

Distribuciones condicionales

Dada la campana de Gauss en tres dimensiones, si efectuamos un corte infinitesimal,
la forma que tiene la distribucin de masas es otra campana de Gauss. La funcin de
densidad condicional de
Y2
sabiendo un valor de y
1
es:
f(y
1
,y
2
)
y
2

y
1

6. Principales Distribuciones Continuas
-167-

) y f(
) y , y f(
= ) y / y ( f
1
1 2
1 2 c

que efectuando las correspondientes operaciones y agrupando trminos es:

|
|
|
|
|
.
|

\
|
|
|
.
|

\
|

o
o

t
o
2
2
1 1
1
2
2 2
2
2
2
1 2 c
- 1
) - y ( + - y
2
1
-
2 - 1
1
= ) y / y ( f exp

En consecuencia, la distribucin condicional es otra normal,

|
|
.
|

\
|

o

o
o

2
2
1 1
1
2
2 1
2
- 1 ); - y ( + N y /
Y


Lgicamente si 0 = queda la distribucin marginal de y
2
.

Lo mismo se puede decir de la distribucin condicional de
Y1
dado un valor
de y
2
:
|
|
.
|

\
|

o

o
o

2
1
2 2
2
1
1 2
1
- 1 ); - y ( + N y /
Y


sin ms que intercambiar los ndices.

Todas las distribuciones condicionales tienen la misma desviacin tpica al no
depender sta del valor y condicionante.

6. Principales Distribuciones Discretas
-168-


Figura 6. 12. Distribucin normal bidimensional con correlacin de 0.6



) y / y ( f
1 2
1
y
2
y
) y / Y ( E
1 2

Figura 6.12. Distribucin condicional de Y2 dado y1.


f(y
1
,y
2
)
y
2

y
1

6. Principales Distribuciones Continuas
-169-
) y / y ( E
2 1
) y / y ( f
2 1
1
y
2
y

Figura 6.13. Distribucin condicional de Y1 dado y2



6.5. PROBLEMAS PROPUESTOS

Distribucin uniforme
6.5.1. Se ha desarrollado un programa de simulacin para una determinada
investigacin que tarda en ejecutarse entre 10 y 30 segundos, siguiendo una
distribucin uniforme. Qu nmero mximo de simulaciones se pueden hacer
para que la probabilidad de tardar ms de 45 minutos sea inferior a 1.5% ?

Solucin: 127


6.5.2. La venta diaria de una fbrica de montaje de ordenadores se adapta a
una distribucin uniforme entre 20 y 40 unidades.

a) Despus de transcurridos 182 das de venta, cul es la probabilidad de
haber vendido ms de 5.600 ordenadores, suponiendo las ventas
independientes de un da para otro?.
b) Cuntos das de venta debemos considerar para asegurar, con un 67% de
probabilidad, la venta de ms de 6.000 unidades?

Solucin: a) 0.036 b) ms de 202 das


6.5.3. El tiempo que tarda un programa en ejecutar un determinado
procedimiento sigue un modelo uniforme de 0 a 12 milisegundos. Calcula:

6. Principales Distribuciones Discretas
-170-
a) La proporcin de ejecuciones superiores a 5 milisegundos.
b) Aplicando la funcin de densidad, el primer y tercer cuartil.

Solucin: a) 0.5833 b) 3 y 9

Distribucin exponencial

6.5.4. La distribucin exponencial se utiliza a menudo para modelizar la
duracin de un sistema. En este caso, la variable X indica el tiempo que funciona
el sistema antes de fallar. Si la duracin de un sistema, en aos, sigue una
distribucin exponencial de media E(X)=6 meses:

a) cul ser la funcin de densidad de la variable aleatoria X?
b) Y la desviacin tpica?
c) cul ser la probabilidad de que el sistema funcione por lo menos durante 1
ao?

Solucin: b) =1/2 c) 0.1353


6.5.5. Si el tiempo de vida de una mquina sigue una distribucin exponencial,
siendo el tiempo medio entre fallos (MTBF) de 200 horas Cual es la
probabilidad de que transcurran ms de 200 horas sin que se produzca una
avera?

Solucin: 0'37


6.5.6. Se ha comprobado que la vida de un diseo de un sistema informtico
sigue una distribucin exponencial con media de 8 aos (sin que se modifique
substancialmente el diseo). Se pide:

a) Calcular la probabilidad de que un diseo tenga una vida entre 3 y 12 aos.
b) La probabilidad de que un diseo que ha vivido sin modificarse ms de 10
aos, perdure 15 aos ms.

Solucin: a) 0,47 b) 0,15335


6.5.7. Una empresa de fabricacin de carcasas de ordenador, tiene tres plantas
de proceso, y todas reciben planchas de metal para cortar y confeccionar las
carcasas (en kg.). La cantidad de Kg. de plancha de metal que puede procesar
una planta en un da se puede representar mediante una funcin exponencial
con un promedio de 4 (en miles de Kg.), para cada una de las tres plantas. Si las
plantas trabajan de forma independiente, calcular la probabilidad de que sean
exactamente dos de las tres plantas las que procesen ms de 4 (miles de Kg.) en
6. Principales Distribuciones Continuas
-171-
un da determinado.

Solucin: 0.26


6.5.8. La duracin X de unos componentes electrnicos flucta aleatoriamente,
verificndose que Prob(X>x)= e
-x
. Se sabe que las componentes duran en
promedio 400 horas de funcionamiento. Qu porcentajes de las componentes
duran ms de 400 horas?

Solucin: 0.37


6.5.9. La probabilidad de que la vida de unos componentes electrnicos sea
superior a t, decrece exponencialmente a medida que aumenta dicho parmetro,
fluctuando aleatoriamente, verificndose que P( V > t )=e
-t
. Se sabe que en el
50% de los casos la vida no sobrepasa 100 horas de funcionamiento.

Calcular la probabilidad de que con dos componentes, la vida del conjunto
sobrepase 100 horas:

a) Situados en paralelo.
b) Situados en serie.

Solucin: a) 0.75 b) 0.25


6.5.10. En el servicio tcnico de mantenimiento y reparacin de una compaa
de ordenadores, el tiempo en horas que transcurre entre dos avisos consecutivos
de avera sigue una distribucin exponencial con media de un cuarto de hora, en
cualquier momento del da. Se pide :

a) Probabilidad de que si a las diez y media se recibe una llamada de aviso, la
prxima se reciba despus de las 11h.
b) Cul es el nmero mximo de avisos que se recibirn entre las once y media
y las trece horas con una probabilidad del 98%?

Solucin: a) 0,1353 b) Aprox. 11 avisos.


6.5.11. El personal de una empresa de ingeniera usa un terminal para realizar
clculos tcnicos. El tiempo que cada tcnico emplea en una sesin es en
promedio 20 minutos. (Asumiendo que dicho tiempo sigue una distribucin
exponencial con
x
e ) x ( f

= ;x>0).

a) Calcular la probabilidad de que un tcnico emplee menos de 20 minutos en su
sesin.
6. Principales Distribuciones Discretas
-172-
b) Cuando un tcnico va a usar el terminal, encuentra que est ocupado por otro
que lleva ya media hora. Cul es la probabilidad de que tenga que esperar
ms de 10 minutos antes de que quede libre?
c) Sabiendo que una maana deben realizarse 10 sesiones en el terminal (cada
una de las cuales empieza nada ms terminar la anterior), calcular
aproximadamente la probabilidad de que todas ellas puedan finalizarse a lo
largo de las 4 horas de la jornada de la maana.

Solucin: a) 0.6321 b) P(X>10) c) 0.7364


6.5.12. Un dispositivo est formado por dos componentes electrnicos iguales A
y B montados en serie. La duracin en horas de funcionamiento de dichos
componentes flucta aleatoriamente siguiendo una distribucin exponencial de
parmetro z. Si por motivos de seguridad es necesario que el dispositivo tenga
una fiabilidad del 99.4% a las t horas de funcionamiento, qu fiabilidad se
requiere a las t horas para cada uno de los dos componentes?

Solucin: 0.997


6.5.13. La duracin de un determinado componente electrnico sigue una
distribucin exponencial de media 1000 horas. Un componente de este tipo lleva
funcionando 300 horas. Cul es la probabilidad de que siga funcionando
durante ms de 700 horas adicionales?

Solucin: 0.496


Distribucin Normal

6.5.14. Si Z es una variable aleatoria N(0,1), hallar:

a) P(Z s 1.85)
b) P(Z s-1.85)
c) P(1 < Z s 1.85)
d) P(-1.85 < Z s -1)
e) P(-1 < Z s 1.85)

Solucin: a) 0.9678 b) 0.0322 c) 0.1265 d) 0.1265 e) 0.8091


6.5.15. Sea X una variable N(5,2). Calcular:

a) P(1 < X s8)
6. Principales Distribuciones Continuas
-173-
b) P(X s1)
c) P(X s -1)

Solucin: a) 0.9104 b) 0.0228 c) 0.00135.


6.5.16. Los lmites medios de tolerancia de un interruptor son 400,5 amperios.
Si un interruptor se dispara a una intensidad menor de 39,5 o mayor de 40,5 se
considera defectuoso. Si los puntos de ruptura de los interruptores de una partida
se distribuyen normalmente con media 39,5 y desviacin tpica 0,2, cul ser el
porcentaje de interruptores defectuosos en esa partida?

Solucin: 0,5


6.5.17. En la produccin de piezas para un motor de combustin interna, los
pesos presentan bastante dispersin. Una dispersin demasiado grande
provoca un mal funcionamiento. Supongamos que un fabricante concreto desea
rechazar el 3% de los cojinetes de menor peso y el 3% de los cojinetes de mayor
peso. Si el peso medio es 4,72 Kg, la desviacin tpica es 0,006 kg y la
distribucin de los pesos es normal, determinar el peso mximo y el peso mnimo
para que una pieza sea aceptada.

Solucin: 4.7087 y 4.7313


6.5.18. Se admite que los pesos, expresados en kilogramos, de los jvenes
varones de un cierto grupo, se distribuyen segn una ley normal N(69, 6). Se
desea poder afirmar que la probabilidad de que el peso X de un joven, tomado al
azar de ese grupo, sea mayor que una cantidad L es 0.9. Calcular L.

Solucin: 61.29


6.5.19. Los coeficientes intelectuales de los alumnos de un colegio siguen la ley
normal y se sabe que P(X>1.4)=0.1056 y P(X>1)=0.4013. Calcular los
parmetros de la distribucin.

Solucin: N=0.9 a=0.4


6.5.20. Dada una variable aleatoria normal X tal que P(X15)=0.1 y
P(X20)=0.95, calcular:

a) P(Xs13)
b) un valor a tal que P(Xsa)=0.05
c) un valor b tal que P(X>b)=0.5.
6. Principales Distribuciones Discretas
-174-

Solucin: a)0.00695 b)14.39 c)17.19


6.5.21. La seal recibida por la pantalla de un ordenador se considera apta si la
desviacin del voltaje observado respecto del terico no es mayor de 10 voltios.
Las desviaciones observadas obedecen a una ley normal de media 0 y
desviacin tpica 5. Calcular que porcentaje de seales recibidas por la pantalla
se consideran aptas.

Solucin: 97,7%


6.5.22. En un sistema binario, la informacin se representa mediante seales
elctricas (por ejemplo voltaje). Un voltaje representa el bit 0 y otro el bit 1.
Supongamos que deseamos representar los bits 0 y 1 por los voltajes 2 y 3
respectivamente. Debido a las fluctuaciones del voltaje en un circuito, la terminal
de entrada de un circuito digital no siempre recibe el voltaje destinado ya que es
frecuentemente distorsionada debido a ruidos en el canal. Muy a menudo, el
ruido se modela como una variable aleatoria distribuida normalmente y se
denomina ruido Gaussiano. Si el ruido es Gaussiano con media N=0 y desviacin
tpica a=0,22, y la terminal de entrada reconoce el bit 0 si el voltaje recibido es
menor de 2,6 y el bit 1 si el voltaje recibido es mayor o igual que 2,6, calcular la
probabilidad de que el receptor reconozca:

a) un 1 cuando se ha transmitido un 0
b) un 0 cuando se ha transmitido un 1.

Solucin: 0.0032 0.0344

6.5.23. El tiempo medio de CPU necesario para la ejecucin de una clase de
programas en un ordenador central es 2,52 minutos y la desviacin tpica es 0,37
minutos. Si el tiempo de ejecucin se distribuye normalmente, Cul es la
probabilidad de que un programa seleccionado aleatoriamente requiera entre 2
y 4 minutos de CPU? cul es la probabilidad de que la diferencia en valor
absoluto entre el tiempo de ejecucin y la media sea menor o igual que 1
minuto?

Solucin: 0.92 0.9931


6.5.24. El nivel de decibelios de un escape averiado sigue una distribucin
normal con media 90.4 decibelios y varianza 5.8 decibelios
2
. Si se toma el valor
medio de dos medidas, en lugar de una medida nica cul ser su distribucin?
qu sucede a la varianza cuando se promedian dos medidas, en lugar de tomar
una nica?.

Solucin: N(90'4,1'70)

6. Principales Distribuciones Continuas
-175-

6.5.25. Un ingeniero de proyectos que est colaborando en el diseo de una
refinera petroqumica. Se deben realizar cuatro actividades secuencialmente y
sin solapamiento. Las duraciones de las actividades se supone que son
variable aleatoria independientes normalmente distribuidas:

ACTIVIDAD MEDIA DESVIACIN TPICA
a 50 das 5 das
b 20 das 3 das
c 70 das 10 das
d 40 das 4 das

Cul es la probabilidad de que el tiempo total necesario para que se elaboren
las cuatro actividades no supere los 200 das?

Solucin: 0'9485


6.5.26. Los dimetros de los ejes fabricados para una determinada aplicacin
estn distribuidos normalmente con una media de 3'810 cm y una desviacin
tpica de 0'051. Las arandelas de los ejes tienen dimetros interiores que estn
normalmente distribuidos con una media de 3'942 cm y una desviacin tpica de
0'025. Dados un eje y una arandela seleccionados al azar, cul es la
probabilidad de que el eje no entre en la arandela?

Solucin: 0'0102


6.5.27. El peso neto de un paquete es una variable aleatoria N(20,2) y el del
envase es una variable aleatoria N(1, 0'2). Colocamos 13 de estos paquetes
sobre un soporte de madera que pesa 50 Kg. Cul es la probabilidad de que al
ponerlos en un montacargas cuya carga lmite es de 300 Kg. este no arranque?

Solucin: 0'9990.


6.5.28. Los dimetros de los tornillos de una caja, medidos en cm siguen una
distribucin N(2,0'03) y los dimetros interiores de las tuercas de otra caja siguen
una distribucin N(2'02, 0'04). Un tornillo y una tuerca ajustarn si el dimetro
interior de la tuerca es mayor que el dimetro del tornillo y la diferencia entre
estos dimetros no es mayor de 0'05 cm. Si se seleccionan al azar un tornillo y
una tuerca cul es la probabilidad de que ajusten?

Solucin: 0'3811


6.5.29. En un examen de selectividad, los estudiantes del colegio A alcanzan
6. Principales Distribuciones Discretas
-176-
calificaciones que se distribuyen N(625,10) y los del colegio B alcanzan
calificaciones que se distribuyen N(600,12'25). Si 2 estudiantes del colegio A y 3
del colegio B hacen este examen cul es la probabilidad de que el promedio de
las dos calificaciones de los estudiantes del colegio A sea mayor que el promedio
de los 3 estudiantes del colegio B?

Solucin: 09938


6.5.30. La dimensin principal de cierta pieza producida en una fbrica se
distribuye normalmente con media 150 y varianza 0,16. Se sabe que las piezas
son aceptables si la longitud se halla comprendida entre 149.2 y 150.4. Calcular
la probabilidad de que al menos el 90% de las piezas de un lote sean correctas:

a) En el caso de que el tamao del lote sea 10.
b) En el caso de que sea 100.

Solucin: a) 0.4342 b) 0.0239 (0.0178 sin aplicar la correccin por continuidad)


6.5.31. La resistencia elctrica de las lmparas fabricadas segn un determinado
proceso, se distribuye normalmente con =2.000 y =200. Dichas lmparas se
empaquetan en lotes de 100 unidades. Una lmpara se considera defectuosa si
su resistencia es inferior a 1900 y un lote se considera de baja calidad si 20 o
ms lmparas son defectuosas. Calcular la probabilidad p de que un lote sea
defectuoso.

Solucin: 0'993

6.5.32. Si el tiempo de vida de un componente elctrico sigue una distribucin
exponencial, siendo el tiempo medio entre fallos es de 100 horas. Calcular la
probabilidad de que transcurran ms de 200 horas sin averas.

a) 03679
b) 01353
c) 06065
d) 00183


6.5.33. Una mquina fabrica piezas cuya longitud sigue una distribucin Normal.
La probabilidad de que una pieza tenga una longitud mayor que 10 cm es del
668%, y la probabilidad de que sea menor que 5 cm es del 1587%. Si una pieza
se considera correcta cuando su longitud se encuentra entre 3 y 12 cm. Calcular
el porcentaje de piezas defectuosas fabricadas por la mquina.

a) 00290
b) 01919
c) 00668
6. Principales Distribuciones Continuas
-177-
d) 01857


6.5.34. El peso en vaco de una bombona de butano sigue una distribucin
normal de media 6 Kg y desviacin tpica 1 Kg. El peso del gas es una variable
normal e independiente de la anterior de media 13 Kg y desviacin tpica 15 Kg.
Si el butanero pesa 8694 Kg y el montacargas no soporta ms de 100 Kg.
Calcular la probabilidad de que el montacargas suba.

a) 00005
b) 00040
c) 00322
d) 00427


6.5.35. HIJOS DE ILUMINADA S.A. es una empresa que se dedica a producir
bombillas. En una de sus lneas se fabrican bombillas de 40 Vatios y se
introducen en paquetes de 40 bombillas. El filamento de las mismas tiene una
resistencia con distribucin NORMAL N(605,1.18) ohmios, y una bombilla se
considera correcta cuando su resistencia esta situada entre los valores 607.86
y 600.96.Cul es la probabilidad de que elegido un paquete (de 40 bombillas)
al azar, contenga 2 ms bombillas defectuosas (por la resistencia)?

a) 0.81142
b) 0.00849
c) 0.18858
d) 0.04084

6.5.36. Disponemos de un montacargas que soporta 100 Kg, y queremos
utilizarlo para que, en un 95% de las veces, pueda subir 3 paquetes de cemento.
Para su traslado, los paquetes son colocados sobre un palet de madera. El peso
individual de cada paquete tiene una distribucin normal N(20,0.5)Kg. Cul
debe ser el peso mximo del palet?

a) 37.53
b) 36.51
c) 38.57
d) 29.53


6.5.37. Una determinada mquina fabrica lminas de acero cuyo espesor sigue
una distribucin normal N(0.1, 0.005) cm. La mquina se considera que funciona
mal, y por tanto se debe revisar, si al tomar una muestra, el espesor promedio de
las lminas es superior a 0.1041cm. Calcular el nmero de piezas que
deberemos tomar para que, cuando la mquina funcione bien, slo tengamos
que revisarla en un 5% de las veces.

a) 9
6. Principales Distribuciones Discretas
-178-
b) 6
c) 4
d) 8


6.5.38. La media de una variable aleatoria normal que modeliza el tiempo de
ejecucin de un determinado algoritmo es de 5 veces la desviacin tpica. Se
cumple adems que P(Xs6)=0.84134. Calcular la media y la desviacin tpica.

Solucin: 5 y 1


6.5.39. El tiempo de transmisin va modem de un fichero con una gran cantidad
de informacin, que se realiza semanalmente en una empresa (45 veces al ao),
se distribuye normalmente con una media de 168 seg. y una desviacin tpica de
5 seg. Calcular:

a) El nmero de veces con un tiempo de transmisin entre 165 y 175 seg.
b) El nmero de veces con un tiempo de transmisin mayor que 180 seg.

Solucin: a) 29 b) 0.369


6.5.40. En un multiplexor de gran potencia, se pueden establecer 4600
conexiones por minuto. El nmero de conexiones por minuto se ha podido
estudiar, que es una variable aleatoria que sigue una distribucin de Poisson de
valor =4489. Calcular la probabilidad de que en un minuto el multiplexor est
saturado de llamadas.

Solucin: 0.0480


6.5.41. Una empresa de fabricacin de mesas de ordenador, posee dos plantas
de produccin (A y B), en la planta A, la altura de las mesas fluctan con media
75 cm. y =1.2 cm, y en la planta B, la altura de las mesas fluctan con media 77
cm. y =0.9 cm. Suponiendo que ambas variables se distribuyen normalmente,
determinar la probabilidad de que al seleccionar al azar una mesa de la planta A
y otra de la planta B, resulte la mesa de la planta A mas alta que la de la planta
B.

Solucin: 0.0918


6.5.42. La dimensin de un determinado componente electrnico (para
incorporarlo en la placa base) fabricada por una determinada firma, exige que
est comprendida entre 149.2 mm y 150.4 mm (fuera de estos limites hay
problemas). Se comienza a trabajar con un proveedor cuya dimensin de la
componente se distribuye normalmente con media 150 mm y varianza 0.16 mm.
6. Principales Distribuciones Continuas
-179-
Calcular la probabilidad de que al menos el 90% de los componentes de un lote
sean correctas:

a) Si el tamao del lote es 10.
b) Si el tamao del lote es 100.

Solucin: a) 0.434 b) 0.0236


6.5.43. El tiempo medio de CPU necesario para la ejecucin de una clase de
programas en un ordenador central es 2.52 minutos y la desviacin tpica es 0.37
minutos. Si el tiempo de ejecucin se distribuye normalmente.

a) Determinar la probabilidad de que un programa seleccionado aleatoriamente
requiera entre 2 y 4 minutos de CPU.
b) Calcular la probabilidad de que la diferencia en valor absoluto entre el tiempo
de ejecucin y la media sea menor o igual que 1 minuto.

Solucin: a) 0.92 b) 0.9931

6.5.44. La variable X se distribuye normalmente con media 200. Se sabe que la
probabilidad de que X sea superior a 250 es 0.2. Calcular cuntos valores
independientes de X deben observarse para tener una probabilidad mayor que
0.5 de que el mayor de ellos sea superior a 300.

Solucin: 15 (clave: P(x
max
>300)=1-P(Todos<300))


6.5.45. Unas 180 personas matriculadas en la universidad estn en una cola
para pagar las matrculas de los cursos; el importe no es el mismo en cada caso
pero se estima una media por persona de 85.000 ptas. y una desviacin de
12.300 ptas. Qu probabilidad hay de que el cajero haya recibido en total ms
de 15 millones de ptas.?

Solucin: 0.9656


6.5.46. Se calcula que durante el prximo mes de enero las ventas de una
empresa de ordenadores bajarn entre 350 y 610 millones de ptas., con una
probabilidad del 80%, siendo la cifra ms probable de disminucin de ventas los
480 millones de pts. cul es la probabilidad de que las ventas disminuyan
menos de 500 millones de pts. aceptando un modelo de distribucin
aproximadamente normal?

Solucin: 0.5792


6.5.47. Se ha advertido que el nmero de errores al escribir por primera vez un
6. Principales Distribuciones Discretas
-180-
programa sigue una distribucin de Poisson de media 0.8 errores por pgina del
listado. Calcula la probabilidad de que:

a) Haya algn error en una pgina.
b) En un procedimiento de diez pginas haya ms de diez errores.
c) En las 500 pginas de que consta el programa haya menos de 350 errores.

Solucin: a) 0.55067 b) 0.18411 c) 0.005868


6.5.48. Se ha calculado, de acuerdo con experiencias anteriores, que dos de
cada cinco alumnos matriculados en una determinada asignatura, no acudirn a
realizar el examen. Teniendo en cuenta que los alumnos son convocados en
distintas aulas de examen, a cuntos debe convocarse en un aula, con
capacidad para 120 personas, para poder asegurar espacio para todos los que
se presenten, con una probabilidad de 0.975?

Solucin: 180 alumnos


6.5.49. La resistencia de un montacargas de una fbrica es de 10 Tm.; en el
mismo se cargan paquetes de peso aleatorio distribuido uniformemente entre 40
y 60 Kg. Determinar el nmero mximo de paquetes que pueden cargarse
manteniendo la probabilidad de rebasar la carga crtica inferior al 1 por mil.

Solucin: 195 paquetes.

6.5.50. El nmero de placas base correctas que se elaboran en una fbrica de
componentes de ordenador cuadruplica al de placas defectuosas. Se pide:

a) La probabilidad de que de 200 placas producidas en un da ms de 40 y
menos de 70 sean defectuosas.
b) Las placas que deben producirse en un da para, con un 90% de probabilidad,
asegurar ms de 100 placas correctas con el fin de satisfacer la demanda.

Solucin: a) 0.464 b) 133 piezas


6.5.51. El peso de las naranjas que llegan a una envasadora se distribuye
normalmente con media 150 gr. y desviacin tpica 30 gr. Calcular el nmero
mnimo de naranjas que es necesario introducir en una bolsa para que la
probabilidad de que sta pese menos de 5 Kg. sea inferior al 1%.

Solucin: 37 naranjas


6.5.52. En una poblacin normal de media 20 y desviacin tpica 4, a qu
6. Principales Distribuciones Continuas
-181-
distancia de la media se encuentra?:

a) el segundo cuartil.
b) el tercer cuartil.
c) el valor que dista 1.5 veces el Intervalo intercuartlico por encima del tercer
cuartil.

Solucin: a) 0 b) 2.7 c) 30.8


6.5.53. Un fabricante exige a sus proveedores de placas de montaje que un
determinado orificio de las mismas tenga un dimetro comprendido entre 96 y
102 micras, debiendo desecharse las que no verifiquen esta condicin.
Si un proveedor sabe que las placas que produce son de una calidad tal, que el
10% de ellas tienen el orificio con un dimetro mayor de 100 micras y que el 5%
de las placas lo tienen inferior a 97 micras, y suponiendo que dicho dimetro se
distribuye normalmente, determinar el porcentaje de placas que deben ser
desechadas por el proveedor. Qu debera hacer ste para disminuir dicho
porcentaje?.

Solucin: 0.6%


6.5.54. Un determinado microprocesador tiene una probabilidad de error de
clculo de una entre un milln. Para un determinado proceso se realizan
4.800.000 operaciones y el efecto de cada error es restar una dcima de unidad
de su valor correcto. Cul es la probabilidad de que el nmero obtenido sea
exactamente una unidad por debajo del valor real?

Solucin: 0.015


6.5.55. Por un punto de una carretera pasa en promedio un coche cada 20
segundos en un sentido y un coche cada 15 segundos en el sentido contrario.

a) Qu tiempo transcurrir en promedio entre el paso por el punto de dos
coches consecutivos, sea cual sea el sentido en el que circulen? (Indicar con
precisin las hiptesis realizadas para responder a esta cuestin.)
b) t segundos despus del paso de un coche llega por un lateral a dicho punto
un peatn que desea cruzar. Cmo se distribuir la variable aleatoria "tiempo
desde que llega hasta que pasa un coche"? Justificar la respuesta.
c) Si el peatn necesita disponer de 10 segundos sin que pase ningn vehculo
para poder cruzar cul es la probabilidad de que pueda cruzar nada ms
llegar sin tener que esperar?

Solucin: a) 8.6 seg c) 0.31
6. Principales Distribuciones Discretas
-182-


6.5.56. Una industria dispone de dos envasadoras de un producto qumico. La
primera dosifica el 75% de la produccin y la segunda el resto. Se sabe que el
peso de producto por envase es una variable N(170,7) en la primera envasadora
y N(176,7) en la segunda. Se consideran como incorrectos aquellos paquetes
cuyo contenido neto es superior a 180 gr. Se pide:

a) Calcular la probabilidad que tiene cada envasadora de producir una paquete
incorrecto
b) Si se elige un paquete al azar y resulta ser incorrecto, hallar la probabilidad de
que haya sido envasado por la segunda mquina
c) Si se eligen 5 paquetes al azar, calcular la probabilidad de que 2 de ellos
hayan sido envasados por la 1 mquina.

Solucin: a) 0.0764 y 0.2843 b) 0.55 c) 0.0330


Distribuciones bidimensionales


6.5.57. Un sistema electrnico contiene cuatro componentes. Sea X
j
el tiempo
transcurrido hasta que falla la componente j (j=1,2,3,4). Suponemos que X
1
,X
2
,X
3

y X
4
son variable aleatoria independientes y cada una de ellas tiene como
funcin de distribucin F. El sistema funciona mientras funcione el componente 1
y al menos uno de los otros tres componentes. Determinar la funcin de
distribucin de la variable aleatoria X que indica el tiempo de duracin del
sistema.

Solucin: F
X
(t)=1-(1-F(t))(1-F(t)
3
) t>0


6.5.58. Dos sistemas de ignicin son utilizados en un satlite, como un
dispositivo redundante para ayudar a garantizar la ignicin. Si ambos sistemas
poseen tiempos de supervivencia distribuidos exponencialmente, el primero con
una media de 3 aos y el segundo con una media de 4 aos, cul es la
probabilidad de que al menos uno sobreviva 2 aos?.

Solucin: 0'8086.


6.5.59. Sea X la temperatura en F e Y la cantidad de lluvia en pulgadas/acre de
una ciudad seleccionada aleatoriamente. Se sabe que:

Cov(X,Y)=8'12 Var(X)=78'24 Var(Y)=2'17

6. Principales Distribuciones Continuas
-183-
Calcular el coeficiente de correlacin existente entre estas dos variables, qu
conclusiones se pueden obtener?
Si hubiramos medido la temperatura en grados Celsius y la lluvia en litros/m2,
sera diferente el valor de la covarianza? y el valor del coeficiente de
correlacin?.

Solucin: 0'623


6.5.60. Sean X
1
, X
2
y X
3
tres variables aleatorias independientes e idnticamente
distribuidas. Cada una de ellas tiene una distribucin uniforme sobre el intervalo
(0,1). Determinar el valor de E[(X
1
-2X
2
+X
3
)
2
].

Solucin: 0.5


6.5.61. Sean X e Y dos variable aleatoria tales que Var(X)=9 Var(Y)=4 y
cov(X,Y)=-1. Calcular:

a) Var(X+Y)
b) Var(X-3Y+4).

Solucin: a) 11 b) 51


6.5.62. Sean X e Y dos variables aleatorias, que pueden ser dependientes, tales
que Var(X)=Var(Y). Demostrar que la covarianza de las variables aleatorias X+Y
y X-Y es nula.


6.5.63. El coste de fabricar un pequea pieza para una mquina de corte es una
variable aleatoria (X) con funcin de densidad f(x) = x/2 - 5 en el intervalo [10,12]
y nula en el resto. El precio de venta es otra variable aleatoria (Y), que se puede
calcular en funcin del coste de fabricacin, segn la expresin: precio de venta
(Y) = coste(x) + 10% coste(x). Calcular la probabilidad de que el precio de venta
de una pieza sea inferior 13.

a) 0.8265
b) 0.9649
c) 0.7641
d) 0.5153


6.5.64. La recta de regresin mnimo cuadrtica de Y/X

a) Es el lugar geomtrico de los valores medios de Y/X
i
.
b) Es siempre la mejor funcin de prediccin de los valores de Y a partir de los
6. Principales Distribuciones Discretas
-184-
de X.
c) Pasa siempre por el punto medio de la distribucin de (X,Y)
d) Tiene pendiente negativa si el coeficiente de correlacin entre X e Y es
prximo a cero.


6.5.65. Un ingeniero que est diseando la cabina de un avin, considera que el
brazo del piloto alcanza una longitud X y su altura sentado es Y. Estas variables
siguen una distribucin normal bivariante siendo
X
=88'9
y
=91'44
X
=4'06

Y
=3'3 =0'8 . Hallar la probabilidad de que un piloto seleccionado al azar:

a) alcance con el brazo una longitud de ms de 96'52
b) tenga sentado una altura de ms de 96'52.

Solucin: a) 0'0307 b) 0'0618


6.5.66. Una empresa grande de ingeniera y arquitectura pasa un conjunto de
tests a los aspirantes a entrar en la seccin de diseo. Los ndices importantes
son la destreza manual X y la visin espacial Y que se consideran juntos. Datos
anteriores sugieren que estas dos variables tienen una distribucin normal
bivariante con parmetros
X
=75,
Y
=60,
X
=10,
Y
=15 y =0,6.

a) Obtener la distribucin condicional de la puntuacin conseguida en visin
espacial, Y, para una destreza manual baja X=50, y para una destreza manual
alta X=90.

b) Si se requiere una puntuacin mnima en visin espacial de 80 para ser
aceptado cul es la probabilidad de que sea aceptado un aspirante con una
puntuacin en destreza manual de 50? y con una puntuacin de 90? existe
alguna relacin entre las variables X e Y?.

Solucin: a) N(37'5,12) N(73'5,12) b) 2x10
-4
0'2946


6.5.67. Dado un lote especfico de engranajes, se cree que la duracin del
tratamiento de calor a que ha sido sometido, X, y la profundidad del
endurecimiento Y tienen una distribucin normal bivariante con
X
=18 segundos,

Y
=7'87 mm,
X
= 4'8,
Y
= 2'03 y = 0'87 .

a) Obtener la recta de regresin E(Y/X=x) que proporciona el valor esperado de
la distribucin condicional de la profundidad del endurecimiento para los
distintos tiempos.
b) Obtener la distribucin condicional del endurecimiento para una duracin
del tratamiento de 15 segundos.
c) Si X=15, cul es la probabilidad de que la profundidad del endurecimiento
6. Principales Distribuciones Continuas
-185-
est entre 5'84 y 9'90?
d) Si la profundidad del endurecimiento es de 7,62, cul es el valor esperado de
la duracin del tratamiento?

Solucin: a) E(Y/X=x)=7'87+0'3679(x-18); b) N(6'76,1); c) 0'8204; d) 17'44


6.5.68. Se supone que la resistencia a la rotura de las soldaduras, Y, y el
dimetro de las soldaduras, X, siguen una distribucin normal bivariante. El
modelo tiene los parmetros
X
=0'201 pulgadas,
Y
=2240 p.s.i.,
X
=0'046,

y
=342 y =0'75.
a) Obtener E(Y/X=x)
b) si se observa un dimetro de 0'184 cul es la distribucin condicional de la
resistencia a la rotura?
c) Si X=0'184, cul es la probabilidad de que la resistencia a la rotura sea
mayor de 1500 p.s.i.?

Solucin: a) E(Y/X=x)=2240+5576'08(x-0'201) b) N(2145'20,226'211) c) 0'9978


6.5.69. En los mensajes que se transmiten en una red de ordenadores se tiene
constatado que la Carga del Sistema (X) y el Tiempo de Respuesta (Y) fluctan
aleatoriamente con media m
x
= 20.5 trabajos y m
y
= 5.2 seg., desviaciones tpicas

x
=5.7 trabajos y
y
=1.3 seg. y coeficiente de correlacin r=0.85. Entre que
limites fluctuara el Tiempo de Respuesta del 95% de los mensajes cuando hay
una carga de 22 trabajos?

Solucin: 4.125 y 6.865


6.5.70. En una red de ordenadores se ha realizado un estudio de regresin
comprobndose que la relacin entre la carga del sistema y el tiempo de
respuesta de cualquier consulta, se ajusta mediante la recta
TIEMPO_RESPUESTA en funcin de la CARGA_SISTEMA, con un coeficiente
de correlacin de 0.9, y se sabe que cuando la carga del sistema es de 6
trabajos, el tiempo medio de respuesta de cualquier consulta flucta en el 95%
de los casos entre 15 y 35 segundos. cunto vale la desviacin tpica de la
variable TIEMPO_RESPUESTA?

Solucin: 11.47


6.6. PROBLEMAS Y CUESTIONES DE EXMENES

6.6.1. Se sabe que el tiempo de vida de un determinado componente electrnico
sigue una distribucin exponencial de media 125 minutos. Se pide:
6. Principales Distribuciones Discretas
-186-

a) Probabilidad de que el componente dure ms de 3 horas. (0.5 puntos)

b) Sabiendo que el componente estaba funcionando a las 3 horas, calcular la
probabilidad de que siga funcionando despus de 4 horas. (0.5 puntos)

c) Si colocamos 2 componentes en serie, cul es la probabilidad de que la vida
del sistema formado por estos dos componentes dure ms de 100 minutos?
Considerar componentes independientes. (1 punto)

d) Cuando falla un componente lo sustituimos por otro. Si al final hemos utilizado
50 componentes, cul es la probabilidad de que la suma de las vidas de los 50
componentes est entre 100 horas y 110 horas? (1 punto)

SOLUCIN:

La vida del componente sigue una distribucin exponencial ) 008 , 0 125 / 1 ( EXP X = =

a) La probabilidad de que dure ms de 3 horas es,

2369 , 0 e e e ) 180 X ( P
44 , 1 180 008 , 0 180
= = = = >



b) Sabiendo que a los 180 minutos ya estaba funcionando, la probabilidad de
que dure ms de 240 minutos es,

6188 , 0 e e e
e
e
) 180 X ( P
) 240 X ( P
) 180 X ( P
) 180 X 240 X ( P
) 180 X / 240 X ( P
48 , 0 60 008 , 0 60
180
240
= = = = =
>
>
=
>
> >
= > >





c) Para el sistema en serie, para que la vida del sistema dure ms de 100
minutos se debe cumplir que los dos componentes duren ms de 100
minutos, y como son componentes independientes, la probabilidad es,

2019 , 0 e
e e e e ) 100 X ( P ) 100 X ( P ) 100 X 100 X ( P ) 100 X ( P
6 , 1
100 008 , 0 2 100 2 100 100
2 1 2 1
=
= = = = > > = > > = >




d) De acuerdo con el teorema central del lmite, la suma de variables
independientes y con la misma distribucin sigue una normal de media la
suma de las medias y varianza la suma de varianzas. Esto es,

50 2 1
X ... X X S + + + =
utos mi n 6250 125 50
1
50 ) X ( E ... ) X ( E ) X ( E ) X ... X X ( E ) S ( E
50 2 1 50 2 1
= =

= + + = + + + =
2
2 2
50
2
2
2
1
2
50 2 1
2 2
781250
008 0
1
50
1
50 utos min
,
) X ( D ... ) X ( D ) X ( D ) X ... X X ( D ) S ( D = =

= + + + = + + + =
6. Principales Distribuciones Continuas
-187-

utos min , ) S ( D 88 883 =

La probabilidad que nos piden es,
( ) 2653 0 3886 0 6539 0 283 0 396 0
88 883
6250 6000
88 883
6250 6600
6600 6000 60 110 60 100
, , , ) , ( ,
, ,
) S ( P ) S ( P
= = | | =
= |
.
|

\
|
| |
.
|

\
|
| = < < = < <




6.6.2. En el envasado de una marca de frutos secos, por normativa uno de los
parmetros a controlar es el peso de cada paquete. Esta variable sigue una
distribucin Normal de media 110 g y de desviacin tpica 2 g.

a. Calcular la probabilidad de que un paquete pese ms de 113 g. (0,5 puntos)

Llamando X al peso por cada paquete y siguiendo esta una distribucin del tipo
X~N(110,2), la probabilidad pedida es:





b. De acuerdo a la normativa para el control del contenido efectivo de los
productos alimenticios envasados, un paquete de estas caractersticas se
considera defectuoso si su contenido es inferior al 95,5% del valor nominal,
que en este caso coincide con la media. Calcular la proporcin de paquetes
defectuosos, es decir, que incumplen la normativa. (1 punto)

Los paquetes que incumplirn la normativa sern aquellos que su peso sea
inferior a
=0,955 Es por ello que la probabilidad pedida ser:






c. Estos paquetes se envasan en cajas de 40 unidades. Si una caja contiene 3 o
ms paquetes defectuosos son retirados de la cadena de produccin.
Determinar el porcentaje de cajas que se retiran de la cadena de envasado. (1
punto)

6. Principales Distribuciones Discretas
-188-
Se retiran aquellas caja con 3 o ms paquetes defectuosos, por lo que se define
una nueva variable Y que determina el nmero de defectuosos en cada caja. Esta
nueva variable sigue una distribucin del tipo Y~B( 40, 0,0067).
La probabilidad pedida ser:




d. Una cadena de supermercados hace un pedido de 200 cajas de dicho
producto. Calcular la probabilidad de que en el total del pedido haya ms de
10 paquetes que incumplan la normativa. (1 punto)

Definimos una nueva variable T que sume el nmero de defectuosas que hay en
las 200 cajas, esto es:

, siendo Y
i
el nmero de paquetes defectuosos en la caja i,
tal y como se defini en el apartado anterior.
Esta nueva variable, por el Teorema Central del Lmite, tendr como distribucin
T~ N(200400,0067, 0000009)=N(53,6, 7,3) por lo que la
probabilidad pedida es:



e. En el proceso de control de calidad, cuantas cajas por trmino medio han de
controlarse hasta encontrar la primera que sea defectuosa? (1 punto)

Sea S, el nmero de cajas a controlar antes de encontrar una defectuosa. Esta
variable sigue una distribucin de tipo S~BN(1, 0,00247), por lo que en trmino
medio el nmero de cajas que tiene que controlar hasta que parezca la primera
defectuosa es:

cajas habr que controlar




6.6.3. El 50% de unos cartuchos de tinta para impresin duran 10 horas. Admitiendo
que la duracin de los cartuchos sigue una distribucin exponencial, se pide:

a) Calcular la probabilidad de que un cartucho recin instalado permita imprimir
durante ms de 18 horas. (1 punto)

b) Cul es la probabilidad de que con los 20 cartuchos que vienen en una caja
podamos imprimir durante ms de 300 horas. (1 punto)

6. Principales Distribuciones Continuas
-189-
Solucin:

a) La funcin de distribucin de la exponencial es
x
x
e 1 ) x ( F

= . Para x=10
5 , 0 e 1
10
=

y despejando el valor de es
0693 , 0
10
5 , 0 l n
=

=
La probabilidad pedida es,
2873 , 0 e e ) 18 X ( P
18 0693 , 0 18
= = = >



b) la duracin total de los cartuchos es,
20 2 1
X ... X X Y + + + =
Aplicando el teorema central del lmite, la variable Y se aproxima a una normal
de media y varianza dado por,
6 , 288
0693 , 0
1
20 ) X ( E ) Y ( E
20
1 i
i
= = =

=

51 , 4164
0693 , 0
1
20 ) X var( ) Y var(
2
20
1 i
i
= = =

=

5 , 64 ) Y ( D =
La probabilidad pedida es,
4299 , 0 ) 1767 , 0 Z ( P
5 , 64
6 , 288 300
Z P ) 300 Y ( P = > = |
.
|

\
|
> = >



6.6.4. La vida de un componente electrnico y la temperatura del entorno siguen una
distribucin normal bivariante de covarianza -30 h C. La vida del componente se
distribuye de forma normal, con media 100 horas y desviacin tpica 10. Sabemos
adems que la probabilidad de que la temperatura sea superior a 30 es 0,0228 y
la de que sea superior a 20 C es 0,5. Se pide:

a) Calcular la probabilidad de que el componente funcione ms de 100 horas si
la temperatura es de 25 C. (1 punto)

Solucin:
como P(T>20)=0.5, la media de la temperatura ser 20, y
1-f(z)=0.0228 para z=2.0, por lo tanto s=30-20/2.0=5

De modo que el vector de medias ser m=(100, 20) y la matriz V ser (100,-
30//-30,25). El coeficiente de correlacin ser entonces r=-0.6

(X|y=25)=N(100-0.6*10/5*(25-20); 10*sqrt(1-0.6))=N(94,8)

Por lo tanto P(X>100)=1- f((100-94)/8)=1- f(0.75)=0.227
6. Principales Distribuciones Discretas
-190-

7. Distribuciones derivadas de la normal

-191-
7. DISTRIBUCIONES DERIVADAS DE LA NORMAL

Contenido
7.1. DISTRIBUCIN CHI-CUADRADO ............................................................ 191
7.2. DISTRIBUCIN t .................................................................................... 192
7.3. DISTRIBUCIN F ..................................................................................... 194
7.4. PROBLEMAS PROPUESTOS .................................................................. 195



7.1. DISTRIBUCIN CHI-CUADRADO

La distribucin chi-cuadrado aparece cuando hacemos la suma de variables
aleatorias normales tipificadas y al cuadrado. De esta forma, z
1
, z
2
, , z
n
son v.a.
N(0;1) e independientes, la variable chi-cuadrado se define como

2
n
2
2
2
1
2
n
Z ... Z Z + + + = _

La funcin de densidad es asimtrica a la derecha.
Grad. de libertad
3
5
9
15
30
Chi-Cuadrado Distribucin
x
d
e
n
s
i
d
a
d
0 20 40 60 80
0
0,04
0,08
0,12
0,16
0,2
0,24

3
5
15
30
9


Figura 7. 1. Funcin de densidad de la chi-cuadrado

El nmero de sumandos son los grados de libertad de la chi-cuadrado.

El valor medio es

n ) ( E
2
n
= _
y la variancia viene dada por,

n 2 ) ( D
2
n
2
= _
7. Distribuciones derivadas de la normal

-192-

El inters de esta variable se debe a que la varianza muestral sigue una
distribucin chi-cuadrado. Ms concretamente,

2
1 n
2
2
s
) 1 n (

_ =
o


El valor de es aquel valor de la chi-cuadrado que deja a su derecha un
rea de probabilidad o, segn la expresin

o = _ > _
o
) ( P
) ( 2
n
2
n




Actividad 7.1:
- Calcular la probabilidad ) 5 ( P
2
3
> _
- Calcular el valor de a tal que 10 , 0 ) a ( P
2
3
= > _ , esto es
) 10 , 0 ( 2
3
_ o bien
2
10 , 0 ; 3
_ .



7.2. DISTRIBUCIN t

La t de STUDENT se define como el cociente entre una variable normal N(0;1) y la
raz cuadrado de una chi-cuadrado dividida sta por sus grados de libertad. As,

n
Z
t
2
n
n
_
=

Donde z es una variable N(0;1) e independiente de la chi quadrado.

La forma de la funcin de densidad es parecida a la normal N(0;1), pero un
poco ms aplanada. Cuando n>30, la funcin de densidad de la t coincide con la
funcin de densidad de la normal N(0;1).
) ( 2 o
_
n
7. Distribuciones derivadas de la normal

-193-
Grad. de libertad
2
5
9
17
30
t de Student Distribucin
x
d
e
n
s
i
d
a
d
-8 -4 0 4 8
0
0,1
0,2
0,3
0,4

2
30

Figura 7. 2. Funcin de densidad de la t de Student

El valor medio de la t
n
es,
0 ] t [ E
n
=
La varianza de la t
n
es,
2 n
n
) t ( D
n
2

= para n>2

La cantidad es aquel valor de la t
n

que deja a su derecha un rea de
probabilidad , segn la expresin,

o = >
o
) t t ( P
n n


La media muestral est relacionada con una distribucin t cuando la
desviacin tpica no es conocida y se estima a partir de la desviacin tpica muestral,
ms concretamente, la expresin,
1 n
t
n s
x

=


sigue una distribucin t
n-1
con n-1 grados de libertad.


Actividad 7.2:
- Calcular la probabilidad de P(t
3
> 2,33)
- Calcular la probabilidad de P(t
5
<-1,96)
- Calcular la probabilidad de P(|t
7
|>2,1)
- Calcular el valor de a que cumple P(t
9
>a)=0,10, esto es
10 0
9
,
t


o
n
t
7. Distribuciones derivadas de la normal

-194-
7.3. DISTRIBUCIN F

La distribucin F aparece como un cociente de dos variables chi-cuadrado cada una
de ellas divididas por sus grados de libertad, e independientes, esto es,

2
2
n
1
2
n
n , n
n
n
F
2
1
2 1
_
_
=
Se dice que el cociente sigue una distribucin F con n
1
y n
2
grados de
libertad, n
1
para el numerador y n
2
para el denominador.

La funcin de densidad es asimtrica hacia la derecha.

Figura 7. 3. Funcin de densidad de una F

El valor medio de una F es,
2 n
n
] F [ E
2
2
n , n
2 1

= para n
2
>2

y la varianza es,

) 4 n )( 2 n ( n
) 2 n n ( n 2
) F ( D
2 2 1
2 1
2
2
n , n
2
2 1

+
=

El valor de es aquel valor de la F que deja a su derecha un rea de
probabilidad o, segn la expresin,

Numerador g.l.,Denominador g.l.
10,10
5,9
13,16
F (ndice de varianza) Distribucin
x
d
e
n
s
i
d
a
d
0 1 2 3 4 5
0
0,2
0,4
0,6
0,8
1
o
2 1
,n n
F
7. Distribuciones derivadas de la normal

-195-
o = >
o
) F F ( P
2 1 2 1
n , n n , n


El cociente de dos varianzas muestrales sigue una distribucin F, ms con
concretamente,

1 n , 1 n
2
2
2
2
2
1
2
1
2 1
F
s
s

=
o
o


Actividad 7.3:
- Calcular la probabilidad de ) 10 F ( P
5 ; 3
>
- Calcular el valor de a tal que 05 , 0 ) a F ( P
9 ; 7
= > , esto es
05 , 0
9 ; 7
F



7.4. PROBLEMAS PROPUESTOS

7.4.1. Determinar a y b para que P(ass
2
sb)=0'8 si s
2
procede de una muestra
aleatoria simple de tamao 16 de una poblacin NORMAL N(8,2).

Solucin: a = 2.28, b = 5.95










7. Distribuciones derivadas de la normal

-196-

8. Distribuciones en el muestreo
-197-
8. DISTRIBUCIONES EN EL MUESTRO

Contenido
8.1. POBLACIN, MUESTREO Y MUESTRA .................................................... 197
8.2. DISTRIBUCIN DE LA VARIANZA MUESTRAL ......................................... 201
8.3. DISTRIBUCIN DE LA MEDIA MUESTRAL ............................................... 203
8.4. DISTRIBUCIN DEL COCIENTE DE VARIANZAS ..................................... 204
8.5. DISTRIBUCIN DE LA PROPORCIN ...................................................... 206
8.6. DISTRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES ............ 207
8.7. DISTRIBUCIN DE LA DIFERENCIA DE PROPORCIONES ..................... 208
8.8. VARIANZA EN POBLACIONES FINITAS .................................................... 210
8.9. PROBLEMAS PROPUESTOS .................................................................... 211
8.10. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 212


8.1. POBLACIN, MUESTREO Y MUESTRA

Poblacin y muestra
El conjunto de todos los elementos bajo estudio se denomina Poblacin, y a una
parte de ellos recibe el nombre de Muestra. Por ejemplo si queremos estudiar el
nivel de renta en la Comunidad Valenciana, la poblacin es el conjunto de individuos
que pertenecen a dicha Comunidad y una muestra es una parte de esa poblacin,
elegida al azar, a partir de la cual se quiere deducir las caractersticas de toda la
poblacin.
Conociendo cada elemento de la poblacin, conocemos todas las
caractersticas y parmetros de la misma. Una poblacin se puede caracterizar por
una funcin de distribucin, la cual depende de un conjunto de parmetros. As:
) ,..., , F(x;
k 2 1 u u u

Si todos los elementos de la poblacin son conocidos, los parmetros
u u u k 2 1
,..., , son perfectamente conocidos. A estos parmetros se denominan
"parmetros poblacionales" y se representan por letras griegas.
El problema estriba en que no podemos conocer todos los elementos de la
poblacin, debido a uno de los siguientes motivos:

8. Distribuciones en el muestreo
-198-
1) La poblacin es muy extensa y llevara mucho tiempo su recopilacin.
2) El coste de obtener la informacin es muy elevado.
3) Al obtener la informacin se puede destrozar el elemento de la poblacin.
Por ejemplo, para obtener la tensin de rotura de una barra de acero.
4) La poblacin como tal puede no existir todava. Por ejemplo, el conjunto de
piezas producidas por una mquina.
En tales casos no queda ms remedio que tomar una pequea parte de la
poblacin y a partir de ella intentar deducir el valor de los parmetros poblacionales.
A esa pequea parte de la poblacin se denomina "muestra".
Los datos de una muestra se pueden considerar como un conjunto de
variables aleatorias, todas ellas con la misma funcin de distribucin
) ,..., , F(x,
k 2 1 u u u
, as:
)
x
,...,
x
,
x
( = x
n 2 1


A cualquier funcin de estos valores, )
x
,...,
x
,
x
(
n 2 1
u , se denomina
"estadstico".
El problema se reduce a obtener un estadstico, funcin de los datos
muestrales, que nos d una aproximacin del parmetro poblacional, lo cual se
expresa por:
)
x
,...,
x
,
x
( =
n 2 1 1 1

u u
La cantidad
u

1
vara para cada
x
,...,
x
,
x n 2 1
, luego se puede considerar como
una funcin o transformacin de n-variables aleatorias, y por lo tanto, tendr una
media, una varianza, as como su propia ) F(
1 u
,
) E(
1 u

) (
D
1
2
u

Con lo cual nos interesa estudiar las propiedades de esa distribucin en
relacin al parmetro desconocido poblacional.
A las distribuciones que tienen los estadsticos muestrales, y que dependen
de los parmetros poblacionales y del tamao de la muestra, se denominan
Distribuciones en el Muestreo y son las que nos permitirn relacionar los estadsticos
muestrales con los parmetros de la poblacin con vistas a un posible conocimiento
de estos ltimos.
8. Distribuciones en el muestreo
-199-
Poblacin
Muestra 1
Muestra
2
Muestra
m
1
x
2
x
m
x
1
s
2
s
m
s
N(15; 2.5)
n=10
.
.
.
.
Histogram
-3,7 -1,7 0,3 2,3 4,3
X
0
100
200
300
400
500
600
f
r
e
q
u
e
n
c
y
Histogram
-1 -0,5 0 0,5 1 1,5
MEANS
0
20
40
60
80
f
r
e
q
u
e
n
c
y
Histogram
SIGMAS
f
r
e
q
u
e
n
c
y
0 0,3 0,6 0,9 1,2 1,5 1,8
0
20
40
60
80

Figura 8. 1. Poblacin y muestra

Se debe cuidar mucho la forma de extraccin de la muestra, ya que sta debe
ser representativa de la poblacin. Si al obtener la muestra, cada elemento de la
poblacin tiene la misma posibilidad de salir, se dice que la muestra es "aleatoria
simple".
Si el tamao de la poblacin no es muy elevado en relacin al tamao de la
muestra, se aplican unos procedimientos que se estudian en "Muestreo en
poblaciones finitas". En este tema suponemos que el tamao de la poblacin es muy
grande en relacin a la muestra, es decir, estamos en "Muestreo en poblaciones
infinitas".
8. Distribuciones en el muestreo
-200-

Tipos de muestreo
Los muestreos pueden ser probabilsticos y no probabilsticos. Entre los
probabilsticos, los ms utilizados son:
- Muestreo aleatorio simple. Cada elemento de la poblacin tiene la misma
probabilidad de salir elegido para formar parte de la muestra.
- Muestreo sistemtico. Cuando la poblacin est enumerada en una lista y
queremos obtener los elementos a lo largo de la lista. Para ello se divide el
tamao de la poblacin entre el nmero de elementos a extraer en la muestra.
Est cociente dar, por ejemplo, un valor h. A continuacin se elige un
nmero al azar de 1 a h, por ejemplo k, y los elementos a extraer son el k, el
k+h, el k+2h, y as sucesivamente.
- Muestreo estratificado. Cuando en la poblacin se pueden formar grupos
con una cierta homogeneidad (Ej. Grupos de edad, grupos por estatus
econmico, etc.). A cada grupo se denomina estrato, y el tamao n de la
muestra a tomar se subdivide para cada estrato segn algn criterio de
afijacin.
- Muestreo por conglomerados. Cuando en la poblacin se pueden formar
grupos con una cierta heterogeneidad, y cada uno de esos grupos, de por s,
puede representar al total de la poblacin. El procedimiento es traer un
nmero al azar de conglomerados, y para cada uno de ellos examinamos
todos sus elementos.
- Muestreo por etapas. Viene a ser una generalizacin de los conglomerados.
En lugar de examinar todos los elementos del conglomerado, se toma una
muestra aleatoria del mismo.
Entre los muestreos no probabilsticos, los ms empleados son:
- El muestreo opintico. Es funcin del entrevistador la eleccin del elemento
de la poblacin a examinar.
- El muestreo por cuotas. Se requiere un cierto nmero de elementos para
cada grupo de la poblacin. Se van tomando elementos de la poblacin,
segn algn procedimiento establecido de antemano, antes que se cubre la
cuota para dichos tipos de elementos.
- Muestreo por bola de nieve. Cuando es difcil acceder a los elementos de la
poblacin, debido a su desconocimiento. Cuando se encuentra a alguno de
ellos, se le pregunta si nos puede indicar la existencia de otros. A su vez esos
otros nos pueden guiar para encontrar nuevos elementos de la poblacin.
8. Distribuciones en el muestreo
-201-

Distribuciones muestrales
En este apartado supondremos que la poblacin estudiada sigue una distribucin
normal, ) ; N( o , y que de ella, extraemos unos valores )
x
,...,
x
,
x
(
n 2 1
al azar e
independientemente. Cada
Xi
se puede considerar, antes de que aparezca el valor
concreto, como ) ; N( o , es decir, son variables aleatorias independientes con la
misma distribucin normal.



f
X
(x)
X
) x ( P
X
-

X
1/n
POBLACIN MUESTRA
Caractersticas poblacionales
(constantes)
Caractersticas muestrales
(variables aleatorias)
(X
1
, X
2
, ..., X
n
)
(media)
o
2
(varianza)
o (desviacin tpica)
p (proporcin)
x (media muestral)
2
n
s (varianza muestral)
2
1 n
s

(cuasivarianza)
s
n
(desv. tpica muestral)
s
n-1
(cuasidesviacin tpica)
f (proporcin muestral)

Figura 8. 2 Distribuciones muestrales

8.2. DISTRIBUCIN DE LA VARIANZA MUESTRAL
Una distribucin _
2
n
se define como una suma de variables N(0;1) al cuadrado e
independientes. El valor medio y la varianza son:
2n = ) (
D
n = ) E(
2
m
2
2
n
_
_


8. Distribuciones en el muestreo
-202-
Cuando n>30 se distribuye segn una normal ) 2n N(n; .
El estadstico
n
) x -
x
(
S
2
i
i
n

=
2

se denomina varianza muestral y al definido por
1
2
1

n
) x -
x
(
S
2
i
i
n

se le conoce como varianza muestral corregida o cuasivarianza muestral.
La raz cuadrada positiva de la varianza muestral es la desviacin tpica
muestral y se representa por s
Sea )
x
,...,
x
,
x
(
n 2 1
una muestra aleatoria simple extrada de una poblacin
normal ) ; N( o , se demuestra que el estadstico
o
2
2
i
i
) x -
x
(


sigue una distribucin _
2
1 - n
.
Multiplicando y dividiendo por n
_
o o
2
-1 n
2
2 2
2
i
i
=
s
n
=
n
) x -
x
( n


o por (n-1),
_
o o
2
1 - n
2
2
2
2
i
i
=
s
1) - (n =
1) - (n
) x -
x
( 1) - (n



Actividad 8.1:
- De una poblacin normal N(30;2,5) se extrae una muestra de tamao 5, Cul es la
probabilidad que la desviacin tpica muestral sea mayor de 3,5?

8. Distribuciones en el muestreo
-203-


8.3. DISTRIBUCIN DE LA MEDIA MUESTRAL

La media muestral de un conjunto de valores muestrales )
x
,...,
x
,
x
(
n 2 1
,
viene dada por

n
x
x
i
i
=
La media y la varianza de x son :
n
= ) x (
D
; = ) x E(
2
2
o

Como
x
n
1
...+ +
x
n
1
+
x
n
1
= x
n 2 1
es una combinacin de variables normales, x
ser a su vez una normal,
)
n
; N( )) x D( ); x N(E( X
o

o bien tipificando,
N(0;1) =
n
- x
o


Si o es desconocida y empleamos los datos de la muestra para estimarla, y
la sustituimos por s, la desviacin tpica muestral, se obtiene que en lugar de una
N(0;1) sigue una distribucin t de Student de n-1 grados de libertad.
Una distribucin t de Student se define como un cociente de
n
N(0,1)
=
t
2
n
n
_

El valor medio y la varianza son:
8. Distribuciones en el muestreo
-204-
2 - n = )
t
(
D
0 = )
t
E(
n
2
n


Cuando n>30 se distribuye segn una N(0;1).
As:
t
=
n
s
- x
1 - n



Actividad 8.2:
- De una poblacin normal de media 15 y desviacin tpica 3 se extrae una muestra de
tamao 7. Cul ser la probabilidad que la media muestral sea mayor de 16?

- De una poblacin normal hemos obtenido la estimacin de la media con un valor de
15,3 y una estimacin de la desviacin tpica con una estimacin de 2,3. Si de esta
poblacin obtengamos una muestra de tamao 9, Cul es la probabilidad que la
media muestral sea mayor de 17,2?
___________________________________________________________________

8.4. DISTRIBUCIN DEL COCIENTE DE VARIANZAS

Una distribucin
F
n , n 2 1
se define como un cociente de dos
2
_ independientes dividida
cada una por sus grados de libertad
n
n
=
F
2
2
n
1
2
n
n , n
2
1
2 1
_
_

Sea ) ; N( X
1 1
o
y otra poblacin ) ; N( Y
2 2
o
, e independientes. Si de la
primera poblacin extraemos una m.a.s )
x
,...,
x
,
x
(
n 2 1
y de la segunda otra m.a.s.
) y ,..., y , y (
n 2 1
, el cociente de sus varianzas muestrales, dividida cada una de ellas
por su varianza poblacional, se distribuye segn una F de
n
,
n 2 1
grados de libertad.
8. Distribuciones en el muestreo
-205-
Esto es:
F
=
s
s
1 - n 1, - n
2
2
2
2
2
1
2
1
2 1
o
o

Para cada muestra
_
o
2
-1 n 2
1
2
1
1
1
=
s
1) -
n
(
_
o
2
1 - n 2
2
2
2
2
2
=
s
1) -
n
(
dividiendo cada _
2
por sus grados de libertad y efectuando su cociente, resulta la
definicin de una distribucin F de 1 -
n
1, -
n 2 1
grados de libertad.
Si las varianzas poblacionales son iguales o
o o
= =
2
2
2
1
, el cociente de
varianzas muestrales es una F,
F
=
s
s
1 - n 1, - n
2
2
2
1
2 1

Por lo general, se suele colocar la varianza muestral mayor en el numerador,
y la menor en el denominador.

Actividad 8.3:
- De dos poblaciones normales con la misma variancia sacamos una muestra de cada
una de ellas. La primera de tamao 7, y la segunda de tamao 9. Cul es la
probabilidad que la variancia de la primera muestra sea mayor que el doble que la
variancia de la segunda muestra.


8. Distribuciones en el muestreo
-206-
8.5. DISTRIBUCIN DE LA PROPORCIN

Proporcin de defectuosas

El nmero X de unidades defectuosas de una muestra aleatoria simple de n unidades
sigue una distribucin Binomial B(n;p). Como X es una suma de dicotmicas, cuando
np>5, el nmero de defectuosas en la muestra sigue una distribucin normal,
( ) ) ( ; p 1 np np N X
La proporcin de unidades defectuosas en la muestra es
n
X
f =
Y f sigue una distribucin normal
|
|
.
|

\
|

n
p p
p N f
) 1 (
;

Proporcin de defectos (defectos por unidad)
En caso de que X cuenta el nmero de defectos que hay entre todas las piezas de
una muestra de tamao n, esta variable aleatoria sigue una distribucin de Poisson
PS(c), donde c es el nmero medio de defectos por muestra. Si c>5 el nmero de
defectos sigue una distribucin normal,
) ; ( c c N X
La proporcin de defectos b(defectos por unidad) es
n
X
f =
En la que f sigue una distribucin normal,
|
|
.
|

\
|

n
u
; u N f

Donde u es el nmero medio de defectos por unidad.
8. Distribuciones en el muestreo
-207-


Actividad 8.4:
- Una mquina produce piezas con una proporcin de defectuosas del 2%. Si de esta
mquina extraemos una muestra de 60 piezas, cul ser la probabilidad que la
proporcin de piezas defectuosas en la muestra sea mayor del 3%?


8.6. DISTRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES

Si de una poblacin que sigue una N(
1
, o
1
) extraemos una muestra aleatoria simple
de tamao n
1
, y de otra poblacin con distribucin N(
2
, o
2
) se extrae otra muestra
aleatoria simple de tamao n
2
, y para cada una de dichas muestras calculamos las
medias muestrales, cada una de ellas sigue una distribucin,
) , (
1
1
1 1
n
N x
o
) , (
2
2
2 2
n
N x
o

La diferencia de medias muestrales, como es una combinacin lineal de
variables normales, sigue una distribucin,
|
|
.
|

\
|
+
2
2
2
1
2
1
2 1 2 1
;
n n
N x x
o o

Si o
1
y o
2
son desconocidas, las estimamos a partir de sus desviaciones
tpicas muestrales, y suponiendo que n
1
y n
2
son suficientemente grandes, la
diferencia de medias muestrales sigue una distribucin,
|
|
.
|

\
|
+
2
2
2
1
2
1
2 1 2 1
;
n
s
n
s
N x x
Si o
1
y o
2
son desconocidas, pero iguales, la mejor estimacin de la o comn
es,
2
) 1 ( ) 1 (

2 1
2
2
2 1
2
1 2 2
+
+
= =
n n
n s n s
s o
Y la diferencia de medias muestrales seguir una distribucin t de Student con
n
1
+n
2
-2 grados de libertad. Esto es,
8. Distribuciones en el muestreo
-208-
2
2 1
2 1 2 1
2 1
1 1
) ( ) (
+
=
+

n n
t
n n
s
x x



Actividad 8.5:
- De una poblacin normal N(40;3) sacamos una muestra de tamao 10, y de otra
poblacin normal N(45; 3,5) sacamos una muestra de tamao 13. Cul es la
probabilidad que la media muestral de la segunda muestra sea mayor que la media
de la primera muestra.

- Si en el ejemplo anterior las desviaciones tpicas realmente son estimaciones de las
desviaciones tpicas poblacionales, cul sera ahora la probabilidad que la media
muestral de la segunda muestra fuera mayor que la media muestral de la primera
muestra.


8.7. DISTRIBUCIN DE LA DIFERENCIA DE PROPORCIONES

Proporcin de defectuosas
Si de un lote de gran tamao en el cual conocemos la proporcin de defectuosas p
1
,
tomamos una muestra de tamao n
1
, la fraccin de defectuosas es,
1
1
1
n
x
f =
Y sigue una distribucin normal
)
) 1 (
, (
1
1 1
1 1
n
p p
p N f


Si efectuamos el mismo procedimiento, pero para otra poblacin con
proporcin p
2
, la fraccin de unidades defectuosas sigue una distribucin normal
)
) 1 (
, (
2
2 2
2 2
n
p p
p N f


La diferencia de fracciones, como es una combinacin lineal de variables
8. Distribuciones en el muestreo
-209-
normales, sigue otra distribucin normal,
|
|
.
|

\
|

+


2
2 2
1
1 1
2 1 2 1
) 1 ( ) 1 (
,
n
p p
n
p p
p p N f f
Si p
1
y p
2
son desconocidas pero iguales, la mejor estimacin de la p comn
es,
1 1
2 1
n n
x x
p
+
+
=
Y en tal caso la diferencia de proporciones sigue una distribucin,
|
|
.
|

\
|
|
|
.
|

\
|
+
1 1
2 1
1 1
) 1 ( ; 0
n n
p p N f f

Proporcin de defectos (defectos por unidad)

Para la diferencia de proporcin de defectos, la frecuencia observada es,
1
1
1
n
x
f =
Como
1
x sigue una distribucin de Poisson de parmetro
1
p , la aproximacin a la
normal es,
|
|
.
|

\
|

1
1
1 1
,
n
p
p N f
Y para una diferencia de proporciones de defectos, la distribucin normal que sigue
es,
|
|
.
|

\
|
+
2
2
1
1
2 1 2 1
,
n
p
n
p
p p N f f
Si
1
p y
2
p son iguales pero desconocidas, la mejor estimacin de la proporcin de
defectos es,
1 1
2 1

n n
x x
p
+
+
=
Donde:

1
x = total de defectos de la muestra de tamao
1
n

2
x = total de defectos de la muestra de tamao
2
n .

Y la diferencia de proporciones sigue una distribucin normal
8. Distribuciones en el muestreo
-210-
|
|
.
|

\
|
|
|
.
|

\
|
+
1 1
2 1
1 1
; 0
n n
p N f f
Observar que estar frmulas son las mismas que para la diferencia de proporciones
de defectuosas sin mas que cambiar la pq por p, y donde p es la proporcin (nmero)
de defectos por unidad.


Actividad 8.6:
- Una maquina hace piezas con una proporcin de defectos del 5%, y otra mquina
hace las mismas piezas con una proporcin de defectos del 3%. Si cogen una
muestra de 50 unidades de la primera mquina y 70 piezas de la segunda mquina,
cul ser la probabilidad que la proporcin de defectos observada en la primera
muestra sea mayor que la proporcin de defectos de la segunda muestra?



8.8. VARIANZA EN POBLACIONES FINITAS

Cuando el tamao de la poblacin no es muy grande en relacin al tamao de la
muestra, las varianzas de los estadsticos muestrales difieren un poco de las
varianzas en caso de poblaciones infinitas. Concretamente para la media muestral,
proporcin muestral, y para el total de la muestra, las varianzas quedan multiplicadas
por un factor de correccin
1

N
n N
. As, las expresiones de dichas varianzas son:
- Para la media muestral x es,
1
) (
2
2

=
N
n N
n
x D
o

- Para la proporcin muestral f es,
1
) (
2

=
N
n N
n
pq
f D
- Para el total

=
=
n
i
i
x T
1
de la muestra es,
8. Distribuciones en el muestreo
-211-
1
) (
2 2

=
N
n N
n T D o

8.9. PROBLEMAS PROPUESTOS

8.9.1.- Dada una poblacin NORMAL N(5,2), cul es la probabilidad de que la media
muestral para una muestra de tamao 4 sea superior a 6? Y si el tamao es 25?
Solucin: 0.1587 0.0062


8.9.2.- Se extraen dos muestras aleatorias simples de tamaos n1=22 y n2=30 de
una poblacin NORMAL de varianza 9. Calcular la probabilidad de que la diferencia
de medias de ambas muestras sea superior a 1.
Solucin: 0.235


8.9.3.- Determinar el tamao de muestra a tomar en el estudio de la fabricacin de
ciertas piezas para que la media muestral de una cierta dimensin difiera de la media
poblacional en menos de 1 cm con una probabilidad del 95% si =3.
Solucin: 36


8.9.4.- En la inspeccin de recepcin por lotes se mide la longitud de una
determinada pieza, su distribucin poblacional es N(10,0'15). Se toma una muestra
de tamao 25, si x <10 no se compra el lote x >10 se compra pagando sobre el
precio una cantidad adicional y=1000( x -10)
2
(en euros). Determinar :
a) La distribucin de la cantidad adicional.
b) La probabilidad de que dicha cantidad sea inferior a 2 euros.
c) Valor de k / P( y>k )= 0'001
Solucin: b) 0.9319 c) 8.64

8. Distribuciones en el muestreo
-212-

8.9.5.- Un fabricante produce lmparas elctricas con una vida media de 2.000 horas
y una desviacin tpica de 200 horas. Mediante la modificacin del proceso de
fabricacin se piensa elevar la media a 2.200 horas conservando la dispersin. Si se
tena una muestra de 10 lmparas producidas antes del cambio, se toma una
muestra de 30 despus del mismo y se halla la diferencia entre las medias
muestrales, cul es la probabilidad de que esta diferencia est entre 195 y 205?
Se admite una distribucin NORMAL para la vida de las lmparas.
Solucin: 0.056


8.9.6.- Determinar a y b para que P(ass'
2
sb)=0'8 si s'
2
procede de una muestra
aleatoria simple de tamao 16 de una poblacin NORMAL N(8,2).
Solucin: a = 2.28, b = 5.95

8.10. PROBLEMAS Y CUESTIONES DE EXMENES

8.10.1.- El espesor de unas planchas de acero sigue una distribucin normal con
varianza 5,4. Se pide:
a) Si tomamos una muestra de tamao n=20, cul es la probabilidad de que la
desviacin tpica sea superior a 3. (1 punto)

b) Cul debe ser el nmero de planchas a medir para que la probabilidad de
que la media muestral de estas planchas difiera de la media poblacional en
ms de 2 unidades sea inferior al 10%? (1punto)
Solucin :

a) ( ) 034 , 0 66 , 31
4 , 5
19 9 ) 1 (
) 3 (
2
19
2
2
= > =
|
|
.
|

\
|
>

= > _
o
P
s n
P s P

b) La condicin que se debe cumplir es,
10 , 0 ) 2 ( = > x P
8. Distribuciones en el muestreo
-213-
El suceso contrario es,
90 , 0 ) 2 ( = < x P
90 , 0
2 2
=
|
|
|
.
|

\
|
<

<

n n
x
n
P
o o

o

Buscamos el valor de 645 , 1
05 , 0
= z , y de la expresin anterior el valor de n se
obtiene de,
645 , 1
2
=
n
o

Despejando n se tiene,
2
4 , 5 645 , 1
= n
n=3,65 de donde el valor de n tiene que ser como mnimo de n=4.


8.10.2.- La longitud de una pieza utilizada en un proceso de montaje sigue una
distribucin normal de media 50 mm y desviacin tpica 12 mm. Si extraemos una
muestra aleatoria simple de 16 piezas. Determinar:
a. Cul es la probabilidad de que su media sea menor de 58? (0,5 puntos)

La media muestral seguir una distribucin del tipo ~N(50, 12/16), por lo que la
probabilidad pedida es:



b. Entre qu valores se encontrar el 38% de las medias muestrales obtenidas
al tomar reiteradamente muestras de 16 piezas de ese lote? (1,5 puntos)

La probabilidad pedida es:
8. Distribuciones en el muestreo
-214-

Asumiendo simetra para simplificar




c. Qu tamao tendra que tener la muestra para que la probabilidad de
encontrar medias superiores a 52 fuese 0,2578? (1,5 puntos)

El tamao de muestra n debe cumplir que:



d. Calcular la probabilidad de que la varianza muestral sea mayor de 12,5? (1
punto)

La varianza muestral sigue una distribucin del tipo por lo que la
probabilidad pedida ser:



8.10.3.- En un proceso de fabricacin se dispone de dos mquinas. El peso de las
piezas fabricadas por la mquina A sigue una distribucin N (100; 2). El peso de las
piezas fabricadas por la mquina B sigue una distribucin N (102; 2). Se toma una
muestra aleatoria de 5 piezas fabricadas por la mquina A y se calcula la media
muestral. A continuacin se toma otra muestra de 5 piezas de B y se calcula la media
muestral. Cul es la probabilidad de que la media muestral de A sea mayor que la
8. Distribuciones en el muestreo
-215-
de B? (2 puntos)
Solucin:
) 5 2 ; 100 ( N xA ~ ) 5 2 ; 102 ( N xB ~
( ) ( ) ( ) 2 102 100 = = = B A B A x E x E x x E
( ) ( ) ( ) 6 , 1 ) 5 / 4 ( ) 5 / 4 (
2 2 2
= + = + = B A B A x x x x o o o
( ) ( ) | | | | ( ) = = = > = > = > ) 58 , 1 ( 6 , 1 / 2 0 ) 6 , 1 ; 2 ( 0 | | N P x x P x x P B A B A 0,057


8. Distribuciones en el muestreo
-216-

9. Inferencia en poblaciones normales
-217-
9. INTRODUCCIN A LA INFERENCIA ESTADSTICA

Contenido
9.1 ESTIMACIN PUNTUAL ......................................................................... 217
9.2. ESTIMACIN POR INTERVALOS DE CONFIANZA ............................... 220
9.2.1. Intervalo de confianza para la media poblacional .................................. 221
9.2.2. Intervalo de confianza para la varianza poblacional ............................... 223
9.2.3. Intervalo de confianza para el cociente de varianzas poblacionales ..... 224
9.2.4. Intervalo de confianza para la proporcin .............................................. 225
9.2.5. Intervalo de confianza para la diferencia de proporciones ..................... 227
9.2.6. Intervalo de confianza para la diferencia de medias poblacionales ........ 228
9.3. TEST DE HIPTESIS ............................................................................. 230
Conceptos ....................................................................................................... 230
Obtencin de los tests .................................................................................... 234
9.4. TEST DE HIPTESIS PARMETRICOS ..................................................... 235
9.4.1. Contrastes de la media de una poblacional normal .......................... 235
9.4.2. Test de hiptesis para la varianza poblacional ................................. 240
9.4.3. Test de hiptesis para el cociente de varianzas poblacionales ........ 241
9.4.4. Contrastes de proporciones ............................................................. 242
9.4.5. Test de hiptesis para la diferencia de medias poblacionales con
muestras independientes ................................................................................ 246
9.4.6. Test para la diferencia de medias poblacionales con datos
apareados ....................................................................................................... 247
9.4.7. Test para la diferencia de proporciones ........................................... 248
9.4.8. Test de ajuste a una distribucin ...................................................... 250
9.4.9. Test de independencia ..................................................................... 252
9.5. PROBLEMAS PROPUESTOS ..................................................................... 255
Test de hiptesis ................................................................................................. 256
Tabla de contingencia ......................................................................................... 260
Test de ajuste a una distribucin ......................................................................... 261
9.6. PROBLEMAS Y CUESTIONES DE EXMENES ......................................... 262



9.1 ESTIMACIN PUNTUAL

Sea X una v.a. cuya funcin de distribucin F(x;u) depende del parmetro poblacional
u , y una muestra aleatoria simple (x
1
, x
2
, , x
n
) extrada de la misma poblacin. El
proceso de estimacin consiste en elegir una funcin de dichos datos muestrales,

de manera que sus valores se aproximen lo mejor posible al valor


verdadero y desconocido del parmetro u .
9. Inferencia en poblaciones normales
-218-

Cul es el criterio para saber que nos aproximamos lo mejor posible al valor
verdadero del parmetro?

Llamando a



se sigue el criterio de elegir u

de forma que minimice la cantidad ) - (


2
u u

, o lo que
es equivalente, que minimice por trmino medio esa cantidad. Esto se puede
expresar como:



Imaginemos que tenemos dos posibles funciones de la muestra (estimadores)

para estimar el mismo parmetro poblacional u (la media de una distribucin


N(0;1)), con las distribuciones que aparecen en la Figura 9. 1.



Figura 9. 1. Dispersin de los estimadores


Observamos que

ser preferible al

, ya que est centrado en el valor verdadero,


y tiene una dispersin menor que la del estimador

.

Si el valor medio del estimador coincide con el parmetro a estimar, se dice
que el estimador es centrado o insesgado,

u u = ) E(



Caso contrario existe un sesgo ) b(u que se define como,
N(0,1)
N(0,2)
x
f
x
(x)
-10 -6 -2 2 6 10
0
0,1
0,2
0,3
0,4


9. Inferencia en poblaciones normales
-219-

u u = u )

E( ) b(


Figura 9. 2. Comparacin de estimadores


Supongamos ahora que las distribuciones de los estadsticos fueran las que
aparecen en la Figura 9. 2. Aqu no tendramos un criterio claro para elegir, ya que si
uno es preciso, el otro es ms exacto.

La exactitud del estimador es la propiedad de proporcionar valores cerca del
valor verdadero, y la precisin se refiere a la dispersin de dichos valores.


Figura 9. 3. Exactitud y precisin de un estimador


Para comparar estos estadsticos debemos elegir otros criterios, por ejemplo,
el que sea Uniformemente de Mnima Varianza (UMV), es decir, entre todos los
posibles estimadores ser mejor el que tenga una varianza ms pequea.

Luego en primer lugar, nos interesa estudiar aquellos estimadores que sean
insesgados y de mnima varianza.
Preciso pero no exacto Exacto pero no preciso Exacto y preciso
x
x
x
x
x
x
x
x x
x
x
x
x
x x
N(0,2)
N(2,1)
x
f
x
(x)
-10 -6 -2 2 6 10
0
0,1
0,2
0,3
0,4


9. Inferencia en poblaciones normales
-220-

El error cuadrtico medio se descompone en sesgo al cuadrado y varianza del
estimador, segn la siguiente expresin:
)

( )

2 2
u u u u D b ) - E(
2
+ =


Para cada estimador

nos interesa conocer su funcin de distribucin, su


media y su varianza o desviacin tpica. La varianza del estimador

viene dada por


la expresin

, cuya expresin depende, por lo general, de un parmetro


poblacional. Por ejemplo, la varianza de la media muestral es,
n
x D
2
2
) (
o
=

En caso de no conocer la varianza poblacional, la estimamos por la varianza
muestral, con lo cual la varianza del estimador es realmente una estimacin de la
varianza poblacional del estimador. Esto se expresa mediante

. La desviacin
tpica de esta varianza estimada se denomina error estndar del estimador

, y se
expresa mediante )

(u EE , lo cual viene a ser equivalente a la notacin )

u D . El error
estndar de la media muestral es,
n
s
x EE = ) (


9.2. ESTIMACIN POR INTERVALOS DE CONFIANZA

No solamente interesa obtener un valor concreto del parmetro desconocido, sino
tambin una idea de la precisin de la estimacin. Con este objeto proporcionamos
un intervalo de valores, cuyos lmites son funcin de los valores muestrales, de forma
que tendr una gran probabilidad, o - 1 , de contener al valor verdadero del parmetro
estimado. Es decir, se debe cumplir la condicin de que

o u - 1 = )) x (
L
) x (
L
P(
2 1

s s


Cuanto menor sea el intervalo, mayor es la precisin del estimador.

Si cambia la muestra, tambin cambia los valores
L
y
L 2 1
, de manera que
tenemos unos intervalos aleatorios.

A la cantidad o - 1 se denomina "coeficiente o nivel de confianza" y o es el
coeficiente o nivel de significacin. Por lo general, o es el 5% el 1%. Si tomamos
5% = o significa que de cada 100 intervalos que obtengamos para estimar u , 95
contendrn al valor verdadero y desconocido del parmetro y 5 no lo contendrn.
9. Inferencia en poblaciones normales
-221-
Esta idea se expone en la Figura 9. 4.



Figura 9. 4. Concepto de intervalos de confianza


Para obtener intervalos de confianza elegimos una funcin ) ; x g( u

cuya
distribucin, es conocida, y no depende del parmetro a estimar y que permite
despejar u en funcin de todo lo dems. Vamos a verlo con casos sencillos que
estudiamos a continuacin.

9.2.1. Intervalo de confianza para la media poblacional

Si x

procede de una poblacin normal ) ; N( o de media y desviacin tpica


conocidas, entonces:

N(0;1) =
n
- x
o



y podemos obtener dos valores de la N(0;1) tales que

o
o

o o
- 1 =
z
+
n
- x
z
- P
/2 /2
|
|
|
|
.
|

\
|
s s

despejando queda:

9. Inferencia en poblaciones normales
-222-
o
o

o
o o
- 1 =
n
z
+ - x
n
z
- P
/2 /2
|
|
.
|

\
|
s s
de donde:
o
o

o
o o
- 1 =
n
z
+ x
n
z
- x P
/2 /2
|
|
.
|

\
|
s s

Si la o poblacional es desconocida, se tiene que

t
=
n
s
- x
1 - n



y obtenemos unos valores de la
t 1 - n
tales que:

o

o o
- 1 =
t
+
n
s
- x
t
- P
/2
1 - n
/2
1 - n
|
|
|
|
.
|

\
|
s s
despejando queda:

o
o o
- 1 =
n
s
t
+ x
n
s
t
- x P
/2
1 - n
/2
1 - n
|
|
.
|

\
|
s s

Y los lmites del intervalo son:

n
s
t
- x ) x ( L
/2
1 - n 1
o
=

n
s
t
x ) x ( L
/2
1 - n 2
o
+ =

Error de estimacin de la media poblacional

Si empleamos el estadstico x para estimar la media poblacional, el error de
estimacin es justamente la semiamplitud del intervalo de confianza, esto es,
n
z
o
c
o
=
2 /


Si no conocemos la o el error de estimacin es,
n
s
t
/2
1 - n
=
o
c
9. Inferencia en poblaciones normales
-223-
Si el tamao N de la poblacin no es muy grande en relacin al tamao de la
muestra, a la varianza hay que aplicar el factor de correccin
1

N
n N
por poblacin
finita, y los errores de estimacin son,

1
2 /

=
N
n N
n
z
o
c
o

1

=
N
n N
n
s
t
/2
1 - n
o
c

Clculo del tamao muestral para un error determinado

Si deseamos saber cuntas unidades debemos evaluar para que nuestra
estimacin de la media poblacional no sea superior a un error determinado c con un
nivel de confianza de o 1 , despejando el tamao muestral n de las frmulas
anteriores del error, tenemos la expresin,
2
2
|
|
.
|

\
|
=
c
o
o
z
n

Si no conocemos la o el valor de la n es,
2
2
2
2 /
1 n
z s
t s
n
|
|
.
|

\
|
c

~
|
|
.
|

\
|
c

=
o
o


Se aproxima a la normal para no tener que recurrir a tanteos al estar la
incgnita n en la frmula del clculo inicial.

Si la poblacin es finita, el valor de la n se despeja de sus expresiones
respectivas, donde aparece el factor de correccin por poblacin finita.


9.2.2. Intervalo de confianza para la varianza poblacional

Para una m.a.s. )
x
,...,
x
,
x
(
n 2 1
extrada de una poblacin normal ) ; N( o , tenemos
que

_
o
2
1 - n
2
=
s
n
2
) 1 (

y podemos calcular unos valores de la chi-cuadrado tales que

o _
o
_
o o
- 1 =
s
n P
2
2
1, - n
2
2
2
- 1,1 - n
|
|
.
|

\
|
s s
2
) 1 (
9. Inferencia en poblaciones normales
-224-

despejando
o
2


o
_
o
_
o o
- 1 =
1
s n
1
P
2
2
1, - n
2
2
2
- 1,1 - n
|
|
|
|
.
|

\
|
>

>
2
) 1 (


o
_
o
_
o o
- 1 =
s n s n
P
2
2
- 1,1 - n
2
2
2
1, - n
|
|
|
|
.
|

\
|

s s

2 2
) 1 ( ) 1 (



9.2.3. Intervalo de confianza para el cociente de varianzas poblacionales

Sea
X1

una m.a.s. extrada de una poblacin ) ; N(


1 o

1
, y
X2

otra m.a.s. extrada de


una poblacin ) ; N(
2
2
o
, se tiene que:

F
=
s
s
1 - n 1, - n
2
2
2
1
2 1
o
o
2
2
2
1


y podemos obtener unos valores de la F tal que:

o
o
o
o o
- 1 =
F
s
s
F
P
/2
1 - n 1, - n
2
2
2
1 /2 - 1
1 - n 1, - n 2 1 2 1
|
|
|
|
|
.
|

\
|
s s
2
2
2
1

o
o
o
o o
- 1 =
F
1
s
s
F
1
P
/2
1 - n 1, - n
2
2
2
1
/2 - 1
1 - n 1, - n 2 1 2 1
|
|
|
|
|
.
|

\
|
> >
2
2
2
1

o
o
o
o o
- 1 =
F
s
s
F
s
s
P
/2 - 1
1 - n 1, - n
2
2
2
1
/2
1 - n 1, - n 2 1 2 1
|
|
|
|
|
.
|

\
|
s s
2
2
2
1
2
2
2
1

9. Inferencia en poblaciones normales
-225-



Actividad 9.1:

En una planta de envasado de agua se toman al azar de la cadena de produccin 15
botellas, y se analiza para cada una de ellas el contenido de calcio en mg/l.,
resultando los siguientes valores:

25 29,4 28,1 27,5 31 27,7 24,7 33,1 32,2 29,4 33,3 28,4 31 26,8 33,3

Se pide:
a) Estimar la media poblacional y su error de estimacin con un nivel de
significacin del 5%.
b) Calcular un intervalo de confianza para la media poblacional, con un
coeficiente de confianza del 95%.
c) De antemano se sabe que la varianza es 9, cunto vale el intervalo de
confianza al 95% para la media poblacional?
d) Cuntas botellas se deben examinar para estimar la media poblacional con
un error menor del 1 mg/l y un nivel de confianza del 95%?



9.2.4. Intervalo de confianza para la proporcin

Si de una poblacin con proporcin poblacional de defectuosas
0
p tomamos una
muestra aleatoria de tamao n y observamos el nmero X de piezas defectuosas,
como el valor de X sigue una distribucin binomial, y sta se puede aproximar a una
distribucin normal, un intervalo de confianza para la proporcin
0
p , viene dado por,
n
q p
z
p p
n
q p
z
p
/2 /2

0

+ s s

o o


Siendo p la proporcin muestral, esto es,
n
x
f p = =
Si p fuera la proporcin de defectos entre las n piezas, entonces X sigue una
distribucin de Poisson, y como se puede aproximar a una distribucin normal, el
intervalo de confianza para la proporcin de defectos es,
n
p
z
p p
n
p
z
p
/2 /2

0 o o
+ s s

9. Inferencia en poblaciones normales
-226-

Error de estimacin de la proporcin

El error de estimacin de la proporcin de unidades defectuosas viene dado
por la expresin que hay a la derecha del del intervalo de confianza para la
proporcin, esto es,
n
q p
z /2

=
o
c

Para el caso de poblacin finita, hemos de adjuntar a la varianza el factor de
correccin
1 N
n N

, y el error es,
1

=
N
n N
n
q p
z /2 o
c

Si no conocemos la p poblacional, hay que obtener una estimacin previa p ,
o bien ponernos en el caso ms desfavorable, y es considerar que el producto
pq=0,25, que es lo mximo que puede ser dicho producto.

El tamao muestral para un error determinado se obtiene despejando n de las
expresiones anteriores.

Si estamos estimando la proporcin de defectos, el intervalo de confianza se
basa en la distribucin de Poisson, y resultan las mismas expresiones pero quitando
la q, es decir, cambiando pq por p. Las expresiones de los errores son,

n
p
z /2 o
c =
1

=
N
n N
n
p
z /2 o
c



Actividad 9.2:

De una produccin de componentes electrnicos se examinaron 75, y resultaron 5
defectuosos.
a) Calcular un intervalo de confianza para la proporcin de componentes
defectuosos.
b) Cuntas piezas se deben examinar para estimar el valor verdadero de la
proporcin de piezas defectuosas con un error menor de 0,01 y una confianza
de 95%?
c) Calcular el tamao muestral si no conocemos un valor previo de p.
d) Calcular el tamao muestral si tenemos una estimacin previa de p=0,04.
9. Inferencia en poblaciones normales
-227-
e) Caso de suponer una poblacin finita de N=1000 bujas.
f) Mismo enunciado que el anterior, pero suponiendo que deseamos estimar la
proporcin de defectos por unidad de buja.

9.2.5. Intervalo de confianza para la diferencia de proporciones

Si de una poblacin de proporcin de defectuosas p
1
tomamos una muestra aleatoria
de tamao n
1
y observamos que hay X
1
defectuosas; y de otra poblacin de
proporcin de defectuosas p
2
tomamos una muestra aleatoria de tamao n
2
y
observamos el nmero de defectuosas X
2
, como tanto X
1
como X
2
siguen
distribuciones normales, si los tamaos de muestra son suficientemente grandes, la
diferencia
2
2
1
1
n
X
n
X


tambin sigue una distribucin normal, y un intervalo de confianza para la diferencia
de proporciones viene dado por,

n
q p
+
n
q p
z p - p p - p
n
q p
+
n
q p
z p - p
2
2 2
1
1 1
2 1 2 1
2
2 2
1
1 1
2 1




2 / 2 / o o
+ s s


Donde,
2
1
1 1

n
x
f p = = y
2
2
2 2

n
x
f p = =

Si las proporciones se refieren a defectos por unidad, el intervalo de confianza
es el mismo, pero cambiando el producto de pq por p, esto es,
n
p
+
n
p
z p - p p - p
n
p
+
n
p
z p - p
2
2
1
1
2 1 2 1
2
2
1
1
2 1




2 / 2 / o o
+ s s




Actividad 9.3:

De una muestra de 400 alumnos de la ETSII, 27 de ellos dijeron que fumaban
habitualmente, en cambio de una muestra de 500 alumnos de la Bellas Artes dijeron
que fumaban 35. Se pueden considerar que el porcentaje de fumadores en BBAA
es bastante superior al de la ETSII?

9. Inferencia en poblaciones normales
-228-
9.2.6. Intervalo de confianza para la diferencia de medias poblacionales

Si de una poblacin normal ) ; ( N
1 1
o , extraemos una muestra de tamao n
1
y
calculamos la
1
x ; y de otra poblacin normal ) ; ( N
2 2
o extraemos otra muestra
aleatoria de tamao n
2
, y observamos
2
x , como la diferencia
2 1
x x sigue una
distribucin normal,
|
|
.
|

\
|
+
2
2
2
1
2
1
2 1 2 1
;
n n
N x x
o o


Un intervalo de confianza para la diferencia de medias poblacionales, siempre
y cuando los tamaos muestrales sean bastante elevados, es,

n
+
n
z
x
-
x
n
+
n
z
x
-
x
2
2
2
1
2
1
/2
2 1
2
2
2
1
2
1
/2
2 1
o o

o o
o o
+ s s +
2 1


En el caso de no conocer las varianzas poblacionales
2
o las estimamos a
partir de las varianzas muestrales
2
s y el intervalo de confianza es,

n
s
+
n
s
t
x
-
x
n
s
+
n
s
t
x
-
x
2 1
/2
2 n + n 2 1
2 1
/2
2 n + n 2 1 2 1 2 1
2
2
2
1
2 1
2
2
2
1
+ s s

o o


Si admitimos que las varianzas poblacionales son iguales pero desconocidas,
la varianza comn la estimamos a partir de una ponderacin de las varianzas
muestrales, esto es,
2 -
n
+
n
s
1) -
n
( +
s
1) -
n
(
= s
2 1
2
2 2
2
1 1 2


Y el intervalo de confianza es,
n
1
+
n
1
s
t
x
-
x
n
1
+
n
1
s
t
x
-
x
2 1
/2
2 - n + n 2 1
2 1
/2
2 - n + n 2 1 2 1 2 1
+ s s
o o

2 1




Actividad 9.4:

1. Un almacenista de pilas alcalinas desea conocer la duracin media de las pilas que
ofrece un nuevo proveedor. Para ello ha tomado 12 pilas al azar y ha medido el
tiempo de duracin en horas. Los resultados han sido:

9. Inferencia en poblaciones normales
-229-
Duracin(hrs.)
27.5
31.2
33.4
29.8
25.4
30.5
31.7
26.3
29.2
32.1
30.8
28.6

a) Cul es la estimacin de la duracin media.
b) Cul es la estimacin de su dispersin?
c) Qu error se comete en la estimacin de la duracin media?
d) Calcular los intervalos de confianza para la duracin media y la dispersin de
la duracin de la pilas.


2. El almacenista anterior tiene la oportunidad de comprar pilas alcalinas de otro
nuevo proveedor que afirma que las que l fabrica tiene una mayor duracin. Para
ello el almacenista extra 10 pilas de este nuevo proveedor y mide la duracin de las
mismas. Los resultados han sido:

Duracin(hrs.)
31.3
33.5
34.2
29.4
28.5
30.7
32.9
31.7
30.3
32.1

a) Estimar la media y la varianza de la duracin de las pilas.
b) Calcular los errores de estimacin.
c) Calcular el intervalo de confianza para diferencia de medias.
d) Estimar el intervalo de confianza para la desviacin tpica.
e) Contrastar la hiptesis de que el segundo proveedor es mejor que el
9. Inferencia en poblaciones normales
-230-
primero.
f) Contrastar la hiptesis de igualdad de varianzas.


3. En la tabla siguiente se recogen medidas de desgaste de las suelas de zapatos de
10 chicos. Las suelas se fabricaron de dos materiales sintticos A y B. La pregunta a
contestar es, hay diferencias entre el material A y el B en cuanto a desgaste de la
suela de zapato.


Chico Material A Material B Diferencia(B-A)
1 13,2 14,0 0,8
2 8,2 8,8 0,6
3 10,9 11,2 0,3
4 14,3 14,2 -0,1
5 10,7 11,8 1,1
6 6,6 6,4 -0,2
7 9,5 9,8 0,3
8 10,8 11,3 0,5
9 8,8 9,3 0,5
10 13,3 13,6 0,3


El material se asign de forma aleatoria a cada zapato.

a) Obtener un intervalo de confianza para la diferencia de la media del desgaste
entre los dos tipos de materiales.



9.3. TEST DE HIPTESIS

Conceptos

Una hiptesis es una afirmacin acerca de algo. Por ejemplo, el parmetro u es igual
a cero. Bajo esta suposicin estudiamos los datos y su comportamiento, y si no hay
mucha discrepancia entre lo observado y lo esperado, aceptamos tal afirmacin,
cuanto menos decimos que no hay suficiente evidencia como para rechazar la
hiptesis establecida.

En consecuencia, se plantea el problema como una toma de una de las dos
decisiones siguientes:
9. Inferencia en poblaciones normales
-231-

d0
= acepto la afirmacin planteada.

d1
= rechazo la afirmacin planteada.

La afirmacin que realizamos se llama "hiptesis nula" y casi siempre va
ligada a lo que es habitual indicando que hay nulo cambio; y la contraria se llama
"hiptesis alternativa".

Si la hiptesis respecto del valor de un parmetro se reduce a un punto,
decimos que la hiptesis es "simple", y si se trata de un conjunto de puntos, decimos
que la hiptesis es "compuesta".

Hiptesis simples son H
0
(u=u
0
) frente a la alternativa H
1
(u=u
1
). Hiptesis
compuestas son H
0
(u e e
0
) frente a la alternativa H
1
(u e e
1
). As pues, podemos tener
H
0
(u=u
0
) vs H
1
(u=u
0
)
que es un test bilateral cuando los valores alternativos estn a ambos lados del valor
supuesto, y

H
0
(usu
0
) vs H
1
(u>u
0
) o bien H
0
(u=u
0
) vs H
1
(u>u
0
)
H
0
(u>u
0
) vs H
1
(u<u
0
) o bien H
0
(u=u
0
) vs H
1
(u<u
0
)

que son test unilaterales, porque los valores alternativos estn a un lado del valor
supuesto.

La hiptesis alternativa es la ms fuerte, y se suele colocar como hiptesis
nula aquella cuyas consecuencias econmicas sean ms graves. Es decir, la
hiptesis nula tiende a ser ms conservadora, de modo que no cambia su
formulacin a menos de que no haya evidencias objetivas muy fuertes en su contra.


Regin de aceptacin y de rechazo

Una vez planteadas la hiptesis nula y la alternativa, el problema consiste en
tomar una muestra de la poblacin, y a partir de ella decidir si aceptar o rechazar la
hiptesis nula, en funcin de la coherencia de los valores muestrales con la hiptesis
nula establecida.

Esto equivale a dividir el espacio muestral en dos zonas. Si el punto muestral
cae en la zona de aceptacin, que llamamos X
0
(s), aceptamos H
0
, y si cae en la zona
de rechazo X
1
(s) aceptamos H
1
, lo cual implica rechazar H
0
. La letra "s" indica la
particin efectuada. Esquemticamente es como aparece en la Figura 9. 5.


9. Inferencia en poblaciones normales
-232-

Figura 9. 5. Test de hipotesis

Encontrar el test significa encontrar la subdivisin del espacio muestral que
minimiza las prdidas de las decisiones errneas, segn la matriz de prdidas


Decisin\Espacio paramtrico e
e
u 0 0

e
e
u 1 1


0, decisin correcta Error 2 (|) W(d
0
,u
1
)


Error 1 (o) W(d
1
,u
0
)

0, decisin correcta


Suponemos que cuando la decisin es la correcta, la prdida es cero.


Errores de primera y segunda especie

En el contraste de hiptesis se pueden cometer dos errores:

1) Rechazar
H0
, cuando realmente es verdadera.

2) Aceptar
H0
, cuando realmente es falsa.

El primero de ellos se llama error de primera especie o tipo I cuya probabilidad
es o , y viene dado por,
) (s)/
X
P(x =
0 1 u
o e

y el segundo es el error de segunda especie o tipo II cuya probabilidad es | , y es

) (s)/
X
P(x =
1 0 u
| e

d0
d1
9. Inferencia en poblaciones normales
-233-

Figura 9.6. Valor de la

Para un contraste de hiptesis nos interesara que tanto o como | sean cero,
o ambos lo ms pequeo posible. Lo primero no se puede conseguir salvo que
analicemos toda la poblacin. Para conseguir lo segundo bastara con aumentar
suficientemente el tamao de la muestra con lo que aumentamos nuestra informacin
y reducimos la probabilidad de equivocarnos. De tal forma que si hacemos o=0, se
cumple, para una misma n, que |=1; y al contrario, si hacemos que |=0, para una
misma n, se cumple que o=1.

La Potencia del test se define como:

) (s)/
X
P(x = ) (
Pot 1 s
u u e


es decir, la probabilidad de rechazar la hiptesis nula en funcin del valor del
parmetro. El mejor test es aquel que para u=u
0
la potencia es mnima y para otro
valor sea mxima.

La curva caracterstica es la complementaria de la curva de potencia, es decir,

| u = = ) / ( ) (
0
H aceptar P CC

1

o
x
/\n

x

L
I L
S
o/2
o/2
|
o
x
/\n
9. Inferencia en poblaciones normales
-234-

Figura 9. 7. Potencia del test


Obtencin de los tests

La forma prctica de obtencin del test de hiptesis es la siguiente: bajo el supuesto
de que se cumple la hiptesis nula H
0
, observamos un estadstico "T", funcin de la
muestra, que seguir un determinado tipo de distribucin, y por lo tanto ser muy
probable que el valor observado est dentro del campo de existencia de la
distribucin T. Esta idea aparece representada en la Figura 9. 8.


Figura 9. 8. Distribucin del estadstico T


Pero si el valor observado cae fuera del intervalo esperado, esto est en
contradiccin con la hiptesis nula, lo cual nos lleva a rechazarla. Por lo general, el
intervalo esperado corresponde al o - 1 de los datos, siendo 5% = o .

Tambin se puede decir que si la probabilidad de obtener un valor mayor que

o/2
o/2
L
I L
S
1o
Intervalo Esperado
1-o
1
o
|
1-|


Pa

1-o
1
o
|
1-|


Pr
0 0
Curva Caracterstica Curva de Potencia
9. Inferencia en poblaciones normales
-235-
el observado, el cual viene dado por:

value - p = ) T > P(T
observ


es muy pequeo, o < value - p , entonces es algo raro, bajo el supuesto de que se
cumpla la hiptesis nula, lo cual nos lleva a rechazarla.

Es decir, que admitimos un cierto nivel de discrepancia entre lo esperado y lo
observado, pero si la discrepancia es muy grande, esto lleva a rechazar la hiptesis
nula.

Con este razonamiento encontramos los principales test, que vemos a
continuacin.


9.4. TEST DE HIPTESIS PARMETRICOS

9.4.1. Contrastes de la media de una poblacional normal

Las hiptesis que planteamos son ) (
H
a frente ) = (
H
0 1 0 0
= , supuesto que
la varianza poblacional sea conocida. El estadstico a emplear es:

Z N(0;1) =
n
- x
= T
0
=
o



y bajo el supuesto de la hiptesis nula, se cumple que:

o
o o
- 1 = )
z
+ < T <
z
P(-
/2 /2


y si la T observada resulta

z
|>
T
|
/2 0 o


entonces se rechaza la hiptesis nula.

Si la varianza poblacional es desconocida, empleamos el estadstico t:

9. Inferencia en poblaciones normales
-236-
t
=
n
s
- x
= T
1 - n
0



y bajo el supuesto de la hiptesis nula, se cumple que:

o
o o
- 1 = )
t
+ T
t
P(-
/2
1 - n
/2
1 - n
s s

luego, si

t
|> T |
/2
1 - n
o
0


rechazamos la hiptesis nula.

Grficamente es segn la Figura 9. 9.


Figura 9. 9. Zonas de aceptacin y de rechazo


El test "s" es mejor que el "t" para contrastar )
0
= (
Ho
.



s
t

0
Pr
0

1

o/2
o/2
L
I L
S
1o
Zona de aceptacin
Zona de rechazo
9. Inferencia en poblaciones normales
-237-
Figura 9. 10. Comparacin de test
0
=15


Con este planteamiento tambin se puede resolver un test a un slo lado, por
ejemplo

conocido con ) (
H
a frente ) > (
H
0
1
0
0
o s

El estadstico a observar es el mismo

n
- x
= T
0
o


las zonas de aceptacin y de rechazo son segn la Figura 9. 11.


Figura 9. 11. Test unilateral

Esto significa que el rea o en lugar de repartirse a ambos lados, slo est
en el lado de
H1
, ya que bajo ) > (
H
0
0
, lo normal es que la
tobserv.
se vaya hacia la
izquierda de la figura.

De esta forma, si:

z
- >
Tobserv. o


aceptamos la H
0
.

De forma anloga, si el test de hiptesis es,

conocido con ) (
H
a frente ) (
H
0
1
0
0
o > s

Las zonas de aceptacin y de rechazo se muestran en la figura siguiente,

o
L
I
1o
Zona de aceptacin
Zona de rechazo
9. Inferencia en poblaciones normales
-238-





Actividad 9.5

Un proveedor de pilas alcalinas del tamao de R6 asegura que pueden funcionar por
trmino medio hasta 40 horas. El comprador de las pilas, para contrastar tal
afirmacin, prueba 9 de ellas y observa el tiempo de duracin de cada uno de ellas.
El resultado ha sido:

40,5 39,5 41 42 37 35 43 41,5 42,5

a) Se puede aceptar la afirmacin del proveedor?
b) Cunto vale el p-valor del test?
c) Si realmente la duracin de las pilas fuera de 35 horas, cul ser la
probabilidad de aceptar que funcionan por trmino medio 40 horas?
d) Cul ser el tamao muestral a tomar por que la probabilidad de aceptar la
hiptesis nula sea del 60%



Aplicacin del test de hiptesis para la media poblacional

En funcin de la escala de la x , la zona de aceptacin del test H
0
(=
0
) frente
a H
1
(=
0
) es,
)
`

+ s s =
n
z x
n
z x s X
o

o o 2 / 0 2 / 0 0
/ ) (


Que grficamente es colocar dos lneas, la LCS y la LCI, siendo,
LCS=
n
z
0
2 / 0
o

o
+ LCI=
n
z
0
2 / 0
o

o



o
L
I L
S
1o
Zona de aceptacin
Zona de rechazo
9. Inferencia en poblaciones normales
-239-
Tomamos una muestra de tamao, calculamos su media muestral, y si este
valor est entre el LCI y el LCS, aceptamos que la media poblacional no se ha
modificado.


Figura 9. 12. Grfico de control para la media poblacional


Clculo de la |

Para el test H
0
(=
0
) frente a H
1
(=
0
), si la media en lugar de
0
cambia a
1
, la probabilidad de que un punto muestral est dentro de los lmites de aceptacin
es,
|
.
|

\
|
+ s s = < < =
1 2 0 2 0
) (
o
o

o
o
|
n
z x
n
z P LCS x LCI P

Suponiendo que la o no haya cambiado, para obtener la probabilidad
tipificamos, pero ahora la distribucin de x es )
n
; ( N x
1
o
y el valor de la |

|
|
|
|
.
|

\
|

|
|
|
|
.
|

\
|
+
=
n
n
z
n
n
z
o

|
o

| |
o o 1 2 / 0 1 2 / 0



Sustituyendo valores calcularamos el valor de |.


Tamao muestral

Si nos dan dos puntos de la curva caracterstica ) 1 , (
0
o y ) ; (
1
| , el tamao
de muestra para realizar el contraste de hiptesis, se obtiene imponiendo que la
LCS
LCI
Muestra 1 Muestra 2

t
Aceptamos H
0
Rechazamos H
0
9. Inferencia en poblaciones normales
-240-
curva caracterstica pase por esos dos puntos y despejando el valor de n se tiene,
( )
2
2
2
2 /
2
2 /
o
o
| o | o
z z
d
z z
n
+
=
|
|
.
|

\
| +
=
Donde
o

=
0 1
d es el descentrado relativo, y
0 1
= o .


9.4.2. Test de hiptesis para la varianza poblacional

El mismo razonamiento se aplica para la varianza poblacional. As para el contraste

) (
H
a frente ) = (
H
2
0
2
1
2
0
2
0 o o o o
=
empleamos el estadstico

_
o
_
2
1 - n
2
0
2
2
. observ
s
) 1 n ( =
y por lo tanto se pueden calcular unos valores de la chi-cuadrado tales que:

o _ s _ s _
o o
- 1 = ) P(
2
/2 - 1,1 - n
2
1 n
2
/2 - 1,1 - n


y en consecuencia, si la
2
. observ
_ est fuera de ese intervalo, rechazamos la hiptesis
nula ) = (
H
2
0
2
0 o o
.

Para el contraste de
) > (
H
a frente ) = (
H
2
1
2
0
2
0
2
0
o
o o o

si el valor de la
2
. observ
_ se va hacia la derecha, da ms peso a
H1
que a
H0
, luego el
rea o se va hacia la derecha. Grficamente es segn la Figura 9. 13.







9. Inferencia en poblaciones normales
-241-

_
2
n-1
(o)

o
1-o
_
2
n-1


Figura 9. 13. Zona de rechazo.

Si _ _
o
2
1, - n
2
. observ
> , rechazamos la
H0




Actividad 9.6.

La duracin de las pilas alcalinas se sabe que tiene una desviacin tpica de 3
minutos. Para comprobar que una nueva remesa de pilas tienen la misma dispersin,
se prueba 11 de ellas y la desviacin tpica muestral ha sido s=3,7. Se puede decir
que la dispersin es mucho mayor en esta segunda remesa?



9.4.3. Test de hiptesis para el cociente de varianzas poblacionales

Anlogamente, para contrastar

) (
H
a frente ) = (
H
2
2
2
1 1
2
2
2
1 0 o o o o
=

el estadstico a observar es:
F
=
s
s
=
F 1 - n 1, - n
2
2
2
1
observ.
2 1
o
o
2
2
2
1

que bajo el supuesto de que
o o
2
2
2
1
= , el estadstico se reduce a:

9. Inferencia en poblaciones normales
-242-
F
=
s
s
=
F 1 - n 1, - n observ.
2 1 2
2
2
1


Tomando como
2
1
s la mayor de las cuasivarianzas muestrales, el cociente
deber ser la unidad, pero si es un poco mayor que la unidad, todava no hay
evidencia de que
o o
2
2
2
1
= , pero si el cociente es bastante mayor que la unidad,
entonces si hay razn para pensar que
o o
2
2
2
1
= .


) (
1 , 1
2 1
o
n n
F

1 , 1
2 1
n n
F


o

Figura 9. 14. Zona de rechazo

Ese bastante nos lo indica el cociente de varianzas muestrales, de forma que
si
F
>
F
/2
1 - n 1, - n observ.
2 1
o
, rechazamos la
H0
, y podemos decir que
o o
2
2
2
1
> .



Actividad 9.7.

De una remesa de 11 pilas alcalinas la desviacin tpica ha sido de 3,7 y de una
segunda remesa de 13 pilas alcalinas la desviacin tpica ha sido de 4,6. Se puede
decir que la dispersin de la segunda remesa es mucho mayor que la dispersin de la
primera?



9.4.4. Contrastes de proporciones

Para contrastar si el porcentaje de defectos de un lote de piezas es p
0
, muestreamos
n piezas al azar del lote, y observamos el nmero X de piezas defectuosas. En
principio, si el tamao del lote es grande en comparacin con la muestra, X sigue una
9. Inferencia en poblaciones normales
-243-
distribucin Binomial B(n,p), pero si np>5, se puede aproximar a una distribucin
normal ) p) - np(1 N(np; X . Con ello bajo el supuesto de que p = p
0
la cantidad X
se distribuye segn una ) ) p - (1 np ; np N(
0 0 0
y tipificando se tiene:

) p - (1 np
p n - X
= z
0 0
0


Esta cantidad Z sigue una distribucin N(0;1), de forma que el valor observado
cabe esperar que est dentro del campo de existencia de la normal tipificada, con
una probabilidad del 95% (tomando 0,05 = o ). En caso de que ocurra lo esperado,
no hay razn para rechazar la hiptesis nula de que p = p
0
. Es decir, la regin de
aceptacin del test es,

z
+ < z <
z
-
/2 /2 o o

y la regin de rechazo es la contraria,

z
> | z |
/2 o




Actividad 9.8

De un contenedor con 10000 piezas se afirma que el porcentaje de defectuosas es
del 2%. Para contrastarlo se toma una muestra de 50 unidades y se observa que hay
2 defectuosas.

a) Es eso coherente con la hiptesis nula de que el porcentaje es del 2%?
b) Cunto vale el p-valor del test?
c) Si viniera un contenedor con un porcentaje del 5%, cul ser la probabilidad
de aceptar la hiptesis nula?
d) Si queremos que la probabilidad anterior fuera de 0,40 qu tamao de
muestra debemos tomar?




Clculo de la | para un proporcin

Para el test ) p p ( H
0 0
= frente a ) p p ( H
0 1
= los lmites de la zona de
aceptacin son,

9. Inferencia en poblaciones normales
-244-
n
q p
z p LCS
0 0
2 / 0 o
+ =
n
q p
z p LCI
0 0
2 / 0 o
=

Si la proporcin fuera p
1
, el valor de | es,
) / ( ) / (
1
0 0
2 / 0
0 0
2 / 0 1
p
n
q p
z p p
n
q p
z p P p LCS f LCI P
o o
| + s s = s s =

Cuando p
0
cambia a p
1
, la f sigue una distribucin normal )
n
q p
; p ( N
1 1
1
,
pero los lmites de la zona de aceptacin no cambian, y el valor de | es,

|
|
|
|
|
.
|

\
|

|
|
|
|
|
.
|

\
|
+
=
n
q p
p
n
q p
z p
n
q p
p
n
q p
z p
1 1
1
0 0
2 / 0
1 1
1
0 0
2 / 0

o o
| | |

Sustituyendo valores, calcularamos el valor de |.

Para la proporcin de defectos(defectos por unidad), es todo igual pero
cambiando pq por slo p.


Grficos de control para la proporcin de piezas defectuosas

Para controlar que la proporcin de piezas defectuosas de un proceso
industrial se mantiene en un nivel de
0
p , tomamos una muestra al azar de tamao n
y observamos la proporcin muestral,
n
x
f p = =
Siendo x el nmero de piezas defectuosas que aparecen en la muestra.

Las sucesivas muestras de tamao n, vamos graficando en ordenadas el valor
de dicha proporcin muestral, y siempre que la misma est dentro de unos lmites de
aceptacin para el test ) p p ( H
0 0
= frente a ) p p ( H
0 1
= diremos que el proceso est
bajo control, tal y como se refleja en la figura de abajo.


9. Inferencia en poblaciones normales
-245-
Tiempo
Muestra 1
Muestra 2
Aceptamos la H0
Rechazamos la H0
f=x/n
n
q p
z p LCS
/
0 0
2 0 o
+ =
n
q p
z p LCI
/
0 0
2 0 o
=

Figura 9. 15. Grfico de control para la proporcin de defectuosas

Siempre que la proporcin observada de la muestra est dentro de dichos
lmites, asumiremos que el proceso se encuentra dentro de lo que cabe esperar, pero
cuando un punto salga de dichos lmites, habr que buscar la causa del cambio del
proceso.


Tamao muestral

Si nos dan dos puntos de la curva caracterstica ) 1 , (
0
o y ) ; (
1
| , el tamao
de muestra para realizar el contraste de hiptesis, se obtiene imponiendo que la
curva caracterstica pase por esos dos puntos y despejando el valor de n se tiene,

2
0
0 0 2 /
|
|
.
|

\
|

+
=
p p
pq z q p z
n
| o


Para la proporcin de defectos (defectos por unidad), el tamao de muestra a
tomar para que el test pase por los dos puntos de la curva caracterstica es,

2
0
0 2 /
|
|
.
|

\
|

+
=
p p
p z p z
n
| o


9. Inferencia en poblaciones normales
-246-
9.4.5. Test de hiptesis para la diferencia de medias poblacionales con
muestras independientes

Si partimos de dos poblaciones de dos poblaciones que siguen distribuciones
N(
1
,o
1
) y N(
2
, o
2
) respectivamente, para realizar el contraste de,

) ( ) (
2 1 2 1
H a frente H = =


Tomamos una muestra de tamao n
1
de la primera poblacin y otra muestra
de tamao n
2
de la segunda poblacin, calculamos las medias muestrales de cada
muestra, y observamos el estadstico,

2
2
2
1
2
1
2 1 2 1
n n
x x
T
o
+
o

=
) ( ) (


El cual sigue una normal tipificada. Si el valor de T cae dentro de la zona de
aceptacin (1-o) no hay razn para rechazar la hiptesis nula. El rea de aceptacin
es,
2 2
z T z
/ / o o
s s


En el caso de que o
1
y o
2
sean desconocidas pero iguales, la o comn la
estimamos mediante,
2
) 1 ( ) 1 (
2 1
2
2
2 1
2
1
+
+
=
n n
n s n s
s
Y el estadstico
2 1
2 1 2 1
1 1
) ( ) (
n n
s
x x
T
+

=


Sigue una t de Student con n
1
+n
2
-2 grados de libertad.

Si
2 /
2
2 /
2
2 1 2 1
o o
+ +
s s
n n n n
t T t

Aceptamos la hiptesis nula de igualdad de medias.

Para el contraste unilateral

) ( ) (
2 1 2 1
> = H a frente H

Aceptamos la H
0
cuando
9. Inferencia en poblaciones normales
-247-
o
2
2 1
+
<
n n
t T


9.4.6. Test para la diferencia de medias poblacionales con datos
apareados

Se trata de un contraste para la diferencia de medias de dos poblaciones, pero en
que las muestras obtenidas no son independientes, sino que estn de alguna forma
relacionadas una a una, de manera que el tamao de las muestras es el mismo. Es
tpico el caso de que de un elemento de la poblacin realizamos mediciones antes y
despus de un tratamiento y queremos contrastar si hay diferencias debido al
tratamiento.

El tamao de la muestra es n, y para cada elemento tenemos las
observaciones x
1i
y x
2i
, la primera y segunda medicin, y deseamos contrastar si las

i i i
x x d
2 1
=

son por trmino medio cero. Es decir, el test de diferencias de medias,

) ( ) (
2 1 2 1
= = H a frente H

Se reduce al test
) 0 ( ) 0 ( = =
d d
H a frente H

Para ello aplicamos este test a la variable d
i
y observamos el estadstico,

n s
d
T
d
0
=
Donde
n
d
d
n
i
i
=
=
1
y
1
) (
1
2

=

=
n
d d
s
n
i
i
d
.

Si
2 /
1
2 /
1
o o

s s
n n
t T t aceptamos la hiptesis nula de igualdad de medias y en
caso contrario la rechazamos.


9. Inferencia en poblaciones normales
-248-


Actividad 9.9.

En la tabla siguiente se recogen medidas de desgaste de las suelas de zapatos de 10
chicos. Las suelas se fabricaron de dos materiales sintticos A y B. La pregunta a
contestar es, hay diferencias entre el material A y el B en cuanto a desgaste de la
suela de zapato.

Chico Material A Material B Diferencia(B-A)
1 13,2 14,0 0,8
2 8,2 8,8 0,6
3 10,9 11,2 0,3
4 14,3 14,2 -0,1
5 10,7 11,8 1,1
6 6,6 6,4 -0,2
7 9,5 9,8 0,3
8 10,8 11,3 0,5
9 8,8 9,3 0,5
10 13,3 13,6 0,3

Las mediciones son las alturas que restan en las suelas de los zapatos.

El material se asign de forma aleatoria a cada zapato.

a) Suponiendo que los datos fueran independientes, hay diferencias entre el
material A y B?
b) Como los datos se han obtenido a pares (son dependientes), qu material es
el mejor?



9.4.7. Test para la diferencia de proporciones

Se trata de un contraste para comprobar si las proporciones de dos poblaciones son
iguales o distintas. Suponemos que la primera poblacin tiene una proporcin p
1
de
una determinada caracterstica, y de sta tomamos una muestra al azar de n
elementos, y la segunda poblacin tiene una proporcin p
2
de la misma caracterstica,
y tomamos una muestra al azar de n
2
elementos.

El test que plantamos es

9. Inferencia en poblaciones normales
-249-
) ( ) (
2 1 2 1
p p H a frente p p H = =

El cual equivale a,

) 0 ( ) 0 (
2 1 2 1
= = p p H a frente p p H

Para su contraste empleamos el estadstico,

|
|
.
|

\
|
+

=
2 1
2 1
1 1
) 1 (
) 0 ( ) (
n n
p p
f f
T

donde

2 1
2 1

n n
x x
p
+
+
=
1
1
1
n
x
f =
2
2
2
n
x
f =

Siendo x
1
y x
2
el nmero de elementos de la muestra que poseen la
caracterstica que estamos estudiando.

Bajo el supuesto de que se cumpla la H
0
, y n
1
y n
2
lo suficientemente grandes,
el estadstico T se distribuye segn una normal tipificada.

Si
2 / 2 / o o
z T z s s aceptamos la hiptesis nula con un nivel de significacin
de o, y en caso contrario rechazamos la hiptesis nula.



Actividad 9.10

Se quiere comprobar si dos lotes con un determinado tipo de componente presenta el
mismo porcentaje de unidades defectuosas. Para comprobarlo se sacan 40 piezas
del primer lote y resulta que hay 2 defectuosas; y despus se sacan 50 piezas del
segundo lote y resulta que hay 4 piezas defectuosas.

a) Podemos afirmar que el porcentaje es el mismo?
b) Cunto vale el p-valor del test?



9. Inferencia en poblaciones normales
-250-
9.4.8. Test de ajuste a una distribucin

Cuando observamos unos datos extrados al azar de una poblacin se plantea la
hiptesis de si dicha poblacin sigue una determinada distribucin o por el contrario
los datos no se puede decir que proceden de dicha poblacin supuesta.

Vamos a plantear el test de ajuste a una distribucin mediante un ejemplo
sencillo, como es la distribucin aleatoria del los puntos extrados al lanzar un dado.
La funcin de probabilidad es,
6 , 5 , 4 , 3 , 2 , 1
6
1
) ( = = =
i i
x para x X P
El objetivo de la prueba es comprobar si un dado est trucado o no. Para ello
lanzamos el dado 60 veces y anotamos la frecuencia de cada cara. Imaginemos que
el resultado haya sido.

OBSERVADO ESPERADO
9 10
13 10
7 10
14 10
12 10
5 10

A la vista de los resultados, podemos decir que el dado est bien?

Bajo el supuesto de que el dado est bien la frecuencia esperada de cada x
i

es
10
6
1
60 ) ( = =
i
x P n
Si observamos que las frecuencias fluctan alrededor del valor de 10, diremos
que no hay motivo para pensar que el dado est trucado. Pero si las frecuencias que
observamos se separan mucho de 10, habr motivo para pensar que el dado
realmente est trucado, ya que existen valores que se escapan de lo que cabe
esperar.

Cmo decimos que hay mucha diferencia respecto de lo que esperamos?

Para medir est diferencia empleamos el estadstico Chi-cuadrado, cuya
expresin es,

=
k
i
k
i
i i
c
E
E O
1
2
1
2
) (
_ _
donde:

i
o = frecuencia observada del valor x
i
.
9. Inferencia en poblaciones normales
-251-

i
e = frecuencia esperada del valor de x
i
.

Las hiptesis que se plantean son:

H
0
(los datos siguen la distribucin del dado) frente a H
1
(los datos no siguen la
distribucin del dado)

Bajo el supuesto de la H
0
se demuestra que el estadstico
2
c
_ sigue una
distribucin
2
_ de k-1 grados de libertad, donde k es el nmero de intervalos o
nmero de sumas de la chi-cuadrado.

La aplicacin del test consistir-a en calcular la cantidad
2
c
_ y si

Si
2
, 1 k
2
c o
_ < _
aceptamos la H
0

Si
2
, 1 k
2
c o
_ > _ rechazamos la H
0
.

O bien calculamos el p-valor del estadstico
2
c
_ , esto es,

( )
2 2
1 c k
P valor p _ _ > =



Y si,

El p-valor > o aceptamos la H
0

El p-valor < o rechazamos la H
0
.

En la siguiente hoja de clculo EXCEL hemos realizado la aplicacin de este
test.

OBSERVADO ESPERADO CONTRIBUCION
9 10 0,1
13 10 0,9
7 10 0,9
14 10 1,6
12 10 0,4
5 10 2,5

Suma 6,4


p-valor, 0,269218814

Por lo tanto no podemos rechazar que el dado sea correcto con =0,05.

9. Inferencia en poblaciones normales
-252-
En resumen, para comprobar si unos datos ) x ,...., x , x (
n 2 1
se ajustan a una
determinada distribucin aleatoria con funcin de distribucin F(x), el procedimiento a
seguir es:

1) Dividir el campo de existencia de la v.a. X en k intervalos disjuntos, a ser
posible equiprobables (con igual probabilidad de pertenecer a uno de los
intervalos).
2) Contar el nmero de datos que caen en cada intervalo. Esto es las o
i
.
3) Calcular la frecuencia esperada en cada intervalo, mediante
i i
p n e = .
4) Calcular la cantidad

=
k
i
s k
i
i i
c
E
E O
1
2
1
2
) (
_ _
donde s es el nmero de parmetros que definen la F(x) estimados a partir de los
propios datos.

Si para calcular la
i
p debemos conocer los parmetros de la distribucin,
entonces los grados de libertad k-1 se reducen con el nmero s de parmetros que
estimamos a partir de los propios datos.

Por ejemplo, si X es una normal debemos conocer la media y la sigma. Pero
si son desconocidos, hay que estimarlos a partir de los propios datos. De este modo,
para este caso el valor de la s=2.

Comprobamos si la
2
c
_ cae dentro de la zona de aceptacin, con lo cual
decimos que los datos siguen esa funcin de distribucin F(x), o si caen el la zona de
rechazo, y decimos que no se admite que los datos siguen esa F(x).

Para que el test funcione bien, un requisito es que la frecuencia esperada sea
al menos de 5, esto es, que 5 p n
i
> . En caso de que algn intervalo no cumpla esta
condicin, se combina con los anteriores o posteriores para cumplir que la frecuencia
esperada al menos sea de 5.


9.4.9. Test de independencia

En muchas ocasiones clasificamos a los elementos de una poblacin en funcin de
dos caractersticas, la A y la B, donde la caracterstica A tiene r posibles valores, y la
B tiene c posibles valores. La clasificacin de cada elemento segn el valor de A y el
valor de B da lugar a una tabla de doble entrada, filas y columnas, que recibe el
nombre de tabla de contingencia. Por ejemplo, la tabla de turno de fabricacin en
filas y nmero de defectos de calidad en cada coche en columnas.
9. Inferencia en poblaciones normales
-253-

La pregunta que se formula es tiene algo que ver el turno de trabajo con el
que aparezcan ms o menos defectos de calidad? En definitiva, se trata de
comprobar si la caracterstica A es independiente de la caracterstica B, es decir,
plantemos un test de independencia entre las dos caractersticas.

Recordamos la notacin expuesta en el tema de estadstica descriptiva
bidimensional.

1 2 j J total
1
2

i nij

ni-


I
total n j -

n - -


Y llamando a:


- i
p = probabilidad de pertenecer a la clase i de la caracterstica A.

j
p
-
= probabilidad de pertenecer a la clase j de la caracterstica B.

La probabilidad de pertenecer a la clase A
i
y a la clase B
j
es,
) (
j i
B A P

Y bajo el supuesto de independencia, se cumple que,
j i j i j i ij
p p B P A P B A P p
- -
= = = ) ( ) ( ) (

Y las hiptesis son,
) , (
0
j i p p p H
j i ij
=
- -
frente a ) , (
1
j i par un menos a p p p H
j i ij - -
=

Para comprobar esta hiptesis aplicamos el estadstico chi-cuadrado como,

= =

=
r
i
c
j ij
ij ij
c
e
e o
1 1
2
2
) (
_
Donde:

i j
o = frecuencia observada en la casilla i,j.

i j
e = frecuencia esperada en la casilla i,j.

9. Inferencia en poblaciones normales
-254-
Bajo el supuesto de independencia,
i j
e se calcula como
n p p n p e
j i ij ij - -
= =
Siendo
n
n
p
i
i
-
-
=
n
n
p
j
j
-
-
=
Que sustituyendo queda,
n
n n
n
n
n
n
n
e
j i j
i
ij
- - -
-
= =



Y bajo la H
0
la cantidad
2
c
_ se distribuye segn una Chi-cuadrado de (r-1)(c-
1) grados de libertad. La regla de decisin es,

Si
2
), 1 )( 1 (
2
o
_ _

<
c r c
aceptamos la H
0
.
Si
2
), 1 )( 1 (
2
o
_ _

>
c r c
rechazamos la H
0
.

O bien calculando el ( )
2
c
2
) 1 c )( 1 r (
P valor p _ > _ =

,

Si p-valor > o aceptamos la H
0
.
Si p-valor < o rechazamos la H
0
.

Para que funcione bien el test la frecuencia esperada en cada casilla debe ser
superior a 5.

Para el contraste de igualdad de proporciones de varias poblaciones o para la
igualdad de varias poblaciones (contraste de homogeneidad), los datos se clasifican
como una tabla de contingencia y se aplica el mismo procedimiento que el visto en el
test de independencia.



Actividad 9.11:

Se toma una muestra de estudiantes de diferentes grupos de clase de aula y se les
pide su opinin en cuanto a una propuesta de cambio del plan de estudios. Los
resultados son los siguientes:

9. Inferencia en poblaciones normales
-255-
Clase A favor En contra
1 120 80
2 70 130
3 60 70
4 40 60

Podemos decir que algunos grupos de clase estn ms a favor de la propuesta que
otros?

Se ha preguntado a un grupo de hombres y mujeres si fuman cigarrillos de forma
habitual. Los resultados han sido:

Fuma No fuma
Mujer 9 11
Hombre 20 40


Hay diferencias entre los hombres y las mujeres en cuanto al hbito de fumar
cigarrillos?



9.5. PROBLEMAS PROPUESTOS

9.5.1. Calcular el tamao de la muestra para que el error relativo de s'
2

respecto de
2
sea inferior al 25% con una probabilidad mayor del 80%.

Solucin: 52


9.5.2. Para estudiar el espesor de la capa de imprimacin de la carrocera de
un determinado modelo de automvil se examinaron 10 vehculos obtenindose
los siguientes valores

{ 45, 40, 44, 43, 45, 43, 46, 45, 44, 45 }

medidos en micras. En el supuesto de que sigan una distribucin NORMAL :

a) Calcular un intervalo de confianza al nivel =0'05 para el promedio del
espesor.
b) Lo mismo para la varianza del espesor.

Solucin: a) [42.78; 45.21] b) [1.37; 9.63]

9. Inferencia en poblaciones normales
-256-

9.5.3. Una resistencia elctrica ha sido medida 6 veces, resultando los valores
en ohmios :
{ 1'5, 1'6, 1'4, 1'5, 1'3, 1'1 }

Calcular el intervalo de confianza para la media con =0'05.

Solucin:[1.21,1.59]

9.5.4. Para un intervalo de confianza de un determinado parmetro con un nivel
de confianza del 90%; indicar cul de las siguientes afirmaciones es correcta:

a) contiene con una probabilidad del 90% el valor real y desconocido del parmetro
poblacional a estimar.
b) es la regin de aceptacin de un test de hiptesis al 10%.
c) estima puntualmente con una probabilidad del 90% el parmetro muestral.
d) ninguna de las anteriores.

Test de hiptesis

9.5.5. Una muestra de 16 transistores de cierto tipo ha presentado una vida
media de 734 horas. Puede aceptarse que la media poblacional es de 740
horas con un nivel de significacin =0'05?

a) Supuesta normalidad y conocido =12 horas.
b) Supuesta normalidad y conocido s'=12 horas.

Solucin: a) no [728.12,739.88] b) si [727.61,740.39]


9.5.6. Sea X una variable aleatoria de distribucin NORMAL N(m,1). Con el fin
de contrastar la hiptesis de que la media poblacional es m=2 frente a m2 se
toma una muestra, siendo esta:

{ 2'1, 2'2, 2'5, 1'9, 1'2 }

Puede aceptarse la hiptesis nula con =0'05?

Solucin: si 1.98 e [1.1235,2.8765]

9.5.7. Tras numerosas comprobaciones, el nmero de pulsaciones por minuto
de varones de 20 a 25 aos se distribuye segn una NORMAL N(72,9). Si una
muestra de 100 jugadores de ftbol da como media 64 pulsaciones por minuto,
debemos considerar esta diferencia como significativa con =0'05?

Solucin: no 64 < 70.5195
9. Inferencia en poblaciones normales
-257-


9.5.8. El contenido de un determinado elemento en un acero es una variable
aleatoria NORMAL N(35,1). Se sospecha que una modificacin del proceso da
lugar a un aumento del contenido medio del elemento en cuestin, y se sabe que
es imposible que lo disminuya.

a) Plantear el Test de hiptesis que confirme el aumento de dicho elemento.
Tomar =0'05.
b) Calcular la probabilidad de aceptar la hiptesis nula para diferentes valores
de la media.

La modificacin no altera las dispersiones.
Muestra {35'5, 34'0, 36'8, 37'0, 35'8, 37'5, 34'5, 38'0, 37'5, 36'0}

Solucin: a) s x 35.62 b) {35,0.975} {35.62,0.5} {36.0,0.115} {36.2,0.033}


9.5.9. Se tiene el Test de hiptesis
H
o
:
2
=4
H
1
:
2
=9
a partir de una muestra aleatoria simple de tamao n=21 procedente de una
poblacin NORMAL. La regin de aceptacin es X
o
(s)={ x / s'
2
s6} y la de rechazo
X
1
(s)={ x / s'
2
>7}. Si s'
2
esta entre ambos se decide aceptar con probabilidad 0'6 y
rechazar con probabilidad 0'4. Hallar las probabilidades de los riesgos de I y II
especie.

Solucin: = 0.04 = 0.2


9.5.10. Una empresa anuncia que el 10% de las unidades de un artculo en
venta procede de sus fbricas, frente a un competidor que asegura que dicho
porcentaje es menor. Se toma una muestra de 100 artculos, de los cuales slo 3
son de la primera empresa. Puede aceptarse que sta tiene razn? Tomar
=0'05.

Solucin: no 0.03 s 0.05065


9.5.11. En el proceso de fabricacin de tornillos se desea que la proporcin
mxima de tornillos defectuosos producidos debe ser de un 5
o
/
o
. En un control de
fabricacin tomamos una muestra de 100 tornillos y encontramos uno
defectuoso.

a) Se puede afirmar que el proceso esta fuera de control? Tomar =0'05.
b) Qu ocurre si la direccin quiere mas precisin en el test?
9. Inferencia en poblaciones normales
-258-

Solucin: a) no 0.01 e [0.0073, 0.0927]

9.5.12. Un partido afirma que el 55% de los electores estn de acuerdo con sus
ideas frente a un problema. Se toma una muestra de 1.000 electores y se obtiene
una proporcin del 51%. Puede sostener el partido poltico dicha afirmacin?
Tomar =0'05.

Solucin: no 0.51 e[0.5192, 0.5808]

9.5.13. La proporcin de unidades defectuosas en un lote de 100 unidades del
proveedor A es del 4%, mientras que un lote de 150 unidades del proveedor B
es del 7%. Hay evidencias para decir que el proveedor A produce menos
unidades defectuosas que el proveedor B? Tomar =0'05.

Solucin: no 0.9941 < 1.96


9.5.14. La variabilidad de un proceso en condiciones de produccin correctas es
de 3 unidades. Se dispone de una muestra de tamao n=15, con los siguientes
valores:

{ 27, 17, 18, 30, 17, 22, 16, 23, 26, 20, 22, 16, 23, 21, 17 }

Funciona correctamente el proceso? Tomar =0'05.

Solucin: no [3.6185, 16.7907]


9.5.15. Para contrastar

H
o
: =1
H
1
: =2

se dispone de una nica observacin x que proviene de una distribucin de
Poisson Ps(). Si se toma como regin de rechazo >4, calcular las
probabilidades de los errores de tipo I y tipo II.

Solucin: = 0.0189 = 0.85712




9.5.16. Una partida de gran tamao de piezas se considera vlida si tiene menos
de un 2% de piezas defectuosas (H
0
:ps002). Para su control se toman 9 piezas
y se acepta la partida si todas las piezas son correctas. Cul es la probabilidad
9. Inferencia en poblaciones normales
-259-
de cometer un error de 2 especie si en realidad el lote inspeccionado tiene un
10% de piezas defectuosas?

a) 03874
b) 06126
c) 02252
d) 07748


9.5.17. HIJOS DE ILUMINADA S.A. es una empresa que se dedica a producir
bombillas. En una de sus lineas se fabrican bombillas de 40 Watios. El filamento
de las mismas tiene una resistencia con distribucin NORMAL N(605,1.18)
ohmios, y una bombilla se considera correcta cuando su resistencia esta situada
entre los valores 607.86 y 600.96. Para comprobar que el proceso de
fabricacin esta bajo control, es decir, que la media vale 605, los operarios de la
linea realizan un test consistente en tomar muestras de tamao 7 de forma
peridica, y si la resistencia media esta situada entre los valores 606.338 y
603.662 se acepta que el proceso esta bajo control. Determinar la probabilidad
de cometer el error de primera especie, y el de segunda especie cuando el valor
de la media poblacional es de 606.5.

a) =0.00270, =0.44540
b) =0.02571, =0.35942
c) =0.02571, =0.44540
d) =0.00270, =0.35942


9.5.18. Para contrastar la hiptesis de igualdad de precisin de dos mtodos de
anlisis, utilizamos la distribucin:

a) N(m
1
+m
2
,
2
2
2
1
o o + )
b)
2
2 1
n n +
_
c)
2 1
,n n
F
d)
2 1
n n
t
+



9.5.19. Se quiere contrastar la hiptesis nula de que la proporcin de piezas
defectuosas en una partida es menor o igual al 1%, contra la alternativa de que
es mayor. Para ello se realiza el siguiente plan: se van tomando piezas de la
partida hasta que aparezca una defectuosa. Si el nmero de piezas tomadas
hasta ese momento es menor o igual que 2 se acepta la partida y en caso
contrario se rechaza. Calcular el error de segunda especie para una proporcin
de piezas defectuosas del 10%.

a) 0.1900
b) 0.1000
9. Inferencia en poblaciones normales
-260-
c) 0.0975
d) 0.0950


9.5.20. Una determinada mquina fabrica lminas de acero cuyo espesor sigue
una distribucin normal N(0.1, 0.005) cm. La mquina se considera que funciona
mal, y por tanto se debe revisar, si al tomar una muestra, el espesor promedio de
las lminas es superior a 0.1041cm. Si al tomar una muestra el promedio de
longitud es inferior a 0.1041cm y por tanto no revisamos la mquina, cul de
estas afirmaciones es cierta?

a) Podemos estar cometiendo un error de primera especie
b) Podemos estar cometiendo un error de segunda especie
c) Seguro que cometeremos un error de primera especie
d) Seguro que cometeremos un error de segunda especie

Tabla de contingencia

9.5.21. La siguiente tabla muestra la frecuencia con la que se dan las distintas
calidades de piezas en dos mquinas de una determinada empresa. Se
pretende comprobar mediante un test
2
si existen diferencias significativas entre
las dos mquinas en cuanto a nmero de piezas fabricadas de cada calidad.
Calcular el nivel de significacin de dicho test.

Piezas
intiles
Piezas
reciclables
Piezas
correctas
Mquina A 15 33 60
Mquina B 42 61 82

a) 005
b) 010
c) 025
d) 050


9.5.22. Un estudio realizado sobre el nmero de accidentes mortales de
automvil durante el ltimo puente festivo, muestra los siguientes resultados, en
funcin del tamao del coche y el estado del conductor y los pasajeros:


MUERTOS \ TAMAO DEL COCHE PEQUEO MEDIANO GRANDE
al menos uno 49 35 18
ninguno 71 65 62

9. Inferencia en poblaciones normales
-261-
En un peridico (A) se afirma que el tamao del coche (y su equipamiento de
seguridad) no influye en el nmero de accidentes mortales, mientras que otro (B)
dice que s, y que la distribucin es:

MUERTOS \ TAMAO DEL COCHE PEQUEO MEDIANO GRANDE
al menos uno 46 34 20
Ninguno 74 66 60


Con los datos expuestos:

a. Slo el peridico A tiene razn, el tamao del coche no influye en la
siniestrabilidad del accidente.
b. Slo el peridico B tiene razn, y el tamao del coche si que influye en el
nmero de muertos, y la distribucin que aporta es aceptable.
c. Ninguno de los dos peridicos tiene razn, ya que el tamao del coche si
que influye, pero la distribucin no es la dada por el peridico
d. No se puede afirmar nada, ya que la muestra es demasiado pequea y
los grados de libertad no son suficientes.

Test de ajuste a una distribucin

9.5.23. Se han sacado 200 muestras de 3 piezas en una lnea de montaje,
encontrndose fuera de tolerancia las siguientes:

N. de piezas
defectuosas
N. de muestras
0 100
1 80
2 15
3 5
Cul de las siguientes afirmaciones es cierta?

a) Con una confianza del 95% rechazamos que sigan una distribucin binomial
de parmetro B(3,0.2).
b) Con una confianza del 99% rechazamos que sigan una distribucin binomial
de parmetro B(3,0.2).
c) Con una confianza del 90% no podemos rechazar que sigan una distribucin
binomial de parmetro B(3,0.2).
d) Con una confianza del 85% no podemos rechazar que sigan una distribucin
binomial de parmetro B(3,0.2)



9. Inferencia en poblaciones normales
-262-
9.5.24. El n de llamadas va modem que recibe un ordenador por unidad de
tiempo se ha muestreado dando los siguientes resultados:

N llamadas Frecuencia
-----------------------------------------------
0 144
1 136
2 74
3 32
4 11
5 2
6 1

Pudiendo aceptarse que la variable tiene una distribucin de Poisson, calcular el valor
de .

Solucin: 1`1


9.6. PROBLEMAS Y CUESTIONES DE EXMENES

9.6.1. Una fbrica trabaja con dos mquinas A y B. El coste semanal, X
A
, de
reparacin para la mquina A se aproxima a una distribucin Normal con
parmetros
A
=350 y
A
2
=500. El coste semanal, X
B
, de reparacin de la mquina
B se aproima a una distribucin normal con parmetros
B
=200 y
B
2
=400.
Queremos estudiar el coste de las reparaciones de cada mquina y, para ello,
tomamos una muestra aleatoria de n
A
=5 facturas de reparaciones de la mquina A
y otra de n
B
=4 de la mquina B y calculamos las medias muestrales de los costes
de reparacin. Si queremos comparar los costes de las dos mquinas:

a) Determinar la distribucin de la diferencia de los costes medios muestrales. (1
punto)

b) Hallar la probabilidad de que la diferencia entre el coste medio muestral de A y
el coste medio muestral de B sea superior a 180 euros. (0.5 puntos)

c) Hallar la probabilidad de que al tomar las dos muestras de facturas, como se
indica en el enunciado, la cuasivarianza del coste de la mquina A sea
superior a 114 veces la cuasivarianza del coste de B? (1.5 puntos)
SOLUCIN:
a)


b)

9. Inferencia en poblaciones normales
-263-




c)
05 , 0 ) 12 , 9 ( )
500
400
4 , 11 (
) 4 , 11
/
/
( ) 4 , 11 / ( ) 4 , 11 (
3 , 4 ) 1 ( ), 1 (
2
2
2 2
2 2
2 2 2 2
= > = >
= > = > = >

F P F P
S
S
P S S P S S P
B A
n n
A
B
B B
A A
B A B A
o
o
o
o



9.6.2. El tiempo que tarda en realizar la entrega de los paquetes a los clientes de la
ciudad de Valencia una empresa de mensajera ubicada en el polgono de la
Fuente del Jarro es, de forma habitual, una variable con distribucin N(m=35min,
=10min). La semana pasada se incorporaron al trabajo tres repartidores nuevos
con poca experiencia, hecho que podra afectar a los tiempos de entrega
empeorndolos. Para hacer un control verificamos el tiempo de entrega de 4
paquetes seleccionados aleatoriamente y obtenemos los siguientes valores
expresados en minutos (40; 15; 42; 70).

a. Con un nivel de significacin del 5% Hay evidencias significativas de un
empeoramiento del tiempo medio de entrega? (1 punto)

b. Cul sera el valor de del test anterior si el tiempo medio de entrega
hubiese aumentado a 45 minutos? (1 punto)

c. Calcular un intervalo de confianza al 99% para la media del tiempo de entrega
y otro al 95% para la varianza de dicho tiempo de entrega (0,75 puntos)

d. Cuntos envos deberamos controlar para estimar la media real del nuevo
tiempo de espera con error absoluto menor de 2 minutos y un nivel de
confianza del 80%? (0,75 puntos)

SOLUCIN:

a) Se trata de un test sobre la media m de una poblacin normal
Es un test unilateral porque el cambio solo es previsible que se d en un
sentido (aumentar) por lo tanto tenemos

H
0
: m=m
0
=35 minutos
H
1
: m>35

Dado que conocemos la desviacin tpica =10, la regla de decisin es
) 14 , 14 , 150 ( ) 200 , 150 (
)
4
400
5
500
, 200 350 ( ,
2 2
N N
N N x x
B
B
A
A
n n B A B A
=
= + =
|
.
|

\
|
+ =
o o

9. Inferencia en poblaciones normales
-264-

Aceptar H
0
si


Calculamos y

Como podemos aceptar la hiptesis nula y admitir
que no ha habido un aumento significativo del tiempo medio de reparto.

b) =P(ceptar H
0
/ H
1
cierta)=P( )=P(N(45, /n)43,25)=
P(N(45, 10/4)43,25)= P(N(45, 5)43,25)=(43,25-45/5)=(-0,35)=0,3632

c) El intervalo de confianza para la media con varianza conocida es


y con nuestros datos





El intervalo de confianza para la varianza poblacional es

_
'
s
o
s
_
'
o o
2
/2 - 1;1 - n
2
2
2
/2 1; - n
2
s ) 1 n ( s ) 1 n (


_
o
_
o o
2
2
2
975 0 3 025 0 3
583 505 . 3 583 505 . 3
= =
s s


216 0
583 505 . 3
384 9
583 505 . 3
s s
o
2

(16163; 7021944)




d)




9.6.3. Queremos estudiar si se mantiene la proporcin de circuitos integrados
defectuosos que se producen en un proceso de produccin. Lo habitual es que
n
z m x
o
o
+ s
0
75 , 41 = x
225 , 43
4
10
645 , 1 35 = +
225 , 43 75 , 41 < = x
45 / 25 , 43 = s m x
entregas
e
z
n 42 28 , 41
2
10 . 285 , 1
2 2
2 /
=
|
.
|

\
|
=
|
.
|

\
|
>
o
o
n
z x
o
o 2 /

4
10
57 , 2 75 , 41
) 60 , 54 90 , 28 ( ) 85 , 12 75 , 41 (
9. Inferencia en poblaciones normales
-265-
haya alrededor de un 0,5%. Para comprobarlo, tomamos una muestra de 300
circuitos y si encontramos un circuito defectuoso o ms decimos que la proporcin
es superior a 0,5%.

a) Determinar, para este contraste de hiptesis, cunto vale la probabilidad de
error de 1 especie (1,25 puntos).

b) Si la proporcin de circuitos defectuosos del proceso fuera del 1% cunto
valdra la probabilidad de error de 2 especie? Qu significado tiene? (1,50
puntos)

c) Si al tomar la muestra de 300 circuitos nos sale uno defectuoso qu decisin
tomamos? Qu tipo de error podramos estar cometiendo? (0,75 puntos)


SOLUCIN:

H
0
(p=0005) vs H
1
(p>0005)

a)



b)
|



El 49% de las veces que apliquemos este test, aceptaremos que la proporcin
de piezas defectuosas es p=0005 cuando en realidad es 001 (por lo tanto nos
estaremos equivocando)

c) Tal y como dice el enunciado, si nos sale X>1, rechazamos la H
0
.
El nico tipo de error que podemos cometer es el de primera especie ya que
hemos RECHAZADO.



9.6.4. De forma habitual, el 10% de los envos de una empresa de distribucin
presentan alguna incidencia como retrasos, errores, etc. Despus de la
incorporacin de varios conductores inexpertos y a lo largo de una semana se
controlan 50 envos registrndose incidencias en 6 de ellos.

a) Con un nivel de significacin del 5% hay evidencias significativas de un
empeoramiento en la proporcin de envos con incidencias? (1,5 puntos)
b) Cul sera el valor de del test anterior si la proporcin de envos con
incidencias hubiese aumentado a un 15%? (1,5 puntos)
c) Cuntos envos deberamos controlar para estimar la proporcin real de
envos con incidencias con un error absoluto menor del 4% y un nivel de
confianza del 80%? (0,5 puntos).
9. Inferencia en poblaciones normales
-266-
d) Calcular un intervalo de confianza al 99% para la proporcin poblacional P de
envos con incidencias despus de la incorporacin de los nuevos
conductores.(0,50 puntos)
Solucin:
a) Las hiptesis a contrastar son: H
0
:P=P
0
= 0,10 H
1
:P>0,10 ya que de
acuerdo con el enunciado el cambio podra suponer un empeoramiento
respecto al funcionamiento habitual, es decir, una proporcin mayor que la
habitual

La regin de aceptacin para este test es

Aceptar si

Como p=6/50=0,12 <

Podemos aceptar H
0
y concluir que no ha habido un incremento significativo
de la proporcin de envos con incidencias

b) =P(ceptar H
0
/ H
1
)=P(p<0,169/P=0,15)=P(N(0,15 0,15 . 0,85/50)<0,169)=

P(N(0,15 0,05)<0,169)=


c) El nmero de envos a controlar, considerando como proporcin habitual 0,10
es



Si tomamos como estimacin previa de P el valor muestral 0,12 sale 108,98
109
Envos.

d) El intervalo de confianza es
) 2381 0 ; 0019 0 (
50
88 0 . 12 0
57 , 2 12 0
) 1 (

2 /
= =

n
p p
z p
o





9.6.5. El nmero de llamadas diarias realizadas con el mvil por las alumnas de 1
de GITI podemos admitir que es una variable de Poisson de media 2,5
llamadas/da y el de las llamadas realizadas por los chicos tiene una distribucin
de Poisson de promedio 1,5 llamadas/da.
Al entrar al examen todos dejan su mvil en la mesa del profesor. Elegido uno
de los mviles al azar, queremos verificar la hiptesis nula de que pertenece a una
chica frente a la alternativa de que es de un chico.
169 , 0
50
90 , 0 . 10 , 0
645 , 1 10 , 0 = +
n
P P
z P p
) 1 (

0 0
0

+ s
o
6480 , 0 ) 38 , 0 ( )
05 , 0
15 , 0 169 , 0
( = u =

u
2
2
2 /
0
) 1 (
e
p p z
n

=
o
envios 93 77 , 92
04 , 0
90 , 0 . 10 , 0 . 285 , 1
2
2
~ = =
9. Inferencia en poblaciones normales
-267-
Como regla de decisin adoptamos la siguiente: Si el telfono tiene
registradas tres llamadas o ms a lo largo del da anterior, lo asignamos a una chica y
si tiene registradas dos o menos llamadas decimos que es de un chico.

a) Plantear estadsticamente las hiptesis a contrastar y las regiones de
aceptacin y rechazo propuestas en el enunciado. (1 punto)
b) Calcular el riesgo de primera especie de la prueba. Interpretar la respuesta.
(1,5 puntos).
c) Calcular el riesgo de segunda especie de la prueba. Interpretar la respuesta.
(1,5 puntos).
Solucin

a) Las hiptesis a contrastar son:

H
0
: =2,5 (pertenece a una chica)
H
1
: =1,5 (pertenece a un chico)

Las regiones de aceptacin y rechazo son:

Aceptar H
0
si X 3
Rechazar H
0
si X 2 Siendo X=Ps()

b) =P(Rechazar H
0
/ H
0
)= P(X 2/=2,5)=P( Ps (2,5)2)=0,5438 (El 54,38% de
los telfonos de las chicas seran asignados a los chicos con el test
propuesto)

c) =P(ceptar H
0
/ H
1
)=P(X3/=1,5)=P(Ps(1,5)3)=1-P(Ps(1,5)2)=
1-0,8088=0,1912 (El 19,12 % de los telfonos de los chicos seran asignados
a las chicas con el test propuesto)



9.6.6. El espesor de unas planchas de acero sigue una distribucin normal con
varianza 5,4. Se pide:

a) Si tomamos una muestra de tamao n=20, cul es la probabilidad de que la
desviacin tpica sea superior a 3. (1 punto)

b) Cul debe ser el nmero de planchas a medir para que la probabilidad de
que la media muestral de estas planchas difiera de la media poblacional en
ms de 2 unidades sea inferior al 10%? (1punto)

Solucin 3:

a) ( ) 034 , 0 66 , 31 P
4 , 5
19 9 s ) 1 n (
P ) 3 s ( P
2
19
2
2
= > _ =
|
|
.
|

\
|
>
o

= >
9. Inferencia en poblaciones normales
-268-
b) La condicin que se debe cumplir es,
10 , 0 ) 2 x ( P = >
El suceso contrario es,
90 , 0 ) 2 x ( P = <
90 , 0
n
2
n
x
n
2
P =
|
|
|
.
|

\
|
o
<
o

<
o


Buscamos el valor de 645 , 1 z
05 , 0
= , y de la expresin anterior el valor de n se
obtiene de,
645 , 1
n
2
=
o

Despejando n se tiene,
2
4 , 5 645 , 1
n =
n=3,65 de donde el valor de n tiene que ser como mnimo de n=4.



9.6.7. Un auditor de calidad est comprobando si los productos de un almacn
logstico de la empresa Mercadona cumplen los requisitos establecidos. Para ello
ha inspeccionado 30 de ellos y ha observado que 5 no cumplen los requisitos. Se
pide:

a) Calcular el intervalo de confianza para la proporcin de productos que no
cumplen los requisitos, con un nivel de significacin del 8%. (0,5 puntos)

b) Cul es el error mximo que cometemos en la estimacin de dicha
proporcin con un nivel de significacin del 8%. (0,5 puntos)

c) Qu tamao de muestra habra que tomar si conocemos que el total de
productos almacenados es de 5000 y el error mximo que deseamos cometer
es de un 3% con un nivel de significacin del 5%? (1punto)

Solucin 4:

a) La proporcin estimada es 167 , 0
30
5
p

= = . Con un 08 , 0 = o el valor de la z es
75 , 1 z
04 , 0
= . Y el intervalo de confianza es,

= =

=
o
048 , 0
286 , 0
119 , 0 167 , 0
30
) 167 , 0 1 ( 167 , 0
75 , 1 167 , 0
n
q

z p

2 /


b) El error mximo cometido es 119 , 0 = c .
c) El tamao de muestra viene dado por
9. Inferencia en poblaciones normales
-269-
1 N
n N

n
q

z
2 /

= c
o

Sustituyendo valores,
4999
n 5000

n
) 167 , 0 1 ( 167 , 0
96 , 1 03 , 0
2 2

= simplificando
n
n 5000
42 , 8

= 5000 n 42 , 9 = , y despejando n queda,

79 , 539
42 , 9
5000
n = = . Esto , tomaremos n=540 elementos.



9.6.8. En un proceso de soldadura manual por puntos de planchas de acero, la
distancia entre puntos resultante viene siendo una variable con distribucin N(2
cm, 0,5 cm).

a) Ante las quejas del rea de montaje, el jefe de la lnea decide comprobar si se
ha modificado sensiblemente la media de las distancias entre puntos. Para
ello, mide las distancias entre 10 parejas de puntos de soldadura elegidas al
azar obteniendo los siguientes valores expresados en cm

( 2,3 2,5 1,9 2,6 3,0 2,1 2,7 2,5 3,1 2,2 )

Con un nivel de significacin =0,10 Qu podemos concluir? (Plantear las
hiptesis apropiadas y justificar la respuesta) (1 punto)

b) Si la media de las distancias hubiese pasado a ser realmente 2,5 cm Cul
sera el riesgo de la prueba anteriormente propuesta? (1 punto)

c) Olvidando los dos apartados anteriores de este ejercicio, supongamos que el
jefe decide aceptar que la media de las distancias es 2 cm si el promedio de
9 distancias entre puntos de soldadura est entre 1,5 y 2,25 cm Cul sera
el riesgo de esta prueba? (1 punto)

Solucin 5:

a) Se trata de un test bilateral sobre la media de una poblacin Normal con
conocida, dado que no hay indicios de que el cambio haya sido en un determinado
sentido

H
0
: m=2 H
1
: m2

Y la regala de decisin
( ) ) 26 , 2 74 , 1
10
5 , 0
645 , 1 2
2 / 0 0
=
(

=
(

e
n
z m x si H Aceptar
o
o

9. Inferencia en poblaciones normales
-270-

Como ) 26 , 2 74 , 1 ( 49 , 2 e = x debemos rechazar la hiptesis nula y aceptar que ha
habido un cambio en la media.

b) Recordemos que
0643 , 0 0 0643 , 0 ) 81 , 4 ( ) 52 , 1 ( )
158 , 0
5 , 2 74 , 1
( )
158 , 0
5 , 2 26 , 2
(
) 26 , 2 74 , 1 ( )
10
5 , 0
, 5 , 2 ( ( ) 5 , 2 / ) 26 , 2 74 , 1 ( ( ) / (
1 0
= = u u =

u
= e = = e = = N P m x P cierta H H Aceptar P |


c) Dada la expresin de la regin de aceptacin, las hiptesis establecidas son

H
0
: m=2 H
1
: m2

Recordemos que
| |
| | 0686 , 0 0014 , 0 9328 , 0 1
) 99 , 2 ( ) 497 , 1 ( 1 )
167 , 0
2 5 , 1
( )
167 , 0
2 25 , 2
( 1 ) 25 , 2 5 , 1 ( ) 167 , 0 , 2 ( N ( P 1
) 25 , 2 5 , 1 ( )
9
5 , 0
, 2 ( N ( P ) 2 m / ) 25 , 2 5 , 1 ( x ( P ) ci erta H / H chazar (Re P
0 0
=
= u u =
(

u = e
= e = = e = = o



10. Anlisis de la varianza

-271-



10. ANLISIS DE LA VARIANZA

Contenido
10.1. ANLISIS DE LA VARIANZA (I). UN FACTOR CONTROLADO. ................... 271
10.1.1. Generalidades ................................................................................ 271
10.1.2. Modelo terico. Hiptesis del modelo.............................................. 273
10.1.3. Hiptesis nula ................................................................................. 276
10.1.4. Ecuacin fundamental .................................................................... 277
10.1.5. Test F ............................................................................................. 277
10.1.6. Comparacin de medias. Test L.S.D. (diferencia mnima significativa)
.................................................................................................................... 278
10.2. ANLISIS DE LA VARIANZA (II). DOS FACTORES CONTROLADOS .......... 280
10.2.1. Introduccin. Planes factoriales ...................................................... 280
10.2.2. Anova para dos factores con repeticiones ...................................... 281
10.2.3. Concepto de Interaccin ................................................................. 281
10.2.4. Modelo y supuestos tericos ........................................................... 283
10.2.5. Hiptesis Nulas ............................................................................... 284
10.2.6. Descomposicin de las Sumas de Cuadrados. Test F .................... 284
10.2.7. Comparacin de Medias. Test L.S.D. .............................................. 284
10.2.8. Validacin del modelo ...................................................................... 287
10.2.9. Igualdad de las varianzas ................................................................ 287
10.2.10. Estimacin de los efectos .............................................................. 288
10.2.11. Predicciones .................................................................................. 289
10.3. PROBLEMAS Y CUESTIONES DE EXAMEN ................................................ 290




10.1. ANLISIS DE LA VARIANZA (I). UN FACTOR CONTROLADO
10.1.1. Generalidades

Bajo el nombre de Anlisis de la Varianza se conocen un conjunto de mtodos
estadsticos aplicables en general al anlisis de observaciones que dependen
simultneamente de varios factores. Fue desarrollado por Fisher en el 1
er
tercio del
siglo pasado.

Los factores a considerar, y que se presume pueden influir sobre la respuesta,
son aqullos que podemos realmente controlar fijando a voluntad sus niveles
(factores controlados).
10. Anlisis de la varianza


-272-

Los factores pueden ser cuantitativos, cuando sus niveles corresponden a
valores medibles (temperatura, pH, etc.) o cualitativos en otro caso (tipo de hojalata,
variedad, mtodo de fabricacin etc.).

Un ejemplo servir para ilustrar un problema tpico de aplicacin de estos
mtodos.

En un estudio sobre corrosin (X) en botes de conservas se desea investigar
la influencia al respecto del tipo de hojalata, pH del lquido de gobierno y temperatura
de almacenamiento del bote. En la terminologa clsica del Anlisis de la Varianza
existen en este caso tres factores:

Tipo de hojalata
pH
Temperatura de conservacin

cuyos efectos se desean estudiar.

Para cada factor, se considerarn en el estudio diferentes niveles (si el factor
es cuantitativo) o variantes (si el factor es cualitativo). As por ejemplo:

Factor tipo de hojalata (cualitativo): Se desean estudiar tres tipos distintos A, B
y C (3 variantes).

Factor pH (cuantitativo): Se estudiarn conservas a pH 4'5 y pH 5'5 (2
niveles).

Factor temperatura de almacenamiento (factor cuantitativo): Se almacenarn
los botes a 0 C, 15 C y 30 C (3 niveles).

A cada combinacin de variantes de los diferentes factores se le denomina
tratamiento, por ejemplo un tratamiento ser: bote hojalata tipo B con pH del lquido
de gobierno 4'5 almacenado a 15 C. En total existirn en este caso 3x2x3=18
tratamientos diferentes.

Una experiencia podra consistir en preparar 5 botes (repeticiones) con cada
uno de los 18 tratamientos posibles, con lo que constara en total de 18x5 = 90 botes
o unidades experimentales.
10. Anlisis de la varianza

-273-

El objetivo en una experiencia de este tipo sera el analizar cules de los tres
factores tienen una influencia significativa sobre el grado de corrosin del bote al
cabo de, por ejemplo, un mes de almacenamiento.

En aquellos factores cuyo efecto sea significativo, se desear adems, precisar la
naturaleza del mismo, determinando, qu variantes difieren significativamente entre s

* Resumen:

- X : variable a estudiar o respuesta (grado de corrosin en el ejemplo).
- Factores: posibles causas controlables que pueden ser fuente de variabilidad
en la respuesta (tipo de hojalata, pH, temperatura, etc.).
- Variantes o niveles: valores que pueden tomar los factores.
- Tratamiento: combinacin de niveles
- Unidad experimental: Unidad fsica sobre la que se aplica un tratamiento
(bote, parcela, animal de ensayo etc.)
- Repeticiones: nmero de veces que se aplica un mismo tratamiento (sobre
diferentes unidades experimentales) en una misma experiencia, o nmero de
veces que se repite la experiencia bajo las mismas condiciones.

Los mtodos del Anlisis de la Varianza, asumen la existencia de un modelo
probabilstico que explica los resultados observados en funcin de un conjunto de
parmetros desconocidos relativos a los efectos de los diferentes factores en estudio
y de una perturbacin aleatoria.

La tcnica de anlisis consiste, en general, en descomponer la variabilidad total
del conjunto de las observaciones expresada por la suma de cuadrados global E(X
ijk
-
X)
2
con N -1 grados de libertad, en un conjunto de trminos independientes, con sus
correspondientes grados de libertad, relativos a los diferentes factores en estudio y al
error experimental. La comparacin de cada uno de estos trminos con el
correspondiente a la perturbacin aleatoria residual ( error), permite contrastar la
significacin de los factores estudiados.

Inicialmente desarrollaremos la teora bsica del Anlisis de la Varianza en el
caso ms sencillo de un solo factor controlado, dejando para ms adelante la
generalizacin al caso de varios factores.


10.1.2. Modelo terico. Hiptesis del modelo

Consideremos, por ejemplo, que se desean comparar I variantes distintas de un
determinado proceso industrial. De cada variante se hacen J pruebas cuyos
resultados podemos considerar como una muestra aleatoria simple extrada de la
poblacin de posibles resultados que podran obtenerse con dicha variante.
10. Anlisis de la varianza


-274-


Variante 1 i I
Poblacin N(
1
,o) N(
i
,o) N(
I
,o)
Muestra (X
11
X
1J
) (X
21
X
2J
) (X
I1
X
IJ
)


Como veremos a continuacin, nuestras hiptesis sobre el modelo implican que
cada una de estas poblaciones tiene una distribucin N(
i
,o), y la hiptesis nula a
contrastar es H
0
:
1
=
2
=
I
.

1
2
4
5
3
- -
x
- 1
x
- 2
x
- 3
x
- 4
x
- 5
x

Figura 10. 1. Distribucin de las poblaciones

Vemos por tanto que el problema que tenemos no es ms que la generalizacin a
I medias del problema de comparacin de dos medias visto en un tema anterior.

Sea I el nmero de niveles del factor y J el nmero de observaciones para cada
una de las variantes (supondremos que dicho nmero es el mismo para todas las
variantes, en cuyo caso el modelo se denomina EQUILIBRADO).

Sea X
ij
la j-ava observacin (j = 1...J) correspondiente a la i-ava variante del factor
(i = 1...I). Siendo
i
= E(X
ij
) el valor medio poblacional correspondiente a dicha
variante, se tendr:


X
ij
=
i
+ c
ij

(1)
10. Anlisis de la varianza

-275-



i

ij
x
i
c
x

Figura 10. 2. Error experimental

donde c
jj
es una perturbacin aleatoria que origina las diferencias existentes entre las
observaciones de una misma variante o tratamiento; adems E(c
ij
) =0

Con respecto a los residuos c
ij
se harn, adems, las siguientes hiptesis:

a) Homocedasticidad: o
2
ij
= o
2
(c
ij
) = o
2
i, j no dependiendo por tanto de la
variante i considerada.
Esta hiptesis hace necesaria la comprobacin previa, mediante el test de
Bartlett u otros similares, de la homogeneidad de las varianzas en los diferentes
grupos o variantes.

b) Incorrelacin: Cov (c
ij
,c
ij
) = 0 si i=i' y/o j=j'; es decir, todos los residuos estn
mutuamente incorrelacionados.

c) Normalidad: los IxJ residuos
ij
c tienen una distribucin conjunta normal
multivariante c

N(0,o
2
I)

Las hiptesis b) y c) implican la independencia de los residuos.

El modelo terico anterior puede formularse de una forma alternativa que resulta
aconsejable por su ms fcil generalizacin al caso de varios factores.

Sea = E
i
/I el promedio de los valores medios de las diferentes variantes o
i
=
i
-
es la diferencia entre la media de la variante i y el promedio general; o
i
mide por lo
tanto el efecto especfico (positivo, negativo o nulo) de la variante i del factor.

Evidentemente, se verifica Eo
i
= E(
i
- ) = E
i
- I = 0

Como
i
= + o
i
, el modelo terico puede formularse como sigue

X
ij
= + o
i
+ c
I

Con Eo
i
= 0

10. Anlisis de la varianza


-276-

o
i

i

X
ij
X
c
ij



Figura 10. 3. Descomposicin de un valor observado

Donde:

X
ij
= j-ava observacin de la variante i del factor
= promedio general
o
i
= efecto especfico de la variante i del factor
c
ij
= residuos N (0,o) e independientes entre s.


10.1.3. Hiptesis nula

La hiptesis nula a contrastar es que el factor no influye sobre la respuesta, es decir,
que todos los niveles tienen la misma media

H
o
:
1
=
2
=
3
=
I
=
H
1
: -
i
=
j


Estas hiptesis son equivalentes a contrastar

H
0
: o
i
= 0
H
1
: - o
i
= 0 ya que sustituyendo
i
por + o
i


H
o
:

+ o
1
= + o
2
= + o
3
= = + o
I
=
o
1
= o
2
= o
3
= . = o
I
= 0

o
i
= 0 Se debe cumplir que 0
i
i
= o







10. Anlisis de la varianza

-277-
10.1.4. Ecuacin fundamental

Llamando

IJ
X
.. X
ij ij
E
= media general de todas las observaciones

J
X
. X
ij j
i
E
= media de la variante i

La ECUACIN FUNDAMENTAL del Anlisis de la varianza muestra la
descomposicin de la variabilidad total de la variable respuesta estudiada.


SCT SCF SCR


- E(X
ij
X..)
2
se le denomina Suma de Cuadrados Total (SCT) pues mide la
variabilidad total del conjunto de las I x J observaciones.

- JE (X
i
-X..)
2
se denomina Suma de Cuadrados debida al factor(SCF) pues
mide la magnitud de las desviaciones de la media de cada variante a la media
general. Mide la parte de la variabilidad total debida o explicada por el factor.

- E(X
ij
-X
i
.)
2
se denomina Suma de Cuadrados Residual pues se basa en las
desviaciones de cada observacin respecto a la media de la variante
respectiva. Mide la parte de variabilidad total existente en las observaciones
no explicadas por el factor, es decir, la debida a causas aleatorias (error
experimental, otros factores no estudiados, etc.).


10.1.5. Test F

Si a las sumas de cuadrados anteriores (SCF y SCR) las dividimos por sus grados de
libertad correspondientes (I-1) e I(J-1) respectivamente) obtenemos los cuadrados
medios CMF y CMR.

Se demuestra que si la hiptesis nula es cierta 0
i
= o


+ =
2
i ij ij
2
i i
2
ij ij
.) X X ( ..) X . X ( J ..) X X (
10. Anlisis de la varianza


-278-
) 1 J ( I ), 1 I (
F
CMR
CMF




La hiptesis nula 0
i
= o se contrastar, por tanto, calculando a partir de las
observaciones el estadstico CMF/CMR = F
c
y rechazndola si este es mayor que el
valor en tablas de
o
) 1 J ( I ), 1 I (
F para la probabilidad de error de 1 especie o
considerado. Esta regla es equivalente a rechazar H
0
si el p-valor correspondiente al
F
c
calculado es menor que o.

Rechazar H
0
equivale a aceptar con un nivel de significacin , que el factor
influye en la respuesta estudiada.


10.1.6. Comparacin de medias. Test L.S.D. (diferencia mnima
significativa)

Si el test F pone de manifiesto la existencia de un efecto significativo del factor, y ste
es cualitativo, resulta procedente estudiar entre qu variantes del factor son
significativas las diferencias o
i
- o
i
. La forma de operar consiste en general, en
calcular una "diferencia mnima significativa" (DMS) tal que dos variantes i, j difieren
significativamente si |X
i.
-X
j.
| > DMS.

En el test de Tuckey se propone como L.S.D. DMS

J
CMR
Q DMS
) 1 J ( I , I
o

=


I = n de niveles del factor (en general n de medias a comparar).
J = n de observaciones en cada variante (en general, n de datos con que se
ha calculado cada una de las medias a comparar).

Nota: En la determinacin de la significacin del efecto de un factor (o su
equivalente, en la determinacin de la significacin de la diferencia entre dos
medias), debemos hacer notar:

a) Que el hecho de que las diferencias sean significativas no implica que las
diferencias sean necesariamente importantes. El anlisis de la varianza, si la
variabilidad residual es pequea, puede dar como significativas diferencias
que en la prctica carezcan de importancia.

10. Anlisis de la varianza

-279-
b) Si el anlisis no da como significativas determinadas diferencias no quiere
decir que stas no existan sino que, simplemente, el test no tiene suficiente
potencia para detectarlas. Este hecho tiene especial importancia cuando
intentamos interpretar el por qu algunas veces, a pesar de obtener en la
prctica diferencias importantes entre las medias, stas no llegan a ser
significativas. Lo que habra que hacer en este caso es aumentar el tamao
de la experiencia o reducir el error experimental (disminuir el CMR),
aumentando la homogeneidad del material experimental o utilizando un
diseo ms adecuado.

Los resultados obtenidos se reflejan en el siguiente

CUADRO RESUMEN DEL ANLISIS DE LA VARIANZA

Origen de
la varianza
Suma de
cuadrados
Grados
de
libertad
Cuadrado
medio
F calculada F tablas
FACTOR SCF I-1
1 I
SCF
CMF

=
CMR
CMF

o
) 1 J ( I ), 1 I (
F

ERROR SCR I(J-1)
) 1 J ( I
SCR
CMR

=

TOTAL SCT IJ-1



EJEMPLO:

Se desea estudiar la influencia de la materia prima sobre la resistencia de unas
piezas de plstico. Para ello se realizaron experiencias utilizando cuatro materias
primas diferentes. Con cada materia prima se fabricaron cinco piezas midindose
finalmente la resistencia en cada una de las veinte piezas fabricadas. Los resultados
fueron:


MAT PRIMA 1 MAT PRIMA 2 MAT PRIMA 3 MAT PRIMA 4
6,0 6,2 5,9 5,0
6,2 6,1 6,0 5,1
6,5 5,9 6,0 4,2
6,8 6,0 6,2 4,6
6,0 6,0 5,8 4,5


10. Anlisis de la varianza


-280-

Cuadro resumen del Anlisis de la Varianza
-----------------------------------------------------------------------------
Fuente SC gl CM F calc p-Valor
-----------------------------------------------------------------------------
Factor 7,922 3 2,64067 36,17 0,0000
Residual 1,168 16 0,073
-----------------------------------------------------------------------------
Total 9,09 19


Dado que el p-Valor es menor que 0,01, existen diferencias estadsticamente
significativas al nivel del 99% de confianza entre las medias de las cuatro materias
primas. Esta afirmacin es equivalente a decir que la materia prima utilizada influye
sobre la resistencia de las piezas de plstico con un nivel de significacin del 99%.

En el apartado siguiente analizaremos cul o cules de las variantes de la materia
prima son diferentes en cuanto a su resistencia promedio.

Tests de rangos

Repeticiones Media Grupos diferentes
--------------------------------------------------------------------------------
M.P. 4 5 4,68 X
M.P. 3 5 5,98 X
M.P. 2 5 6,04 X
M.P. 1 5 6,30 X

Observamos que solo la cuarta materia prima da lugar a una resistencia media
estadsticamente diferente a las dems siendo menor en valor que el resto

10.2. ANLISIS DE LA VARIANZA (II). DOS FACTORES CONTROLADOS
10.2.1. Introduccin. Planes factoriales

Apoyndonos en los conceptos y terminologa expuestos en el apartado anterior,
vamos a desarrollar este apartado de forma esquemtica. Solamente desarrollaremos
en profundidad aquellos conceptos que sean nuevos y propios del presente capitulo.

PLANES FACTORIALES. Constituyen un diseo especial para el estudio
simultneo de dos o ms factores en el que todos los niveles de todos los factores se
combinan entre s. Los utilizaremos en este tema como diseo base para desarrollar
las tcnicas del Anlisis de la Varianza para dos factores.

10. Anlisis de la varianza

-281-
10.2.2. Anova para dos factores con repeticiones

Utilizaremos como diseo base para el estudio de este apartado, el siguiente diseo
factorial


FACTOR B
FACTOR
A
B
1
B
2
B
j
B
J
A
1
= ` n = ` n = =
A
2
= = = =
A
3
= = = =
A
i
= =
=` n
X
ijk.

=

A
I
= = = =


10.2.3. Concepto de Interaccin

Se dice que hay interaccin entre dos factores si el efecto conjunto de la variante i de
uno de ellos con la j del otro, no es igual a la suma de los efectos simples
respectivos. (Efectos no aditivos).

Tambin se dice que existe interaccin entre dos factores cuando el efecto de uno
de ellos depende del nivel que consideremos en el otro.

De manera similar a la anterior, se dice que no existe interaccin entre dos
factores cuando el incremento en la respuesta (+ -) al pasar de un nivel a otro de
uno de los factores, es el mismo en cualquiera de los niveles que podamos
considerar del otro factor.

Vamos a considerar algunos ejemplos representativos.
a) Consideremos el ejemplo de la corrosin de los botes de hojalata en el que
contemplamos dos factores: Factor tipo de hojalata (hojalata A y hojalata B) y
Factor pH (pH
1
, PH
2
y pH
3
)

10. Anlisis de la varianza


-282-

Figura 10. 4. Grfico de interacciones
En este primer caso, cualquiera que sea el pH, la hojalata A presenta mayor
corrosin que la hojalata B y, adems, LA DIFERENCIA ENTRE UNA Y OTRA
HOJALATA ES LA MISMA PARA CUALQUIER pH.

En el caso de la Figura 10.4, influyen los dos factores (hojalata A mayor corrosin
que la B, y a mayor pH menor corrosin) pero no hay interaccin entre ellos.

Figura 10. 5. Hay interaccin


En el caso de la Figura 10.5, el efecto del factor hojalata depende del valor del pH
que consideremos. As, a pH bajo presenta menor corrosin la hojalata B, a pH
intermedio el grado de corrosin es el mismo y a pH alto presenta menor corrosin la
hojalata B. Obsrvese que en este caso no tiene sentido preguntarse qu hojalata es
ms resistente si no se especifica cul va a ser el pH a emplear en la conserva.

10. Anlisis de la varianza

-283-
b) Consideremos ahora la calidad organolptica de tres zumos de naranja
(natural, pasteurizado, esterilizado) a travs del tiempo (recin preparado, a
los 5 das, a los 15 das) conservados a temperatura constante.

Figura 10. 6. Grfico de interacciones

Obtenga el lector sus propias conclusiones

Hay interaccin?
Por qu?
Qu zumo es mejor?
Se comportan igual los tres zumos?
Influye el tiempo de conservacin en la calidad? Cmo?


10.2.4. Modelo y supuestos tericos

El modelo terico completo es

ijk ij j i ijk
) ( X c + o| + | + o + = donde

X
ijk
= valor de la K.sima observacin en el tratamiento formado por la variante
i del primer factor con la variante j del segundo.
= promedio general
o
i
= efecto especfico de la variante i del 1
er
factor
|
j
= efecto especfico de la variante j del 2 factor
(o|)
ij
= efecto de la interaccin entre los factores en sus niveles i, j,
respectivos.
c
ijk
= residuo aleatorio

10. Anlisis de la varianza


-284-
0
i
i
= o

0
j
j
= |

0 ) (
i
ij
= o|

0 ) (
j
ij
= o|


Supuestos:


) , 0 ( N
0 ) (
ijk
ijk
o c
= c E
` independientes e incorrelacionados


10.2.5. Hiptesis Nulas

Las hiptesis nulas a contrastar son la ausencia de efecto sobre la respuesta de cada
uno de los factores as como la ausencia de interaccin entre ellos

H
0
:
0 ) (
0
0
ij
j
i
= o|
= |
= o

H
1
:
0 ) (
0
0
ij
j
i
= o|
= |
= o


10.2.6. Descomposicin de las Sumas de Cuadrados. Test F

La variabilidad total de las observaciones se descompone de la siguiente forma
similar al ANOVA de un factor

gl 1) - IJ(N 1) - 1)(J - (I 1) - (J 1) - (I 1) - (IJN
SCR SCint
2
SCF
1
SCF SCT
ijk
2
)
. ij
X
ijk
X (
ij
...) X
. j .
X .. X
. ij
X ( N
j
2
...) X
. j .
X ( IN
i
2
...) X
.. i
X ( JN
ijk
2
...) X
ijk
X (

+ + + + =



La significacin de cada factor se obtiene calculando el cociente

CMR
CMF
GLR SCR
GLF SCF
F
c
= =
tivo significa No
GLR , GLF
F
nivel al ivo significat
GLR , GLF
F
o
s
o
o
>



10.2.7. Comparacin de Medias. Test L.S.D.

Si algn factor resulta significativo podr determinarse entre que variantes hay
diferencias significativas comparando la diferencia de medias con la L.S.D. DMS
10. Anlisis de la varianza

-285-

b CMR Q DMS
glr , a
o
=

a = n de medias a comparar entre si (n de variantes del factor).
b = n de datos con que se calcul cada una de las medias anteriores.

EJEMPLO:

En una experiencia para analizar la influencia de un nuevo catalizador en dos
mtodos A y B de sntesis de un producto orgnico, se ensayaron 4 dosis de
catalizador. Con cada una de las 8 combinaciones - tratamientos - dosis x mtodo se
realizaron tres experiencias.

Los resultados, expresados en gr. de producto obtenido con la misma cantidad de
materia prima en 1 hora, se recogen en la tabla siguiente:


Dosis de catalizador (mg.)
Mtodo/Do
sis
075 1 125 150
A
68 91 90 105
60 75 98 95
62 86 94 99
B
60 72 64 48
45 71 75 55
66 60 70 50


Solucin

El modelo es:

ijk ij j i ijk
) ( X c + o| + | + o + =

0 ) (
0 ) (
0
0
j
ij
i
ij
j
i
= o|
= o|
= |
= o


) , 0 ( N
ijk
o = c independientes.


10. Anlisis de la varianza


-286-
Cuadro resumen del anlisis de la varianza


O.V. SC GL CM F
c
F
t

Total 709696 23
Catalizado
r
153513 3 51171 1239 * * 29 ' 5 F
01 ' 0
16 ' 3
= >
Mtodo 343204 1 343204 8312 * * 53 ' 8 F
01 ' 0
16 ' 1
= >
Interaccin
CxM 146913 3 48971 1186 * * 29 ' 5 F
01 ' 0
16 ' 3
= >
Error 66066 16 4129


Son significativos todos los efectos al 99 % (p < 0'01)


Interpretacin de Resultados


a) La interaccin es significativa, luego no existe una concentracin de catalizador
ptima. La concentracin de 1'50, que con el mtodo A da el rendimiento promedio
mximo (99'67 gr), con el mtodo B da el mnimo rendimiento promedio (51 gr).
Luego habr que estudiar el efecto del catalizador en cada uno de los mtodos.
Int eraction Plot
dosis
r
e
n
d
i
m
i
e
n
t
o
me todo
A
B
51
61
71
81
91
101
0,75 1 1,25 1,50
10. Anlisis de la varianza

-287-

b) No obstante, el mtodo A presenta para cada concentracin del catalizador, un
rendimiento mayor que el mtodo B. Por ello sera conveniente la utilizacin del
catalizador slo en el mtodo A, y preferiblemente, a la dosis mxima.


10.2.8. Validacin del modelo

Para validar el modelo del anlisis de la varianza, debemos comprobar que se
cumplen la hiptesis que se hacen de los residuos. Es decir, que son normales, con
media cero, varianza igual para todas las poblaciones, y que los residuos son
independientes.

Por tal motivo debemos examinar los distintos grficos de los residuos y, si no
observamos ningn comportamiento sistemtico, quiere decir que podemos aceptar
la hiptesis del residuo y por lo tanto aceptar el modelo del anlisis de la varianza.


10.2.9. Igualdad de las varianzas

Una forma sencilla para contrastar la igualdad de varianzas de las distintas
poblaciones es hacer el mismo anlisis de la varianza pero dando como variable
dependiente el cuadrado del residuo del ANOVA con los datos originales.

Si con este ANOVA los factores no tienen significacin, quiere decir que se
cumple la hiptesis nula de igualdad de las varianzas de todas las poblaciones.

Aplicando esta tcnica al ejemplo anterior con dos factores, los resultados son:



Anlisis de la Varianza paraRESIDUALS^2 - Sumas de Cuadrados de Tipo III
--------------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor
--------------------------------------------------------------------------------
EFECTOS PRINCIPALES
A:Dosis 4517,83 3 1505,94 1,61 0,2261
B:Mtodo 1040,17 1 1040,17 1,11 0,3071

INTERACCIONES
AB 6163,02 3 2054,34 2,20 0,1280

RESIDUOS 14953,9 16 934,616
--------------------------------------------------------------------------------
TOTAL (CORREGIDO) 26674,9 23
--------------------------------------------------------------------------------
Los cocientes F estn basados en el error cuadrtico medio residual.

10. Anlisis de la varianza


-288-

Como todos los p-values son superiores a 0,05, no hay ningn efecto
significativo y eso quiere decir que las varianzas de todas las poblaciones son
iguales.

10.2.10. Estimacin de los efectos

El efecto
i
o viene dado por
- - -
= o -
i i

Su estimacin es:
- - -
= o x x
i i
-

El efecto de la interaccin entre dos factores es:

) ( ) (
j i ij ij
| + o + = o|
- -
-

Y su estimacin es,
)

x ( x ) (
j i ij ij
^
| + o + = o|
- -
-

Para el ejemplo anterior, la tabla de las medias es,

Tabla de Medias por mnimos cuadrados para Rendimiento
con 95,0 Intervalos de confianza
--------------------------------------------------------------------------------
Error Lmite Lmite
Nivel Frecuencia Media Estndar Inferior Superior
--------------------------------------------------------------------------------
Media Total 24 73,2917
Dosis
0,75 6 60,1667 2,62335 54,6054 65,7279
1 6 75,8333 2,62335 70,2721 81,3946
1,25 6 81,8333 2,62335 76,2721 87,3946
1,5 6 75,3333 2,62335 69,7721 80,8946
Mtodo
A 12 85,25 1,85499 81,3176 89,1824
B 12 61,3333 1,85499 57,4009 65,2657
Dosis segn Mtodo
0,75 A 3 63,3333 3,70997 55,4685 71,1981
0,75 B 3 57,0 3,70997 49,1352 64,8648
1 A 3 84,0 3,70997 76,1352 91,8648
1 B 3 67,6667 3,70997 59,8019 75,5315
1,25 A 3 94,0 3,70997 86,1352 101,865
1,25 B 3 69,6667 3,70997 61,8019 77,5315
1,5 A 3 99,6667 3,70997 91,8019 107,531
1,5 B 3 51,0 3,70997 43,1352 58,8648
--------------------------------------------------------------------------------

Por ejemplo, la estimacin del efecto
A
o , es,

10. Anlisis de la varianza

-289-
96 , 11 29 , 73 25 , 85 x x
A A
= = = o
- -
- -

Esto significa que cuando tomamos el mtodo A, por trmino medio, con
respecto a la media general, la variable observada aumenta con 11,96.

El efecto de
25 , 1

|
54 , 8 29 , 73 83 , 81 x x

25 , 1 25 , 1
= = = |
- -
- -

El efecto de la interaccin es,

21 , 0 ) 54 , 8 96 , 11 29 , 73 ( 0 , 94 )

x ( x ) (
25 , 1 A 25 , 1 ; A 25 , 1 ; A
^
= + + = | + o + = o|
- -
- -


10.2.11. Predicciones

Si por ejemplo hemos comprobado que la mejor combinacin de los factores es el
nivel i para el factor A y el nivel j para el factor B, la prediccin de la media de los
resultados con esa combinacin de los factores,

ij
^
j i ij
) (

o| + | + o + =

El error de prediccin viene dado por el CM
residual
, es decir, la varianza del
residuo.

En el ejemplo anterior, cuando el mtodo sea el A y la dosis sea 1,25, la
prediccin del valor medio es,

21 , 0 54 , 8 96 , 11 29 , 73 ) (


25 , 1 ; A
^
25 , 1 A 25 , 1 ; A
+ + + = o| + | + o + = =94


Como la varianza residual es de CM
residual
=41,29, un intervalo de
confianza para el valor medio con esas condiciones es,

] 27 , 101 ; 73 , 86 [ 27 , 7 94
3
29 , 41
96 , 1 94 = =


Con un nivel de confianza del 95%, y donde 3 es el nmero de datos con los
que se ha calculado la media de 94.


10. Anlisis de la varianza


-290-

10.3. PROBLEMAS Y CUESTIONES DE EXAMEN

10.3.1. Para evaluar la actuacin que el gobierno est teniendo en el caso Bankia, se
ha realizado una encuesta a un total de 261 ciudadanos de ambos sexos en cinco
ciudades diferentes, donde cada ciudadano ha puntuado de 1 a 10 la actuacin del
Gobierno. A los datos obtenidos se les ha aplicado un ANOVA de dos factores con
interacciones cuyos resultados ms relevantes se muestran a continuacin:


Analysis of Variance for PUNTUACION/100 - Type III Sums of Squares
--------------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-value(APROXIMADO)
--------------------------------------------------------------------------------
MAIN EFFECTS
A:CIUDAD 124,595 4 ---- ---- ----
B:SEXO 6,23191 1 ---- ---- ----

INTERACTIONS
AB 4,73289 4 ---- ---- ----

RESIDUAL 833,325 ---- 3,32002
--------------------------------------------------------------------------------
TOTAL 1061,3 260




Intervalos al 95% para las medias
CIUDAD
P
U
N
T
U
A
C
I

N
1 2 3 4 5
1,8
2,8
3,8
4,8
5,8
10. Anlisis de la varianza

-291-



1) Completar la tabla ANOVA
Analysis of Variance for PUNTUACION/100 - Type III Sums of Squares
--------------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
--------------------------------------------------------------------------------
MAIN EFFECTS
A:CIUDAD 124,595 4 31,1488 9,38 0,0000
B:SEXO 6,23191 1 6,23191 1,88 0,1719

INTERACTIONS
AB 4,73289 4 1,18322 0,36 0,8395

RESIDUAL 833,325 251 3,32002
--------------------------------------------------------------------------------
TOTAL 1061,3 260
--------------------------------------------------------------------------------


2) Qu efectos son significativos con =0,05
a) Sexo, ciudad e interaccin
b) Sexo y ciudad
c) Solo sexo
d) Solo ciudad (p-valor <0,05)
3) Qu ciudad o ciudades presentan diferencias significativas con =0,05
a) 2, 3 y 4
b) 1 respecto de las dems
Grfico de interacciones
CIUDAD
PUNTUACIN
SEXO
H
M
2,2
3,2
4,2
5,2
6,2
1 2 3 4 5
10. Anlisis de la varianza


-292-
c) 5 respecto de las dems (nico intervalo que no se solapa con el
resto)
d) 1 y 2

4) En qu ciudad o ciudades presentan diferencias significativas las
puntuaciones de ambos sexos
a) En la 5
b) En la 2,3 y 4
c) En la 1
d) En ninguna (ya que la interaccin no es significativa por lo que las
medias son iguales en todas las ciudades. No son significativamente
diferentes)

10.3.2. Se ha recogido la valoracin de un lder poltico en dos ciudades distintas 1 y
2 (Factor A), dividida cada una en tres barrios segn su nivel adquisitivo (Alto,
Medio y Bajo) (Factor B). Parece que el mtodo ms indicado para ver si existe
influencia de estos dos factores sobre dicha valoracin es un Anlisis de la
Varianza:

a) Los resultados obtenidos con el Statgraphics han sido estos qu conclusiones
obtenemos?





--------------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
--------------------------------------------------------------------------------
MAIN EFFECTS
A:Ciudad 60,8444 1 60,8444 21,37 0,0000
B:Nivel 84,6889 2 42,3444 14,87 0,0000
INTERACTIONS
AB 29,4889 2 14,7444 5,18 0,0076
RESIDUAL 239,2 84 2,84762
--------------------------------------------------------------------------------
TOTAL (CORRECTED) 414,222 89
--------------------------------------------------------------------------------


b) A la vista de las grficas siguientes y, teniendo en cuenta las conclusiones
obtenidas en el apartado anterior, determinar cul es la ciudad en la que se tiene una
10. Anlisis de la varianza

-293-
valoracin ms alta del lder poltico y qu nivel adquisitivo tienen, justificando en qu
grficas has obtenido dichas conclusiones y porqu.



Means and 95,0 Percent LSD Intervals
Nivel
V
a
l
o
r
a
c
i

n
A B M
2,8
3,8
4,8
5,8
6,8
Means and 95,0 Percent LSD Intervals
Ciudad
V
a
l
o
r
a
c
i

n
1 2
3,3
3,8
4,3
4,8
5,3
5,8
10. Anlisis de la varianza


-294-



10.3.3. En una fbrica de botellas de plstico se quiere decidir qu producto resulta
ms resistente. Para ello se supone que tanto el tipo de plstico utilizado como
materia prima, como el volumen de las botellas, pueden afectar a dicha
resistencia. Se estudiaron tres tipos de plstico, (A;B;C) y 4 volmenes diferentes
(0,75; 1; 1,25 y 1,5), midiendo la resistencia de 3 botellas elegidas al azar para
cada posible combinacin de tipo de plstico y volumen (se analizaron 36 botellas
en total).

a) Completar la tabla del ANOVA de dos factores que result de dicho
experimento (1 puntos):


Fuente SC Gl CM F
c
Plstico 2287,17 2 1143,585 42929
Volmen 1613,64 3 537,88 20191
Plstico x Volmen 2284,61 6 380,7683 14294
Residual 639,33 24 26639
Total 6824,75 35

b) En vista de la tabla anterior, qu se puede decir de la significacin de los
efectos de los factores estudiados? Qu significado tiene en este caso
concreto de estudio la interaccin? Tomar = 0.05 (0,5 puntos)

Para el plstico: T
c
=42929 > F tablas
ivo significat Efecto valor P F < = 05 , 0 40 3
05 , 0
24 , 2

Para el volumen: T
c
=20191 > F tablas
ivo significat Efecto valor P F < = 05 , 0 01 3
05 , 0
24 , 3

Interaction Plot
Ciudad
V
a
l
o
r
a
c
i

n
Nivel
A
B
M
3,1
4,1
5,1
6,1
7,1
1 2
10. Anlisis de la varianza

-295-
Para la interaccin:T
c
=14294 > F tablas
ivo significat Efecto valor P F < = 05 , 0 51 , 2
01 , 0
24 , 6


El efecto significativo de la interaccin puede interpretarse como que el efecto del
volumen no es el mismo en los tres tipos de plastic


A partir del grfico de interaccin, qu combinacin de tipo de plstico y volumen da
una botella ms resistente? Si por motivos econmicos el nico tipo de plstico que
se puede utilizar es el C, qu volumen de botella da una mayor resistencia?

Mejor combinacin (mayor resistencia) : Plstico A y Volumen 1,5 litros
Para el plstico C el volumen que ofrece mayor resistencia es de 1 litro


10.3.4. Una cooperativa agrcola vende tres tipos de fitoreguladores (A, B y C) para
regular el crecimiento de trigo. Para determinar cul es el ms efectivo, se
seleccionan al azar 12 parcelas de trigo con caractersticas similares. En tres de
ellas se aplica el fitoregulador A, en otras tres parcelas el fitoregulador B y en otras
seis, el C. En todos los casos, la aplicacin se realiza por medio de un atomizador
a una dosis de 10 mg/ha. Los resultados obtenidos, medidos como longitud media
(mm) de 10 plantas seleccionadas al azar al cabo de 3 semanas de aplicacin
(variable longitud) son los indicados en la tabla. Los datos se analizan con
ANOVA utilizando Statgraphics, obtenindose el grfico que se muestra a
continuacin.

Grfico de interaccin
Volmen
R
e
s
i
s
t
e
n
c
i
a
Plstico
A
B
C
56
66
76
86
96
106
0,75 1 1,25 1,5
A
B
C
10. Anlisis de la varianza


-296-
Means and 95,0 Percent LSD Intervals
fitoregulador
longitud
A B C
280
380
480
580
680
780
880

fitoregulador A fitoregulador B fitoregulador C
373 365 312 739 711 695
615 844 711
648 809 663


Prctica 2:

- Cul de las siguientes afirmaciones es correcta? (2,5
puntos)
a) A la vista de la grfica se deduce que el p-valor del test del ANOVA es superior
a 0,05.
b) A la vista de la grfica se deduce que el p-valor del test del ANOVA es inferior a
0,05.
c) A partir de la grfica no es posible deducir ninguna de las dos respuestas
anteriores.
d) Depende del nivel de significacin del test, el cual no se puede deducir del
grfico.

Solucin: los intervalos LSD se han construido con un nivel de confianza 1- =95%,
de modo que =0,05. Dado que los intervalos LSD no se solapan significa que
alguna de las medias es significativamente distinta de las dems considerando
=0,05, por lo que se rechaza la hiptesis nula H
0
: m
A
=m
B
=m
C
. Consecuentemente,
p-valor< , de modo que la respuesta correcta es la b).


- Teniendo en cuenta que A x =350, C B x x = =750, qu tipo de fitoregulador se
recomendara para maximizar la longitud?
(2,5 puntos)

a) El de tipo B, ya que la longitud de su intervalo LSD es mayor que la de C lo cual
sugiere que tiene una mayor probabilidad de que se alcancen valores mayores de
longitud.
b) El de tipo C, ya que la longitud de su intervalo LSD es menor que el de B lo cual
sugiere que su desviacin tpica es menor.
10. Anlisis de la varianza

-297-
c) El de tipo B C.
d) Cualquiera de los tres, ya que se acepta la hiptesis nula H
0
: m
A
=m
B
=m
C
.

Solucin: la c) ya que se solapan sus intervalos LSD, por lo que debe aceptarse la
hiptesis de que m
B
=m
C
.



- Una de las hiptesis del ANOVA es que la poblacin de datos de la variable longitud
se ajusta a un modelo Normal en cada uno de los tres fitoreguladores ensayados.
Cmo se podra verificar si esta hiptesis es admisible?
(2,5 puntos)

a) La hiptesis de normalidad es admisible dado que los intervalos LSD son
simtricos.
b) Habra que estudiar si los 12 datos de la tabla se ajustan bien a un modelo
Normal.
c) Habra que calcular los residuos del ANOVA y estudiar si stos se ajustan bien a
un modelo Normal.
d) No hay suficientes datos para estudiar si el modelo Normal es admisible.

Solucin: los intervalos LSD son siempre simtricos, por lo que la respuesta a) es
falsa. Dado que la media de A es significativamente menor que las otras dos,
tampoco es correcto utilizar directamente los 12 datos de la tabla, pues tenemos una
mezcla de dos poblaciones con distinta media. La respuesta correcta es la c), pues
hay tcnicas que permiten estudiar si el modelo Normal es admisible aunque slo
tengamos 12 datos.


10.3.5. Una industria qumica desea estudiar el efecto del tipo de catalizador y de la
concentracin de un cierto aditivo denominado NCV en la calidad final del producto
elaborado. Para ello se ha diseado un experimento ensayando tres catalizadores
diferentes: A, B y C (factor CAT) combinados con tres concentraciones de aditivo:
4, 5 y 6 (factor NCV). Cada uno de los nueve tratamientos se ensay dos veces,
midindose en cada prueba un parmetro de calidad final (variable LAT). Tras la
realizacin del experimento y la recogida de datos se llev a cabo un Anlisis de la
Varianza cuya tabla resumen se muestra a continuacin:

Analysis of Variance for LAT - Type III Sums of Squares
------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio
------------------------------------------------------------------
MAIN EFFECTS
A:CAT 77,7733 ___ ________ _____
B:NCV _______ ___ 41,4867 _____
10. Anlisis de la varianza


-298-
INTERACTIONS
AB _______ ___ ________ _____
RESIDUAL 16,56 ___ ________
------------------------------------------------------------------
TOTAL (CORRECTED) 250,52 ___
------------------------------------------------------------------
a) Completa la tabla resumen del ANOVA, indicando qu efectos son
estadsticamente significativos (=0,05). Justificando la respuesta, as como los
clculos realizados. (3,5 puntos)

Analysis of Variance for LAT - Type III Sums of Squares
------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio
------------------------------------------------------------------
MAIN EFFECTS
A:CAT 77,7733 2 38,8866 21,13
B:NCV 82,9734 2 41,4867 22,55
INTERACTIONS
AB 73,2133 4 18,303 9,95
RESIDUAL 16,56 9 1,84
------------------------------------------------------------------
TOTAL (CORRECTED) 250,52 17
------------------------------------------------------------------

Respuesta: Dado que se han realizado 18 pruebas experimentales, el nmero de
grados de libertad totales ser 18 1 = 17. Como en los dos factores hay dos niveles,
los grados de libertad de cada factor sern 3 1 = 2. La interaccin doble tendr 2 2
= 4 grados de libertad, y los residuales se obtienen por diferencia: Df
res
= 17 2 2
4 = 9
Cuadrado medio
NCV
= suma de cuadrados / gr. Lib
41,4867 = SC / 2 SC = 82,9734
SC
AB
= SC
total
SC
CAT
SC
NCV
= 73,2133
Dividiendo las sumas de cuadrados por los grados de libertad se obtiene el cuadrado
medio. Dividiendo el cuadrado medio de un factor entre el cuadrado medio residual
se obtiene la F-ratio.
El F-ratio de CAT (21,13) y el F-ratio de NCV (22,5) superan el valor crtico (=0,05)
de una F
2;9
que vale 4,26. El F-ratio de la interaccin (9,95) supera el valor crtico
(=0,05) de una F
4;9
que vale 3,63. Por tanto, el efecto simple de los dos factores y de
la interaccin son estadsticamente significativos.

b) Qu informacin aporta el siguiente grfico? Dicha informacin es coherente
con las conclusiones del apartado anterior? Por qu? (2,5 puntos)
10. Anlisis de la varianza

-299-



Respuesta: Este grfico muestra los intervalos LSD (Least Significant Differences)
para el factor CAT, obtenidos con un nivel de confianza del 95%. A la vista del grfico
se deduce que el valor medio de la variable LAT es significativamente distinto entre
los catalizadores A y el B, as como tambin entre B y C ya que sus intervalos LSD
no se solapan. Sin embargo, no hay diferencias significativas entre A y C porque sus
respectivos intervalos se solapan. Por tanto, se deduce que:

m
B
< (m
A
= m
C
)

La informacin deducida del grfico es coherente con el hecho de que el factor CAT
resulta estadsticamente significativo, pues ello indica que al menos uno de los
catalizadores tendr un valor medio significativamente distinto de los dems.



Soluciones
a) Los dos factores y la interaccin son significativas (p-valor<005), lo que implica
que las ciudades y los distintos niveles adquisitivos valoran al poltico de diferente
manera.
La interaccin significara que los distintos niveles no valoran igual en las dos
ciudades.

b) Dado que la interaccin es significativa no podemos mirar en los intervalos LSD ya
que nos dan los valores del factor sin tener en cuenta la relacin con la otra variable.
Si miramos en la grfica Interaction Plot vemos que la valoracin ms alta es en la
ciudad 1 con nivel adquisitivo Alto y Medio, que tienen idntica valoracin.
Si hubiramos mirado en los LSD (que no es lo correcto aunque en este caso difieren
poco) slo es la ciudad 1 con nivel alto.


Means and95,0 Percent LSDIntervals
ALG
L
A
T
A B C
5,3
7,3
9,3
11,3
13,3
CAT
10. Anlisis de la varianza


-300-


11. Regresin lineal
-301-
11. REGRESIN LINEAL
Contenido
11.1. HIPTESIS DEL MODELO ..................................................................... 301
11.2. ESTIMACIN DE LOS COEFICIENTES DE REGRESIN ..................... 303
11.3. CONTRASTES DE SIGNIFICACIN DE LOS COEFICIENTES .............. 305
11.4. VALIDACIN DEL MODELO ................................................................... 310
11.5. INTERVALOS DE PREDICCIN ............................................................. 313
11.6. BONDAD DE AJUSTE ............................................................................. 315
11.7. PROBLEMAS Y CUESTIONES DE EXMENES .................................... 317


11.1. HIPTESIS DEL MODELO

Supongamos que tenemos la variable aleatoria bidimensional (X,Y) donde X es la
altura de una persona, Y es su peso, y a partir de una muestra de n personas,
quisiramos predecir el peso de una de ellas conociendo su altura. Para ello
aplicamos un modelo de la forma Y=g(X), siendo la ms sencilla la recta, de manera
que a la nube de puntos (X,Y) queremos ajustar la mejor recta que pase por todos
ellos.
El modelo terico a aplicar es:
c | o + X + = Y
donde c es una variable normal de media 0 y de varianza o . X es un valor fijo, y
| o, son los parmetros que definen la recta, que se llama recta de regresin.
Como c es aleatorio, tambin Y ser aleatorio con una distribucin normal de
media:
| o c | o + = ) E( + X + = E(Y)
y varianza
o
c
2 2 2
= ) (
D
= (Y)
D

Tngase en cuenta que X +| o representan aqu una constante.
Si para una altura determinada el valor medio del peso fuera siempre el
mismo, no habra inters en ajustar una recta a los puntos, puesto que el conocer X
no aporta nada para predecir el valor de Y. Esto significara que el coeficiente de
correlacin es cero y la recta de regresin es paralela al eje de las X.
11. Regresin lineal
-302-
En caso contrario, el coeficiente de correlacin es distinto de cero, y puede
ser interesante ajustar una recta a la nube de puntos (X,Y). Grficamente es:



Figura 11. 1. Distribuciones condicionales.

Para una X fijada, el conjunto de puntos de Y forman una campana de Gauss.
Los valores medios de dichas campanas se encuentran sobre la recta X +| o y la
dispersin de cada campana es siempre la misma. A esta ltima propiedad se le
llama homocedsticidad.
La ecuacin c | o + X + = Y significa que, conocido X, podemos predecir un
valor de Y, excepto una cantidad residual c , que llamamos error, la cual engloba la
influencia de todos los dems factores sobre la variable Y.
Los errores tienen que cumplir la condicin de ser independientes. Esta
propiedad se expresa diciendo que los errores o residuos deben estar
incorrelacionados entre si.
Con todo ello las hiptesis del modelo
c | o + X + = Y
son:
1) Para cada X, Y sigue una distribucin normal de media X +| o y de
varianza
o
2
.
2) c sigue una distribucin normal de media 0 y varianza
o
2
.
11. Regresin lineal
-303-
3) Los residuos estn incorrelacionados.
4) Los residuos no siguen un comportamiento sistemtico.
5) Los residuos no tienen valores anmalos.
Si queremos reducir el error de prediccin, podemos introducir otra variable X
2

de forma que haya una mejor explicacin de la variable Y. En otros casos,
directamente queremos conocer la relacin entre una variable dependiente Y, y dos o
ms variables independientes X
1
y X
2
. El modelo a aplicar es:
c | | o +
X
+
X
+ = Y
2
2
1
1

entonces se dice que el modelo es de regresin lineal mltiple.
Las hiptesis a aadir son:
6) Las variables X's son independientes entre si.
7) El nmero de datos es mayor que el nmero de variables X's.

11.2. ESTIMACIN DE LOS COEFICIENTES DE REGRESIN

Para una nube de puntos (X,Y) como el de la figura siguiente

X
Y
y
y

i
e

Figura 11. 2. Recta de ajuste

la mejor recta de regresin es aquella que la suma de los cuadrados de los
segmentos verticales dibujados sea mnima. Dichos segmentos representan el error
11. Regresin lineal
-304-
entre el valor observado y un valor predicho. Esto es, conociendo un valor de X, el
valor predicho es:
X + = Y | o


y el error es
X - - y = Y - Y = | o c


que por trmino medio tendr un valor al cuadrado de:
) X - - E(y
2
| o
y debemos elegir los parmetros y de forma que
) X - - E(Y mnimo
2
| o
Para ello hacemos
0 =
E
0; =
E
| o c
c
c
c

y obtenemos los valores de o y |

, a los cuales llamamos a y b, respectivamente.


Los valores que se obtienen son:
S
S
= b
2
xx
2
xy

x b + a = y
Donde,

=
=
n
i
i i xy
y y x x S
1
2
) )( (

=
=
n
i
i xx
x x S
1
2 2
) (
En regresin lineal mltiple, por ejemplo, para dos variables, el modelo es
c | | | +
X
+
X
+ = Y
2
2
1
1 0

y la condicin a cumplir es )
X
-
X
- - E(Y mn
2
2
2
1
1 0
| | | , y obtenemos unos valores
de
b
,
b
,
b 2 1 0
, en funcin de los datos muestrales.
11. Regresin lineal
-305-


11.3. CONTRASTES DE SIGNIFICACIN DE LOS COEFICIENTES

Se observa que a y b, las estimaciones de o y | , son funciones de los datos
muestrales ) y ,
x
),...( y ,
x
( ), y ,
x
(
n
n
2
2
1
1
, de manera que, para cada muestra de n
puntos extrada al azar, cambian los valores de a y b. En consecuencia, a y b son dos
variables aleatorias con sus medias y sus varianzas. Se demuestra que para el
estadstico a son:
o = E(a)
) n - n(
x
x
x
= (a)
D
2
2
i
n
1 = i
2
i
n
1 = i
2
2

o

y para el estadstico b son:
| = E(b)
x
x
= (b)
D
2
2
i
n
1 = i
2
2
n -

o


siendo
o
2
la varianza residual, cuya estimacin viene dada por:
2

n
e
=
2
i
n
1 = i 2
o

Como
o
2
es desconocida, la sustituimos por
o
2
, a y b siguen distribuciones t
de Student de n-2 grados de libertad. Es decir:

t
=
D(a)
E(a) - a
2 - n

11. Regresin lineal
-306-
t
=
D(b)
E(b) - b
2 - n

o bien:
t
=
D(b)
- b
;
t
=
D(a)
- a
2 - n 2 - n
| o

las primeras hiptesis que se plantean es si o y | son nulas o por el contrario
tienen un valor significativamente distinto de cero.
Para contrastar 0) = (
H0
o observamos la cantidad
D(a)
0 - a

lo cual da un nmero. Si ste est dentro del campo de existencia de la t, al 95%,
decimos que no hay razn para rechazar que 0 = o .
Para contrastar 0) = (
Ho
| observamos la cantidad
D(b)
0 - b

lo cual da otro nmero. Si ste se encuentra dentro del campo de existencia al 95%
de una
t 2 - n
, decimos que no hay razn para rechazar que 0 = | .
En la prctica, el valor de
D(b)
b
se le llama t-value, y se calcula la probabilidad
de que una
t 2 - n
sea, en mdulo, mayor que la t-value. Si dicha probabilidad es menor
que 0,05, rechazamos la hiptesis nula de que el coeficiente es cero.

Simple Regression - Peso vs. Altura
Dependent variable: Peso
Independent variable: Altura
Linear model: Y = a + b*X

11. Regresin lineal
-307-
Coefficients
Least Squares Standard T
Parameter Estimate Error Statistic P-Value
Intercept -78,486 19,6355 -3,99714 0,0002
Slope 0,833335 0,110693 7,52833 0,0000

Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 2815,93 1 2815,93 56,68 0,0000
Residual 2782,35 56 49,6848
Total (Corr.) 5598,28 57

Correlation Coefficient = 0,709224
R-squared = 50,2999 percent
R-squared (adjusted for d.f.) = 49,4124 percent
Standard Error of Est. = 7,04874
Mean absolute error = 5,20749
Durbin-Watson statistic = 2,12033 (P=0,6706)
Lag 1 residual autocorrelation = -0,0660485

The StatAdvisor
The output shows the results of fitting a linear model to describe the relationship between Peso and
Altura. The equation of the fitted model is
Peso = -78,486 + 0,833335*Altura
Since the P-value in the ANOVA table is less than 0,05, there is a statistically significant relationship
between Peso and Altura at the 95,0% confidence level.
The R-Squared statistic indicates that the model as fitted explains 50,2999% of the variability in Peso.
The correlation coefficient equals 0,709224, indicating a moderately strong relationship between the
variables. The standard error of the estimate shows the standard deviation of the residuals to be
7,04874. This value can be used to construct prediction limits for new observations by selecting the
Forecasts option from the text menu.

11. Regresin lineal
-308-
The mean absolute error (MAE) of 5,20749 is the average value of the residuals. The Durbin-Watson
(DW) statistic tests the residuals to determine if there is any significant correlation based on the order in
which they occur in your data file. Since the P-value is greater than 0,05, there is no indication of serial
autocorrelation in the residuals at the 95,0% confidence level.
En regresin lineal mltiple se acta con el mismo criterio, pero adems se
suele hacer un contraste de hiptesis de que todos los coeficientes de regresin son
nulos, esto es:
0) = = (
H
2 1
0
| |
frente que al menos uno de ellos es distinto de cero. Para esto aplicamos un
procedimiento semejante al anlisis de la varianza. Se calcula el valor de
o
2
por dos
procedimientos que veremos a continuacin, y que bajo el supuesto de la hiptesis
0) = = (
H
2 1
0
| | , deben dar lo mismo, esto es, que el cociente:
1

2
2
2
1
~
o
o

Siempre el numerador va a ser mayor que el denominador, y en caso de que
ese cociente sea muy elevado, eso es indicio de que al menos un coeficiente de
regresin es distinto de cero.


Figura 11. 3. Valores predichos
1
) y - y (
=
2
i
n
1 = i 2
1


o

11. Regresin lineal
-309-
2 - n
) y - y (
=
2
i i
n
1 = i 2
2


o

y el cociente de varianzas sigue una F de 1 y n-2 grados de libertad.


Multiple Regression - Peso
Dependent variable: Peso
Independent variables:
Altura
Edad
Sexo=2

Standard T
Parameter Estimate Error Statistic P-Value
CONSTANT -101,667 36,5018 -2,78526 0,0074
Altura 0,621629 0,144015 4,31641 0,0001
Edad 3,3533 1,18711 2,82477 0,0066
Sexo=2 -7,22088 3,53274 -2,04399 0,0458

Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 3434,97 3 1144,99 28,58 0,0000
Residual 2163,31 54 40,0613
Total (Corr.) 5598,28 57

R-squared = 61,3576 percent
R-squared (adjusted for d.f.) = 59,2108 percent
Standard Error of Est. = 6,3294
Mean absolute error = 4,85517
11. Regresin lineal
-310-
Durbin-Watson statistic = 2,1583 (P=0,7124)
Lag 1 residual autocorrelation = -0,081475

The StatAdvisor
The output shows the results of fitting a multiple linear regression model to describe the relationship
between Peso and 3 independent variables. The equation of the fitted model is
Peso = -101,667 + 0,621629*Altura + 3,3533*Edad - 7,22088*Sexo=2
Since the P-value in the ANOVA table is less than 0,05, there is a statistically significant relationship
between the variables at the 95,0% confidence level.
The R-Squared statistic indicates that the model as fitted explains 61,3576% of the variability in Peso.
The adjusted R-squared statistic, which is more suitable for comparing models with different numbers of
independent variables, is 59,2108%. The standard error of the estimate shows the standard deviation of
the residuals to be 6,3294. This value can be used to construct prediction limits for new observations by
selecting the Reports option from the text menu. The mean absolute error (MAE) of 4,85517 is the
average value of the residuals. The Durbin-Watson (DW) statistic tests the residuals to determine if there
is any significant correlation based on the order in which they occur in your data file. Since the P-value is
greater than 0,05, there is no indication of serial autocorrelation in the residuals at the 95,0% confidence
level.
In determining whether the model can be simplified, notice that the highest P-value on the independent
variables is 0,0458, belonging to Sexo=2. Since the P-value is less than 0,05, that term is statistically
significant at the 95,0% confidence level. Consequently, you probably don't want to remove any
variables from the model.

11.4. VALIDACIN DEL MODELO

Aparte de contrastar las hiptesis nulas de que los coeficientes de regresin son cero
o no, hay que comprobar las hiptesis del modelo acerca de los residuos. Esto es:
1) Son normales
2) Media cero.
3) Varianza constante.
4) Incorrelacionados.
5) No hay valores anmalos.
1) Normalidad
Para comprobar la normalidad de los residuos se realiza un grfico probabilstico
normal, como el de la figura siguiente:

11. Regresin lineal
-311-
Normal ProbabilityPlot
-13 -8 -3 2 7 12 17
RESIDUALS
0,1
1
5
20
50
80
95
99
99,9
p
e
r
c
e
n
t
a
g
e

Figura 11. 4. Test de ajuste a una normal.

Si los puntos estn situados sobre una recta, decimos que los datos se
ajustan a una distribucin normal.
2) Media cero
Se puede calcular el intervalo de confianza del residuo. Si el intervalo de confianza al
95% incluye al 0, decimos que la media es 0 con un nivel de significacin del 5%.
3) Varianza constante
Para ello realizamos un grfico de dispersin de
ei
frente a x. Por ejemplo, si el
grfico fuera como el de la figura siguiente:


Figura 11. 5.Varianza no constante
11. Regresin lineal
-312-

se observa que a medida que aumenta X, aumenta la dispersin, lo que contradice la
hiptesis de homocedsticidad del modelo.
4) Autocorrelacin
Por ejemplo, si el grfico de
ei
frente a x es como el de la figura siguiente:


Figura 11. 6. Residuos en funcin de x

significa que los residuos estn correlacionados, ya que primero son negativos, luego
positivos, negativos, etc.. Es decir, no hay independencia de los residuos.
Este caso particular corresponde a una situacin en que la nube de puntos
(X,Y) tiene la forma de una parbola, pero se ha ajustado una recta, tal como en la
figura de abajo:

Figura 11. 7. Falta de ajuste

En general, las grficas de residuos no tienen que mostrar ningn
11. Regresin lineal
-313-
comportamiento sistemtico.

5) Valores anmalos
Se pueden determinar dibujando los residuos en funcin de x, y observando aquellos
puntos que sean muy extremos, tanto por arriba, como por abajo de la media.
Tambin se pueden estandarizar los residuos, y observar aquellos cuyos valores
sean ms de 3 en mdulo.

11.5. INTERVALOS DE PREDICCIN

Una vez que el modelo ha pasado la etapa de validacin, se puede emplear para
realizar predicciones de y
0
, conociendo un valor de
x0
. Se pueden efectuar dos tipos
de predicciones:
a) Dado un valor de
x0
, cunto vale por trmino medio el valor de y
0
? Es
una prediccin para la media de y
0
.
b) Dado un valor de
x0
, cunto vale el valor de y
0
? Es una prediccin
para un valor puntual de y
0
.
Para el segundo caso habr una mayor imprecisin que para el primero,
puesto que resulta ms difcil predecir un valor puntual, que una media, en donde los
valores altos y bajos se pueden compensar.
El intervalo de prediccin para la media de y
0
es:
|
|
.
|

\
|
s
) x
x
(
+
n
1
t
+
x
b + a
xx
2
0 2 /2
n2 0 o
o


y para un valor puntual es:
|
|
.
|

\
|
s
) x
x
(
+
n
1
+ 1
t
+
bx
+ a
xx
2
0 2 /2
n2 0 o
o


donde
) x
x
( =
S
2
i
n
1 = i
xx


11. Regresin lineal
-314-
Grficamente, los lmites superior e inferior de dichos intervalos forman unas
curvas alrededor de la recta de regresin, tal como se presenta en la figura siguiente:
Plot of Fitted Model
Peso = -78,486 + 0,833335*Altura
150 160 170 180 190 200
Altura
45
55
65
75
85
P
e
s
o
Fi
gura 11. 8. Intervalos de prediccin.
Las curvas mas interiores corresponden a la prediccin de un valor medio de
Y, y las mas exteriores, a un valor puntual de Y.
Cuando X coincide con x , la amplitud de los intervalos es mnima, tal y como
se observa en la figura 11.8, y se corresponde con las frmulas.

11. Regresin lineal
-315-
Plantear el
problema
Formular el
modelo
y=a+bx+e
Calcular
coeficientes
Validacin del
modelo
Ok?
Previsin y control
NO
SI

Figura 11. 9. Formulacin de modelos de regresin


11.6. BONDAD DE AJUSTE

Para dos modelos de regresin que cumplan las hiptesis, )cul de los dos es el
mejor? o bien para uno de ellos, )cunto de bien se ajustan los datos al modelo?
Para determinar el grado de ajuste de los puntos se calcula el coeficiente de
determinacin
R
2
, el cual viene dado por:
total cuadrados de suma
residual cuadrados de suma
1 =
R
2

Cunto ms se ajuste a 100% el
R
2
, mejor ser el ajuste de los datos al
modelo.

11. Regresin lineal
-316-
Si introducimos otra variable al modelo, el valor de
R
2
siempre aumenta, pero
puede ser que la aportacin de la nueva variable no sea significativa. Por ello se
calcula el
R
2
ajustado, el cual es:
o
o
2
Y
2
2
adjus.
1 =
var.total
al var.residu
1 =
R

el cual penaliza la introduccin de nuevas variables, y en caso de no ser
significativas, disminuye el valor de
R
2
adju.


# Mtodo del incremento de la suma de cuadrados
Modelo 1 (ms sencillo)
c | | +
x
+ = y
1
1 0

Suma de cuadrados:
SCR
+
SCE
=
SCT 1 1 1

Modelo 2 (ms completo)
c | | | +
x
+
x
+ = y
2
2
1
1 0


Suma de cuadrados
SCR
+
SCE
=
SCT 2 2 2

Incremento de la suma de cuadrados
SCR
-
SCR
= SCR
2 1
A
El modelo 2 es mejor que el 1 si:
F
>
2 g.l.modelo
SCR
1
SCR
2 elo mod g.l. 1,
2
o
A






11. Regresin lineal
-317-
11.7. PROBLEMAS Y CUESTIONES DE EXMENES

11.7.1.- Se quiere estudiar la relacin existente entre la renta, en millones de euros,
para diferentes provincias espaolas y el nmero de automviles y motocicletas (en
miles de unidades) en las mismas. Para ello se tienen para cada provincia la
relacin de automviles y motocicletas as como su renta media.
Los resultados obtenidos mediante regresin se muestran a continuacin.
Anlisis de Regresin Mltiple
-----------------------------------------------------------------------------
Variable dependiente: RENTA_PROV
-----------------------------------------------------------------------------
Error Estadstico
Parmetro Estimacin estndar T P-Valor
-----------------------------------------------------------------------------
CONSTANTE 6343.96 1127.17 5.62823 0.0000
AUTOMOVIL 0.610523 0.024924 24.4954 0.0000
MOTOS 0.110201 0.0565941 1.94722 0.0575
-----------------------------------------------------------------------------
Anlisis de Varianza
-----------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor
-----------------------------------------------------------------------------
Modelo 9.02343E10 2 4.51172E10 1537.11 0.0000
Residuo 1.37954E9 47 2.9352E7
-----------------------------------------------------------------------------
Total (Corr.) 9.16139E10 49
R-cuadrado = 98.4942 porcentaje
R-cuadrado (ajustado para g.l.) = 98.4301 porcentaje
Error estndar de est. = 5417.75
Error absoluto medio = 3469.87
Estadstico de Durbin-Watson = 2.29066 (P=0.1528)
Autocorrelacin residual en Lag 1 = -0.153461

11. Regresin lineal
-318-

Con los resultados anteriores y un nivel de significacin de un 5%

1. Cules son las variables que presentan una influencia significativa sobre el nivel
de renta provincial? (2,5 puntos)

a) AUTOMOVIL y MOTOS
b) AUTOMOVIL
c) MOTOS
d) El modelo no es significativo



2. El coeficiente de determinacin del modelo representado tiene un valor de: (2,5
puntos)

a) -0.153461
b) 98.4942
c) 6343.96
d) 1537.11



3. Empleando el modelo completo cul es el valor esperado de la renta provincial
si AUTOMOVIL=1000 y MOTOS= B=500? (2,5 puntos)

a) 6343.96
b) 7505.533
c) 7009.5835
d) 55.1005


4. La estimacin del parmetro AUTOMOVIL representa: (2,5 puntos)

a) Incremento medio en el valor esperado de la renta provincial por cada coche
que se matricula manteniendo constante el resto de variables independientes.
b) Incremento medio en el valor esperado de la renta provincial por cada mil
coches que se matriculan manteniendo constante el resto de variables
independientes.
c) Incremento en el valor esperado de la renta provincial por cada mil coches
que se matriculan manteniendo constante el resto de variables independientes
11. Regresin lineal
-319-
d) Incremento en el valor esperado de la renta provincial por cada coche que se
matricula sin matricularse ninguna moto.

11.7.2.- La relacin que existe entre la potencia de un coche (horsepower) y su
consumo (mpg) y su pas de procedencia se ha estudiado a travs de un modelo de
regresin como el que se ve en la siguiente salida del statgraphics:
-----------------------------------------------------------------------------
Dependent variable: horsepower
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT 161,85 6,75849 23,9477 0,0000
mpg -2,56657 0,196964 -13,0306 0,0000
Pais 1,43398 2,909 0,492947 0,6228
-----------------------------------------------------------------------------
Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 55446,7 2 27723,3 121,33 0,0000
Residual 33589,4 147 228,499
-----------------------------------------------------------------------------
Total (Corr.) 89036,1 149
R-squared = 62,2744 percent
R-squared (adjusted for d.f.) = 61,7611 percent
Standard Error of Est. = 15,1162
Mean absolute error = 11,615
Durbin-Watson statistic = 1,46866 (P=0,0005)
Lag 1 residual autocorrelation = 0,26547

11. Regresin lineal
-320-
1) De qu trminos depende de forma significativa para un valor de =0,05 la
variable dependiente? Justifica la respuesta (0,50 puntos)
a) Contante, mpg, pas
x b) Constante, mpg porque sus P-valores son menores q ue 0,05
c) Pas
d) La dependencia nos la da la R-squared.

2) Cunto vale el coeficiente de determinacin? (0,50 puntos)

a) Lo obtenemos de la tabla del anlisis de la varianza y nos lo da el p-value
indicndonos que como es menos que 005 el modelo es vlido.
b) Lo obtenemos de la tabla del anlisis de la varianza y se calcula como la raz
cuadrada de la SCE/SCT y vale 15,1162
x c) Lo obtenemos de la tabla del anlisis de la varianza y se calcula como la
SCE/SCT por 100 y vale 62,2744%
d) Nos lo da la tabla del anlisis de la varianza y es el valor F-Ratio 121,33 que al ser
tan grande significa que el modelo es vlido.

11.7.3.- Se estudia la relacin entre la composicin de un cemento tipo Portland y el
calor desprendido durante la fase de fraguado. Para ello se midi la cantidad de calor
desprendido en caloras por gramos de cemento junto con las variables que se
pensaba podan tener influencia sobre el calor desprendido A, B y C que representan
el contenido en porcentaje de tres productos.

Los resultados se obtenidos se muestran a continuacin.

11. Regresin lineal
-321-

Anlisis de Regresin Mltiple
-----------------------------------------------------------------------------
Variable dependiente: Calor
-----------------------------------------------------------------------------
Error Estadstico
Parmetro Estimacin estndar T P-Valor
-----------------------------------------------------------------------------
CONSTANTE 48,1936 3,9133 12,3153 0,0000
A 1,69589 0,204582 8,28954 0,0000
B 0,656915 0,0442342 14,8508 0,0000
C 0,250018 0,184711 1,35356 0,2089
-----------------------------------------------------------------------------

Anlisis de Varianza
-----------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor
-----------------------------------------------------------------------------
Modelo 2667,65 3 889,217 166,34 0,0000
Residuo 48,1106 9 5,34562
-----------------------------------------------------------------------------
Total (Corr.) 2715,76 12

R-cuadrado = 98,2285 porcentaje
R-cuadrado (ajustado para g.l.) = 97,638 porcentaje
Error estndar de est. = 2,31206
Error absoluto medio = 1,57588
Estadstico de Durbin-Watson = 2,11016 (P=0,3638)
Autocorrelacin residual en Lag 1 = -0,116306



11. Regresin lineal
-322-

Anlisis de Regresin Mltiple
-----------------------------------------------------------------------------
Variable dependiente: Calor
-----------------------------------------------------------------------------
Error Estadstico
Parmetro Estimacin estndar T P-Valor
-----------------------------------------------------------------------------
CONSTANTE 52,5773 2,28617 22,998 0,0000
A 1,46831 0,121301 12,1047 0,0000
B 0,66225 0,0458547 14,4424 0,0000
-----------------------------------------------------------------------------

Anlisis de Varianza
-----------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor
-----------------------------------------------------------------------------
Modelo 2657,86 2 1328,93 229,50 0,0000
Residuo 57,9045 10 5,79045
-----------------------------------------------------------------------------
Total (Corr.) 2715,76 12

R-cuadrado = 97,8678 porcentaje
R-cuadrado (ajustado para g.l.) = 97,4414 porcentaje
Error estndar de est. = 2,40634
Error absoluto medio = 1,90933
Estadstico de Durbin-Watson = 1,92164 (P=0,4717)
Autocorrelacin residual en Lag 1 = -0,054504



11. Regresin lineal
-323-
A. El coeficiente de determinacin del modelo matemtico ms adecuado tiene un
valor de: (0,25 puntos)
a. 2,40634
b. 97,638
c. 2,31206
d. 97,4414 Cuando se comparan modelos se usa el R-cuadrado
(ajustado para gl)

B. La ecuacin matemtica que se debera utilizar para predecir el valor del calor
desprendido en la fase de fraguado es: (0,25 puntos)
a. Calor=48,1936+0,656915B+1,69589A
b. Calor=52,5773+0,66225B+1,46831A (el coeficiente de C no es
significativo)
c. Calor=48,1936+0,250018C+0,656915B+1,69589A
d. Ninguno de los anteriores

C. La estimacin del parmetro A representa: (0,25 puntos)
a. Decremento medio en el valor del calor por cada unidad que aumenta
el parmetro A
b. Incremento medio en el valor del calor por cada unidad que
aumenta el parmetro A manteniendo constante el resto de
variables independientes.
c. Incremento medio en el valor del calor por cada unidad que aumenta el
parmetro A
d. Ninguna de los anteriores

D. Qu valor obtendramos del calor desprendido si A=11, B=56 y C=8 (0,25
puntos)
103,63563
a. 105,81471 (sustituyndolas variables significativas en el modelo
segundo que es el apropiado)
11. Regresin lineal
-324-
b. 106,45871
c. 105,635774


11.7.4.- Para estudiar a qu se debe la variabilidad obtenida en funcin del tipo de
fitoregulador, se analiza en laboratorio la composicin de cada un de ellos y se
encuentra que su composicin es muy similar, pero difieren en la concentracin de
una hormona de crecimiento vegetal denominada auxina (variable conc). El
fitoregulador A contiene 10 g/l de auxina, el de tipo B contiene 40 g/l y el de tipo C, 20
g/l. El efecto de la concentracin sobre la longitud obtenida (datos de la tabla anterior)
se analiza con regresin lineal mltiple, obtenindose los siguientes resultados:
Multiple Regression Analysis
-----------------------------------------------------------------------------
Dependent variable: longitud
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT -258,333 125,178 -2,06372 0,0691
conc 73,0 11,1942 6,52125 0,0001
conc^2 -1,21667 0,211749 -5,7458 0,0003
-----------------------------------------------------------------------------
Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 299756,0 2 149878,0 29,40 0,0001
Residual 45876,0 9 5097,33
-----------------------------------------------------------------------------
Total (Corr.) 345632,0 11

R-squared = 86,7269 percent
11. Regresin lineal
-325-
R-squared (adjusted for d.f.) = 83,7774 percent
Standard Error of Est. = 71,3956
Mean absolute error = 47,5

Teniendo en cuenta los resultados del modelo de regresin, qu concentracin de
auxina deber tener el fitoregulador para maximizar la longitud, bajo las condiciones
del experimento? Considerar o=0,05. (2,5 puntos)

a) conc = 20
b) conc = 30
c) conc = 40
d) conc = 20 o bien conc = 40
e) ninguna de las anteriores

Solucin: las dos variables del modelo son estadsticamente significativas ya que su p-
valor es menor a 0,05. La ecuacin resultante ser: Longitud = 258,333 + 73 conc
1,217 conc
2

Para determinar el mximo relativo de esta ecuacin, hay que derivar e igualar a
cero:
d(long)/dc = 73 2 1,217 conc = 0 conc = 73/(21,217) = 30 g/l.


11. Regresin lineal
-326-


Anexo A
-327-

ANEXO A. Tablas de las principales distribuciones de probabilidad

DISTRIBUCIN DE POISSON .......................................................................................... 328
DISTRIBUCIN NORMAL TIPIFICADA ............................................................................ 331
DISTRIBUCIN
2
n
_ DE PEARSON .................................................................................. 332
DISTRIBUCIN t de Student ............................................................................................ 335
DISTRIBUCIN F de snedecor ......................................................................................... 338



Anexo A
-328-


DISTRIBUCIN DE POISSON

=


= s
c
i
i
! i
e
) c X ( P
0

0 1 2 3 4 5 6 7 8 9 10

c=0 c=1 c=2 c=3 c=4 c=5 c=6 c=7 c=8
0,02 0,9802 0,9998 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0,04 0,9608 0,9992 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0,06 0,9418 0,9983 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0,08 0,9231 0,9970 0,9999 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0,10 0,9048 0,9953 0,9998 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0,15 0,8607 0,9898 0,9995 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0,20 0,8187 0,9825 0,9989 0,9999 1,0000 1,0000 1,0000 1,0000 1,0000
0,25 0,7788 0,9735 0,9978 0,9999 1,0000 1,0000 1,0000 1,0000 1,0000
0,30 0,7408 0,9631 0,9964 0,9997 1,0000 1,0000 1,0000 1,0000 1,0000
0,35 0,7047 0,9513 0,9945 0,9995 1,0000 1,0000 1,0000 1,0000 1,0000
0,40 0,6703 0,9384 0,9921 0,9992 0,9999 1,0000 1,0000 1,0000 1,0000
0,45 0,6376 0,9246 0,9891 0,9988 0,9999 1,0000 1,0000 1,0000 1,0000
0,50 0,6065 0,9098 0,9856 0,9982 0,9998 1,0000 1,0000 1,0000 1,0000
0,55 0,5769 0,8943 0,9815 0,9975 0,9997 1,0000 1,0000 1,0000 1,0000
0,60 0,5488 0,8781 0,9769 0,9966 0,9996 1,0000 1,0000 1,0000 1,0000
0,65 0,5220 0,8614 0,9717 0,9956 0,9994 0,9999 1,0000 1,0000 1,0000
0,70 0,4966 0,8442 0,9659 0,9942 0,9992 0,9999 1,0000 1,0000 1,0000
0,75 0,4724 0,8266 0,9595 0,9927 0,9989 0,9999 1,0000 1,0000 1,0000
0,80 0,4493 0,8088 0,9526 0,9909 0,9986 0,9998 1,0000 1,0000 1,0000
0,85 0,4274 0,7907 0,9451 0,9889 0,9982 0,9997 1,0000 1,0000 1,0000
0,90 0,4066 0,7725 0,9371 0,9865 0,9977 0,9997 1,0000 1,0000 1,0000
1,00 0,3679 0,7358 0,9197 0,9810 0,9963 0,9994 0,9999 1,0000 1,0000
1,10 0,3329 0,6990 0,9004 0,9743 0,9946 0,9990 0,9999 1,0000 1,0000
1,20 0,3012 0,6626 0,8795 0,9662 0,9923 0,9985 0,9997 1,0000 1,0000
1,30 0,2725 0,6268 0,8571 0,9569 0,9893 0,9978 0,9996 0,9999 1,0000
1,40 0,2466 0,5918 0,8335 0,9463 0,9857 0,9968 0,9994 0,9999 1,0000
1,50 0,2231 0,5578 0,8088 0,9344 0,9814 0,9955 0,9991 0,9998 1,0000
1,60 0,2019 0,5249 0,7834 0,9212 0,9763 0,9940 0,9987 0,9997 1,0000
1,70 0,1827 0,4932 0,7572 0,9068 0,9704 0,9920 0,9981 0,9996 0,9999
1,80 0,1653 0,4628 0,7306 0,8913 0,9636 0,9896 0,9974 0,9994 0,9999
1,90 0,1496 0,4337 0,7037 0,8747 0,9559 0,9868 0,9966 0,9992 0,9998
2,00 0,1353 0,4060 0,6767 0,8571 0,9473 0,9834 0,9955 0,9989 0,9998
2,10 0,1225 0,3796 0,6496 0,8386 0,9379 0,9796 0,9941 0,9985 0,9997
2,20 0,1108 0,3546 0,6227 0,8194 0,9275 0,9751 0,9925 0,9980 0,9995
2,30 0,1003 0,3309 0,5960 0,7993 0,9162 0,9700 0,9906 0,9974 0,9994
2,40 0,0907 0,3084 0,5697 0,7787 0,9041 0,9643 0,9884 0,9967 0,9991
2,50 0,0821 0,2873 0,5438 0,7576 0,8912 0,9580 0,9858 0,9958 0,9989
2,60 0,0743 0,2674 0,5184 0,7360 0,8774 0,9510 0,9828 0,9947 0,9985
2,70 0,0672 0,2487 0,4936 0,7141 0,8629 0,9433 0,9794 0,9934 0,9981
2,80 0,0608 0,2311 0,4695 0,6919 0,8477 0,9349 0,9756 0,9919 0,9976
2,90 0,0550 0,2146 0,4460 0,6696 0,8318 0,9258 0,9713 0,9901 0,9969
3,00 0,0498 0,1991 0,4232 0,6472 0,8153 0,9161 0,9665 0,9881 0,9962
3,10 0,0450 0,1847 0,4012 0,6248 0,7982 0,9057 0,9612 0,9858 0,9953
3,20 0,0408 0,1712 0,3799 0,6025 0,7806 0,8946 0,9554 0,9832 0,9943
3,30 0,0369 0,1586 0,3594 0,5803 0,7626 0,8829 0,9490 0,9802 0,9931
3,40 0,0334 0,1468 0,3397 0,5584 0,7442 0,8705 0,9421 0,9769 0,9917
3,50 0,0302 0,1359 0,3208 0,5366 0,7254 0,8576 0,9347 0,9733 0,9901
3,60 0,0273 0,1257 0,3027 0,5152 0,7064 0,8441 0,9267 0,9692 0,9883
3,70 0,0247 0,1162 0,2854 0,4942 0,6872 0,8301 0,9182 0,9648 0,9863
3,80 0,0224 0,1074 0,2689 0,4735 0,6678 0,8156 0,9091 0,9599 0,9840
3,90 0,0202 0,0992 0,2531 0,4532 0,6484 0,8006 0,8995 0,9546 0,9815
4,00 0,0183 0,0916 0,2381 0,4335 0,6288 0,7851 0,8893 0,9489 0,9786
4,10 0,0166 0,0845 0,2238 0,4142 0,6093 0,7693 0,8786 0,9427 0,9755
4,20 0,0150 0,0780 0,2102 0,3954 0,5898 0,7531 0,8675 0,9361 0,9721
4,30 0,0136 0,0719 0,1974 0,3772 0,5704 0,7367 0,8558 0,9290 0,9683
4,40 0,0123 0,0663 0,1851 0,3594 0,5512 0,7199 0,8436 0,9214 0,9642
4,50 0,0111 0,0611 0,1736 0,3423 0,5321 0,7029 0,8311 0,9134 0,9597
4,60 0,0101 0,0563 0,1626 0,3257 0,5132 0,6858 0,8180 0,9049 0,9549
4,70 0,0091 0,0518 0,1523 0,3097 0,4946 0,6684 0,8046 0,8960 0,9497
4,80 0,0082 0,0477 0,1425 0,2942 0,4763 0,6510 0,7908 0,8867 0,9442
4,90 0,0074 0,0439 0,1333 0,2793 0,4582 0,6335 0,7767 0,8769 0,9382

Anexo A
-329-



DISTRIBUCIN DE POISSON

=


= s
c
i
i
! i
e
) c X ( P
0

0 1 2 3 4 5 6 7 8 9 10

c=0 c=1 c=2 c=3 c=4 c=5 c=6 c=7 c=8
5,00 0,0067 0,0404 0,1247 0,2650 0,4405 0,6160 0,7622 0,8666 0,9319
5,10 0,0061 0,0372 0,1165 0,2513 0,4231 0,5984 0,7474 0,8560 0,9252
5,20 0,0055 0,0342 0,1088 0,2381 0,4061 0,5809 0,7324 0,8449 0,9181
5,30 0,0050 0,0314 0,1016 0,2254 0,3895 0,5635 0,7171 0,8335 0,9106
5,40 0,0045 0,0289 0,0948 0,2133 0,3733 0,5461 0,7017 0,8217 0,9027
5,50 0,0041 0,0266 0,0884 0,2017 0,3575 0,5289 0,6860 0,8095 0,8944
5,60 0,0037 0,0244 0,0824 0,1906 0,3422 0,5119 0,6703 0,7970 0,8857
5,70 0,0033 0,0224 0,0768 0,1800 0,3272 0,4950 0,6544 0,7841 0,8766
5,80 0,0030 0,0206 0,0715 0,1700 0,3127 0,4783 0,6384 0,7710 0,8672
5,90 0,0027 0,0189 0,0666 0,1604 0,2987 0,4619 0,6224 0,7576 0,8574
6,00 0,0025 0,0174 0,0620 0,1512 0,2851 0,4457 0,6063 0,7440 0,8472
6,10 0,0022 0,0159 0,0577 0,1425 0,2719 0,4298 0,5902 0,7301 0,8367
6,20 0,0020 0,0146 0,0536 0,1342 0,2592 0,4141 0,5742 0,7160 0,8259
6,30 0,0018 0,0134 0,0498 0,1264 0,2469 0,3988 0,5582 0,7017 0,8148
6,40 0,0017 0,0123 0,0463 0,1189 0,2351 0,3837 0,5423 0,6873 0,8033
6,50 0,0015 0,0113 0,0430 0,1118 0,2237 0,3690 0,5265 0,6728 0,7916
6,60 0,0014 0,0103 0,0400 0,1052 0,2127 0,3547 0,5108 0,6581 0,7796
6,70 0,0012 0,0095 0,0371 0,0988 0,2022 0,3406 0,4953 0,6433 0,7673
6,80 0,0011 0,0087 0,0344 0,0928 0,1920 0,3270 0,4799 0,6285 0,7548
6,90 0,0010 0,0080 0,0320 0,0871 0,1823 0,3137 0,4647 0,6136 0,7420
7,00 0,0009 0,0073 0,0296 0,0818 0,1730 0,3007 0,4497 0,5987 0,7291
7,20 0,0007 0,0061 0,0255 0,0719 0,1555 0,2759 0,4204 0,5689 0,7027
7,40 0,0006 0,0051 0,0219 0,0632 0,1395 0,2526 0,3920 0,5393 0,6757
7,60 0,0005 0,0043 0,0188 0,0554 0,1249 0,2307 0,3646 0,5100 0,6482
7,80 0,0004 0,0036 0,0161 0,0485 0,1117 0,2103 0,3384 0,4812 0,6204
8,00 0,0003 0,0030 0,0138 0,0424 0,0996 0,1912 0,3134 0,4530 0,5925
8,20 0,0003 0,0025 0,0118 0,0370 0,0887 0,1736 0,2896 0,4254 0,5647
8,40 0,0002 0,0021 0,0100 0,0323 0,0789 0,1573 0,2670 0,3987 0,5369
8,60 0,0002 0,0018 0,0086 0,0281 0,0701 0,1422 0,2457 0,3728 0,5094
8,80 0,0002 0,0015 0,0073 0,0244 0,0621 0,1284 0,2256 0,3478 0,4823
9,00 0,0001 0,0012 0,0062 0,0212 0,0550 0,1157 0,2068 0,3239 0,4557
9,20 0,0001 0,0010 0,0053 0,0184 0,0486 0,1041 0,1892 0,3010 0,4296
9,40 0,0001 0,0009 0,0045 0,0160 0,0429 0,0935 0,1727 0,2792 0,4042
9,60 0,0001 0,0007 0,0038 0,0138 0,0378 0,0838 0,1574 0,2584 0,3796
9,80 0,0001 0,0006 0,0033 0,0120 0,0333 0,0750 0,1433 0,2388 0,3558
10,0 0,0000 0,0005 0,0028 0,0103 0,0293 0,0671 0,1301 0,2202 0,3328
10,2 0,0000 0,0004 0,0023 0,0089 0,0257 0,0599 0,1180 0,2027 0,3108
10,4 0,0000 0,0003 0,0020 0,0077 0,0225 0,0534 0,1069 0,1863 0,2896
10,6 0,0000 0,0003 0,0017 0,0066 0,0197 0,0475 0,0966 0,1710 0,2694
10,8 0,0000 0,0002 0,0014 0,0057 0,0173 0,0423 0,0872 0,1566 0,2502
11,00 0,0000 0,0002 0,0012 0,0049 0,0151 0,0375 0,0786 0,1432 0,2320
11,20 0,0000 0,0002 0,0010 0,0042 0,0132 0,0333 0,0708 0,1307 0,2147
11,40 0,0000 0,0001 0,0009 0,0036 0,0115 0,0295 0,0636 0,1192 0,1984
11,60 0,0000 0,0001 0,0007 0,0031 0,0100 0,0261 0,0571 0,1085 0,1830
11,80 0,0000 0,0001 0,0006 0,0027 0,0087 0,0230 0,0512 0,0986 0,1686
12,00 0,0000 0,0001 0,0005 0,0023 0,0076 0,0203 0,0458 0,0895 0,1550
12,20 0,0000 0,0001 0,0004 0,0020 0,0066 0,0179 0,0410 0,0811 0,1424
12,40 0,0000 0,0001 0,0004 0,0017 0,0057 0,0158 0,0366 0,0734 0,1305
12,60 0,0000 0,0000 0,0003 0,0014 0,0050 0,0139 0,0326 0,0664 0,1195
12,80 0,0000 0,0000 0,0003 0,0012 0,0043 0,0122 0,0291 0,0599 0,1093
13,00 0,0000 0,0000 0,0002 0,0011 0,0037 0,0107 0,0259 0,0540 0,0998
13,20 0,0000 0,0000 0,0002 0,0009 0,0032 0,0094 0,0230 0,0487 0,0910
13,40 0,0000 0,0000 0,0002 0,0008 0,0028 0,0083 0,0204 0,0438 0,0828
13,60 0,0000 0,0000 0,0001 0,0007 0,0024 0,0072 0,0181 0,0393 0,0753
13,80 0,0000 0,0000 0,0001 0,0006 0,0021 0,0063 0,0161 0,0353 0,0684
14,00 0,0000 0,0000 0,0001 0,0005 0,0018 0,0055 0,0142 0,0316 0,0621
14,20 0,0000 0,0000 0,0001 0,0004 0,0016 0,0048 0,0126 0,0283 0,0562
14,40 0,0000 0,0000 0,0001 0,0003 0,0013 0,0042 0,0111 0,0253 0,0509
14,60 0,0000 0,0000 0,0001 0,0003 0,0012 0,0037 0,0098 0,0226 0,0460
14,80 0,0000 0,0000 0,0000 0,0002 0,0010 0,0032 0,0087 0,0202 0,0415
15,00 0,0000 0,0000 0,0000 0,0002 0,0009 0,0028 0,0076 0,0180 0,0374


Anexo A
-330-


DISTRIBUCIN DE POISSON
=


= s
c
i
i
! i
e
) c X ( P
1

M z
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
F
u
n
c
i

n

d
e

d
i
s
t
r
i
b
u
c
i

n

P
(
X

x
)


c=
0
1
2

3
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
Anexo A
-331-


DISTRIBUCIN NORMAL TIPIFICADA
dt e
2
1
) z Z ( P ) z (
z
2
t
-
2
}

t
= s = |
o

z 0 1 2 3 4 5 6 7 8 9 z 0 1 2 3 4 5 6 7 8 9

-3 0,0013 0,0010 0,0007 0,0005 0,0003 0,0002 0,0002 0,0001 0,0001 0,0000 0.0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319

-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1057 0,1038 0,1020 0,1003 0,0985 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
-0,7 0,2420 0,2389 0,2358 0,2327 0,2297 0,2266 0,2236 0,2207 0,2177 0,2148 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936

-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
-0.0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 3 0,9987 0,9990 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999 1,0000
Jos Jabaloyes Vivas Vicente Chirivella Gonzlez
Anexo A
-332-


DISTRIBUCIN
2
n
_ DE PEARSON
( )
dt
/ n
t
e ) x ( P
x
/ n
/ n
/ t
n }
I
= s _

0
2
1 2
2 2
2 2


0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51
x
F
u
n
c
i

n

d
e

d
i
s
t
r
i
b
u
c
i

n

P
(

_
n
2

x
)

n=1
n=2
n=3
n=4
n=5
n=6
n=7
n=8
n=9
n=10
n=12
n=14
n=16
n=18
n=20
n=22
n=24
n=26
n=28
n=30
Anexo A
-333-


DISTRIBUCIN

DE PEARSON (Cont.)
( )
dt
2 / n 2
t
e ) x ( P
x
0
2 / n
1 2 / n
2 / t 2
n
}
I
= s _



0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140
F
u
n
c
i

n

d
e

d
i
s
t
r
i
b
u
c
i

n

P
(

_
n
2

x
)

x
n=30
n=35
n=40
n=45
n=50
n=55
n=60
n=65
n=70
n=75
n=80
n=85
n=90
n=95
n=100
Anexo A
-334-
DISTRIBUCIN CHI-CUADRADO DE PEARSON


( )
dt
2
t
e ) x X ( P
x 2
n 2
n
1
2
n
2
t
}

I
= >

_
2
n
(o)
o



n 0.9995 0.999 0.995 0.99 0.975 0.95 0.90 0.50 0.10 0.050 0.025 0.01 0.005 0.001 0.0005

1 0.000 0.000 0.000 0.000 0.001 0.004 0.016 0.455 2.706 3.842 5.024 6.635 7.879 10.827 12.115
2 0.001 0.002 0.010 0.020 0.051 0.103 0.211 1.386 4.605 5.992 7.378 9.210 10.597 13.815 15.201
3 0.015 0.024 0.072 0.115 0.216 0.352 0.584 2.366 6.251 7.815 9.348 11.345 12.838 16.266 17.731
4 0.064 0.091 0.207 0.297 0.484 0.711 1.064 3.357 7.779 9.488 11.143 13.277 14.860 18.466 19.998
5 0.158 0.210 0.412 0.554 0.831 1.146 1.610 4.352 9.236 11.071 12.833 15.086 16.750 20.515 22.106

6 0.299 0.381 0.676 0.872 1.237 1.635 2.204 5.348 10.645 12.592 14.449 16.812 18.548 22.457 24.102
7 0.485 0.599 0.989 1.239 1.690 2.167 2.833 6.346 12.017 14.067 16.013 18.475 20.278 24.321 26.018
8 0.710 0.857 1.344 1.647 2.180 2.733 3.490 7.344 13.362 15.507 17.535 20.090 21.955 26.124 27.867
9 0.972 1.152 1.735 2.088 2.700 3.325 4.168 8.343 14.684 16.919 19.023 21.666 23.589 27.877 29.667
10 1.265 1.479 2.156 2.558 3.247 3.940 4.865 9.342 15.987 18.307 20.483 23.209 25.188 29.588 31.419

11 1.587 1.834 2.603 3.054 3.816 4.575 5.578 10.341 17.275 19.675 21.920 24.725 26.757 31.264 33.138
12 1.935 2.214 3.074 3.571 4.404 5.226 6.304 11.340 18.549 21.026 23.337 26.217 28.300 32.909 34.821
13 2.305 2.617 3.565 4.107 5.009 5.892 7.042 12.340 19.812 22.362 24.736 27.688 29.819 34.527 36.477
14 2.697 3.041 4.075 4.660 5.629 6.571 7.790 13.339 21.064 23.685 26.119 29.141 31.319 36.124 38.109
15 3.107 3.483 4.601 5.229 6.262 7.261 8.547 14.339 22.307 24.996 27.488 30.578 32.802 37.698 39.717

16 3.536 3.942 5.142 5.812 6.908 7.962 9.312 15.339 23.542 26.296 28.845 32.000 34.267 39.252 41.308
17 3.980 4.416 5.697 6.408 7.564 8.672 10.085 16.338 24.769 27.587 30.191 33.409 35.718 40.791 42.881
18 4.439 4.905 6.265 7.015 8.231 9.390 10.865 17.338 25.989 28.869 31.526 34.805 37.156 42.312 44.434
19 4.913 5.407 6.844 7.633 8.907 10.117 11.651 18.338 27.204 30.144 32.852 36.191 38.582 43.819 45.974
20 5.398 5.921 7.434 8.260 9.591 10.851 12.443 19.337 28.412 31.410 34.170 37.566 39.997 45.314 47.498

21 5.895 6.447 8.034 8.897 10.283 11.591 13.240 20.337 29.615 32.671 35.479 38.932 41.401 46.796 49.010
22 6.404 6.983 8.643 9.543 10.982 12.338 14.042 21.337 30.813 33.925 36.781 40.289 42.796 48.268 50.510
23 6.924 7.529 9.260 10.196 11.689 13.091 14.848 22.337 32.007 35.173 38.076 41.638 44.181 49.728 51.999
24 7.453 8.085 9.886 10.856 12.401 13.848 15.659 23.337 33.196 36.415 39.364 42.980 45.558 51.179 53.478
25 7.991 8.649 10.520 11.524 13.120 14.611 16.473 24.337 34.382 37.653 40.647 44.314 46.928 52.619 54.948

26 8.537 9.222 11.160 12.198 13.844 15.379 17.292 25.337 35.563 38.885 41.923 45.642 48.290 54.051 56.407
27 9.093 9.803 11.808 12.879 14.573 16.151 18.114 26.336 36.741 40.113 43.195 46.963 49.645 55.475 57.856
28 9.656 10.391 12.461 13.565 15.308 16.928 18.939 27.336 37.916 41.337 44.461 48.278 50.994 56.892 59.299
29 10.227 10.986 13.121 14.256 16.047 17.708 19.768 28.336 39.088 42.557 45.722 49.588 52.336 58.301 60.734
30 10.804 11.588 13.787 14.954 16.791 18.493 20.599 29.336 40.256 43.773 46.979 50.892 53.672 59.702 62.160

40 16.906 17.917 20.707 22.164 24.433 26.509 29.051 39.335 51.805 55.759 59.342 63.691 66.766 73.403 76.096
50 23.461 24.674 27.991 29.707 32.357 34.764 37.689 49.335 63.167 67.505 71.420 76.154 79.490 86.660 89.560
60 30.339 31.738 35.534 37.485 40.482 43.188 46.459 59.335 74.397 79.082 83.298 88.379 91.952 99.608 102.69
7
70 37.467 39.036 43.275 45.442 48.758 51.739 55.329 69.335 85.527 90.531 95.023 100.43 104.22 112.32 115.58
80 44.792 46.520 51.172 53.540 57.153 60.392 64.278 79.334 96.578 101.88 106.62 112.32 116.32 124.84 128.26
90 52.277 54.156 59.196 61.754 65.647 69.126 73.291 89.334 107.56 113.15 118.14 124.11 128.29 137.20 140.78
100 59.895 61.918 67.328 70.065 74.222 77.929 82.358 99.334 118.49 124.34 129.56 135.81 140.17 149.45 153.16


Jos Jabaloyes Vivas
Vicente Chirivella Gonzlez


Anexo A
-335-



DISTRIBUCIN t de Student
dt
n ) 2 / n (
) (
) n / t 1 ( ) x X ( P
x
2
1 n
2
1 n
2
}

+ +

t I
I
+ = s


n
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 16 18 20 22 24 26 28 30
0 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

0,1 0,5317 0,5353 0,5367 0,5374 0,5379 0,5382 0,5384 0,5386 0,5387 0,5388 0,5389 0,5390 0,5391 0,5391 0,5392 0,5393 0,5393 0,5394 0,5394 0,5394 0,5395 0,5395
0,2 0,5628 0,5700 0,5729 0,5744 0,5753 0,5760 0,5764 0,5768 0,5770 0,5773 0,5774 0,5776 0,5777 0,5778 0,5780 0,5781 0,5782 0,5783 0,5784 0,5785 0,5785 0,5786
0,3 0,5928 0,6038 0,6081 0,6104 0,6119 0,6129 0,6136 0,6141 0,6145 0,6148 0,6151 0,6153 0,6155 0,6157 0,6160 0,6162 0,6164 0,6165 0,6166 0,6167 0,6168 0,6169
0,4 0,6211 0,6361 0,6420 0,6452 0,6472 0,6485 0,6495 0,6502 0,6508 0,6512 0,6516 0,6519 0,6522 0,6524 0,6528 0,6531 0,6533 0,6535 0,6537 0,6538 0,6539 0,6540
0,5 0,6476 0,6667 0,6743 0,6783 0,6809 0,6826 0,6838 0,6847 0,6855 0,6861 0,6865 0,6869 0,6873 0,6876 0,6881 0,6884 0,6887 0,6890 0,6892 0,6894 0,6895 0,6896
0,6 0,6720 0,6953 0,7046 0,7096 0,7127 0,7148 0,7163 0,7174 0,7183 0,7191 0,7197 0,7202 0,7206 0,7210 0,7215 0,7220 0,7224 0,7227 0,7229 0,7231 0,7233 0,7235
0,7 0,6944 0,7218 0,7328 0,7387 0,7424 0,7449 0,7467 0,7481 0,7492 0,7501 0,7508 0,7514 0,7519 0,7523 0,7530 0,7536 0,7540 0,7544 0,7547 0,7549 0,7551 0,7553
0,8 0,7148 0,7462 0,7589 0,7657 0,7700 0,7729 0,7750 0,7766 0,7778 0,7788 0,7797 0,7804 0,7810 0,7815 0,7823 0,7829 0,7834 0,7839 0,7842 0,7845 0,7848 0,7850
0,9 0,7333 0,7684 0,7828 0,7905 0,7953 0,7986 0,8010 0,8028 0,8042 0,8054 0,8063 0,8071 0,8078 0,8083 0,8093 0,8100 0,8106 0,8111 0,8115 0,8118 0,8121 0,8124
1 0,7500 0,7887 0,8045 0,8130 0,8184 0,8220 0,8247 0,8267 0,8283 0,8296 0,8306 0,8315 0,8322 0,8329 0,8339 0,8347 0,8354 0,8359 0,8364 0,8367 0,8371 0,8373

1,1 0,7651 0,8070 0,8242 0,8335 0,8393 0,8433 0,8461 0,8483 0,8501 0,8514 0,8526 0,8535 0,8544 0,8551 0,8562 0,8571 0,8578 0,8584 0,8589 0,8593 0,8597 0,8600
1,2 0,7789 0,8235 0,8419 0,8518 0,8581 0,8623 0,8654 0,8678 0,8696 0,8711 0,8723 0,8734 0,8742 0,8750 0,8762 0,8772 0,8779 0,8785 0,8791 0,8795 0,8799 0,8802
1,3 0,7913 0,8384 0,8578 0,8683 0,8748 0,8793 0,8826 0,8851 0,8870 0,8886 0,8899 0,8910 0,8919 0,8927 0,8940 0,8950 0,8958 0,8965 0,8970 0,8975 0,8979 0,8982
1,4 0,8026 0,8518 0,8720 0,8829 0,8898 0,8945 0,8979 0,9005 0,9025 0,9041 0,9055 0,9066 0,9075 0,9084 0,9097 0,9107 0,9116 0,9123 0,9128 0,9133 0,9138 0,9141
1,5 0,8128 0,8638 0,8847 0,8960 0,9030 0,9079 0,9114 0,9140 0,9161 0,9177 0,9191 0,9203 0,9212 0,9221 0,9235 0,9245 0,9254 0,9261 0,9267 0,9272 0,9276 0,9280
1,6 0,8222 0,8746 0,8960 0,9076 0,9148 0,9196 0,9232 0,9259 0,9280 0,9297 0,9310 0,9322 0,9332 0,9340 0,9354 0,9365 0,9374 0,9381 0,9387 0,9392 0,9396 0,9400
1,7 0,8307 0,8844 0,9062 0,9178 0,9251 0,9300 0,9335 0,9362 0,9383 0,9400 0,9414 0,9426 0,9435 0,9444 0,9458 0,9468 0,9477 0,9484 0,9490 0,9495 0,9499 0,9503
1,8 0,8386 0,8932 0,9152 0,9269 0,9341 0,9390 0,9426 0,9452 0,9473 0,9490 0,9503 0,9515 0,9525 0,9533 0,9546 0,9557 0,9565 0,9572 0,9578 0,9583 0,9587 0,9590
1,9 0,8458 0,9011 0,9232 0,9349 0,9421 0,9469 0,9504 0,9530 0,9551 0,9567 0,9580 0,9591 0,9601 0,9609 0,9622 0,9632 0,9640 0,9647 0,9652 0,9657 0,9661 0,9665

2 0,8524 0,9082 0,9303 0,9419 0,9490 0,9538 0,9572 0,9597 0,9617 0,9633 0,9646 0,9657 0,9666 0,9674 0,9686 0,9696 0,9704 0,9710 0,9715 0,9720 0,9724 0,9727
2,1 0,8585 0,9147 0,9367 0,9482 0,9551 0,9598 0,9631 0,9655 0,9674 0,9690 0,9702 0,9712 0,9721 0,9728 0,9740 0,9750 0,9757 0,9763 0,9768 0,9772 0,9776 0,9779
2,2 0,8642 0,9206 0,9424 0,9537 0,9605 0,9649 0,9681 0,9705 0,9723 0,9738 0,9750 0,9759 0,9768 0,9774 0,9786 0,9794 0,9801 0,9807 0,9812 0,9816 0,9819 0,9822
2,3 0,8695 0,9259 0,9475 0,9585 0,9651 0,9694 0,9725 0,9748 0,9765 0,9779 0,9790 0,9799 0,9807 0,9813 0,9824 0,9832 0,9838 0,9843 0,9848 0,9851 0,9854 0,9857
2,4 0,8743 0,9308 0,9521 0,9628 0,9692 0,9734 0,9763 0,9784 0,9801 0,9813 0,9824 0,9832 0,9840 0,9846 0,9855 0,9863 0,9869 0,9874 0,9877 0,9881 0,9884 0,9886
2,5 0,8789 0,9352 0,9561 0,9666 0,9728 0,9767 0,9795 0,9815 0,9831 0,9843 0,9852 0,9860 0,9867 0,9873 0,9882 0,9888 0,9894 0,9898 0,9902 0,9905 0,9907 0,9909
2,6 0,8831 0,9392 0,9598 0,9700 0,9759 0,9797 0,9823 0,9842 0,9856 0,9868 0,9877 0,9884 0,9890 0,9895 0,9903 0,9910 0,9914 0,9918 0,9921 0,9924 0,9926 0,9928
2,7 0,8871 0,9429 0,9631 0,9730 0,9786 0,9822 0,9847 0,9865 0,9878 0,9888 0,9897 0,9903 0,9909 0,9914 0,9921 0,9927 0,9931 0,9935 0,9937 0,9940 0,9942 0,9944
2,8 0,8908 0,9463 0,9661 0,9756 0,9810 0,9844 0,9867 0,9884 0,9896 0,9906 0,9914 0,9920 0,9925 0,9929 0,9936 0,9941 0,9945 0,9948 0,9950 0,9952 0,9954 0,9956
2,9 0,8943 0,9494 0,9687 0,9779 0,9831 0,9863 0,9885 0,9901 0,9912 0,9921 0,9928 0,9933 0,9938 0,9942 0,9948 0,9952 0,9956 0,9958 0,9961 0,9963 0,9964 0,9965

3 0,8976 0,9523 0,9712 0,9800 0,9850 0,9880 0,9900 0,9915 0,9925 0,9933 0,9940 0,9945 0,9949 0,9952 0,9958 0,9962 0,9965 0,9967 0,9969 0,9971 0,9972 0,9973
3,1 0,9007 0,9549 0,9734 0,9819 0,9866 0,9894 0,9913 0,9927 0,9936 0,9944 0,9949 0,9954 0,9958 0,9961 0,9966 0,9969 0,9972 0,9974 0,9976 0,9977 0,9978 0,9979
3,2 0,9036 0,9573 0,9753 0,9835 0,9880 0,9907 0,9925 0,9937 0,9946 0,9953 0,9958 0,9962 0,9965 0,9968 0,9972 0,9975 0,9978 0,9979 0,9981 0,9982 0,9983 0,9984
3,3 0,9063 0,9596 0,9771 0,9850 0,9893 0,9918 0,9934 0,9946 0,9954 0,9960 0,9965 0,9968 0,9971 0,9974 0,9977 0,9980 0,9982 0,9984 0,9985 0,9986 0,9987 0,9988
3,4 0,9089 0,9617 0,9788 0,9864 0,9904 0,9928 0,9943 0,9953 0,9961 0,9966 0,9970 0,9974 0,9976 0,9978 0,9982 0,9984 0,9986 0,9987 0,9988 0,9989 0,9990 0,9990
3,5 0,9114 0,9636 0,9803 0,9876 0,9914 0,9936 0,9950 0,9960 0,9966 0,9971 0,9975 0,9978 0,9980 0,9982 0,9985 0,9987 0,9989 0,9990 0,9991 0,9992 0,9992 0,9993
3,6 0,9138 0,9654 0,9816 0,9886 0,9922 0,9943 0,9956 0,9965 0,9971 0,9976 0,9979 0,9982 0,9984 0,9986 0,9988 0,9990 0,9991 0,9992 0,9993 0,9993 0,9994 0,9994
3,7 0,9160 0,9670 0,9829 0,9896 0,9930 0,9950 0,9962 0,9970 0,9975 0,9979 0,9982 0,9985 0,9987 0,9988 0,9990 0,9992 0,9993 0,9994 0,9994 0,9995 0,9995 0,9996
3,8 0,9181 0,9686 0,9840 0,9904 0,9937 0,9955 0,9966 0,9974 0,9979 0,9983 0,9985 0,9987 0,9989 0,9990 0,9992 0,9993 0,9994 0,9995 0,9996 0,9996 0,9996 0,9997
3,9 0,9201 0,9701 0,9850 0,9912 0,9943 0,9960 0,9971 0,9977 0,9982 0,9985 0,9988 0,9989 0,9991 0,9992 0,9994 0,9995 0,9996 0,9996 0,9997 0,9997 0,9997 0,9997

4 0,9220 0,9714 0,9860 0,9919 0,9948 0,9964 0,9974 0,9980 0,9984 0,9987 0,9990 0,9991 0,9992 0,9993 0,9995 0,9996 0,9996 0,9997 0,9997 0,9998 0,9998 0,9998
4,1 0,9239 0,9727 0,9869 0,9926 0,9953 0,9968 0,9977 0,9983 0,9987 0,9989 0,9991 0,9993 0,9994 0,9995 0,9996 0,9997 0,9997 0,9998 0,9998 0,9998 0,9998 0,9999
4,2 0,9256 0,9739 0,9877 0,9932 0,9958 0,9972 0,9980 0,9985 0,9988 0,9991 0,9993 0,9994 0,9995 0,9996 0,9997 0,9997 0,9998 0,9998 0,9998 0,9999 0,9999 0,9999
4,3 0,9273 0,9750 0,9884 0,9937 0,9961 0,9975 0,9982 0,9987 0,9990 0,9992 0,9994 0,9995 0,9996 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999
4,4 0,9289 0,9760 0,9891 0,9942 0,9965 0,9977 0,9984 0,9989 0,9991 0,9993 0,9995 0,9996 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
4,5 0,9304 0,9770 0,9898 0,9946 0,9968 0,9979 0,9986 0,9990 0,9993 0,9994 0,9995 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 1,0000
4,6 0,9319 0,9779 0,9903 0,9950 0,9971 0,9982 0,9988 0,9991 0,9994 0,9995 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 1,0000 1,0000
4,7 0,9333 0,9788 0,9909 0,9953 0,9973 0,9983 0,9989 0,9992 0,9994 0,9996 0,9997 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 1,0000
4,8 0,9346 0,9796 0,9914 0,9957 0,9976 0,9985 0,9990 0,9993 0,9995 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 1,0000
4,9 0,9359 0,9804 0,9919 0,9960 0,9978 0,9986 0,9991 0,9994 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 1,0000

5 0,9372 0,9811 0,9923 0,9963 0,9979 0,9988 0,9992 0,9995 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 1,0000
5,1 0,9384 0,9818 0,9927 0,9965 0,9981 0,9989 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999
5,2 0,9395 0,9825 0,9931 0,9967 0,9983 0,9990 0,9994 0,9996 0,9997 0,9998 0,9999 0,9999 0,9999 0,9999 1,0000
5,3 0,9406 0,9831 0,9934 0,9970 0,9984 0,9991 0,9994 0,9996 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999
5,4 0,9417 0,9837 0,9938 0,9972 0,9985 0,9992 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 1,0000
5,5 0,9428 0,9842 0,9941 0,9973 0,9986 0,9992 0,9995 0,9997 0,9998 0,9999 0,9999 0,9999 0,9999
5,6 0,9438 0,9848 0,9944 0,9975 0,9987 0,9993 0,9996 0,9997 0,9998 0,9999 0,9999 0,9999 1,0000
5,7 0,9447 0,9853 0,9946 0,9977 0,9988 0,9994 0,9996 0,9998 0,9999 0,9999 0,9999 1,0000
5,8 0,9457 0,9858 0,9949 0,9978 0,9989 0,9994 0,9997 0,9998 0,9999 0,9999 0,9999
5,9 0,9466 0,9862 0,9951 0,9979 0,9990 0,9995 0,9997 0,9998 0,9999 0,9999 0,9999

6 0,9474 0,9867 0,9954 0,9981 0,9991 0,9995 0,9997 0,9998 0,9999 0,9999 1,0000
6,1 0,9483 0,9871 0,9956 0,9982 0,9991 0,9996 0,9998 0,9999 0,9999 0,9999
6,2 0,9491 0,9875 0,9958 0,9983 0,9992 0,9996 0,9998 0,9999 0,9999 0,9999
6,3 0,9499 0,9879 0,9960 0,9984 0,9993 0,9996 0,9998 0,9999 0,9999 1,0000
6,4 0,9507 0,9882 0,9961 0,9985 0,9993 0,9997 0,9998 0,9999 0,9999
6,5 0,9514 0,9886 0,9963 0,9986 0,9994 0,9997 0,9998 0,9999 0,9999
6,6 0,9521 0,9889 0,9965 0,9986 0,9994 0,9997 0,9998 0,9999 1,0000
6,7 0,9528 0,9892 0,9966 0,9987 0,9994 0,9997 0,9999 0,9999
6,8 0,9535 0,9895 0,9967 0,9988 0,9995 0,9998 0,9999 0,9999
6,9 0,9542 0,9898 0,9969 0,9988 0,9995 0,9998 0,9999 0,9999

7 0,9548 0,9901 0,9970 0,9989 0,9995 0,9998 0,9999 0,9999
7,2 0,9561 0,9906 0,9972 0,9990 0,9996 0,9998 0,9999 1,0000
7,4 0,9572 0,9911 0,9974 0,9991 0,9996 0,9998 0,9999
7,6 0,9584 0,9916 0,9976 0,9992 0,9997 0,9999 0,9999
7,8 0,9594 0,9920 0,9978 0,9993 0,9997 0,9999 0,9999
8 0,9604 0,9924 0,9980 0,9993 0,9998 0,9999
Anexo A
-336-

M Teresa Carot Snchez


DISTRIBUCIN t de Student
dt
n ) 2 / n (
) (
) n / t 1 ( ) x X ( P
x
2
1 n
2
1 n
2
}

+ +

t I
I
+ = s

n
x 35 40 45 50 55 60 65 70 75 80 85 90 95 100 110 120
0 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

0,05 0,5198 0,5198 0,5198 0,5198 0,5198 0,5199 0,5199 0,5199 0,5199 0,5199 0,5199 0,5199 0,5199 0,5199 0,5199 0,5199 0,5199
0,1 0,5395 0,5396 0,5396 0,5396 0,5396 0,5397 0,5397 0,5397 0,5397 0,5397 0,5397 0,5397 0,5397 0,5397 0,5397 0,5397 0,5398
0,15 0,5592 0,5592 0,5593 0,5593 0,5593 0,5594 0,5594 0,5594 0,5594 0,5594 0,5594 0,5594 0,5595 0,5595 0,5595 0,5595 0,5596
0,2 0,5787 0,5788 0,5788 0,5789 0,5789 0,5789 0,5789 0,5790 0,5790 0,5790 0,5790 0,5790 0,5790 0,5791 0,5791 0,5791 0,5793
0,25 0,5980 0,5981 0,5981 0,5982 0,5982 0,5983 0,5983 0,5983 0,5984 0,5984 0,5984 0,5984 0,5984 0,5984 0,5985 0,5985 0,5987
0,3 0,6170 0,6171 0,6172 0,6173 0,6173 0,6174 0,6174 0,6175 0,6175 0,6175 0,6175 0,6176 0,6176 0,6176 0,6176 0,6177 0,6179
0,35 0,6358 0,6359 0,6360 0,6361 0,6362 0,6362 0,6363 0,6363 0,6363 0,6364 0,6364 0,6364 0,6364 0,6365 0,6365 0,6365 0,6368
0,4 0,6542 0,6544 0,6545 0,6546 0,6546 0,6547 0,6548 0,6548 0,6549 0,6549 0,6549 0,6549 0,6550 0,6550 0,6550 0,6551 0,6554
0,45 0,6723 0,6724 0,6726 0,6727 0,6728 0,6728 0,6729 0,6729 0,6730 0,6730 0,6731 0,6731 0,6731 0,6732 0,6732 0,6732 0,6736
0,5 0,6899 0,6901 0,6902 0,6904 0,6905 0,6905 0,6906 0,6907 0,6907 0,6908 0,6908 0,6909 0,6909 0,6909 0,6910 0,6910 0,6915
0,55 0,7071 0,7073 0,7075 0,7076 0,7077 0,7078 0,7079 0,7080 0,7080 0,7081 0,7081 0,7082 0,7082 0,7082 0,7083 0,7083 0,7088
0,6 0,7238 0,7241 0,7242 0,7244 0,7245 0,7246 0,7247 0,7248 0,7248 0,7249 0,7249 0,7250 0,7250 0,7251 0,7251 0,7252 0,7258
0,65 0,7400 0,7403 0,7405 0,7407 0,7408 0,7409 0,7410 0,7411 0,7412 0,7412 0,7413 0,7413 0,7414 0,7414 0,7415 0,7415 0,7422
0,7 0,7557 0,7560 0,7562 0,7564 0,7566 0,7567 0,7568 0,7569 0,7570 0,7570 0,7571 0,7571 0,7572 0,7572 0,7573 0,7574 0,7580
0,75 0,7709 0,7712 0,7714 0,7716 0,7718 0,7719 0,7720 0,7721 0,7722 0,7723 0,7723 0,7724 0,7724 0,7725 0,7726 0,7726 0,7734
0,8 0,7854 0,7858 0,7860 0,7863 0,7864 0,7866 0,7867 0,7868 0,7869 0,7870 0,7870 0,7871 0,7871 0,7872 0,7873 0,7874 0,7881
0,85 0,7994 0,7998 0,8001 0,8003 0,8005 0,8006 0,8008 0,8009 0,8010 0,8011 0,8011 0,8012 0,8013 0,8013 0,8014 0,8015 0,8023
0,9 0,8129 0,8132 0,8135 0,8138 0,8140 0,8141 0,8143 0,8144 0,8145 0,8146 0,8147 0,8147 0,8148 0,8149 0,8150 0,8150 0,8159
0,95 0,8257 0,8261 0,8264 0,8267 0,8269 0,8270 0,8272 0,8273 0,8274 0,8275 0,8276 0,8277 0,8277 0,8278 0,8279 0,8280 0,8289

1 0,8379 0,8383 0,8387 0,8389 0,8392 0,8393 0,8395 0,8396 0,8397 0,8398 0,8399 0,8400 0,8401 0,8401 0,8402 0,8403 0,8414
1,05 0,8495 0,8500 0,8503 0,8506 0,8508 0,8510 0,8512 0,8513 0,8515 0,8516 0,8517 0,8517 0,8518 0,8519 0,8520 0,8521 0,8531
1,1 0,8606 0,8610 0,8614 0,8617 0,8619 0,8621 0,8623 0,8624 0,8626 0,8627 0,8628 0,8629 0,8629 0,8630 0,8631 0,8632 0,8643
1,15 0,8710 0,8715 0,8719 0,8722 0,8724 0,8726 0,8728 0,8730 0,8731 0,8732 0,8733 0,8734 0,8735 0,8736 0,8737 0,8738 0,8749
1,2 0,8809 0,8814 0,8818 0,8821 0,8824 0,8826 0,8828 0,8829 0,8830 0,8832 0,8833 0,8834 0,8834 0,8835 0,8836 0,8837 0,8849
1,25 0,8902 0,8907 0,8911 0,8914 0,8917 0,8919 0,8921 0,8923 0,8924 0,8925 0,8926 0,8927 0,8928 0,8929 0,8930 0,8931 0,8944
1,3 0,8990 0,8995 0,8999 0,9002 0,9005 0,9007 0,9009 0,9011 0,9012 0,9013 0,9014 0,9015 0,9016 0,9017 0,9018 0,9020 0,9032
1,35 0,9072 0,9077 0,9081 0,9085 0,9087 0,9090 0,9092 0,9093 0,9095 0,9096 0,9097 0,9098 0,9099 0,9100 0,9101 0,9102 0,9115
1,4 0,9148 0,9154 0,9158 0,9162 0,9164 0,9167 0,9169 0,9170 0,9172 0,9173 0,9174 0,9175 0,9176 0,9177 0,9178 0,9180 0,9193
1,45 0,9220 0,9226 0,9230 0,9233 0,9236 0,9239 0,9241 0,9242 0,9244 0,9245 0,9246 0,9247 0,9248 0,9249 0,9250 0,9252 0,9265
1,5 0,9287 0,9293 0,9297 0,9300 0,9303 0,9306 0,9308 0,9309 0,9311 0,9312 0,9313 0,9314 0,9315 0,9316 0,9318 0,9319 0,9332
1,55 0,9349 0,9355 0,9359 0,9363 0,9366 0,9368 0,9370 0,9372 0,9373 0,9375 0,9376 0,9377 0,9378 0,9378 0,9380 0,9381 0,9394
1,6 0,9407 0,9413 0,9417 0,9421 0,9423 0,9426 0,9428 0,9429 0,9431 0,9432 0,9433 0,9434 0,9435 0,9436 0,9438 0,9439 0,9452
1,65 0,9461 0,9466 0,9470 0,9474 0,9477 0,9479 0,9481 0,9483 0,9484 0,9486 0,9487 0,9488 0,9489 0,9490 0,9491 0,9492 0,9505
1,7 0,9510 0,9516 0,9520 0,9523 0,9526 0,9528 0,9530 0,9532 0,9534 0,9535 0,9536 0,9537 0,9538 0,9539 0,9540 0,9541 0,9554
1,75 0,9556 0,9561 0,9565 0,9569 0,9572 0,9574 0,9576 0,9577 0,9579 0,9580 0,9581 0,9582 0,9583 0,9584 0,9585 0,9587 0,9599
1,8 0,9598 0,9603 0,9607 0,9611 0,9613 0,9616 0,9617 0,9619 0,9621 0,9622 0,9623 0,9624 0,9625 0,9626 0,9627 0,9628 0,9641
1,85 0,9636 0,9641 0,9646 0,9649 0,9652 0,9654 0,9656 0,9657 0,9659 0,9660 0,9661 0,9662 0,9663 0,9664 0,9665 0,9666 0,9678
1,9 0,9672 0,9677 0,9681 0,9684 0,9687 0,9689 0,9691 0,9692 0,9694 0,9695 0,9696 0,9697 0,9698 0,9698 0,9700 0,9701 0,9713
1,95 0,9704 0,9709 0,9713 0,9716 0,9719 0,9721 0,9723 0,9724 0,9725 0,9727 0,9728 0,9729 0,9729 0,9730 0,9731 0,9732 0,9744

2 0,9733 0,9738 0,9742 0,9745 0,9748 0,9750 0,9752 0,9753 0,9754 0,9756 0,9757 0,9757 0,9758 0,9759 0,9760 0,9761 0,9772
2,05 0,9760 0,9765 0,9769 0,9772 0,9774 0,9776 0,9778 0,9779 0,9781 0,9782 0,9783 0,9784 0,9784 0,9785 0,9786 0,9787 0,9798
2,1 0,9785 0,9790 0,9793 0,9796 0,9798 0,9800 0,9802 0,9803 0,9805 0,9806 0,9807 0,9807 0,9808 0,9809 0,9810 0,9811 0,9821
2,15 0,9807 0,9812 0,9815 0,9818 0,9820 0,9822 0,9824 0,9825 0,9826 0,9827 0,9828 0,9829 0,9830 0,9830 0,9831 0,9832 0,9842
2,2 0,9827 0,9832 0,9835 0,9838 0,9840 0,9842 0,9843 0,9844 0,9846 0,9847 0,9847 0,9848 0,9849 0,9849 0,9851 0,9851 0,9861
2,25 0,9846 0,9850 0,9853 0,9856 0,9858 0,9859 0,9861 0,9862 0,9863 0,9864 0,9865 0,9866 0,9866 0,9867 0,9868 0,9869 0,9878
2,3 0,9862 0,9866 0,9869 0,9872 0,9874 0,9875 0,9877 0,9878 0,9879 0,9880 0,9881 0,9881 0,9882 0,9882 0,9883 0,9884 0,9893
2,35 0,9877 0,9881 0,9884 0,9886 0,9888 0,9890 0,9891 0,9892 0,9893 0,9894 0,9895 0,9895 0,9896 0,9896 0,9897 0,9898 0,9906
2,4 0,9891 0,9894 0,9897 0,9899 0,9901 0,9902 0,9904 0,9905 0,9906 0,9906 0,9907 0,9908 0,9908 0,9909 0,9910 0,9910 0,9918
2,45 0,9903 0,9906 0,9909 0,9911 0,9913 0,9914 0,9915 0,9916 0,9917 0,9918 0,9918 0,9919 0,9919 0,9920 0,9921 0,9921 0,9929
2,5 0,9914 0,9917 0,9919 0,9921 0,9923 0,9924 0,9925 0,9926 0,9927 0,9928 0,9928 0,9929 0,9929 0,9930 0,9931 0,9931 0,9938
2,55 0,9923 0,9926 0,9929 0,9931 0,9932 0,9933 0,9934 0,9935 0,9936 0,9937 0,9937 0,9938 0,9938 0,9939 0,9939 0,9940 0,9946
2,6 0,9932 0,9935 0,9937 0,9939 0,9940 0,9941 0,9942 0,9943 0,9944 0,9945 0,9945 0,9946 0,9946 0,9946 0,9947 0,9948 0,9953
2,65 0,9940 0,9943 0,9945 0,9946 0,9948 0,9949 0,9950 0,9950 0,9951 0,9952 0,9952 0,9952 0,9953 0,9953 0,9954 0,9954 0,9960
2,7 0,9947 0,9949 0,9951 0,9953 0,9954 0,9955 0,9956 0,9957 0,9957 0,9958 0,9958 0,9959 0,9959 0,9959 0,9960 0,9960 0,9965
2,75 0,9953 0,9955 0,9957 0,9959 0,9960 0,9961 0,9961 0,9962 0,9963 0,9963 0,9964 0,9964 0,9964 0,9965 0,9965 0,9966 0,9970
2,8 0,9959 0,9961 0,9962 0,9964 0,9965 0,9966 0,9966 0,9967 0,9968 0,9968 0,9968 0,9969 0,9969 0,9969 0,9970 0,9970 0,9974
2,85 0,9964 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9971 0,9972 0,9972 0,9973 0,9973 0,9973 0,9973 0,9974 0,9974 0,9978
2,9 0,9968 0,9970 0,9971 0,9972 0,9973 0,9974 0,9975 0,9975 0,9976 0,9976 0,9976 0,9977 0,9977 0,9977 0,9977 0,9978 0,9981
2,95 0,9972 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9978 0,9979 0,9979 0,9979 0,9980 0,9980 0,9980 0,9981 0,9981 0,9984

3 0,9975 0,9977 0,9978 0,9979 0,9980 0,9980 0,9981 0,9981 0,9982 0,9982 0,9982 0,9983 0,9983 0,9983 0,9983 0,9984 0,9987
3,05 0,9978 0,9980 0,9981 0,9982 0,9982 0,9983 0,9983 0,9984 0,9984 0,9984 0,9985 0,9985 0,9985 0,9985 0,9986 0,9986 0,9989
3,1 0,9981 0,9982 0,9983 0,9984 0,9985 0,9985 0,9986 0,9986 0,9986 0,9987 0,9987 0,9987 0,9987 0,9987 0,9988 0,9988 0,9990
3,15 0,9983 0,9985 0,9985 0,9986 0,9987 0,9987 0,9988 0,9988 0,9988 0,9989 0,9989 0,9989 0,9989 0,9989 0,9989 0,9990 0,9992
3,2 0,9985 0,9987 0,9987 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 0,9990 0,9990 0,9991 0,9991 0,9991 0,9991 0,9991 0,9993
3,25 0,9987 0,9988 0,9989 0,9990 0,9990 0,9991 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9992 0,9992 0,9993 0,9994
3,3 0,9989 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9993 0,9993 0,9993 0,9993 0,9993 0,9993 0,9993 0,9994 0,9995
3,35 0,9990 0,9991 0,9992 0,9992 0,9993 0,9993 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9996
3,4 0,9992 0,9992 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 0,9995 0,9995 0,9995 0,9995 0,9995 0,9997
3,45 0,9993 0,9993 0,9994 0,9994 0,9995 0,9995 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,5 0,9994 0,9994 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 0,9997 0,9997 0,9998
3,55 0,9994 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,6 0,9995 0,9996 0,9996 0,9996 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 0,9998 0,9998 0,9998
3,65 0,9996 0,9996 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9999
3,7 0,9996 0,9997 0,9997 0,9997 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9999
3,75 0,9997 0,9997 0,9997 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999
3,8 0,9997 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 0,9998 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 1,0000
4 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999

Anexo A
-337-
M Teresa Carot Snchez

DISTRIBUCIN t de Student


dt
n ) (
) (
)
n
t
1 ( ) x X ( P
x
2
n
2
1 n
2
1 n 2
}

+ +

t I
I
+ = >
o
tn
(o)



Probabilidad de una cola
n 0.0005 0.001 0.005 0.01 0.025 0.05 0.1 0.2 0.25 0.3 0.4 0.45 0.475

1 636.578 318.289 63.656 31.821 12.706 6.314 3.078 1.376 1.000 0.727 0.325 0.158 0.079
2 31.600 22.328 9.925 6.965 4.303 2.920 1.886 1.061 0.816 0.617 0.289 0.142 0.071
3 12.924 10.214 5.841 4.541 3.182 2.353 1.638 0.978 0.765 0.584 0.277 0.137 0.068
4 8.610 7.173 4.604 3.747 2.776 2.132 1.533 0.941 0.741 0.569 0.271 0.134 0.067
5 6.869 5.894 4.032 3.365 2.571 2.015 1.476 0.920 0.727 0.559 0.267 0.132 0.066

6 5.959 5.208 3.707 3.143 2.447 1.943 1.440 0.906 0.718 0.553 0.265 0.131 0.065
7 5.408 4.785 3.499 2.998 2.365 1.895 1.415 0.896 0.711 0.549 0.263 0.130 0.065
8 5.041 4.501 3.355 2.896 2.306 1.860 1.397 0.889 0.706 0.546 0.262 0.130 0.065
9 4.781 4.297 3.250 2.821 2.262 1.833 1.383 0.883 0.703 0.543 0.261 0.129 0.064
10 4.587 4.144 3.169 2.764 2.228 1.812 1.372 0.879 0.700 0.542 0.260 0.129 0.064

11 4.437 4.025 3.106 2.718 2.201 1.796 1.363 0.876 0.697 0.540 0.260 0.129 0.064
12 4.318 3.930 3.055 2.681 2.179 1.782 1.356 0.873 0.695 0.539 0.259 0.128 0.064
13 4.221 3.852 3.012 2.650 2.160 1.771 1.350 0.870 0.694 0.538 0.259 0.128 0.064
14 4.140 3.787 2.977 2.624 2.145 1.761 1.345 0.868 0.692 0.537 0.258 0.128 0.064
15 4.073 3.733 2.947 2.602 2.131 1.753 1.341 0.866 0.691 0.536 0.258 0.128 0.064

16 4.015 3.686 2.921 2.583 2.120 1.746 1.337 0.865 0.690 0.535 0.258 0.128 0.064
17 3.965 3.646 2.898 2.567 2.110 1.740 1.333 0.863 0.689 0.534 0.257 0.128 0.064
18 3.922 3.610 2.878 2.552 2.101 1.734 1.330 0.862 0.688 0.534 0.257 0.127 0.064
19 3.883 3.579 2.861 2.539 2.093 1.729 1.328 0.861 0.688 0.533 0.257 0.127 0.064
20 3.850 3.552 2.845 2.528 2.086 1.725 1.325 0.860 0.687 0.533 0.257 0.127 0.063

21 3.819 3.527 2.831 2.518 2.080 1.721 1.323 0.859 0.686 0.532 0.257 0.127 0.063
22 3.792 3.505 2.819 2.508 2.074 1.717 1.321 0.858 0.686 0.532 0.256 0.127 0.063
23 3.768 3.485 2.807 2.500 2.069 1.714 1.319 0.858 0.685 0.532 0.256 0.127 0.063
24 3.745 3.467 2.797 2.492 2.064 1.711 1.318 0.857 0.685 0.531 0.256 0.127 0.063
25 3.725 3.450 2.787 2.485 2.060 1.708 1.316 0.856 0.684 0.531 0.256 0.127 0.063

26 3.707 3.435 2.779 2.479 2.056 1.706 1.315 0.856 0.684 0.531 0.256 0.127 0.063
27 3.689 3.421 2.771 2.473 2.052 1.703 1.314 0.855 0.684 0.531 0.256 0.127 0.063
28 3.674 3.408 2.763 2.467 2.048 1.701 1.313 0.855 0.683 0.530 0.256 0.127 0.063
29 3.660 3.396 2.756 2.462 2.045 1.699 1.311 0.854 0.683 0.530 0.256 0.127 0.063
30 3.646 3.385 2.750 2.457 2.042 1.697 1.310 0.854 0.683 0.530 0.256 0.127 0.063

40 3.551 3.307 2.704 2.423 2.021 1.684 1.303 0.851 0.681 0.529 0.255 0.126 0.063
60 3.460 3.232 2.660 2.390 2.000 1.671 1.296 0.848 0.679 0.527 0.254 0.126 0.063
120 3.373 3.160 2.617 2.358 1.980 1.658 1.289 0.845 0.677 0.526 0.254 0.126 0.063
3.290 3.090 2.576 2.326 1.960 1.645 1.282 0.842 0.674 0.524 0.253 0.126 0.063

n 0.001 0.002 0.01 0.02 0.05 0.1 0.2 0.4 0.5 0.6 0.8 0.9 0.95

Probabilidad de dos colas

Jos Jabaloyes Vivas
Vicente Chirivella Gonzlez

Anexo A
-338-
DISTRIBUCIN F de snedecor


dt
) t n n ( ) (
t n n
) x X ( P
x
2
n n
1 2 2
2
n
,
2
1
n
1
2
n
2
n
2
2
n
1
2 1
1 2 1
}

+ |
= >


F
n n
1 2
,
( ) o
o


Grados de libertad de la varianza mayor (n1)
1 2 3 4 5 6 7 8
p 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01

1 161.45 4052.2 199.50 4999.3 215.71 5403.5 224.58 5624.3 230.16 5763.9 233.99 5858.9 236.77 5928.3 238.88 5980.9
2 18.51 98.50 19.00 99.00 19.16 99.16 19.25 99.25 19.30 99.30 19.33 99.33 19.35 99.36 19.37 99.38
3 10.13 34.12 9.55 30.82 9.28 29.46 9.12 28.71 9.01 28.24 8.94 27.91 8.89 27.67 8.85 27.49
4 7.71 21.20 6.94 18.00 6.59 16.69 6.39 15.98 6.26 15.52 6.16 15.21 6.09 14.98 6.04 14.80
5 6.61 16.26 5.79 13.27 5.41 12.06 5.19 11.39 5.05 10.97 4.95 10.67 4.88 10.46 4.82 10.29
6 5.99 13.75 5.14 10.92 4.76 9.78 4.53 9.15 4.39 8.75 4.28 8.47 4.21 8.26 4.15 8.10
7 5.59 12.25 4.74 9.55 4.35 8.45 4.12 7.85 3.97 7.46 3.87 7.19 3.79 6.99 3.73 6.84
8 5.32 11.26 4.46 8.65 4.07 7.59 3.84 7.01 3.69 6.63 3.58 6.37 3.50 6.18 3.44 6.03
9 5.12 10.56 4.26 8.02 3.86 6.99 3.63 6.42 3.48 6.06 3.37 5.80 3.29 5.61 3.23 5.47

10 4.96 10.04 4.10 7.56 3.71 6.55 3.48 5.99 3.33 5.64 3.22 5.39 3.14 5.20 3.07 5.06
11 4.84 9.65 3.98 7.21 3.59 6.22 3.36 5.67 3.20 5.32 3.09 5.07 3.01 4.89 2.95 4.74
12 4.75 9.33 3.89 6.93 3.49 5.95 3.26 5.41 3.11 5.06 3.00 4.82 2.91 4.64 2.85 4.50
13 4.67 9.07 3.81 6.70 3.41 5.74 3.18 5.21 3.03 4.86 2.92 4.62 2.83 4.44 2.77 4.30
14 4.60 8.86 3.74 6.51 3.34 5.56 3.11 5.04 2.96 4.69 2.85 4.46 2.76 4.28 2.70 4.14
15 4.54 8.68 3.68 6.36 3.29 5.42 3.06 4.89 2.90 4.56 2.79 4.32 2.71 4.14 2.64 4.00
16 4.49 8.53 3.63 6.23 3.24 5.29 3.01 4.77 2.85 4.44 2.74 4.20 2.66 4.03 2.59 3.89
17 4.45 8.40 3.59 6.11 3.20 5.19 2.96 4.67 2.81 4.34 2.70 4.10 2.61 3.93 2.55 3.79
18 4.41 8.29 3.55 6.01 3.16 5.09 2.93 4.58 2.77 4.25 2.66 4.01 2.58 3.84 2.51 3.71
19 4.38 8.18 3.52 5.93 3.13 5.01 2.90 4.50 2.74 4.17 2.63 3.94 2.54 3.77 2.48 3.63

20 4.35 8.10 3.49 5.85 3.10 4.94 2.87 4.43 2.71 4.10 2.60 3.87 2.51 3.70 2.45 3.56
21 4.32 8.02 3.47 5.78 3.07 4.87 2.84 4.37 2.68 4.04 2.57 3.81 2.49 3.64 2.42 3.51
22 4.30 7.95 3.44 5.72 3.05 4.82 2.82 4.31 2.66 3.99 2.55 3.76 2.46 3.59 2.40 3.45
23 4.28 7.88 3.42 5.66 3.03 4.76 2.80 4.26 2.64 3.94 2.53 3.71 2.44 3.54 2.37 3.41
24 4.26 7.82 3.40 5.61 3.01 4.72 2.78 4.22 2.62 3.90 2.51 3.67 2.42 3.50 2.36 3.36
25 4.24 7.77 3.39 5.57 2.99 4.68 2.76 4.18 2.60 3.85 2.49 3.63 2.40 3.46 2.34 3.32
26 4.23 7.72 3.37 5.53 2.98 4.64 2.74 4.14 2.59 3.82 2.47 3.59 2.39 3.42 2.32 3.29
27 4.21 7.68 3.35 5.49 2.96 4.60 2.73 4.11 2.57 3.78 2.46 3.56 2.37 3.39 2.31 3.26
28 4.20 7.64 3.34 5.45 2.95 4.57 2.71 4.07 2.56 3.75 2.45 3.53 2.36 3.36 2.29 3.23
29 4.18 7.60 3.33 5.42 2.93 4.54 2.70 4.04 2.55 3.73 2.43 3.50 2.35 3.33 2.28 3.20

30 4.17 7.56 3.32 5.39 2.92 4.51 2.69 4.02 2.53 3.70 2.42 3.47 2.33 3.30 2.27 3.17
31 4.16 7.53 3.30 5.36 2.91 4.48 2.68 3.99 2.52 3.67 2.41 3.45 2.32 3.28 2.25 3.15
32 4.15 7.50 3.29 5.34 2.90 4.46 2.67 3.97 2.51 3.65 2.40 3.43 2.31 3.26 2.24 3.13
33 4.14 7.47 3.28 5.31 2.89 4.44 2.66 3.95 2.50 3.63 2.39 3.41 2.30 3.24 2.23 3.11
34 4.13 7.44 3.28 5.29 2.88 4.42 2.65 3.93 2.49 3.61 2.38 3.39 2.29 3.22 2.23 3.09
38 4.10 7.35 3.24 5.21 2.85 4.34 2.62 3.86 2.46 3.54 2.35 3.32 2.26 3.15 2.19 3.02
42 4.07 7.28 3.22 5.15 2.83 4.29 2.59 3.80 2.44 3.49 2.32 3.27 2.24 3.10 2.17 2.97
46 4.05 7.22 3.20 5.10 2.81 4.24 2.57 3.76 2.42 3.44 2.30 3.22 2.22 3.06 2.15 2.93
50 4.03 7.17 3.18 5.06 2.79 4.20 2.56 3.72 2.40 3.41 2.29 3.19 2.20 3.02 2.13 2.89
60 4.00 7.08 3.15 4.98 2.76 4.13 2.53 3.65 2.37 3.34 2.25 3.12 2.17 2.95 2.10 2.82

80 3.96 6.96 3.11 4.88 2.72 4.04 2.49 3.56 2.33 3.26 2.21 3.04 2.13 2.87 2.06 2.74
100 3.94 6.90 3.09 4.82 2.70 3.98 2.46 3.51 2.31 3.21 2.19 2.99 2.10 2.82 2.03 2.69
200 3.89 6.76 3.04 4.71 2.65 3.88 2.42 3.41 2.26 3.11 2.14 2.89 2.06 2.73 1.98 2.60
1000 3.85 6.66 3.00 4.63 2.61 3.80 2.38 3.34 2.22 3.04 2.11 2.82 2.02 2.66 1.95 2.53
3.84 6.63 3.00 4.61 2.60 3.78 2.37 3.32 2.21 3.02 2.10 2.80 2.01 2.64 1.94 2.51

NOTA: Los valores de la

para 1- son los mismos que los de

para .
Anexo A
-339-
DISTRIBUCIN F de Snedecor
(Continuacin)


dt
) t n n ( ) (
t n n
) x X ( P
x
2
n n
1 2 2
2
n
,
2
1
n
1
2
n
2
n
2
2
n
1
2 1
1 2 1
}

+ |
= >

F
n n
1 2
,
( ) o
o


Grados de libertad de la varianza mayor (n1)
10 12 16 20 30 50 100
p 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01

1 241.88 6055.9 243.90 6106.7 246.47 6170.0 248.02 6208.7 250.10 6260.4 251.77 6302.3 253.04 6333.9 254.31 6365.6
2 19.40 99.40 19.41 99.42 19.43 99.44 19.45 99.45 19.46 99.47 19.48 99.48 19.49 99.49 19.50 99.50
3 8.79 27.23 8.74 27.05 8.69 26.83 8.66 26.69 8.62 26.50 8.58 26.35 8.55 26.24 8.53 26.13
4 5.96 14.55 5.91 14.37 5.84 14.15 5.80 14.02 5.75 13.84 5.70 13.69 5.66 13.58 5.63 13.46
5 4.74 10.05 4.68 9.89 4.60 9.68 4.56 9.55 4.50 9.38 4.44 9.24 4.41 9.13 4.37 9.02
6 4.06 7.87 4.00 7.72 3.92 7.52 3.87 7.40 3.81 7.23 3.75 7.09 3.71 6.99 3.67 6.88
7 3.64 6.62 3.57 6.47 3.49 6.28 3.44 6.16 3.38 5.99 3.32 5.86 3.27 5.75 3.23 5.65
8 3.35 5.81 3.28 5.67 3.20 5.48 3.15 5.36 3.08 5.20 3.02 5.07 2.97 4.96 2.93 4.86
9 3.14 5.26 3.07 5.11 2.99 4.92 2.94 4.81 2.86 4.65 2.80 4.52 2.76 4.41 2.71 4.31

10 2.98 4.85 2.91 4.71 2.83 4.52 2.77 4.41 2.70 4.25 2.64 4.12 2.59 4.01 2.54 3.91
11 2.85 4.54 2.79 4.40 2.70 4.21 2.65 4.10 2.57 3.94 2.51 3.81 2.46 3.71 2.40 3.60
12 2.75 4.30 2.69 4.16 2.60 3.97 2.54 3.86 2.47 3.70 2.40 3.57 2.35 3.47 2.30 3.36
13 2.67 4.10 2.60 3.96 2.51 3.78 2.46 3.66 2.38 3.51 2.31 3.38 2.26 3.27 2.21 3.17
14 2.60 3.94 2.53 3.80 2.44 3.62 2.39 3.51 2.31 3.35 2.24 3.22 2.19 3.11 2.13 3.00
15 2.54 3.80 2.48 3.67 2.38 3.49 2.33 3.37 2.25 3.21 2.18 3.08 2.12 2.98 2.07 2.87
16 2.49 3.69 2.42 3.55 2.33 3.37 2.28 3.26 2.19 3.10 2.12 2.97 2.07 2.86 2.01 2.75
17 2.45 3.59 2.38 3.46 2.29 3.27 2.23 3.16 2.15 3.00 2.08 2.87 2.02 2.76 1.96 2.65
18 2.41 3.51 2.34 3.37 2.25 3.19 2.19 3.08 2.11 2.92 2.04 2.78 1.98 2.68 1.92 2.57
19 2.38 3.43 2.31 3.30 2.21 3.12 2.16 3.00 2.07 2.84 2.00 2.71 1.94 2.60 1.88 2.49

20 2.35 3.37 2.28 3.23 2.18 3.05 2.12 2.94 2.04 2.78 1.97 2.64 1.91 2.54 1.84 2.42
21 2.32 3.31 2.25 3.17 2.16 2.99 2.10 2.88 2.01 2.72 1.94 2.58 1.88 2.48 1.81 2.36
22 2.30 3.26 2.23 3.12 2.13 2.94 2.07 2.83 1.98 2.67 1.91 2.53 1.85 2.42 1.78 2.31
23 2.27 3.21 2.20 3.07 2.11 2.89 2.05 2.78 1.96 2.62 1.88 2.48 1.82 2.37 1.76 2.26
24 2.25 3.17 2.18 3.03 2.09 2.85 2.03 2.74 1.94 2.58 1.86 2.44 1.80 2.33 1.73 2.21
25 2.24 3.13 2.16 2.99 2.07 2.81 2.01 2.70 1.92 2.54 1.84 2.40 1.78 2.29 1.71 2.17
26 2.22 3.09 2.15 2.96 2.05 2.78 1.99 2.66 1.90 2.50 1.82 2.36 1.76 2.25 1.69 2.13
27 2.20 3.06 2.13 2.93 2.04 2.75 1.97 2.63 1.88 2.47 1.81 2.33 1.74 2.22 1.67 2.10
28 2.19 3.03 2.12 2.90 2.02 2.72 1.96 2.60 1.87 2.44 1.79 2.30 1.73 2.19 1.65 2.06
29 2.18 3.00 2.10 2.87 2.01 2.69 1.94 2.57 1.85 2.41 1.77 2.27 1.71 2.16 1.64 2.03

30 2.16 2.98 2.09 2.84 1.99 2.66 1.93 2.55 1.84 2.39 1.76 2.25 1.70 2.13 1.62 2.01
31 2.15 2.96 2.08 2.82 1.98 2.64 1.92 2.52 1.83 2.36 1.75 2.22 1.68 2.11 1.61 1.98
32 2.14 2.93 2.07 2.80 1.97 2.62 1.91 2.50 1.82 2.34 1.74 2.20 1.67 2.08 1.59 1.96
33 2.13 2.91 2.06 2.78 1.96 2.60 1.90 2.48 1.81 2.32 1.72 2.18 1.66 2.06 1.58 1.93
34 2.12 2.89 2.05 2.76 1.95 2.58 1.89 2.46 1.80 2.30 1.71 2.16 1.65 2.04 1.57 1.91
38 2.09 2.83 2.02 2.69 1.92 2.51 1.85 2.40 1.76 2.23 1.68 2.09 1.61 1.97 1.53 1.84
42 2.06 2.78 1.99 2.64 1.89 2.46 1.83 2.34 1.73 2.18 1.65 2.03 1.57 1.91 1.49 1.78
46 2.04 2.73 1.97 2.60 1.87 2.42 1.80 2.30 1.71 2.13 1.62 1.99 1.55 1.86 1.46 1.73
50 2.03 2.70 1.95 2.56 1.85 2.38 1.78 2.27 1.69 2.10 1.60 1.95 1.52 1.82 1.44 1.68

60 1.99 2.63 1.92 2.50 1.82 2.31 1.75 2.20 1.65 2.03 1.56 1.88 1.48 1.75 1.39 1.60
80 1.95 2.55 1.88 2.42 1.77 2.23 1.70 2.12 1.60 1.94 1.51 1.79 1.43 1.65 1.32 1.49
100 1.93 2.50 1.85 2.37 1.75 2.19 1.68 2.07 1.57 1.89 1.48 1.74 1.39 1.60 1.28 1.43
200 1.88 2.41 1.80 2.27 1.69 2.09 1.62 1.97 1.52 1.79 1.41 1.63 1.32 1.48 1.19 1.28
1000 1.84 2.34 1.76 2.20 1.65 2.02 1.58 1.90 1.47 1.72 1.36 1.54 1.26 1.38 1.08 1.11
1.83 2.32 1.75 2.18 1.64 2.00 1.57 1.88 1.46 1.70 1.35 1.52 1.24 1.36 1.01 1.01

NOTA: Los valores de la

para 1- son los mismos que los de

para .

Jos Jabaloyes Vivas y Vicente Chirivella Gonzlez
Anexo A
-340-

Bibliografa
-341-

BIBLIOGRAFA

PEA, DANIEL (1986), Estadstica, modelos y mtodos. Vol. 1 Fundamentos, Alianza
Universidad Textos, Madrid.

MONTGOMERY, DOUGLAS C. Y RUNGER, GEORGE C, (2003), Probabilidad y estadstica
aplicadas a la ingeniera, Limusa-Wiley, Mxico.

ROMERO, RAFAEL Y ZNICA, LUISA ROSA (2008), Mtodos estadsticos e ingeniera,
Editorial UPV- 637, Valencia.

Formulario y tablas de estadstica, Editorial UPV n 104, Valencia.

También podría gustarte