Está en la página 1de 272

INSTITUTO TECNOLGICO SUPERIOR

de Acayucan


Asignatura: Probabilidad y estadstica
Clave de la asignatura: SCC - 0424
Carrera: Ingeniera en Sistemas Computacionales


A N T O L O G I A

Presenta:
ING. ULISES GIRON JIMENEZ




ACAYUCAN, VER. J UNIO 2008

Probabilidad y Estadstica

Ing. Ulises Girn J imnez


III

INDICE





UNIDAD 1














OBJETIVO GENERAL...............................................................................

JUSTIFICACION........................................................................................


ESTADISTICA DESCRIPTIVA.........
1.1 Conceptos bsicos de estadstica.......................
1.1.1 Definicin de estadstica.............................................................
1.1.2 Inferencia estadstica..................................................................
1.1.3 Teora de decisin......................................................................
1.1.4 Poblacin....................................................................................
1.1.5 Muestra aleatoria........................................................................
1.1.6 Parmetros aleatorios.................................................................
1.1.7 Enfoque clsico...........................................................................
1.1.8 Enfoque Bayesiano.....................................................................
1.2 Descripcin de datos.....
1.2.1 Datos agrupados y no agrupados...............................................
1.2.2 Frecuencia de clase....................................................................
1.2.3 Frecuencia relativa......................................................................
1.2.4 Punto medio................................................................................
10

11
12
13
13
16
16
16
20
20
20
21
22
22
22
22
23
IV























1.2.5 Lmites........................................................................................
1.2.6 Histograma..................................................................................
1.2.7 Histograma de frecuencia relativa..............................................
1.3 Medidas de tendencia central
1.3.1 Media aritmtica, geomtrica y ponderada.................................
1.3.2 Mediana......................................................................................
1.3.3 Moda...........................................................................................
1.4 Medidas de dispersin.
1.4.1 Varianza......................................................................................
1.4.2 Desviacin estndar...................................................................
1.4.3 Desviacin media........................................................................
1.4.4 Desviacin mediana....................................................................
1.4.5 Rango.........................................................................................
1.5 Parmetros para datos agrupados
1.5.1 La media.....................................................................................
1.5.2 La desviacin tpica....................................................................
1.6 Distribucin de frecuencias....
1.6.1 Distribuciones numricas............................................................
1.6.2 Distribuciones categricas..........................................................
1.6.3 Distribuciones acumuladas.........................................................
1.6.4 Distribuciones porcentuales........................................................
1.6.5 Distribuciones porcentuales acumuladas...................................
23
23
24
25
25
29
31
35
35
36
38
38
38
39
39
39
41
42
43
44
44
45
V

















UNIDAD 2





1.7 Tcnicas de agrupacin de datos...
1.7.1 Lmites de clase..........................................................................
1.7.2 Rango de clase...........................................................................
1.7.3 Fronteras de clase......................................................................
1.7.4 Marca de clase............................................................................
1.7.5 Intervalo de clase............................................................
1.7.6 Diagrama de tallos y hojas ...
1.7.7. Diagrama de Pareto..................................................................
1.7.8 Diagrama de puntos...................................................................
1.8 Histograma.......
1.8.1 Diagrama de barras....................................................................
1.8.2 Polgono de frecuencias.............................................................
1.8.3 Ojivas.........................................................................................
1.8.4 Grficas circulares......................................................................
1.9 Distribuciones mustrales...

PROBABILIDAD.
2.1 Teora elemental de probabilidad.......
2.1.1 Concepto clsico y como frecuencia relativa..............................
2.1.2 Interpretacin subjetiva de la probabilidad.................................
2.2 Probabilidad de eventos......
2.2.1 Definicin de espacio muestral...................................................
46
46
46
46
47
47
50
52
59
59
59
59
60
61
62
65
66
66
69
69
69
VI




















UNIDAD 3


2.2.2 Discreto y continuo.....................................................................
2.2.3 Definicin de evento...................................................................
2.2.4 Simbologa, uniones e intersecciones........................................
2.2.5 Diagramas de Venn....................................................................
2.3 Tcnicas de conteo.
2.3.1 Diagrama de rbol......................................................................
2.3.2 Notacin factorial........................................................................
2.3.3 Permutacin................................................................................
2.3.4 Combinaciones...........................................................................
2.4 Probabilidad con tcnicas de conteo
2.4.1 Axiomas......................................................................................
2.4.2 Teoremas....................................................................................
2.5 Probabilidad condicional...
2.5.1 Dependiente................................................................................
2.5.2 Independiente.............................................................................
2.6 Eventos Independientes...
2.6.1 Regla de Bayes...........................................................................


FUNCIONES Y DISTRIBUCIONES MUESTRALES.......
3.1 Funcin de probabilidad..
3.1.1 Variables aleatorias discretas.....................................................
71
71
71
71
72
76
80
81
91
100
100
100
101
101
110
113
113
121
121
121
VII














UNIDAD 4







3.1.2 Variables aleatorias continas....................................................
3.2 Distribucin Binomial......
3.2.1 Conceptos de ensayos de Bernoulli...........................................
3.3 Distribucin Hipergeomtrica
3.4 Distribucin de Poisson..
3.5 Esperanza matemtica.
3.6 Distribucin normal.
3.6.1 Distribucin de la probabilidad contina.....................................
3.7 Aproximacin de la Binomial a la normal
3.8 Otras distribuciones mustrales.
3.8.1 Distribucin T- Student...............................................................
3.8.2 Distribucin X cuadrada..............................................................


ESTADSTICA APLICADA...
4.1 Inferencia estadstica.....
4.1.1 Concepto.....................................................................................
4.1.2 Estimacin..................................................................................
4.1.3 Prueba de hiptesis....................................................................
4.1.4 Mtodo clsico de estimacin (puntual)......................................
4.1.5 Estimador Insesgado..................................................................
4.2 Intervalos de confianza
122

123
123
129
132
139
146
146
156
161
161
162
170
171
171
171
171
172
172
172
VIII













UNIDAD 5
4.2.1 Estimacin por intervalo..............................................................
4.2.2 Lmites de confianza...................................................................
4.2.3 Intervalo de confianza para una media.......................................
4.2.4 Intervalo de confianza para una diferencia de medida...............
4.2.5 Intervalo de confianza para proporciones...................................
4.2.6. Intervalo de confianza para diferencia de proporciones.
4.3 Pruebas de hiptesis.....
4.3.1 Prueba de hiptesis para la media poblacional..........................
4.3.2 Prueba de hiptesis para diferencias de medias........................
4.3.3 Prueba de hiptesis para proporciones......................................
4.3.4 Prueba de hiptesis para diferencia de proporciones.................


REGRESIN Y CORRELACIN...
5.1 Introduccin
5.1.1 Grficas de los datos..................................................................
5.1.2 Variables de regresin independientes.......................................
5.1.3 Regresin lineal simple...............................................................
5.2 Diagrama de dispersin
5.2.1 Tabla de datos.............................................................................
5.2.2. Construccin de Diagramas.......................................................
5.3. Estimacin mediante la lnea de regresin
5.3.1. Ecuacin de la recta como ajuste de datos...............................
172
173
174
183
186
189
196
203
214
220
223
216
217
217
218
219
221
221
222
222
222
IX

5.3.2. Modelos.....................................................................................
5.4. Mtodos de mnimos cuadrados
5.4.1 Estimacin de los coeficientes de regresin..............................
5.5. Error estndar de estimacin
5.6. Coeficiente de determinacin y correlacin.
5.6.1. Coeficiente de determinacin de la muestra.............................
5.6.2. Coeficiente de correlacin de la muestra..................................
5.7. Problemas prcticos de ajustes de curvas


Anexos..
..

Bibliografa.

223
223
224
230
233
233
238
245


255


262



10

OBJ ETIVO GENERAL




El estudiante seleccionar modelos probabilsticas, aplicar clculos de inferencia
estadstica sobre datos y desarrollar modelos para la toma de decisiones en sistemas con
componentes aleatorios.












11

J USTIFICACION

Uno de los objetivos del Instituto Tecnolgico Superior de Acayucan, es el de promover,
apoyar e impulsar el trabajo creativo del docente, principalmente en la elaboracin de
antologa que apoya al proceso enseanza aprendizaje, el cual debe ser estimulado con
los comentarios y sugerencias del profesorado y conviene que sea imitado por otros
maestros, quienes con capacidad de trabajo y tiempo disponible, pueden y deben gestar
literatura de este gnero, dando los pasos adecuados para pulirla y poder formar as textos
que faciliten la enseanza y el aprendizaje del curso.
El presente material de consulta y apoyo didctico se pone en manos de nuestros maestros
y, particularmente, de los alumnos que se forman en nuestro instituto. Considero los
contenidos de esta antologa como el propsito ms firme de mi convencimiento para facilitar
el estudio de la probabilidad y estadstica en las nuevas generaciones que me honran al
confiarme su preparacin y garantizar modestamente el fijarles una enseanza para toda la
vida.

































UNIDAD 1
ESTADISTICA
DESCRIPTIVA
Objetivo:
El estudiante conocer fundamentos
y tcnicas bsicas de estadstica,
para organizar, representar y analizar
datos obtenidos de una situacin
simulada o real.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





13

1.1 Conceptos bsicos de estadstica.
1.1.1 Definicin de estadstica.
La palabra estadstica procede del vocablo "estado" pues era funcin principal de los
gobiernos de los estados establecer registros de poblacin, nacimientos, defunciones, etc.
Hoy en da la mayora de las personas entienden por estadstica al conjunto de datos, tablas,
grficos, que se suelen publicar en los peridicos.

Definicin:
Estadstica, rama de las matemticas que se ocupa de reunir, organizar y analizar datos
numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de
decisiones.

Estadstica es un conjunto de mtodos cientficos para la recopilacin, representacin
condensacin y anlisis de los datos extrados de un sistema en estudio. Con el objeto de
poder hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.

El anlisis se hace con las herramientas estadsticas, empleando la informacin obtenida de
los datos, para realizar estimaciones o inferencias, testear hiptesis de trabajo y as, poder
tomar las decisiones ms adecuadas en cada caso particular, basadas en la evidencia
cientfica suministrada por estos anlisis.

El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre
todo en el proceso de interpretacin de esa informacin. El desarrollo de la teora de la
probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. La probabilidad
es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la
cantidad de datos necesarios en un determinado estudio estadstico. Cuando a travs de
una muestra pretendemos obtener informacin de una poblacin entera los datos obtenidos
puede ser diferente a los reales. Son valores aproximados del parmetro desconocido. A
estos valores se les llama Estimaciones.

Al dar una estimacin estoy cometiendo un error llamado error de muestreo debido a que no
se esta considerando a toda la poblacin, sino a una parte de ella. Existen procedimientos
que pueden determinar de antemano el error que puedo cometer.

UNIDAD I / ESTADISTICA DESCRIPTIVA.





14

Aparte de estos, existen otros errores que se presentan tanto en encuestas por muestreo
como en las encuestas por censo. Este tipo de errores son mayores y de difcil correccin.
Son errores ajenos al muestreo.

Qu es un experimento comparativo?
Es una investigacin cuya finalidad es comparar los efectos de dos o ms estmulos
(tratamientos A y B) aplicados a ciertos entes (unidades de experimentacin c
1
, c
2
, c
3
y c
4
,).
Para ello se efectan mediciones sobre los efectos de ambos tratamientos obtenindose los
resultados (
1A
,
2B
,
3B
y
4A
).



Qu es una encuesta por muestreo?
Es una investigacin que tiene por objetivo la descripcin de ciertas caractersticas
(c
1
, c
2
, c
3 ,
, c
6
) de una poblacin, mediante el examen de una parte de ella (muestra c
1
, c
4
).
La medicin de una caracterstica en los elementos de la muestra produce resultados
1 4
( y ) Y Y . Si el muestreo es probabilstico, todos los elementos de la poblacin tiene una
probabilidad no nula de formar parte de la muestra.


UNIDAD I / ESTADISTICA DESCRIPTIVA.





15

Qu es un estudio observacional?
Es una investigacin comparativa sin la asignacin aleatoria que se hace en los
experimentos (o investigacin de muestreo no probabilstico), cuya finalidad es tambin
comparar los efectos que dos o mas condiciones ( A y B) tienen sobre los entes observados
(c
1
, c
2
, c
3
y c
4
,). Esto se lleva a cabo con extremado cuidado y control.



Divisin de la estadstica
Se divide en dos partes:

Re
( ) Re
( )
copilar
Descriptiva Deductiva presentar
Condensar
Divisin Estadistica
Caracteristicas
Inferencial Inferencia
muestras











a) Estadstica descriptiva o deductiva: Es la parte de la estadstica que se ocupa de
recopilar, representar y condensar los datos obtenidos del sistema en estudio,
utilizando representaciones grficas de los datos tabulados.

b) Estadstica inferencial o inferencia estadstica: Utiliza datos de muestra para hacer
inferencias (caracterstica) acerca de un conjunto de datos grandes una poblacin
de cual se selecciono la muestra.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





16

1.1.2 Inferencia estadstica.
Es la parte de la Estadstica dedicada a la formulacin de supuestos y estimaciones, para
hacer predicciones y poder sacar conclusiones de los datos obtenidos con el estudio de las
muestras. Y as, poder tomar decisiones con base cientfica. La Estadstica se emplea en el
estudio de los fenmenos naturales, tanto los generados en los laboratorios por los
cientficos como aquellos ms all del control humano.

Es una herramienta de uso tan amplio y general que hoy da es difcil imaginar un lugar
donde no pueda emplearse. Ms an, en algunas disciplinas es la herramienta bsica de
medicin, como por ejemplo en parapsicologa para la determinacin de PES (percepciones
extra-sensoriales).

1.1.3 Teora de decisin.
Es una herramienta bsica para la toma de decisiones, basadas en evidencia cientfica. La
manera de hacerlo es plantear las hiptesis posibles y luego efectuarle una prueba o test
estadstico.

Llamada en algunas obras: la docimasia estadstica. Cuando una conclusin se valida con
un test estadstico se la llama de tipo cuantitativo, en caso contrario la decisin adoptada es
de tipo cualitativo, o sea, una decisin tomada en forma subjetiva. El mtodo consiste en
definir una probabilidad de aceptacin del orden del 95% (o rechazo) de una hiptesis de
trabajo planteada, que permite calcular los valores crticos (o lmites de aceptacin) de un
estadgrafo calculado a partir de los valores medidos. La importancia de este tema es muy
grande. Basta decir que el objeto final de la Estadstica es la toma de decisiones.

1.1.4 Poblacin.
La poblacin, es el conjunto de todas las muestras posibles, que pueden obtenerse del
sistema en estudio de acuerdo al mtodo de seleccin empleado.

La poblacin, entonces, es el total hipottico de los datos que se estudian o recopilan. El
tamao de la poblacin se saca contando el nmero de elementos componentes. A veces es
un conteo simple, pero otras veces se trata de conteos ordenados.

A continuacin muestra las formas de observar una poblacin.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





17


Etapas de la recopilacin de datos
Etapa 1 - Objetivos de la Recopilacin: esta primera etapa consiste en determinar con
claridad qu es lo que se quiere lograr con la recopilacin. No siempre es fcil saber lo que se
quiere y menos determinarlo en detalle. Por eso, se deben definir primero los objetivos
generales del trabajo estadstico. Y a partir de ellos se conocern las variables a medir y as
saber cules elementos se necesitarn. Con esto se tiene una primera idea de los alcances y
limitaciones de la tarea a realizar, segn sea el tipo de informacin a obtener de la poblacin en
estudio. Los objetivos deben redactarse concisos, breves y claros. Normalmente, la persona a
cargo de la investigacin es la responsable de esta etapa pues tiene una visin ms completa y
actualizada del tema en estudio. Por ejemplo, si se necesita la distribucin de la poblacin por
edades y sexo, no es lo mismo disponer de la informacin del ltimo censo realizado que
hacerlo uno mismo.

UNIDAD I / ESTADISTICA DESCRIPTIVA.





18

Etapa 2 - Relevamientos: esta etapa consiste en determinar lo que se tiene para alcanzar los
objetivos definidos en la etapa anterior. Se trata de listar los bienes necesarios para poder hacer
el trabajo, y el listado de los disponibles. Conviene tener en cuenta la siguiente clasificacin de
los bienes: Tangibles e Intangibles.

Por su parte, los bienes tangibles son dos:
Los materiales incluyen los de vidrio, de limpieza, drogas, reactivos, etc.
Por equipamiento se entiende no slo los aparatos de medicin, sino los accesorios
como muebles y tiles de laboratorio y para oficina.
El dinero o los recursos monetarios deben ser determinados con mucho detalle para
afrontar gastos e inversiones durante la investigacin. Adems, hay que determinar los
fondos disponibles y las posibles fuentes financieras adonde poder recurrir.


La infraestructura incluye a los edificios, laboratorios, electricidad, agua, etc.
El personal es todo el necesario en sus diferentes niveles, como ser: profesionales,
tcnicos, ayudantes, consultores externos, de servicio, etc. Este relevamiento de los
bienes tangibles disponibles y de los necesarios para la recopilacin condiciona de
alguna manera los objetivos. Puede ser que se disponga de bienes sobrados para
alcanzar los objetivos, por lo que se pueden plantear metas ms ambiciosas. Por otra
parte, puede ocurrir que los bienes disponibles estn lejos de cubrir los necesarios, y
por lo tanto se debern resignar los objetivos planteados por otros ms modestos.


Por su parte, los bienes intangibles son dos:
la organizacin de los bienes tangibles, de manera tal de alcanzar los objetivos, y
los conocimientos para saber cmo usarlos. Esto es el know how de cada profesin. Y
tambin lo es la bsqueda bibliogrfica de trabajos similares en revistas especializadas,
textos y otras fuentes de informacin. Una vez terminada esta etapa, que seguramente
habr ayudado a depurar la anterior, se debe comenzar a pensar en las diferentes
maneras de hacerlo.

Etapa 3 - Creacin de alternativas: esta etapa consiste en saber cmo hacerlo. O sea,
generar distintas alternativas de sistemas de recopilacin de datos, de acuerdo con los objetivos
adoptados y los bienes disponibles. Se debe hacer un listado con todas las formas posibles de
UNIDAD I / ESTADISTICA DESCRIPTIVA.





19

efectuar la recopilacin a fin de tener un panorama completo. En sntesis, se habla de fuente
propia cuando se decide extraer los datos mediante mediciones. Fuente Primaria es cuando
se toman los datos de otros investigadores que publican los resultados de sus propias
mediciones. Fuente Secundaria es cuando los datos se extraen de publicaciones que usan
como referencia a fuentes primarias.

Etapa 4 - Seleccin de alternativas: consiste en determinar cul es la mejor entre las n
alternativas planteadas en la etapa anterior. Se necesita de un mtodo para la adopcin de un
criterio de seleccin.

Etapa 5 - Prueba piloto: existe una diferencia entre el diseo en los papeles y la realidad. Es
por eso que siempre es aconsejable hacer una prueba piloto antes de la puesta en marcha para
poder juzgar cmo trabaja el sistema de recopilacin de datos. Se sacan unos pocos datos y se
analizan las dificultades no previstas, junto con los resultados. Comparando los valores
obtenidos con los que se esperaba tener, se hace una especie de control previo del sistema.

Etapa 6 - Ajustes: Lo normal es tener que hacer pequeos ajustes que permitan optimizar al
sistema. De las diferencias detectadas en el control de la etapa anterior se sacan indicios. Estos
muestran qu tpicos retocar y surgen nuevas ideas de cmo hacer mejor las cosas.
Bsicamente, usando el sentido comn se corrigen los principales defectos, como ser: mejorar
el entrenamiento y conocimientos del personal, redisear formularios, calibrar equipos de
medicin, estimacin de la magnitud del error de medicin, etc. Pero tambin hay tcnicas de
optimizacin especiales como son los distintos modelos de la Investigacin Operativa. Esta es
una disciplina muy emparentada con estadstica y sus modelos ms conocidos son: Teora de
Lneas de Espera, Programacin por Camino Crtico (PERT), Programacin Dinmica y Lineal,
Reemplazos, Simulaciones, etc. Una vez hechos los ajustes, se vuelve a la etapa anterior y se
efecta una nueva prueba piloto. Este ensayo permite decidir si se contina adelante, o si son
necesarios ms ajustes. Hay que continuar hasta que todo sea satisfactorio y recin entonces
pasar a la etapa siguiente.

Etapa 7 - Puesta en marcha: una vez optimizado y ajustado el mtodo de obtencin de datos
solo resta ponerlo en marcha. De esa manera, se logra la cantidad de datos necesarios para
alcanzar los objetivos previstos. El resultado final es la obtencin de un volumen grande de
informacin que debe ser presentada en forma ms resumida y comprensible usando tablas,
grficos y otras formas, como se ver ms adelante.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





20

1.1.5 Muestra aleatoria.
La muestra es un conjunto de datos obtenidos de una poblacin cualquiera, con el mtodo de
recopilacin elegido. Se la puede imaginar como un subconjunto del conjunto poblacin. Se
toman muestras, cuando no se puede o no conviene, tomar la poblacin entera. Si se tiene una
poblacin de tamao infinito, no se podr nunca tomar todas las muestras posibles, como por
ejemplo, las mediciones repetidas de una misma magnitud, que se pueden repetir
indefinidamente mientras el ensayo no sea destructivo (repetidas pesadas en una balanza,
medir la temperatura de un cuerpo, etc.). Hay ocasiones, donde si bien la poblacin es finita, es
tan grande que no resulta prctico tomar todos los casos como por ejemplo, cuando la
poblacin es la especie humana.

Lgicamente, la confiabilidad de las conclusiones extradas concernientes a una poblacin
dependen de si la muestra se ha escogido apropiadamente de tal modo que represente la
poblacin suficiente. Una forma de hacer esto para poblaciones finitas es asegurarse de que
cada miembro de la poblacin tenga igual oportunidad de encontrarse en la muestra, lo que se
conoce como muestra aleatoria.

1.1.6 Parmetros aleatorios.
Parmetro, es toda magnitud que tiene el mismo valor dentro de una poblacin. O sea, no
permite diferenciar entre s a sus elementos componentes. Existen medidas para realizar
descripciones cuantitativas de los conjuntos de datos, o poblaciones, y de sus muestras,
diferencindose entre ellas las que se refieren a las mismas poblaciones y a las muestras. Para
el caso de las poblaciones, las medidas que las describen se denominan parmetros, y suelen
estar representadas con letras griegas (por ejemplo y ). Por otro lado, para el caso de
aquellas medidas que describen a una muestra se les llama estadsticos o estimadores, y son
representados por letras de nuestro alfabeto (por ejemplo, x o s). Tales medidas cuantitativas
que describen a las poblaciones y a las muestras se comentarn enseguida. Se considera que
se conoce una poblacin cuando conocemos la distribucin de probabilidad f(x) de la variable
aleatoria asociada X.

1.1.7 Enfoque clsico.
La utilizacin de esta metodologa implica una cierta filosofa o visin de la Probabilidad y la
Estadstica muy particular y poco frecuente. Lo particular de este enfoque es que es
razonablemente ms sencillo que el enfoque clsico de la estimacin y el ensayo de hiptesis, a
UNIDAD I / ESTADISTICA DESCRIPTIVA.





21

los que reemplaza y mejora por cuanto no implica aproximaciones ni requiere de la introduccin
de nuevos conceptos.

1.1.8 Enfoque Bayesiano.
En el enfoque Bayesiano de la Estadstica, la incertidumbre presente en un modelo dado,
p(x), es representada a travs de una distribucin de probabilidad p ( ) sobre los posibles
valores del parmetro desconocido (tpicamente multidimensional) que define al modelo. El
Teorema de Bayes,

) (
) ( ) (
) (
x p
x p p
x p

=

Permite entonces incorporar la informacin contenida en un conjunto de datos
) ,..., (
1 n
x x x =
,
produciendo una descripcin conjunta de la incertidumbre sobre los valores de los parmetros
del modelo a travs de la distribucin final p (x ).

Desafortunadamente, la implementacin de las tcnicas Bayesianas usualmente requiere de un
esfuerzo computacional muy alto. La mayor parte de este esfuerzo se concentra en el clculo
de ciertas caractersticas de la distribucin final del parmetro de inters (que llamaremos
resmenes inferenciales). As, por ejemplo, para pasar de una distribucin conjunta a una
coleccin de distribuciones y momentos marginales que sean tiles para hacer inferencias
sobre subconjuntos de parmetros, se requiere integrar. En la mayora de los casos los
resmenes inferenciales bsicos se reducen a integrales de la forma:

( ) { } ( ) ( ) ( )

= d z p p g g S


El anlisis Bayesiano, en otra diferencia con la estadstica clsica, permite incorporar en un
estudio informacin de distintas fuentes, incluso subjetivas.

De esta manera concibe, en un plano muy general, las tcnicas estadsticas como mecanismos
para la actualizacin del conocimiento particular o general, individual o colectivo sobre el estado
que guarda la naturaleza."


UNIDAD I / ESTADISTICA DESCRIPTIVA.





22

1.2 Descripcin de datos.

1.2.1 Datos agrupados y no agrupados.
La principal diferencia entre ambas es que en datos agrupados se ordenan los datos de la
tabla y se almacenan en el orden del ndice. Los datos agrupados mejoran el rendimiento al
almacenar los datos de la tabla junto con datos de nivel de hoja del ndice. Una ordenacin es
un conjunto de datos numricos en orden creciente o decreciente. Este mtodo de presentacin
de la informacin consiste en presentar los datos por medio de una tabla o cuadro.

Los datos no agrupado no apunta directamente a la fila de la tabla, sino que utiliza los valores
del ndice agrupado como punteros a las filas de la tabla.

Una fila de datos consiste en datos recogidos que no han sido organizados numricamente.

1.2.2 Frecuencia de clase.
La frecuencia de clase o frecuencia de categora, es el nmero de observaciones que caen
dentro de una categora
Altura ( in) Nmero de
estudiantes f
60 62
63 65
66 68
69 71
72 74
7
20
44
29
10
Total 110

1.2.3 Frecuencia relativa.
La frecuencia relativa (proporcin); de una clase es su frecuencia dividida por la frecuencia total
de todas las clases.

total
estudiante de numero
relativa frecuencia =


UNIDAD I / ESTADISTICA DESCRIPTIVA.





23

Altura ( in) Nmero de
estudiantes (f)
Frecuencia
relativa
60 62 7 0.0636
63 65 20 0.1818
66 68 44 0.4
69 71 29 0.2636
72 74 10 0.0909
total 110 1.0000


1.2.4 Punto medio.
El punto medio del intervalo de clase, que puede tomarse como representativo de la clase, se
llama marca de clase, que se refiere al punto medio del intervalo de clase y se obtiene
promediando los limites inferior y superior de clase. As que las marcas de clase del intervalo
60 62 es:

60 62
61
2
+
=

1.2.5 Lmites.
Tomando encuenta la clase 60 - 62 se dice que se llaman lmites de clases, el 60 se llama
lmite inferior de clase y el 62 se llama lmite superior de clase.

1.2.6 Histograma.
Es una representacin grafica para la distribucin de frecuencia. Un histograma o histograma de
frecuencias, consiste en un conjunto de rectngulos con:

a) base en el eje x horizontal, centros en las marcas de clases y longitudes iguales a los
tamaos de los intervalos de clase y

b) reas proporcionales a las frecuencias de clase.


UNIDAD I / ESTADISTICA DESCRIPTIVA.





24

Altura ( in) Nmero de
estudiantes (f)
Marca de
clases (X)
60 62 7 61
63 65 20 64
66 68 44 67
69 71 29 70
72 74 10 73
total 110




1.2.7 Histograma de frecuencia relativa.
Altura ( in) Numero de
estudiantes (f)
Frecuencia
relativa
60 62 7 0.0636
63 65 20 0.1818
66 68 44 0.4
69 71 29 0.2636
72 74 10 0.0909
total 110 1.0000


0
10
20
30
40
50
58 61 64 67 70 73 76
frecuencia
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
1 2 3 4 5
F
r
e
c
.

R
e
l
.
Histograma de frecuencia relativa
Problemas
Problema:
extincin m
terrenos ag
numero tot

T

a) Re


1.3. Me

1.3.1 Med
Media aritm
Sean, x
1
,x
al valor dad
o bien
s propuesto
El rascn t
mundial. En
grcolas de G
al de rascon
rea
1. Tierr
2. Tierr
3. Orkn
4. Lewi
5. N. U
6. S. U
7. Hebr
8. Coll
9. Irlan
10. Repu
Total
esuma los da
edidas de

dia aritm
mtica
x
2
,....,x
n
, n o
do por:
os:
errestre o g
fechas reci
Gran Breta
nes terrestres
ra bajas de E
ras altas de e
ney y Shetlan
is y Harris
ist y Benbec
ist y Barra
ridas interior
y Tirce
da del norte
ublica de Irla
atos con un h
tendencia
tica, geom
observacione
UN
guin de las
entes se lle
a e Irlanda
s que habitan
Escocia
escocia
nd
cula
res

anda
histograma
a central.
mtrica y p
es mustrale
NIDAD I /



codornices
ev a cabo
(Journal of
n en cada de
ponderad
es, definirem
ESTADIST
es una ave
un censo d
applied ecol
e 10 reas ge
Numero
ter
1
a.
os promedio

TICA DESC
e europea e
e rascones
logy) . La ta
eogrficas.
de rascones
restres
12
15
34
76
82
155
76
121
128
789
1488
o de estas ob
CRIPTIVA
25
en peligro de
cantores en
abla indica e
s
bservaciones
A.



5
e
n
el
s
UNIDAD I / ESTADISTICA DESCRIPTIVA.





26

N
x
N
x
N
x x x x
x
N
j
j
n

= =
+ + + +
=
=1
3 2 1
...


Ejemplo: La media aritmtica de los nmeros 8, 3. 5, 12 y 10

6 . 7
5
38
5
10 12 5 3 8
= =
+ + + +
= x

En esta expresin, puede verse que el promedio de un conjunto de nmeros se calcula
sumndolos y luego dividiendo la suma por el nmero de sumandos. La estadstica promedio
representa muy bien el 'centro' de la distribucin de los datos cuando se trata de casos
'normales'. Entendemos aqu por casos 'normales' aquellos conjuntos de datos que no
contienen valores muy extremos, valores muy alejados de los dems. Debido a que en muchas
situaciones experimentales, el comportamiento de los datos es relativamente 'normal', el
promedio es muy usado, convirtindose en la primera estadstica calculada para representar el
'centro' de la poblacin en estudio.

si los nmeros X
1
, X
2
, ... , X
k
, ocurren f
1
, f
2
, ... , f
k
, veces respectivamente, su media
aritmtica
N
fx
x
f
x f
f f f
x f x f x f
x
k
j
j
N
j
j j
k
k k

=
=
+ + +
+ + +
=
=
=
1
1
2 1
2 2 1 1
...
...


Ejemplo: si 5, 8, 6, y 2 ocurren con frecuencias 3, 2, 4 y 1 , respectivamente, su media
aritmtica es
( )( ) ( )( ) ( )( ) ( )( )
7 . 5
10
2 24 16 15
1 4 2 3
2 1 6 4 8 2 5 3
=
+ + +
=
+ + +
+ + +
= x


Ejemplo:En la tabla siguiente se tiene los puntajes obtenidos en la Prueba de Aptitud
Acadmica por 30 jvenes, provenientes de un mismo establecimiento educacional:
UNIDAD I / ESTADISTICA DESCRIPTIVA.





27

P. Ap. Verbal P. Ap. Matemtica P. Ap. Verbal P. Ap. Matemtica
685 664 730 642
490 548 618 533
580 567 690 654
705 665 680 542
470 452 690 678
620 506 710 732
650 618 742 749
702 718 685 570
643 621 595 574
540 555 674 657
575 502 722 747
600 531 585 620
500 478 505 482
680 558 600 643
587 600 543 500

Con los datos de la tabla, se puede caracterizar el establecimiento educacional usando el
promedio de cada una de las pruebas. Lo primeros que se necesita es calcular la suma de los
puntajes de los treinta alumnos.

Dichas sumas son las siguientes:
Prueba de Aptitud Verbal 18796
Prueba de Aptitud Matemtica 17906
Promedio Prueba de Aptitud Verbal 626.533
Promedio Prueba de Aptitud Matemtica 596.867
La Media g
La media g
del product
media geo

Ejemplo: la
G =
3
2 ( )

Promedio
En muchas
Para hacer
necesario a
importancia

Definicin.
A veces as
W
K
depend
Ejemplo: si
estudiante
calificacion

Ejercicios
a) hal
5, y
So

geomtrica
geomtrica e
to:
n
ometrica=
a media geom
4 ( ) 8 ( ) 4 =

Ponderado
s ocasiones,
r presente e
asignar a cad
a dentro de l
sociada con l
dientes de la
i el examen
tiene calific
nes media es
s:
llar la media
y 4
lucin: 4.8
G
s el resultad
n
n
x x x ... .
2 1
mtrica g de

.
las observa
ste hecho e
da uno de s
a muestra.
los nmeros
a relevancia a
final de un c
cacin 85 e
s :
( )(7 1
= x
aritmtica d
UN
o de multipli
2, 4 y 8

mathca
aciones recol
n la bsqued
stos, una po
X
1
, X
2
, . . .
asignada a c
curso cuanta
en el exame
) ( )( )
3 1 1
90 1 70
+ +
+
de los nmer
NIDAD I /



car todos los
ad gmea
lectadas no
da de un 'ce
nderacin (p
X
K
, ciertos f
cada nmero
a tres veces
en final y 7
) ( )( )
3
85 3
=
+
ros 5, 3, 6, 5
ESTADIST
s elementos
an 2 4 , 8 , ( ) 4 =
tienen la mis
entro' que re
peso o coefic
factores peso
o.

mas que una
70 y 90 en
83
5
415
=
5, 4, 5, 2, 8, 6
TICA DESC
y extraer la

sma importa
epresente a
ciente) que re
os ( o pesos
a evaluacin
los dos pa
6, 5, 4, 8, 3,
CRIPTIVA
28
raz n -sima
ancia relativa
los datos, es
epresente su
) W
1
, W
2
,...
n parcial y un
arciales , las
4, 5, 4, 8, 2
A.



8
a
a.
s
u
,
n
s
2,
UNIDAD I / ESTADISTICA DESCRIPTIVA.





29

b) De entre 100 nmeros. 20 son cuatros, 40 son cinco, 30 son seis y los restantes siete.
Hallar su media aritmtica.
Solucin: 5.30

c) las calificaciones finales de un estudiante en cuatro asignatura fueron 82, 86, 90 y 70. si
los respectivos crditos otorgados a esos cursos son 3, 5, 3 y 1 , determinar una
calificacin media a apropiada.
Solucin: 85

d) De los 80 empleados de una empresa 6 cobra $ 7,00 a la hora y el resto $4,00 a la
hora. Hallar cuanto cobran de media por hora
Solucin: $6.25

e) Cuatro grupos de estudiantes, consistentes en 15, 20, 10 y 18 individuos, dieron pesos
medios de 162, 148, 153 y 140 lb., respectivamente . hallar el peso medio de todos
esos estudiantes.
Solucin: 150 lb.


1.3.2 Mediana.
La mediana de un conjunto de nmeros ordenados en magnitud es el valor central o la media
de los dos valores centrales.
Datos sin agrupar:
Ejemplo: el conjunto de nmeros 3, 4, 4, 5, 6, 8, 8, 8, 10 tiene mediana 6
mathcad median 3 4 , 4 , 5 , 6 , 8 , 8 , 8 , 10 , ( ) 6 =


Ejemplo: el conjunto de nmeros 5, 5, 7, 9, 11, 12, 15, 18 tiene mediana ( 9 + 11 ) = 10

Ejemplo: las notas de un estudiante en seis exmenes han sido 84, 91, 72, 68, 87 y 78. hallar la
mediana de esas notas.
Solucin : las notas ordenadas son 68, 72, 78, 84, 87 , 91,
1 / 2 ( 78 + 84 ) = 81

UNIDAD I / ESTADISTICA DESCRIPTIVA.





30

Ejemplo: cinco oficinistas cobran $ 4.52, $ 5.96, $ 5.28, $ 11.20 y $ 5.75 a la hora. Hallar la
mediana
Solucin = la ordenacin es: $ 4.52, $ 5.28, $ 5.75 , $ 5.96, $ 11.20
La mediana es $ 5.75

Datos Agrupados:
Las grficas siguientes, correspondientes a polgonos de frecuencias absolutas acumuladas,
nos plantea de nuevo dos situaciones diferentes a considerar:
( )
C
f
f
N
L mediana
mediana


+ =

1
1
2

donde:
L
1
= frontera inferior de la clase mediana.
N = numero de datos (frecuencia total)
( f )
1
= suma de la frecuencia de las clases inferiores a la de la mediana.
f
mediana
= frecuencia de la clase mediana.
C = anchura del intervalo de clase de la mediana.

Ejemplo:
Altura ( in) Numero de estudiantes (f)
60 62 7
63 65 20
66 68 44
69 71 29
72 74 10
total 110


Para indicar la posicin : 55
2
110
= ; entonces se procede a realizar una suma con las
frecuencias (f) hasta llegar al valor 55 o mas de 55 pero no menos, para suponer que ah cae la
mediana solo que se tiene que hacer es verificar su valor.

7 + 20+ 44 = 71 por lo tanto cae en el intervalo 66 68
UNIDAD I / ESTADISTICA DESCRIPTIVA.





31

Datos:
5 . 65
1
= L ; 110 = N ; ( ) 27
1
=

f ; 44 =
mediana
f ; 3 5 . 65 5 . 68 = = C

( ) 41 . 67 3
44
27
2
110
5 . 65 =


+ = mediana

1.3.3 Moda.
La moda de un conjunto de nmeros es el valor que ocurre con mayor frecuencia; es decir, el
valor mas frecuente. La moda puede no existir e incluso no ser nica. Esta estadstica debe
usarse con cuidado. Su objetivo es identificar zonas donde se producen aglomeraciones de
datos, sin embargo, podra ser que por el solo hecho de haber una observacin extra en un
punto aislado, ste pudiese aparecer como una moda.

Este inconveniente es especialmente delicado cuando hay pocas observaciones en la muestra,
tal como es el caso que se observa en el grfico siguiente.

Datos sin agrupar:
Ejemplo: el conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 tiene como moda 9
mathcad mode 2 2 , 5 , 7 , 9 , 9 , 9 , 10 , 10 , 11 , 12 , 18 , ( ) 9 =

Ejemplo: el conjunto 3, 5, 8, 10, 12, 15, 16 n o tiene moda

Ejemplo: el conjunto 2, 3, 4, 4, 4, 5, 5, 7 , 7, 7, 9 tiene dos modas 4 y 7 y se llama bimodal

Una distribucin nica se llama unimodal.
Datos agrupados :
C L a

+

+ =
2 1
1
1
mod

donde:
L
1
= frontera inferior de la clase modal ( clase que contiene a la moda)
UNIDAD I / ESTADISTICA DESCRIPTIVA.





32

1
= exceso de la frecuencia modal sobre la clase inferior inmediata

2
= exceso de la frecuencia modal sobre la clase superior inmediata
c = anchura del intervalo de clase modal.

Ejemplo :
Altura ( in) Numero de estudiantes (f)
60 62 7
63 65 20
66 68 44
69 71 29
72 74 10
total 110

De acuerdo a la definicin la moda ser quien tenga mayor frecuencia por lo tanto cae en el
intervalo 66 68

5 . 65
1
= L ; 22 20 44
1
= = ; 15 29 44
2
= = ; 3 5 . 65 5 . 68 = = C

( ) 28 . 67 3
15 22
22
5 . 65 mod =

+
+ = a

Medidas de posicin relativa (Cuartiles, deciles y percentiles).
Las calificaciones de exmenes y ciertos tipos de datos sociolgicos y de salud con frecuencia
se presentan en una forma que describe la posicin de una observacin relativa a las dems
observaciones de la distribucin.

Si un conjunto de datos estn ordenados por magnitud, el valor central ( o la media de los dos
centrales) que divide al conjunto en dos mitades iguales es la mediana. Extendiendo esa idea,
podemos pensar en aquellos valores que dividen al conjunto en cuatro partes iguales.

Estos valores, denotados por Q
1
, Q
2
, Q
3
, se llaman primer, segundo y tercer cuartil. Q
2

coincide con la mediana.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





33

Anlogamente los valores que dividen a los datos en 10 partes iguales se llaman deciles y se
denotan D
1
, D
2
, . . . , D
9
, mientras los valores que se dividen en 100 partes iguales se llaman
percentiles denotados P
1
, P
2
, . . . , P
99
.

Colectivamente cuartiles, deciles y percentiles se denominan cuantiles.

Altura ( in) Numero de estudiantes (f)
60 62 7
63 65 20
66 68 44
69 71 29
72 74 10
total 110

Hallar Cuartiles:

N / 4 = 100 / 4 = 25
5 + 18 = 23 63 65 62.5 65.5
Q
1
65.5
25 23 ( )
42
3 ( ) + 65.64 =


2N / 4 = 2(100) / 4 = 50
5 + 18 = 23 63 65 62.5 65.5
5 + 18 + 42 = 65

Q
2
65.5
50 23 ( )
42
3 ( ) + 67.43 =


3N / 4 = 3(100) / 4 = 75
5 + 18 +42 = 65 66 68 65.5 68.5

Q
3
68.5
75 65 ( )
27
3 ( ) + 69.61 =



UNIDAD I / ESTADISTICA DESCRIPTIVA.





34

Hallar los deciles
100
10
10 = D
1
62.5
10 5 ( )
18
3 ( ) + 63.33 =


2 100 ( )
10
20 = D
2
62.5
20 5 ( )
18
3 ( ) + 65 =


5+ 18 = 23
3 100 ( )
10
30 = D
3
65.5
30 23 ( )
42
3 ( ) + 66 =


5+ 18 = 23
4 100 ( )
10
40 = D
4
65.5
40 23 ( )
42
3 ( ) + 66.71 =

5+ 18 = 23
5 100 ( )
10
50 = D
5
65.5
50 23 ( )
42
3 ( ) + 67.43 =


5+ 18 = 23
6 100 ( )
10
60 = D
6
65.5
60 23 ( )
42
3 ( ) + 68.14 =


5+ 18 + 42 = 65
7 100 ( )
10
70 = D
7
68.5
70 65 ( )
27
3 ( ) + 69.06 =


5+ 18 + 42 = 65
8 100 ( )
10
80 = D
8
68.5
80 65 ( )
27
3 ( ) + 70.17 =


5+ 18 + 42 = 65
UNIDAD I / ESTADISTICA DESCRIPTIVA.





35

D
9
9 100 ( )
10
90 = 68.5
90 65 ( )
27
3 ( ) + 71.28 =


Hallar percentiles P
35
y P
50
35 (100) / 100 = 35
P
35 65.5
35 23 ( )
42
3 ( ) + 66.36 =


50 (100) / 100 = 50
P
50
65.5
50 23 ( )
42
3 ( ) + 67.43 =



1.4. Medidas de dispersin.

Medidas de Posicin.
La descripcin de un conjunto de datos, incluye como un elemento de importancia la ubicacin
de stos dentro de un contexto de valores posibles. Por ejemplo, puede resultar de inters
conocer qu porcentaje de automviles equipados con convertidor cataltico sobrepasa el
estndar de emisiones de gases que es aceptable segn la legislacin vigente. Ya no se trata
en este ejemplo de describir el centro de un conjunto de datos de esta naturaleza. Es necesario
ser ms especfico. Es probable que la emisin promedio de un conjunto de automviles est
dentro de la norma. Pero,es aceptable que el 25% de ellos no la cumpla?. Se ve, entonces,
que la descripcin debe entregar ms informacin de los datos para cubrir las necesidades
informativas referentes a un problema en particular.

1.4.1 Varianza.
Cuadrada para poder compararla con la media y otras medidas anlogas. Esta es la idea del
desvo estndar o desviacin tpica. Tambin es la frmula planteada por Gauss en su teora
de errores casuales. Como se ver ms adelante, la curva de Gauss tiene dos puntos de
inflexin simtricos ubicados a una distancia del centro igual al desvo estndar.

UNIDAD I / ESTADISTICA DESCRIPTIVA.





36

La varianza
La varianza es el promedio de los cuadrados de las desviaciones de cada elemento, x
i
,
respecto a la media,

La varianza de un conjunto de datos se define como el cuadrado de la desviacin tpica y viene
dada en consecuencia por S
2
. varianza poblacional (s
2
)
( )
N
x x
S
N
j
j
=

=
1
2
2
;
para una poblacin finita con n determinaciones.

Y la varianza muestral (
2
)
1 1
) (
1
2
1 2
1
2
2

=
=
=
n
n
y
y
n
x x
n
i
n
i
i
i
n
i
i


1.4.2 Desviacin estndar.
A su vez, el desvo estndar poblacional () y el muestral (s) se obtienen con la raz
cuadrada de las respectivas varianzas y Representa el alejamiento de una serie de nmeros de
su valor medio. Se calcula a partir de todas las desviaciones individuales con respecto a la
media.

Para poder conocer o calcular tanto la media como la varianza poblacionales, se necesita
conocer la poblacin completa. Esto es imposible en el caso de mediciones repetidas porque
estas son infinitas desde el punto de vista terico. Anlogamente, la cantidad total de muestras
que se le puede extraer a un paciente, para hacerle una determinacin en el laboratorio, es tan
grande que puede ser considerada infinita. Por lo tanto, para todos
( )
N
x x
S
N
j
j
=

=
1
2

El uso de esta estadstica es recomendado en aquellos conjuntos de datos que ofrecen cierto
grado de simetra respecto de su centro. En estos casos, habitualmente tiene sentido medir
discrepancias de un valor con el centro de los datos usando mltiplos de la desviacin estndar.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





37

A modo de ejemplo, se puede decir que un valor est bastante alejado del centro de los datos si
su distancia de l supera dos desviaciones estndar. Apoyndose en la idea anterior, la
desviacin estndar puede ser usada para determinar valores que se encuentran 'cerca' del
centro. Este uso va ms all de la simple descripcin, en otros mbitos de Estadstica es usada
para tomar decisiones respecto de la poblacin de la que fue extrada la muestra.

Ejercicio: Calcular la desviacin estndar de los siguientes datos:
68.2, 69.3, 70.4, 71.5, 72.6, 73.7, 74.8,
prom
68.2 69.3 + 70.4 + 71.5 + 72.6 + 73.7 + 74.8 +
7
:=
prom 71.5 =


desv
68.2 71.5 ( )
2
69.3 71.5 ( )
2
+ 70.4 71.5 ( )
2
+ 71.5 71.5 ( )
2
+ 72.6 71.5 ( )
2
+ 73.7 71.5 ( )
2
+ 74.8 71.5 ( )
2
+
7
:=
desv 2.2 =


Problema: Investigadores del Massachussets Institute of Technology (MIT) estudiaron las
propiedades espectroscopicas de asteroides de la franja principal con un dimetro menor a los
10 kilometros. Los asteroides se observaron con el telescopio hiltener del observatorio del MIT;
se registro el numero N de exposiciones de imagen espectral independientes para cada
observacin. Aqu se presentan los datos de 40 observaciones de asteroides obtenidas de
Science.

Numero de exposiciones de imagen espectral independientes para 40
observaciones de asteroides.
3
1
3
6
4
1
3
3
3
4
2
1
3
2
2
2
1
3
2
2
4
3
2
3
1
2
1
2
3
6
3
2
2
1
2
4
3
1
1
2

a) Localice y y s en el listado
b) Construya los intervalos
s y s y s y 3 , 2 ,



UNIDAD I / ESTADISTICA DESCRIPTIVA.





38

1.4.3 Desviacin media.
La desviacin media o desviacin promedio de un conjunto de N nmeros x
1
, x
2
, . . . , x
N
es
abreviada por MD y se define como:
N
x x
D M
N
j
j
=

=
1
. .

Ejemplo: hallar la desviacin media del conjunto 2, 3, 6, 8, 11
media aritmetica =
2 3 + 6 + 8 + 11 +
5
6 =
con mathcad
mean 2 3 , 6 , 8 , 11 , ( ) 6 =
desviacion media
MD =
2 6 3 6 + 6 6 + 8 6 + 11 6 +
5
2.8 =


1.4.4 Desviacin mediana.
Es la media aritmtica de los valores absolutos de las desviaciones de los valores de la
variable con respecto a la mediana.
n
n Me x
D
j j
Me


=

1.4.5 Rango.
La ms simple de todas es el rango, definido como la diferencia entre el valor mximo y
mnimo del grupo de datos. De fcil clculo y comprensin, tiene la desventaja de ser la
medida ms grosera de la dispersin.

Dos grupos de datos, con muy distinta dispersin pueden llegar a tener rangos similares. Uno
de ellos puede tener el 99% de los valores junto al mnimo y el otro el 99% junto al mximo,
pero al tener extremos iguales, sus rangos resultaran iguales a pesar de ser tan dismiles
intrnsecamente.

RANGO = Mx. datos - Mn. datos


1.5 Pa

1.5.1 La
Sean, x
1

observacio
o bien

Ejemplo: La


1.5.2 La
A su vez,
cuadrada d
de su valor
media.



armetros
a media.
,x
2
,....,x
n

ones al valor
a media aritm
a desviaci
el desvo e
de las respec
r medio. Se c
para dato
, n obser
dado por:
N
x
x
x

=
=
mtica de los
8
= x
n tpica.
estndar pob
ctivas varian
calcula a par
UNID
os agrupa
rvaciones m
N
x
N
x x x

+ + +
3 2 1
s nmeros 8
5
12 5 3 + + +
blacional (
nzas y Repre
rtir de todas

=
=
k
j
f
S
1
DAD I / ES
dos.
mustrales,
x
n

=
+ +...
, 3. 5, 12 y 1
5
38 10 2
=
+
) y el mue
esenta el ale
las desviacio
( )

k
j
j
j j
f
x x f
1
2
STADISTIC
definiremos

N
x
N
j
j
=1

0
6 . 7 =
estral ( s) s
ejamiento de
ones individu
CA DESCR
promedio
e obtienen c
una serie d
uales con res
RIPTIVA.


39
de estas
con la raz
e nmeros
specto a la
UNIDAD I / ESTADISTICA DESCRIPTIVA.





40











68.2 5 -2.63586.9477 34.7385
69.3 11 -1.53582.3588 25.9472
70.4 14 -0.43580.1900 2.6595
71.5 11 0.6642 0.4411 4.8521
72.6 7 1.7642 3.1122 21.7856
73.7 3 2.8642 8.2034 24.6101
74.8 2 3.9642 15.7145 31.4290
Total 53 146.0219

70.8358
Desv.
Est. = 1.6599

Y la desviacin media para datos agrupados:

=
=

=
k
j
j
k
j
j j
f
x x f
DM
1
1


















x x
j

x x f
j j

68.2 5 2.6358 13.1792
69.3 11 1.5358 16.8943
70.4 14 0.4358 6.1019
71.5 11 0.6642 7.3057
72.6 7 1.7642 12.3491
73.7 3 2.8642 8.5925
74.8 2 3.9642 7.9283
Total 53 72.3509

70.8358
Desv. Med. = 1.3651
j
x
j
f x x
j

2
) ( x x
j
( )
2
x x f
j j

= x
j
x
j
f
= x
UNIDAD I / ESTADISTICA DESCRIPTIVA.





41

1.6 Distribucin de frecuencias.

Reglas generales para formar distribuciones de frecuencias
Paso 1: Calcular el intervalo de los datos :

Intervalo = Observacin Grande Observacin Pequea.

Paso 2: Dividir el intervalo entre 5 y 20 clases de igual anchura. El nmero de clases es
arbitrario, pero se obtiene una mejor descripcin grafica si se utiliza pocas clases cuando el
nmero de datos es pequeo y un mayor nmero de clases cuando el conjunto de datos es
grande. La frontera de la clases ms baja ( o primera) deber estar situada por debajo de la
medicin ms pequea, y el ancho de la clase debe ser tal que ninguna observacin pueda
quedar exactamente en la frontera de una clases. Se pueden calcular de la siguiente
manera:
clase de anchura
clases
Intervalo

#
=

O bien,
clase
clases de anchura
Intervalo
# =

Si la precisin es:
una unidad entera (1) entonces es 1/2 = 0.5, la primera clases comenzar restndole 0.5
a la observacin mas pequeo
una unidad decimal (0.1) entonces es 0.1/2 = 0.05, la primera clases empieza restndole
0.05 a la observacin mas pequea.

Paso 3: para cada clase, contar el numero de observaciones que caen en esa clase. Este
nmero es la frecuencia de clases.

Datos obtenidos.
Por ejemplo: en la tabla que sigue se recogen los pesos de 40 estudiantes varones de una
universidad, con precisin de 1 libra. Construir una distribucin de frecuencias.

UNIDAD I / ESTADISTICA DESCRIPTIVA.





42

138
146
168
146
161
164
158
126
173
145
150
140
138
142
135
132
147
176
147
142
144
136
163
135
150
125
148
119
153
156
149
152
154
140
145
157
144
165
135
128

El mtodo textual tiene una ventaja importante con respecto a los otros: se puede influenciar
al lector. El autor puede resaltar ciertas cifras de su inters, puede remarcar conceptos
apropiados para sus fines y hacer pasar desapercibidos a los otros. Se puede focalizar la
atencin del lector, de tal manera que pase por alto ciertos datos evitando que saque sus
propias conclusiones.


1.6.1 Distribuciones numricas.
Mtodo de presentacin de datos tabular.
Una ordenacin es un conjunto de datos numricos en orden creciente o decreciente. Este
mtodo de presentacin de la informacin consiste en presentar los datos por medio de una
tabla o cuadro.

Ejercicio: Los tiempos de CPU que se indican en la tabla representan el tiempo ( en
segundos) que 25 trabajos estuvieron en control de la unidad central de proceso (CPU) de
una computadora mainframe grande. Estos 25 valores representan una muestra
seleccionada de los 1000 tiempos de CPU .
Tabla de muestra de n = 25 tiempos de
CPU de trabajos (en segundos ).
1.17
1.23
0.15
0.19
0.92
1.61
3.76
2.41
0.82
0.75
1.16
1.94
0.71
0.47
2.59
1.38
0.96
0.02
2.16
3.07
3.53
4.75
1.59
2.01
1.40




UNIDAD I / ESTADISTICA DESCRIPTIVA.





43

1.6.2 Distribuciones categricas.
Al resumir grandes colecciones de datos, es til distribuirlos en clases o categoras, y
determinar el nmero de individuos que pertenecen a cada clase, llamado frecuencia de
clase. Una disposicin tabular de los datos por clase junto con las correspondientes
frecuencias de clase, se llama distribucin de frecuencia ( o tabla de frecuencia).

Ejemplos:
Intervalo = 4.75 0.02 = 4.73

Anchura aproximada de la clase es:

7 . 0 676 . 0
7
73 . 4
7
int
= =
ervalo


Nota: si deseo saber la anchura de la clases entonces selecciono de manera arbitraria el
numero de clases en este caso el numero 7 indica el numero de clases ( filas) y el resultado
es la anchura de cada clases.

Como la tabla contiene datos con valores de centsimas entonces el grado de precisin es de
0.01 por lo tanto se deber de utilizar 0.01/2 = 0.005. por lo cual al intervalo menor que es de
0.02 se le restara 0.05. Ahora el primer valor en la tabla iniciara en 0.015.

clase Intervalo de
clase
Tabulacin Frec.
1
2
3
4
5
6
7
0.015 0.715
0.715 1.415
1.415 2.115
2.115 2.815
2.815 3.515
3.515 4.215
4.215 4.915
/////
/////////
////
///
/
//
/
5
9
4
3
1
2
1




UNIDAD I / ESTADISTICA DESCRIPTIVA.





44

1.6.3 Distribuciones acumuladas.

Intervalo de
clase
Frecuencia
de clase
Distribucin
acumulada
0.015 0.715
0.715 1.415
1.415 2.115
2.115 2.815
2.815 3.515
3.515 4.215
4.215 4.915
5
9
4
3
1
2
1
5
14
18
21
22
24
25
Total 25




1.6.4 Distribuciones porcentuales.
En esta distribucin tenemos a la distribucin de frecuencia relativa y ojivas porcentuales que
se encuentra multiplicando la frecuencia relativa por cien para que los resultados estn en
porcentajes . Y la suma de todas estas frecuencias resulte al 100 %.
N
Frecuencia
relativa Frecuencia =
100 * Re . l Frec ojivas y relativa Frecuencia =


0
5
10
15
20
25
30
1 2 3 4 5 6 7
Distribucion acumulada
UNIDAD I / ESTADISTICA DESCRIPTIVA.





45

Intervalo de clase Frec. Frec. relativa frecuencia relativa y ojivas porcentual (%)
0.015 0.715
0.715 1.415
1.415 2.115
2.115 2.815
2.815 3.515
3.515 4.215
4.215 4.915

5
9
4
3
1
2
1
0.20
0.36
0.16
0.12
0.04
0.08
0.04
20
36
16
12
4
8
4
Total 25 1.00



1.6.5 Distribuciones porcentuales acumuladas.
Las distribuciones porcentuales acumuladas resulta dividiendo la distribucin acumulada
entre la frecuencia total y multiplicada por 100 para que los resultados resulten en porcentajes
y al terminar el ultimo calculo debe ser al cien por ciento.
Intervalo de clase Frec. Distribucin acumulada Dist. porcentuales acumulada (%)
0.015 0.715
0.715 1.415
1.415 2.115
2.115 2.815
2.815 3.515
3.515 4.215
4.215 4.915
5
9
4
3
1
2
1
5
14
18
21
22
24
25
20
56
72
84
88
96
100
Total 25
0
5
10
15
20
25
30
35
40
1 2 3 4 5 6 7
Frecuencia relativa porcentual
UNIDAD I / ESTADISTICA DESCRIPTIVA.





46

100 *
.
N
A D
DPA =




1.7 Tcnicas de agrupacin de datos.

1.7.1 Lmites de clase.
118 y 122 se llaman limite de clase
118 se llama limite inferior y 122 limite superior de clase


1.7.2 Rango de clase.
El tamao o anchura de un intervalo de clase es la diferencia entre las fronteras de clase
superior e inferior.
C = 122.5 117.5 = 5

1.7.3 Fronteras de clase.
Si se dan valores con precisin de 1 unidad, el intervalo de clase 118 122 incluye
tericamente todas las medias desde 117.5 a 122.5 y se llaman frontera de clase o
verdaderos limites de clase; el menor 117.5 es la frontera inferior y el mayor 122.5 la frontera
superior.

0
20
40
60
80
100
120
1 2 3 4 5 6 7
Distribucion Porcentual Acumulada
UNIDAD I / ESTADISTICA DESCRIPTIVA.





47

1.7.4 Marca de clase.
La marca de clase es el punto medio del intervalo de clase y se obtiene promediando los
limites inferior y superior de clase . As que las marcas de clase del intervalo 118 122 es
(118 + 122 ) / 2 = 120

1.7.5 Intervalo de clase.
Los valores de 118 122 se les llaman intervalo de clases

Ejercicio: en la tabla siguiente se recogen los pesos de 40 estudiantes varones de una
universidad, con precisin de 1 libra. Construir:
a) una distribucin de frecuencia.
b) Distribucin de frecuencia acumulada
c) Grafica de la distribucin de frecuencia acumulada
d) Frecuencia relativa
e) Frecuencia relativa y ojivas porcentuales
f) Grafica de la frecuencia relativa y ojivas porcentuales
g) Distribucin porcentuales acumuladas
h) Grafica de la distribucin porcentuales acumuladas

119 138 146 156
125 140 147 157
126 140 147 158
128 142 148 161
132 142 149 163
135 144 150 164
135 144 150 165
135 145 152 168
136 145 153 173
138 146 154 176

Los pesos son 176 y 119 lb.; El intervalo es 176 119 = 57 lb.
Si se usan 5 u 20 intervalos de clase su anchura ser:
11 4 . 11
5
57
= = o 3 85 . 2
20
57
= =
UNIDAD I / ESTADISTICA DESCRIPTIVA.





48

Una coleccin razonable es 5 lb.
Se inicia desde un valor de precisin antes para que se considere que los valores deben de
caer dentro del intervalo.


Grficos


Peso (lb.) Frecuencia Distribucin
acumulada
frecuencia
relativa
frecuencia
relativa y ojivas
porcentual (%)
Distribucin
porcentuales
acumulada (%)
118 122 1 1 0.025 2.5 2.5
123 127 2 3 0.05 5 7.5
128 132 2 5 0.05 5 12.5
133 137 4 9 0.1 10 22.5
138 142 6 15 0.15 15 37.5
143 147 8 23 0.2 20 57.5
148 152 5 28 0.125 12.5 70
153 157 4 32 0.1 10 80
158 162 2 34 0.05 5 85
163 167 3 37 0.075 7.5 92.5
168 172 1 38 0.025 2.5 95
173 - 177 2 40 0.05 5 100
Total 40 1.00 100
a) Distribucin acumulada b) Distribucin relativa y ojivas c) Frecuencia porcentual
acumulada


0
10
20
30
40
50
1 2 3 4 5 6 7 8 9 10 11 12
Distribucin acumulada
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9 10 11 12
frecuencia relativa y ojivas porcentual (%)
0
20
40
60
80
100
120
1 2 3 4 5 6 7 8 9 10 11 12
frecuencia porcentual acumulada
UNIDAD I / ESTADISTICA DESCRIPTIVA.





49



Ejercicio. Tabla de una distribucin de frecuencia de puntuaciones de un examen final de lgebra

Grado Numero de estudiante Marca de clases (x) fx
30 39
40 49
50 59
60 69
70 79
80 89
90 - 100
1
3
11
21
43
32
9
34.5
44.5
54.5
64.5
74.5
84.5
95.0
34.5
133.5
599.5
1354.5
3203.5
2704
855
N = f = 120 fx = 8884.5

a) marca de clases
x
1
= 34.5; x
2
=44.5; x
3
= 54.5 ; x
4 =
64.5 ; x
5
= 74.5; x
6
= 84.5 ; x
7
= 95.0

b) media aritmtica
04 . 74
120
5 . 8884
= = =

N
fx
x


c) mediana
120/2 = 60
1 + 3 + 11 + 21 = 36
1 + 3 + 11 + 21 + 43 = 79
70 79 43 clase mediana
110 120 130 140 150 160 170 180
PESO
0
2
4
6
8
10
12
14
F
r
e
q
u
e
n
c
y
Mean = 146.8
Std. Dev. = 13.051
N = 40
Histogram
UNIDAD I / ESTADISTICA DESCRIPTIVA.





50

( ) 08 . 75 10
43
36
2
120
5 . 69 =


+ = mediana
d) moda
70 79 43
( ) 17 . 76 10
11 22
22
5 . 69 mod =

+
+ = a


Problema: En la tabla siguiente se recogen los pesos de 40 estudiantes varones de una
universidad con precisin de una libra.
Peso (lb.) Frecuencia (f)
118 126
127 135
136 144
145 153
154 162
163 171
172 180
3
5
9
12
5
4
2
N = f = 40

Hallar:
a) Marca de clases
b) Media aritmtica
c) Mediana y moda
d) trazar un histograma y polgono de frecuencia


1.7.6 Diagrama de tallos y hojas.
Un mtodo para iniciar el anlisis exploratorio de los datos, previo al uso de los mtodos
estadsticos tradicionales, y que adems proporciona informacin rpida, visual y es
relativamente nueva, es la representacin grfica de tallos y hoja. Esta representacin se
basa en la ordenacin de los datos a manera de grfico, pero sin llegar a ello, utilizando las
decenas y las unidades.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





51


78 93 61 100 70 83 88 74 97 72
66 73 76 81 83 64 91 70 77 86

Ahora pensaremos en cada uno de los datos separando las decenas de las unidades, es decir,
el nmero 51 se ver como 5 | 1.
6
7
8
9
10
1 6 4
8 0 4 2 3 6 0 7
3 8 1 3 6
3 7 1
0

Para entenderle un poco ms, hemos de decir que el primer rengln que dice 6 | 1 6 4 quiere
decir que entre la lista de datos se encuentran los valores 61, 66 y 64. Esta es la representacin
grfica tallos y hoja, donde cada rengln es una posicin de tallos y cada dgito de la derecha
es una hoja.

El procedimiento para realizarla es primero empezar con los tallo, es decir la columna de la
izquierda, y despus dato por dato ir llenando las hojas a la derecha de la lnea vertical, en el
tronco correspondiente. Adems, si se desean tener los datos ordenados, y hay gente que lo
prefiere as, se pueden ordenar las hojas en cada rengln para que la representacin quede
como sigue:
6
7
8
9
10
1 4 6
0 0 2 3 4 6 7 8
1 3 3 6 8
1 3 7
0

En realidad una representacin de tallos y hojas presenta la misma informacin que la lista
original de datos, pero de una manera mucho ms compacta (especialmente si la lista de datos
es ms grande) y manejable.

Ejemplo: Los tiempos de CPU que se indican en la tabla representan el tiempo (en segundos)
que 25 trabajos estuvieron en control de la unidad central de proceso (CPU) de una
UNIDAD I / ESTADISTICA DESCRIPTIVA.





52

computadora mainframe grande. Estos 25 valores representan una muestra seleccionada de los
1000 tiempos de CPU:

1.17
1.23
0.15
0.19
0.92
1.61
3.76
2.41
0.82
0.75
1.16
1.94
0.71
0.47
2.59
1.38
0.96
0.02
2.16
3.07
3.53
4.75
1.59
2.01
1.40

Ramas hojas Frecuencia
0
1
2
3
4
02 15 19 47 71 75 82 92
96
16 17 23 38 40 59 61 94
01 16 41 59
07 53 76
75
9
8
4
3
1
25


1.7.7 Diagrama de Pareto.
El Diagrama de Pareto constituye un sencillo y grfico mtodo de anlisis que permite
discriminar entre las causas ms importantes de un problema (los pocos y vitales) y las que lo
son menos (los muchos y triviales). El Diagrama de Pareto es una grfica en donde se
organizan diversas clasificaciones de datos por orden descendente, de izquierda a derecha por
medio de barras sencillas despus de haber reunido los datos para calificar las causas. De
modo que se pueda asignar un orden de prioridades.

Ventajas:
Ayuda a concentrarse en las causas que tendrn mayor impacto en caso de ser
resueltas.
Proporciona una visin simple y rpida de la importancia relativa de los problemas.
Ayuda a evitar que se empeoren alguna causas al tratar de solucionar otras y puede
ser resueltas.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





53

Su formato altamente visible proporciona un incentivo para seguir luchando por ms
mejoras.

Cundo se utiliza?
Al identificar un producto o servicio para el anlisis para mejorar la calidad.
Cuando existe la necesidad de llamar la atencin a los problema o causas de una forma
sistemtica.
Al identificar oportunidades para mejorar
Al analizar las diferentes agrupaciones de datos (ej: por producto, por segmento, del
mercado, rea geogrfica, etc.)
Al buscar las causas principales de los problemas y establecer la prioridad de las
soluciones
Al evaluar los resultados de los cambios efectuados a un proceso (antes y despus)
Cuando los datos puedan clasificarse en categoras
Cuando el rango de cada categora es importante

Pareto es una herramienta de anlisis de datos ampliamente utilizada y es por lo tanto til en la
determinacin de la causa principal durante un esfuerzo de resolucin de problemas. Este
permite ver cules son los problemas ms grandes, permitindoles a los grupos establecer
prioridades.

En casos tpicos, los pocos (pasos, servicios, tems, problemas, causas) son responsables por
la mayor parte el impacto negativo sobre la calidad. Si enfocamos nuestra atencin en estos
pocos vitales, podemos obtener la mayor ganancia potencial de nuestros esfuerzos por mejorar
la calidad.

Un equipo puede utilizar la Grfica de Pareto para varios propsitos durante un proyecto
para lograr mejoras:
Para analizar las causas
Para estudiar los resultados
Para planear una mejora continua
Las Grficas de Pareto son especialmente valiosas como fotos de antes y despus
para demostrar qu progreso se ha logrado. Como tal, la Grfica de Pareto es una
herramienta sencilla pero poderosa.

UNIDAD I / ESTADISTICA DESCRIPTIVA.





54

Cmo se utiliza?
Seleccionar categoras lgicas para el tpico de anlisis identificado (incluir el periodo
de tiempo).
Reunir datos. La utilizacin de un check List puede ser de mucha ayuda en este paso.
Ordenar los datos de la mayor categora a la menor
Totalizar los datos para todas las categoras
calcular el porcentaje del total que cada categora representa
trazar los ejes horizontales (x) y verticales (y primario - y secundario)
trazar la escala del eje vertical izquierdo para frecuencia (de 0 al total, segn se calcul
anteriormente)
de izquierda a derecha trazar las barras para cada categora en orden descendente. Si
existe una categora otros, debe ser colocada al final, sin importar su valor. Es decir,
que no debe tenerse en cuenta al momento de ordenar de mayor a menor la frecuencia
de las categoras.
trazar la escala del eje vertical derecho para el porcentaje acumulativo, comenzando
por el 0 y hasta el 100%
trazar el grfico lineal para el porcentaje acumulado, comenzando en la parte superior
de la barra de la primera categora (la mas alta)
dar un ttulo al grfico, agregar las fechas de cuando los datos fueron reunidos y citar la
fuente de los datos.
analizar la grfica para determinar los pocos vitales

Consejos para la construccin / interpretacin
Como hemos visto, un Diagrama de Pareto es un grfico de barras que enumera las categoras
en orden descendente de izquierda a derecha, el cual puede ser utilizado por un equipo para
analizar causas, estudiar resultados y planear una mejora contina.

Dentro de las dificultades que se pueden presentar al tratar de interpretar el Diagrama de
Pareto es que algunas veces los datos no indican una clara distincin entre las categoras. Esto
puede verse en el grfico cuando todas las barras son ms o menos de la misma altura.

Otra dificultad es que se necesita ms de la mitad de las categoras para sumar ms del 60%
del efecto de calidad, por lo que un buen anlisis e interpretacin depende en su gran mayora
de un buen anlisis previo de las causas y posterior recogida de datos.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





55

En cualquiera de los casos, parece que el principio de Pareto no aplica. Debido a que el mismo
se ha demostrado como vlido en literalmente miles de situaciones, es muy poco probable que
se haya encontrado una excepcin.

Es mucho ms probable que simplemente no se haya seleccionado un desglose apropiado de
las categoras.

Esto nos lleva a la conclusin que para llevar a cabo un proceso de Resolucin de Problemas
/Toma de Decisiones (RP/TD) es necesario manejar cada una de las herramientas bsicas de la
calidad, tanto desde el punto de vista terico como desde su aplicacin.

La interpretacin de un Diagrama de Pareto se puede definir completando las siguientes
oraciones de ejemplo:

Existen (nmero de categoras) contribuyentes relacionados con (efecto).

Pero estos (nmero de pocos vitales) corresponden al (nmero) % del total (efecto). Debemos
procurar estas (nmero) categoras pocos vitales, ya que representan la mayor ganancia
potencial para nuestros esfuerzos.

Relacin con otras herramientas
Un Diagrama de Pareto generalmente se relaciona con:
diagrama de Causa y Efecto (Ishikawa)
Check List de Revisin
Check List de reunin de datos
Matriz para la Planeacin de Acciones


Ejemplo: Un fabricante de heladeras desea analizar cules son los defectos ms frecuentes que
aparecen en las unidades al salir de la lnea de produccin.

Para esto, empez por clasificar todos los defectos posibles en sus diversos tipos:



UNIDAD I / ESTADISTICA DESCRIPTIVA.





56

Tipo de Defecto Detalle del Problema
Motor no detiene No para el motor cuando alcanza Temperatura
No enfra El motor arranca pero la heladera no enfra
Burlete Def. Burlete roto o deforme que no ajusta
Pintura Def. Defectos de pintura en superficies externas
Rayas Rayas en las superficies externas
No funciona Al enchufar no arranca el motor
Puerta no cierra La puerta no cierra correctamente
Gavetas Def. Gavetas interiores con rajaduras
Motor no arranca El motor no arranca despus de ciclo de parada
Mala Nivelacin La heladera se balancea y no se puede nivelar
Puerta Def. Puerta de refrigerador no cierra hermticamente
Otros Otros Defectos no incluidos en los anteriores

Posteriormente, un inspector revisa cada heladera a medida que sale de produccin registrando
sus defectos de acuerdo con dichos tipos.

Despus de inspeccionar 88 heladeras, se obtuvo una tabla como esta:

Tipo de Defecto Detalle del Problema Frec.
Burlete Def. Burlete roto o deforme que no ajusta 9
Pintura Def. Defectos de pintura en superficies externas 5
Gavetas Def. Gavetas interiores con rajaduras 1
Mala Nivelacin La heladera se balancea y no se puede nivelar 1
Motor no arranca El motor no arranca despus de ciclo de parada 1
Motor no detiene No para el motor cuando alcanza Temperatura 36
No enfra El motor arranca pero la heladera no enfra 27
No funciona Al enchufar no arranca el motor 2
Otros Otros Defectos no incluidos en los anteriores 0
Puerta Def. Puerta de refrigerador no cierra hermticamente 0
UNIDAD I / ESTADISTICA DESCRIPTIVA.





57

Puerta no cierra La puerta no cierra correctamente 2
Rayas Rayas en las superficies externas 4
Total: 88


Pero Cules son los defectos que aparecen con mayor frecuencia? Para hacerlo ms
evidente, antes de graficar podemos ordenar los datos de la tabla en orden decreciente de
frecuencia:

Tipo de Defecto Detalle del Problema Frec. Frec. Rel. Prop. acum.
Motor no
detiene
No para el motor cuando alcanza
Temperatura
36 0.4091
0.4091
No enfra El motor arranca pero la heladera no enfra 27 0.3068 0.7159
Burlete Def. Burlete roto o deforme que no ajusta 9 0.1023 0.8182
Pintura Def. Defectos de pintura en superficies externas 5 0.0568 0.8750
Rayas Rayas en las superficies externas 4 0.0455 0.9205
No funciona Al enchufar no arranca el motor 2 0.0227 0.9432
Puerta no cierra La puerta no cierra correctamente 2 0.0227 0.9659
Gavetas Def. Gavetas interiores con rajaduras 1 0.0114 0.9773
Mala Nivelacin La heladera se balancea y no se puede
nivelar
1 0.0114
0.9886
Motor no
arranca
El motor no arranca despus de ciclo de
parada
1 0.0114
1.0000
Puerta Def. Puerta de refrigerador no cierra
hermticamente
0 0.0000
1.0000
Otros Otros Defectos no incluidos en los anteriores 0 0.0000 1.0000
Total: 88 1.0000

Vemos que la categora otros siempre debe ir al final, sin importar su valor. De esta manera, si
hubiese tenido un valor ms alto, igual debera haberse ubicado en la ltima fila.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





58

Ahora resulta evidente cuales son los tipos de defectos ms frecuentes. Podemos observar
que los 3 primeros tipos de defectos se presentan en el 82 % de las heladeras,
aproximadamente. Por el Principio de Pareto, concluimos que: La mayor parte de los defectos
encontrados en el lote pertenece slo a 3 tipos de defectos, de manera que si se eliminan las
causas que los provocan desaparecera la mayor parte de los defectos.


Ejemplo: Considere un problema de inters para la Divisin de Economa Comercial ( BED ,
Business Economics Divisin) del Departamento del trabajo de Estados Unidos. Cada ao, la
BED monitorea las empresas que fracasan y clasifican cada fracaso en categoras. Estas
clasificaciones se basan en opiniones de acreedores informados y los informes la BED. Estas
frecuencias se muestran en el diagrama de Pareto.

Causas subyacentes Frec. Frec. Rel. Proporcin acum.
Incompetencias
Experiencia desequilibrada
Falta de experiencia gerencial
Falta de experiencia de lnea
Causas desconocidas
Otras causas
698
314
236
111
83
2
0.477
0.215
0.161
0.076
0.057
0.014
0.477
0.692
0.853
0.929
0.986
1.000
Totales 1463 1.000




0.0000
0.5000
1.0000
1.5000
1 3 5 7 9 11
0
0.5
1
1.5
1 2 3 4 5 6
UNIDAD I / ESTADISTICA DESCRIPTIVA.





59

1.7.8 Diagrama de puntos.
78 93 61 100 70 83 88 74 97 72
66 73 76 81 83 64 91 70 77 86



1.8 Histograma.

1.8.1 Diagrama de barras.
En este tipo de grfica, sobre los valores de las variables se levantan barras estrechas de
longitudes proporcionales a las frecuencias correspondientes. Se utilizan para representar
variables cuantitativas discretas. Consiste en representar las cantidades con rectngulos de
igual base, y de altura proporcional a los valores respectivos. Los intervalos libres entre barras
tambin deben ser del mismo tamao, aunque a veces algunos autores las muestran pegadas.


1.8.2 Polgono de frecuencias.
Otra forma de representacin de un uso menos comn, y muy parecida a las grficas de lneas,
es el polgono de frecuencias. La diferencia fundamental entre ambas es que en el polgono de
frecuencias se aaden dos clases con frecuencias cero: una antes de la primera clase con
0
20
40
60
80
100
120
0 5 10 15 20 25
UNIDAD I / ESTADISTICA DESCRIPTIVA.





60

datos y otra despus de la ltima. El resultado es que se "sujeta" la lnea por ambos extremos al
eje horizontal y lo que podra ser una lnea separada del eje se convierte, junto con ste, en un
polgono.

El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigacin
durante el ao de 1990 en cinco pases (fuente: Revista "Ciencia y Desarrollo", 1994,
XIX(114):12):


Un polgono de frecuencia es un grafico de trozos de las frecuencias de clase con relacin a la
marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los
rectngulos de los histogramas. Se suelen aadirse longitudes PQ y RS a las marcas de clase
extremas como asociadas a una frecuencia de clase cero.



1.8.3 Ojivas.
Una grfica similar al polgono de frecuencias es la ojiva, pero sta se obtiene de aplicar
parcialmente la misma tcnica a una distribucin acumulativa y de igual manera que stas,
existen las ojivas mayor que y las ojivas menor que.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





61

Existen dos diferencias fundamentales entre las ojivas y los polgonos de frecuencias (y por
sto la aplicacin de la tcnica es parcial):

Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el
extremo izquierdo; para la ojiva menor que, con el derecho.

En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase.
Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.

Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que,
utilizando los datos que se usaron para ejemplificar el histograma:



La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que est
sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las
4:00 horas (en cuestiones temporales se dira: despus de las 4:00 horas). De forma anloga,
en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el nmero
de observaciones menores que la frontera sealada (en caso de tiempos sera el nmero de
observaciones antes de la hora que seala la frontera).

1.8.4 Grficas circulares.
En un diagrama de este tipo, los 360 de un crculo se reparten proporcionalmente a las
frecuencias de los distintos valores de la variable. Resultan muy adecuados cuando hay pocos
valores, o bien cuando el carcter que se estudia es cualitativo. El diagrama de sectores
siguiente refleja el resultado de una encuesta (realizada a 300 personas) sobre los tipos de
pelcula preferidos por el pblico en general:
UNIDAD I / ESTADISTICA DESCRIPTIVA.





62








1.9 Distribuciones mustrales.

Como una estadstica es una variable aleatoria que depende solo de la muestra observada,
debe tener una distribucin de probabilidad. Esta distribucin de probabilidad de una estadstica
se llama distribucin muestral. La distribucin muestral de la estadstica depende del tamao de
la poblacin, el tamao de las muestras y el mtodo de eleccin de las muestras

Si se selecciona n elementos de una poblacin de modo tal que cada conjunto de n elementos
de la poblacin tenga la misma probabilidad de ser seleccionado, se dice que los n elementos
constituyen una muestra aleatoria.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





63


El resultado de un experimento estadstico se puede registrar como un valor numrico o como
una representacin descriptiva. Cuando se lanza un par de dados y el total es un resultado de
inters, registramos un valor numrico. El estadstico se interesa en primer lugar en el anlisis
de los datos numricos. En cualquier estudio, el nmero de observaciones posibles puede ser
pequeo, grande pero finito o infinito. Por ejemplo si a los alumnos estudiantes de cierta
escuela se les hacen una pruebas de sangre y el tipo sanguneo se puede clasificar en ocho
maneras. Puede ser AB, A, B u O, con un signo mas o uno menos, que dependen de la
presencia o ausencia del antgeno R h. la clasificacin de tipos sanguneos solo podemos tener
tantas observaciones como estudiantes haya en la escuela. El proyecto por tanto tiene como
resultados un numero finito de observaciones.

Sea x
1
, x
2
, ..., x
n
variable aleatorias independientes, cada una con la misma distribucin de
probabilidad f (x). Definimos entonces a x
1
, x
2
, ..., x
n
como una muestra aleatoria de tamao n
de la poblacin f(x) y escribimos su distribucin de probabilidad conjunta como:
1 2 1 2
( , ,..., ) ( ) ( ),..., ( )
n n
F x x x f x f x f x =

La distribucin de probabilidad de una estadstica se llama distribucin muestral. La distribucin
de probabilidad de x se llama distribucin la media.

La distribucin muestral de una estadstica depende del tamao de la poblacin, el tamao de
las muestras y el mtodo de eleccin de las muestras.

Se debe ver las distribuciones mustrales de x y S
2
como el mecanismo a partir del cual
haremos finalmente inferencias de los parmetros y
2
.

Cuando las muestras son lo suficientemente grandes, se pueden hacer inferencias analticas
bastante extensas, con pocos y simples recursos, en comparacin con tcnicas ms refinadas
de la Estadstica. Esto es conveniente desde un punto de vista didctico.
La Teora del muestreo es el estudio de las relaciones entre una poblacin y las muestras que
se extraen de ella. Del anlisis de las muestras se pueden estimar o inferir datos de la poblacin
como su media ( ), varianza (
2
), etc., llamados parmetros poblacionales. Cuando la
poblacin sea finita y de un tamao manejable en tiempo y costo, los valores poblacionales se
calculan directamente, sin necesidad del muestreo.
UNIDAD I / ESTADISTICA DESCRIPTIVA.





64

Uno de los propsitos de la estadstica inferencial es estimar las caractersticas poblacionales
desconocidas, examinando la informacin obtenida de una muestra, de una poblacin. El
punto de inters es la muestra, la cual debe ser representativa de la poblacin objeto de
estudio. Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras
reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden hacer
observaciones probabilsticas sobre una poblacin cuando se usan muestras representativas
de la misma.

Muestras Aleatorias
Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan muestras
por muchas razones; una enumeracin completa de la poblacin, llamada censo, puede ser
econmicamente imposible, o no se cuenta con el tiempo suficiente.

A continuacin se ver algunos usos del muestreo en diversos campos:
1. Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinin pblica y el apoyo en las elecciones.
2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan para
determinar la eficiencia de una tcnica o programa de enseanza.
3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la calidad.
4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban la
eficacia de una tcnica o de un frmaco nuevo.
5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la produccin los
efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los criterios
del pblico sobre cuestiones relacionadas con el bienestar y la seguridad nacional.

Tipos de distribuciones mustrales:
Distribucin muestral de la media con varianza conocida.
Distribucin muestral de diferencia de medias.
Distribucin muestral de proporcin.
Distribucin muestral de diferencia de proporciones.
Distribucin muestral de varianza.
Distribucin muestral de razn de varianza.
























































UNIDAD 2
PROBABILIDAD
Objetivo:
Conocer los conceptos bsicos
de probabilidad para aplicarlos
en la solucin de Problemas.
UNIDAD II / PROBABILIDAD.





66
2.1 Teora elemental de probabilidad.

La Teora de la Probabilidad constituye la base o fundamento de la Estadstica, ya que las
inferencias que hagamos sobre la poblacin o poblaciones en estudio se movern dentro de
unos mrgenes de error controlado, el cual ser medido en trminos de probabilidad.

As pues, es comn y corriente hablar de la probabilidad de un suceso, entendiendo como tal
un nmero entre 0 y 1, de forma que si ste es cercano a 0 (a l), el suceso tiene poca
(mucha) probabilidad de ocurrir o haber ocurrido.

Vemos, pues, que conviene precisar en cada caso de qu se est hablando, tratando de
evitar afirmaciones tan comunes en los medios de comunicacin como la de "... maana es
posible que llueva pero no es probable...".

2.1.1 Concepto clsico y como frecuencia relativa.
E n f o q u e c l as i c o o
a p r i o r i
C o n c ep t o
E n f o q u e c o m o f r ec u en c i a r el at i v a o
a p o s t er i o r i



Concepto clsico
Est basado en el concepto de resultados igualmente verosmiles y motivado por el
denominado Principio de la Razn Insuficiente, el cual postula que si no existe un
fundamento para preferir una entre varias posibilidades, todas deben ser consideradas
equiprobables.

As, en el lanzamiento de una moneda perfecta la probabilidad de cara debe ser igual que la
de cruz y, por tanto, ambas iguales a 1/2. De la misma manera, la probabilidad de cada uno
de los seis sucesos elementales asociados al lanzamiento de un dado debe ser 1/6. Laplace
recogi esta idea y formul la regla clsica del cociente entre casos favorables y casos
posibles, supuestos stos igualmente verosmiles.

El problema aqu surge porque en definitiva igualmente verosmil es lo mismo que
igualmente probable, es decir, se justifica la premisa con el resultado. Adems qu ocurre
UNIDAD II / PROBABILIDAD.





67
cuando estamos considerando un experimento donde no se da esa simetra?, o, qu hacer
cuando el nmero de resultados posibles es infinito?.

Si un suceso E puede ocurrir en h maneras diferentes de un nmero total de n maneras
posibles, todos igualmente factibles. Entonces la probabilidad de que ocurra E (o sea un
xito) se denota por
p = Pr { E }= h / n

La probabilidad de que no ocurra E (o sea un fracaso) se denota por
q = Pr { no E }
q = ( n h ) / n
q = 1 h /n
q = 1 - p
q = 1 - Pr { E }
As pues, p + q = 1 , es decir,

Pr { E } + Pr {no E } = 1.

El suceso no E se denotara por E.

Ejemplo: sea e el suceso de que al tirar un dado una vez salga un 3 o un 4. Hay seis formas
de caer el dado, dando 1, 2, 3, 4, 5, o 6, como E puede ocurrir de dos formas tenemos:

p = Pr { E }= 2/6 = 1/3

La probabilidad de que no salga ni 3 ni 4 es:
q = Pr { no E }= 1 1/3 = 2/3

Concepto frecuentista
Es un hecho, empricamente comprobado, que la frecuencia relativa de un suceso tiende a
estabilizarse cuando la frecuencia total aumenta. Surge as el concepto frecuentista de la
probabilidad de un suceso como un nmero ideal al que converge su frecuencia relativa
cuando la frecuencia total tiende a infinito.

UNIDAD II / PROBABILIDAD.





68
As, solemos afirmar que la probabilidad de que salga un seis al tirar un dado es 1/6 porque
al hacer un gran nmero de tiradas su frecuencia relativa es aproximadamente esa. El
problema radica en que al no poder repetir la experiencia infinitas veces, la probabilidad de
un suceso ha de ser aproximada por su frecuencia relativa para un n suficientemente
grande, y cun grande es un n grande? 0, qu hacer con aquellas experiencias que solo
se pueden repetir una vez?

Si despus de n repeticiones de un experimento, donde n es muy grande, un suceso ocurre
h veces entonces la probabilidad del suceso es h / n. Esto tambin se llama la probabilidad
estimada o emprica, de un suceso se toma como la frecuencia relativa de ocurrencia del
suceso cuando el nmero de observaciones es muy grande.

Ejemplo: Si en 1000 tiradas de una moneda salen 529 caras, la frecuencia relativa de caras
es: 529/1000 = 0.529

Definicin formal de Probabilidad
Los anteriores conceptos de lo que debera ser la probabilidad de un suceso, llevaron a
Kolmogorov a dar una definicin axiomtica de probabilidad. Es decir, a introducir rigor
matemtico en el concepto de probabilidad, de forma que se pudiera desarrollar una teora
slida sobre el concepto definido.

As, llamaremos probabilidad a una aplicacin
[ ] 1 , 0 : a A P

Tal que:
Axioma 1: Para todo suceso A de A sea ( ) 0 A P
Axioma 2: Sea P() = 1
Axioma 3: Para toda coleccin de sucesos incompatibles, { }
i
A con =
j i
A A j i ,
debe ser
( )

=
=

1 1 i
i
i
i
A P A P
U

UNIDAD II / PROBABILIDAD.





69
Obsrvese que esta definicin no dice cmo asignar las probabilidades ni siquiera a los
sucesos elementales. Solo dice que cualquier asignacin que hagamos debe verificar estos
tres axiomas para que pueda llamarse Probabilidad.

2.1.2 Interpretacin subjetiva de la probabilidad.
Concepto subjeti vo
Se basa en la idea de que la probabilidad que una persona da a un suceso debe depender
de su juicio y experiencia personal, pudiendo dar dos personas distintas probabilidades
diferentes a un mismo suceso. Estas ideas pueden formalizarse, y si las opiniones de una
persona satisfacen ciertas relaciones de consistencia, puede llegarse a definir una
probabilidad para los sucesos. El principal problema a que da lugar esta definicin es, como
antes dijimos, que dos personas diferentes pueden dar probabilidades diferentes a un mismo
suceso.
La probabilidad subjetiva de un evento se la asigna la persona que hace el estudio, y
depende del conocimiento que esta persona tenga sobre el tema. Precisamente por su
carcter de subjetividad no se considera con validez cientfica, aunque en la vida diaria es de
las ms comunes que se utilizan al no apoyarse ms que en el sentido comn y los
conocimientos previos, y no en resultados estadsticos.

2.2 Probabilidad de eventos.

2.2.1 Definicin de espacio muestral.
La Estadstica, y por tanto el Clculo de Probabilidades, se ocupan de los denominados
fenmenos o experimentos aleatorios. El conjunto de todos los resultados posibles
diferentes de un determinado experimento aleatorio se denomina Espacio Muestral asociado
a dicho experimento y se suele representar por . A los elementos de se les denomina
sucesos elementales.

As por ejemplo, el espacio muestral asociado al experimento aleatorio consistente en el
lanzamiento de una moneda es = {Cara, Cruz}; el espacio muestral asociado al
lanzamiento de un dado es ={1, 2, 3, 4, 5, 6}, siendo Cara y Cruz los sucesos elementales
asociados al primer experimento aleatorio y 1, 2, 3, 4, 5 y 6 los seis sucesos elementales del
segundo experimento aleatorio.
UNIDAD II / PROBABILIDAD.





70
A pesar de la interpretacin que tiene el espacio muestral, no es ms que un conjunto
abstracto de puntos (los sucesos elementales), por lo que el lenguaje, los conceptos y
propiedades de la teora de conjuntos constituyen un contexto natural en el que desarrollar el
Clculo de Probabilidades.

Sea A el conjunto de las partes de, es decir, el conjunto de todos los subconjuntos de . En
principio, cualquier elemento de A, es decir, cualquier subconjunto del espacio muestral
contendr una cierta incertidumbre, por lo que trataremos de asignarle un nmero entre 0 y 1
como medida de su incertidumbre.

En Clculo de Probabilidades dichos subconjuntos reciben en el nombre de sucesos, siendo
la medida de la incertidumbre su probabilidad. La tripleta (,A,P) recibe el nombre de
espacio probabilstico.

Por tanto, asociado a todo experimento aleatorio existen tres conjuntos: El espacio muestral
, la clase de los sucesos, es decir, el conjunto de los elementos con incertidumbre asociados
a nuestro experimento aleatorio A, y una funcin real,
[ ] 1 , 0 : a A P

La cual asignar a cada suceso (elemento de A) un nmero entre cero y uno como medida
de su incertidumbre.

Advertimos no obstante, que la eleccin del espacio muestral asociado a un experimento
aleatorio no tiene por qu ser nica, sino que depender de que sucesos elementales
queramos considerar como distintos y del problema de la asignacin de la probabilidad
sobre esos sucesos elementales.

Problema: Liste los elementos de cada uno de los espacios mustrales siguientes:
a) El conjunto de enteros entre 1 y 50 divisibles entre 8
b) El conjunto S = {x | x
2
+ 4x 5 = 0}
c) Describir un espacio muestral para una tirada de un par de dados
Solucin:
a) S = {8, 16, 24, 32, 40, 48 };
b) S = {-5, 1}

UNIDAD II / PROBABILIDAD.





71
c)
(1,6)
(1,5)
(1,4)
(1,3)
(1,2)
(1,1)
(2,6)
(2,5)
(2,4)
(2,3)
(2,2)
(2,1)
(3,6)
(3,5)
(3,4)
(3,3)
(3,2)
(3,1)
(4,6)
(4,5)
(4,4)
(4,3)
(4,2)
(4,1)
(5,6)
(5,5)
(5,4)
(5,3)
(5,2)
(5,1)
(6,6)
(6,5)
(6,4)
(6,3)
(6,2)
(6,1)

2.2.2 Discreto y continuo.
Modelos discretos: Obedecen a la generacin de variables aleatorias discretas generalmente
asociadas a la frecuencia de eventos.

Modelos continuos que generalmente se usan en la modelacin individual de los montos o
prdidas que de alguna u otra manera puedan afectar la caja de la empresa.


2.2.3 Definicin de evento.
Un evento es un subconjunto de un espacio muestral. La probabilidad de un evento A es
igual a la suma de las probabilidades de los sucesos simples del evento A.

2.2.4 Diagramas de Venn.
La relacin entre eventos y el correspondiente espacio muestral se puede ilustras de forma
grafica mediante diagramas de Venn. En un diagrama de Venn representamos el espacio
muestral como un rectngulo y los eventos con crculos trazados dentro del rectngulo. Un
universo U puede representarse geomtricamente por el conjunto de puntos dentro de un
rectngulo. Tales diagramas denominados diagramas de Venn, sirven para darnos una
intuicin geomtrica respecto a las posibles relaciones entre conjuntos.

2.2.5 Simbologa, uniones e intersecciones.
La unin de dos eventos A y B es el evento que ocurre si A o B, o ambos, ocurren en una
sola realizacin del experimento. Denotaremos la unin de los eventos A y B mediante el
smbolo . B A
UNIDAD II / PROBABILIDAD.





72

Interseccin: Dados dos conjuntos cualesquiera A y B llamamos "Interseccin" de A y B al
conjunto formado por todos los elementos que pertenecen a A y pertenecen a B.
Simblicamente: B A

Diferencia: Dados dos conjuntos cualesquiera A y B llamamos "Diferencia" de A "menos" B
al conjunto formado por los elementos que pertenecen a A y no pertenecen a B.
Simblicamente: A - B

Complemento: Dados dos conjuntos cualesquiera A y B con B A (B Subconjunto de A)
llamamos "Complemento de B respecto a A" al conjunto de elementos que pertenecen a A y
no a B, esto es lo que le falta a B para ser igual a A.
Simblicamente: (A B )

UNIDAD II / PROBABILIDAD.





73
2.3 Tcnicas de conteo.

Qu son las tcnicas de conteo?. Las tcnicas de conteo son aquellas que son usadas
para enumerar eventos difciles de cuantificar.

Se les denomina tcnicas de conteo a las combinaciones, permutaciones y diagrama de
rbol, hay que destacar que stas nos proporcionan la informacin de todas las maneras
posibles en que ocurre un evento determinado.

Las bases para entender el uso de las tcnicas de conteo son el principio multiplicativo y el
aditivo, los que a continuacin se definen y se hace uso de ellos.

Anlisis combinatorio.
En muchos casos el nmero de puntos mustrales en un espacio muestral no es muy
grande y as la enumeracin o cuenta directa de los puntos del muestreo necesario para
obtener las probabilidades no es difcil. Sin embargo, surgen problemas cuando la cuenta
directa se convierte en una imposibilidad prctica. En tales casos se emplea el anlisis
combinatorio, que podra llamarse una forma sofisticada de contar.

Principio aditi vo.
A menudo es ms fcil calcular la probabilidad de algn evento a partir del conocimiento de
las probabilidades de otros eventos. Esto puede ser cierto si el evento en cuestin se puede
representar como la unin de otros dos eventos o como el complemento de algn evento. A
continuacin se presenta varias leyes importantes que con frecuencia simplifica el clculo de
probabilidades. La primera regla aditiva se aplica a uniones de eventos.

Si se desea llevar a efecto una actividad, la cul tiene formas alternativas para ser realizada,
donde la primera de esas alternativas puede ser realizada de M maneras o formas, la
segunda alternativa puede realizarse de N maneras o formas ..... y la ltima de las
alternativas puede ser realizada de W maneras o formas, entonces esa actividad puede ser
llevada a cabo de,

M + N + .........+ W maneras o formas

UNIDAD II / PROBABILIDAD.





74
Problema: Una persona desea comprar una lavadora de ropa, para lo cual ha pensado que
puede seleccionar de entre las marcas Whirpool, Easy y General Electric, cuando acude a
hacer la compra se encuentra que la lavadora de la marca W se presenta en dos tipos de
carga ( 8 u 11 kilogramos), en cuatro colores diferentes y puede ser automtica o
semiautomtica, mientras que la lavadora de la marca E, se presenta en tres tipos de carga
(8, 11 o 15 kilogramos), en dos colores diferentes y puede ser automtica o semiautomtica
y la lavadora de la marca GE, se presenta en solo un tipo de carga, que es de 11
kilogramos, dos colores diferentes y solo hay semiautomtica. Cuntas maneras tiene esta
persona de comprar una lavadora?

Solucin:
M = Nmero de maneras de seleccionar una lavadora Whirpool
N = Nmero de maneras de seleccionar una lavadora de la marca Easy
W = Nmero de maneras de seleccionar una lavadora de la marca General Electric

M = 2 x 4 x 2 = 16 maneras
N = 3 x 2 x 2 = 12 maneras
W = 1 x 2 x 1 = 2 maneras

M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora

Problema: Rafael Luna desea ir a las Vegas o a Disneylandia en las prximas vacaciones
de verano, para ir a las Vegas l tiene tres medios de transporte para ir de Chihuahua al
Paso Texas y dos medios de transporte para ir del Paso a las Vegas, mientras que para ir
del paso a Disneylandia l tiene cuatro diferentes medios de transporte,
a) Cuntas maneras diferentes tiene Rafael de ir a las Vegas o a Disneylandia?,
b) Cuntas maneras tiene Rafael de ir a las Vegas o a Disneylandia en un viaje
redondo, si no se regresa en el mismo medio de transporte en que se fue?.

Solucin:
a) V = maneras de ir a las Vegas
D = maneras de ir a Disneylandia

V = 3 x 2 = 6 maneras
D = 3 x 4 = 12 maneras
V + D = 6 + 12 = 18 maneras de ir a las Vegas o a Disneylandia
UNIDAD II / PROBABILIDAD.





75
b) V = maneras de ir y regresar a las Vegas D = maneras de ir y regresar a
Disneylandia

V = 3 x 2 x 1 x 2 = 12 maneras
D = 3 x 4 x 3 x 2 = 72 maneras
V + D = 12 + 72 = 84 maneras de ir a las Vegas o a Disneylandia en un viaje redondo

Cmo podemos distinguir cuando hacer uso del principio multiplicativo y cuando del
aditivo?

Es muy simple, cuando se trata de una sola actividad, la cual requiere para ser llevada a
efecto de una serie de pasos, entonces haremos uso del principio multiplicativo y si la
actividad a desarrollar o a ser efectuada tiene alternativas para ser llevada a cabo, haremos
uso del principio aditivo.

Principio multiplicati vo.
Si se desea realizar una actividad que consta de r pasos, en donde el primer paso de la
actividad a realizar puede ser llevado a cabo de N
1
maneras o formas, el segundo paso de
N
2
maneras o formas y el r-simo paso de N
r
maneras o formas, entonces esta actividad
puede ser llevada a efecto de;

N
1
x N
2
x ..........x N
r
maneras o formas

El principio multiplicativo implica que cada uno de los pasos de la actividad debe ser llevado
a efecto, uno tras otro.

Problema: Cuntas placas para automvil pueden ser diseadas si deben constar de tres
letras seguidas de cuatro nmeros, si las letras deben ser tomadas del abecedario y los
nmeros de entre los dgitos del 0 al 9?,
a) Si es posible repetir letras y nmeros,
b) No es posible repetir letras y nmeros,
c) Cuntas de las placas diseadas en el inciso b empiezan por la letra D y empiezan
por el cero,
d) Cuantas de las placas diseadas en el inciso b empiezan por la letra D seguida de la
G.
UNIDAD II / PROBABILIDAD.





76
Solucin:
Considerando 26 letras del abecedario y los dgitos del 0 al 9
a) 26 x 26 x 26 x 10 x 10 x 10 x 10 = 175,760,000 placas para automvil.
b) 26 x 25 x 24 x 10 x 9 x 8 x 7 = 78,624,000 placas para automvil
c) 1 x 25 x 24 x 1 x 9 x 8 x 7 = 302,400 placas para automvil
d) 1 x 1 x 24 x 10 x 9 x 8 x 7 = 120,960 placas para automvil

Problema: Cuntos nmeros telefnicos es posible disear, los que deben constar de seis
dgitos tomados del 0 al 9?,
a) Considere que el cero no puede ir al inicio de los nmeros y es posible repetir
dgitos,
b) El cero no debe ir en la primera posicin y no es posible repetir dgitos,
c) Cuntos de los nmeros telefnicos del inciso b empiezan por el nmero siete?,
d) Cuntos de los nmeros telefnicos del inciso b forman un nmero impar?.

Solucin:
a) 9 x 10 x 10 x 10 x 10 x 10 = 900,000 nmeros telefnicos
b) 9 x 9 x 8 x 7 x 6 x 5 = 136,080 nmeros telefnicos
c) 1 x 9 x 8 x 7 x 6 x 5 = 15,120 nmeros telefnicos
d) 8 x 8 x 7 x 6 x 5 x 5 = 67,200 nmeros telefnicos

Problema: En una ciudad los nmeros de telfono constan de 5 dgitos, cada uno de los
cuales se llama con alguno de los 10 dgitos (0 al 9). Cuntos nmeros diferentes pueden
formularse?
Solucin: 10 x 10 x 10 x 10 x 10 = 100,000 nmeros diferentes

2.3.1 Diagrama de rbol.
Problema: Suponga que una persona tiene 2 formas de ir de una ciudad A a otra ciudad B; y
una vez llegada a B, tiene 3 maneras de llegar a otra ciudad C, De cuntas maneras podr
realizar el viaje de A a C pasando por B?

Solucin: Si empez a pie, podr tomar luego avin, carro o trasatlntico, y si empez en
bicicleta, tambin podr tomar avin, carro o trasatlntico. La persona tuvo 6 formas
diferentes de realizar el viaje que son: (iniciales) pa, pc, pt, ba, bc, bt. (2 x 3 = 6)
UNIDAD II / PROBABILIDAD.





77

Problema: Se va a conformar un comit de 3 miembros compuesto por un representante de
los trabajadores, uno de la administracin y uno del gobierno. Si hay 3 candidatos de los
trabajadores, 2 de la administracin y 4 del gobierno, determinar cuntos comits diferentes
pueden conformarse, empleando un diagrama de rbol



Problema: Un experimento consiste en lanzar una moneda y despus lanzarla una segunda
vez si sale cara. Si sale cruz en el primer lanzamiento, entonces se lanza un dado una vez.
Para listar los elementos del espacio muestral que proporciones mayor informacin.
UNIDAD II / PROBABILIDAD.





78

Problema: Suponga que se selecciona tres artculos de forma aleatoria de un proceso de
fabricacin. Cada articulo se inspecciona y clasifica como defectuoso, D, o sin defectos N.

Problema: Un mdico general clasifica a sus pacientes de acuerdo a: su sexo (masculino o
femenino), tipo de sangre (A, B, AB u O) y en cuanto a la presin sangunea (Normal, Alta o
Baja). Mediante un diagrama de rbol diga en cuantas clasificaciones pueden estar los
pacientes de este mdico?


UNIDAD II / PROBABILIDAD.





79
Si contamos todas las ramas terminales, nos damos cuenta que el nmero de clasificaciones
son 2 x 4 x 3 = 24 mismas que podemos enumerar;
MAN, MAA, MAB, MBN, MBA, MBB, etc, etc.

Problema: Un producto (por ejemplo, hardware para un sistema de computadoras) se puede
embarcar a travs de cuatro aerolneas diferentes, y cada aerolnea puede transportar los
embarques por tres rutas distintas. Cuntas formas distintas de embarcar el producto
existen?


Problema: Dos equipos denominados A y B se disputan la final de un partido de baloncesto,
aquel equipo que gane dos juegos seguidos o complete un total de tres juegos ganados ser
el que gane el torneo. Mediante un diagrama de rbol diga de cuantas maneras puede ser
ganado este torneo,

Solucin:
A = gana el equipo A; B = gana el equipo B

UNIDAD II / PROBABILIDAD.





80
En este diagrama se muestran que hay solo diez maneras de que se gane el torneo, que se
obtienen contando las ramas terminales de este diagrama de rbol, las que es posible
enumerar;

AA, ABB, ABAA, ABABA, ABABB, etc, etc.

2.3.2 Notacin factorial.
En algunos problemas de matemticas se nos presentan multiplicaciones de nmeros
naturales sucesivos tal como:

4 x 3 x 2 x 1 = 24; 3 x 2 x 1 = 6; 2 x 1 = 2.

Para abreviar estas expresiones, se usa una notacin especial llamada notacin factorial y
nos denota las multiplicaciones sucesivas de n hasta l y se define como:

4 x 3 x 2 x 1 = 4! Se leecuatro factorial

3 x 2 x 1 = 3! Se lee tres factorial

En trminos generales:

n(n-1)(n-2)...x 2 x 1 = n! Se lee n factorial

Propiedades:

a) para n natural n! = n(n-1)!

Ejemplo:
7! = 7 x 6! = 7 x 6 x 5 x 4!
0! = 1
5! = 5 x 4 x 3 x 2 x 1 = 120
4! 3! = (24)(6) = 144
8! 8 7 6 5!
336
5! 5!
x x x
= =

UNIDAD II / PROBABILIDAD.





81
10!8! 10 9! 8 7 6!
560
9!6! 9! 6!
x x x x
x
= =
3! 3! 1
5! 5 4 3! 20 x x
= =

Cuando n es demasiado grande se suele utilizar la frmula de Stirling:
! 2 * .
n n
n n n e



2.3.3 Permutacin.
Una permutacin es un arreglo de todo o parte de un conjunto de objetos, el cual tiene una
disposicin de elementos en un orden especifico. Es todo arreglo de elementos en donde
nos interesa el lugar o posicin que ocupa cada uno de los elementos que constituyen dicho
arreglo.

Teorema :
Dado un conjunto de n elementos claramente distintos, se desea seleccionar r elementos de
los n y acomodarlos dentro de r posiciones.

El nmero de permutaciones diferentes de los n elementos tomados r a la vez se denota por
:
n
P
r
y es igual
n
P
r
= n ( n 1 ) (n 2 ) . . . ( n r + 1 )
)! (
!
r n
n
P
r n

=

para este caso particular r = n se convierte en:
n
P
n
= n ( n 1 ) (n 2 ) . . . 1 = n !

donde n ! = n (n 1 ) (n 2 ) . . . (3)(2)(1) y se llama n factorial.

Esta frmula nos permitir obtener todos aquellos arreglos en donde el orden es importante
y solo se usen parte (r) de los n objetos con que se cuenta, adems hay que hacer notar
que no se pueden repetir objetos dentro del arreglo, esto es, los n objetos son todos
diferentes.
UNIDAD II / PROBABILIDAD.





82
La demostracin del teorema anterior es : hay n formas de ocupar la primera posicin. Una
vez que se ocupa, hay n 1 formas de ocupar la segunda, n 2 formas de ocupar la
tercera, . . . , y (n r + 1 ) formas de ocupar la n-sima posicin. Aplicaremos la regla de
multiplicativa para obtener
( )( )( ) ( )
( ) r n
n
r n n n n P
r n

= + =
!
1 ... 2 1
Problema: Hallar:
a) 8 P 3 b) 6 P 4 c) 15 P 1 d) 3 P 3

Solucin
a) 336
b) 360
c) 15
d) 6

Problema: El numero de ordenaciones o permutaciones diferentes que consisten de 3 letras
cada una y que puede formarse de las 7 letras A, B , C, D, E, F, G, es n = 7 & r = 3
7P3 = 210

Problema: Se quieren sentar 5 hombres y 4 mujeres en una fila de modo que las mujeres
ocupen los sitios pares de cuantas formas pueden sentarse?
Solucin:
( 5 P 5 ) ( 4 P 4 ) = 2880 formas

Problema: Cuantas representaciones diferentes sern posibles formar, si se desea que
consten de Presidente, Secretario, Tesorero, Primer Vocal y Segundo Vocal?, s esta
representacin puede ser formada de entre 25 miembros del sindicato de una pequea
empresa.

Solucin:
Por principio multiplicativo:
25 x 24 x 23 x 22 x 21 = 6,375,600 maneras

Por Frmula:
n = 25, r = 5
UNIDAD II / PROBABILIDAD.





83

25
P
5
= 25!/ (25 5)! = 25! / 20! = (25 x 24 x 23 x 22 x 21 x....x 1) / (20 x 19 x 18 x ... x 1) =
6,375,600 maneras de formar la representacin

Problema:
a) Cuntas maneras diferentes hay de asignar las posiciones de salida de 8 autos que
participan en una carrera de frmula uno? (Considere que las posiciones de salida
de los autos participantes en la carrera son dadas totalmente al azar)
b) Cuntas maneras diferentes hay de asignar los primeros tres premios de esta
carrera de frmula uno?

Solucin:
Por principio multiplicativo:
8 x 7 x 6 x 5 x 4 x 3 x 2 x 1= 40,320 maneras de asignar las posiciones de salida de los
autos participantes en la carrera

Por Frmula:
n = 8, r = 8

8
P
8
= 8! = 8 x 7 x 6 x 5 x 4 x......x 1= 40,320 maneras de asignar las posiciones de salida
......etc., etc.

a) Por principio multiplicativo:
8 x 7 x 6 = 336 maneras de asignar los tres primeros lugares de la carrera

Por frmula:
n =8, r = 3

8
P
3
= 8! / (8 3)! = 8! / 5! = (8 x 7 x 6 x 5 x ........x1)/ (5 x 4 x 3 x......x1) = 336 maneras de
asignar los tres primeros lugares de la carrera

Problema: Cuntos puntos de tres coordenadas ( x, y, z ), ser posible generar con los
dgitos 0, 1, 2, 4, 6 y 9?, Si,
a) No es posible repetir dgitos,
b) Es posible repetir dgitos.

Solucin:
a) Por fr
n = 6, r =

6
P
3
= 6!
Nota: este

b) Por el p
6 x 6 x 6 =

Problema:
ordenarse


Problema:
de qumica
a) los
b) sol
Solucin
a) (4
b) (9

Problema:
Encuentre
Solucin:
20

mula
= 3
/ (6 3)! = 6
inciso tamb
principio mult
= 216 puntos
De cuntas
en fila en un
Cuatro libro
a se colocan
s libros de ca
lamente los l
P 4 ) (6 P 6 )
P 9 ) (4 P 4 )
Se sacan d
el nmero de
P 2 = 380
6! / 3! = 6 x 5
in puede se
tiplicativo
posibles
s maneras 3
taller, de mo
3F
P
3
= 3!
3!
os distintos d
en un estant
ada asignatur
libros de mat
) ( 2 P 2 ) ( 3
) = 8709120
dos billetes
e puntos mu
5 x 4 x 3! / 3!
er resuelto p
3 fresadoras
odo que el m
4T
P
4
= 4! P
4
P
4
=
(4!) (4!) (2!)
de matemtic
te. De cua
ra deben est
temticas de
3 P 3 ) = 207
de lotera d
ustrales en e
UN
= 6 x 5 x 4 =
or el principi
s, 4 tornos,
mismo tipo de
4T
4
= 4! P
= 4!
(4!) = 16588
cas, seis dife
ntas formas
tar todos junt
eben estar ju
360
de 20 para u
el espacio S
NIDAD II /
= 120 puntos
o multiplicati
4 taladros
e mquina qu
2C

P
2
= 2!
8
erentes de f
distintas es
tos,
untos?
un primer y
/ PROBAB
s posibles
ivo
y 2 cepillos
uede juntas.
fsica y dos d
posible orde
un segundo
BILIDAD.

84
s pueden
diferentes
enarlos si
o premios.
UNIDAD II / PROBABILIDAD.





85
Problema: De cuantas formas puede una organizacin local de la sociedad americana de
qumica programar a tres conferencistas para tres reuniones diferentes si todos estn
disponibles en cualquiera de cinco fechas posibles?
Solucin:
5 P 3 = 60

Problema: El testigo de un accidente, en el que el causante se dio a la fuga, le dijo a la
polica que el numero de placas tenias las letras RLH seguidas de tres dgitos, el primero de
los cuales era un 5. si el testigo no puede recordar los dos ltimos dgitos, pero est seguro
que todos los dgitos eran diferentes , encuentre el nmero mximo de registros de
automviles que la polica tendr que revisar.
Solucin:
9 P 2 = 72

Problema: En una carrera de coches (50 coches) queremos saber el nmero de formas
distintas en que se pueden repartir los premios (primero, segundo y tercer lugar)
Solucin: 50 P 3 = 117600

Problema: Alguien desea colocar 6 cuadros en lnea recta sobre la pared de una biblioteca.
De cuantas maneras diferentes lo pueden hacer?
Solucin: 6P6 = 720

Problema: De cuantas maneras pueden 10 personas sentarse en una banca si solo hay 4
puestos disponibles?
Solucin: 10P4 = 5040

Problemas propuestos:
P1.- Un sistema de alarma de seguridad se activa y desactiva introduciendo el cdigo
numrico de tres dgitos apropiados en el orden correcto en un tablero digital.
a) Calcule el nmero total de posibles combinaciones del cdigo si ningn digito se
puede utilizar dos veces.
b) Calcule el numero total de posibles combinaciones del cdigo si los dgitos se puede
utilizar mas de una vez.
Solucin:
a) 10 P 3 = 720 b) (10)(10)(10) = 1000
UNIDAD II / PROBABILIDAD.





86
P2.- Se contrata un servicio de calificacin de computadoras para encontrar las tres mejore
marcas de monitores EGA. Se incluir un total de 10 marcas en el estudio. De cuantas
formas distintas puede el servicio de calificacin llegar al ordenamiento final?
Solucin:
10 P 3 = 720

P3.- en una carrera de coches (50 coches) queremos saber el nmero de formas distintas en
que se pueden repartir los premios (primero, segundo y tercer lugar)
Solucin: 50 P 3 = 117600

P4.- Alguien desea colocar 6 cuadros en lnea recta sobre la pared de una biblioteca. De
cuantas maneras diferentes lo pueden hacer?
Solucin: 6P6 = 720

P5.- De cuantas maneras pueden 10 personas sentarse en una banca si solo hay 4
puestos disponibles?
Solucin: 10P4 = 5040

Permutaciones con repeticiones.
Las permutaciones que ocurren al arreglar objetos en un crculo se llaman permutaciones
circulares. Dos permutaciones circulares no se consideran diferentes a menos que los
objetos correspondientes en los dos arreglos estn precedidos o seguidos por un objeto
diferente conforme recorramos en la direccin de las manecillas del reloj.

Teorema: El numero de permutaciones distintas de n cosas de las que n
1
son de una
clase, n
2
de una segunda clase , ... , n
k
de una k esima
! ,..., ! , !
!
2 1
,..., ,
2 1
k
n n n n
n n n
n
P
k
=


Problemas: Obtenga todas las seales posibles que se pueden disear con seis banderines,
dos de los cuales son rojos, tres son verdes y uno morado.

Solucin:
n = 6 banderines; x
1
= 2 banderines rojos; x
2
= 3 banderines verdes; x
3
= 1 bandern
morado
UNIDAD II / PROBABILIDAD.





87

6
P
2
,
3
,
1
= 6! / 2!3!1! = 60 seales diferentes

Problema:
a) Cuntas claves de acceso a una computadora ser posible disear con los
nmeros 1,1,1,2,3,3,3,3?,
b) cuntas de las claves anteriores empiezan por un nmero uno seguido de un dos?,
c) cuntas de las claves del inciso a empiezan por el nmero dos y terminan por el
nmero tres?

Solucin:
a) n = 8 nmeros; x
1
= 3 nmeros uno; x
2
= 1 nmero dos; x
3
= 4 nmeros cuatro

8
P
3
,
1
,
4
= 8! / 3!1!4! = 280 claves de acceso

b) n = 6 (se excluye un nmero uno y un dos); x
1
= 2 nmeros uno; x
2
= 4 nmeros tres
1 x 1 x
6
P
2
,
4
= 1 x 1 x 6! / 2!4! = 15 claves de acceso

El primer nmero uno nos indica el nmero de maneras cmo es posible colocar en la
primera posicin de la clave de acceso un nmero uno, debido a que todos los nmeros uno
son iguales, entonces tenemos una sola manera de seleccionar un nmero uno para la
primera posicin, el siguiente nmero uno nos indica el nmero de maneras como se
colocara en la segunda posicin el nmero dos y la expresin siguiente nos indica todos los
arreglos posibles que es posible disear con los nmeros restantes.

c) n = 6 (se excluye un nmero dos y un tres); x
1
= 3 nmeros uno; x
2
= 3 nmeros tres
1 x
6
P
3
,
3
x1 = 1 x 6! / 3!3! = 20 claves de acceso

El nmero uno inicial nos indica que existe una sola manera de seleccionar el nmero dos
que va en la primera posicin del arreglo, mientras que el nmero uno final nos indica que
hay una sola manera de seleccionar el nmero tres que va al final del arreglo an y cuando
haya cuatro nmeros tres, como estos son iguales al disear una permutacin es indistinto
cul nmero tres se ponga, ya que siempre se tendr el mismo arreglo y la expresin
intermedia nos indica todos los arreglos posibles a realizar con los nmeros restantes.

Problema: De cuntas maneras es posible plantar en una lnea divisoria de un terreno dos
nogales, cuatro manzanos y tres ciruelos?
UNIDAD II / PROBABILIDAD.





88

Solucin:
n = 9 rboles; x
1
= 2 nogales; x
2
= 4 manzanos; x
3
= 3 ciruelos

9
P
2
,
4
,
3
= 9! / 2!4!3! = 1260 maneras de plantar los rboles

Problema: Si un equipo de ftbol soccer femenil participa en 12 juegos en una temporada,
cuntas maneras hay de que entre esos doce juegos en que participa, obtenga 7 victorias,
3 empates y 2 juegos perdidos?

Solucin:
n = 12 juegos; x
1
= 7 victorias; x
2
= 3 empates; x
3
= 2 juegos perdidos

12
P
7
,
3
,
2
= 12! / 7!3!2! = 7,920 maneras de que en la temporada este equipo logre siete
victorias, tres empates y dos juegos perdidos.

Problema: De cuantas formas diferentes se pueden arreglar 3 focos rojos, 4 amarillos, y 2
azules en una serie de luces navideas con 9 portalmparas?
Solucin:
9!
1260
3!(4!)(2!)
=

Problema: Usted cuanta con 12 analista de sistemas y desea asignar tres al trabajo 1, cuatro
al trabajo 2 y cinco al trabajo 3. De cuantas formas distintas puede efectuar esta
asignacin?
Solucin:
n
1
= 3, n
2
= 4, n
3
= 5
12!
27720
3!(4!)(5!)
=

Problema: Cuantas muestras de 4 juntas unidades por soldadura blanda de estao-plomo
se pueden seleccionar de un lote de 25 juntas de este tipo que estn disponibles para
pruebas de resistencia?
25!
12650
(4!)(21!)
=


UNIDAD II / PROBABILIDAD.





89
Pruebas ordenadas
Se le llama prueba ordenada al hecho de seleccionar r objetos de entre n objetos contenidos
en una urna uno tras otro. Una prueba ordenada puede ser llevada a efecto de dos maneras:
a) Con sustitucin (con reemplazo).- En este caso se procede a seleccionar el primer
objeto de entre los n que hay, se observa de qu tipo es y se procede a regresarlo a
la urna, luego se selecciona el siguiente objeto, lo anterior se repite hasta que se
han extrado los r objetos de la prueba, por tanto el nmero de pruebas ordenadas
de con sustitucin se obtiene:

Nmero total de pruebas ordenadas con sustitucin = n x n x n x .........x n = n
r

Hay n maneras de seleccionar el primer objeto, luego al seleccionar el segundo objeto, dado
que se ha regresado a la urna el primer objeto, tambin se tendrn n objetos y as
sucesivamente.
b) Sin sustitucin (sin reemplazo).- En este caso se procede a seleccionar el primer
objeto, el cual no es regresado a la urna, luego se selecciona el segundo objeto, lo
anterior se repite hasta completar los r objetos de la prueba, por lo que el nmero
total de pruebas ordenadas sin sustitucin se obtiene:

Nmero total de pruebas ordenadas sin sustitucin = n(n-1)(n-2).........(n-r +1) =
n
P
r

Hay n maneras de seleccionar el primer objeto, luego al seleccionar el segundo objeto, hay
n 1 maneras, dado que el primer objeto no se regresa a la urna, luego cuando se extrae el
r-simo objeto, hay (n r +1) de que sea seleccionado.

Problema: Cuntas maneras hay de que se asignen tres premios de un sorteo en donde el
primer premio es una departamento, el segundo premio es un auto y el tercer premio es un
centro de cmputo, si los participantes en este sorteo son 120 personas,
a) s la asignacin se puede hacer con sustitucin,
b) s la asignacin se puede hacer sin sustitucin.
Solucin:
a) Por principio multiplicativo:
120 x 120 x 120 = 1,728,000 maneras de asignar los premios
Por frmula: n =120, r = 120

UNIDAD II / PROBABILIDAD.





90
n
r
= 120
3
= 1,728,000 maneras de asignar los tres premios
b) Por principio multiplicativo:
120 x 119 x 118 = 1,685,040 maneras de asignar los premios

Por frmula:
n = 120, r = 3

120
P
3
= 120! / (120 3)! = 120! / 117! = 120 x 119 x 118 = 1,685,040 maneras de asignar los
premios

Hay que hacer notar que en este caso, como los boletos que son seleccionados ya no
regresan a la urna de donde fueron extrados, los participantes solo pueden recibir un premio
en caso de que fueran de los afortunados. Esta es la forma en que generalmente se efecta
un sorteo.
Problema: Cuntas formas hay de asignar las primeras cinco posiciones de una carrera de
autos de frmula K, si participan 26 autos en esta carrera?. Considere que la asignacin es
totalmente al azar.

Solucin:
Esta asignacin debe ser sin sustitucin, esto es, se trata de una prueba ordenada sin
sustitucin, por lo que la solucin es la que se muestra.

n = 26, r = 5

26
P
5
= 26! / (26 5)! = 26! / 21! = 26 x 25 x 24 x 23 x 22 = 7,893,600 maneras de asignar las
cinco primeras posiciones de salida

Problema: Cuntas formas hay de asignar el orden de participacin de las primeras 5
concursantes de 11 finalistas de un concurso de Miss Mundo?

Solucin:
Esta asignacin debe realizarse sin sustitucin, por lo que se trata de una prueba ordenada
sin sustitucin.
n = 11, r = 5

UNIDAD II / PROBABILIDAD.





91

11
P
5
= 11! / (11 5)! = 11! / 6! = 11 x 10 x 9 x 8 x 7 = 55,440 maneras de asignar la
participacin


2.3.4 Combinaciones.
Como ya se mencion anteriormente, una combinacin, es un arreglo de elementos en
donde no nos interesa el lugar o posicin que ocupan los mismos dentro del arreglo. En una
combinacin nos interesa formar grupos y el contenido de los mismos.

Teorema
Se desea escoger una muestra de r elementos de un conjunto de n elementos. Entonces, el
numero de muestras distintas de r elementos que se pueden escoger de n se denota por
( )
n
r

y es igual
=

r
n

)! ( !
!
r n r
n
C
r n

=

Observe que el orden en que se extraen los r elementos no es importante.

Demostracin del teorema:
La seleccin de una muestra de r elementos de un conjunto de n elementos equivale a
dividir los n elementos entre k = 2 grupos: los r que se escogen para la muestra y los ( n r )
restantes que no se seleccionan. Por tanto, al aplicar el teorema obtenemos:

=

r
n

)! ( !
!
r n r
n
C
r n

=


Problema:
Hallar el valor de
a) 7 C4 b) 6 C 5 c) 4 C 4

Solucin:
a)
UNIDAD II / PROBABILIDAD.





92
35
)! 4 7 ( ! 4
! 7
4 7
=

= C

b)
6
)! 5 6 ( ! 5
! 6
5 6
=

= C
c)
1
)! 4 4 ( ! 4
! 4
4 4
=

= C
Problema: E l nmero de maneras en las cuales 3 cartas pueden escogerse o seleccionarse
de un total de 8 cartas diferentes es:
Solucin:
56
)! 3 8 ( ! 3
! 8
=

=
r n
C

Problema: De cuatro qumicos y tres fsicos encuentre el nmero de comits que se pueden
formar que consistan en dos qumicos y un fsico.
Solucin:
Qumico 4 C 2; Fsico 3 C 1

( ) ( )
( ) ( )
4 2 3 1
4! 3!
2!(4 2)! 1!(3 1)!
6 3 18
C C

= =



=


Problema: Se contrataran cinco ingenieros de ventas de entre un grupo de 100 solicitantes.
De cuantas formas (combinaciones) podemos seleccionar grupos de cinco ingenieros de
ventas?
Solucin:
100 C 5 = 75, 287,520

Problema: a) Si se cuenta con 14 alumnos que desean colaborar en una campaa pro
limpieza del Tec, cuantos grupos de limpieza podrn formarse si se desea que consten de 5
alumnos cada uno de ellos, b) si entre los 14 alumnos hay 8 mujeres, cuantos de los
UNIDAD II / PROBABILIDAD.





93
grupos de limpieza tendrn a 3 mujeres?, c) cuntos de los grupos de limpieza contarn
con 4 hombres por lo menos?

Solucin:
a) n = 14, r = 5
14
C
5
= 2002 grupos

b) n = 14 (8 mujeres y 6 hombres), r = 5
8
C
3
*
6
C
2
= 840

c) En este caso nos interesan grupos en donde haya 4 hombres o ms
6
C
4
*
8
C
1
+
6
C
5
*
8
C
0
= 15 x 8 + 6 x 1 = 120 + 6 = 126

Problema: Para contestar un examen un alumno debe contestar 9 de 12 preguntas,
a) Cuntas maneras tiene el alumno de seleccionar las 9 preguntas?,
b) Cuntas maneras tiene si forzosamente debe contestar las 2 primeras preguntas?,
c) Cuntas maneras tiene si debe contestar una de las 3 primeras preguntas?,
d) Cuntas maneras tiene si debe contestar como mximo una de las 3 primeras
preguntas?

Solucin:
a) n = 12, r = 9

12
C
9
= 220 maneras de seleccionar las nueve preguntas o dicho de otra manera,
el alumno puede seleccionar cualquiera de 220 grupos de 9 preguntas para contestar el
examen

b)
2
C
2
*
10
C
7
= 1 x 120 = 120 maneras de seleccionar las 9 preguntas entre las que estn
las dos primeras preguntas

c)
3
C
1
*
9
C
8
= 3 x 9 = 27 maneras de seleccionar la 9 preguntas entre las que est una
de las tres primeras preguntas

d) En este caso debe seleccionar 0 o 1 de las tres primeras preguntas

3
C
0
*
9
C
9
+
3
C
1
*
9
C
8
= (1 x 1) + (3 x 9)
= 1 + 27 = 28 maneras de seleccionar las preguntas a contestar
UNIDAD II / PROBABILIDAD.





94
Problema. Una seora desea invitar a cenar a 5 de 11 amigos que tiene
a) Cuntas maneras tiene de invitarlos?,
b) cuntas maneras tiene si entre ellos est una pareja de recin casados y no
asisten el uno sin el otro,
c) Cuntas maneras tiene de invitarlos si Rafael y Arturo no se llevan bien y no van
juntos?

Solucin:
a) n = 11, r = 5

11
C
5
= 462 maneras de invitarlos
Es decir que se pueden formar 462 grupos de cinco personas para ser invitadas a cenar.

b) Esta seora tiene dos alternativas para hacer la invitacin, la primera es no
invitar a la pareja y la segunda es invitar a la pareja.

2
C
0
*
9
C
5
+
2
C
2
*
9
C
3
= (1 x 126) + (1 x 84) = 210 maneras de invitarlos
En este caso separamos a la pareja de los dems invitados para que efectivamente se
cumpla el que no asistan o que asistan a la cena.

c) La seora tiene dos alternativas para hacer la invitacin, una de ellas es que
no invitar a Rafael y a Arturo o que asista solo uno de ellos.
2
C
0
*
9
C
5
+
2
C
1
*
9
C
4

= (1 x 126) + (2 x 126)
= 126 + 252 = 378 maneras de hacer la invitacin

Problema: En un plano hay 10 puntos denominados A, B, C, ....,etc. etc., en una misma lnea
no hay ms de dos puntos,
a) Cuntas lneas pueden ser trazadas a partir de los puntos?,
b) Cuntas de las lneas no pasan por los puntos A o B?,
c) Cuntos tringulos pueden ser trazados a partir de los puntos?,
d) Cuntos de los tringulos contienen el punto A?,
e) Cuntos de los tringulos tienen el lado AB?.

Solucin:
a) Una lnea puede ser trazada a partir de cmo mnimo dos puntos por lo tanto,
UNIDAD II / PROBABILIDAD.





95

10
C
2
= 10! / (10 2)!2! = 10! / 8!2! = 45 lneas que se pueden trazar

b) En este caso excluiremos los puntos A y B y a partir de los ocho puntos restantes se
obtendrn las lneas.

2
C
0
*
8
C
2
= 1 x 28 = 28 lneas que no pasan por los puntos A o B

c) Un tringulo puede ser trazado a partir de tres puntos, luego;
10
C
3
= 10! / (10 3)!3! = 10! / 7!3! = 120 tringulos posibles de trazar

d) En este caso se separa el punto A de los dems, se selecciona y posteriormente
tambin se seleccionan dos puntos ms.
1
C
1
*
9
C
2
= 1 x 36 = 36 tringulos que contienen el punto A

e) Los puntos A y B forman parte de los tringulos a trazar por lo que;
2
C
2
*
8
C
1
= 1 X 8 = 8 tringulos que contienen el lado AB

Problema: De un total de 5 matemticos y 7 fsicos, se forma un comit de 2 matemticos y
3 fsicos. De cuantas formas puede formarse, si
a) puede pertenecer el cualquier matemtico y fsico,
b) un fsico determinado debe permanecer al comit,
c) dos matemticos determinados no pueden estar en el comit?

a) 2 Mat. de un total de 5 5 C 2
3 Fis. de un total de 7 7 C 3 = (5 C 2) ( 7 C 3) = 350

b ) 2 Mat. de un total de 5 5 C 2
2 Fis. de un total de 6 6 C 2 = (5 C 2) (6 C 2) = 150

c) 2 Mat. de un total de 3 3 C 2
3 Fis. de un total de 7 7 C 3 = (3 C 2) (7 C 3) = 105

Problema: De cuantas formas pueden 10 objetos dividirse en dos grupos de 4 y 6 objetos
respectivamente.
Solucin:
(10 C 4) = 210
UNIDAD II / PROBABILIDAD.





96
Problema: Cuantas manos diferentes de 5 naipes pueden darse con un mazo normal de 52
naipes, no importa el orden en que se reciban las cartas, lo que nos indica que se trata de
una combinacin.
Solucin:
52 C 5 = 2598960

Problema: Si 10 alumnos desean jugar baloncesto, cuntos equipos diferentes pueden
formarse con estos jugadores ? , uno de los muchachos se llama Jos. Solo se desea contar
los equipos que incluyen a Jose
Solucin:
10 C 5 = 252 equipos diferentes
El nmero de equipos que incluyen a Jos son:
9 C 4 = 126

Problema: cuntas parejas distintas pueden formarse con cinco individuos?
Solucin:
5 C 2 = 10

Particiones ordenadas.
Se le llama particin ordenada al hecho de repartir n objetos en clulas de una cantidad de
x
1
objetos, x
2
objetos,......y x
k
objetos.

Problema: Cuntas maneras hay de repartir 10 libros diferentes entre tres alumnos, si al
primero le daremos 2, al segundo 3 y el resto al tercer alumno? , esta particin seran las
siguientes si se numeran los libros del 1 al 10;
Solucin:
Lo primero que debemos hacer es seleccionar 2 libros de los 10 que se tienen para el primer
alumno, esto es;

10
C
2
= 10! / (10 2)!2! = 10! / 8!2! = 45 maneras de seleccionar los libros
Luego se seleccionan 3 libros de los 8 que quedan para el segundo alumno;

8
C
3
= 8! / (8 3)!3! = 8! / 5!3! = 56 maneras

Y por ltimo se proceder a seleccionar cinco libros de los cinco que quedan para el tercer
alumno, lo que se muestra a continuacin;
UNIDAD II / PROBABILIDAD.





97

5
C
5
= 5! / (5 5)!5! = 5! / 0!5! = 1 manera

Por tanto el nmero total de particiones ordenadas en clulas de 2, 3 y 5 elementos se
determina:

10
C
2
*
8
C
3
*
5
C
5
= 2520

La expresin anterior nos recuerda a la frmula utilizada para encontrar las permutaciones
de n objetos, entre los cuales hay algunos objetos que son iguales, por lo que usaremos la
misma frmula para encontrar las particiones ordenadas.

Por tanto la frmula para las particiones ordenadas sera:

Esta frmula slo puede ser utilizada cuando se reparten todos los objetos, no parte de
ellos, en ese caso se usarn combinaciones.

Donde:
nPx
1
,x
2
,.....,x
k
= Total de particiones ordenadas o reparticiones que es posible hacer cuando
los n objetos son repartidos en grupos de x
1
objetos, x
2
objetos ...... y x
k
objetos.
n = x
1
+ x
2
+ ......+ x
k

Problema: Cuntas maneras hay de repartir 9 juguetes entre tres nios, si se desea que al
primer nio le toquen 4 juguetes, al segundo 2 y al tercero 3 juguetes?

Solucin:
Por combinaciones,
9
C
4
*
5
C
2
*
3
C
3
= 126*10*1= 1260 maneras de repartir los juguetes

Por frmula,
n = 9; x
1
= 4; x
2
= 2; x
3
=3
9
P
4
,
2
,
3
= 9! / 4!2!3! = 1,260 maneras de repartir los juguetes

Problema: Cuntas maneras hay de repartir los mismos 9 juguetes entre tres nios, si se
desea darle 3 al primer nio, 2 al segundo nio y 2 al tercer nio?

! x !....... x ! x
! n
x , .......... x , nPx
k
k
2 1
2 1
=
UNIDAD II / PROBABILIDAD.





98
Solucin:
En este caso nicamente se puede dar solucin por combinaciones, ya que no es posible
usar la frmula debido a que se reparten solo parte de los juguetes.

9
C
3
*
6
C
2
*
4
C
2
= 84*15*6 = 7,560 maneras de repartir los juguetes (solo se reparten 7 y
quedan dos juguetes)

Problema:
a) Cuntas maneras hay de que se repartan 14 libros diferentes entre 3 alumnos, si
se pretende que al primer alumno y al segundo les toquen 5 libros a cada uno y al
tercero le toque el resto?,
b) Cuntas maneras hay de que se repartan los libros si se desea dar 5 libros al
primer alumno, 3 al segundo y 2 libros al tercer alumno?

Solucin:
a) Por frmula:
n = 14 ; x
1
= 5; x
2
= 5; x
3
= 4
14
P
5
,
5
,
4
= 14! / 5!5!4! = 21,021 maneras de repartir los libros en grupos de 5, 5 y 4 libros

b) Por combinaciones:
14
C
5
*
9
C
3
*
6
C
2
= 2,002*84*15 = 2,522,520 maneras de repartir 10 de los 14 libros en grupos
de 5, 3 y 2 libros

Problema:
a) Cuntas maneras hay de repartir a 12 alumnos en 4 equipos de 3 personas cada
uno de ellos para que realicen prcticas de laboratorio diferentes?,
b) Cuantas maneras hay de que se repartan los 12 alumnos en 4 equipos de 3
personas si se va a realizar una misma prctica?

Solucin:
a) En este caso al ser prcticas de laboratorio diferentes, es posible resolver el
problema por combinaciones o por la frmula, dado que se reparten todos los
alumnos
Por frmula:
n = 12; x
1
= 3 prctica 1; x
2
= 3 prctica 2; x
3
= 3 prctica 3; x
4
= 3 prctica 4
UNIDAD II / PROBABILIDAD.





99
12
P
3
,
3
,
3
,
3
= 12! / 3!3!3!3! = 369,600 maneras de repartir a los estudiantes en cuatro equipos
de 3 personas para realizar prcticas diferentes

b)
12
P
3
,
3
,
3
,
3
* 1 /4! = 12! / 3!3!3!3! * 1 / 4! = 369,600 / 4! = 15,400 maneras de repartir a
los alumnos en equipos de 3 personas para realizar una misma prctica

Al multiplicar la solucin que se da al inciso a, por 1/4! se est quitando el orden de los
grupos, que en este caso no nos interesa.

Ejercicios propuestos:
P1.- Se contrata un servicio de calificacin de computadoras para encontrar las tres mejore
marcas de monitores EGA. Se incluir un total de 10 marcas en el estudio. De cuantas
formas distintas puede el servicio de calificacin pero no debe poner los tres en ningn
orden?
Solucin:
10 C 3 = 120
P2.- cuntas parejas distintas pueden formarse con cinco individuos?
Solucin.
5 C 2 = 10

P3.- Con 5 estadistas y 6 economistas quiere formarse un comit de 3 estadistas y 2
economistas. Cuntos comits diferentes pueden formarse si:
a)no se impone ninguna restriccin ,
b)dos estadistas determinados deben estar en el comit
c)un economista determinado no debe estar en el comit?
Solucin:
a) 150 b) 45 c) 100

P4.- Suponga que necesita reemplazar 5 empaques en un dispositivo que funciona con
energa nuclear. Si tiene una caja con 20 empaques de entre los cuales escoger, cuantas
elecciones diferentes son posibles? Es decir, cuantas muestras distintas de 5 empaques se
pueden seleccionar de los 20 ?
Solucin:
20C5 = 15,504

UNIDAD II / PROBABILIDAD.





100
P5.- Se realizo un estudio para examinar la reaccin entre la estructura de costos y la
propiedades mecnicas de granos equieje en lingotes solidificados unidireccionalmente (
Metallurgical Transactions, mayo de 1986 ). Lingotes de aleaciones de cobre se vertieron en
uno de tres tipos de moldes (columnares, mixtos o equieje) con una orientacin ya sea
transversal o longitudinal. De cada lingote se tomaron cinco especimenes para pruebas de
tensin a distintas distancias (10, 35, 60, 85 y 100 milmetros ) de la cara de enfriamiento del
lingote, y se determino la resistencia al vencimiento. Cuantas mediciones de resistencia se
obtendrn si el experimento incluye un lingote para cada combinacin de tipo de molde y
orientacin?
Solucin: (3C2)(5C2) = 30

2.4 Probabilidad con tcnicas de conteo.

2.4.1 Axiomas.
Axioma 1: para cada suceso a en la clase C P ( A ) 0
Axioma 2: para el suceso cierto o seguro S en la clase C P ( S ) = 1
Axioma 3: para cualquier numero mutuamente excluyente A
1
, B
2
, ... en la clase C
P ( A
1


A
2


) = p( A
1
) + p(

A
2
) + ...

En particular , para solo dos sucesos mutuamente excluyentes A
1
, A
2

P (A
1
A
2
) = p(A
1
) + p(A
2
)

2.4.2 Teoremas.
Teorema 1 . si A
1
A
2
entonces P (A
1
) P(

A
2
) y P( A
2
- A
1
) = P( A
2
) P (A
1
)
Teorema 2. para cada suceso A 0 P ( A) 1 es decir la probabilidad de un suceso entre 0
y 1.
Teorema 3. P ( ) = 0 es decir el suceso imposible tiene probabilidad cero.
Teorema 4. si A es el complemento de A entonces P ( A ) = 1 p ( A )
Teorema 5. p(A) = p(A
1
) + p(A
2
) + ... + p (A
n
); En particular si A = S, el espacio muestral,
entonces p(A
1
) + p(A
2
) + ... + p (A
n
) = 1
Teorema 6. si A y B son dos sucesos cualesquiera , entonces
P ( A B ) = P(A) + P(B) - P ( AB )
Teorema 7. para dos sucesos A y B
P ( A) = P ( AB ) + P ( AB )
UNIDAD II / PROBABILIDAD.





101
Teorema 8. si un suceso A debe resultar en uno de los sucesos mutuamente excluyentes A
1

, A
2
, ...,A
n
entonces P ( A) = P( A A
1
) + P ( A A
2
)+ + P ( A A
n
)


2.5 Probabilidad condicional.

2.5.1 Dependiente.
Hay ocasiones en que nos interesa alterar nuestra estimacin de la probabilidad de un
evento cuando poseemos informacin adicional que podra afectar el resultado. Esta
probabilidad modificada se denomina probabilidad condicional del evento.

La probabilidad de que un evento B ocurra cuando se sabe que ya ocurri algn evento A se
llama probabilidad condicional y se denota por P(B A ). El smbolo P(B A ) por lo
general se lee la probabilidad de que ocurra B dado que ocurri A o simplemente la
probabilidad de B, dado A.

Frmula para la probabilidad condicional

Para determinar la probabilidad condicional de que el evento A ocurra, Dado que ocurra el
evento B, divida la probabilidad de que ocurra tanto A como B entre la probabilidad de
que ocurra B; esto es,
( )
( )
( ) B P
B A P
B A P

=
donde suponemos que P ( B ) 0

Sea un espacio muestral en donde se ha definido un evento E, donde p(E)>0, si
deseamos determinar la probabilidad de que ocurra un evento A (el que tambin es definido
en el mismo espacio muestral), dado que E ya ocurri, entonces deseamos determinar una
probabilidad de tipo condicional, la que se determina como se muestra;

Donde:
p(AE) = probabilidad de que ocurra A dado que E ya ocurri; p(AE) = probabilidad de que
ocurra A y E a un mismo tiempo; p(E) = probabilidad de que ocurra E
) E ( p
) E A ( p
) E | A ( p

=
UNIDAD II / PROBABILIDAD.





102
Luego;

Por tanto:


Donde:
AE= nmero de elementos comunes a los eventos A y E
E= nmero de elementos del evento E
Luego entonces podemos usar cualquiera de las dos frmulas para calcular la probabilidad
condicional de A dado que E ya ocurri.

Si la ocurrencia o no de E
1
no afecta para nada la probabilidad de ocurrencia de E
2
,
entonces : Pr { E
2
E
1
} = P { E
2
}, y diremos que E
1
y E
2
son sucesos independientes; en
caso contrario, se dir que son casos dependientes.

Si denotamos por E
1
E
2
el suceso de que ambos E
1
y E
2
ocurran, llamado un suceso
compuesto, entonces
Pr {E
1
E
2
} = Pr {E
1
} Pr { E
2
E
1
}

En particular,
Pr {E
1
E
2
} = Pr {E
1
} Pr { E
2
}

Problema: La probabilidad de que un vuelo programado normalmente salga a tiempo es
P(D) = 0.83; la probabilidad de que llegue a tiempo es P ( A ) 0 0.82; y la probabilidad de que
salga y llegue a tiempo es P ( D A ) = 0.78. Encuentre la probabilidad de que un avin
a) llegue a tiempo, dado que sali a tiempo y
b) sali a tiempo, dado que llego a tiempo.

Solucin:
a) La probabilidad de que un avin llegue a tiempo, dado que sali a tiempo es
( ) 0.78
( | ) 0.94
( ) 0.83
P D A
P A D
P D

= = =


=

E A
) E A ( P


=

E
) E ( P


=
E
E A
) E | A ( P
UNIDAD II / PROBABILIDAD.





103
La probabilidad de que un avin saliera a tiempo, dado que llego a tiempo es
( ) 0.78
( | ) 0.95
( ) 0.82
P D A
P D A
P A

= = =

Problema: Sean E
1
y E
2
los sucesos cara en el quinto lanzamiento y cara en el sexto
lanzamiento de una moneda, respectivamente. Entonces E
1
y E
2
son sucesos
independientes y por lo tanto, la probabilidad de que salga cara en ambos intentos es
Pr {E
1
E
2
} = Pr {E
1
} Pr { E
2
} = ( ) =
Problema: Si las probabilidades de A y B de estar vivos dentro de 20 aos son 0.7 y 0.5,
respectivamente, entonces la probabilidad de que ambos lo estn es
(0.7) (0.5) = 0.35

Problema: Una caja contiene 3 bolas blancas y 2 bolas negras. Sea E
1
el suceso la primera
bola extrada es negra y E
2
el suceso la segunda bola extrada es negra . las bolas
extradas no se devuelven a la caja E
1
y E
2
son sucesos dependientes .
Solucin:
Pr {E
1
E
2
} = Pr {E
1
} P { E
2
} = ( 2/5 )(1 / 4 ) = 1 /10

Sucesos mutuamente excluyentes
Dos o ms sucesos se llaman sucesos mutuamente excluyentes si la ocurrencia de
cualquiera de ellos excluye la de los otros. De modo que si E
1
y E
2
son sucesos mutuamente
excluyentes , entonces

Pr {E
1
E
2
} = 0

Si E
1
+ E
2
denota el suceso de que ocurra E
1
o bien E
2
o ambos a la vez, entonces

Pr (E
1
+ E
2
) = Pr (E
1
) + Pr ( E
2
) - Pr (E
1
E
2
)

En particular
Pr (E
1
+ E
2
) = Pr (E
1
) + Pr ( E
2
) para suceso
Mutuamente excluyentes

Problema: Sea E
1
el suceso sacar un as de una baraja y E
2
sacar un rey. Cual es la
probabilidad de sacar o un as o un rey en un solo ensayo es
UNIDAD II / PROBABILIDAD.





104
Solucin:
Pr (E
1
) = 4 / 52 = 1/13
Pr (E
2
) = 4/52 = 1/13
Pr (E
1
+ E
2
) = 1 / 13 + 1/13 = 2 / 13

Problema: Una bola se extrae aleatoriamente de una caja que contiene 6 bolas rojas, 4
bolas blancas y 5 bolas azules. Determinar la probabilidad de que sea a) roja, b) blanca, c)
azul, d) no roja, e) roja o azul.
Solucin:
a) pr ( roja ) = 6 / ( 6 + 4 + 5 ) = 6 / 15 = 2/5
b) Pr ( blanca = 4 / 15
c) Pr ( azul ) = 5 /15 = 1/3
d) Pr(no roja ) = 1 Pr(roja) = 1 2/5 = 3/5

O bien
Pr ( no roja ) = 4 / 15 + 5 / 15 = 9/15 = 3/5
e) Pr ( roja o azul ) = pr (roja) + Pr ( blanca) = 2/5 + 4 /15 = 2/3

Problema: Sea E
1
el suceso sacar un as de una baraja y E
2
sacar una espada.
Entonces E
1
y E
2
no son sucesos mutuamente excluyentes, porque pueden sacarse el as
de espadas. Luego la probabilidad de sacar un as o una espada o ambos es
Pr (E
1
+ E
2
) = Pr (E
1
) + Pr ( E
2
) - Pr (E
1
E
2
) = 4 /52 + 13/52 1 /52 = 16 / 52 = 4 /13

Problema: Un dado honesto se lanza dos veces. Hallar la probabilidad de obtener 4, 5 o 6 en
el primer lanzamiento y 1, 2, 3 o 4 en el segundo lanzamiento.
Solucin: E
1
= 4, 5 o 6 E
2
= 1, 2, 3 o 4

Pr (E
1
E
2
) = Pr (E
1
)
Pr ( E
2


E
1
) = Pr (E
1
) P (E
2
) = (3/6)(4/6) = 1/3

Problema: Se extraen tres bolas sucesivamente de la caja que contiene 6 bolas rojas, 4
bolas blancas y 5 bolas azules. Hallar la probabilidad de que se extraigan en el orden roja,
blanca y azul si las bolas , a) se remplazan, b) no se remplazan.
Solucin:
a) pr ( se remplazan ) = [6 / ( 6 + 4 + 5 ) ] [4 / ( 6 + 4 + 5 )] [5 / ( 6 + 4 + 5 ) ] = 8/225
UNIDAD II / PROBABILIDAD.





105
b) Pr ( no se remplazan) = [6 / ( 6 + 4 + 5 ) ] [4 / ( 5 + 4 + 5 )] [5 / ( 5 + 3 + 5 ) ] = 4/91

Problema: Hallar la probabilidad de obtener al menos un 4 en dos lanzamientos de un dado
honrado.
Pr ( al menos un 4 en dos lanzamientos) = Pr (E
1
) + Pr ( E
2
) - Pr (E
1
E
2
)
= Pr (E
1
) + Pr ( E
2
) - Pr (E
1
) Pr(E
2
) = 1/6+1/6 - (1/6)(1/6) = 11/36

Problema: Se lanza al aire dos dados normales, si la suma de los nmeros que aparecen es
de por lo menos siete,
a) determine la probabilidad de que en el segundo dado aparezca el nmero cuatro,
b) Determine la probabilidad de que ambos nmeros sean pares,
c) Determine la probabilidad de que en el primer dado aparezca el nmero dos.

Solucin:
El espacio muestral es el mismo que cuando se lanza un dado dos veces y se muestra a
continuacin;
(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)
(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
= (1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

a) Para calcular una probabilidad condicional es necesario definir los eventos A y E,
siendo estos,
A = evento de que en el segundo dado aparezca el nmero cuatro,
E = evento de que la suma de los nmeros que aparecen sea de por lo menos siete, (que es
que es el evento que est condicionando)

E = {21 elementos, los que suman siete o ms}
(6,1) (5,2) (6,2)(4,3) (5,3) (6,3) (3,4) (4,4) (5,4) (6,4)
(2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
E

=




A = {6 elementos, los que en el segundo dado aparece el cuatro}
UNIDAD II / PROBABILIDAD.





106
A = {(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)}

Luego,
AE = {(3,4) (4,4) (5,4) (6,4)}, AE= 4 elementos

Por tanto;
p(AE) = AE/ E= 4/21 = 0.19048

b) E = evento de que la suma de los nmeros que aparecen sea de por lo menos siete
(6,1) (5,2) (6,2)(4,3) (5,3) (6,3)(3,4) (4,4) (5,4) (6,4)
(2,5) (3,5) (4,5) (5,5) (6,5)(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
E

=




A = evento de que ambos nmeros sean pares
A = (2,2) (4,2) (6,2) (2,4) (4,4) (6,4) (2,6) (4,6) (6,6)

AE = (6,2) (4,4) (6,4) (2,6) (4,6) (6,6) AE=6 elementos
p(AE) = AE/ E = 6/ 21 = 0.28571

c) E = evento de que la suma de los nmeros que aparecen sea de por lo menos siete
(6,1) (5,2) (6,2)(4,3) (5,3) (6,3) (3,4) (4,4) (5,4) (6,4)
(2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
E

=




A = evento de que en el primer dado aparezca el nmero dos
A = (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

AE = {(2,5)}, AE= 1 elemento
P(AE) = AE/E = 1/21 = 0.04762

Problema: Se seleccionan al azar dos nmeros de entre los nmeros del 1 al 9, si la suma
de los nmeros que aparecen es par,
a) Determine la probabilidad de que ambos nmeros sean pares,
b) Determine la probabilidad de que ambos nmeros sean impares.

Solucin:
UNIDAD II / PROBABILIDAD.





107
= {
9
C
2
= 36 maneras de seleccionar dos nmeros de entre nueve que se tienen}
(1,2)
(1,3) (2,3)
(1,4) (2,4) (3,4)
= (1,5) (2,5) (3,5) (4,5)
(1,6) (2,6) (3,6) (4,6) (5,6)
(1,7) (2,7) (3,7) (4,7) (5,7) (6,7)
(1,8) (2,8) (3,8) (4,8) (5,8) (6,8) (7,8)
(1,9) (2,9) (3,9) (4,9) (5,9) (6,9) (7,9) (8,9)
a) E = evento de que la suma de los nmeros que se seleccionan sea par
E = (1,3) (2,4) (1,5) (3,5) (2,6) (4,6) (1,3) (3,7) (5,7) (2,8) (4,8) (6,8) (1,9) (3,9) (5,9) (7,9)
E = {16 elementos }

A = evento de que ambos nmeros Sean pares
A = (2,4) (2,6) (4,6)(2,8) (4,8) (6,8)

A = {6 elementos}
AE = (2,4) (2,6) (4,6) (2,8) (4,8) (6,8)

AE = 6 elementos ,
p(AE) = AE/ E= 6/16 = 0.375

b) E = evento de que la suma de los nmeros seleccionados es par
E = (1,3) (2,4) (1,5) (3,5) (2,6) (4,6) (1,3) (3,7) (5,7) (2,8) (4,8) (6,8) (1,9) (3,9) (5,9) (7,9)

A = evento de que ambos nmeros sean impares
A = (1,3) (1,5) (3,5) (1,7) (3,7) (5,7) (1,9) (3,9) (5,9) (7,9)
A = {10 elementos},
AE = (1,3) (1,5) (3,5) (1,7) (3,7) (5,7) (1,9) (3,9) (5,9) (7,9)
AE= 10 elementos; p(AE)= AE/ E= 10/16 = 0.625

Problema: Dada la siguiente tabla referente a la produccin de flechas para camin de carga
pesada; se inspeccionan 200 flechas del tipo A y B, 300 del tipo C y 400 del tipo D, a
continuacin se presentan los resultados obtenidos en la inspeccin;

UNIDAD II / PROBABILIDAD.





108
Tipo flecha
DEFECTO A B C D TOTAL
I 54 23 40 15 132
II 28 12 14 5 59
S - DEF 118 165 246 380 909
TOTAL 200 200 300 400 1100

a) Si se selecciona una flecha al azar y resulta que es una flecha del tipo B, cul es la
probabilidad de que no tenga defectos,
b) Si la flecha seleccionada es del tipo C, cul es la probabilidad de que tenga
defectos del tipo II?,
c) Si la flecha seleccionada tiene defectos del tipo I, cul es la probabilidad de que
sea del tipo A,
d) cul es la probabilidad de que una flecha no tenga defectos?,
e) cul es la probabilidad de que una flecha tenga defectos?
Solucin:
a) Definiremos los eventos;
E = evento de que la flecha seleccionada sea del tipo B = {200 elementos o flechas}
A = evento de que la flecha seleccionada no tenga defectos = {909 flechas o elementos}
AE = {165 elementos del tipo B y que no tienen defectos}
p(AE) = AE/E= 165/200 = 0.825

b) E = evento de que la flecha sea del tipo C = {300 flechas}
A = evento de que la flecha tenga defectos del tipo II ={59 flechas}
AE = {14 flechas del tipo C y que tienen defectos del II } ;
p(AE) =AE/E= 14/300 = 0.04667

c) E = evento de que la flecha tenga defectos del tipo I = {132 flechas}
A = evento de que la flecha sea del tipo A = {200 flechas}
AE = {54 flechas con defectos del tipo I y del tipo A}
p(AE) = AE/E= 54 / 132 = 0.40901

d) En este caso se trata de una probabilidad simple, ya que no hay un evento que est
condicionando al evento del cual se desea determinar su probabilidad
UNIDAD II / PROBABILIDAD.





109
D = evento de que una flecha no tenga defectos = {909 flechas}
= {1100 flechas}
p(D) = 909/1100 = 0.82636

e) F = evento de que una flecha tenga defectos = {132 + 59 = 191 flechas}
= {1100 flechas} p(F) = 191 / 1100 = 0.17364

Problema: Segn las estadsticas, la probabilidad de que un auto que llega a cierta
gasolinera cargue gasolina es de 0.79, mientras que la probabilidad de que ponga aceite al
motor es de 0.11 y la probabilidad de que ponga gasolina y aceite al motor es de 0.06,
a) S un auto carga gasolina, cul es la probabilidad de que ponga aceite?,
b) S un auto pone aceite al motor, cul es la probabilidad de que ponga gasolina?
Solucin:

a) E = evento de que un auto cargue gasolina p(E) = 0.79
A = evento de que un auto ponga aceite al motor P(A) = 0.11
AE = evento de que un auto ponga gasolina y aceite p(AE) = 0.07
p(AE) = p(AE)/p(E) = 0.07/ 0.79 = 0.0881

b) E = evento de que un auto ponga aceite al motor P(E) = 0.11
A = evento de que un auto ponga gasolina P(A) = 0.79
AE = evento de que un auto ponga aceite al motor y ponga gasolina P(AE) = 0.07
P(AE) = p(AE)/ p(E) = 0.07/0.11 = 0.63636

Problema: La probabilidad de que un auto de carreras cargue gasolina en cierto circuito en la
primera media hora de recorrido es de 0.58, la probabilidad de que cambie de neumticos en
esa primera media hora de recorrido es de 0.16, la probabilidad de que cargue gasolina y
cambie de neumticos en la primera media hora de recorrido es de 0.05,
a) Cul es la probabilidad de que cargue gasolina o cambie de neumticos en la
primera media hora de recorrido?,
b) cul es la probabilidad de que no cargue combustible y de neumticos en la
primera media hora de recorrido,
c) Si el auto cambia de neumticos en la primera media hora de recorrido, cul es la
probabilidad de que cargue combustible tambin?,
UNIDAD II / PROBABILIDAD.





110
d) Si el auto carga combustible en la primera media hora de recorrido, cul es la
probabilidad de que cambie de neumticos tambin?

Solucin:
a) A = evento de que cargue gasolina en la primera media hora de recorrido P(A) = 0.58
B = evento de que cambie de neumticos en la primera hora de recorrido P(B) = 0.16
AB = evento de que cargue combustible y cambie de neumticos en la primera hora de
recorrido P(AB) = 0.05
P(cargue gasolina o cambie de neumticos) = p(AB) = p(A) + p(B) p(AB)
P(cargue gasolina o cambie de neumticos) = 0.58 + 0.16 0.05 = 0.69

b) p( no cargue combustible y no cambie de neumticos) = 1 p(AB) = 1 0.69 = 0.31

c) E = evento de que el auto cambie de neumticos en la primera media hora de recorrido
A = evento de que el auto cargue combustible en la primera media hora de recorrido
p(AE) = p(AE)/ p(E) = 0.05/0.16 = 0.3125

d) E = evento de que el auto cargue combustible en la primera media hora de recorrido
A = es el evento de que el auto cambie de neumticos en la primera media hora de recorrido
p(AE) = p(AE)/p(E) = 0.05/0.58 = 0.08621

2.5.2 independientes.
Se dice que un evento B es independiente de un evento A, si p(BA) = p(B), esto quiere
decir que la probabilidad de que ocurra B no es afectada por la ocurrencia del evento A, la
expresin anterior se puede sustituir en el teorema de la multiplicacin para probabilidad
condicional,
p(AB) = p(A)p(BA) = p(A)p(B)
Luego,
p(AB) = p(A)p(B)
Concepto de independencia
Si la expresin anterior se cumple, podemos decir que los eventos A y B son
independientes.

Problema: Pruebas repetidas e independientes.
UNIDAD II / PROBABILIDAD.





111
Sea el espacio muestral del lanzamiento de una moneda tres veces,
= {AAA, AAS, ASA, ASS, SAS, SAA, SSA, SSS}

p(AAA) = p(A
1
A
2
A
3
) = p(A
1
)p(A
2
A
1
)p(A
3
A
1
A
2
) = p(A)p(A)p(A) =1/2*1/2*1/2 = 1/8
p(AAS) = p(A)p(A)p(S) =1/2*1/2*1/2 =1/8
p(ASA) = p(A)p(S)p(A) = 1/2*1/2*1/2 = 1/8
etc, etc.

Con lo anterior se comprueba que efectivamente la probabilidad de cada uno de los
elementos del espacio muestral descrito anteriormente es de 1/8 como se consideraba
cuando se calculaban probabilidades para un espacio finito equiprobables.

Problema: Un equipo de ftbol soccer tiene una probabilidad de ganar de 0.6, una
probabilidad de empatar de 0.3 y una probabilidad de perder de 0.1, si este equipo participa
en dos juegos la semana prxima, determine la probabilidad de que; a. Gane el segundo
juego, b. Gane ambos juegos, c. Gane uno de los juegos, d. Gane el primer juego y empate
el segundo.
El espacio muestral sera:

= {GG, GE, GP, EG, EE, EP, PG, PE, PP}

a) p(gane el segundo juego) = p(GG, EG, PG) = (0.6)(0.6) + (0.3)(0.6) + (0.1)(0.6)
= 0.36 + 0.18 + 0.06 = 0.6

b) p(gane ambos juegos) = p(GG) = (0.6)(0.6) = 0.36

c) p(gane uno de los juegos) = p(GE, GP, EG, PG)
= (0.6)(0.3) + (0.6)(0.1) + (0.3)(0.6) + (0.1)(0.6) = 0.18 + 0.06 + 0.18 + 0.06 = 0.48

d) p(gane el primero y empate el segundo) = p(GE) = (0.6)(0.3) = 0.18


Problema: Un boxeador gana 8 de cada 10 peleas en las que compite, si este boxeador
participar en tres peleas en los prximos seis meses, determine la probabilidad de que;
a) Gane dos de las peleas
UNIDAD II / PROBABILIDAD.





112
b) Si gana dos de las peleas, cul es la probabilidad de que sean la primera y tercera
peleas?,
c) Gane la segunda pelea.

Solucin: ={GGG. GGP, GPG, GPP, PGG, PGP, PPG, PPP}
a) p(gane dos de las peleas) = p(GGP, GPG, PGG)
= (0.8)(0.8)(0.2) + (0.8)(0.2)(0.8) + (0.2)(0.8)(0.8) = 0.128 + 0.128 + 0.128 = 0.384

b) E = evento de que gane dos peleas.
E ={ GGP, GPG, PGG }, p(E) = 0.348
A = evento de que gane la primera y la tercer pelea
A={GGG, GPG} AB = {GPG}, p(AB) = (0.8)(0.2)(0.8) =0.128
P(AE) = p(AE) / p(E) = 0.348/0.128= 0.3333

c) p(gane la segunda pelea) = p(GGG, GGP, PGG, PGP)
= (0.8)(0.8)(0.8) + (0.8)(0.8)(0.2) + (0.2)(0.8)(0.8) + (0.2)(0.8)(0.2)
= 0.512 + 0.128 + 0.128 + 0.032 = 0.8

Problema: Tres hombres tiran a un blanco, A tiene 1/3 de posibilidades de acertar al blanco,
B tiene 1/2 de posibilidades de acertar y C tiene 1/4 de posibilidades de pegar al blanco, si
cada uno de ellos hace un solo disparo, determine la probabilidad de que;
a) Solo uno de ellos acierte al blanco,
b) Si solo uno de ellos acierta al blanco, cul es la probabilidad de que acierte A?,
c) Determine la probabilidad de que ninguno acierte al blanco.

Solucin:
Haciendo uso de un diagrama de rbol se obtiene el siguiente espacio muestral;
= {ABC, ABC`, AB`C, AB`C`, A`BC, A`BC`, A`B`C, A`B`C`}

donde:
A = acierta A, A`= no acierta A, B = acierta B, B`= no acierta B, etc., etc.
a) p(solo uno de ellos acierte al blanco)
= p(AB`C`, A`BC`, A`B`C) = 1/3*1/2*3/4 + 2/3*1/2*3/4 + 2/3*1/2*1/4
= 3/24 + 6/24 + 2/24 = 11/24 = 0.45833

UNIDAD II / PROBABILIDAD.





113
b) E = evento de que solo uno de ellos acierte al blanco
E = {AB`C`, A`BC`, A`B`C}; p(E) =11/24
A = evento de que A acierte al blanco
A = { ABC, ABC`, AB`C, AB`C`}
AE = { AB`C`} = 1/3*1/2*3/4 = 3/24
p(AE)= p(AE)/p(E) = (3/24)/(11/24)
= 3/11 = 0.27273

c) p(ninguno acierte al blanco) = p(ABC) = 2/3*1/2*3/4 = 6/24 = 0.25


2.6. Eventos Independientes

2.6.1 Regla de Bayes.
Teorema de la Probabilidad Total
Sea un espacio probabilstico (, A, P) y { }
n
A A una particin de sucesos de .
Es decir,
n
A
= U y
i j
A A
= I para toda i j

Entonces, para todo suceso B A es ( ) ( | )* ( )
n n
n
P B P B A P A =

.
Resultado que se puede parafrasear diciendo que la probabilidad de un suceso que se
puede dar de varias formas es igual a la suma de los productos de las probabilidades de
ste en cada una de esas formas, P(B / A
n
), por las probabilidades de que se den estas
formas, P(A
n
).

Problema: Una poblacin est formada por tres grupos tnicos: A (un 30%), B (un 10%) y C
(un 6O%). Adems se sabe que el porcentaje de personas con ojos claros en cada una de
estas poblaciones es, respectivamente, del 20%, 40% y 5%. Por el teorema de la
probabilidad total, la probabilidad de que un individuo elegido al azar de esta poblacin
tenga ojos claros es:

P(ojos claros) = P(A) P(ojos claros/A) + P(B) P(ojos claros/B) + P(C) P(0jos claros/C )
= 0'3 0'2 + 0'1 0'4 + 0'6 0'05 = 0'13.
UNIDAD II / PROBABILIDAD.





114
Teorema de Bayes
El siguiente teorema es un resultado con una gran carga filosfica detrs, el cual mide el
cambio que se va produciendo en las probabilidades de los sucesos a medida que vamos
haciendo observaciones. Paradjicamente a su importancia, su demostracin no es ms que
la aplicacin de la definicin de probabilidad condicionada seguida de la aplicacin del
teorema de la probabilidad total.

Teorema:
Sea un espacio probabilstico (, A, P) y { }
n
A A una particin de sucesos de y B A
un suceso con probabilidad positi va. Entonces, para todo suceso A
i
es
( ) ( | )
( | )
( ) ( | )
i i
i
n n
n
P A P B A
P A B
P A P B A
=



Este teorema tiene una interpretacin intuitiva muy interesante. Si las cosas que pueden
ocurrir las tenemos clasificadas en los sucesos A
i
de los cuales conocemos sus
probabilidaes P(A
i
), denominadas a priori, y se observa un suceso B, la frmula de Bayes
nos da las probabilidades a posteriori de los sucesos A<SUB<I< sub>, ajustadas o
modificadas por B.

Problema: Supongamos que tenemos una urna delante de nosotros de la cual solo
conocemos que o es la urna A
1
con 3 bolas blancas y 1 negra, o es la urna A
2
con 3 bolas
negras y 1 blanca. Con objeto de obtener ms informacin acerca de cual urna tenemos
delante, realizamos un experimento consistente en extraer una bola de la urna desconocida.
Si suponemos que la bola extraida result blanca 1B y a priori ninguna de las dos urnas es
ms verosmil que la otra, P(A
1
) = P(A
2
) = 1/2, entonces la frmula de Bayes nos dice que las
probabilidades a posteriori de cada urna son

P(A
1
/1B) =3/4 y P(A
2
/1B) =1/4

Habiendo alterado de esta forma nuestra creencia sobre la urna que tenemos delante: Antes
creamos que eran equiprobables y ahora creemos que es tres veces ms probable que la
urna desconocida sea la A
1
.

UNIDAD II / PROBABILIDAD.





115
Pero, qu ocurrir si extraemos otra bola?. Lgicamente, en la frmula de Bayes
deberemos tomar ahora como probabilidades a priori las calculadas, 3/4 y 1/4, pues stas
son nuestras creencias sobre la composicin de la urna, antes de volver a realizar el
experimento.

Si suponemos que la bola no fue reemplazada (se deja para el lector el caso de
reemplazamiento), y sale una bola negra 2N, la frmula de Bayes nos devolvera a la
incertidumbre inicial, ya que sera
P(A
1
/2N) =1/2 y P(A
2
/2N) =1/2

Si hubiera salido blanca, la frmula de Bayes, al igual que la lgica, tambin sera
concluyente,

P(A
1
/2B) =1 y P(A
2
/2B) =0

La utilizacin de la frmula de Bayes, es decir, la utilizacin de distribuciones de probabilidad
a posteriori como modelos en la estimacin de parmetros, al recoger sta tanto la
informacin muestral, P(B/A
i
), como la informacin a priori sobre ellos, P(A
i
), constituye una
filosofa inferencial en gran desarrollo en los ltimos aos, la cual, no obstante, tiene el
inconveniente (o segn ellos la ventaja) de depender de la informacin a priori, la cual en
muchas ocasiones es subjetiva y por tanto, pudiendo ser diferente de un investigador a otro.

Uno de los primeros intentos por utilizar la probabilidad para hacer inferencias es la base de
una rama de la metodologa estadstica llamada mtodos estadsticos bayesianos.

Con referencia a la figura siguiente podemos escribir A como la unin de los dos eventos
mutuamente excluyentes E A y E A.

De aqu :
A = ( E A ) ( E A. ),

Y por el corolario i del teorema y adems podemos escribir

P ( A ) = P [ (E A ) P ( E A ) ] = P (E A ) + P ( E A )
= P (E ) P (A E) + P ( E ) P ( AE ) .
UNIDAD II / PROBABILIDAD.





116

Problema:
P ( E) = 600/900 = 2/3 ; P (A E) = 36/600 = 3/50
P ( E ) = 1/3 P ( AE ) = 12/300 = 1/25
P ( A ) = (2/3)(3/50) + (1/3)(1/25) = 4/75

Una generalizacin de la ilustracin precedente al caso donde el espacio muestral se parte
en k subconjuntos la cubre el siguiente teorema, que algunas veces se denomina teorema
de probabilidad total o regla de eliminacin

Teorema 2.6.1.
Si los eventos B
1
,

B
2
, ..., B
k
constituyen una particin del espacio muestral S tal que
P(B
i
) 0
para i = 1, 2, ..., k, , entonces para cualquier evento A de S,

= =
= =
k
i
i i
k
i
i
B A B P A B P A P
1 1
) | )( ( ) ( ) (


Problema: En cierta planta de montaje, tres maquinas, B
1
, B
2
y B
3
, montan 30% , 45 % y 25
% de los productos, respectivamente. Se sabe de la experiencia pasada que 2% , 3% y 2%
de los productos ensamblados por cada maquina, respectivamente, tiene defectos. Ahora ,
suponga que se selecciona de forma aleatoria un producto terminado. cual es la
probabilidad de que este defectuoso?

Solucin:
A = el producto esta defectuoso
B
1
: el producto esta ensamblado por la maquina B
1
B
2
: el producto esta ensamblado por la maquina B
2

B
3
: el producto esta ensamblado por la maquina B
3

Al aplicar la regla de eliminacin, podemos escribir
P ( A ) = P (B
1
) P (A B
1
) + P (B
2
) P (A B
2
) + P (B
3
) P (A B
3
)
UNIDAD II / PROBABILIDAD.





117

P (B
1
) P (A B
1
) = (0.3) (0.02) = 0.006; P (B
2
) P (A B
2
) = (0.45)(0.03) = 0.0135
P (B
3
) P (A B
3
) = (0.25)(0.02) = 0.005; P ( A ) = 0.006 + 0.0135 + 0.005 = 0.0245
Cul es la probabilidad de que este producto fuera hecho por la maquina B
i
?
Preguntas de este tipo se puede contestar mediante la regla de bayes

Problema: con referencia al ejemplo anterior, si se elige al azar un producto y se encuentra
que es defectuoso, cual es la probabilidad de que este ensamblado por la maquina B
3
?

Solucin:
3 3
3
1 1 2 2 3 3
( ) ( | )
( | )
( ) ( | ) ( ) ( | ) ( ) ( | )
P B P A B
P B A
P B P A B P B P A B P B P A B
=
+ +

y despus sustituir las probabilidades calculadas en el ejemplo anterior , tenemos:

3
0.005 0.005 10
( | )
0.006 0.0135 0.005 0.0245 49
P B A = = =
+ +


En vista del hecho de que se selecciono un producto defectuoso, este resultado sugiere que
probablemente no fue hecho con la maquina B
3.

Problema: Tres mquinas denominadas A, B y C, producen un 43%, 26% y 31% de la
produccin total de una empresa respectivamente, se ha detectado que un 8%, 2% y 1.6%
del producto manufacturado por estas mquinas es defectuoso,
a) Se selecciona un producto al azar y se encuentra que es defectuoso, cul es la
probabilidad de que el producto haya sido fabricado en la mquina B?,
b) Si el producto seleccionado resulta que no es defectuoso, cul es la probabilidad de que
haya sido fabricado en la mquina C?

Solucin:
UNIDAD II / PROBABILIDAD.





118

a) Definiremos los eventos;
D = evento de que el producto seleccionado sea defectuoso (evento que condiciona); A =
evento de que el producto sea fabricado en la mquina A; B = evento de que el producto sea
fabricado por la mquina B; C = evento de que el producto sea fabricado por la mquina C

( ) ( | )
( | )
( ) ( | ) ( ) ( | ) ( ) ( | )
P B P D B
P B D
P A P D A P B P D B P C P D C
=
+ +


0.26(0.02) 0.0052
( | ) 0.116697
0.43(0.08) 0.26(0.02) 0.31(0.016) 0.04456
P B D = = =
+ +


b) ND = evento de que el producto seleccionado no sea defectuoso (evento que condiciona)
A = evento de que el producto sea fabricado en la mquina A; B = evento de que el producto
sea fabricado por la mquina B; C = evento de que el producto sea fabricado por la mquina
C.

( ) ( | )
( | )
( ) ( | ) ( ) ( | ) ( ) ( | )
P C P ND C
P C ND
P A P ND A P B P ND B P C P ND C
=
+ +


0.31(0.984) 0.30504
( | ) 0.31927
0.43(0.92) 0.26(0.98) 0.31(0.984) 0.95544
P B D = = =
+ +


Problema: Una empresa recibe visitantes en sus instalaciones y los hospeda en cualquiera
de tres hoteles de la ciudad; Palacio del Sol, Sicomoros o Fiesta Inn, en una proporcin de
UNIDAD II / PROBABILIDAD.





119
18.5%, 32% y 49.5% respectivamente, de los cuales se ha tenido informacin de que se les
ha dado un mal servicio en un 2.8%, 1% y 4% respectivamente,
a) Si se selecciona a un visitante al azar cul es la probabilidad de que no se le
haya dado un mal servicio?
b) Si se selecciona a un visitante al azar y se encuentra que el no se quej del
servicio prestado, cul es la probabilidad de que se haya hospedado en el
Palacio del Sol?,
c) Si el visitante seleccionado se quej del servicio prestado, cul es la probabilidad
de que se haya hospedado en e hotel Fiesta Inn?

Solucin: Haciendo uso de un diagrama de rbol;

a) NQ = evento de que un visitante no se queje del servicio; PS = evento de que un
visitante haya sido hospedado en el hotel Palacio del Sol; S = evento de que un
visitante haya sido hospedado en el hotel Sicmoro; FI = evento de que un visitante
haya sido hospedado en el hotel Fiesta Inn

( ) ( ) ( | ) ( ) ( | ) ( ) ( | )
( ) 0.185(0.972) 0.32(0.99) 0.495(0.96) 0.97182
P NQ P PS P NQ PS P S P NQ S P FI P NQ FI
P NQ
= + +
= + + =


b) NQ = evento de que un visitante no se queje del servicio; PS = evento de que un
visitante haya sido hospedado en el hotel Palacio del Sol; S = evento de que un
visitante haya sido hospedado en el hotel Sicomoro; FI = evento de que un visitante
haya sido hospedado en el hotel Fiesta Inn

UNIDAD II / PROBABILIDAD.





120
0.185(0.972) 0.17982
( | ) 0.1850342
0.185(0.972) 0.32(0.99) 0.495(0.96) 0.97182
P PS NQ = = =
+ +


c) Q = evento de que un visitante se queje del servicio; FI = evento de que un visitante
haya sido hospedado en el hotel Fiesta Inn

0.495(0.04) 0.0198
( | ) 0.7026
0.185(0.028) 0.32(0.01) 0.495(0.04) 0.0.02818
P FI Q = = =
+ +
















































UNIDAD 3
FUNCIONES Y
DISTRIBUCIONES
MUESTRALES.
Objetivo:
Establecer las distribuciones de
probabilidad, basndose en datos
de situaciones reales o simuladas
que impliquen eventos aleatorios.
Centrar su estudio en las
distribuciones Binomial,
Hipergeomtrica, Poisson,
Normal, TStudent, chi-cuadrada y
f de Fisher para su aplicacin.
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



122

3.1 Funcin de probabilidad.

3.1.1 Variables aleatorias discretas.
La estadstica se ocupa de realizar inferencias acerca de poblaciones y sus caractersticas.
Se lleva a cabo experimentos cuyos resultados se encuentran sujetos al azar. Por ejemplo,
el espacio muestral que da una descripcin detallada de cada posible resultado cuando se
prueban tres componentes electrnicos se puede escribir como:
S = {NNN, NND, NDN, DNN, NDD, DND, DDN, DDD}

Donde N denota no defectuoso y D denota defectuoso. Naturalmente, estamos
interesados en el nmero de defectuosos que ocurren. De esta forma a cada punto muestral
se le asignara un valor numrico de 0, 1, 2, o 3. Estos resultados son, por supuesto,
cantidades aleatorias determinadas por el resultado del experimento. Se puede ver como
valores que toma la variable aleatoria X, el nmero de artculos defectuosos cuando se
prueban tres componentes electrnicos.

Definicin
Una variable aleatoria es una funcin que asocia un numero real con cada elemento del
espacio muestral.

Ejemplo: supngase que se lanza una moneda dos veces de tal forma que el espacio
muestral es S = {SS, SA, AS, AA }.

Represntese por X el nmero de sol que puede resultar.
Punto muestral SS SA AS AA
X 2 1 1 0

Ejemplo: se sacan dos bolas de manera sucesiva sin reemplazo de una urna que contiene
cuatro bolas rojas y tres negras. Los posibles resultados y los valores x de la variable
aleatoria. x el numero de bolas rojas, son

Punto muestral RR RB BR BB
X 2 1 1 0

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



123

Definicin
Si un espacio muestral contiene un numero finito de posibilidades o una serie interminable
con tantos elementos como nmeros enteros existen, se llama espacio muestral discreto.


3.1.2 Variables aleatorias continuas.
Una variable aleatoria continua tiene una probabilidad cero de tomar exactamente cualquiera
de sus valores. En consecuencia, su distribucin de probabilidad no se puede dar en forma
tabular. Consideremos una variable aleatoria cuyos valores son las alturas de toda la gente
mayor de 21 aos de edad. Entre cualesquiera dos valores, digamos 163.5 y 164.5
centmetros, o incluso 163.99 y 164.01 centmetros, hay un nmero infinito de alturas unas
de las cuales es 164 centmetros. Tratamos ahora como un intervalo en lugar de un valor
puntual de nuestra variable aleatoria. Trataremos el clculo de probabilidades para varios
intervalos de variables aleatorias continuas como:
( ) ( ) , , P a x b P W c < < >
Ntese que cuando x es continua,
( ) ( ) ( ) ( ) b x a P b X P b X a P b x a P < < = = + < < = <
Es decir no importa si incluimos o no un extremo del intervalo. Esto no es cierto, sin
embargo, cuando X es discreta. Aunque la distribucin de probabilidad de variable continua
no se puede representar en forma tabular, se puede establecer como una formula. Dicha
frmula necesariamente ser funcin de los valores numricos de la variable continua f(x)
por lo general se llama funcin de densidad de probabilidad o simplemente funcin de
densidad de X.
Definicin
Si un espacio muestral contiene un nmero infinito de posibilidades igual al nmero de
puntos en un segmento de lnea, se llama espacio muestral continuo.

3.2 Distribucin Binomial.

3.2.1 Conceptos de ensayos de Bernoulli.
Binomial. Es la que maneja la distribucin de la probabilidad de obtener cierta cantidad de
xitos al realizar una cantidad de experimentos con probabilidad de xito constante y con
ensayos independientes
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



124

Las caractersticas de esta distribucin son:
a) En los experimentos que tienen este tipo de distribucin, siempre se esperan dos
tipos de resultados, ejem. Defectuoso, no defectuoso, pasa, no pasa, etc, etc.,
denominados arbitrariamente xito (que es lo que se espera que ocurra) o
fracaso (lo contrario del xito).
b) Las probabilidades asociadas a cada uno de estos resultados son constantes, es
decir no cambian.
c) Cada uno de los ensayos o repeticiones del experimento son independientes entre
s.
d) El nmero de ensayos o repeticiones del experimento (n) es constante.

La distribucin Binomial o de Bernoulli
Consideremos los llamados ensayos Bernoulli, stos son aquellos experimentos cuyo
resultado es uno de dos posibles y mutuamente excluyentes, a los que se denominarn xito
y fracaso.

Entonces se tiene lo que se denomina experimento Binomial, donde el nmero de ensayos
se denota con n, la probabilidad de xito con p y la de fracaso con q. Hay que notar que las
probabilidades de xito y de fracaso estn relacionadas de la siguiente manera: p + q =1.

La distribucin de probabilidad Binomial
La distribucin de probabilidad para una variable aleatoria Binomial esta dada por

n x ,..., 2 , 1 , 0 =
Donde:
p = probabilidad de xito en una sola prueba; q = 1 p (probabilidad de fracaso)
n = nmero de pruebas; x = numero de xitos en n pruebas. La media y la varianza de la
variable Binomial son, respectivamente, np = npq =
2



Problema: Hallar la probabilidad de que al lanzar una moneda tres veces resulten (a) tres
sol; (b) dos guilas y un sol; (c) al menos un sol ; ( d) no ms de una guila.
x n x
q p
x
n
x X P

= = ) (
x n x
q p
x n x
n

=
)! ( !
!
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



125

Solucin:
Puede ocurrir 2 posibilidades (sol o guila ) por cada lanzamiento hay un total de
( 2) ( 2) (2) = 8 resultados posibles.
S = { SSS, SSA, SAS, ASS, SAA, ASA, AAS, AAA}

P(caiga un sol en una sola tirada) = p =
P(no caiga sol en una sola tirada) = q = 1 p =

(a) p( tres sol )
n = 3 y x = 3 n x = 3 3 = 0
dbinom 3 3 ,
1
2
,

0.125 =


(b) p ( dos guilas y un sol )
n = 3 ; x = 2 ; n x = 3 2 = 1
dbinom 2 3 ,
1
2
,

0.375 =


( c ) p (al menos un sol ) = p ( 1 , 2 , 3 sol )
o bien = 1 p (ningn sol )
n = 3 ; x = 0; n x = 3 0 = 3

1 dbinom 0 3 ,
1
2
,

0.875 =


(e) p(no ms de una guila ) = p( 0 guila 1 guila) = p( 0 guila) +p(1 guila )
para 0 guila : n = 3 ; x = 0 ; n x = 3 0 = 3
para 1 guila : n = 3 ; x = 1 ; n x = 3 1 = 2
dbinom 0 3 ,
1
2
,

dbinom 1 3 ,
1
2
,

+ 0.5 =


Problema: La probabilidad de que cierta clase de componente sobreviva a una prueba de
choque dada es . Encuentre la probabilidad de que sobrevivan exactamente dos de los
siguientes cuatro componentes que se prueben.
Solucin:
p = ; n = 4 ; x = 2;
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



126

b ( 2; 4, ) = 4 C2 ( )
2
(1/4)
2
= 27/128 = 0.2109

Problema: La probabilidad de que un paciente se recuper de una delicada operacin de
corazn es 0.9 cul es la probabilidad de que exactamente cinco de los siguientes siete
pacientes intervenidos sobrevivan?

Solucin:
n = 7; p = 0.9, q = 0.1,, x = 5
b ( 5; 7, 0.9) = 7C5 (0.9)
5
(0.1)
2
= 0.1240

Problema: Hallar la probabilidad de que en cinco lanzamientos de un dado honrado
aparezca 3
a) dos veces
b) mximo una vez
c) al menos dos veces

Solucin:
p = 1/6; q = 1 p = 5/6

a) n = 5 ; x = 2
b( 2; 5, 1/6) = 5C2 (1/6)
2
( 5/6)
3
= 625/3888 = 0.16075

b) n = 5 , x= 0 , 1
b( 0; 5, 1/6) + b( 1; 5, 1/6) = 3125/3888= 0.80386

c) n = 5 ; x = 2, 3, 4, 5
b( 2; 5, 1/6) +b( 3; 5, 1/6) +b( 4; 5, 1/6) +b( 5; 5, 1/6) = 763/3888 = 0.19624

Problema: Si el 20 % de los tornillos producidos por una mquina son defectuosos,
determinar la probabilidad de que de 4 tornillos escogidos aleatoriamente
(a)1,
(b) 0,
(c) menos de 2, sean defectuosos.

Solucin:
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



127

(a) n = 4 x =1 p = 0.2 q = 0.8
b(1 ; 4, 0.2) = 0.4096

(b) n = 4 x = 0 p = 0.2 q = 0.8
b(0 ; 4, 0.2) = 0.4096

(c ) n = 4 x = 0, 1 p = 0.2 q = 0.8
p(x<2) = P(x = 0) + P(x = 1) = 0.8192

Problema: Hallar la probabilidad de obtener un total de 7 al menos una vez en tres
lanzamiento de un par de dados honrados.

Solucin:
n = 7 p =1/6 X = 0 q = 5/6
P(al menos un 7 en tres lanzamiento) = 1 P( ningn 7 en 3 lanzamiento)
n = 3 x = 0 p = 1/6 q = 5/6
b ( 0; 3, 1/6) = 125/216 = 0.57870

P(al menos un 7 en tres lanzamiento) = 1 125/216
= 91/216 = 0.42130

Problema: Calcula la probabilidad de que una familia que tiene 4 hijos, 3 de ellos sean
varones.
Solucin: n = 4 y p =1/2 ; x = 3
p(obtener 3 varones) = b(3;4,) = 0.25

Problema: Se tiene una moneda trucada de modo que la probabilidad de sacar cara es
cuatro veces la de sacar cruz. Se lanza 6 veces la moneda. Calcula las siguientes
probabilidades:
a) Obtener dos veces cruz.
b) Obtener a lo sumo dos veces cruz.

Solucin: Calculamos en primer lugar la probabilidad de cara y de cruz:
p(cara) + p(cruz) =1. Si llamamos x a la probabilidad de sacar cruz, podemos escribir:
4 x + x = 1; 5x=1; x =1/5 =0,2
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



128

As resulta: p(cruz)=0,2 y p(cara)=0,8 n = 6 y p = 0,2

a) Probabilidad de obtener dos veces cruz: x = 2
b(2; 6,0.2) = 0.24

b) Probabilidad de obtener a lo sumo dos veces cruz: x 2 o bien x = 0, 1, 2
b(0; 6,0.2) + b(1; 6,0.2)+ b(2; 6,0.2) = 0.90

Problema: La probabilidad de que un alumno de 1 de Bachillerato repita curso es de 0,3.
Elegimos 20 alumnos al azar. Cul es la probabilidad de que haya exactamente 4 alumnos
repetidores?

Solucin:
X = 4 n = 20; p = 0.3 ; q = 0.7
b( 4; 20, 0.3) = 0.13

Problema: Los ingenieros elctricos saben que una corriente neutral elevada en los
sistemas de alimentacin de computadoras son un problema potencial. Un estudio reciente
de las corrientes de carga en sistemas de alimentacin de computadoras en instalaciones
estadounidenses revelo que el 10 % de las instalaciones tenan razones de corriente neutral
a corriente de carga total altas ( IEEE transactions on Industry Applications, Julio / agosto de
2004). Si se escoge una muestra aleatoria de cinco sistemas de alimentacin de
computadora del gran nmero de instalaciones del pas, Que probabilidad hay de que
a) Exactamente tres tengan una relacin de corriente neutral a corriente de carga total
alta?
b) Por lo menos tres tengan una relacin alta?
c) Menos de tres tengan una relacin alta?

Solucin:
a) x = 3; p = 0.1; n = 5
b(3,5,0.1) = 0.0081

b) x 3; p = 0.1; n = 5
b(x = 3,4,5, n = 5, p = 0.1) = 0.0086

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



129

c) x < 3; p = 0.1; n = 5
b(x = 0,1,2, n = 5, p = 0.1) = 0.9914

3.3 Distribucin Hipergeomtrica.

Los tipos de aplicaciones de la distribucin Hipergeomtrica son muy similares a los de la
Binomial. Pero en caso de la Binomial se requiere la independencia entre las pruebas.

El muestreo se debe efectuar con reemplazo de cada artculo despus de que se observe.
Por otro lado, la distribucin Hipergeomtrica no requiere independencia y se basa en el
muestreo que se realiza sin reemplazo.

El experiment Hipergeomtrica posee las siguientes propiedades:
1. Se selecciona sin reemplazo una muestra aleatoria de tamao n de N artculos.
2. K de los N artculos se pueden clasificar como xitos y N K se clasifican como fracaso.

El nmero x de xitos de un experimento Hipergeomtrica se denomina variable aleatoria
Hipergeomtrica. En consecuencia, la distribucin de probabilidad de la variable
Hipergeomtrica se llama distribucin Hipergeomtrica, y sus valores se denotan como h(x,
N, n, k), debido a que dependen del numero de xitos k en el conjunto N del que
seleccionamos n artculos.


Problema: Se selecciona al azar un comit de cinco personas entre tres qumicos y cinco
fsicos. Encuentre la distribucin de probabilidad para el nmero de qumicos en el comit.

Solucin:
3 0 5 5
8 5
( )( )
( 0) (0,8,5,3) 0.0179
C C
P x h
C
= = = =
3 1 5 4
8 5
( )( )
( 1) (1,8,5,3) 0.2679
C C
P x h
C
= = = =
( )
( )( )
n N
x n k N x k
C
C C
n
N
x n
k N
x
k
k n N x h

=

= , , ,
n x ,..., 2 , 1 , 0 =
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



130


3 2 5 3
8 5
( )( )
( 2) (2,8,5,3) 0.5357
C C
P x h
C
= = = =
3 3 5 2
8 5
( )( )
( 3) (3,8,5,3) 0.1786
C C
P x h
C
= = = =

En forma tabular la distribucin Hipergeomtrica de x es como sigue:

x 0 1 2 3
h (x, N, n k) 0.0179 0.2679 0.5357 0.1786

Problema: Lotes de 40 componentes cada uno se denomina aceptables sino contienen mas
de tres defectuosos. El procedimiento para muestrear el lote es la seleccin de cinco
componentes al azar y rechazar el lote si se encuentra un componente defectuoso. cual es
la probabilidad de que se encuentre exactamente un defectuoso en la muestra si hay tres
defectuosos en todo el lote ?
Solucin:
N = 40, n = 5; k = 3; x = 1
3 1 37 4
40 5
( )( )
(1,40,5,3) 0.3011
C C
h
C
= =

Problema: Una caja contiene 6 bolas blancas y 4 rojas. Se realiza un experimento en el cual
se selecciona una bola aleatoriamente y se observa su color, pero no se reemplaza la bola.
Hallar la probabilidad de que despus de 5 pruebas del experimento se haya escogido 3
bolas blancas.

N = 10; n = 5; x = 3; k = 6
6 3 4 2
10 5
( )( )
(3,10,5,6) 0.4762
C C
h
C
= =

Problema: Un lote de 40 artculos se seleccionan al azar 4 para probarlos y si fallan la
prueba mas de 2 se rechaza el lote completo. Cul es la probabilidad de rechazar un lote
que tenga 8 defectuosos? Dado que el muestreo se hace sin reemplazo y la fraccin de
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



131

muestreo es grande (10%) tenemos una variable aleatoria Hipergeomtrica. Los parmetros
son: N = 40, k = 8, n = 4, x es el numero de defectuosos en la muestra y queremos la
probabilidad p ( x > 2)

Solucin:
P ( x > 2 ) = p (x = 3) + p(x = 4) = h ( 3; 40, 4, 8) + h ( 4 ; 40, 4, 8) = 0.0204

Problema: Esta es la probabilidad de rechazar un lote con 25 % de defectuosos y es muy
baja. Para mejorar el proceso de seleccin, los ingenieros deciden rechazar el lote cuando
haya 2 o mas defectuosos. Cul es la probabilidad de rechazar un lote que tenga 8
defectuosos? Los parmetros permanecen iguales lo que cambia es la probabilidad ahora
es: p ( x 2 ) = p (x = 2) + p ( x > 2)

Solucin:
N = 40 ; n = 4, k = 8 ; x 2
p ( x 2 ) = p (x = 2) + p (x = 3) + p(x = 4)]
= h ( 2; 40, 4, 8) + h ( 3; 40, 4, 8) + h ( 4 ; 40, 4, 8) = 0.1723

Problema: Con esta nueva poltica de rechazar el lote cuando sean 2 o ms cul es la
probabilidad de rechazar un lote con 6 defectuosos? los parmetros son, ahora N = 40, k =
6; n = 4 y queremos la probabilidad:
p (x > 10 ) = 1 - [ p (x = 0) + p ( x = 1)] = 1 [ h (0 , 40, 4, 6) + h ( 1,40, 4,6)]=
= 1 ( 0.5075 + 0.3929 ) = 0.0996

Problema: En el saln de tercer ao de una escuela hay 35 alumnos, de los cuales 10 son
nias y 25 nios. Se nombra un comit de 7 alumnos que represente al saln. La seleccin
se hace al azar. que probabilidad hay de que en el comit haya mayora de nias? En
situaciones se cumple las hiptesis de una Hipergeomtrica. Los parmetros son : N = 35,
k = 10, n = 7, x es el numero de nias en el comit. La probabilidad pedida es:
P (x > 3 ) = p (x = 4) + p (x = 5) + p (x = 6) + p (x = 7)

Solucin:
=h(4,35,7,10)+h(5,35,7,10)+ (6,35,7,10)+h(7,35,7,10)
= 0.0718 + 0.0112 + 7.8072 x 10
4
+ 1.7845 x 10
5
= 0.0838

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



132

3.4 Distribucin de Poisson.

Los experimentos que dan valores numricos de una variable aleatoria x, el nmero de
resultados que ocurren durante un intervalo dado o en una regin especifica, se llaman
experimentos de Poisson. El intervalo puede ser de cualquier longitud, como un minuto, un
das , una semana, un mes, o incluso un ao. Por ello un experimento de Poisson puede
generar observaciones para la variable aleatoria x que representa el nmero de llamadas
telefnicas por hora que recibe una oficina, el nmero de das que la escuela permanece
cerrada debido a la nieve durante invierno o el nmero de juegos suspendidos debido a la
lluvia durante la temporada de bisbol. La regin especfica podra ser un segmento de
lnea, un rea o quizs una pieza de material. En tales casos X puede representarse el
numero de ratas de campo por acre, el numero de bacterias en un cultivo dado o el numero
de errores mecanogrficos por pagina.

Un experimento de Poisson se deriva del proceso de Poisson y posee las siguientes
propiedades:
1. el numero de resultados que ocurren en un intervalo o regin especifica es
independiente del numero que ocurre en cualquier otro intervalo o regin del espacio
disjunto. De esta forma vemos que el proceso de Poisson no tiene memoria.

2. la probabilidad de que ocurra un solo resultado durante un intervalo muy corto o una
regin pequea es proporcional a la longitud del intervalo o al tamao de la regin y
no depende del nmero de resultados que ocurren fuera de este intervalo o regin.

3. la probabilidad de que ocurra mas de un resultado en tal intervalo corto o que caiga
en tal regin pequea insignificante.

4. El numero X de resultados que ocurren durante un experimento de Poisson se llama
variable aleatoria de Poisson y su distribucin de probabilidad se llama distribucin
de Poisson. El nmero medio de resultados en cada unidad se denota por la letra
griega lambda, .

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



133

La distribucin de probabilidad de Poisson
La distribucin de probabilidad para una variable aleatoria de Poisson esta dada por :
!
) , (
x
e
x p


= ; x = 0, 1, 2, ...
donde :
= Numero medio de eventos en una unidad dada de tiempo, rea o volumen.
= e 2.71828...
La media y la varianza de una variable aleatoria de Poisson son , respectivamente,
= y =
2


Problema: Supongamos que el numero de grietas por espcimen de concreto con cierto tipo
de mezcla de cemento tiene una distribucin de probabilidad de Poisson aproximada.
Adems, suponga que el nmero medio de grietas por espcimen es de 2.5.
a) Calcule la media y la desviacin estndar de x, el numero de grietas por espcimen
de concreto.
b) Calcule la probabilidad de que un espcimen de concreto escogido al azar tenga
exactamente cinco grietas.
c) Calcule la probabilidad de que un espcimen de concreto escogido al azar tenga dos
o mas grietas.

Solucin:
a) Tanto la media como la varianza de una variable aleatoria de Poisson son iguales a .
Por tanto, 5 . 2 = = 5 . 2
2
= =
Entonces la desviacin estndar es
58 . 1 5 . 2 = =

b) Queremos conocer la probabilidad de que un espcimen de concreto tenga
exactamente cinco grietas. La distribucin de probabilidad de x
5 . 2 = ; x = 5;
067 . 0
! 5
5 . 2
) 5 (
5 . 2 5
= =

e
p
c) Para determinar la probabilidad de que un espcimen de concreto tenga o mas
grietas necesitamos calcular
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



134

( ) ( ) ( )

=
= + + + =
2
) ( ... 4 3 2 ) 2 (
x
x p p p p x p

Si queremos calcular la probabilidad de este evento, es preciso considerar el evento
complementario. As,
( )
( ) ( ) [ ]
713 . 0 287 . 0 1
1 0 1
) 2 ( 1 2
= =
+ =
< =
p p
x p x p


Problema: Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las
probabilidades de que reciba,
a) cuatro cheques sin fondo en un da dado,
b) 10 cheques sin fondos en cualquiera de dos das consecutivos?

Solucin:
a) x = variable que nos define el nmero de cheques sin fondo que llegan al banco en un
da cualquiera = 0, 1, 2, 3, ....., etc
= 6 cheques sin fondo por da
e = 2.718

p(4, 6 ) = 0.1339

b) x = variable que nos define el nmero de cheques sin fondo que llegan al banco en dos
das consecutivos = 0, 1, 2, 3, ......, etc., etc.
= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos

P(10, 12 ) = 0.1049

Problema: En la inspeccin de hojalata producida por un proceso electroltico continuo, se
identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de
identificar
a) una imperfeccin en 3 minutos,
b) al menos dos imperfecciones en 5 minutos,
c) cuando ms una imperfeccin en 15 minutos.

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



135

Solucin:
a) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 3
minutos = 0, 1, 2, 3, ...., etc., etc.
= 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata

P( 1, 0.6) = 0.3293

b) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 5
minutos = 0, 1, 2, 3, ...., etc., etc.
= 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata

) 1 , 1 , 0 ( 1 ) 1 ... , 4 , 3 , 2 ( = = = = = x p etc x p = 1- (0.367918+0.367918) = 0.26416

c) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 15
minutos = 0, 1, 2, 3, ....., etc., etc.
= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata
( 0,1, 3) ( 0, 3) ( 1, 3)
0.0498 0.1494 0.1992
p x p x p x = = = = = + = =
= + =


Problema: Durante un experimento de laboratorio el nmero promedio de partculas
radiactivas que pasan a travs de un contador en un milisegundo es cuatro cul es la
probabilidad de que seis partculas entren al contador en un milisegundo dado?
t = 4; x = 6



Aproximacin de la binomial por la poisson
En este caso se determinarn probabilidades de experimentos Binomiales, pero que dadas
sus caractersticas, es posible aproximarlas con la distribucin de Poisson, estas
caractersticas son, n ( n es muy grande) y p 0 (p es muy pequea), por lo que:


( )
1042 . 0
! 6
4
) (
4 6
= =

e
x f
! x
q p C ) p , n , x ( p
x
x n x
x n

=
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



136

La expresin anterior solo se cumple cuando n y p 0, solo en este caso, si esto no
se cumple, la aproximacin no se puede llevar a efecto, por lo que la frmula a utilizar en
este caso sera:


Donde:
= = n p = nmero esperado de xitos = tasa promedio de xitos; n = nmero de
repeticiones del experimento; p = probabilidad de xito = p(xito)

Una regla general aceptable es emplear esta aproximacin si n 20 y p 0.05: s n 100, la
aproximacin es generalmente excelente siempre y cuando n p 10.

Problema: Se sabe que el 5% de los libros encuadernados en cierto taller tienen
encuadernaciones defectuosas. Determine la probabilidad de que 2 de 100 libros
encuadernados en ese taller, tengan encuadernaciones defectuosas, usando,
a) la frmula de la distribucin Binomial,
b) la aproximacin de Poisson a la distribucin Binomial.

Solucin:
a) n = 100
p = 0.05 = p(encuadernacin defectuosa) = p(xito)
q = 0.95 = p(encuadernacin no defectuosa) = p(fracaso)
x = variable que nos define el nmero de encuadernaciones defectuosas en la muestra
= 0, 1, 2, 3,....,100 encuadernaciones defectuosas

p(x = 2, n = 100, p = 0.05 ) = 0.0812

b) n = 100 encuadernaciones
p = 0.05
= n p = (100)(0.05)= 5
x = variable que nos define el nmero de encuadernaciones defectuosas en la muestra =
= 0, 1, 2, 3,....,100 encuadernaciones defectuosas

p(2, 5) = 0.0843
! x
) , x ( p
x


=
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



137

Al comparar los resultados de las probabilidades con una y otra distribucin, nos damos
cuenta de que la diferencia entre un clculo y otro es de tan solo 0.0031, por lo que la
aproximacin de Poisson es una buena opcin para calcular probabilidades Binomiales.

Problema: Un fabricante de maquinaria pesada tiene instalados en el campo 3840
generadores de gran tamao con garanta. S la probabilidad de que cualquiera de ellos falle
durante el ao dado es de 1/1200 determine la probabilidad de que
a) 4 generadores fallen durante el ao en cuestin,
b) que ms 1 de un generador falle durante el ao en cuestin.

Solucin:
a) n = 3840 generadores
p = 1/1200 = probabilidad de que un generador falle durante el ao de garanta
= n p = (3840)(1/1200) = 3.2 motores en promedio pueden fallar en el ao de garanta
x = variable que nos define el nmero de motores que pueden fallar en el ao de garanta =
0, 1, 2, 3,....,3840 motores que pueden fallar en el ao de garanta

dpois 4 3.2 , ( ) 0.1781 =


b) ) 1 ( 1 ) 1 ( = > x p x P
1 dpois 0 3.2 , ( ) dpois 1 3.2 , ( ) + ( ) 0.8288 =


Problema: En un proceso de manufactura, en el cual se producen piezas de vidrio, ocurren
defectos o burbujas, ocasionando que la pieza sea indeseable para la venta. Se sabe que en
promedio 1 de cada 1000 piezas tiene una o ms burbujas. Cul es la probabilidad de que
en una muestra aleatoria de 8000 piezas, menos de 3 de ellas tengan burbujas?

Solucin:
n = 8000 piezas
p = 1/1000= 0.001 probabilidad de que una pieza tenga 1 o ms burbujas
= np = (8000)(1/1000) = 8 piezas en promedio con 1 o ms burbujas
x = variable que nos define el nmero de piezas que tienen 1 o ms burbujas =
= 0,1, 2, 3,....,8000 piezas con una o ms burbujas

dpois 0 8 , ( ) dpois 1 8 , ( ) + dpois 2 8 , ( ) + 0.0138 =


UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



138

Problema: Diez por ciento de las herramientas producidas en un proceso de fabricacin
determinado resultan defectuosas. Hallar la probabilidad de que en una muestra de 10
herramientas seleccionadas aleatoriamente, exactamente 2 estn defectuosas, empleando
la aproximacin de Poisson a la distribucin Binomial
p = 0.1; n = 10 = n p = 0.1 (10) = 1 ; x = 2

dpois 2 1 , ( ) 0.1839 =


Problema: Si la probabilidad de que un individuo sufra una reaccin negativa ante una
inyeccin de cierto suero es 0.001, hallar la probabilidad de que entre 2000 individuos:
(a) exactamente 3 ;
(b) mas de 2 de ellos reaccionen negativamente.

Solucin:
= N p = (2000) ( 0.001) = 2
(a) P r{3 individuos reaccionen negativamente} =
dpois 3 2 , ( ) 0.1804 =


(b) P r{ms de 2 de ellos reaccionen negativamente}
= 1 P r(0 1 2 lo sufran)

1 dpois 0 2 , ( ) dpois 1 2 , ( ) + dpois 2 2 , ( ) + ( ) 0.3233 =


Problema: Diez por ciento de las herramientas producidas en un proceso de fabricacin
determinado resultan defectuosas. Hallar la probabilidad de que en una muestra de 10
herramientas seleccionadas aleatoriamente, exactamente 2 estn defectuosas, empleando
a) La distribucin Binomial
b) la aproximacin de Poisson a la distribucin Binomial.

Solucin.
a) x = 2; n = 10 ; p = 10 % = 0.1 ; q = 0.9
dbinom2 10 , 0.1 , ( ) 0.1937 =


b) = n p = 10 (0.1) = 1; x = 2
dpois 2 1 , ( ) 0.1839 =


UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



139

En general la aproximacin es buena si P 0.1


3.5 Esperanza matemtica.

Media de una variable aleatoria.
Si se lanzan 16 veces dos monedas y X es el nmero de caras que ocurre por lanzamiento,
entonces los valores de X pueden ser 0,1 y 2. Suponga que en el experimento salen cero
caras, una cara y dos caras un total de cuatro, siete y cinco veces, respectivamente. El
numero promedio de caras por lanzamiento de las dos monedas es entonces:

( )( ) ( )( ) ( )( )
06 . 1
16
5 2 7 1 4 0
=
+ +


Este es un valor promedio y no es necesariamente un posible resultado del experimento.
O bien :
( ) ( ) ( ) 06 . 1
16
5
2
16
7
1
16
4
0 =



Los nmeros 4/16, 7/16, y 5/16 son las fracciones de los lanzamientos totales que tienen
como resultado cero, una y dos caras, respectivamente. Estas fracciones tambin son la
frecuencia relativa de los diferentes valores de X en nuestro experimento. En efecto,
entonces, podemos calcular la media o promedio de un conjunto de datos mediante el
conocimiento de los distintos valores que ocurren y sus frecuencias relativas, sin un
conocimiento del nmero total de observaciones en nuestro conjunto de datos.

Por tanto, si 4/16 o 1/4 de los lanzamientos tiene como resultado cero caras, 7/16 de los
lanzamientos tienen como resultado una cara y 5/16 de estos tiene dos caras, el numero
medio de caras por lanzamiento ser 1.06 sin importar si el nmero total de lanzamiento fue
16,000 o incluso 10,000.

Utilicemos frecuencias relativas para calcular el nmero promedio de caras por lanzamiento
que podramos esperar en el largo plazo. Nos referimos a este valor promedio como la
media de la variable x o la media de la distribucin de probabilidad de X y la denotamos
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



140

por
x
o simplemente como cuando este claro a que variable nos referimos. Tambin es
comn entre los estadsticos referirse a esta media como la esperanza matemtica o el valor
esperado de la variable aleatoria X y denotarla como E(X).

Supongamos que se lanza monedas legales, encontramos un espacio muestral para nuestro
experimento es
{ } TT TH HT HH S , , , = .
Como los 4 puntos mustrales son iguales probables, se sigue que
( ) ( )
4
1
2
1
2
1
0 =

= = = TT P X P
( ) ( ) ( )
2
1
4
1
4
1
1 = + = + = = TH P HT P X P
( ) ( )
4
1
2 = = = TT P X P
Este resultado significa que una persona que lance dos monedas una y otra vez, en
promedio, obtendr una cara por lanzamiento.

Definicin
Sea X una variable aleatoria con distribucin de probabilidad f(x). La media o valor
esperado de X es ( )

= =
x
x xf X E ) ( ; si X es discreta,

Problema: Un inspector de calidad muestrea un lote que contiene siete componentes; el lote
contiene cuatro componentes buenos y tres defectuosos. El inspector toma una muestra de
tres componentes. Encuentre el valor esperado del nmero de componentes buenos en esta
muestra.

Solucin: sea X el nmero de componentes buenos en la muestra. La distribucin de
probabilidad de x es

( )( )
( )
7
3
3
3
4
) (
x x
x F

= x = 0, 1, 2, 3

Unos simples clculos dan
f(0) = 1/35 = 0.028571428,
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



141

f(1) = 12/35= 0.342857142;
f(2) = 18/35= 0.514285714;
f(3) = 4/35= 0.114285714. Por tanto.

( ) ( ) ( ) ( ) 71 . 1
7
12
35
4
3
35
18
2
35
12
1
35
1
0 ) ( = =

= = X E

De esta forma si se selecciona al azar una muestra de tamao tres una y otra vez de un
lote de cuatro componentes buenos y tres defectuosos, contendra, en promedio 1.7
componentes buenos.

Problema: En un juego de azar se pagaran $5 a una persona si solo salen caras(H) o
cruces (T) cuando se lanzan tres monedas, y ella pagara $ 3 si salen una o dos caras.
cual es su ganancia esperada?

Solucin: el espacio muestral para los posibles resultados cuando se lanzan de manera
simultnea tres monedas, o de manera equivalente si se lanzan tres veces una moneda, es

{ } TTT TTH THT HTT THH HTH HHT HHH S , , , , , , , =


Se podra argumentar que cada una de estas posibilidades es igualmente probable y que
ocurre con la probabilidad de 1/8. un mtodo alternativo seria aplicar la regla de la
multiplicacin de probabilidad para eventos independientes a cada elemento de S. Por
ejemplo,

P ( HHT) = P(H) P(H) P(T) = (1/2)(1/2)(1/2) = 1/8

La variable aleatoria de inters es Y, el monto que el jugador puede ganar; y los valores
posibles de Y son $5 si ocurre el evento
{ } TTT HHH E ,
1
=

Y - $ 3 si ocurre el evento
{ } TTH THT HTT THH HTH HHT E , , , , ,
2
=

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



142

Evento. Como E
1
y E
2
ocurren con probabilidades y , respectivamente, se sigue que

( ) ( ) ( ) 1
4
3
3
4
1
5 =

= = Y E

En este juego la persona perder, en promedio, $1 por lanzamiento de las tres monedas. Un
juego se considera equitativo si el jugador, en promedio, queda empatado. Por tanto, una
ganancia esperada de cero define un juego equitativo.

Consideremos una nueva variable aleatoria g(X), que depende de X; es decir, cada valor de
g(X) esta determinado al conocer los valores de X. Por ejemplo, g(X) podra ser X
2
o 3X 1 ,
de modo que siempre que x tome el valor 2, g(X) toma el valor g(2). En particular, si X es
una variable aleatoria discreta con distribucin de probabilidad
), (x f 2 , 1 , 0 , 1 = x y
2
) ( X X g = entonces

( ) [ ] ( ) ( )
( ) [ ] ( ) ( )
( ) ( )
( ) [ ] ( ) ) 2 ( 2 4
, 1 1
1 1 1
0 0 0
f X P X g P
f f
X P X P X g P
f X P X g P
= = = =
+ =
= + = = =
= = = =


De modo que la distribucin de probabilidad de g(X) se puede escribir como

) (x g
0 1 4
[ ] ) ( ) ( x g X g P =
) 0 ( f ) 1 ( ) 1 ( f f + ) 2 ( f

Por definicin del valor esperado de una variable aleatoria, obtenemos

[ ]
( ) ( ) ( ) [ ] ( ) 2 4 1 1 1 0 0
) (
) (
f f f f
x g E
X g
+ + + =
=


( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

=
+ + + =
x
x f x g
f f f f
) ( ) (
2 2 1 1 0 0 1 1
2 2 2 2

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



143

este resultado se generaliza en el siguiente teorema para variables discretas y continuas.
Teorema
Sea x una variable aleatoria con distribucin de probabilidad f(x). La media o valor esperado
de la variable aleatoria g(X) es

( ) [ ]

= = ); ( ) (
) (
x f x g X g E
X g
si X es discreta

Problema: Suponga que el numero de autos x que pasa por un lavado de autos entre 4:00
pm y 5:00 pm en cualquier viernes soleado tienen la siguiente distribucin de probabilidad :

x 4 5 6 7 8 9
P(X = x) 1 / 12 1 / 12 1 / 4 1 / 4 1 / 6 1 / 6

Sea g(x) = 2X 1 la cantidad de dinero en dlares, que el administrador paga al
dependiente. Encuentre las ganancias esperadas de dependiente en este periodo particular.

Solucin:

( ) [ ] ( )
( ) ( )
( ) ( ) ( ) ( ) ( ) ( ) 67 . 12 $
6
1
17
6
1
15
4
1
13
4
1
11
12
1
9
12
1
7
1 2
1 2
9
4
=

=
=
=

= x
X f x
X E X g E


Debemos extender ahora nuestro concepto de esperanza matemtica al caso de dos
variables aleatorias X y Y con distribucin de probabilidad conjunta ) , ( y x f .

Definicin
Sean X y Y variables aleatorias con distribucin de probabilidad conjunta f(x , y ). La media
o valor esperado de la variable aleatoria g(X, Y ) es
( ) [ ]

= =
x y
Y X g
y x f y x g Y X g E ) , ( ) , ( ,
) , (
; si X y Y son discretas

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



144

Problema: Sean X y Y variables aleatorias con distribucin de probabilidad conjunta que se
indica en la tabla siguiente:
) , ( y x f
X Totales por
rengln
0 1 2
0 3/28 9/28 3/28 15/28
Y 1 3/14 3/14 3/7
2 1/28 1/28
Totales por
columna
5/14 15/28 3/28 1

Encuentre el valor esperado de g ( X, Y ) = XY

Solucin:
( )
( ) ( )( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )( ) ( )
( )
14
3
) 1 , 1 (
0 , 2 0 2 1 , 1 1 1 0 , 1 0 1 2 , 0 2 0 1 , 0 1 0 0 , 0 0 0
) , (
2
0
2
0
= =
+ + + + + =
=

= =
f XY E
f f f f f f XY E
y x xyf XY E
x y


Definicin
Sea X una variable aleatoria con distribucin de probabilidad f(x). La media o valor
esperado de X es


= = dx x xf X E ) ( ) ( ; si X es continua



Un ingeniero se interesa en la vida media de cierto tipo de dispositivo electrnico. Esta es
una ilustracin de problema de tiempo de falla que a menudo se presenta en la prctica. El
valor esperado de la vida del dispositivo es un parmetro importante para su evaluacin.

Problema: Sea X la variable que denota la vida en horas de cierto dispositivo electrnico. La
funcin de densidad de probabilidad es:

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



145

=
0
000 , 20
) (
3
x
x f
caso otro cualquier en
100 > x


Encuentre la vida esperada de este tipo de dispositivo.
Solucin:
200
20000 20000
) (
100
2
100
3
= =

= =


dx
x
dx
x
x X E
Teorema
Sea x una variable aleatoria con distribucin de probabilidad f(x). La media o valor esperado
de la variable aleatoria g(X) es
( ) [ ] dx x f x g X g E
X g


= = ) ( ) (
) (
; si X es continua

Problema: Sea X una variable aleatoria con funcin de densidad

=
0
,
3
) (
2
x
x f
caso otro cualquier en
2 1 < < x


Encuentre el valor esperado de g(X) = 4X + 3 .

Solucin:
( )
( )
( ) 8 3 4
3
1
3
3 4
3 4
2
1
2 3
2
1
2
= + =
+
= +


dx x x dx
x x
X E
Debemos extender ahora nuestro concepto de esperanza matemtica al caso de dos
variables aleatorias X y Y con distribucin de probabilidad conjunta ) , ( y x f .
Definicin
Sean X y Y variables aleatorias con distribucin de probabilidad conjunta f(x,y). La media o
valor esperado de la variable aleatoria g(X, Y ) es
( ) [ ] dy dx y x f y x g Y X g E
Y X g


= = ) , ( ) , ( ,
) , (
; si X y Y son continuas.


Problema:
Solucin:
Tenemos

3.6 Distr

3.6.1 Dis
La distribuc
es la distri
de campan
la investiga

Adems
mediante u
gaussiana,
ecuacin a

Se dice qu
nombre de
UNIDA
Encuentre E
( ) , y x f

X
Y
E
ibucin no
stribucin
cin continua
ibucin norm
na, la cual de
acin.
, los errores
una distribuc
en honor
a partir de un
e estas varia
e curva norm
AD III / FUN

X
Y
E para
(

+
=
0
4
3 1 y x
1
0
2
0


x
y
X
Y
ormal.
de la prob
a de probab
mal. Su gra
escribe much
s en las me
in normal. L
de Karl Frie
estudio de e
ables tienen
mal o campa
NCIONES
la funcin de
)
2
y

en
0<
4
3 1 (
2
+

y x
x
y
babilidad
bilidad ms im
afica, que se
hos fenmen
ediciones cie
La distribuci
edrich Gaus
errores en m
una distribuc
ana de Gaus
Y DISTRI
e densidad
o cualquier
, 2 < < x
)
1
0
2
=

dxdy
contina.
mportante en
denomina c
nos que ocur
entficas se
n normal a
ss (1777
mediciones re
cin normal
ss. Para exp
BUCIONE
caso otro
0<
2
1
0
3
=
+
dy
y y
n todo el ca
curva normal
rren en la nat
aproximan e
menudo se d
1855), quie
epetidas de la
y la funcin
presar que u
ES MUEST
1 < < y

8
5
=
mpo de la e
, es la curva
turaleza, la i
extremadam
denomina di
en tambin d
a misma can
de densidad
una variable
TRALES.

146
estadstica
en forma
ndustria y
ente bien
stribucin
derivo su
ntidad.
d recibe el
aleatoria
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



147

continua X, tiene una distribucin normal de media y desviacin tpica , escribimos
.
Distribucin normal
La funcin de densidad de la variable aleatoria normal X, con media y varianza ,
2
es
( )
( ) ( ) [ ]
2
/
2
1
2
1
, ;



=
x
e x n < < x
donde
... 14159 . 3 = y ... 71828 . 2 = e

Existen unas tablas que permiten calcular probabilidades en distribuciones normales
reducidas. Por ello es aconsejable transformar cualquier variable aleatoria X que sigue que
sigue una distribucin en otra variable Z que siga una distribucin N(0,1).
El cambio de variable que es necesario hacer es el siguiente:

Caractersticas:
a) Es generada por una variable de tipo continuo, denominada x; -< x <
b) La funcin que nos define esta distribucin es:
-< x <
Al dar a la funcin los valores de ,
2
y valores a x, obtendremos la distribucin en
cuestin, la que tiene forma de campana, por lo que tambin se le conoce como
campana de Gauss. Hay un nmero infinito de funciones de densidad Normal, una
para cada combinacin de y . La media mide la ubicacin de la distribucin y la
desviacin estndar mide su dispersin.
c) Es simtrica con respecto a su eje vertical.
d) Es asinttica con respecto a su eje horizontal; esto quiere decir que jams va a tocar
el eje de las equis.
e) El rea total bajo la curva es 1.
f) S sumamos a , se observar que aproximadamente el 68.26% de los
datos se encuentran bajo la curva, si sumamos a 2, el 95.44% de los datos
estar entre esos lmites y si sumamos a 3, entonces el 99.74% de los datos
caer dentro de esos lmites. Esta caracterstica es a la vez una forma emprica y

) , ( N
) , ( N


=
X
Z
2 2
2 2
2
1



/ ) x (
) , , x ( f

=
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



148

rpida de demostrar si los datos que se analizan tienen una distribucin Normal; ya
que para trabajar los datos con esta distribucin, debe verificarse que efectivamente
as se distribuyen, ya que de no hacerlo, las decisiones que en un momento dado se
tomarn de un anlisis de los datos con la distribucin Normal, seran errneas.

Definicin
La distribucin de una variable aleatoria normal con media cero y varianza 1 se llama
distribucin normal estndar.


Problema: Encuentre la probabilidad para cada ejercicio,
a)
La probabilidad pedida se encuentra directamente en las tablas . Basta buscar 1,2 en la
columna y 0,03 en la fila. Su interseccin nos da la probabilidad.


8907 . 0 ) 23 . 1 ( = z P
Para calcularlo a travs de la frmula original se le suma 0.5 que es de la parte de la regin
negativa mas lo que se va a calcular.
0.5
1
2
0
1.23
u e
u
2

+ 0.8907 =

b)

) 23 , 1 ( Z p
) 24 , 1 ( Z p

Dos formas
1) usando e
2) Restand

0.5
c) P ( z -
( 0 z P

d)

Observand

5 , 0 ( p
UNIDA
(Z P
s de calcular
el teorema P
do 0.5 que es
1
2
0
1.24
e

0.72 )
) 235 . 0 72 . =
do la figura se
) 76 , 1 5 Z
AD III / FUN
1 ) 24 . 1 = Z
r:
P + q = 1
1 0.5+

s la parte com
u e
u
2

2
d

0 =
58
0.5
1
2


e deduce qu
)
NCIONES
2 . 1 ( 1 < Z P
1
2
0
1.24

mpleta de la
0.1075

1
2
0.72
0
e

e
Y DISTRI
8 . 0 1 ) 24 =
4
u e
u
2

2
d

regin somb
u e
u
2

2
d

0 =
BUCIONE
10 . 0 8925=
0.1075 =

breada de la
.2358

ES MUEST
075

seccin pos
TRALES.

149
sitiva
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



150

(0.5 1.76) ( 1.76) ( 0.5)
0.9608 0.6915 0.2693
p z p z p z =
= =

1
2
0
1.76
u e
u
2

d
1
2
0
0.5
u e
u
2

0.2693 =


Problema: El peso de los individuos de una poblacin se distribuye normalmente con media
de 70 Kg. y desviacin tpica 6 Kg. De una poblacin de 2000 personas, calcula cuntas
tendrn un peso comprendido entre 64 y 76 Kg.
Solucin:
Se trata de una distribucin N (70,6)
= 70 Kg. , = 6 Kg. ; X = 64 y 76 Kg.
64 70 76 70
1 1
6 6
Z Z

= = = =

Z = -1 Z = 1
( )
( ) ( ) 1 1
1 1 769 64 (
=
=
z p z p
z p X p


Por tanto,
p(64 X 76 ) = 0.8413 0.1587 = 0.6826

Esto significa que el 68,25 % de las personas pesan entre 64 y 76 Kg.
Como hay 2000 personas, calculamos el 68,25% de 2000 y obtenemos 1365 personas.

Problema: El acero que se utiliza para tuberas de agua a menudo se recubre internamente
con un mortero de cemento para evitar la corrosin. En un estudio de los recubrimientos de
mortero de una tubera empleada en un proyecto de transmisin de agua en California
(Transportation Engineering Journal, Noviembre de 1979) se especific un espesor de 7/16
pulgadas para el mortero. Un gran nmero de mediciones de espesor dieron una media de
0.635 pulgadas y una desviacin estndar de 0.082 pulgadas. S las mediciones de
espesor, tenan una distribucin Normal, qu porcentaje aproximado fue inferior a 7/16 de
pulgada?


=
X
Z
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



151

Solucin:
x = variable que nos define el espesor del mortero en pulgadas; = 0.635 pulgadas; =
0.082 pulgadas

0080 . 0 ) 41 . 2 ( = Z P

Por tanto, 0.008 x 100% = 0.8% de los recubrimientos de mortero tienen un espesor menor
de 7/16 pulgadas

Problema: Un tubo fluorescente estndar tiene una duracin distribuida Normalmente, con
una media de 7,000 horas y una desviacin estndar de 1,000 horas. Un competidor ha
inventado un sistema de iluminacin fluorescente compacto que se puede insertar en los
receptculos de lmparas incandescentes. El competidor asegura que el nuevo tubo
compacto tiene una duracin distribuida Normalmente con una media de 7,500 horas y una
desviacin estndar de 1,200 horas.
a) Cul tubo fluorescente tiene mayor probabilidad de tener una duracin mayor de
9,000 horas?
b) Cul tubo tiene mayor probabilidad de tener una duracin de menos de 5,000
horas?

Solucin:
a) Tubo 1
X
1
= variable que nos define la duracin en horas de un tubo fluorescente
= 7,000 horas; = 1,000 horas

Tubo 2
X
2
= variable que nos define la duracin del tubo fluorescente del competidor
= 7,500 horas; = 1,200 horas



p(x
1
> 9,000 horas) = p (z
1
> 2.00 )
= 1 0.9772 = 0.0228
41 2 4085 2
082 0
635 0 4375 0
082 0
635 0 16 7
. .
.
. .
.
. /
Z =

=
00 2
000 1
000 7 000 9
1
.
,
, ,
z =

=
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



152


p(x
2
> 9,000 horas) = p(z
2
> 1.25) = 1 0.8944 = 0.1056

Por tanto el tubo fluorescente del competidor tiene una probabilidad mayor de durar ms de
9,000 horas.

b)

p(x
1
< 5,000 horas) = p(z
1
< -2.00) = 0.0228

p(x
2
< 5,000 horas) = p(z
2
< - 2.08) = 0 0.0188

Por tanto, el tubo fluorescente que tiene una mayor probabilidad de durar menos de 5,000
horas es el del primer fabricante.

Problema: La distribucin de la demanda (en nmero de unidades por unidad de tiempo) de
un producto a menudo puede aproximarse con una distribucin de probabilidad Normal. Por
ejemplo, una compaa de comunicacin por cable ha determinado que el nmero de
interruptores terminales de botn solicitados diariamente tiene una distribucin Normal, con
una media de 200 y una desviacin estndar de 50.
a) En qu porcentaje de los das la demanda ser de menos de 90 interruptores?
b) En qu porcentaje de los das la demanda estar entre 225 y 275 interruptores?
c) Con base en consideraciones de costos, la compaa ha determinado que su mejor
estrategia consiste en producir una cantidad de interruptores suficiente para atender
plenamente la demanda en 94% de todos los das. Cuntos interruptores terminales
deber producir la compaa cada da?

Solucin:
a) X = variable que nos indica el nmero de interruptores demandados por da a una
compaa de cable

= 200 interruptores por da; = 50 interruptores por da
25 1
200 1
500 7 000 9
2
.
,
, ,
z =

=
00 2
000 1
000 7 000 5
1
.
,
, ,
z =

=
08 2
200 1
500 7 000 5
2
.
,
, ,
z =

=
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



153


p(z

= - 2.20) = 0.4861

p(x < 90) = p(z < -2.20) = 0.0139

Por tanto, 0.0139 x 100% = 1.39% de los das se tendr una demanda menor de 90
interruptores.

b)

p(225 x 275) = p(z
2
) p(z
1
) = 0.4332 0.1915 = 0.2417

Por tanto, 0.2417 x 100% = 24.17% de los das se tendr una demanda entre 225 y 275
interruptores.

c) En este caso se trata de determinar que valor toma x cuando se pretende cumplir con
el 94% de la demanda de todos los das.

Por tanto despejaremos de la frmula de z;
;
x = + z x = + z(p = 0.44) = 200 + z(p = 0.44)(50) =
= 200 + (1.55)(50) = 277.5 278 interruptores terminales por da

Cmo se obtiene el valor de z?
En la tabla buscamos la z que corresponde a una probabilidad de 0.44 y nos damos cuenta
de que no existe un valor exacto de 0.44 por lo que tomamos los valores de rea ms
cercanos; luego,
z(p = 0.4394) = 1.50; z(p = 0.4406) = 1.60
Por tanto si interpolamos, encontramos que el valor de z para una probabilidad de 0.44 es
de 1.55, y es el valor que se sustituye en la ecuacin.

20 2
50
200 90
. z =

=
50 0
50
200 225
1
. z =

= 50 1
50
200 275
2
. z =


=
x
Z
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



154

Cul es la razn de usar un rea de 0.44 en lugar de una de 0.94 para buscar en la tabla el
valor de z?

Es muy simple, la tabla que estamos usando es una tabla que solo trabaja con reas que
son definidas de la media hasta el valor de x y x puede estar tanto del lado derecho de la
media, como del lado izquierdo de la media, es por esto que el rea a utilizar es de 0.44 que
se encuentra al lado derecho de la media.

Problema: La nota media de las pruebas de acceso correspondientes a los estudiantes que
queran ingresar en una facultad era 5,8 y la desviacin tpica 1,75. Fueron admitidos los de
nota superior a 6.
a) Cul fue el porcentaje de admitidos si la distribucin es normal?
b) Con qu probabilidad exactamente cuatro de diez estudiantes son admitidos por
distribucin binomial?

Solucin:
a) = 5.8 ; = 1.75 ; x = 6
Z = ( 6 5.8 ) / 1.75 = 0.11

P ( X > 6 ) = p ( Z > 0.11 ) = 1 P ( Z < 0.11 ) = 1 0.5438 = 0.4562 = 45.62 %

b) Es una distribucin Binomial de parmetros n = 10 y p = 0,4562

p(obtener r xitos ) = p (X = r) =
= =


Problema: Dada una distribucin normal con = 50 y = 10, encuentre la probabilidad de
que x tome un valor en 45 y y 62.
Z
1
= ( 45 50 ) / 10 = - 0.5 Z
2
= ( 62 50 ) / 10 = 1.2
r n r
p p
r
n

) 1 .( =

= =
6 4
) 4562 , 0 1 ( ) 4562 , 0 (
4
10
) 4 (X p
235 , 0 ) 5438 , 0 ( ) 4562 , 0 (
1 . 2 . 3 . 4
7 . 8 . 9 . 10
6 4
= =
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



155



p ( 45 < X < 62 ) = p ( -0.5 < Z < 1.2 ) = P ( Z < 1.2 ) P ( Z < - 0.5 )
= 0.8849 0.3085 = 0.5764

Problema: Dada una distribucin normal con = 300 y = 50, encuentre la probabilidad de
que X tome un valor mayor que 362.

Z = ( 362 300 ) / 50 = 1.24
P ( X > 362 ) = P ( Z > 1.24 ) = 1 p ( Z < 1.24 ) = 1 0.8925 = 0.1075

Problema: Una empresa elctrica fabrica focos que tienen una duracin , antes de fundirse,
que se distribuye normalmente con media igual a 800 horas y una desviacin estndar de 40
horas. Encuentre la probabilidad de que un foco se funda entre 778 y 834 horas.

Solucin:
Z
1
= ( 778 800 ) / 40 = - 0.55 ; Z
2
= ( 834 800 ) / 40 = 0.85
P (778 < X < 834 ) = p ( - 0.55 < Z < 0.85 ) = P ( Z < 0.85 ) P ( -0.55)
= 0.8023 0.2912 = 0.5111

Problema: En un proceso industrial el dimetro de un cojinete es una parte importante del
componente. El comprador establece que las especificaciones en el dimetro sean 3.0
0.01 cm. La implicacin es que ninguna parte que caiga fuera de estas especificaciones se
aceptar. Se sabe que en el proceso el dimetro de un cojinete tiene una distribucin normal
con media 3.0 y una desviacin estndar de 0.005. En promedio, cuntos cojinetes se
descartaran?

Solucin:
X
1
= 3.0 0.01 cm = 2.99 cm; X
2
= 3.0 + 0.01 cm = 3.01
= 3.0 ; = 0.005
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



156

Z
1
= ( 2.99 3.0 ) / 0.005 = - 2.0
Z
2
= ( 3.01 3.0 ) / 0.005 = 2.0
P ( 2.99 < x < 3.01 ) = P (-2.0 < Z < 2.0 ) = p ( Z < 2.0 ) P ( Z < - 2.0 )
= 0.9772 0.0228 = 0.9544

Ejemplo: Cierta maquina fabrica resistores elctricos que tienen una resistencia media de 40
ohmios y una desviacin estndar de 2 ohmios. Suponga que la resistencia sigue una
distribucin normal y se puede medir con cualquier grado de precisin, qu porcentaje de
resistores tendrn una resistencia que exceda 43 ohmios?

Solucin:
X = 43 ; = 40; = 2
Z = (43 40 ) / 2 = 1.5
P ( X > 43 ) = P ( Z > 1.5 ) = 1 P( Z < 1.5 ) = 1 0.9332 = 0.0668 = 6.68 %


3.7 Aproximacin de la Binomial a la normal.

Cuando n es grande y p est prximo a 0,5 el comportamiento de una distribucin binomial
B(n, p) es aproximadamente igual a una distribucin normal,

Esto permite sustituir el estudio de una por el de una .

Suele considerarse que la aproximacin es buena cuando n p>5 y n q>5

Dado que por mucho que se parezca nunca es igual una binomial que una normal, es
necesario aplicar en el clculo de probabilidades un ajuste que recibe el nombre de
correccin de Yates.
Si X es la binomial y X

la normal, la correccin consiste en lo siguiente:


(Se asocia un intervalo unidad centrado en el punto)
) , ( npq np N
) , ( p n B ) , ( npq np N

+ = =
2
1
2
1
) ( r X r p r X p
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



157



(se alarga el intervalo por la izquierda y por la derecha.)
Para valores de n mayores de 1.000 se puede suprimir la correccin.

Problema: Se lanza una moneda correcta al aire 400 veces. Calcula la probabilidad de
obtener un nmero de caras comprendido entre 180 y 210, ambos inclusive.
Solucin:

Calculamos la media y la desviacin tpica de la distribucin binomial:
; . Por tanto,

(180 210) (179.5 210.5)
179.5 200 210.5 200
10 10
p X p x
p z
=







pero

( 2.05) ( 2.05) 1 ( 2.05) 1 0.9798 0.0202 p z p z p z = = = =
luego

Problema: Un tirador acierta en el blanco en el 70% de los tiros. Si el tirador participa en una
competicin y tira 25 veces, cul es la probabilidad de que acierte ms de 10 tiros?

Solucin:
Es una distribucin B(25; 0,7) que podemos aproximar a travs de la normal:

La aproximacin ser buena.

+ =
2
1
2
1
) ( b X a p b X a p
200
2
1
. 400 = = = np 10
2
1
.
2
1
. 400 = = = npq
) 05 , 2 ( ) 05 , 1 ( ) 05 , 1 05 , 2 ( = = Z p Z p Z p
8531 , 0 ) 05 , 1 ( = Z p
8329 , 0 0202 , 0 8531 , 0 ) 210 180 ( = = X p
5 5 , 7 3 , 0 . 25 .
5 5 , 17 7 , 0 . 25 .
> = =
> = = =
q n
p n
29 , 2 3 , 0 . 7 , 0 . 25 = = = npq
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



158


( 10) ( 11) ( 10.5)
10.5 17.5
( 3.06) 1 ( 3.06) 1 0.0010 0.999
2.29
p x p x p x
p z p z p z
> = =

= = = =






Problema: Hallar la probabilidad de obtener entre 3 y 6 caras inclusive en 10 lanzamientos
de una moneda honrada utilizando
(a) La distribucin binomial,
(b) la aproximacin normal a la distribucin binomial.

Solucin
a) sea X la variable aleatoria que da el numero de caras en 10 lanzamientos. Entonces :
P ( X = 3 ) = (10C 3) (1/2)
3
(1/2)
7
= 15 /128 = 0.1172
P ( X = 4 ) = (10C4 ) (1/2)
4
(1/2)
6
= 105/512 = 0.2051
P ( X = 5 ) = (10C 5) (1/2)
5
(1/2)
5
= 63/256 = 0.2461
P ( X = 6 ) = (10C 6) (1/2)
6
(1/2)
4
= 105/512 = 0.2051

Entonces la probabilidad pedida es
P ( 3 x 6 ) = 15/128 + 105/512 + 63/256 + 105/512
= 99/128 = 0.7734


Figura 1:

9998 , 0 ) 06 , 3 ( = = Z p
numero de caras
0
0,05
0,1
0,15
0,2
0,25
0,3
0 5 10 15
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



159


Figura 2:

b) La distribucin de probabilidad para el numero de caras en 10 lanzamientos de la
moneda se presentan grficamente en las figuras 1 y 2 . en la figura 2 trata los datos como si
fueran continuos. La probabilidad pedida es la suma de las reas de los rectngulos
sombreados en la figura 2 y puede aproximarse por el rea bajo la correspondiente curva
normal, mostrada a trazos. Considerando los datos como continuos, se deduce que 3 a 6
caras pueden considerarse como 2.5 a 6.5 caras. Tambin la media y la varianza para la
distribucin Binomial estn dadas por:

1 1
10(0.5) 5
10(0.5)(0.5) 1.58
2.5 5 6.5 5
1.58 0.95
1.58 1.58
( 1.58 0.95) ( 0.95) ( 1.58)
0.8289 0.0571 0.7718
np
npq
z z
p z p z p z

= = =
= = =

= = = =
< < = < <
= =


Se compara muy bien con el valor verdadero de 0.7734 obtenido en el inciso a) . La
precisin es aun mejor para valores superiores de n.

numerodecaras
0
0,05
0,1
0,15
0,2
0,25
0,3
0 2 4 6 8 10 12
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



160

Problema: La probabilidad de que un paciente se recupere de una rara enfermedad de la
sangre es 0.4. si se sabe que 100 personas contraen esta enfermedad, cual es la
probabilidad de que menos de 30 sobrevivan ?

Solucin:
1
100(0.4) 40
100(0.4)(0.4) 4.899
29.5 40
2.14
4.899
( 30) ( 2.14) 0.0162
np
npq
z
p x p z

= = =
= = =

= =
< = < =


Problema: Una prueba de opcin mltiple tiene 200 preguntas cada una con cuatro
respuestas posibles de las que solo una es la correcta. Cual es la probabilidad De que con
puras conjeturas se obtengan de 25 a 30 respuestas correctas para 80 de los 200 problemas
acerca de los que el estudiante no tiene conocimiento?

Solucin : La probabilidad de un respuesta correcta para cada una de las 80 preguntas es p
= . Si X representa el nmero de respuesta correcta debidas a conjeturas entonces:
30
25
1
(25 30) ,80,
4
1
80 20
4
1 3
180 3.873
4 4
x
x
p x b x
np

=
=

=



= = =



= =



necesitamos el rea entre X
1
= 24.5 y X
2
= 30.5. Los valores Z correspondientes son

Z
1
= (24.5 20 ) / 3.875 = 1.16 y Z
2
= (30.5 20 ) / 3.873 = 2.71


UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



161

La probabilidad de adivinar correctamente de 25 a 30 preguntas est dada por la regin
sombreada de la figura.


P ( 25 X 30 ) =p ( 1.16 < Z < 2.71 ) = p ( X < 2.71) P ( X < 1.16)
= 0.9966 0.8770 = 0.1196


3.8 Otras distribuciones mustrales.

3.8.1 Distribucin T - Student.



Propiedades de las distribuciones t
1. Cada curva t tiene forma de campana con centro en cero.
2. Cada curva t esta mas dispersa que la curva normal estndar z.
3. A medida que v aumenta, la dispersin de la curva t correspondiente disminuye.

Sean
1 2
, ,...,
n
X X X variables aleatorias independientes que son todas normales con y
desviacin estndar. Entonces la variable aleatoria
x
t
s
n

= tiene una distribucin t con v =
n 1 grados de libertad.
Problema: El valor t con v = 14 grados de libertad que deja un rea de 0.025 a la izquierda y
por tanto un rea de 0.975 a la derecha es
0.975 0.025
2.145 t t = =

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



162

Problema: Encuentre la probabilidad de
0.025 0.05
t t t < <
Solucin:
Como
0.05
t deja un rea de 0.05 a la derecha y
0.025
t deja un rea de 0.025 a la izquierda
encontramos un rea total de 1- 0.05 0.025 = 0.925
0.025 0.05
( ) 0.925 P t t t < < =

Problema: Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto
proceso en lo lotes es 500 gramos por milmetro de materia prima. Para verificar esta
afirmacin toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre -
0.05
t y
0.05
t , queda satisfecho con su afirmacin. Qu conclusin extraera de una muestra
que tiene una media de 518 gramos por milmetro y una desviacin estndar de 40 gramos?
Suponga que la distribucin de rendimiento es aproximadamente normal.

Solucin:
518 500
2.25
40
25
t

= =
Este es un valor por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor
de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02. De aqu es probable que el fabricante concluya que el proceso
produce un mejor producto del que piensa.


3.8.2 Distribucin X cuadrada.
Propiedades de las distribuciones ji cuadrada.
1. Los valores de

son mayores o iguales que cero.


2. La forma de una distribucin

depende del gl = n l . En consecuencia , hay un


nmero infinito de distribuciones de

.
3. El rea bajo una curva ji cuadrada y sobre el eje horizontal es 1.

Problema: Los siguientes son los pesos en decagramos de 10 paquetes de semillas de
pasto distribuida por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1,45.9,45.8, 46.9, 45.2, 46.
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



163

Encuentre un intervalo de confianza de 95 % para la varianza de todos los paquetes de
semillas de pasto que distribuye esta compaa suponga una poblacin normal.

Solucin:
2
( )
0.5347
1
i
x x
s
n

= =


Al elevar este resultado al cuadrado se obtiene la varianza de la muestra
Varianza = 0.286

Para obtener un intervalo de confianza de 95% se elige un 0.05 = con 9 grados de
libertad se obtiene los valores de

.

Se puede observar en la grfica anterior que el valor

. Corre en forma normal, esto es de


izquierda a derecha.



UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



164



Se observa que la varianza corre en sentido contrario, pero esto es solo en la grafica. Con un
nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los
paquetes de semillas de pasto est entre 0.135 y 0.935 decagramos al cuadrado.

Problemas propuestos
P1. En una cierta rea de la ciudad se da como una razn del 75% de los robos la necesidad
de dinero para comprar estupefacientes. Encuentre la probabilidad que dentro de los 5
prximos asaltos reportados en esa rea
a) exactamente 2 se debieran a la necesidad de dinero para comprar drogas;
b) cuando mucho 3 se debieran a la misma razn arriba indicada.

P2. Un agricultor que siembra fruta afirma que 2/3 de su cosecha de duraznos han sido
contaminada por la mosca del mediterrneo. Encuentre la probabilidad de que al
inspeccionar 4 duraznos
a) los 4 estn contaminados por la mosca del mediterrneo
b) cualquier cantidad entre 1 y 3 est contaminada.

P3. De acuerdo con una investigacin llevada a cabo por la Administrative Management
Society, 1/3 de las compaas en Estados Unidos le dan a sus empleados cuatro semanas
de vacaciones despus de 15 aos de servicio. Encuentre la probabilidad de que 6 de las
compaas investigadas al azar, el nmero que les dan a sus empleados cuatro semanas de
vacaciones despus de 15 aos de servicio es
a) cualquier cantidad entre 2 y 5;
b) menos de 3.
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



165

P4. De acuerdo con un estudio publicado por un grupo de socilogos de la Universidad de
Massachussets, aproximadamente 60% de los adictos al Valium en el estado de
Massachussets, lo tomaron por primera vez debido a problemas psicolgicos. Encuentre la
probabilidad de que los siguientes 8 adictos entrevistados
a) exactamente 3 hayan comenzado a usarlo debido a problemas psicolgicos.
b) al menos 5 de ellos comenzaran a tomarlo por problemas que no fueron
psicolgicos.

P5. Al probar una cierta clase de neumtico para camin en un terreno escabroso se
encontr que 25% de los camiones terminaban la prueba con los neumticos daados. De
los siguientes 15 camiones probados encuentre la probabilidad de que
a) De 3 a 6 tengan ponchaduras;
b) Menos de 4 tengan ponchaduras;
c) Mas de 5 tengan ponchaduras

P6. De acuerdo con un reporte publicado en la revista Parade, septiembre 14 de 1980, una
investigacin a nivel nacional llevada a cabo por la Universidad de Michigan revel que casi
el 70% de los estudiantes del ltimo ao desaprueban las medidas para controlar el hbito
de fumar mariguana todos los das. Si 12 de estos estudiantes se seleccionan al azar y se
les pregunta su opinin, encuentre la probabilidad de que el nmero que desaprueba dicha
medida sea
a. cualquier cantidad entre 7 y 9
b. cuando mucho 5;
c. no menos de 8

P7. La probabilidad de que un paciente se recupere de una delicada operacin de corazn
es de 0.9. Cul es la probabilidad de que exactamente 5 de los prximos 7 pacientes que
se sometan a esta intervencin sobrevivan?

P8. Un ingeniero de control de trfico reporta que el 75% de los vehculos que pasan por un
punto de verificacin tienen matrculas del estado. Cul es la probabilidad de que ms de 7
de los siguientes 9 vehculos no sean del estado?

P9. Una investigacin de los residentes de una ciudad de Estados Unidos mostr que 20%
preferan un telfono blanco que de cualquier otro color disponible. Cul es la probabilidad
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



166

de que ms de la mitad de los siguientes 20 telfonos que se instalen en esta ciudad sean
de color blanco?


P10. Se sabe que el 40% de los ratones inyectados con un suero quedan protegidos contra
una cierta enfermedad. Si 5 ratones son inyectados, encuentre la probabilidad de que
a. Ninguno contraiga la enfermedad;
b. Menos de 2 la contraigan;
c. Ms de 3 la contraigan

P11. Suponga que los motores de un aeroplano operan en forma independiente y de que
fallan con una probabilidad de 0.4. Suponiendo que uno de estos artefactos realiza un vuelo
seguro en tanto se mantenga funcionando cuando menos la mitad de sus motores,
determine qu aeroplano, uno de los 4 motores o uno de 2, tiene mayor probabilidad de
terminar su vuelo exitosamente.

P12. Las probabilidades son de 0.4, 0.2, 0.3 y 0.1, respectivamente, de que un delegado
llegue por aire a cierta convencin, llegue en autobs, 3en automvil o en tren. Cul es la
probabilidad de que entre 9 delegados seleccionados aleatoriamente en esta convencin, 3
hayan llegado por aire, 3 en autobs, 1 en automvil y 2 en tren.

P13. El dueo de una casa planta 6 tallos que selecciona al azar de una caja que contiene 5
tallos de tulipn y 4 de narciso. Cul es la probabilidad de que plante 2 tallos de narciso y 4
de tulipn?

P14. Un comit de tres integrantes se forma aleatoriamente seleccionando de entre 4
doctores y 2 enfermeras. Escriba una frmula para la distribucin de probabilidad de la
variable aleatoria X que representa el nmero de doctores en el comit. Encuentre P(2 X
3).

P15. Una compaa est interesada en evaluar sus actuales procedimientos de inspeccin
en el embarque de 50 artculos idnticos. El procedimiento es tomar una muestra de 5
piezas y autorizar el embarque si se encuentra que no ms de 2 estn defectuosas. qu
proporcin del 20% de embarques defectuosos sern autorizados?

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



167

P16. La probabilidad de que una persona que vive en cierta ciudad posea un perro se estima
en 0.3. Encuentre la probabilidad de que la dcima persona entrevistada aleatoriamente en
esta ciudad sea la quinta persona que posee un perro.

P17. Un cientfico inocula varios ratones, uno a la vez, con un germen de una enfermedad
hasta que obtiene 2 que la han contrado. Si la probabilidad de contraer la enfermedad es
1/6. cul es la probabilidad de que se requieran 8 ratones?
P18. Suponga que la probabilidad de que una persona determinada crea una historia acerca
de los atentados a una famosa actriz es de 0.8. Cul es la probabilidad de que
a) la sexta persona que escucha tal historia sea la cuarta que la crea?
b) La tercera persona que escucha tal historia sea la primera en creerla?

P19. Tres personas lanzan una moneda y la que salga dispareja paga los cafs. Si todas las
monedas caen iguales, se lanzan nuevamente. Encuentre la probabilidad de que se
necesiten menos de 4 lanzamientos.

P20. La probabilidad de que un estudiante para piloto apruebe el examen escrito para
obtener su licencia de piloto privado es de 0.7. Encuentre la probabilidad de que una
persona apruebe el examen
a. en el tercer intento
b. antes del cuarto intento

P21. El nmero promedio de ratas de campo por acre en un campo de trigo de 5 acres se
estima que es de 12. Encuentre la probabilidad de que menos de 7 ratas de campo se
encuentren
a. en una acre de terreno determinado;
b. en 2 de los siguientes 3 acres inspeccionados.

P22. Un restaurante prepara una ensalada que contiene en promedio 5 verduras diferentes.
Encuentre la probabilidad de que la ensalada contenga ms de 5 verduras
a. en un determinado da;
b. en 3 de los siguientes 4 das;
c. por primera vez el 5 de abril.

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



168

P23. La probabilidad de que una persona muera debido a cierta infeccin respiratoria es
0.002. Encuentre la probabilidad de que mueran menos de 5 de las prximas 2000
personas infectadas.

P24. Suponga que en promedio 1 persona de cada 1000 comete un error numrico al
preparar su declaracin de impuestos. Si se seleccionan al azar 10 000 formas y se
examinan, encuentre la probabilidad de que 6, 7 u 8 formas tengan error.

P25. La probabilidad de que un estudiante presente problemas de escoliosis (desviacin
lateral sufrida por la columna vertebral) en una escuela de la localidad es de 0.004. De los
siguientes 1875 estudiantes revisados encuentre la probabilidad de que
a) menos de 5 presenten este problema
b) 8, 9 o 10 presenten este problema

P26. Se est considerando la produccin de una mquina automtica de soldar. Se
considerar exitosa si tiene una efectividad del 99% en sus soldaduras. De otra manera, no
se considerar eficiente. Se lleva a cabo la prueba de un prototipo y se realizan 100
soldaduras. La mquina se aceptar para su fabricacin si no son defectuosas ms de tres
soldaduras.
a. Cul es la probabilidad de que una mquina eficiente sea rechazada?
b. Cul es la probabilidad de que una mquina ineficiente con 95% de
soldaduras correctas sea aceptada?

P27. Una agencia que renta automviles en un aeropuerto local tiene disponibles 5 Ford, 7
Chevrolet, 4 Dodge, 3 Datsun y 4 Toyota. Si la agencia selecciona aleatoriamente 9 de
estos vehculos para transportar delegados desde el aeropuerto hasta el centro de
convenciones en el centro de la ciudad, encuentre la probabilidad de que se utilicen 2 Ford,
3 Chevrolet, 1 Dodge, 1 Datsun y 2 Toyota.

P28. Un investigador de la UCLA reporta que las ratas viven un promedio de 40 meses
cuando sus dietas son muy restringidas y luego enriquecidas con vitaminas y protenas.
Suponiendo que las vidas de tales ratas estn normalmente distribuidas con una desviacin
estndar de 6.3 meses, encuentre la probabilidad de que una rata determinada viva
a) ms de 32 meses;
b) menos de 28 meses;
UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.



169

c) entre 37 y 49 meses.

P29. Las piezas de pan de centeno distribuidas a las tiendas locales por una cierta
pastelera tienen una longitud de 30cm y una desviacin estndar de 2cm. Suponiendo que
las longitudes estn normalmente distribuidas, qu porcentaje de las piezas son
a) de ms de 31.7cm de longitud?
b) entre 29.3 y 33.5 cm de longitud?
c) de una longitud menor que 25.5 cm?
P38. Una mquina despachadora de refrescos est ajustada para servir un promedio de 200
ml por vaso. Si la cantidad de refresco es normalmente distribuida con una desviacin
estndar igual a 15 ml.
a) Qu fraccin de los vasos contendr ms de 224 ml?
b) Cul es la probabilidad de que un vaso contenga entre 191 y 209 ml?
c) Cuntos vasos probablemente se derramarn si se utilizan vasos de 230 ml en
los siguientes 1000 refrescos?
















































UNIDAD 4
ESTADISTICA
APLICADA.
Objetivo:
Conocer los aspectos
fundamentales de la inferencia
estadstica. Definir su aplicacin
en situaciones reales o simuladas.
UNIDAD IV / ESTADISTICA APLICADA.



171

4.1 Inferencia estadstica.

4.1.1 Concepto.
La teora de la inferencia estadstica consiste en aquellos mtodos por los que se realizan
inferencias o generalizaciones acerca de una poblacin. La tendencia actual es la
distribucin entre el mtodo clsico de estimacin de un parmetro de la poblacin, por
medio del cual las inferencias se basan de manera estricta en informacin que se obtiene de
una muestra aleatoria seleccionada de la poblacin, y el mtodo Bayesiano, que utiliza el
conocimiento subjetivo previo sobre la distribucin de probabilidad de los parmetros
desconocidos junto con la informacin que proporcionan los datos de la muestra. En esta
unidad utilizaremos los mtodos clsicos para estimar los parmetros de la poblacin
desconocidos como la media, la proporcin y la varianza mediante el clculo de estadstica
de muestras aleatorias y la aplicacin de la teora de las distribuciones mustrales.

4.1.2 Estimacin.
El objetivo principal de la estadstica inferencial es la estimacin, esto es que mediante el
estudio de una muestra de una poblacin se quiere generalizar las conclusiones al total de la
misma. Como vimos en la seccin anterior, los estadsticos varan mucho dentro de sus
distribuciones mustrales, y mientras menor sea el error estndar de un estadstico, ms
cercanos sern unos de otros sus valores.

Existen dos tipos de estimaciones para parmetros; puntuales y por intervalo. Una
estimacin puntual es un nico valor estadstico y se usa para estimar un parmetro, que
se calcula a partir de una muestra dada y sirve como una aproximacin del valor exacto
desconocido del parmetro.

El estadstico usado se denomina estimador. Una estimacin por intervalo, es la estima
de un parmetro poblacional dada por dos nmeros entre los cuales se considera que se
encuentra dicho parmetro generalmente de ancho finito

4.1.3 Prueba de hiptesis.
Las secciones anteriores han mostrado cmo puede estimarse un parmetro a partir de los
datos contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador
puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos
UNIDAD IV / ESTADISTICA APLICADA.



172

problemas de ingeniera, ciencia, y administracin, requieren que se tome una decisin entre
aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el
nombre de hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica,
puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en
el mundo de la ingeniera, pueden formularse como problemas de prueba de hiptesis.


4.1.4 Mtodo clsico de estimacin (puntual).
Una estimacin puntual de un parmetro es un solo numero que se puede considerar
como el valor mas razonable de . La estimacin puntual se obtiene al seleccionar una
estadstica apropiada y calcular su valor a partir de datos de la muestra dada. La estadstica
seleccionada se llama estimador puntual de .


4.1.5 Estimador Insesgado.
Entre todos los estimadores de que son insesgados, seleccione al que tenga varianza
mnima. El resultante recibe el nombre de estimador insesgado con varianza mnima
(MVUE, minimum variance unbiased estimator) de . En otras palabras, la eficiencia se
refiere al tamao de error estndar de la estadstica. Si comparamos dos estadsticas de una
muestra del mismo tamao y tratamos de decidir cul de ellas es un estimador ms eficiente,
escogeramos la estadstica que tuviera el menor error estndar, o la menor desviacin
estndar de la distribucin de muestreo. Tiene sentido pensar que un estimador con un error
estndar menor tendr una mayor oportunidad de producir una estimacin ms cercana al
parmetro de poblacin que se est considerando.


4.2 Intervalos de confianza.

4.2.1 Estimacin por intervalo.
Las estimaciones por intervalo de un parmetro poblacional desconocido dan idea de la
precisin y exactitud de la inferencia efectuada, junto con la probabilidad de que tal
estimacin sea cierta. Se calculan a travs de los llamados: intervalos de confianza. Estos se

UNIDAD IV / ESTADISTICA APLICADA.





173

construyen con la funcin probabilstica del modelo estadstico adoptado para realizar la
estimacin


4.2.2 Lmites de confianza.
Estimas por intervalo de confianza, de parmetros poblacionales.
Un intervalo de confianza con un nivel de confianza de 95% de la resistencia real promedio a
la ruptura podra tener un lmite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un
nivel de confianza de 95%, es posible tener cualquier valor de entre 9162.5 y 9482.9. Un
nivel de confianza de 95% implica que 95% de todas las muestras dara lugar a un intervalo
que incluye o cualquier otro parmetro que se est estimando, y slo 5% de las muestras
producir un intervalo errneo. Cuanto mayor sea el nivel de confianza podremos creer que
el valor del parmetro que se estima est dentro del intervalo.


Intervalos (S
s
, S 2
s
, S 3
s
) son llamados lo limites de confianza del 68.27 %,
95.45 % y 99.73 % o como otras veces se conocen limites fiduciales.

Anlogamente, S 1.96
s
y S 2.58
s
son los limites de confianza del 95 % y 99 % (
0.95 y 0.99 ) para
s
.

El porcentaje de confianza se llama tambin nivel de confianza. Los nmeros 1.96, 2.58,
etc., de los limites de confianza se llaman coeficientes de confianza o valores crticos y se
denotan por Z
c
. De los niveles de confianza se pueden obtener los coeficientes de confianza
y recprocamente.

En la tabla siguiente se dan los valores de Z
c
que corresponden a distintos niveles de
confianza utilizados en la prctica. Para niveles de confianza que no se encuentra en la tabla
, los valores de Z
c
pueden sacarse de las tablas de la curva normal en el Apndice A.

Nivel de confianza (%)

99.73 3.00
99 2.58
98 2.33
96 2.05

UNIDAD IV / ESTADISTICA APLICADA.





174

95.45 2.00
95 1.96
90 1.645
80 1.28
68.27 1.00
50 0.6745

Estos intervalos abiertos por izquierda o por derecha se denominan de una cola, mientras
que los comunes para la estimacin de parmetros poblacionales son de dos colas.

Niveles de significancia Niveles de confianza Coeficiente de confianza

( ) 100 * 1 = NC

Z
0.0005
0.0010
0.0013
0.0050
0.0100
0.0227
0.0250
0.0500
0.1587
99.95 %
99.90 %
99.87 %
99.50 %
99.00 %
97.72 %
97.50 %
95.00 %
84.13 %
3.29
3.09
3.00
2.58
2.33
2.00
1.96
1.645
1.00

99.90% 99.00% 95.00%
1 cola 3.09 2.33 1.645
2 cola 3.29 2.58 1.96


4.2.3 Intervalo de confianza para media con varianza conocida.
1. Grandes muestras ( n 30 ).
La frmula para el clculo de probabilidad es la siguiente:

n
x
Z


=
UNIDAD IV / ESTADISTICA APLICADA.



175

Como en este caso no conocemos el parmetro y lo queremos estimar por medio de la
media de la muestra, slo se despejar de la formula anterior, quedando lo siguiente:

De esta frmula se puede observar que tanto el tamao de la muestra como el valor de z se
conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de
confianza establecido.

Pero en ocasiones se desconoce por lo que en esos casos lo correcto es utilizar otra
distribucin llamada t de Student si la poblacin de donde provienen los datos es normal.
Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual de la
desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de la
poblacin (s = ).

En el caso de muestreo en una poblacin infinita o si el muestreo es con remplazamiento en
una poblacin finita y por

Si el muestreo es sin remplazamiento en una poblacin finita de tamao N.

En general, la desviacin tpica poblacional es desconocida, de modo que para obtener
los lmites de confianza anteriores se utiliza la estima muestra S.

Muestras grandes.
Problema: Supngase que las estaturas de 100 estudiantes de la universidad XYZ. Hallar
los intervalos de confianza del:
a) 95 % y
b) 99 % .
Para estimar la estatura media de X = 67.45 y 2.73 = pulgadas de los estudiantes de la
universidad XYZ.
n
Z x
C


a) Los lmites de confianza del 95% son
n
Z x
c

=
N
n N
n
Z x
c

UNIDAD IV / ESTADISTICA APLICADA.





176

Z
c
= 1.96


As, pues, el intervalo de confianza del 95 % para la media poblacional es 66.88 a 68.02
pulgadas, que puede denotarse por 66.88 < < 68.02

b) Los lmites de confianza del 99 % son

As, pues, el intervalo de confianza del 99 % para la media poblacional es 66.69 a 68.21
pulgadas, que puede denotarse por 66.69 < < 68.21

Problema: Las medidas de los dimetros de una muestra de 200 cojinetes de bolas hechos
por una determinada maquina durante una semana dieron una media de 0.824 pulgadas y
una desviacin tpica de 0.042 pulgadas. Hallar los limites de confianza del
a) 95 %
b) 99 %
Para el dimetro medio de todos los cojinetes.

Solucin:
a) los limites de confianza del 95% son
Z
c
= 1.96


b) los limites de confianza del 99% son
Z
c
= 2.58


Problema: Hallar los limites de confianza del
a) 98 %
b) 90 %
67.45 1.96
2.93
100
+ 68.02 = 67.45 1.96
2.93
100
66.88 =
67.45 2.58
2.93
100
+ 68.21 = 67.45 2.58
2.93
100
66.69 =
0.824 1.96
0.042
200
+ 0.83 = 0.824 1.96
0.042
200
0.818 =
0.824 2.58
0.042
200
+ 0.832 = 0.824 2.58
0.042
200
0.816 =
UNIDAD IV / ESTADISTICA APLICADA.



177

c) 99.73 %
Para el dimetro medio de los cojinetes del problema anterior.

Solucin:
a) Los limites de confianza del 98 %
Z
c
= 2.33

b) Los limites de confianza del 90 %
Z
c
= 1.645

c) Los limites de confianza del 99.73 %
Z
c
= 3.00


Problema: Al medir el tiempo de reaccin, un psiclogo estima que la desviacin tpica del
mismo es de 0.05 segundos.
Cul es el numero de medidas que deber hacer para que sea del
a) 95 %
b) 99 %
la confianza de que error de su estima no exceda de 0.01 segundo ?

Solucin:
a) Los lmites de confianza del 95 % son.
Tomando = s = 0.05 segundos, se tiene que el error ser igual a 0.01 si:
(1.96 ) ( 0.05 ) / n = 0.01, es decir,
n = (1.96)(0.05) / 0.01
n = 9.8
n = 96.04.

As, pues, se puede estar en la confianza del 95 % de que el error de la estima ser
menor de 0.01 si n es 96 o mayor.
0.824 2.33
0.042
200
+ 0.831 = 0.824 2.33
0.042
200
0.817 =
0.824 1.645
0.042
200
+ 0.829 = 0.824 1.645
0.042
200
0.819 =
0.824 3.00
0.042
200
+ 0.833 = 0.824 3.00
0.042
200
0.815 =
UNIDAD IV / ESTADISTICA APLICADA.



178

b) Los lmites de confianza del 99 % son.
Tomando = s = 0.05 segundos, se tiene que el error ser igual a 0.01 si:
(2.58) ( 0.05 ) / n = 0.01, es decir,
n = (2.58)(0.05) / 0.01
n = 166.41.
As, pues, se puede estar en la confianza del 99 % de que el error de la estima ser menor
de 0.01 si n es 166 o mayor.

Problema: Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de
zinc en el ro. Suponga que la desviacin estndar de la poblacin es 0.3.

Solucin:
Para el 95 % , Z
c
= 1.96


para el 99 % ; Z
c
= 2.58





Problema: Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra de 30
2.6 1.96
0.3
36

+ 2.7 = 2.6 1.96


0.3
36

2.5 =
7 . 2 5 . 2 < <
2.6 2.58
0.3
36

+ 2.73 = 2.6 2.58


0.3
36

2.47 =
73 . 2 47 . 2 < <
UNIDAD IV / ESTADISTICA APLICADA.



179

focos tiene una duracin promedio de 780 horas, encuentre un intervalo de confianza de
96% para la media de la poblacin de todos los focos que produce esta empresa.

Solucin:

Con un nivel de confianza del 96% se sabe que la duracin media de los focos que produce
la empresa est entre 765 y 765 horas.
Problema: La prueba de corte sesgado es el procedimiento ms aceptado para evaluar la
calidad de una unin entre un material de reparacin y su sustrato de concreto. El artculo
Testing the Bond Between Repair Materials and Concrete Substrate informa que, en cierta
investigacin, se obtuvo una resistencia promedio muestral de 17.17 N/mm
2
, con una
muestra de 48 observaciones de resistencia al corte, y la desviacin estndar muestral fue
3.28 N/mm
2
. Utilice un nivel de confianza inferior del 95% para estimar la media real de la
resistencia al corte.

Solucin:
Para el intervalo de confianza unilateral, se cargar el rea bajo la curva hacia un solo lado
como sigue:

Inferior a 95 % de la tabla es el 90 % que tiene
Z
c
= 1.645


Problema: Suponga que un centro de computo regional desea evaluar el desempeo de su
sistema de memoria en disco. Una medida del desempeo es el tiempo medio entre fallas de
su unidad de disco. A fin de estimar este valor, el centro registro el tiempo entre fallas para
una muestra aleatoria de 45 fallas de la unidad de disco. Se calcularon las siguientes
estadsticas: ; s = 215 horas , estime el verdadero tiempo medio entre fallas
con un intervalo de confianza de 90%

Solucin:
780 2.05
40
30

765.03 = 780 2.05


40
30

+ 794.97 =
794 765 < <
39 . 16
48
28 . 3
645 . 1 17 . 17 =

horas x 1762 =
UNIDAD IV / ESTADISTICA APLICADA.



180




Problema: Una muestra aleatoria de 50 calificaciones de matemticas de un total de 200,
arrojo una media de 75 y una desviacin tpica de 10
a) Cuales son los limites de confianza del 95 % para la estima de la media de las
200 calificaciones?
b) Con que grado de confianza podr decirse que la media de las 200 calificaciones
es 75 1?

Solucin:
a) Se debe emplearse la formula para poblaciones finitas con muestreo sin
remplazamiento. Entonces los limites de confianza del 95 % son :

b) Los lmites de confianza pueden representarse por:

75 1.23 Z
c
Puesto que esto debe ser igual a 75 1 , se tiene que 1.23 Z
c
= 1 Z
c
= 0.81. El rea
bajo la curva desde

Por simetra es : z = - 0.81 y z = 0.81 es :
( 0.81 0.81) ( 0.81) ( 0.81)
0.7910 0.2090 0.5820 50.2%
p z p z p z =
= = =

De aqu el grado de confianza pedido es de 58.20%

Clculo del Tamao de la Muestra para Estimar una Media
Qu tan grande debe ser una muestra si la media muestral se va a usar para estimar la
media poblacional? . La respuesta depende del error estndar de la media, si este fuera
cero, entonces se necesitara una sola media que ser igual necesariamente a la media
poblacional desconocida , porque = 0. Este caso extremo no se encuentra en la prctica,
1762 1.645
215
45

1709.3 = 1762 1.645


215
45

+ 1814.7 =
7 . 1814 3 . 1709 < <
75 1.96
10
50

200 50
200 1
+ 77.41 = 75 1.96
10
50

200 50
200 1
72.59 =
75 Z
c
10
50

200 50
200 1
+

UNIDAD IV / ESTADISTICA APLICADA.





181

pero refuerza el hecho de que mientras menor sea el error estndar de la media, menor es el
tamao de muestra necesario para lograr un cierto grado de precisin.

Se estableci antes que una forma de disminuir el error de estimacin es aumentar el
tamao de la muestra, si ste incluye el total de la poblacin, entonces sera igual
a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible
determinar un tamao de la muestra tal que el error de estimacin sea tan pequeo como
queramos, para ser mas preciso, dado un nivel de confianza y un error fijo de estimacin ,
se puede escoger un tamao de muestra n tal que Nivel de confianza.
Con el propsito de determinar n. El error mximo de estimacin esta dado por:

Si se eleva al cuadrado ambos lados de esta ecuacin y se despeja n de la ecuacin
resultante, obtenemos:

Como n debe de ser un nmero entero, redondeamos hacia arriba todos los resultados
fraccionarios.

En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de
estimacin se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:


Problema: Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado
de Maryland. Un estudio anterior de diez ciervos cazados mostr que la desviacin estndar
de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el bilogo
tenga el 95% de confianza de que el error de estimacin es a lo ms de 4 libras?

Solucin:
x

= < ) ( x P
n
Z
=
2

Z
n
1

=
N
n N
n
Z

2 2 2
2 2
) 1 (

Z N
N Z
n
+
=
UNIDAD IV / ESTADISTICA APLICADA.



182



En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza en
que m difiere en menos de 4 libras de .

Problema: Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
normal con una desviacin estndar de 40 horas. De qu tamao se necesita una muestra
si se desea tener 96% de confianza que la media real est dentro de 10 horas de la media
real?

Solucin.


Se necesita una muestra de 68 focos para estimar la media de la poblacin y tener un error
mximo de 10 horas. Qu pasara si en lugar de tener un error de estimacin de 10 horas
slo se requiere un error de 5 horas?



Se puede observar como el tamao de la muestra aumenta, pero esto tiene como beneficio
una estimacin ms exacta.

Problema: Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se
desea saber de que tamao debe de ser la muestra. El muestreo se realizar sin reemplazo.

Solucin:
( ) ( ) ( )
( ) ( ) ( )( )
2 2
2 2
2 2 2 2 2
2
2.053 40 300
55.21
( 1)
10 300 1 2.053 40
z N
n
N z


= = =
+
+

( )( )
736 . 35
4
2 . 12 96 . 1
2 2
=

Z
n
x
( )
45 . 67
10
40 ) 053 . 2 (
2 2
=

Z
n
( )
74 . 269
5
40 ) 053 . 2 (
2 2
=

Z
n
UNIDAD IV / ESTADISTICA APLICADA.



183

Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la poblacin una
muestra sin reemplazo de 55 focos para poder estimar la duracin media de los focos
restantes con un error mximo de 10 horas.


4.2.4. Intervalo de confianza para una diferencia de medias.
Si se tienen dos poblaciones con medias y varianzas y , respectivamente, un
estimador puntual de la diferencia entre y est dado por la estadstica . Por
tanto. Para obtener una estimacin puntual de - se seleccionan dos muestras
aleatorias independientes, una de cada poblacin, de tamao n
1
y n
2
, se calcula la diferencia
, de las medias mustrales. Recordando a la distribucin muestral de diferencia de
medias:

Al despejar de esta ecuacin - se tiene:
= ( )
En el caso en que se desconozcan las varianzas de la poblacin y los tamaos de muestra
sean mayores a 30 se podr utilizar la varianza de la muestra como una estimacin puntual.

Problema: Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B.
Se mide el rendimiento en millas por galn de gasolina. Se realizan 50 experimentos con el
motor tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las dems condiciones se
mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas
por galn y el promedio para el motor B es 42 millas por galn. Encuentre un intervalo de
confianza de 96% sobre la diferencia promedio real para los motores A y B. Suponga que las
desviaciones estndar poblacionales son 6 y 8 para los motores A y B respectivamente.

Solucin:
1

2
1

2
2

2 1
x x
1

2 1
x x
2
2
2
1
2
1
2 1 2 1
) ( ) (
n n
x x
Z


+

=
1

2 1

2 1
x x Z
2
2
2
1
2
1
n n

+
UNIDAD IV / ESTADISTICA APLICADA.



184

Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la
media mayor menos la media menor. En este caso ser la media del motor B menos la
media del motor A. El valor de z para un nivel de confianza del 96% es de 2.05.

= ( )


La interpretacin de este ejemplo sera que con un nivel de confianza del 96% la diferencia
del rendimiento promedio esta entre 3.43 y 8.57 millas por galn a favor del motor B. Esto
quiere decir que el motor B da ms rendimiento promedio que el motor A, ya que los dos
valores del intervalo son positivos.

Problema: Una compaa de taxis trata de decidir si comprar neumticos de la marca A o de
la B para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un
experimento utilizando 12 de cada marca. Los neumticos se utilizan hasta que se
desgastan, dando como resultado promedio para la marca A 36,300 kilmetros y para la
marca B 38,100 Kilmetros. Calcule un intervalo de confianza de 95% para la diferencia
promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de forma
aproximadamente normal con desviacin estndar de 5000 kilmetros para la marca A y
6100 kilmetros para la marca B.

Solucin:
= ( )


Como el intervalo contiene el valor cero, no hay razn para creer que el promedio de
duracin del neumtico de la marca B es mayor al de la marca A, pues el cero nos est
indicando que pueden tener la misma duracin promedio.

Clculo del Tamao de la Muestra para Estimar la Diferencia de Medias
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que error esta
dado por:
2 1

2 1
x x Z
75
64
50
36
05 . 2 ) 36 42 (
2
2
2
1
2
1
+ = +
n n

57 . 8 43 . 3 < <
B A

2 1

2 1
x x Z
12
6100
12
5000
96 . 1 ) 36300 38100 (
2 2
2
2
2
1
2
1
+ = +
n n

67 . 6262 68 . 2662 < <
A B

UNIDAD IV / ESTADISTICA APLICADA.



185



En esta ecuacin se nos pueden presentar dos casos:
Los tamaos de muestra son iguales.
Los tamao de muestra son diferentes

Para el primer caso no se tiene ningn problema, se eleva al cuadrado la ecuacin y se
despeja n ya que n
1
es igual a n
2
.



Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza cuando las
poblaciones son de diferente tamao y se sabe que una es K veces mayor que la otra.

Problema: Un director de personal quiere comparar la efectividad de dos mtodos de
entrenamiento para trabajadores industriales a fin de efectuar cierta operacin de montaje.
Se divide un nmero de operarios en dos grupos iguales: el primero recibe el mtodo de
entrenamiento 1, y el segundo, el mtodo 2. Cada uno realizar la operacin de montaje y se
registrar el tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan
una desviacin estndar aproximadamente de 2 minutos. Si se desea que la estimacin de
la diferencia en tiempo medio de montaje sea correcta hasta por un minuto, con una
probabilidad igual a 0.95,

Cuntos trabajadores se tienen que incluir en cada grupo de entrenamiento?

Solucin:


Cada grupo debe contener aproximadamente 31 empleados.


2
2
2
1
2
1
n n
Z

+ =
2
2
2
2
1
2
) (

+
=
Z
n
31
1
) 2 2 ( ) 969 . 1 ( ) (
2
2 2 2
2
2
2
2
1
2
=
+
=
+
=

Z
n
UNIDAD IV / ESTADISTICA APLICADA.



186

4.2.5 Intervalo de confianza para proporciones.
Un estimador puntual de la proporcin P en un experimento Binomial est dado por la
estadstica P = X / N, donde x representa el nmero de xitos en n pruebas.

Por tanto, la proporcin de la muestra p = x /n se utilizar como estimador puntual del
parmetro P. Si no se espera que la proporcin P desconocida est demasiado cerca de 0
de 1, se puede establecer un intervalo de confianza para P al considerar la distribucin
muestral de proporciones.

Al despejar P de esta ecuacin nos queda:

En este despeje podemos observar que se necesita el valor del parmetro P y es
precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporcin de la
muestra p siempre y cuando el tamao de muestra no sea pequeo.

Cuando n es pequea y la proporcin desconocida P se considera cercana a 0 a 1, el
procedimiento del intervalo de confianza que se establece aqu no es confiable, por tanto, no
se debe utilizar. Para estar seguro, se debe requerir que np nq sea mayor o igual a 5. El
error de estimacin ser la diferencia absoluta entre p y P, y podemos tener el nivel de
confianza de que esta diferencia no exceder


El error de estimacin ser la diferencia absoluta entre p y P, y podemos tener el nivel de
confianza de que esta diferencia no exceder


n
Pq
P p
Z

=
n
Pq
Z p P
c
=
n
Pq
Z p P
c
=
n
Pq
Z p P
c
=
n
Pq
Z
UNIDAD IV / ESTADISTICA APLICADA.



187

Problema: Un fabricante de reproductores de discos compactos utiliza un conjunto de
pruebas amplias para evaluar la funcin elctrica de su producto. Todos los reproductores
de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra
aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o ms pruebas.
Encuentre un intervalo de confianza de 90% para la proporcin de los reproductores de
discos compactos de la poblacin que no pasan todas las pruebas.

Solucin:
500; 15/500 0.03; 1.645
0.0175 0.0425
n p z
pq
P p z
n
P
= = = =
=
< <


Problema: En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se
encontraron 20 defectuosas. Si la proporcin p de pilas defectuosas en esa muestra se usa
para estimar P, que vendr a ser la proporcin verdadera de todas las pilas defectuosas tipo
B fabricadas por la Everlast Company, encuentre el mximo error de estimacin e tal que se
pueda tener un 95% de confianza en que P dista menos de de p.

Solucin:
P = x / n = 20 / 400 = 0.05
Z
c
= 1.96


Si p = 0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista
menos de 0.021 de p. En otras palabras, si p = 0.05 se usa para estimar P, el error mximo
de estimacin ser aproximadamente 0.021 con un nivel de confianza del 95%. Para calcular
el intervalo de confianza se tendra: 0.05 0.021 P =

Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se
sabe que la proporcin de pulas defectuosas de esta compaa est entre 0.029 y 0.071. Si
se requiere un menor error con un mismo nivel de confianza slo se necesita aumentar el
tamao de la muestra.

021 . 0
400
) 95 . 0 )( 05 . 0 (
96 . 1 = = =
n
pq
Z
UNIDAD IV / ESTADISTICA APLICADA.



188

Problema: En un estudio de 300 accidentes de automvil en una ciudad especfica, 60
tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90%
de confianza para aproximar la proporcin de todos los accidentes automovilsticos que en
esa ciudad tienen consecuencias fatales.

Solucin:
P = 60/300 = 0.20 ; Z
c
= 1.645
(0.20)(0.8)
0.20 1.645
300
P =
0.162 < P < 0.238

Problema: Es comn utilizar aceros inoxidables en las plantas qumicas para manejar fluidos
corrosivos. Sin embargo, estos aceros tienen especial susceptibilidad al agrietamiento por
corrosin causada por esfuerzos en ciertos entornos. En una muestra de 295 fallas de
aleaciones de acero que ocurrieron en refineras de petrleo y plantas petroqumicas en
Japn durante los ltimos 10 aos, 118 se debieron a agrietamiento por corrosin causada
por esfuerzos y a fatiga de corrosin ( Materials Performance, junio de 1981). Establezca un
intervalo de confianza de 95 % para verdadera proporcin de fallas de aleaciones causadas
por agrietamiento por corrosin debida a esfuerzos.
Solucin:
P = 118 / 295 = 0.4



Problemas propuestos:
P1. Una encuesta sobre vivienda estadounidense realizada por el Departamento de
Comercio de Estados Unidos revelo que 750 de 1500 propietarios de casa muestreados
siguen la filosofa de hgalo usted mismo , es decir, realizaron ellos mismos la mayor parte
del trabajo en por lo menos una de las mejoras o reparaciones de su hogar ( Bureau of the
Census, Statistical Brief, mayo de 1992). Estime, con un intervalo de confianza de 95 %, la
verdadera proporcin de propietarios de casas estadounidenses que realizan ellos mismos
la mayor parte del trabajo de mejoramiento o reparacin de sus hogares.

456 . 0 344 . 0
056 . 0 4 . 0
295
) 6 . 0 )( 4 . 0 (
) 96 . 1 ( 4 . 0
< <
= = =
P
n
pq
Z p P
UNIDAD IV / ESTADISTICA APLICADA.



189

P2. La encuesta del Agujero Negro, patrocinada por el Consejo de Investigacin sobre
Empleo Profesional, informa cuales son los puestos mas difciles de llenar en las listas de los
reclutadores. En la encuesta mas recientes, 95 de 285 reclutadores consideraron los
puestos de ingeniera como los mas difciles de llenar. ( Industrial Engineering, agosto de
1990). Estime el verdadero porcentaje de reclutadores que consideran que los puestos mas
difciles de llenar son los de ingeniera. Utilice un intervalo de confianza de 99 % .

P3. Como parte de un convenio de cooperacin en investigacin entre Estados Unidos y
Japn, se diseo un edificio de concreto armado a escala completa y se aprob en
condiciones simuladas de carga de un terremoto en Japn (Journal of Structural
Enginnering, enero de 1986). En una parte del estudio se pidi a varios ingenieros de diseo
estadounidense que evaluaron el nuevo diseo. De los 48 ingenieros encuestados, 36
opinaron que la pared de cizallamiento de la estructura tena un refuerzo demasiado ligero.
Establezca un intervalo de confianza de 95 % para la verdadera proporcin de ingenieros de
diseo estadounidenses que consideran que la pared de cizallamiento del edificio tiene un
refuerzo demasiado ligero.


4.2.6. Intervalo de confianza para diferencia de proporciones.
Para este caso en particular se utilizar la distribucin muestral de diferencia de
proporciones para la estimacin de la misma. Recordando la formula:

Despejando de esta ecuacin:


Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al hacer el
despeje nos queda las dos proporciones poblacionales y es precisamente lo que queremos
estimar, por lo que se utilizarn las proporciones de la muestra como estimadores puntuales:

2
2 2
1
1 1
2 1 2 1
) ( ) (
n
q P
n
q P
P P p p
Z
+

=
2 1
P P
2
2 2
1
1 1
2 1 2 1
) (
n
q P
n
q P
Z p p P P + =
2
2 2
1
1 1
2 1 2 1
) (
n
q P
n
q P
Z p p P P + =
UNIDAD IV / ESTADISTICA APLICADA.



190

Problema: Se considera cierto cambio en un proceso de fabricacin de partes componentes.
Se toman muestras del procedimiento existente y del nuevo para determinar si ste tiene
como resultado una mejora. Si se encuentra que 75 de 1500 artculos del procedimiento
actual son defectuosos y 80 de 2000 artculos del procedimiento nuevo tambin lo son,
encuentre un intervalo de confianza de 90% para la diferencia real en la fraccin de
defectuosos entre el proceso actual y el nuevo.

Solucin:



Como el intervalo contiene el valor de cero, no hay razn para creer que el nuevo
procedimiento producir una disminucin significativa en la proporcin de artculos
defectuosos comparada con el mtodo existente.

Problema: Un artculo relacionado con la salud, reporta los siguientes datos sobre la
incidencia de disfunciones importantes entre recin nacidos con madres fumadoras de
marihuana y de madres que no la fumaban:

Usuario No usuario
Tamao muestral 1246 11178
Numero de disfunciones 42 294
Proporcin muestral 0.0337 0.0263

Encuentre el intervalo de confianza del 99% para la diferencia de proporciones.

Solucin:
Representemos P
1
la proporcin de nacimientos donde aparecen disfunciones entre todas
las madres que fuman marihuana y definamos P
2
, de manera similar, para las no fumadoras.
El valor de z para un 99% de confianza es de 2.58.


2
2 2
1
1 1
2 1 2 1
) (
n
q P
n
q P
Z p p P P + =
0217 . 0 0017 . 0
2 1
< < P P
2
2 2
1
1 1
2 1 2 1
) (
n
q P
n
q P
Z p p P P + =
UNIDAD IV / ESTADISTICA APLICADA.



191



Este intervalo es bastante angosto, lo cual sugiere que P
1
-P
2
ha sido estimado de manera
precisa.

Problema: Un ingeniero de trfico realizo un estudio de velocidades vehiculares en un
segmento de calle en la cual se cambio varias veces el lmite de velocidad sealizado.
Cuando el lmite era de 30 millas por hora, el ingeniero vigilo las velocidades de 100
vehculos elegidos al azar que transitaron por la calle y observo 49 violaciones del lmite de
velocidad. Despus de que el limite se elevo a 35 millas por hora, el ingeniero volvi a vigilar
las velocidades de 100 vehculos elegidos aleatoriamente y observo 19 que violaron el
limite. Establezca un intervalo de confianza de 99% para , donde p
1
es la
verdadera proporcin de vehculos que excedieron el lmite de velocidad menor ( 30 millas
por hora) y p
2
es la verdadera proporcin de vehculos que ( en condiciones de circulacin
similares) excedieron el lmite de velocidad mayor ( 35 millas por hora).

Solucin:
p
1
= 49/100 = 0.49
p
2
= 19/100 = 0.19



Determinacin de Tamaos de Muestra para Estimaciones
Al iniciar cualquier investigacin, la primer pregunta que surge es: de qu tamao debe ser
la o las muestras?. La respuesta a esta pregunta la veremos en esta seccin, con conceptos
que ya se han visto a travs de este material.

Se desea saber que tan grande se requiere que sea una muestra para asegurar que el error
al estimar P sea menor que una cantidad especfica .

0212 . 0 0064 . 0
2 1
< < P P
) (
2 1
p p
2
2 2
1
1 1
2 1 2 1
) (
n
q P
n
q P
Z p p P P + =
464 . 0 136 . 0
164 . 0 30 . 0
100
) 81 . 0 )( 19 . 0 (
100
) 51 . 0 )( 49 . 0 (
58 . 2 ) 19 . 0 49 . 0 (
2 1
2 1
< <
= + =
P P
P P
n
pq
Z =
UNIDAD IV / ESTADISTICA APLICADA.



192

Elevando al cuadrado la ecuacin anterior se despeja n y nos queda:

Esta frmula est algo engaosa, pues debemos utilizar p para determinar el tamao de la
muestra, pero p se calcula a partir de la muestra.

Existen ocasiones en las cuales se tiene una idea del comportamiento de la proporcin de la
poblacin y ese valor se puede sustituir en la frmula, pero si no se sabe nada referente a
esa proporcin entonces se tienen dos opciones:

Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimacin
de P. Despus con el uso de la frmula se podra determinar de forma aproximada
cuntas observaciones se necesitan para proporcionar el grado de precisin que se
desea.

Tomar el valor de p como 0.5 ya que sustituyendo este en la frmula se obtiene el
tamao de muestra mayor posible.

En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de
estimacin se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Problema: En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de
Hamilton, Canad, se encuentra que 340 estn suscritas a HBO. Qu tan grande se
requiere que sea una muestra si se quiere tener 95% de confianza de que la estimacin de P
est dentro de 0.02?

Solucin:
p = 340/500=0.68.

2
2

pq Z
n =
1

=
N
n N
n
pq
Z
pq Z N
pqN Z
n
2 2
2
) 1 ( +
=

83 . 2089
) 02 . 0 (
) 32 . 0 )( 68 . 0 ( ) 96 . 1 (
2
2
2
2
= = =

pq Z
n
UNIDAD IV / ESTADISTICA APLICADA.



193

Por lo tanto si basamos nuestra estimacin de P sobre una muestra aleatoria de tamao
2090, se puede tener una confianza de 95% de que nuestra proporcin muestral no diferir
de la proporcin real por ms de 0.02.

Problema: Una legisladora estatal desea encuestar a los residentes de su distrito para
conocer qu proporcin del electorado conoce la opinin de ella, respecto al uso de fondos
estatales para pagar abortos. Qu tamao de muestra se necesita si se requiere un
confianza del 95% y un error mximo de estimacin de 0.10?

Solucin:
En este problema, se desconoce totalmente la proporcin de residentes que conoce la
opinin de la legisladora, por lo que se utilizar un valor de 0.5 para p.


Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la
estimacin tenga un error mximo de 0.10.

Clculo del Tamao de la Muestra para Estimar la Diferencia de Proporciones
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que error esta
dado por:


En esta ecuacin se nos pueden presentar dos casos:
Los tamaos de muestra son iguales.
Los tamaos de muestra son diferentes.
( )
2
2 2 1 1
2

q p q p z
n
+
=
Problema: Una compaa de productos alimenticios contrat a una empresa de investigacin
de mercadotecnia, para muestrear dos mercados, I y II, a fin de comparar las proporciones
de consumidores que prefieren la comida congelada de la compaa con los productos de
sus competidores. No hay informacin previa acerca de la magnitud de las proporciones P
1
y
04 . 96
) 10 . 0 (
) 50 . 0 )( 50 . 0 ( ) 96 . 1 (
2
2
2
2
= = =

pq Z
n
2
2 2
1
1 1
n
q p
n
q p
Z + =
UNIDAD IV / ESTADISTICA APLICADA.



194

P
2
. Si la empresa de productos alimenticios quiere estimar la diferencia dentro de 0.04, con
una probabilidad de 0.95, Cuntos consumidores habr que muestrear en cada mercado?
Solucin:


Se tendr que realizar encuestas a 1201 consumidores de cada mercado para tener una
estimacin con una confianza del 95% y un error mximo de 0.04.


Problemas propuestos
P1. Se prob una muestra aleatoria de 400 cinescopios de televisor y se encontraron 40
defectuosos. Estime el intervalo que contiene, con un coeficiente de confianza de 0.90, a la
verdadera fraccin de elementos defectuosos.

P2. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un trabajo,
exacto dentro de 4 segundos y con una probabilidad de 0.90, para terminar un trabajo de
montaje. Si la experiencia previa sugiere que = 16 seg. mide la variacin en el tiempo de
montaje entre un trabajador y otro al realizar una sola operacin de montaje, cuntos
operarios habr que incluir en la muestra?

P3. El decano registr debidamente el porcentaje de calificaciones D y F otorgadas a los
estudiantes por dos profesores universitarios de matemticas. El profesor I alcanz un 32%,
contra un 21% para el profesor II, con 200 y 180 estudiantes, respectivamente. Estime la
diferencia entre los porcentajes de calificaciones D y F otorgadas por los dos profesores.
Utilice un nivel de confianza del 95% e interprete los resultados.

P4. Suponga que se quiere estimar la produccin media por hora, en un proceso que
produce antibitico. Se observa el proceso durante 100 perodos de una hora, seleccionados
al azar y se obtiene una media de 34 onzas por hora con una desviacin estndar de 3
onzas por hora. Estime la produccin media por hora para el proceso, utilizando un nivel de
confianza del 95%.

P5. Un ingeniero de control de calidad quiere estimar la fraccin de elementos defectuosos
en un gran lote de lmparas. Por la experiencia, cree que la fraccin real de defectuosos
( )( ) ( )( ) [ ]
( )
5 . 1200
04 . 0
5 . 0 5 . 0 5 . 0 5 . 0 ) 96 . 1 ( ) (
2
2
2
2 2 1 1
2
=
+
=
+
=

q p q p Z
n
UNIDAD IV / ESTADISTICA APLICADA.



195

tendra que andar alrededor de 0.2. Qu tan grande tendra que seleccionar la muestra si
se quiere estimar la fraccin real, exacta dentro de 0.01, utilizando un nivel de confianza fe
95%?

P6. Se seleccionaron dos muestras de 400 tubos electrnicos, de cada una de dos lneas de
produccin, A y B. De la lnea A se obtuvieron 40 tubos defectuosos y de la B 80. Estime la
diferencia real en las fracciones de defectuosos para las dos lneas, con un coeficiente de
confianza de 0.90 e intrprete los resultados.

P7. Se tienen que seleccionar muestras aleatorias independientes de n1 = n2 = n
observaciones de cada una de dos poblaciones binomiales, 1 y 2. Si se desea estimar la
diferencia entre los dos parmetros binomiales, exacta dentro de 0.05, con una probabilidad
de 0.98. qu tan grande tendra que ser n?. No se tiene informacin anterior acerca de los
valores P1 y P2, pero se quiere estar seguro de tener un nmero adecuado de
observaciones en la muestra.

P8. Se llevan a cabo pruebas de resistencia a la tensin sobre dos diferentes clases de
largueros de aluminio utilizados en la fabricacin de alas de aeroplanos comerciales. De la
experiencia pasada con el proceso de fabricacin se supone que las desviaciones estndar
de las resistencias a la tensin son conocidas. La desviacin estndar del larguero 1 es de
1.0 Kg/mm2 y la del larguero 2 es de 1.5 Kg/mm2. Se sabe que el comportamiento de las
resistencias a la tensin de las dos clases de largueros son aproximadamente normal. Se
toma una muestra de 10 largueros del tipo 1 obtenindose una media de 87.6 Kg/mm2, y
otra de tamao 12 para el larguero 2 obtenindose una media de 74.5 Kg/mm2. Estime un
intervalo de confianza del 90% para la diferencia en la resistencia a la tensin promedio. 50

P9. Se quiere estudiar la tasa de combustin de dos propelentes slidos utilizados en los
sistemas de escape de emergencia de aeroplanos. Se sabe que la tasa de combustin de
los dos propelentes tiene aproximadamente la misma desviacin estndar; esto es 1 = 2 =
3 cm/s. Qu tamao de muestra debe utilizarse en cada poblacin si se desea que el error
en la estimacin de la diferencia entre las medias de las tasas de combustin sea menor que
4 cm/s con una confianza del 99%?.



UNIDAD IV / ESTADISTICA APLICADA.



196

4.3 Pruebas de hiptesis.

La Teora de la Decisin Estadstica como herramienta bsica para la toma de decisiones,
basadas en evidencia cientfica. La manera de hacerlo es plantear las hiptesis posibles y
luego efectuarle una prueba o test estadstico. Llamada en algunas obras: la docimasia
estadstica. Cuando una conclusin se valida con un test estadstico se la llama de tipo
cuantitativo, en caso contrario la decisin adoptada es de tipo cualitativo, o sea, una decisin
tomada en forma subjetiva. El mtodo consiste en definir una probabilidad de aceptacin del
orden del 95% (o rechazo) de una hiptesis de trabajo planteada, que permite calcular los
valores crticos (o lmites de aceptacin) de un estadgrafo calculado a partir de los valores
medidos. La importancia de este tema es muy grande. Basta decir que el objeto final de la
Estadstica es la toma de decisiones

Hiptesis estadstica es una suposicin hecha con respecto a la funcin de
distribucin de una variable aleatoria.

Las pruebas que se realizan para plantear las hiptesis se conocen con el nombre de
ensayos de validacin estadstica. El problema bsico es determinar si las diferencias
observadas entre el valor obtenido y el valor esperado se deben al azar, o si realmente son
diferentes.

Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido
utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters
se centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae
en decir si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de
manera formal como



La proposicin Ho; = 50 cm/s, se conoce como hiptesis nula, mientras que la
proposicin H
1
; 50 cm/s, recibe el nombre de hiptesis alternati va. Puesto que la
hiptesis alternativa especifica valores de que pueden ser mayores o menores que 50
s cm H
s cm H
/ 50 ;
/ 50 ;
1
0

UNIDAD IV / ESTADISTICA APLICADA.





197

cm/s, tambin se conoce como hiptesis alternativa bilateral. En algunas situaciones, lo
que se desea es formular una hiptesis alternati va unilateral, como en

Ho; = 50 cm/s Ho; = 50 cm/s
H1; < 50 cm/s H1; > 50 cm/s

Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres
maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso,
entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha
cambiado el valor del parmetro.

2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora
o modelo.

3. Cuando el valor del parmetro proviene de consideraciones externas, tales como
las especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de
las especificaciones.

Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el
nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del
empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si
esta informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin
embargo si esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa.
Debe hacerse hincapi en que la verdad o falsedad de una hiptesis en particular nunca
puede conocerse con certidumbre, a menos que pueda examinarse a toda la poblacin.
Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es necesario
desarrollar un procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad de
llegar a una conclusin equivocada. La hiptesis nula, representada por Ho, es la
afirmacin sobre una o ms caractersticas de poblaciones que al inicio se supone cierta (es
UNIDAD IV / ESTADISTICA APLICADA.



198

decir, la creencia a priori). La hiptesis alternativa, representada por H1, es la afirmacin
contradictoria a Ho, y sta es la hiptesis del investigador.

La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia
muestral sugiere que es falsa. Si la muestra no contradice decididamente a Ho, se contina
creyendo en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un
anlisis por prueba de hiptesis son rechazar Ho o no rechazar Ho.

Para establecer la verdad o falsedad de una hiptesis estadstica con certeza total, ser
necesario examinar toda la poblacin. En la mayora de las situaciones reales no es posible
o practico efectuar este examen, y el camino ms aconsejable es tomar una muestra
aleatoria de la poblacin y con base a ella decidir si la hiptesis es verdadera o falsa.

En la prueba de una hiptesis estadstica, es costumbre declarar la hiptesis como
verdadera si la probabilidad calculada excede el valor tabular llamado el nivel de
significacin y se declara falsa si la probabilidad calculada es menor que el valor tabular. La
prueba a realizar depender del tamao de las muestras de la homogeneidad de las
varianzas y de la dependencia o no de las variables.

Prueba de una Hiptesis Estadstica
Para ilustrar los conceptos generales, considere el problema de la rapidez de combustin del
agente propulsor presentado con anterioridad. La hiptesis nula es que la rapidez promedio
de combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es igual a 50
cm/s. Esto es, se desea probar:

Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se
observa cual es la rapidez de combustin promedio muestral. La media muestral es un
estimador de la media verdadera de la poblacin. Un valor de la media muestral que este
prximo al valor hipottico = 50 cm/s es una evidencia de que el verdadero valor de la
media m es realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis nula Ho. Por otra
parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la
hiptesis alternativa H
1
. Por tanto, en este caso, la media muestral es el estadstico de
prueba.

s cm H
s cm H
/ 50 ;
/ 50 ;
1
0

x
UNIDAD IV / ESTADISTICA APLICADA.



199

La media muestral puede tomar muchos valores diferentes. Supngase que si
48.5 51.5, entonces no se rechaza la hiptesis nula Ho; = 50 cm/s, y que si
<48.5 > 51.5, entonces se acepta la hiptesis alternativa H
1
; 50 cm/s. Los
valores de x que son menores que 48.5 o mayores que 51.5 constituyen la regin crtica de
la prueba, mientras que todos los valores que estn en el intervalo 48.5 51.5 forman la
regin de aceptacin. Las fronteras entre las regiones crticas y de aceptacin reciben el
nombre de valores crticos. La costumbre es establecer conclusiones con respecto a la
hiptesis nula H
o
. Por tanto, se rechaza H
o
en favor de H
1
si el estadstico de prueba cae en
la regin crtica, de lo contrario, no se rechaza H
o
.

Contrastes de hiptesis y significacin o reglas de decisiones:
Si suponemos que una hiptesis particular es cierta pero vemos que los resultados hallados
en una muestra aleatoria difieren notablemente de los esperados bajo tal hiptesis entonces
diremos que las diferencias observadas son significativas y nos veramos inclinados a
rechazar la hiptesis.

Los procedimientos que nos capacitan para determinar si las muestras observadas difieren
significativamente de los resultados esperados y por tanto nos ayuda a decidir si aceptamos
o rechazamos hiptesis, se llama contraste (o tests) de hiptesis o de significacin o reglas
de decisin.

Nivel de significacin.
Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuestos a
correr el riesgo de cometer un error tipo I se llama nivel de significacin del contraste. Esta
probabilidad se denota a menudo por , se suele especificar antes de tomar una muestra, de
manera que los resultados obtenidos no influyan a nuestra eleccin.

Es frecuente un nivel de significacin de 0.05 o 0.01, si bien se usan otros valores si por
ejemplo, se escoge el nivel de significacin 0.05 (o 5 %) al disear una regla de decisiones
entonces hay 5 oportunidades entre 100 de rechazar la hiptesis cuando debiera haberse
aceptado; es decir, tenemos un 95 % de confianza de que hemos adoptado la decisin
correcta y por lo tanto tiene una probabilidad de 0.05 de ser falsa.

Tipos de Ensayo (Contrastes de una y de dos colas).
Se pueden presentar tres tipos de ensayo de hiptesis que son:
x
x x
x
UNIDAD IV / ESTADISTICA APLICADA.



200

Bilateral
Unilateral Derecho
Unilateral Izquierdo

En el test precedente estbamos interesados en los valores extremos del estadstico S o en
su correspondiente valor de Z a ambos lados de la media (o sea en las dos colas de la
distribucin) tales test se llaman contraste de dos colas o bilaterales.

Con frecuencia, no obstante, estaremos interesados tan solo en valores extremos aun lado
de la media (o sea, en una de las colas de la distribucin), tal como sucede cuando se
contrasta la hiptesis de que un proceso es mejor que el otro (lo cual no es lo mismo que
contrastar si un proceso es mejor o peor que el otro). Tales contrastes se llaman unilaterales
o de una cola. En tales situaciones, la regin crtica es una regin situada a un lado de la
distribucin, con rea igual al nivel de significacin. Tabla de valores crticos de z para
contrastes de una o de dos colas en varios niveles de significacin.

Nivel de significancia ,

Valores criticos z,
para tests unilateral
Valores criticos z,
para tests bilateral
0.10 -1.28 o 1.28 -1.645 y 1.645
0.05 -1.645 0 1.645 -1.96 y 1.96
0.01 -2.33 o 2.33 -2.58 y 2.58
0.005 -2.58 0 2.58 -2.81 y 2.81
0.002 -2.88 o 2.88 -3.08 y 3.08


Bilateral Unilateral Derecho





UNIDAD IV / ESTADISTICA APLICADA.



201

Unilateral Izquierdo


Uso de valores P para la toma de decisiones
Al probar hiptesis en las que la estadstica de prueba es discreta, la regin crtica se puede
elegir de forma arbitraria y determinar su tamao. Si es demasiado grande, se puede
reducir al hacer un ajuste en el valor crtico. Puede ser necesario aumentar el tamao de la
muestra para compensar la disminucin que ocurre de manera automtica en la potencia de
la prueba (probabilidad de rechazar Ho dado que una alternativa especfica es verdadera).
Por generaciones enteras de anlisis estadstico, se ha hecho costumbre elegir un nivel de
significancia de 0.05 0.01 y seleccionar la regin crtica en consecuencia. Entonces, por
supuesto, el rechazo o no rechazo estricto de Ho depender de esa regin crtica. En la
estadstica aplicada los usuarios han adoptado de forma extensa la aproximacin del valor
P. La aproximacin se disea para dar al usuario una alternativa a la simple conclusin de
rechazo o no rechazo.

La aproximacin del valor P como ayuda en la toma de decisiones es bastante natural pues
casi todos los paquetes de computadora que proporcionan el clculo de prueba de hiptesis
entregan valores de P junto con valores de la estadstica de la prueba apropiada.

Un valor P es el nivel (de significancia) ms bajo en el que el valor observado de la
estadstica de prueba es significativo.

El valor P es el nivel de significancia ms pequeo que conduce al rechazo de la
hiptesis nula Ho.

El valor P es el mnimo nivel de significancia en el cual Ho sera rechazada cuando
se utiliza un procedimiento de prueba especificado con un conjunto dado de
informacin. Una vez que el valor de P se haya determinado, la conclusin en
cualquier nivel particular resulta de comparar el valor P con :

UNIDAD IV / ESTADISTICA APLICADA.





202

1. Valor P rechazar Ho al nivel .
2. Valor P > No rechazar Ho al nivel .




Errores de tipo I y de tipo II
Si rechazamos una hiptesis cuando debiera ser aceptada diremos que se ha cometido un
error de tipo I, la probabilidad de cometer un error tipo I se denota por el smbolo . Por
otra parte, si aceptamos una hiptesis que debiera ser rechazada, diremos que se ha
cometido un error de tipo II, la probabilidad de cometer un error tipo II se denota por el
smbolo . En ambos casos se ha producido un juicio errneo.

Decisin Ho es verdadera Ho es falsa
Aceptar Ho No hay error Error tipo II
Rechazar Ho Error tipo I No hay error

UNIDAD IV / ESTADISTICA APLICADA.





203

1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de
uno por lo general tiene como resultado un aumento en la probabilidad del otro.

2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I,
siempre se puede reducir al ajustar el o los valores crticos.

3. Un aumento en el tamao muestral n reducir y de forma simultnea.

4. Si la hiptesis nula es falsa, es un mximo cuando el valor real del parmetro se
aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor
hipottico, ser menor .

Pasos para establecer un ensayo de hiptesis independientemente de la distribucin que se
est tratando:
1. Interpretar correctamente hacia que distribucin muestral se ajustan los datos del
enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los parmetros de los
estadsticos. As mismo se debe determinar en este punto informacin implcita como el tipo
de muestreo y si la poblacin es finita o infinita.
3. Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del
problema. El ensayo de hiptesis est en funcin de parmetros ya que se quiere evaluar el
universo de donde proviene la muestra. En este punto se determina el tipo de ensayo
(unilateral o bilateral).
4. Establecer la regla de decisin. Esta se puede establecer en funcin del valor crtico, el
cual se obtiene dependiendo del valor de (Error tipo I o nivel de significancia) o en
funcin del estadstico lmite de la distribucin muestral. Cada una de las hiptesis deber
ser argumentada correctamente para tomar la decisin, la cual estar en funcin de la
hiptesis nula o Ho.
5. Calcular el estadstico real, y situarlo para tomar la decisin.
6. Justificar la toma de decisin y concluir.

4.3.1 Prueba de hiptesis para la media poblacional.

n
x
Z


=
UNIDAD IV / ESTADISTICA APLICADA.



204

Problema: Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao
pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar
poblacional de 8.9 aos, esto parece indicar que la vida media de hoy en da es mayor que
70 aos? Utilice un nivel de significancia de 0.05

Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.

2. Datos:


3. Ho : = 70 aos
H1 : > 70 aos

4. Regin critica o regla de decisin
Si Z
R
1.645 no se rechaza Ho.
Si Z
R
> 1.645 se rechaza Ho y se acepta H
1
.
5. Clculos:


6. Justificacin y decisin:
Como 2.02 > 1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la
vida media hoy en da es mayor que 70 aos.

05 . 0
100
8 . 71
9 . 8
70
=
=
=
=
=

n
x
02 . 2
100
89
70 8 . 71
0
=

=
n
x
Z

UNIDAD IV / ESTADISTICA APLICADA.





205

Problema: Una empresa elctrica fabrica focos que tienen una duracin que se distribuye de
forma aproximadamente normal con una media de 800 horas y una desviacin estndar de
40 horas. Si una muestra aleatoria de 30 focos tiene una duracin promedio de 788 horas,
muestran los datos suficiente evidencia para decir que la duracin media ha cambiado?
Utilice un nivel de significancia del 0.04.

Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.

2. Datos:
= 800 horas
= 40 horas
= 788 horas
n = 30
= 0.04

3. Ensayo de hiptesis
Ho; = 800 horas
H1; 800 horas


4. Regla de Decisin:
Si 2.052 Z
R
2.052 No se rechaza Ho
Si Z
R
< -2.052 si Z
R
> 2.052 Se rechaza Ho

5. Clculos:

1

643 . 1
30
40
800 788
0
=

=
n
x
Z

UNIDAD IV / ESTADISTICA APLICADA.





206

6.Justificacin y decisin:
2.052 -1.643 2.052 por lo tanto, no se rechaza Ho y se concluye con un nivel de
significancia del 0.04 que la duracin media de los focos no ha cambiado.

Problema: Un fabricante de equipo deportivo desarrolla un nuevo sedal sinttico que afirma
tiene una resistencia media a la tensin de ocho kilogramos con una desviacin estndar de
0.5 Kg. Pruebe la hiptesis = 8 Kg. Contra la alternativa 8 Kg. si se prueba una
muestra aleatoria de 50 sedales y se encuentra que tiene una resistencia media a la tensin
de 7.78 Kg. utilice un nivel de significancia de 0.01

Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.

2. Datos:
= 8 Kg.
= 0.5 Kg.
= 7.8 Kg.
n = 50
= 0.01

3. Ho : = 8 Kg.
H1 : 8 Kg.

4. Regla de Decisin:
Si 2.58 Z
R
2. 58 No se rechaza Ho
Si Z
R
< -2.58 si Z
R
> 2.58 Se rechaza Ho

5. Clculos:


6. Justificacin y decisin:

83 . 2
50
5 . 0
0 . 8 8 . 7
0
=

=
n
x
Z


UNIDAD IV / ESTADISTICA APLICADA.



207

Como Si 2.83 < -2.58 por lo tanto, se rechaza Ho y se concluye que la resistencia
promedio a la tensin no es igual a 8 Kg. sino que, de hecho, es menor que 8 Kg. con un
nivel de significancia del 0.01 .

Problema: Una muestra aleatoria de 64 bolsas de palomitas de maz pesan, en promedio
5.23 onzas con una desviacin estndar de 0.24 onzas. Pruebe la hiptesis de que = 5.5
onzas contra al hiptesis alternativa, < 5.5 onzas en el nivel de significancia de 0.05.

Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar
desconocida, pero como el tamao de muestra es mayor a 30 se puede tomar la
desviacin muestral como un estimador puntual para la poblacional.

2. Datos:
= 5.5 onzas
= 0.24 onzas
x = 5.23 onzas
n = 64
a = 0.05
3. Ensayo de hiptesis
Ho; = 5.5 onzas
H1; < 5.5 onzas

4. Regla de decisin:
Si Z
R
-1.645 No se rechaza Ho
Si Z
R
< -1.645 Se rechaza Ho

5. Clculos:

UNIDAD IV / ESTADISTICA APLICADA.





208



6. Justificacin y decisin:
Como 9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de significancia del
0.05 que las bolsas de palomitas pesan en promedio menos de 5.5 onzas.

Problema: La duracin media de una muestra de 100 tubos fluorescentes producidos por
una compaa resulta ser 1570 hrs. Con una desviacin tpica de 120 hrs. Si es la duracin
media de todos los tubos producidos por la compaa, comprobar la hiptesis = 1600 hrs.
Contra la hiptesis alternativa 1600 hrs. Con un nivel de significancia de (a) 0.05 y (b)
0.01

Solucin:
a)
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.

2. Datos:
= 0.05
n = 100
x = 1570
= 120 hrs.

3. Ensayo de hipotesis
H
0
: = 1600 hrs.
H1 : 1600 hrs.

4. Regla de decisin
Si 1.96 Z
R
1.96 No se rechaza Ho
Si Z
R
< -1.96 si Z
R
> 1.96 Se rechaza Ho

5. Clculos
9
64
24 . 0
5 . 5 25 . 5
0
=

=
n
x
Z

UNIDAD IV / ESTADISTICA APLICADA.





209


6. Justificacin y decisin
Como Si 2.50 < -1.96 por lo tanto, se rechaza Ho y se concluye que La duracin media
de una muestra de 100 tubos fluorescentes producidos por una compaa no resulta ser
1570 hrs., sino que, de hecho , es menor que 1570 hrs. con nivel de significancia del
0.05 que la duracin media de todos los tubos producidos por la compaa no ha
cambiado.

b)
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.

2. Datos:
= 0.01
n = 100
x = 1570
= 120 hrs.

3. Ensayo de hipotesis
H
0
: = 1600 hrs.
H1 : 1600 hrs.

4. Regla de decisin

Si 2.58 Z
R
2.58 No se rechaza Ho
Si Z
R
< -2.58 si Z
R
> 2.58 Se rechaza Ho

5. Clculos

6. Justificacin y decisin
Como Si 2.58 -2.50 2.58 como se encuentra dentro de este rango, se acepta Ho (o no
se toma ninguna decisin) al nivel de significacin del 0.01
50 . 2
100
120
1600 1570
=

= Z
50 . 2
100
120
1600 1570
=

= Z
UNIDAD IV / ESTADISTICA APLICADA.



210

Problema: La resistencia a la rotura de los cables producidos por un fabricante tiene una
media de 1800 libras y una desviacin tpica de 100 libras. Mediante una nueva tcnica en el
proceso de fabricacin se aspira a una resistencia pueda ser incrementada. Para ensayar
esta aspiracin, se ensaya una muestra de 50 cables y se encuentra que su resistencia
media es de 1850 libras. Puede mantenerse que, en efecto, hay un aumento de resistencia
al nivel de significacin del 0.01?

Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.

2. Datos:
= 0.01
n = 50
x = 1850 lbs
= 100 lbs

3. Ensayo de hipotesis
H
0
: = 1800 lbs
H1 : > 1800 lbs.

4. Regla de decisin
Si Z
R
2..33 No se rechaza Ho
Si Z
R
> 2.33 Se rechaza Ho

5. Clculos


6. Justificacin y decisin
Como Si 3.54 > 2.33 por lo tanto, se rechaza Ho y se acepta H
1,
por lo tanto se


concluye que su resistencia media no es de 1850 libras si no que mayor.

Problema: Se ha estudiado la tasa de quemado de un propulsor a chorro. Las
especificaciones requieren que la tasa media de quemado sea 40 cm/s. Adems, supngase
que sabemos que la desviacin estndar de la tasa de quemado es aproximadamente de 2
54 . 3
50
100
1800 1850
=

= Z
UNIDAD IV / ESTADISTICA APLICADA.



211

cm/ s. El experimentador decide especificar una probabilidad de error tipo I , y el
basara la prueba en una muestra aleatoria de tamao n = 25. Pruebe la hiptesis de
y . Si se prueban veinticinco especmenes, y la tasa de
quemado media de muestra que se obtiene es

1. Se trata de una distribucin mustrales de medias con desviacin estndar
conocida.
2. datos:


3. Ensayo de hiptesis

4. regla de decisin
-1.96 1.96 se acepta H
0
Z<-1.96 Z>1.96 se acepta H
1

5. clculos
=
6. justificacin y decisin
3.13 >1.96 se acepta H
1
y se concluye que la tasa de quemado media no es igual a
40 cm/s, sino que mas de 40 cm/s.

Varianza desconocida.
Las variables aleatorias X
1
, X
2
, ... X
n
representan una muestra aleatoria de una distribucin
normal con y desconocidas. Entonces la variable aleatoria tiene una
distribucin t de student con n 1 grados de libertad.

05 . 0 =
s cm/ 40 = s com/ 40
s cm x / 25 . 41 =
25
/ 2
/ 40
/ 25 . 41
=
=
=
=
n
s cm
s cm
s cm x

05 . 0 =
s cm H
s cm H
/ 40 :
/ 40 :
1
0

Z
n
x
Z

= 13 . 3
25
2
40 25 . 41
=

s
x n ) (
UNIDAD IV / ESTADISTICA APLICADA.



212

La estructura de la prueba es idntica a la del caso con conocida, con la excepcin de que
el valor en la estadstica de prueba se reemplaza por la estimacin de S calculada y la
distribucin normal estndar se reemplaza con una distribucin . Como resultado; para la
hiptesis bilateral
Ho : = o
Hi : o

El rechazo de Ho en un nivel de significancia resulta cuando una estadstica calculada.


Problema: Los cientficos han citado al benceno, un disolvente qumico de uso comn en la
sntesis de plsticos, como un posible agente causante de cncer. Ciertos estudios han
demostrado que las personas que trabajan con benceno durante mas de cinco aos tienen
una incidencia de leucemia 20 veces mayor que la poblacin en general. En consecuencia,
el gobierno federal estadounidense ha bajado el nivel mximo permisible de benceno en
lugar de trabajo de 10 partes por milln (ppm) a 1 ppm ( informacin en el Florida Times
Union, 2 de abril de 1984). Suponga que una fabrica de artculos de acero, que expone a sus
trabajadores diariamente a benceno, esta siendo investigada por la Administracin de
Seguridad y Salud Ocupacional (OSHA) de Estados Unidos. Se examinan 20 muestras de
aire, tomada durante un periodo de un mes, parar determinar el contenido de benceno. Los
anlisis produjeron las siguientes estadsticas resumidas:

La fabrica de artculos de acero esta violando las nuevas normas del gobierno? Pruebe la
hiptesis de que el nivel medio de benceno en la planta es mayor que 1 ppm ., utilizando


Solucin:

1. se trata de una distribucin muestral de medias con varianza desconocida.

2. datos:
n
s
x
t
0

=
ppm x 1 . 2 = ppm s 7 . 1 =
05 . 0 =
UNIDAD IV / ESTADISTICA APLICADA.



213



3. Ensayo de hiptesis
H
0
:
H
1
:

4. Regla de decisin :
> 1.729 se acepta H
1
y se rechaza H
0

-1.729 se acepta H
0
y se rechaza H
1


5. clculos :

Supuesto: La distribucin de frecuencia relativa de la poblacin de niveles de benceno
para todas las muestras de aire tomadas en la planta de fabricacin de artculos de
acero es aproximadamente normal.
Regin de rechazo: para y gl = (n l) = 19, se rechazara H
0
si t > t
0.05
= 1.729

6. justificacin y decisin.
2.89 > 1.729 se acepta H
1
y se rechaza H
0
. se llega a la conclusin de que la
planta esta violando las nuevas normas gubernamentales .

Problema: La resistencia al rompimiento de una fibra textil es una variable aleatoria
distribuida normalmente. Las especificaciones requieren que la resistencia media al
rompimiento deba igualar el valor de 15 psi. Al fabricante le gustara detectar cualquier
desviacin significativa respecto a este valor. En consecuencia se desea probar
y . Con un nivel de significancia de . Si una muestra
05 . 0
1
20
7 . 1
1 . 2
=
=
=
=
=

ppm
n
ppm s
ppm x
1 =
1 >
t
t
n
s
x
t
0

=
05 . 0 =
89 . 2
20
7 . 1
1 1 . 2
0
=

=
n
s
x
t

psi 150 = psi 150 05 . 0 =
UNIDAD IV / ESTADISTICA APLICADA.



214

aleatoria de 15 especimenes de prueba se selecciona y se determinan sus resistencias al
rompimiento. La media y la varianza de la muestra se calculan a partir de los datos de la
misma como y .

1. se trata de una distribucin muestral de medias con varianza desconocida.

2. datos:


3. Ensayo de hiptesis

por ser bilateral



4. regla de decisin
se acepta H
0
se acepta H
1

5. Clculos
=

6. justificacin y decisin
se acepta H
0
y concluiramos que no hay evidencia suficiente
para rechazar la hiptesis de que
18 . 152 = x 63 . 16
2
= s
05 . 0
150
15
63 . 16
18 . 152
2
=
=
=
=
=

n
s
x
150 :
150 :
1
0

H
H
05 . 0 = 025 . 0
2
05 . 0
2
= =

145 . 2
) 1 15 ( , 025 . 0
=

t 145 . 2
) 1 15 ( , 025 . 0
=

t
145 . 2 145 . 2 t
145 . 2 < t 145 . 2 > t
n
s
x
t

= 07 . 2
15
63 . 16
150 18 . 152
=

145 . 2 07 . 2 145 . 2
psi 150 =
UNIDAD IV / ESTADISTICA APLICADA.



215

4.3.2 Prueba de hiptesis para diferencias de medias.
Problema: Un diseador de productos est interesado en reducir el tiempo de secado de
una pintura tapaporos. Se prueban dos frmulas de pintura; la frmula 1 tiene el contenido
qumico estndar, y la frmula 2 tiene un nuevo ingrediente secante que debe reducir el
tiempo de secado. De la experiencia se sabe que la desviacin estndar del tiempo de
secado es ocho minutos, y esta variabilidad inherente no debe verse afectada por la adicin
del nuevo ingrediente. Se pintan diez especmenes con la frmula 1, y otros diez con la
frmula 2. Los dos tiempos promedio de secado mustrales son 121 min. y 112 min.
Respectivamente. A qu conclusiones puede llegar el diseador del producto sobre la
eficacia del nuevo ingrediente, utilizando = 0.05?

Solucin:
1. Se trata de una distribucin muestral de diferencias de medias

2. Datos:
1 2
1
2
1 2
8
121min
112min
10
0.05
x
x
n n

= =
=
=
= =
=


3. Ensayo de hiptesis
0 1 2
1 1 2
: 0
: 0
H
H


=
>


4. Regla de decisin
0
1
1.645 se acepta
1.645 se acepta
Z H
Z H

>


5. Clculos
UNIDAD IV / ESTADISTICA APLICADA.



216

2 2
(121 112) 0
2.52
8 8
10 10
Z

= =
+


6. Justificacin y decisin
Puesto que 2.52 > 1.645, se acepta H1, y se concluye con un nivel de significancia de 0.05
que la adicin del nuevo ingrediente a la pintura si disminuye de manera significativa el
tiempo promedio se secado.

Problema: Se utiliza dos mquinas para llenar botellas de plstico con un volumen neto de
16.0 onzas. Las distribuciones de los volmenes de llenado pueden suponerse normales,
con desviaciones estndar de 0.020 y 0.025 onzas. Un miembro del grupo de ingeniera de
calidad sospecha que el volumen neto de llenado de ambas mquinas es el mismo, sin
importar si este es o no de 16 onzas. De cada mquina se toma una muestra aleatoria de 10
botellas.

Se encuentra el ingeniero en lo correcto?
Utilice un nivel de significancia de 0.05.

MAQUINA 1 MAQUINA 2
16.03
16.04
16.05
16.05
16.02
16.01
15.96
15.98
16.02
15.99
16.02
15.97
15.96
16.01
15.99
16.03
16.04
16.02
16.01
16.00

Solucin:
1. Se trata de una distribucin muestral de diferencias de medias

2. Datos:
1 2
1 2
1 2
0.020; 0.025
16.015; 16.005
10; 0.05
x x
n n

= =
= =
= = =

3. Ensayo de hiptesis
UNIDAD IV / ESTADISTICA APLICADA.



217

0 1 2
1 1 2
: 0
: 0
H
H


=




4. Regla de decisin
0
1
1.96 1.96 se acepta
1.96 o 1.96 se acepta
Z H
Z Z H

< >


5. Clculos
2 2
(16.015 16.005) 0
0.987
(0.020) (0.025)
10 10
Z

= =
+


6. Justificacin y decisin
Puesto que 1.96 1.96 Z , se acepta H0, y se concluye con un nivel de significancia de
0.05 que las dos mquinas tienen el mismo promedio de llenado.

Problema: Existen dos tipos de plasticos apropiados para su uso por un fabricante de
componentes electrnicos. La tensin de ruptura de es plstico es un parmetro importante.
Se sabe que la desviacin estandar es de 1.0 Psi. De una muestra aleatoria de tamao 10 y
12 para cada plstico respectivamente. Se tiene ua media de 162.5 para el plastico 1 y de 155
para el plastico 2. La compaa no adoptara el plastico 1 a menos que la tensin de ruptura de
este exceda a la del plastico 2 al menos por 10 Psi. Con base a la informacin contenidad en
la muestra. La compaa debera utilizar el plastico 1?. Utilice un nivel de significancia de 0.05
para llegar a una decisin.

Solucin:
1. Se trata de una distribucin muestral de diferencias de medias
UNIDAD IV / ESTADISTICA APLICADA.



218


2. Datos:
1 2
1
2
1
2
1.0
162.5
155
10
12
0.05
psi
x psi
x psi
n
n

= =
=
=
=
=
=


3. Ensayo de hiptesis
0 1 2
1 1 2
: 10
: 10
H
H


=
>



4. Regla de decisin
0
1
1.645 se acepta
1.645 se acepta
Z H
Z H

>


5. Clculos
2 2
(162.5 155) 10
5.83
(1) (1)
10 12
Z

= =
+

.
6. Justificacin y decisin
No existe evidencia suficiente para apoyar el uso del plstico 1 ya que 5.83 1.645 , se
acepta H0.

UNIDAD IV / ESTADISTICA APLICADA.



219

Problema: La gerente de planta de una fbrica enlatadora de jugo de naranja est interesada
en comprar el rendimiento de dos diferentes lneas de produccin. Como la lnea nmero 1
es relativamente nueva, sospecha que el nmero de cajas que se producen al da es mayor
que el correspondiente a la vieja lnea 2. se toman datos al azar durante diez das para cada
lnea, encontrndose que por da y 818.6 cajas por da. De la
experiencia con la operacin de este tipo de equipo se sabe qu y con
un nivele de significancia de 0.05

Solucin:
1. se trata de una distribucin muestral de diferencias de medias.

2. datos:
; 818.6
;
;

3. ensayo de hiptesis


4. regla de decisin
Z > 1.645 se acepta H
1

Z -1.645 se acepta H
0

5. Clculos

Z

6. justificacin y decisin
cajas x 9 . 824
1
= =
2
x
40
2
1
= . 50
2
2
=
cajas x 9 . 824
1
= =
2
x
40
2
1
= . 50
2
2
=
10
2 1
= = n n 05 . 0 =
2 1 1
2 1 0
:
:


>
=
H
H

10 . 2
10
50
10
40
0 ) 6 . 818 9 . 824 (
=
+

=
UNIDAD IV / ESTADISTICA APLICADA.



220

2.10 > 1.645 se acepta H
1
. se concluye que el numero medio de cajas producidas
diariamente por la nueva lnea de produccin es mayor que el numero medio de caja
producidas por la vieja lnea.


4.3.3 Prueba de hiptesis para proporciones.
Problema: Un constructor afirma que se instalan bombas de calor en 70% de todas las
casas que se construyen hoy en da en la ciudad de Richmond. Estara de acuerdo con
esta afirmacin si una investigacin de casas nuevas en esta ciudad muestra que 8 de 15
tienen instaladas bombas de calor? Utilice un nivel de significancia de 0.10.

Solucin:
1. Se trata de una distribucin muestral de proporciones.

2. Datos:


3. Ensayo de hiptesis
Ho; P = 0.70
H1; P 0.70

4. Regla de Decisin:
Si 1.645 Z 1.645 No se rechaza Ho
Si ZR < -1.645 si ZR > 1.645 Se rechaza Ho

5. Clculos:
10 . 0
15
5333 . 0 15 / 8
70 . 0
=
=
= =
=

n
p
P
UNIDAD IV / ESTADISTICA APLICADA.



221


6. Justificacin y decisin :
Como 1.645 -1.41 1.645 No se rechaza Ho y se concluye con un nivel de significancia
de 0.10 que la afirmacin del constructor es cierta.

Problema: El fabricante de una patente mdica sostiene que la misma tiene un 90 % de
efectividad en el alivio de una alergia, por un periodo de 8 hrs. En una muestra de 200
individuos que tenan la alergia, la medicina suministrada alivio a 160 personas. Determinar
si la aseveracin del fabricante es cierta. El nivel de significancia es 0.01

Solucin:
1. Se trata de una distribucin muestral de proporciones.

2. Datos:


3. Ensayo de hiptesis
H
0
: p = 0.9
H
1
: p < 0.9

4. Regla de decisin
Z < -2.33 se acepta H
1
y se rechaza H
0
Z -2.33 se acepta H
0

5. Clculos
41 . 1
15
) 30 . 0 )( 70 . 0 (
70 . 0 533 . 0
=

=
n
Pq
P p
Z
01 . 0
200
8 . 0 200 / 160
90 . 0
=
=
= =
=

n
p
P
UNIDAD IV / ESTADISTICA APLICADA.



222


6. justificacin y decisin
- 4.71 < - 2.33 se acepta H
1
y se rechaza H
0
. se concluye que es menor al 90 % de
efectividad

Problema: Un fabricante de semiconductores produce controladores que se emplean en
aplicaciones de motores automovilsticos. El cliente requiere que la fraccin de controladores
defectuosos en uno de los pasos de manufactura crticos no sea mayor que 0.05, y que el
fabricante demuestre esta caracterstica del proceso de fabricacin con este nivel de calidad,
utilizando =0.05. El fabricante de semiconductores toma una muestra aleatoria de 200
dispositivos y encuentra que cuatro de ellos son defectuosos. El fabricante puede
demostrar al cliente la calidad del proceso?

Solucin:
1. Se trata de una distribucin muestral de proporciones.

2. Datos:
P = 0.05
p = 4/200 = 0.02
n = 200
= 0.05

3. ensayo de hiptesis


71 . 4
200
) 10 . 0 )( 90 . 0 (
90 . 0 8 . 0
=

=
n
Pq
P p
Z
05 . 0 :
05 . 0 :
1
0
<
=
P H
P H
UNIDAD IV / ESTADISTICA APLICADA.



223

4. Regla de decisin:
Si ZR -1.645 No se rechaza Ho
Si ZR < -1.645 Se rechaza Ho

5. Clculos:

6. Justificacin y decisin:
Puesto que 1.946<-1.645, se rechaza Ho y se concluye con un nivel de significancia del
0.05 que la fraccin de artculos defectuosos es menor que 0.05.


4.3.4. Prueba de hiptesis para diferencia de proporciones.
Problema: Se evalan dos tipos diferentes de soluciones para pulir, para su posible uso en
una operacin de pulido en la fabricacin de lentes intraoculares utilizados en el ojo humano
despus de una ciruga de cataratas. Se pulen 300 lentes con la primera solucin y, de
stos, 253 no presentaron defectos inducidos por el pulido. Despus se pulen otros 300
lentes con la segunda solucin, de los cuales 196 resultan satisfactorios. Existe alguna
razn para creer que las dos soluciones para pulir son diferentes? Utilice = 0.01

Solucin:
1. Se trata de una distribucin muestral de diferencia de proporciones.

2. Datos:
p1= 253/300= 0.8433
p2 = 196/300= 0.6533
n
1
= n
2
= 300

3. Ensayo de hiptesis:
Ho; P
1
= P
2

H1; P
1
P
2


946 . 1
200
) 95 . 0 )( 05 . 0 (
05 . 0 02 . 0
=

=
n
Pq
P p
Z

UNIDAD IV / ESTADISTICA APLICADA.





224


4. Regla de decision.
2.575 2.575 se acepta Ho
2.575 o 2.575 Se acepta H1
Si z
Si Z Z

< >


5. Clculos
1 2
1 2
1 2
253 196
0.7483
300 300
0.7483
1 0.2517
x x
P
n n
P P P
q P
+ +
= = =
+ +
= = =
= =

1 2 1 2
1 2
( ) ( )
1 1
(0.8433 0.6533) 0
5.36
1 1
(0.7483)(0.2517)
300 300
p p P P
Z
Pq
n n
Z

=

+



= =

+





6. Justificacin y decisin :
Puesto que 5.36 > 2.575 se rechaza la hiptesis nula y se concluye con un nivel de
significancia de 0.01 que los dos fluidos para pulir son diferentes.

Problema: Se tomar el voto entre los residentes de una ciudad y el condado
circundante para determinar si se debe construir una planta qumica propuesta. El lugar
de construccin est dentro de los lmites de la ciudad y por esta razn muchos votantes
del condado consideran que la propuesta pasar debido a la gran proporcin de
votantes que favorecen la construccin. Para determinar si hay una diferencia
UNIDAD IV / ESTADISTICA APLICADA.



225

significativa en la proporcin de votantes de la ciudad y votantes del condado que
favorecen la propuesta, se realiza una encuesta. Si 120 de 200 votantes de la ciudad
favorecen la propuesta y 240 de 500 residentes del condado tambin lo hacen.

Estara de acuerdo en que la proporcin de votantes de la ciudad que favorecen la
propuesta es ms alto que la proporcin?. Utilice un nivel de significancia de 0.025.
Solucin:
1. Se trata de una distribucin muestral de diferencia de proporciones.

2. Datos:
p1= 120/200 = 0.60; p2 = 240 / 500 = 0.48
n
1
= 200; n
2
= 500

3. Ensayo de hiptesis:
Ho; P
1
= P
2

H1; P
1

>
P
2


4. Regla de decision.
Z 1.96 se acepta Ho
1.96 Se acepta H1
Si
Si Z

>


5. Clculos
1 2
1 2
120 240
0.48
200 500
x x
P
n n
+ +
= = =
+ +


1 2 1 2
1 2
( ) ( ) (0.60 0.48) 0
2.9
1 1
1 1
(0.51)(0.49)
200 500
p p P P
Z
Pq
n n

= = =

+
+







6. Justificacin y decisin :
Puesto que 2.9 > 1.96 se acepta H1 y se concluye estar de acuerdo en que la proporcin
de votantes de la ciudad a favor de la propuesta es ms alta que la proporcin de
votantes del condado..

















































UNIDAD 5
REGRESION Y
CORRELACION.
Objetivo:
Comprender el concepto de
correlacin y regresin, los
expresar matemticamente y los
usar para tomar decisiones.
UNIDAD V / REGRESIN Y CORRELACIN.







217
5.1 Introduccin.

A menudo, en la prctica, se requiere resolver problemas que incluyen conjuntos de
variables cuando se sabe que existen algunas relaciones inherentes entre ellas. Por
ejemplo, en una situacin industrial se puede saber que el contenido de alquitrn en el flujo
saliente de un proceso qumico se relaciona con la temperatura de entrada. Ya que una de
las aplicaciones ms importantes de la estadstica implica la estimacin del valor medio de
una variable de respuesta y o la prediccin de algn valor futuro y con base en el
conocimiento de un conjunto de variables independientes relacionadas, . ,..., ,
2 1 k
x x x


5.1.1 Grficas de los datos.
En la grafica de los datos es la interpretacin de la informacin que se ha recopilado a travs
de un experimento en la cual consiste en la comparacin por pares de datos y solo marca
cada dato a travs de puntos.

Problema: El calor especifico ) / ( kgmol cal Cp del
4 3
O Mn vara con la temperatura de
acuerdo a la siguiente tabla:
Punto T ( K) C
p

1 280 32.7
2 650 45.4
3 1000 52.15
4 1200 53.7
5 1500 52.9
6 1700 50.3

Elabore la grafica de los datos que muestra la tabla.

0
20
40
60
0 500 1000 1500 2000
C
a
l
o
r

e
s
p
e
c
i
f
i
c
o

Temperatura
Grafica de datos
UNIDAD V / REGRESIN Y CORRELACIN.







218
5.1.2 Variables de regresin independientes.
Una de las aplicaciones ms importantes de la estadstica implica la estimacin del valor
medio de una variable de respuesta o la prediccin de algn valor futuro de con base
en el conocimiento de un conjunto de variables independientes relacionadas .

Por ejemplo, el gerente de un centro de procesamiento de datos podra querer relacionar el
tiempo de espera (la variable dependiente) entre el momento en que se presenta un
trabajo a una computadora y el momento en que se completa, con variables tales como el
numero y el tamao de los trabajos que ya estn esperando para ejecutarse y el tamao de
los trabajos que se estn presentando ( las variables independientes). El objetivo sera
crear una ecuacin de prediccin (o un modelo) que exprese como una funcin de las
variables independientes. Esto permitira la gerente predecir para valores especficos de
las variables independientes y, en ltima instancia, utilizar los conocimientos derivados de un
estudio de la ecuacin de prediccin para instaurar polticas de control del tiempo de espera.

Los modelos que se emplean para relacionar una variable dependiente con las variables
independientes se denominan modelos de regresin o modelos estadsticos
lineales porque expresan el valor medio de para valores dados de como una
funcin lineal de un conjunto de parmetros desconocidos.

Definicin
La variable por predecir (o por modelar), , es la variable dependiente (o de respuesta)


Definicin
Las variables que se utilizan para predecir (o modelar) se denominan variables
independiente y se denotan con los smbolos , etctera.





y y
k
x x x ,..., ,
2 1
y
y
y
y
k
x x x ,..., ,
2 1
y
k
x x x ,..., ,
2 1
y
y
, , ,
3 2 1
x x x
UNIDAD V / REGRESIN Y CORRELACIN.







219
5.1.3 Regresin lineal simple.
En el caso de la regresin lineal simple donde hay una sola variable de regresin
independiente x y una sola variable Y, los datos se pueden representar mediante los pares
de observaciones ( ) { } n i y x
i i
,..., 2 , 1 ; , =
.


El ejemplo ms simple de una aproximacin por mnimos cuadrados es el ajuste de una
lnea recta a un conjunto de parejas de datos observadas: ) , (
1 1
y x , ) , (
2 2
y x ,. . . ) , (
n n
y x .
La expresin matemtica de una lnea recta es:
0 1
y a a x = + +
En donde
0
a y
1
a son coeficientes que representan la interseccin con el eje de las
abscisas y la pendiente, respectivamente y E es el error o residuo entre el modelo y las
observaciones, que se pueden representar reordenando la ecuacin como:
x a a y E
1 0
=
Por lo tanto, el error o residuo es la diferencia entre el valor real de y y el valor aproximado
x a a
1 0
+ , predicho por la ecuacin lineal.
x a a y
1 0
+ = Ecuacin de la lnea recta
Entonces, podramos escoger un modelo que relacione a con x trazando una lnea resta
a travs de los puntos de la figura. Semejante modelo deterministico uno que no
contempla errores de prediccin podra ser adecuado si todos los puntos de la figura,
quedaran sobre la lnea ajustada. Sin embargo, es evidente que esta situacin ideal no
ocurre para los datos de la tabla. Sin importar como tracemos una lnea recta desviaran
significativamente de la lnea ajustada.

La solucin al problema anterior es construir un modelo probabilstico que relacione y con x;
uno que contemple la variacin aleatoria de los puntos de datos a los lados de una lnea
recta. Un tipo de modelo probabilstico, el modelo de regresin lineal simple, supone que
el valor medio de y para un valor dado de x se grafica como una lnea recta y que los puntos
se desvan de esta lnea de medias en una cantidad aleatoria (positiva o negativa) igual a
, es decir,
0 1
y a a x = + +
y

UNIDAD V / REGRESIN Y CORRELACIN.









220
Donde
0
a y
1
a

son parmetros desconocidos de la porcin deterministico (no aleatoria) del
modelo. Si suponemos que los puntos se desvan por encima y por debajo de la lnea de
medias, siendo algunas desviaciones positivas, otras negativas, y con entonces el
valor medio de es
0 1
0 1
0 1
( ) ( )
( )
E y E a a x
a a x E
a a x

= + +
= + +
= +


Por tanto, el valor medio de para un valor dado de x, representado por el smbolo E (y), *
se grafica como una lnea recta con ordenada al origen igual a
0
a y pendiente igual a
1
a .

La validez de las inferencias acerca de
0
a y
1
a depender de las distribuciones de muestreo
de los estimadores, que a su vez dependen de la distribucin de probabilidad del error
aleatorio, ; por tanto, primero debemos hacer supuestos especficos respecto a . Tales
supuestos, que se resumirn a continuacin, son bsicos para todo anlisis de regresin
estadstico.

Lneas de regresin ajustada.
Supuesto I: La media de la distribucin de probabilidad de es 0. Es decir, la media de los
errores a lo largo de una serie infinitamente larga de experimentos es 0 para cada valor de la
variable independiente x. Este supuesto implica que el valor medio de , para un
valor dado de x es
0 1
( ) E y a a x = +

Supuesto II: La varianza de la distribucin de probabilidad de es constante para todos los
valores de la variable independiente x. En el caso de nuestro modelo de lnea recta, este
supuesto significa que la varianza de es igual a una constante, digamos , para todos
los valores de x.

Supuesto III: La distribucin de probabilidad de es normal.
Supuesto IV: Los errores asociados a cualesquier dos observaciones distintas son
0 ) ( = E
y
y

) ( , y E y

UNIDAD V / REGRESIN Y CORRELACIN.









221
independientes. Es decir, el error asociado a un valor de en particular no tiene efecto
alguno sobre los errores asociados a otros valores de .
Las implicaciones de los tres primeros supuestos pueden apreciarse en la figura siguiente,
que muestra las distribuciones de errores para tres valores especficos de x, a saber,
y .

Observe que las distribuciones de frecuencia relativa de los errores son normales, con una
media de 0 y una varianza constante de . La lnea recta de la figura es el valor medio
para un valor dado de x,

En la prctica, los supuestos no tienen que cumplirse al pie de la letra para que los
estimadores de mnimos cuadrados y las estadsticas de prueba (que se describirn ms
adelante) tengan el grado de con fiabilidad que esperamos de un anlisis de regresin.

5.2. Diagrama de dispersin

5.2.1. Tabla de datos
Ejemplo: Supongamos que el inventor de un material aislante quiere determinar la magnitud
de la compresin que se producir en un espcimen de 2 pulgadas de espesor cuando se
someta a diferentes cantidades de presin. Se prueban cinco trozos experimentales del
material bajo diferentes presiones.

Los valores de x (en unidades de 10 libras por pulgada cuadrada) y las magnitudes de
compresin resultantes (en unidades de 0.1 pulgada) se presentan en la tabla.
y
y
2 1
,x x
3
x
2
y
y
UNIDAD V / REGRESIN Y CORRELACIN.







222
Tabla Compresin vs. presin
para un material aislante
Espcimen Presin Compresin
X
1
2
3
4
5
1
2
3
4
5
1
1
2
2
4


5.2.2. Construccin de diagramas.
En la figura se muestra una grafica de los datos llamada diagrama de dispersin.


Supongamos que creemos que el valor de tiende a aumentar de forma lineal conforme x
aumenta.


5.3. Estimacin mediante la lnea de regresin

5.3.1. Ecuacin de la recta como ajuste de datos
El mtodo ms simple de ajustar una curva a un conjunto de datos es el de trazar los puntos
y unirlos con una lnea recta. Aunque es una alternativa validad y se utiliza cuando se
requiere hacer estimaciones rpidas, los resultados son independientes, desde un punto de
vista subjetivo, de la persona que traza la recta.

y
0
1
2
3
4
5
0 2 4 6
C
o
m
p
r
e
n
s
i

n
Presin
y
UNIDAD V / REGRESIN Y CORRELACIN.







223
Para quitar esta dependencia se usa la regresin lineal o mnimos cuadrados.

Ecuacin de la lnea recta
x a a y
1 0
+ =

Polinomio de segundo grado o cuadrtico:
e x a x a a y + + + =
2
2 1 0


Una extensin til en la regresin lineal es el caso en que y es una funcin lineal de dos o
ms variables. Por ejemplo, y pudiera ser una funcin lineal de
1
x y
2
x , de la forma:
2 2 1 1 0
x a x a a y + + =

5.3.2. Modelos
Algoritmo de la solucin

1. Inicio
2. Solicitud de los datos discretos ( tabla de datos encontrados experimentalmente) a
los cuales se le va a encontrar la recta que de aproxima mas a ellos.
3. Calcular con base a los datos dados el valor de n.
4. encontrar la sumatoria

y
5. Encontrar la sumatoria

x
6. encontrar la sumatoria del producto

xy
7. Encontrar la sumatoria de la potencia

2
x
8. Sustituir los valores encontrados en los pasos 3, 4, 5, 6, 7, en las ecuaciones del
mtodo de mnimos cuadrados.
9. Resolver el sistema de ecuaciones para encontrar a las constantes A y B
10. sustituir los valores de A y B en la ecuacin de la recta.
11. impresin de los resultados
12. Fin.


5.4. Mtodos de mnimos cuadrados.

El significado de mnimos cuadrados consiste en obtener la recta que ajuste a una serie de
datos numricos, con la condicin que la suma de los cuadrados de los residuos sea mnima
posible.
UNIDAD V / REGRESIN Y CORRELACIN.







224


a) Muestra de datos con un error significativo.
b) Ajuste polinomial con oscilaciones que violan el rango de datos.
c) Se obtienen resultados ms satisfactorios usando el ajuste de mnimos cuadrados.

Si queremos escoger la lnea recta "de mejor ajuste" para un conjunto de datos, debemos
estimar los parmetros desconocidos
0
a y
1
a

del modelo de regresin lineal simple. Estos
estimadores podran obtenerse empleando el mtodo de mxima verosimilitud pero el
mtodo ms fcil y el ms atractivo desde un punto de vista intuitivo es el mtodo de
mnimos cuadrados. Cuando se satisfacen los supuestos de la seccin anterior, los
estimadores de mxima verosimilitud y de mnimos cuadrados de
0
a y
1
a

son idnticos.


5.4.1. Estimacin de los coeficientes de regresin
Ecuacin de la lnea recta (regresin lineal)

x a a y
1 0
+ =

( )
2
2
1

=
i i
i i i i
x x n
y x y x n
a

x a y a
1 0
=








Problema:



Solucin:


Problema:
automatiza
bodega de
y optimizar
1993) se es

La disposic
dentro de l
se verific
simulacin
tiempo tota
Algo que in
(y) y el nm


Ajstese una
Las bode
ados para el
be disearse
r el tiempo d
studi el dise
cin emplea
la bodega, e
simulando
se vari el n
al que un ve
nteresa a los
mero de veh
a lnea recta
i
1
2
3
4
5
6
7
egas mode
manejo de
e con cuidad
de respuesta
eo ptimo d
da supone q
es decir, que
(en una c
nmero de v
ehculo bloqu
s investigado
culos (x).
UNIDAD
a los valore
X
1
2
3
4
5
6
7
ernas utiliza
materiales.
do a modo de
a. En The Jo
de una bodeg
que los veh
e no hay con
computadora
vehculos y s
ue a otro).
ores es la re
D V / REGR
s x y y de la
y
0.5
2.5
2.0
4.0
3.5
6.0
5.5
an vehculo
En consecu
e evitar el co
oumal of En
ga automatiz
culos no se
ngestionamie
) las opera
se registr el
Los datos s
elacin entre
RESIN Y
tabla siguien
os guiados
uencia, la di
ongestionam
ngineering fo
zada.
bloquean e
ento. La valid
aciones de
l tiempo de c
e muestran
e el tiempo d
Y CORREL
nte:

computari
sposicin fs
iento de los
or industry (a
entre s cuan
dez de este
la bodega.
congestionam
en la siguie
de congestio
LACIN.




225
izados y
sica de la
vehculos
agosto de
ndo viajan
supuesto
En cada
miento (el
ente tabla.
onamiento
UNIDAD V / REGRESIN Y CORRELACIN.







226
Nmero de
vehculos
Tiempo de congestionamiento
en minutos
Nmero de
vehculos
Tiempo de congestionamiento
en minutos
1
2
3
4
5
6
7
8
0
0
0.02
0.01
0.01
0.01
0.03
0.03
9
10
11
12
13
14
15
0.02
0.04
0.04
0.04
0.03
0.04
0.05

a) Construya un diagrama de dispersin para los datos.
b) Encuentre la lnea de mnimos cuadrados que relaciona el nmero de vehculos (x)
con el tiempo de congestionamiento (y).
c) Trace la lnea de mnimos cuadrados en la grfica del inciso a.

Solucin:


Problema: En la tabla siguiente se presentan los alargamientos de un resorte
correspondientes a fuerzas de diferente magnitud que lo deforman.

Puntos 1 2 3 4 5
Fuerza (kgf) : x 0 2 3 6 7
Longitud del resorte
(m) : y
0.120 0.153 0.170 0.225 0.260


y =0.00319118x - 0.00400000
-0.01
0
0.01
0.02
0.03
0.04
0.05
0.06
0 5 10 15 20
Tiempo de congestionamiento
Aproxime e

Solucin:


Problema:
acuerdo a

Punto
T ( K)
C
p

Aproxime e



esta informac
El calor es
la siguiente t
1
280
32.7
esta informac
cin por el m
specifico Cp
tabla:
2
650
45.4
cin por el m
0.000
0.050
0.100
0.150
0.200
0.250
0.300
0
UNIDAD
mtodo de m
/ ( kgmo cal p
3
1000
52.15
mtodo de m
y
2
D V / REGR
nimos cuadr
) ol del
3
Mn
4
1200
53.7
nimos cuadr
y =0.0194x +0.
R
2
=0.9875
4 6
RESIN Y
rados, usand
4 3
O n vara co
5
0 150
52.9
rados. Usand
1156
5
6 8
Y CORREL
do regresin

on la tempe
6
00 17
9 50
do regresin

LACIN.




227
lineal.
ratura de
700
0.3
lineal.
UNIDAD V / REGRESIN Y CORRELACIN.







228
Polinomio de segundo grado o cuadrtico (regresin polinomial)
2
0 1 2
y a a x a x = + +




= + +
= + +
= + +
i i i i i
i i i i i
i i i
y x x a x a x a
y x x a x a x a
y x a x a n a
2 4
2
3
1
2
0
3
2
2
1 0
2
2 1 0


Problema: Ajuste un polinomio de segundo orden a los datos de las dos columnas del
cuadro:
i
x
i
y
0
1
2
3
4
5
2.1
7.7
13.6
27.2
40.9
61.1


152.6

433 . 25
5 . 2
6
2
=
=
=
=
y
x
n
m

=
=
=
=
225
55
6 . 2 15
15
3
2
i
i
i
i
x
x
y
x

=
=
=
8 . 2488
6 . 585
979
2
4
i i
i i
i
y x
y x
x


8 . 2488 979 225 55
6 . 585 225 55 15
6 . 152 55 15 6
2 1 0
2 1 0
2 1 0
= + +
= + +
= + +
a a a
a a a
a a a


UNIDAD V / REGRESIN Y CORRELACIN.







229



Regresin lineal mltiple
2 2 1 1 0
x a x a a y + + =

Ahora tenemos el conjunto de ecuaciones normales:

0 1 1, 2 2,
2
0 1, 1 1, 2 1, 2, 1,
2
0 2, 1 1, 2, 2 2, 2,
i i i
i i i i i i
i i i i i i
a n a x a x y
a x a x a x x x y
a x a x x a x x y
+ + =
+ + =
+ + =






Problema: Veinte tipos de hojas de aceros procesadas en fro tienen diferentes
composiciones de cobre y temperaturas de templado. Al medir su dureza resultante se
obtuvieron los siguientes valores:



y =1.853x
2
+2.397x +2.464
R =0.998
0
10
20
30
40
50
60
70
0 1 2 3 4 5 6
UNIDAD V / REGRESIN Y CORRELACIN.







230
Se sabe que la dureza depende en forma lineal del contenido de u de cobre en % y de la
temperatura del templado v
v a u a a y
2 1 0
+ + =

Determine los parmetros
1 0
,a a y
2
a , siguiendo el criterio de los mnimos cuadrados.
Solucin:
A
12
1.2
13800
1.2
0.1712
1380
13800
1380
16020000
795.7
81.258
902230

:=
rref A ( )
1
0
0
0
1
0
0
0
1
161.336
32.969
0.086

=
y 161.336 32.969u + 0.086v :=

5.5 Error estndar de estimacin

Los segmentos de lnea verticales representan desviaciones de los puntos respecto a la
lnea en la siguiente figura. Se puede constatar, desplazando una regla dentro de la grfica
que es posible encontrar muchas lneas para las cuales la suma de las desviaciones (o
errores) es igual a 0, pero puede demostrarse que hay una y slo una lnea para la cual la
suma de los cuadrados de las desviaciones es mnima. La suma de los cuadrados de las
desviaciones se denomina suma de cuadrados del error y se denota con el smbolo SSE. La
lnea recibe el nombre de lnea de mnimos cuadrados, lnea de regresin o ecuacin de
prediccin de mnimos cuadrados.

UNIDAD V / REGRESIN Y CORRELACIN.







231


Grafica que muestra las desviaciones de los puntos respectos a una lnea recta.

Si queremos encontrar la lnea de mnimos cuadrados para un conjunto de datos,
suponemos que tenemos una muestra de n puntos de datos que se pueden identificar
mediante los correspondientes valores de x y y , digamos, (x
1
, y
1
) , (x
2
, y
2
), . . . , (x
n ,
Y
n
). El
modelo de lnea recta para la respuesta y en trminos de x es
0 1
y a a x = + +

La lnea de medias es
0 1
( ) E y a a x = + y la lnea ajustada, que esperamos encontrar, se
representa como
0 1
y a a x = + .

Entonces, la suma de los cuadrados de las desviaciones de los valores de y respecto a sus
valores estimados para toda las n puntos de datos es

[ ]
2
0 1
1
( )
n
i i
i
SSE y a a x
=
= +

Para una regresin lineal.


2
2
0 1 2
1
( )
n
i i i
i
SSE y a a x a x
=
= + +

Para una regresin polinomial.



En la mayor parte de las situaciones prcticas, la varianza del error aleatorio es
desconocida y se debe estimar a partir de los datos de muestra. Puesto que mide la
2

2

UNIDAD V / REGRESIN Y CORRELACIN.









232
variacin de los valores de respecto de la lnea
0 1
( ) E y a a x = + parece intuitivamente
razonable estimar dividiendo SSE entre un nmero apropiado.

Teorema
Sea entonces , si se satisfacen los supuestos, la estadstica
=
Tiene una distribucin ji cuadrada con v =(n 2 ) grados de libertad.


Entonces,

Donde E( ) =v =(n - 2).
Por tanto,


Y negamos a la conclusin de que s
2
es un estimador insesgado de .

El procedimiento empleado para calcular SSE puede dar pie a errores de redondeo
considerables. En el siguiente recuadro se presentan la frmula para s
2
y un mtodo para
calcular SSE.

Estimacin de

donde


y
2

). 2 /(
2
= n SSE s
2
2

SSE
=
2
2
) 2 (

s n
2
2 2
2

=
n
s

) (
2
) (
2
2
2

E
n
s E

=
2

2
2
2
) 2 (
2
) (

= n
n
s E
2

error para libertad de Grados


2
SSE
s =
2
=
n
SSE
( )

= =
xy yy i i
SS SS y y SSE

2
UNIDAD V / REGRESIN Y CORRELACIN.







233

Donde
1
a =

Advertencia: al realizar estos clculos tal vez se sienta tentado a redondear los valores
calculados de y Asegrese de conservar por lo menos seis cifras
significativas para cada una de estas cantidades a fin de evitar un error importante en el
clculo de SSE.


5.6 Coeficiente de determinacin y correlacin

5.6.1 Coeficiente de determinacin de la muestra
Otra forma de medir la contribucin de x a la prediccin de y es considerar hasta dnde
pueden reducirse los errores de la prediccin de y aprovechando la informacin
proporcionada por x.


a) Diagrama de dispersin de los datos
b) Supuesto: x no contribuye con informacin a la prediccin de ;
c) Supuesto: x contribuye con informacin a la prediccin de ;
0 1
y a a x = +

Como ilustracin, supongamos que una muestra de datos tiene el diagrama de dispersin
que se muestra en la figura anterior del inciso a. Si suponemos que x no contribuye con
informacin a la prediccin de y, la mejor prediccin de y ser la media de la muestra, y, que
se grafica como una lnea horizontal en la figura inciso b.

( )


= =
n
y
y y y SS
i
i i yy
2
2 2
) (

,
yy
SS .
xy
SS
y y y =
y
UNIDAD V / REGRESIN Y CORRELACIN.







234
Los segmentos de lnea verticales trazados en esa figura son las desviaciones de los puntos
respecto de la media y. Observe que la suma de los cuadrados de las desviaciones para el
modelo:

es .

Supongamos ahora que ajustamos una lnea de mnimos cuadrados al mismo conjunto de
datos y marcamos las desviaciones de los puntos respecto de la lnea como se hace en la
figura del inciso c.

Compare las desviaciones respecto de las lneas de prediccin en los incisos b y c de la
figura anterior.

Es evidente que:
1. Si x contribuye con poca o ninguna informacin a la prediccin de , las sumas de
los cuadrados de las desviaciones para las dos lneas,


2. Si x contribuye con informacin a la prediccin de , entonces SSE ser menor que
SS
yy
. De hecho, si todos los puntos caen en la lnea de mnimos cuadrados, entonces
SSE =0.
Una forma cmoda de medir qu tan bien se desempea la ecuacin de mnimos
cuadrados
0 1
y a a x = + como predictora de y es calcular la reduccin en la suma de los
cuadrados de las desviaciones que se puede atribuir a x, expresada como una proporcin de
SS
yy
. Esta cantidad, llamada coeficiente de determinacin, es

En la regresin lineal simple se puede demostrar que esta cantidad es igual al cuadrado del
coeficiente de correlacin lineal simple r.

y y =

=
2
) ( y y SS
i yy
y

=
2
) ( y y SS
i yy

=
2
) (
i i
y y SSE
y
yy
yy
SS
SSE SS
UNIDAD V / REGRESIN Y CORRELACIN.







235

Definicin:
El coeficiente de determinacin es
yy yy
yy
SS
SSE
SS
SSE SS
r =

= 1
2

Este coeficiente representa la proporcin de la suma de los cuadrados de las desviaciones
de los valores de y respecto de sus valores estimados ( ) y
que se puede atribuir a una
relacin lineal y y x . (En una regresin lineal simple, este coeficiente tambin puede
calcularse elevando al cuadrado el coeficiente de correlacin r )

Observe que r
2
siempre est entre 1 y 1, porque r est entre -1 y +1. Por tanto, r
2
=0.60
significa que la suma de los cuadrados de las desviaciones de los valores de y respecto de
sus valores estimados se redujo en 60% al utilizar , en lugar de , para predecir y. O bien,
en trminos ms prcticos, r
2
=0.60 implica que el modelo de lnea recta que relaciona a y
con x puede explicar (o dar cuenta de) 60% de la variacin presente en la muestra de
valores de y.

Problema: Calcule el coeficiente de determinacin para el ejemplo de compresin de ais-
lante. Los datos se repiten en la tabla siguiente:

Presin Compresin
X, 10 libras
por pulg
2
Y, 0.1 de
pulgada
1
2
3
4
5
1
1
2
2
4


y y
UNIDAD V / REGRESIN Y CORRELACIN.







236

( ) ( )
( )
2
2
2
2
2
10
26 6
5 5
1.10
6.0 1.1
0.82 82%
6.0
i
yy i
i i
yy
yy
y
SS y
SSE y y
SS SSE
r
SS
= = =
= =


= = = =



(Observe que este valor tambin podra haberse obtenido elevando al cuadrado el
coeficiente de correlacin r =0.904.)

Ahora sabemos que al usar la presin x para predecir la compresin y con la lnea de
mnimos cuadrados =-0.1 +0.7x, la suma total de los cuadrados de las desviaciones de
los cinco valores de y respecto de sus valores estimados se redujo en 82% gracias al
empleo del predictor lineal . Es decir, 82% de la variacin de los valores de compresin de
la muestra se puede explicar mediante la lnea de mnimos cuadrados.


Interpretacin prctica del coeficiente de determinacin, r
2
Aproximadamente 100(r
2
) % de la suma total de los cuadrados de las desviaciones de los
valores y de la muestra respecto de su media se puede explicar por ( o atribuirse a) el
empleo de x para predecir y con el modelo de lnea recta.

En situaciones en las que un modelo de regresin de lnea recta resulta ser un predictor
estadsticamente satisfactorio de y, el valor de r
2
puede servir al analista de regresin como
gua en la bsqueda de mejores y ms tiles modelos. Por ejemplo, Crandall y Cedercreutz
(1976) emplean un modelo lineal simple para relacionar el costo del trabajo mecnico
(calefaccin, ventilacin y plomera) en la construccin con el rea de piso.




y
y
y
UNIDAD V / REGRESIN Y CORRELACIN.







237
Con base en los datos asociados a la construccin de 26 fbricas y bodegas, se obtuvo la
ecuacin de prediccin de mnimos cuadrados que se indica en la figura siguiente. Se lleg
a la conclusin de que el rea de piso y el costo mecnico tienen una relacin lineal, ya que
la estadstica t (para probar H
o
:
1
0 a = ) produjo un valor de 3.61, el cual es significativo con
un
0
a tan pequeo como 0.002.

Por tanto, el rea de piso debe servirnos para predecir el costo mecnico de una fbrica o
bodega. Sin embargo, el valor del coeficiente de determinacin r
2
fue de 0.35. Esto nos dice
que slo 35% de la variacin en los costos mecnicos se puede atribuir a las diferencias en
el rea de piso.

Este valor relativamente pequeo de r
2
impuls a Crandall y Cedercreutz a incluir en el
modelo otras variables independientes (por ejemplo, volumen, cantidad de vidrio) en un
intento por dar cuenta de una porcin significativa del 65% restante de la variacin en el
costo mecnico que no puede explicarse con el rea de piso.


Modelo lineal simple que relaciona el costo con el rea de piso.







UNIDAD V / REGRESIN Y CORRELACIN.







238
5.6.2 Coeficiente de correlacin de la muestra
La pendiente de mnimos cuadrados,
1
a

proporciona informacin til sobre la relacin o
"asociacin" lineal entre dos variables y y x. Otra forma de medir la asociacin es calcular el
coeficiente de correlacin r del momento de producto de Pearson. El coeficiente de
correlacin, que se define en el recuadro, ofrece una medida cuantitativa de la fortaleza de la
relacin lineal entre x y y en la muestra, como lo hace la pendiente de mnimos cuadrados
1
a . Sin embargo, a diferencia de la pendiente, el coeficiente de correlacin r es
adimensional. El valor de r siempre est entre -1 y +1, sin importar en qu unidades se
exprese x y y..

Definicin :
El coeficiente de correlacin r del momento de producto de Pearson es una medida de la
fortaleza de la relacin lineal entre dos variables x y y en la muestra. El coeficiente se
calcula ( para una muestra de n mediciones de x y y ) como sigue
yy xx
xy
SS SS
SS
r =


Puesto que tanto r como
1
a proporcionan informacin acerca de la utilidad del modelo, no
debe sorprendemos que las frmulas mediante las cuales se calculan sean similares. En
particular, observe que SS
xy
aparece en los numeradores de ambas expresiones y que, dado
que ambos denominadores siempre son positivos, r y
1
a siempre tienen el mismo signo
(ambos positivos o bien ambos negativos). Un valor de r cercano o igual a 0 implica poca o
ninguna relacin lineal entre y y x.

En contraste, cuanto ms se acerque r a 1 o -1, ms fuerte ser la relacin lineal entre x y y.
Y, si r =1 o r =-1, todos los puntos caern exactamente en la lnea de mnimos cuadrados.
Un valor positivo de r implica que y aumenta cuando x aumenta; un valor negativo implica
que y disminuye cuando x aumenta.




UNIDAD V / REGRESIN Y CORRELACIN.







239
Problema: En la tabla siguiente .Calcule el coeficiente de correlacin r entre la presin x y la
compresin y.
Presin Compresin
X, 10 libras por pulg
2
Y, 0.1 de pulgada
1
2
3
4
5
1
1
2
2
4

Solucin:
SS
xy
=7, SS
xx
=10, : y .

Entonces,
( ) ( )
2
2
2
10
26 6
5 5
i
yy i
y
SS y = = =



y el coeficiente de correlacin es



Por tanto, la presin y la magnitud de la compresin tienen una correlacin elevada, al
menos para esta muestra de cinco trozos de material aislante. La implicacin es que existe
una relacin lineal positiva fuerte entre estas variables. No obstante, debemos tener cuidado
de no precipitamos a conclusiones injustificadas. Por ejemplo, el inventor de un nuevo
material aislante podra sentirse tentado a concluir que un aumento en la presin siempre
producir una mayor compresin. La implicacin de semejante conclusin es que existe una
relacin causal entre las dos variables. Sin embargo, una correlacin elevada no implica
causalidad. Muchos otros factores, como la temperatura y la humedad, podran contribuir al
aumento en el grado de compresin que se produce en los especmenes.

=10
i
y

= 26
2
i
y
( )( )
904 . 0
746 . 7
7
6 10
7
= = = =
yy xx
xy
SS SS
SS
r
UNIDAD V / REGRESIN Y CORRELACIN.







240
Advertencia
Una correlacin elevada no implica causalidad. Si se observa un valor positivo o negativo
grande del coeficiente de correlacin r de la muestra, no es correcto llegar a la conclusin de
que un cambio en x causa un cambio en y. La nica conclusin puede existir una tendencia
lineal entre x y .

Tenga presente que el coeficiente de correlacin r mide la correlacin entre los valores x y
los valores y de la muestra, y que existe un coeficiente de correlacin lineal similar para la
poblacin de la cual se seleccionaron los puntos de datos.

El coeficiente de correlacin de poblacin se denota con el smbolo (rho). Como era
de esperar, se estima con la estadstica de muestra correspondiente, r . Por otro lado, en
lugar de estimar , podramos querer probar la hiptesis :

H
0
: =0 contra
H
a
: ,

es decir, probar la hiptesis de que x no contribuye con informacin a la prediccin de y
empleando el modelo de lnea recta contra la alternativa de que las dos variables tienen por
10 menos una relacin lineal.

La nica diferencia real entre la pendiente de mnimos cuadrados
1
a

y el coeficiente de
correlacin r es la escala de medicin. Por tanto, la informacin que proporcionan acerca de
la utilidad del modelo de mnimos cuadrados es en cierta medida redundante. Adems, la
pendiente
1
a

proporciona informacin adicional sobre la magnitud del incremento (o
decremento) de y con cada incremento unitario de x.

Por esta razn, recomendamos utilizar la pendiente para hacer inferencias acerca de la
existencia de una relacin lineal positiva o negativa entre dos variables.

Para quienes prefieren probar si hay o no una relacin lineal entre dos variables empleando
el coeficiente de correlacin r, bosquejamos el procedimiento en el recuadro.

y

0
UNIDAD V / REGRESIN Y CORRELACIN.







241
Prueba de hiptesis para la correlacin lineal
Prueba de un cola Prueba de dos colas
1
: 0
: 0
( 0)
o
H
H

=
>
<

1
: 0
: 0
o
H
H


Estadstica de prueba:
2
2
1
r n
t
r



Regin de rechazo:
( )
t t
t t

>
<

Regin de rechazo:
/2
t t

>
Donde la distribucin de t depende de (n 2) gl .

Problema: Es importante que los investigadores cientficos en el rea de los productos
forestales sean capaces de estudiar la correlacin entre la anatoma y las propiedades
mecnicas de los rboles. De acuerdo con el estudio Quantitative Anatomical Characteristics
of Plantation Grown Loblolly Pine (pinus Taeda L.) and Cottonwood (populus deltoides Bart.
Ex Marsh.) and Their Relationship to Mechanical Properties que llev a cabo el
Departamento de Silvicultura y Productos Forestales del Instituto Politcnico y Universidad
Estatal de Virginia, un experimento en el que se seleccionaron aleatoriamente 29 pinos
loblolly para investigacin que produjeron los datos de la tabla siguiente sobre la gravedad
especfica en gramos /cm
3
y el mdulo de ruptura en kilo pascales (kPa). Calcule e interprete
el coeficiente de correlacin muestra!.

Gravedad
especifica, x
3
( / ) g cm
Modulo de
ruptura, y
(kPa)
Gravedad
especifica, x
3
( / ) g cm
Modulo de
ruptura, y
(kPa)
0.414
0.383
0.399
0.402
0.442
0.422
29186
29266
26215
30162
38867
37831
0.581
0.557
0.550
0.531
0.550
0.556
85156
69571
84160
73466
78610
67657
UNIDAD V / REGRESIN Y CORRELACIN.







242
0.466
0.500
0.514
0.530
0.569
0.558
0.577
0.572
0.548
44576
46097
59698
67705
66088
78486
89869
77369
67095
0.523
0.602
0.569
0.544
0.557
0.530
0.547
0.585
74017
87291
86836
82540
81699
82096
75657
80490

Solucin
0.11273; 11807324786
34422.75972
xx yy
xy
S S
S
= =
=

34422.75972
0.9435
(0.11273)(11807324786)
r = =


Un coeficiente de correlacin de 0.9435 indica una buena relacin lineal entre X y Y. Como
r
2
=0.8902, podemos decir que aproximadamente 89% de la variacin en los valores de Y
se explica por una relacin lineal con X.

Una prueba de la hiptesis especial =0 contra una alternativa apropiada es equivalente
a probar para el modelo de regresin lineal simple que utilizan la distribucin t con
n 2 grados de libertad o la distribucin F con 1 y n - 2 grados de libertad. Sin embargo, si
se desea evitar el procedimiento del anlisis de varianza y calcular slo el coeficiente de
correlacin muestral, se puede verificar que el valor t dado por


Tambin se puede escribir como que, como antes, es un valor de la
estadstica T que tiene una distribucin t con n - 2 grados de libertad.

0 =
s
SSR
S
s
b
t
xx
= =
2
1
2
r
n r
t

=
UNIDAD V / REGRESIN Y CORRELACIN.







243
Problema: Para los datos del ejemplo anterior pruebe la hiptesis de que no hay una
asociacin lineal entre las variables.

Solucin:
1
1. : 0
2. : 0
3. =0.05
4. Regin critica: 2.052 y 2.052
o
H
H
t t

< >

( )
2
5. Calculos
0.9435( 27)
14.79, 0.001
1 0.9435
t P = = <



6. Decisin
Rechazar la hiptesis de no asociacin lineal.

Una prueba de la hiptesis ms general =
o
contra una alternativa adecuada se lleva a
cabo fcilmente a partir de la informacin muestral. Si X y Y siguen la distribucin normal
bivariada, la cantidad


Es un valor de una variable aleatoria que sigue de manera aproximada la distribucin normal
con media (1/2) In [(1 + ) / (1- )] y varianza 1/ (n - 3). De esta forma el procedimiento de
prueba es calcular





+
r
r
1
1
ln
2
1

( )( )
( )( )

+
+
=

+
=
0
0
0
0
1 1
1 1
ln
2
3
1
1
ln
1
1
ln
2
3

r
r n
r
r n
z
UNIDAD V / REGRESIN Y CORRELACIN.







244
y comparar con los puntos crticos de la distribucin normal estndar.

Problema: Para los datos del ejemplo antes de que acabamos de resolver pruebe la
hiptesis nula contra la alternativa de que . Utilice un nivel de significancia
de 0.05

Solucin:
1.
2.
3.
4. Regin critica :
5. Clculos

P =0.0655
6. Decisin : Hay en realidad alguna evidencia de que el coeficiente de
correlacin excede 0.9

Relacin no lineal.



Diagrama de dispersin que muestra correlacin cero




9 . 0 = 9 . 0 >
9 . 0 : .
0
= H
9 . 0 :
1
> H
05 . 0 =
645 . 1 > z
51 . 1
9 . 1 ) 9435 . 0 1 (
1 . 0 ) 9435 . 0 1 (
ln
2
26
=

+
= z
UNIDAD V / REGRESIN Y CORRELACIN.







245
5.7. Problemas prcticos de ajustes de curvas

Problema: Partir de un estudio experimental acerca de la estabilidad de arcilla muy platica,
se observo que el contenido de agua para moldeo con densidad optima dependa
linealmente de los porcentajes de cal y puzolana mezclado con la arcilla. Se tuvieron as los
resultados que dan abajo. Ajuste una ecuacin de la forma:
v a u a a y
2 1 0
+ + =


Solucin:


A
7
45
62.5
45
407.5
291.25
62.5
291.25
816.25
206.4
1367.85
1789.65

:=
rref A ( )
1
0
0
0
1
0
0
0
1
28.692
0.257
0.096

=
y 28.692 0.257u + 0.096v :=



Problema: Al medir la velocidad (con un tubo de Pitot) en una tubera circular de dimetro
interior de 20 cm, se encontr la siguiente informacin:

UNIDAD V / REGRESIN Y CORRELACIN.







246
V ( cm / s ) 600 550 450 312 240
R ( cm) 0 3 5 7 8

Donde R es la distancia en cm. medida a partir del centro del tubo.
a) Obtenga la curva v =f(R) que aproxima estos datos experimentales



b) Calcule la velocidad en el punto R =4 cm.


Problema: Si aproxima la funcin dada abajo por un polinomio de segundo grado

y =-5.3472x
2
- 3.0667x +601.71
0
100
200
300
400
500
600
700
0 2 4 6 8 10
UNIDAD V / REGRESIN Y CORRELACIN.







247


Problema: En la siguiente tabla, r es la resistencia de una bobina en ohms y T la temperatura
de la bobina en C. Por mnimos cuadrados determine el mejor polinomio lineal que
represente la funcin dada:





Problema: En una reaccin gaseosa de expansin a volumen constante, se observa que la
presin del reactor (batch) aumenta con el tiempo de reaccin segn se muestra en la tabla
de abajo.

Que grado de polinomio aproxima mejor la funcin P =f(t) ?

y =-8.8218x
2
- 1412.1x +39694
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
0 5 10 15 20
y =35.744x - 361.8
0
10
20
30
40
50
60
70
80
90
100
0 5 10 15
UNIDAD V / REGRESIN Y CORRELACIN.







248




Problema: ajstese una lnea recta a los valores x y y de la tabla siguiente:
i
x
i
y
1
2
3
4
5
6
7
0.5
2.5
2.0
4.0
3.5
6.0
5.5

Solucin:



y =1.2386x +0.8702
0
0.5
1
1.5
2
2.5
3
3.5
0 0.5 1 1.5 2
y =0.5234x
2
+0.479x +1.0089
0
0.5
1
1.5
2
2.5
3
3.5
0 0.5 1 1.5 2
0
2
4
6
8
0 2 4 6 8
UNIDAD V / REGRESIN Y CORRELACIN.







249
Ejercicios propuestos

P1. En cada caso, grafique la lnea que pasa por los puntos.
a. (0, 2) Y (2, 6)
b. (0, 4) Y (2, 6)
c. (0,-2) y (-1,-6)
d. (0, -4) Y (3, -7)

P2. Grafique las siguientes lneas:
a. y =3 +2x
b. y =l +x
c. y =- 2 +3x
d. y =5x
e. y =4 - 2x

P3. Dos procesos para el taladrado hidrulico de roca son el taladrado en seco y el taladrado
hmedo. En un agujero seco se introduce aire comprimido por las varillas de taladrar para
expulsar las partculas e impulsar el martillo; en un agujero hmedo se introduce agua a
presin. Se realiz un experimento para determinar si el tiempo y que se requiere para
taladrar una distancia de cinco pies en roca aumenta con la profundidad x (The American
Statistician, febrero de 1991). Los resultados para una porcin del experimento se muestran
en la siguiente tabla.

Profundidad a la que se inicia el taladro x,
pies
Tiempo para taladrar 5 pies , minutos
0
25
50
75
100
125
150
175
4.90
7.41
6.19
5.57
5.17
6.89
7.05
7.11
y
UNIDAD V / REGRESIN Y CORRELACIN.







250
200
225
250
275
300
325
350
375
395
6.19
8.28
4.84
8.29
8.91
8.54
11.79
12.12
11.02

a) Elabore un diagrama de dispersin para datos.
b) Encuentre la ecuacin de prediccin de mnimos cuadrados.
c) Grafique la lnea de mnimos cuadrados en el diagrama de dispersin
d) Interprete los valores de
0
a

y
1
a

P4. Se realiz un estudio para modelar el desempeo trmico de los tubos con aletas
integrales empleados en las industrias de refrigeracin y de proceso (Journal of Heat
Transfer, agosto de 1990). En el experimento se utilizaron 24 tubos con aletas integrales de
fabricacin especial, con aletas rectangulares hechas de cobre. Se liber vapor hacia abajo
en cada tubo y se midi el coeficiente de transferencia de calor del lado del vapor (con base
en el rea superficial exterior del tubo). La variable dependiente en este estudio es la tasa de
promocin de la transferencia de calor y, definida como el cociente entre el coeficiente del
lado del vapor del tubo con aletas y el coeficiente del lado del vapor de un tubo liso,
evaluados a la misma temperatura. En teora, la transferencia de calor est relacionada con
el rea de la parte superior del tubo que no est "inundada" por la condensacin del vapor.
Los datos de la tabla son los valores de proporcin de rea no inundada (x) y promocin de
la transferencia de calor (y) registrados para los 24 tubos con aletas integrales.

Proporcin de rea
no inundada, x
Promocin de la transferencia de
calor,
1.93
1.95
1.78
1.64
4.4
5.3
4.5
4.5
y
UNIDAD V / REGRESIN Y CORRELACIN.







251
1.54
1.32
2.12
1.88
1.70
1.58
2.47
2.37
2.00
1.77
1.62
2.77
2.47
2.24
1.32
1.26
1.21
2.26
2.04
1.88
3.7
2.8
6.1
4.9
4.9
4.1
7.0
6.7
5.2
4.7
4.2
6.0
5.8
5.2
3.5
3.2
2.9
5.3
5.1
4.6

a) Determine la lnea de mnimos cuadrados que relaciona la promocin de la
transferencia de calor con la proporcin de rea no inundada x.
b) Grafique los puntos de datos y trace la lnea de mnimos cuadrados como verificacin
de sus clculos.
c) Interprete los valores de
0
a

y
1
a
.
P5. La Comisin Federal de Comunicaciones (FCC) de Estados Unidos especifica que las
emisiones electromagnticas radiadas por dispositivos digitales se deben medir en un sitio
de prueba de campo abierto. A fin de verificar la aceptabilidad de un sitio de prueba es
preciso evaluar la atenuacin del sitio (es decir, la prdida de transmisin desde la entrada
de un dipolo de media onda hasta la salida de otro cuando ambos dipolos se colocan sobre
el plano de tierra).


y
UNIDAD V / REGRESIN Y CORRELACIN.







252
Un estudio realizado en un sitio de prueba en Fort Collins, Colorado, produjo los siguientes
datos de atenuacin del sitio (en decibeles) y frecuencia de transmisin (en megahertz) para
dipolos a una distancia de 3 metros.
Frecuencia de
Transmisin X, MHZ
Atenuacin del sitio ,dBL
50
100
200
300
400
500
600
700
800
900
1000
11.5
15.8
18.2
22.6
26.2
27.1
29.5
30.7
31.3
32.6
34.9

P6. Como parte de un estudio sobre la rapidez de combustin de grafito artificial en un flujo
de aire hmedo, se llevo a cabo un experimento con miras a investigar la difusividad del
oxgeno a travs de una mezcla de vapor de agua (Combustion and Flame, vol. 50, 1983).
Se prepararon muestras de mezclas de nitrgeno y oxgeno con una fraccin molar de agua
de 0.017 a nueve temperaturas distintas, y se midi la difusividad del oxgeno en cada una.
Los datos se reproducen en la siguiente tabla.
Temperatura Difusividad de oxigeno
x Y
1,000 1.69
1,100 1.99
1,200 2.31
1,300 2.65
1,400 3.01
1,500 3.39
1,600 3.79
1,700 4.21
1,800 4.64

y
UNIDAD V / REGRESIN Y CORRELACIN.







253
a) Grafique los puntos de datos en un diagrama de dispersin.
b) Ajuste un modelo lineal simple que relacione la difusividad media del oxgeno,
, con la temperatura, x. Interprete las estimaciones de los parmetros del modelo.
c) Calcule SSE y S
2

P7. El equilibrio termogravimtrico (TG ) es una nueva tcnica que se desarroll para evaluar
el comportamiento trmico de los compuestos qumicos. Abou El Naga y Salem (1986)
compararon la tcnica TG con el mtodo estndar de evaluar la estabilidad respecto a la
termooxidacin de aceite, base y sus mezclas aditivas (por ejemplo, aceites de
transformador, de turbina y de transmisin). En cada espcimen de una muestra de 10
aceites base se determin la cantidad y de compuestos oxidativos formados en el punto de
oxidacin empleando la tcnica TG, as como el porcentaje total de productos de oxidacin x
empleando el mtodo estndar. Los resultados del experimento se muestran en la siguiente
tabla.
Aceite
base
Tcnica TG: cantidad de
compuestos oxidativos , % en
peso
Mtodo estndar:
Total de productos de oxidacin
X, %
1
2
3
4
5
6
7
8
9
10
25.4
27.11
28.0
17.9
18.9
22.9
30.8
18.6
24.4
29.8
2.3
2.5
2.65
1.3
1.45
1.9
3.3
1.4
2.1
2.9


) (y E
y
UNIDAD V / REGRESIN Y CORRELACIN.







254
a) Ajuste un modelo lineal simple que relacione la cantidad y de compuestos oxidativas
determinados por la tcnica TG con el porcentaje total de productos de oxidacin x
determinados por el mtodo estndar.
b) Grafique los puntos de datos y la lnea de mnimos cuadrados en un diagrama de
dispersin.
d) Interprete los valores de
0
a

y
1
a
c) Calcule SSE, S
2
y s.
d) Interprete el valor de s.
































ANEXOS
TABLAS

z
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
1,
1,
1,
1,
1,
1,
1,
1,
1,
1,
2,
2,
2,
2,
2,
2,
2,
2,
2,
2,
3,
3,
3,
3,
3,
3,

APNDIC
Ta

z 0,00
,0
,1
,2
,3
,4
0,5000
0,5398
0,5793
0,6179
0,6554
,5
,6
,7
,8
,9
0,6915
0,7257
0,7580
0,7881
0,8159
,0
,1
,2
,3
,4
0,8413
0,8643
0,8849
0,9032
0,9192
,5
,6
,7
,8
,9
0,9332
0,9452
0,9554
0,9641
0,9713
,0
,1
,2
,3
,4
0,9772
0,9821
0,9861
0,9893
0,9918
,5
,6
,7
,8
,9
0,9938
0,9953
0,9965
0,9974
0,9981
,0
,1
,2
,3
,4
0,9987
0,9990
0,9993
0,9995
0,9997
,5 0,9998

CE A
bla de la dis
0,01 0
0,5040
0,5438
0,5832
0,6217
0,6591
0,
0,
0,
0,
0,
0,6950
0,7291
0,7611
0,7910
0,8186
0,
0,
0,
0,
0,
0,8438
0,8665
0,8869
0,9049
0,9207
0,
0,
0,
0,
0,
0,9345
0,9463
0,9564
0,9649
0,9719
0,
0,
0,
0,
0,
0,9778
0,9826
0,9864
0,9896
0,9920
0,
0,
0,
0,
0,
0,9940
0,9955
0,9966
0,9975
0,9982
0,
0,
0,
0,
0,
0,9987
0,9991
0,9993
0,9995
0.9997
0,
0,
0,
0,
0,
0,9998 0,
stribucin n
0,02 0,03
,5080
,5478
,5871
,6255
,6628
0,512
0,55
0,59
0,629
0,666
,6985
,7324
,7642
,7939
,8212
0,70
0,735
0,767
0,796
0,823
,8461
,8686
,8888
,9066
,9222
0,848
0,870
0,890
0,908
0,923
,9357
,9474
,9573
,9656
,9726
0,937
0,948
0,958
0,966
0,973
,9783
,9830
,9868
,9898
,9922
0,978
0,993
0,987
0,990
0,992
,9941
,9956
,9967
,9976
,9982
0,994
0,995
0,996
0,997
0,998
,9987
,9991
,9994
,9995
,9997
0,998
0,999
0,999
0,999
0,999
,9999 0,999


normal (rea
3 0,04
20
17
10
93
64
0,5160
0,5557
0,5948
0,6331
0,6700
19
57
73
67
38
0,7054
0,7389
0,7703
0,7995
0,8264
85
08
07
82
36
0,8508
0,8729
0,8925
0,9099
0,9251
70
84
82
64
32
0,9382
0,9495
0,9591
0,9671
0,9738
88
34
71
01
25
0,9793
0,9838
0,9875
0,9904
0,9927
43
57
68
77
83
0,9945
0,9959
0,9969
0,9977
0,9984
88
91
94
96
97
0,9988
0,9992
0,9994
0,9996
0,9997
99 0,9999
a bajo la cur


0,05 0
0,5199
0,5596
0,5987
0,6368
0,6736
0
0
0
0
0
0,7088
0,7422
0,7734
0,8023
0,8289
0
0
0
0
0
0,8531
0,8749
0,8944
0,9115
0,9265
0
0
0
0
0
0,9394
0,9505
0,9599
0,9678
0,9744
0
0
0
0
0
0,9798
0,9842
0,9878
0,9906
0,9929
0
0
0
0
0
0,9946
0,9960
0,9970
0,9978
0,9984
0
0
0
0
0
0,9989
0,9992
0,9994
0,9996
0,9997
0
0
0
0
0
0,9999 0
ANEX
rva normal)
0,06 0,07
,5239
,5636
,6026
,6406
,6772
0,527
0,567
0,606
0,644
0,680
,7123
,7454
,7764
,8051
,8315
0,715
0,748
0,779
0,807
0,834
,8554
,8770
,8962
,9131
,9278
0,857
0,879
0,898
0,914
0,929
,9406
,9515
,9608
,9686
,9750
0,94
0,952
0,96
0,969
0,975
,9803
,9846
,9881
,9909
,9931
0,980
0,985
0,988
0,99
0,993
,9948
,9961
,9971
,9979
,9985
0,994
0,996
0,997
0,997
0,998
,9989
,9992
,9994
,9996
,9997
0,998
0,999
0,999
0,999
0,999
,9999 0,999
XOS / TAB


7 0,08
79
75
64
43
08
0,5319
0,5714
0,6103
0,6480
0,6844
57
86
94
78
40
0,7190
0,7517
0,7823
0,8106
0,8364
77
90
80
47
92
0,8599
0,8810
0,8997
0,9162
0,9306
18
25
16
93
56
0,9429
0,9535
0,9625
0,9699
0,9761
08
50
84
11
32
0,9812
0,9854
0,9887
0,9913
0,9934
49
62
72
79
85
0,9951
0,9963
0,9973
0,9980
0,9986
89
92
95
96
97
0,9990
0,9993
0,9995
0,9996
0,9997
99 0,9999
BLAS

256
0,09
0,5359
0,5753
0,6141
0,6517
0,6879

0,7224
0,7549
0,7852
0,8133
0,8389

0,8621
0,8830
0,9015
0,9177
0,9319

0,9441
0,9545
0,9633
0,9706
0,9767

0,9817
0,9857
0,9890
0,9916
0,9936

0,9952
0,9964
0,9974
0,9981
0,9986

0,9990
0,9993
0,9995
0,9997
0,9998

0,9999

ANEXOS / TABLAS



257

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-3.4
-3.3
-3.2
-3.1
-3.0
0.0003
0.0005
0.007
0.0010
0.0013
0.0003
0.0005
0.0007
0.0009
0.0013
0.0003
0.0005
0.0006
0.0009
0.0013
0.0003
0.0004
0.0006
0.0009
0.0012
0.0003
0.0004
0.0006
0.0008
0.0012
0.0003
0.0004
0.0006
0.0008
0.0011
0.0003
0.0004
0.0006
0.0008
0.0011
0.0003
0.0004
0.0005
0.0008
0.0011
0.0003
0.0004
0.0005
0.0007
0.0010
0.0002
0.0003
0.0005
0.0007
0.0010
-2.9
-2.8
-2.7
-2.6
-2.5
0.0019
0.0026
0.0035
0.0047
0.0062
0.0018
0.0025
0.0034
0.0045
0.0060
0.0017
0.0024
0.0033
0.0044
0.0059
0.0017
0.0023
0.0032
0.0043
0.0057
0.0016
0.0023
0.0031
0.0041
0.0055
0.0016
0.0022
0.0030
0.0040
0.0054
0.0015
0.0021
0.0029
0.0039
0.0052
0.0015
0.0021
0.0028
0.0038
0.0051
0.0014
0.0020
0.0027
0.0037
0.0049
0.0014
0.0019
0.0026
0.0036
0.0048
-2.4
-2.3
-2.2
-2.1
-2.0
0.0082
0.0107
0.0139
0.0179
0.0228
0.0080
0.0140
0.0136
0.0174
0.0222
0.0078
0.0102
0.0132
0.0170
0.0217
0.0075
0.0099
0.0129
0.0166
0.0212
0.0073
0.0096
0.0125
0.0162
0.0207
0.0071
0.0094
0.0122
0.0158
0.0202
0.0069
0.0091
0.0119
0.0154
0.0197
0.0068
0.0089
0.0116
0.0150
0.0192
0.0066
0.0087
0.0113
0.0146
0.0188
0.0064
0.0084
0.110
0.0143
0.0183
-1.9
-1.8
-1.7
-1.6
-1.5
0.0287
0.0359
0.0446
0.0548
0.0668
0.0281
0.0352
0.0436
0.0537
0.0655
0.0274
0.0344
0.0427
0.0526
0.0643
0.0268
0.0336
0.0418
0.0516
0.0630
0.0262
0.0329
0.0409
0.0505
0.0618
0.0256
0.0322
0.0401
0.0495
0.0606
0.0250
0.0314
0.0392
0.0485
0.0594
0.0244
0.0307
0.0384
0.0475
0.0582
0.0239
0.0301
0.0375
0.0465
0.0571
0.0233
0.0294
0.0367
0.0455
0.0559
-1.4
-1.3
-1.2
-1.1
-1.0
0.0808
0.0968
0.1151
0.1357
0.1587
0.0793
0.0951
0.1131
0.1335
0.1562
0.0778
0.0934
0.1112
0.1314
0.1539
0.0764
0.0918
0.1093
0.1292
0.1515
0.0749
0.0901
0.1075
0.1271
0.1492
0.0735
0.0885
0.1056
0.1251
0.1469
0.0722
0.0869
0.1038
0.1230
0.1446
0.0708
0.0853
0.1020
0.1210
0.1423
0.0694
0.0838
0.1003
0.1190
0.1401
0.0681
0.0823
0.0985
0.1170
0.1379
-0.9
-0.8
-0.7
-0.6
-0.5
0.1841
0.2119
0.2420
0.2743
0.3085
0.1814
0.2090
0.2389
0.2709
0.3050
0.1788
0.2061
0.2358
0.2676
0.3015
0.1762
0.2033
0.2327
0.2643
0.2981
0.1736
0.2005
0.2296
0.2611
0.2946
0.1711
0.1977
0.2266
0.2566
0.2578
0.1685
0.1949
0.2236
0.2546
0.2877
0.1660
0.1922
0.2206
0.2514
0.2843
0.1635
0.1894
0.2177
0.2483
0.2810
0.1611
0.1867
0.2148
0.2451
0.2776
-0.4
-0.3
-0.2
-0.1
-0.0
0.3446
0.3821
0.4207
0.4602
0.5000
0.3409
0.3783
0.4168
0.4562
04960
0.3372
0.3745
0.4129
0.4522
0.4920
0.3336
0.3707
0.4090
0.4483
0.4880
0.3300
0.3669
0.4052
0.4443
0.4840
0.3264
0.3632
0.4013
0.4404
0.4801
0.3228
0.3594
0.3974
0.4364
0.4761
0.3192
0.3557
0.3936
0.4325
0.4721
0.3156
0.3520
0.3897
0.4286
0.4681
0.3121
0.3483
0.3859
0.4247
0.4641





ANEXOS / TABLAS



258
APNDICE B

Valores crticos de la distribucin t



V

0.40 0.30 0.20 0.15 0.10 0.05 0.025
1
2
3
4
5
0.325
0.289
0.277
0.271
0.267
0.727
0.617
0.584
0.569
0.559
1.376
1.061
0.978
0.941
0.920
1.963
1.386
1.250
1.190
1.156
3.078
1.886
1.638
1.533
1.476
6.314
2.920
2.353
2.132
2.015
12.706
4.303
3.182
2.776
2.571
6
7
8
9
10
0.265
0.263
0.262
0.261
0.260
0.553
0.549
0.546
0.543
0.542
0.906
0.896
0.889
0.883
0.879
1.134
1.119
1.108
1.100
1.093
1.440
1.415
1.397
1.383
1.372
1.943
1.895
1.860
1.833
1.812
2.447
2.365
2.306
2.262
2.228
11
12
13
14
15
0.260
0.259
0.259
0.258
0.258
0.540
0.539
0.537
0.537
0.536
0.876
0.873
0.870
0.868
0.866
1.088
1.083
1.079
1.076
1.074
1.363
1.356
1.350
1.345
1.341
1.796
1.782
1.771
1.761
1.753
2.201
2.179
2.160
2.145
2.131
16
17
18
19
20
0.258
0.257
0.257
0.257
0.257
0.535
0.534
0.534
0.533
0.533
0.865
0.863
0.862
0.861
0.860
1.071
1.069
1.067
1.066
1.064
1.337
1.333
1.330
1.328
1.325
1.746
1.740
1.734
1.729
1.725
2.120
2.110
2.101
2.093
2.086
21
22
23
24
25
0.257
0.256
0.256
0.256
0.256
0.532
0.532
0.532
0.531
0.531
0.859
0.858
0.858
0.857
0.856
1.063
1.061
1.060
1.059
1.058
1.323
1.321
1.319
1.318
1.316
1.721
1.717
1.714
1.711
1.708
2.080
2.074
2.069
2.064
2.060
26
27
28
29
30
0.256
0.256
0.256
0.256
0.256
0.531
0.531
0.530
0.530
0.530
0.856
0.855
0.855
0.854
0.854
1.058
1.057
1.056
1.055
1.055
1.315
1.314
1.313
1.311
1.310
1.706
1.703
1.701
1.699
1.697
2.056
2.052
2.048
2.045
2.042
40
60
120

0.255
0.254
0.254
0.253
0.529
0.527
0.526
0.524
0.851
0.848
0.845
0.842
1.050
1.045
1.041
1.036
1.303
1.296
1.289
1.282
1.684
1.671
1.658
1.645
2.021
2.000
1.980
1.960








ANEXOS / TABLAS



259



Continuacin de valores crticos de la distribucin t


V

0.02 0.015 0.01 0.0075 0.005 0.0025 0.0005
1
2
3
4
5
15.895
4.849
3.482
2.999
2.757
21.205
5.643
3.896
3.298
3.003
31.821
6.965
4.541
3.747
3.365
42.434
8.073
5.047
4.088
3.634
63.657
9.925
5.841
4.604
4.032
127.322
14.089
7.453
5.598
4.773
636.590
31.598
12.924
8.610
6.869
6
7
8
9
10
2.612
2.517
2.449
2.398
2.359
2.829
2.715
2.634
2.574
2.527
3.143
2.998
2.896
2.821
2.764
3.372
3.203
3.085
2.998
2.932
3.707
3.499
3.355
3.250
3.169
4.317
4.029
3.833
3.690
3.581
5.959
5.408
5.041
4.781
4.587
11
12
13
14
15
2.328
2.303
2.282
2.264
2.249
2.491
2.461
2.436
2.415
2.397
2.718
2.681
2.650
2.624
2.602
2.879
2.836
2.801
2.771
2.746
3.106
3.055
3.012
2.977
2.947
3.497
3.428
3.372
3.326
3.286
4.437
4.318
4.221
4.140
4.073
16
17
18
19
20
2.235
2.224
2.214
2.205
2.197
2.382
2.368
2.356
2.346
2.336
2.583
2.567
2.552
2.539
2.528
2.724
2.706
2.689
2.674
2.661
2.921
2.898
2.878
2.861
2.845
3.252
3.222
3.197
3.174
3.153
4.015
3.965
3.922
3.883
3.849
21
22
23
24
25
2.189
2.183
2.177
2.172
2.167
2.328
2.320
2.313
2.307
2.301
2.518
2.508
2.500
2.492
2.485
2.649
2.639
2.629
2.620
2.612
2.831
2.819
2.807
2.797
2.787
3.135
3.119
3.104
3.091
3.078
3.819
3.792
3.768
3.745
3.725
26
27
28
29
30
2.162
2.158
2.154
2.150
2.147
2.296
2.291
2.286
2.282
2.278
2.479
2.473
2.467
2.462
2.457
2.605
2.598
2.592
2.586
2.581
2.779
2.771
2.763
2.756
2.750
3.067
3.057
3.047
3.038
3.030
3.707
3.690
3.674
3.659
3.646
40
60
120

2.125
2.099
2.076
2.054
2.250
2.223
2.196
2.170
2.423
2.390
2.358
2.326
2.542
2.504
2.468
2.432
2.704
2.660
2.617
2.576
2.971
2.915
2.860
2.807
3.551
3.460
3.373
3.291















ANEXOS / TABLAS



260
APNDICE C

Tabla de valores crticos de la distribucin ji cuadrada



ANEXOS / TABLAS



261




262
BIBLIOGRAFIA.


Chapra, S. y Canales R.; Mtodos numricos para ingenieros. Mc Graw Hill
Irwin R. Miller, J ohn E. Freud, Richard J honston; Probabilidad y Estadistica para ingenieros; Ed.
Prentice Hall;
Mendenhall, Sincich; Probabilidad y estadstica para ingeniera y ciencias ; Ed. Prentice Hall.
Meyer.: Probabilidad y aplicaciones Estadsticas. Ed. Addison-Wesley.
Murray Spiegel.; Probabilidad y estadstica .;Ed. McGraw Hill.
Nieves Dominguez; Numricos para ingenieros; Mc Graw Hill
Paul L. Meyer; Probabilidad y aplicaciones Estadisticas. Ed. Fondo Educativo Interamericana.
Richard I. Levin, David S. Rubin; Estadistica para administradores; Prentice Hall.
Walpole , Myers.; Probabilidad y estadstica para ingenieros Prentice Hall

También podría gustarte