Está en la página 1de 272

INSTITUTO TECNOLGICO SUPERIOR

de Acayucan

Asignatura: Probabilidad y estadstica


Clave de la asignatura: SCC - 0424
Carrera: Ingeniera en Sistemas Computacionales

ANTOLOGIA
Presenta:

ING. ULISES GIRON JIMENEZ

ACAYUCAN, VER.

JUNIO 2008

Probabilidad y Estadstica

Ing. Ulises Girn Jimnez

INDICE

UNIDAD 1

OBJETIVO GENERAL...............................................................................

10

JUSTIFICACION........................................................................................

11

ESTADISTICA DESCRIPTIVA.........

12

1.1 Conceptos bsicos de estadstica.......................

13

1.1.1 Definicin de estadstica.............................................................

13

1.1.2 Inferencia estadstica..................................................................

16

1.1.3 Teora de decisin......................................................................

16

1.1.4 Poblacin....................................................................................

16

1.1.5 Muestra aleatoria........................................................................

20

1.1.6 Parmetros aleatorios.................................................................

20

1.1.7 Enfoque clsico...........................................................................

20

1.1.8 Enfoque Bayesiano.....................................................................

21

1.2 Descripcin de datos.....

22

1.2.1 Datos agrupados y no agrupados...............................................

22

1.2.2 Frecuencia de clase....................................................................

22

1.2.3 Frecuencia relativa......................................................................

22

1.2.4 Punto medio................................................................................

23

III

1.2.5 Lmites........................................................................................

23

1.2.6 Histograma..................................................................................

23

1.2.7 Histograma de frecuencia relativa..............................................

24

1.3 Medidas de tendencia central

25

1.3.1 Media aritmtica, geomtrica y ponderada.................................

25

1.3.2 Mediana......................................................................................

29

1.3.3 Moda...........................................................................................

31

1.4 Medidas de dispersin.

35

1.4.1 Varianza......................................................................................

35

1.4.2 Desviacin estndar...................................................................

36

1.4.3 Desviacin media........................................................................

38

1.4.4 Desviacin mediana....................................................................

38

1.4.5 Rango.........................................................................................

38

1.5 Parmetros para datos agrupados

39

1.5.1 La media.....................................................................................

39

1.5.2 La desviacin tpica....................................................................

39

1.6 Distribucin de frecuencias....

41

1.6.1 Distribuciones numricas............................................................

42

1.6.2 Distribuciones categricas..........................................................

43

1.6.3 Distribuciones acumuladas.........................................................

44

1.6.4 Distribuciones porcentuales........................................................

44

1.6.5 Distribuciones porcentuales acumuladas...................................

45

IV

1.7 Tcnicas de agrupacin de datos...

UNIDAD 2

46

1.7.1 Lmites de clase..........................................................................

46

1.7.2 Rango de clase...........................................................................

46

1.7.3 Fronteras de clase......................................................................

46

1.7.4 Marca de clase............................................................................

47

1.7.5 Intervalo de clase............................................................

47

1.7.6 Diagrama de tallos y hojas ...

50

1.7.7. Diagrama de Pareto..................................................................

52

1.7.8 Diagrama de puntos...................................................................

59

1.8 Histograma.......

59

1.8.1 Diagrama de barras....................................................................

59

1.8.2 Polgono de frecuencias.............................................................

59

1.8.3 Ojivas.........................................................................................

60

1.8.4 Grficas circulares......................................................................

61

1.9 Distribuciones mustrales...

62

PROBABILIDAD.

65

2.1 Teora elemental de probabilidad.......

66

2.1.1 Concepto clsico y como frecuencia relativa..............................

66

2.1.2 Interpretacin subjetiva de la probabilidad.................................

69

2.2 Probabilidad de eventos......


2.2.1 Definicin de espacio muestral...................................................

69
69

2.2.2 Discreto y continuo.....................................................................

71

2.2.3 Definicin de evento...................................................................

71

2.2.4 Simbologa, uniones e intersecciones........................................

71

2.2.5 Diagramas de Venn....................................................................

71

2.3 Tcnicas de conteo.

72

2.3.1 Diagrama de rbol......................................................................

76

2.3.2 Notacin factorial........................................................................

80

2.3.3 Permutacin................................................................................

81

2.3.4 Combinaciones...........................................................................

91

2.4 Probabilidad con tcnicas de conteo

100

2.4.1 Axiomas......................................................................................

100

2.4.2 Teoremas....................................................................................

100

2.5 Probabilidad condicional...


2.5.1 Dependiente................................................................................

101

2.5.2 Independiente.............................................................................

110

2.6 Eventos Independientes...


2.6.1 Regla de Bayes...........................................................................

UNIDAD 3

101

113
113

FUNCIONES Y DISTRIBUCIONES MUESTRALES.......

121

3.1 Funcin de probabilidad..

121

3.1.1 Variables aleatorias discretas.....................................................

121

VI

3.1.2 Variables aleatorias continas....................................................


3.2 Distribucin Binomial......
3.2.1 Conceptos de ensayos de Bernoulli...........................................
3.3 Distribucin Hipergeomtrica
3.4 Distribucin de Poisson..
3.5 Esperanza matemtica.
3.6 Distribucin normal.
3.6.1 Distribucin de la probabilidad contina.....................................

UNIDAD 4

122
123
123
129
132
139
146
146

3.7 Aproximacin de la Binomial a la normal

156

3.8 Otras distribuciones mustrales.

161

3.8.1 Distribucin T- Student...............................................................

161

3.8.2 Distribucin X cuadrada..............................................................

162

ESTADSTICA APLICADA...

170

4.1 Inferencia estadstica.....

171

4.1.1 Concepto.....................................................................................

171

4.1.2 Estimacin..................................................................................

171

4.1.3 Prueba de hiptesis....................................................................

171

4.1.4 Mtodo clsico de estimacin (puntual)......................................

172

4.1.5 Estimador Insesgado..................................................................

172

4.2 Intervalos de confianza

172

VII

4.2.1 Estimacin por intervalo..............................................................

172

4.2.2 Lmites de confianza...................................................................

173

4.2.3 Intervalo de confianza para una media.......................................

174

4.2.4 Intervalo de confianza para una diferencia de medida...............

183

4.2.5 Intervalo de confianza para proporciones...................................

186

4.2.6. Intervalo de confianza para diferencia de proporciones.

189

4.3 Pruebas de hiptesis.....

UNIDAD 5

196

4.3.1 Prueba de hiptesis para la media poblacional..........................

203

4.3.2 Prueba de hiptesis para diferencias de medias........................

214

4.3.3 Prueba de hiptesis para proporciones......................................

220

4.3.4 Prueba de hiptesis para diferencia de proporciones.................

223

REGRESIN Y CORRELACIN...

216

5.1 Introduccin

217

5.1.1 Grficas de los datos..................................................................

217

5.1.2 Variables de regresin independientes.......................................

218

5.1.3 Regresin lineal simple...............................................................

219

5.2 Diagrama de dispersin

221

5.2.1 Tabla de datos.............................................................................

221

5.2.2. Construccin de Diagramas.......................................................

222

5.3. Estimacin mediante la lnea de regresin


5.3.1. Ecuacin de la recta como ajuste de datos...............................

222
222

VIII

5.3.2. Modelos.....................................................................................

223

5.4. Mtodos de mnimos cuadrados

223

5.4.1 Estimacin de los coeficientes de regresin..............................

224

5.5. Error estndar de estimacin

230

5.6. Coeficiente de determinacin y correlacin.

233

5.6.1. Coeficiente de determinacin de la muestra.............................

233

5.6.2. Coeficiente de correlacin de la muestra..................................

238

5.7. Problemas prcticos de ajustes de curvas

245

Anexos..

255

..

Bibliografa.

262

IX

OBJETIVO GENERAL

El estudiante seleccionar modelos probabilsticas, aplicar clculos de inferencia


estadstica sobre datos y desarrollar modelos para la toma de decisiones en sistemas con
componentes aleatorios.

10

JUSTIFICACION

Uno de los objetivos del Instituto Tecnolgico Superior de Acayucan, es el de promover,


apoyar e impulsar el trabajo creativo del docente, principalmente en la elaboracin de
antologa que apoya al proceso enseanza aprendizaje, el cual debe ser estimulado con
los comentarios y sugerencias del profesorado y conviene que sea imitado por otros
maestros, quienes con capacidad de trabajo y tiempo disponible, pueden y deben gestar
literatura de este gnero, dando los pasos adecuados para pulirla y poder formar as textos
que faciliten la enseanza y el aprendizaje del curso.
El presente material de consulta y apoyo didctico se pone en manos de nuestros maestros
y, particularmente, de los alumnos que se forman en nuestro instituto. Considero los
contenidos de esta antologa como el propsito ms firme de mi convencimiento para facilitar
el estudio de la probabilidad y estadstica en las nuevas generaciones que me honran al
confiarme su preparacin y garantizar modestamente el fijarles una enseanza para toda la
vida.

11

UNIDAD 1
ESTADISTICA
DESCRIPTIVA

Objetivo:
El estudiante conocer fundamentos
y tcnicas bsicas de estadstica,
para organizar, representar y analizar
datos obtenidos de una situacin
simulada o real.

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.1 Conceptos bsicos de estadstica.


1.1.1 Definicin de estadstica.
La palabra estadstica procede del vocablo "estado" pues era funcin principal de los
gobiernos de los estados establecer registros de poblacin, nacimientos, defunciones, etc.
Hoy en da la mayora de las personas entienden por estadstica al conjunto de datos, tablas,
grficos, que se suelen publicar en los peridicos.
Definicin:
Estadstica, rama de las matemticas que se ocupa de reunir, organizar y analizar datos
numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de
decisiones.
Estadstica es un conjunto de mtodos cientficos para la recopilacin, representacin
condensacin y anlisis de los datos extrados de un sistema en estudio. Con el objeto de
poder hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.
El anlisis se hace con las herramientas estadsticas, empleando la informacin obtenida de
los datos, para realizar estimaciones o inferencias, testear hiptesis de trabajo y as, poder
tomar las decisiones ms adecuadas en cada caso particular, basadas en la evidencia
cientfica suministrada por estos anlisis.

El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre
todo en el proceso de interpretacin de esa informacin. El desarrollo de la teora de la
probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. La probabilidad
es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la
cantidad de datos necesarios en un determinado estudio estadstico. Cuando a travs de
una muestra pretendemos obtener informacin de una poblacin entera los datos obtenidos
puede ser diferente a los reales. Son valores aproximados del parmetro desconocido. A
estos valores se les llama Estimaciones.
Al dar una estimacin estoy cometiendo un error llamado error de muestreo debido a que no
se esta considerando a toda la poblacin, sino a una parte de ella. Existen procedimientos
que pueden determinar de antemano el error que puedo cometer.

13

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Aparte de estos, existen otros errores que se presentan tanto en encuestas por muestreo
como en las encuestas por censo. Este tipo de errores son mayores y de difcil correccin.
Son errores ajenos al muestreo.
Qu es un experimento comparativo?
Es una investigacin cuya finalidad es comparar los efectos de dos o ms estmulos
(tratamientos A y B) aplicados a ciertos entes (unidades de experimentacin

,).

Para ello se efectan mediciones sobre los efectos de ambos tratamientos obtenindose los
resultados (

).

Qu es una encuesta por muestreo?


Es una investigacin que tiene por objetivo la descripcin de ciertas caractersticas
( ,

de una poblacin, mediante el examen de una parte de ella (muestra

).

La medicin de una caracterstica en los elementos de la muestra produce resultados

(Y1 y Y4 ) . Si el muestreo es probabilstico, todos los elementos de la poblacin tiene una


probabilidad no nula de formar parte de la muestra.

14

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Qu es un estudio observacional?
Es una investigacin comparativa sin la asignacin aleatoria que se hace en los
experimentos (o investigacin de muestreo no probabilstico), cuya finalidad es tambin
comparar los efectos que dos o mas condiciones ( A y B) tienen sobre los entes observados
,

,). Esto se lleva a cabo con extremado cuidado y control.

Divisin de la estadstica
Se divide en dos partes:

Re copilar

Descriptiva( Deductiva) Re presentar

Condensar

Divisin Estadistica

Caracteristicas

Inferencial ( Inferencia)
muestras

a) Estadstica descriptiva o deductiva: Es la parte de la estadstica que se ocupa de


recopilar, representar y condensar los datos obtenidos del sistema en estudio,
utilizando representaciones grficas de los datos tabulados.
b) Estadstica inferencial o inferencia estadstica: Utiliza datos de muestra para hacer
inferencias (caracterstica) acerca de un conjunto de datos grandes una poblacin
de cual se selecciono la muestra.

15

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.1.2 Inferencia estadstica.


Es la parte de la Estadstica dedicada a la formulacin de supuestos y estimaciones, para
hacer predicciones y poder sacar conclusiones de los datos obtenidos con el estudio de las
muestras. Y as, poder tomar decisiones con base cientfica. La Estadstica se emplea en el
estudio de los fenmenos naturales, tanto los generados en los laboratorios por los
cientficos como aquellos ms all del control humano.
Es una herramienta de uso tan amplio y general que hoy da es difcil imaginar un lugar
donde no pueda emplearse. Ms an, en algunas disciplinas es la herramienta bsica de
medicin, como por ejemplo en parapsicologa para la determinacin de PES (percepciones
extra-sensoriales).

1.1.3 Teora de decisin.


Es una herramienta bsica para la toma de decisiones, basadas en evidencia cientfica. La
manera de hacerlo es plantear las hiptesis posibles y luego efectuarle una prueba o test
estadstico.
Llamada en algunas obras: la docimasia estadstica. Cuando una conclusin se valida con
un test estadstico se la llama de tipo cuantitativo, en caso contrario la decisin adoptada es
de tipo cualitativo, o sea, una decisin tomada en forma subjetiva. El mtodo consiste en
definir una probabilidad de aceptacin del orden del 95% (o rechazo) de una hiptesis de
trabajo planteada, que permite calcular los valores crticos (o lmites de aceptacin) de un
estadgrafo calculado a partir de los valores medidos. La importancia de este tema es muy
grande. Basta decir que el objeto final de la Estadstica es la toma de decisiones.

1.1.4 Poblacin.
La poblacin, es el conjunto de todas las muestras posibles, que pueden obtenerse del
sistema en estudio de acuerdo al mtodo de seleccin empleado.
La poblacin, entonces, es el total hipottico de los datos que se estudian o recopilan. El
tamao de la poblacin se saca contando el nmero de elementos componentes. A veces es
un conteo simple, pero otras veces se trata de conteos ordenados.
A continuacin muestra las formas de observar una poblacin.

16

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Etapas de la recopilacin de datos


Etapa 1 - Objetivos de la Recopilacin: esta primera etapa consiste en determinar con
claridad qu es lo que se quiere lograr con la recopilacin. No siempre es fcil saber lo que se
quiere y menos determinarlo en detalle. Por eso, se deben definir primero los objetivos
generales del trabajo estadstico. Y a partir de ellos se conocern las variables a medir y as
saber cules elementos se necesitarn. Con esto se tiene una primera idea de los alcances y
limitaciones de la tarea a realizar, segn sea el tipo de informacin a obtener de la poblacin en
estudio. Los objetivos deben redactarse concisos, breves y claros. Normalmente, la persona a
cargo de la investigacin es la responsable de esta etapa pues tiene una visin ms completa y
actualizada del tema en estudio. Por ejemplo, si se necesita la distribucin de la poblacin por
edades y sexo, no es lo mismo disponer de la informacin del ltimo censo realizado que
hacerlo uno mismo.

17

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Etapa 2 - Relevamientos: esta etapa consiste en determinar lo que se tiene para alcanzar los
objetivos definidos en la etapa anterior. Se trata de listar los bienes necesarios para poder hacer
el trabajo, y el listado de los disponibles. Conviene tener en cuenta la siguiente clasificacin de
los bienes: Tangibles e Intangibles.
Por su parte, los bienes tangibles son dos:

Los materiales incluyen los de vidrio, de limpieza, drogas, reactivos, etc.

Por equipamiento se entiende no slo los aparatos de medicin, sino los accesorios
como muebles y tiles de laboratorio y para oficina.

El dinero o los recursos monetarios deben ser determinados con mucho detalle para
afrontar gastos e inversiones durante la investigacin. Adems, hay que determinar los
fondos disponibles y las posibles fuentes financieras adonde poder recurrir.

La infraestructura incluye a los edificios, laboratorios, electricidad, agua, etc.

El personal es todo el necesario en sus diferentes niveles, como ser: profesionales,


tcnicos, ayudantes, consultores externos, de servicio, etc. Este relevamiento de los
bienes tangibles disponibles y de los necesarios para la recopilacin condiciona de
alguna manera los objetivos. Puede ser que se disponga de bienes sobrados para
alcanzar los objetivos, por lo que se pueden plantear metas ms ambiciosas. Por otra
parte, puede ocurrir que los bienes disponibles estn lejos de cubrir los necesarios, y
por lo tanto se debern resignar los objetivos planteados por otros ms modestos.

Por su parte, los bienes intangibles son dos:

la organizacin de los bienes tangibles, de manera tal de alcanzar los objetivos, y

los conocimientos para saber cmo usarlos. Esto es el know how de cada profesin. Y
tambin lo es la bsqueda bibliogrfica de trabajos similares en revistas especializadas,
textos y otras fuentes de informacin. Una vez terminada esta etapa, que seguramente
habr ayudado a depurar la anterior, se debe comenzar a pensar en las diferentes
maneras de hacerlo.

Etapa 3 - Creacin de alternativas: esta etapa consiste en saber cmo hacerlo. O sea,
generar distintas alternativas de sistemas de recopilacin de datos, de acuerdo con los objetivos
adoptados y los bienes disponibles. Se debe hacer un listado con todas las formas posibles de

18

UNIDAD I / ESTADISTICA DESCRIPTIVA.

efectuar la recopilacin a fin de tener un panorama completo. En sntesis, se habla de fuente


propia cuando se decide extraer los datos mediante mediciones. Fuente Primaria es cuando
se toman los datos de otros investigadores que publican los resultados de sus propias
mediciones. Fuente Secundaria es cuando los datos se extraen de publicaciones que usan
como referencia a fuentes primarias.
Etapa 4 - Seleccin de alternativas: consiste en determinar cul es la mejor entre las n
alternativas planteadas en la etapa anterior. Se necesita de un mtodo para la adopcin de un
criterio de seleccin.
Etapa 5 - Prueba piloto: existe una diferencia entre el diseo en los papeles y la realidad. Es
por eso que siempre es aconsejable hacer una prueba piloto antes de la puesta en marcha para
poder juzgar cmo trabaja el sistema de recopilacin de datos. Se sacan unos pocos datos y se
analizan las dificultades no previstas, junto con los resultados. Comparando los valores
obtenidos con los que se esperaba tener, se hace una especie de control previo del sistema.
Etapa 6 - Ajustes: Lo normal es tener que hacer pequeos ajustes que permitan optimizar al
sistema. De las diferencias detectadas en el control de la etapa anterior se sacan indicios. Estos
muestran qu tpicos retocar y surgen nuevas ideas de cmo hacer mejor las cosas.
Bsicamente, usando el sentido comn se corrigen los principales defectos, como ser: mejorar
el entrenamiento y conocimientos del personal, redisear formularios, calibrar equipos de
medicin, estimacin de la magnitud del error de medicin, etc. Pero tambin hay tcnicas de
optimizacin especiales como son los distintos modelos de la Investigacin Operativa. Esta es
una disciplina muy emparentada con estadstica y sus modelos ms conocidos son: Teora de
Lneas de Espera, Programacin por Camino Crtico (PERT), Programacin Dinmica y Lineal,
Reemplazos, Simulaciones, etc. Una vez hechos los ajustes, se vuelve a la etapa anterior y se
efecta una nueva prueba piloto. Este ensayo permite decidir si se contina adelante, o si son
necesarios ms ajustes. Hay que continuar hasta que todo sea satisfactorio y recin entonces
pasar a la etapa siguiente.
Etapa 7 - Puesta en marcha: una vez optimizado y ajustado el mtodo de obtencin de datos
solo resta ponerlo en marcha. De esa manera, se logra la cantidad de datos necesarios para
alcanzar los objetivos previstos. El resultado final es la obtencin de un volumen grande de
informacin que debe ser presentada en forma ms resumida y comprensible usando tablas,
grficos y otras formas, como se ver ms adelante.

19

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.1.5 Muestra aleatoria.


La muestra es un conjunto de datos obtenidos de una poblacin cualquiera, con el mtodo de
recopilacin elegido. Se la puede imaginar como un subconjunto del conjunto poblacin. Se
toman muestras, cuando no se puede o no conviene, tomar la poblacin entera. Si se tiene una
poblacin de tamao infinito, no se podr nunca tomar todas las muestras posibles, como por
ejemplo, las mediciones repetidas de una misma magnitud, que se pueden repetir
indefinidamente mientras el ensayo no sea destructivo (repetidas pesadas en una balanza,
medir la temperatura de un cuerpo, etc.). Hay ocasiones, donde si bien la poblacin es finita, es
tan grande que no resulta prctico tomar todos los casos como por ejemplo, cuando la
poblacin es la especie humana.
Lgicamente, la confiabilidad de las conclusiones extradas concernientes a una poblacin
dependen de si la muestra se ha escogido apropiadamente de tal modo que represente la
poblacin suficiente. Una forma de hacer esto para poblaciones finitas es asegurarse de que
cada miembro de la poblacin tenga igual oportunidad de encontrarse en la muestra, lo que se
conoce como muestra aleatoria.

1.1.6 Parmetros aleatorios.


Parmetro, es toda magnitud que tiene el mismo valor dentro de una poblacin. O sea, no
permite diferenciar entre s a sus elementos componentes. Existen medidas para realizar
descripciones cuantitativas de los conjuntos de datos, o poblaciones, y de sus muestras,
diferencindose entre ellas las que se refieren a las mismas poblaciones y a las muestras. Para
el caso de las poblaciones, las medidas que las describen se denominan parmetros, y suelen
estar representadas con letras griegas (por ejemplo

). Por otro lado, para el caso de

aquellas medidas que describen a una muestra se les llama estadsticos o estimadores, y son
representados por letras de nuestro alfabeto (por ejemplo, x o s). Tales medidas cuantitativas
que describen a las poblaciones y a las muestras se comentarn enseguida. Se considera que
se conoce una poblacin cuando conocemos la distribucin de probabilidad f(x) de la variable
aleatoria asociada X.

1.1.7 Enfoque clsico.


La utilizacin de esta metodologa implica una cierta filosofa o visin de la Probabilidad y la
Estadstica muy particular y poco frecuente. Lo particular de este enfoque es que es
razonablemente ms sencillo que el enfoque clsico de la estimacin y el ensayo de hiptesis, a

20

UNIDAD I / ESTADISTICA DESCRIPTIVA.

los que reemplaza y mejora por cuanto no implica aproximaciones ni requiere de la introduccin
de nuevos conceptos.

1.1.8 Enfoque Bayesiano.


En el enfoque Bayesiano de la Estadstica, la incertidumbre presente en un modelo dado,
p(x), es representada a travs de una distribucin de probabilidad p ( ) sobre los posibles
valores del parmetro desconocido (tpicamente multidimensional) que define al modelo. El
Teorema de Bayes,

p ( x) =

p ( ) p ( x )
p( x)

Permite entonces incorporar la informacin contenida en un conjunto de datos x = ( x1 ,..., x n ) ,


produciendo una descripcin conjunta de la incertidumbre sobre los valores de los parmetros
del modelo a travs de la distribucin final p (x ).
Desafortunadamente, la implementacin de las tcnicas Bayesianas usualmente requiere de un
esfuerzo computacional muy alto. La mayor parte de este esfuerzo se concentra en el clculo
de ciertas caractersticas de la distribucin final del parmetro de inters (que llamaremos
resmenes inferenciales). As, por ejemplo, para pasar de una distribucin conjunta a una
coleccin de distribuciones y momentos marginales que sean tiles para hacer inferencias
sobre subconjuntos de parmetros, se requiere integrar. En la mayora de los casos los
resmenes inferenciales bsicos se reducen a integrales de la forma:

S {g ( )} = g ( ) p ( ) p (z )d
El anlisis Bayesiano, en otra diferencia con la estadstica clsica, permite incorporar en un
estudio informacin de distintas fuentes, incluso subjetivas.
De esta manera concibe, en un plano muy general, las tcnicas estadsticas como mecanismos
para la actualizacin del conocimiento particular o general, individual o colectivo sobre el estado
que guarda la naturaleza."

21

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.2 Descripcin de datos.


1.2.1 Datos agrupados y no agrupados.
La principal diferencia entre ambas es que en datos agrupados se ordenan los datos de la
tabla y se almacenan en el orden del ndice. Los datos agrupados mejoran el rendimiento al
almacenar los datos de la tabla junto con datos de nivel de hoja del ndice. Una ordenacin es
un conjunto de datos numricos en orden creciente o decreciente. Este mtodo de presentacin
de la informacin consiste en presentar los datos por medio de una tabla o cuadro.
Los datos no agrupado no apunta directamente a la fila de la tabla, sino que utiliza los valores
del ndice agrupado como punteros a las filas de la tabla.
Una fila de datos consiste en datos recogidos que no han sido organizados numricamente.

1.2.2 Frecuencia de clase.


La frecuencia de clase o frecuencia de categora, es el nmero de observaciones que caen
dentro de una categora
Altura ( in)

Nmero de
estudiantes f

60 62

63 65

20

66 68

44

69 71

29

72 74

10
Total 110

1.2.3 Frecuencia relativa.


La frecuencia relativa (proporcin); de una clase es su frecuencia dividida por la frecuencia total
de todas las clases.

frecuencia relativa =

numero de estudiante
total

22

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Altura ( in)

Nmero de

Frecuencia

estudiantes (f)

relativa

60 62

0.0636

63 65

20

0.1818

66 68

44

0.4

69 71

29

0.2636

72 74

10

0.0909

total

110

1.0000

1.2.4 Punto medio.


El punto medio del intervalo de clase, que puede tomarse como representativo de la clase, se
llama marca de clase, que se refiere al punto medio del intervalo de clase y se obtiene
promediando los limites inferior y superior de clase. As que las marcas de clase del intervalo
60 62 es:

60 + 62
= 61
2

1.2.5 Lmites.
Tomando encuenta la clase 60 - 62 se dice que se llaman lmites de clases, el 60 se llama
lmite inferior de clase y el 62 se llama lmite superior de clase.

1.2.6 Histograma.
Es una representacin grafica para la distribucin de frecuencia. Un histograma o histograma de
frecuencias, consiste en un conjunto de rectngulos con:
a)

base en el eje x horizontal, centros en las marcas de clases y longitudes iguales a los
tamaos de los intervalos de clase y

b)

reas proporcionales a las frecuencias de clase.

23

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Altura ( in)

Nmero de

Marca de

estudiantes (f)

clases (X)

60 62

61

63 65

20

64

66 68

44

67

69 71

29

70

72 74

10

73

total

110

frecuencia
50
40
30
20
10
0
58

61

64

67

70

73

76

1.2.7 Histograma de frecuencia relativa.


Altura ( in)

Numero de

Frecuencia

estudiantes (f)

relativa

60 62

0.0636

63 65

20

0.1818

66 68

44

0.4

69 71

29

0.2636

72 74

10

0.0909

total

110

1.0000

Frec. Rel.

Histograma de frecuencia relativa


0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
1

24

UN
NIDAD I / ESTADIST
TICA DESC
CRIPTIVA
A.

Problemas
s propuesto
os:
Problema: El rascn terrestre o guin
g
de las codornices es una ave
e europea en
e peligro de
e
m
En fechas recientes se lle
ev a cabo un censo de rascones cantores en
n
extincin mundial.
terrenos ag
grcolas de Gran
G
Breta
a e Irlanda (Journal of applied ecollogy) . La ta
abla indica el
e
numero total de rascon
nes terrestress que habitan
n en cada de
e 10 reas ge
eogrficas.

rea

Numero de rascones
s
terrestres

1. Tierrra bajas de Escocia


E

12

2. Tierrras altas de escocia


e

15

3. Orkn
ney y Shetlan
nd

34

4. Lewiis y Harris

76

5. N. Uist y Benbeccula

82

6. S. Uist y Barra

155

7. Hebrridas interiorres

76

8. Coll y Tirce

121

9. Irlanda del norte

128

10. Repu
ublica de Irla
anda

789

T
Total

1
1488

esuma los da
atos con un histograma
h
a) Re

1.3.

edidas de tendencia
a central.
Me

1.3.1 Med
dia aritm
tica, geom
mtrica y ponderad
p
a.
Media aritm
mtica
Sean, x1 ,xx2 ,....,xn , n observacione
o
es mustrale
es, definiremos promedio
o de estas ob
bservacioness
al valor dad
do por:

o bien

255

UNIDAD I / ESTADISTICA DESCRIPTIVA.

x + x 2 + x 3 + ... + x n
x= 1
=
N

x
j =1

x
N

Ejemplo: La media aritmtica de los nmeros 8, 3. 5, 12 y 10

8 + 3 + 5 + 12 + 10 38
=
= 7. 6
5
5

x=

En esta expresin, puede verse que el promedio de un conjunto de nmeros se calcula


sumndolos y luego dividiendo la suma por el nmero de sumandos. La estadstica promedio
representa muy bien el 'centro' de la distribucin de los datos cuando se trata de casos
'normales'. Entendemos aqu por casos 'normales' aquellos conjuntos de datos que no
contienen valores muy extremos, valores muy alejados de los dems. Debido a que en muchas
situaciones experimentales, el comportamiento de los datos es relativamente 'normal', el
promedio es muy usado, convirtindose en la primera estadstica calculada para representar el
'centro' de la poblacin en estudio.
si los nmeros X1 , X2 , ... , Xk , ocurren f1 , f2 , ... , fk , veces respectivamente, su media
aritmtica
N

f x + f 2 x 2 + ... + f k x k
=
x= 1 1
f1 + f 2 + ... + f k

f
j =1

xj

f
j =1

x=

fx
N

Ejemplo: si 5, 8, 6, y 2 ocurren con frecuencias 3, 2, 4 y 1 , respectivamente, su media


aritmtica es
x=

(3 )(5 ) + (2 )(8 ) + (4 )(6 ) + (1)(2 ) = 15 + 16 + 24 + 2


3+ 2 + 4 +1

10

= 5 .7

Ejemplo:En la tabla siguiente se tiene los puntajes obtenidos en la Prueba de Aptitud


Acadmica por 30 jvenes, provenientes de un mismo establecimiento educacional:

26

UNIDAD I / ESTADISTICA DESCRIPTIVA.

P. Ap. Verbal

P. Ap. Matemtica

P. Ap. Verbal

P. Ap. Matemtica

685

664

730

642

490

548

618

533

580

567

690

654

705

665

680

542

470

452

690

678

620

506

710

732

650

618

742

749

702

718

685

570

643

621

595

574

540

555

674

657

575

502

722

747

600

531

585

620

500

478

505

482

680

558

600

643

587

600

543

500

Con los datos de la tabla, se puede caracterizar el establecimiento educacional usando el


promedio de cada una de las pruebas. Lo primeros que se necesita es calcular la suma de los
puntajes de los treinta alumnos.
Dichas sumas son las siguientes:
Prueba de Aptitud Verbal 18796
Prueba de Aptitud Matemtica 17906
Promedio Prueba de Aptitud Verbal 626.533
Promedio Prueba de Aptitud Matemtica 596.867

27

UN
NIDAD I / ESTADIST
TICA DESC
CRIPTIVA
A.

La Media g
geomtrica G
La media g
geomtrica es el resultado de multiplicar todos los
s elementos y extraer la raz n -sima
a
del productto:

media geoometrica = n x1 .x 2 ...x n


a media geom
mtrica g de 2, 4 y 8
Ejemplo: la
G = 3 ( 2) ( 4) ( 8) = 4

mathcaad

gmeaan ( 2 , 4 , 8) = 4

Promedio Ponderado.
En muchass ocasiones, las observa
aciones recollectadas no tienen la missma importa
ancia relativa
a.
Para hacerr presente este hecho en la bsqued
da de un 'ce
entro' que re
epresente a los datos, es
s
necesario asignar
a
a cad
da uno de s
stos, una ponderacin (p
peso o coefic
ciente) que re
epresente su
u
importancia
a dentro de la muestra.
Definicin.
A veces as
sociada con los
l nmeros X1, X2, . . . XK , ciertos factores
f
peso
os ( o pesos ) W1, W2 ,...,
WK depend
dientes de la
a relevancia asignada
a
a ccada nmero
o.

Ejemplo: sii el examen final de un curso


c
cuanta
a tres veces mas que una
a evaluacin
n parcial y un
n
estudiante tiene calific
cacin 85 en
e el exame
en final y 70
7 y 90 en los dos pa
arciales , las
s
nes media es
s:
calificacion

x=

(1)(70
7 ) + (1)(90 ) + (3)(85) 415
=
= 83
1+1+ 3

Ejercicios
s:
a) halllar la media aritmtica de
d los nmerros 5, 3, 6, 5,
5 4, 5, 2, 8, 6,
6 5, 4, 8, 3, 4, 5, 4, 8, 2,
2
5, y 4
Solucin: 4.8

28
8

UNIDAD I / ESTADISTICA DESCRIPTIVA.

b) De entre 100 nmeros. 20 son cuatros, 40 son cinco, 30 son seis y los restantes siete.
Hallar su media aritmtica.
Solucin: 5.30
c) las calificaciones finales de un estudiante en cuatro asignatura fueron 82, 86, 90 y 70. si
los respectivos crditos otorgados a esos cursos son 3, 5, 3 y 1 , determinar una
calificacin media a apropiada.
Solucin: 85
d) De los 80 empleados de una empresa 6 cobra $ 7,00 a la hora y el resto $4,00 a la
hora. Hallar cuanto cobran de media por hora
Solucin: $6.25
e) Cuatro grupos de estudiantes, consistentes en 15, 20, 10 y 18 individuos, dieron pesos
medios de 162, 148, 153 y 140 lb., respectivamente . hallar el peso medio de todos
esos estudiantes.
Solucin: 150 lb.

1.3.2 Mediana.
La mediana de un conjunto de nmeros ordenados en magnitud es el valor central o la media
de los dos valores centrales.
Datos sin agrupar:
Ejemplo: el conjunto de nmeros 3, 4, 4, 5, 6, 8, 8, 8, 10 tiene mediana 6
mathcad

median ( 3 , 4 , 4 , 5 , 6 , 8 , 8 , 8 , 10) = 6

Ejemplo: el conjunto de nmeros 5, 5, 7, 9, 11, 12, 15, 18 tiene mediana ( 9 + 11 ) = 10


Ejemplo: las notas de un estudiante en seis exmenes han sido 84, 91, 72, 68, 87 y 78. hallar la
mediana de esas notas.
Solucin : las notas ordenadas son 68, 72, 78, 84, 87 , 91,
1 / 2 ( 78 + 84 ) = 81

29

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Ejemplo: cinco oficinistas cobran $ 4.52, $ 5.96, $ 5.28, $ 11.20 y $ 5.75 a la hora. Hallar la
mediana
Solucin = la ordenacin es: $ 4.52, $ 5.28, $ 5.75 , $ 5.96, $ 11.20
La mediana es $ 5.75
Datos Agrupados:
Las grficas siguientes, correspondientes a polgonos de frecuencias absolutas acumuladas,
nos plantea de nuevo dos situaciones diferentes a considerar:

( f )1
C
mediana = L1 + 2
f mediana

donde:
L1 = frontera inferior de la clase mediana.
N = numero de datos (frecuencia total)
( f ) 1 = suma de la frecuencia de las clases inferiores a la de la mediana.
f mediana = frecuencia de la clase mediana.
C = anchura del intervalo de clase de la mediana.
Ejemplo:

Para indicar la posicin :

Altura ( in)

Numero de estudiantes (f)

60 62

63 65

20

66 68

44

69 71

29

72 74

10

total

110

110
= 55 ; entonces se procede a realizar una suma con las
2

frecuencias (f) hasta llegar al valor 55 o mas de 55 pero no menos, para suponer que ah cae la
mediana solo que se tiene que hacer es verificar su valor.
7 + 20+ 44 = 71 por lo tanto cae en el intervalo 66 68

30

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Datos:

L1 = 65.5 ; N = 110 ;

( f )

= 27 ; f mediana = 44 ; C = 68.5 65.5 = 3

110

27

(3) = 67.41
mediana = 65.5 + 2
44

1.3.3 Moda.
La moda de un conjunto de nmeros es el valor que ocurre con mayor frecuencia; es decir, el
valor mas frecuente. La moda puede no existir e incluso no ser nica. Esta estadstica debe
usarse con cuidado. Su objetivo es identificar zonas donde se producen aglomeraciones de
datos, sin embargo, podra ser que por el solo hecho de haber una observacin extra en un
punto aislado, ste pudiese aparecer como una moda.
Este inconveniente es especialmente delicado cuando hay pocas observaciones en la muestra,
tal como es el caso que se observa en el grfico siguiente.
Datos sin agrupar:
Ejemplo: el conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 tiene como moda 9
mathcad

mode( 2 , 2 , 5 , 7 , 9 , 9 , 9 , 10 , 10 , 11 , 12 , 18) = 9

Ejemplo: el conjunto 3, 5, 8, 10, 12, 15, 16 n o tiene moda


Ejemplo: el conjunto 2, 3, 4, 4, 4, 5, 5, 7 , 7, 7, 9 tiene dos modas 4 y 7 y se llama bimodal
Una distribucin nica se llama unimodal.
Datos agrupados :

1
C
mod a = L1 +
1 + 2
donde:
L 1 = frontera inferior de la clase modal ( clase que contiene a la moda)

31

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1 = exceso de la frecuencia modal sobre la clase inferior inmediata


2 = exceso de la frecuencia modal sobre la clase superior inmediata
c = anchura del intervalo de clase modal.
Ejemplo :
Altura ( in)

Numero de estudiantes (f)

60 62

63 65

20

66 68

44

69 71

29

72 74

10

total

110

De acuerdo a la definicin la moda ser quien tenga mayor frecuencia por lo tanto cae en el
intervalo 66 68

L1 = 65.5 ; 1 = 44 20 = 22 ; 2 = 44 29 = 15 ; C = 68.5 65.5 = 3


22
mod a = 65.5 +
(3) = 67.28
22 + 15
Medidas de posicin relativa (Cuartiles, deciles y percentiles).
Las calificaciones de exmenes y ciertos tipos de datos sociolgicos y de salud con frecuencia
se presentan en una forma que describe la posicin de una observacin relativa a las dems
observaciones de la distribucin.
Si un conjunto de datos estn ordenados por magnitud, el valor central ( o la media de los dos
centrales) que divide al conjunto en dos mitades iguales es la mediana. Extendiendo esa idea,
podemos pensar en aquellos valores que dividen al conjunto en cuatro partes iguales.
Estos valores, denotados por Q 1, Q 2, Q3 , se llaman primer, segundo y tercer cuartil. Q

coincide con la mediana.

32

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Anlogamente los valores que dividen a los datos en 10 partes iguales se llaman deciles y se
denotan D1 , D2 , . . . , D9 , mientras los valores que se dividen en 100 partes iguales se llaman
percentiles denotados P1 , P2 , . . . , P 99 .
Colectivamente cuartiles, deciles y percentiles se denominan cuantiles.
Altura ( in)

Numero de estudiantes (f)

60 62

63 65

20

66 68

44

69 71

29

72 74

10

total

110

Hallar Cuartiles:
N / 4 = 100 / 4 = 25
5 + 18 = 23

65.5 +

63 65 62.5 65.5

( 25 23 )
42

( 3) = 65.64

2N / 4 = 2(100) / 4 = 50
5 + 18 = 23

63 65 62.5 65.5

5 + 18 + 42 = 65

65.5 +

( 50 23 )
42

( 3 ) = 67.43

3N / 4 = 3(100) / 4 = 75
66 68 65.5 68.5

5 + 18 +42 = 65

68.5 +

( 75 65 )
27

( 3) = 69.61

33

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Hallar los deciles


100
10

= 10

2( 100)
10

= 20

( 10 5)

62.5 +

18

62.5 +

( 3) = 63.33

( 20 5)
18

( 3) = 65

5+ 18 = 23
3( 100)
10

= 30

65.5 +

( 30 23)
42

( 3) = 66

5+ 18 = 23
4( 100)
10

= 40

65.5 +

65.5 +

65.5 +

68.5 +

68.5 +

( 40 23)
42

( 3) = 66.71

5+ 18 = 23
5( 100)
10

= 50

( 50 23)
42

( 3) = 67.43

5+ 18 = 23
6( 100)
10

= 60

( 60 23)
42

( 3) = 68.14

5+ 18 + 42 = 65
7( 100)
10

= 70

( 70 65)
27

( 3) = 69.06

5+ 18 + 42 = 65
8( 100)
10

= 80

( 80 65)
27

( 3) = 70.17

5+ 18 + 42 = 65

34

UNIDAD I / ESTADISTICA DESCRIPTIVA.

9( 100)
10

= 90

68.5 +

( 90 65)
27

( 3) = 71.28

Hallar percentiles P 35 y P 50
35 (100) / 100 = 35
P

35

65.5 +

( 35 23 )
42

( 3 ) = 66.36

50 (100) / 100 = 50
P

50

1.4.

65.5 +

( 50 23 )
42

( 3 ) = 67.43

Medidas de dispersin.

Medidas de Posicin.
La descripcin de un conjunto de datos, incluye como un elemento de importancia la ubicacin
de stos dentro de un contexto de valores posibles. Por ejemplo, puede resultar de inters
conocer qu porcentaje de automviles equipados con convertidor cataltico sobrepasa el
estndar de emisiones de gases que es aceptable segn la legislacin vigente. Ya no se trata
en este ejemplo de describir el centro de un conjunto de datos de esta naturaleza. Es necesario
ser ms especfico. Es probable que la emisin promedio de un conjunto de automviles est
dentro de la norma. Pero,es aceptable que el 25% de ellos no la cumpla?. Se ve, entonces,
que la descripcin debe entregar ms informacin de los datos para cubrir las necesidades
informativas referentes a un problema en particular.

1.4.1 Varianza.
Cuadrada para poder compararla con la media y otras medidas anlogas. Esta es la idea del
desvo estndar o desviacin tpica. Tambin es la frmula planteada por Gauss en su teora
de errores casuales. Como se ver ms adelante, la curva de Gauss tiene dos puntos de
inflexin simtricos ubicados a una distancia del centro igual al desvo estndar.

35

UNIDAD I / ESTADISTICA DESCRIPTIVA.

La varianza
La varianza es el promedio de los cuadrados de las desviaciones de cada elemento, x i,
respecto a la media,
La varianza de un conjunto de datos se define como el cuadrado de la desviacin tpica y viene
dada en consecuencia por S2 . varianza poblacional (s 2)

(x
N

S2 =

j =1

x)

para una poblacin finita con n determinaciones.


Y la varianza muestral ( 2)

n
yi
n
n
2
2
y i i =1
( xi x )

n
= i =1
2 = i =1
n 1
n 1

1.4.2 Desviacin estndar.


A su vez, el desvo estndar poblacional () y el muestral (s) se obtienen con la raz
cuadrada de las respectivas varianzas y Representa el alejamiento de una serie de nmeros de
su valor medio. Se calcula a partir de todas las desviaciones individuales con respecto a la
media.
Para poder conocer o calcular tanto la media como la varianza poblacionales, se necesita
conocer la poblacin completa. Esto es imposible en el caso de mediciones repetidas porque
estas son infinitas desde el punto de vista terico. Anlogamente, la cantidad total de muestras
que se le puede extraer a un paciente, para hacerle una determinacin en el laboratorio, es tan
grande que puede ser considerada infinita. Por lo tanto, para todos

(x
N

S=

j =1

x)

El uso de esta estadstica es recomendado en aquellos conjuntos de datos que ofrecen cierto
grado de simetra respecto de su centro. En estos casos, habitualmente tiene sentido medir
discrepancias de un valor con el centro de los datos usando mltiplos de la desviacin estndar.

36

UNIDAD I / ESTADISTICA DESCRIPTIVA.

A modo de ejemplo, se puede decir que un valor est bastante alejado del centro de los datos si
su distancia de l supera dos desviaciones estndar. Apoyndose en la idea anterior, la
desviacin estndar puede ser usada para determinar valores que se encuentran 'cerca' del
centro. Este uso va ms all de la simple descripcin, en otros mbitos de Estadstica es usada
para tomar decisiones respecto de la poblacin de la que fue extrada la muestra.
Ejercicio: Calcular la desviacin estndar de los siguientes datos:
68.2, 69.3, 70.4, 71.5, 72.6, 73.7, 74.8,
prom:=

68.2+ 69.3+ 70.4+ 71.5+ 72.6+ 73.7+ 74.8


7

prom = 71.5

desv :=

( 68.2 71.5 ) + ( 69.3 71.5 ) + ( 70.4 71.5 ) + ( 71.5 71.5 ) + ( 72.6 71.5 ) + ( 73.7 71.5 ) + ( 74.8 71.5 )

desv = 2.2

Problema: Investigadores del Massachussets Institute of Technology (MIT) estudiaron las


propiedades espectroscopicas de asteroides de la franja principal con un dimetro menor a los
10 kilometros. Los asteroides se observaron con el telescopio hiltener del observatorio del MIT;
se registro el numero N de exposiciones de imagen espectral independientes para cada
observacin. Aqu se presentan los datos de 40 observaciones de asteroides obtenidas de
Science.
Numero

de

exposiciones

de

imagen

espectral

independientes

para

40

observaciones de asteroides.
3

a) Localice

y y s en el listado

b) Construya los intervalos

y s , y 2 s , y 3s

37

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.4.3 Desviacin media.


La desviacin media o desviacin promedio de un conjunto de N nmeros x 1, x 2, . . . , x

es

abreviada por MD y se define como:


N

M .D. =

x
j =1

Ejemplo: hallar la desviacin media del conjunto 2, 3, 6, 8, 11


2 + 3 + 6 + 8 + 11

media aritmetica =

5
con mathcad

=6

mean ( 2 , 3 , 6 , 8 , 11) = 6
desviacion media

MD =

2 6 + 3 6 + 6 6 + 8 6 + 11 6
5

= 2.8

1.4.4 Desviacin mediana.


Es la media aritmtica de los valores absolutos de las desviaciones de los valores de la
variable con respecto a la mediana.

D Me =

Me n j
n

1.4.5 Rango.
La ms simple de todas es el rango, definido como la diferencia entre el valor mximo y
mnimo del grupo de datos. De fcil clculo y comprensin, tiene la desventaja de ser la
medida ms grosera de la dispersin.
Dos grupos de datos, con muy distinta dispersin pueden llegar a tener rangos similares. Uno
de ellos puede tener el 99% de los valores junto al mnimo y el otro el 99% junto al mximo,
pero al tener extremos iguales, sus rangos resultaran iguales a pesar de ser tan dismiles
intrnsecamente.
RANGO = Mx. datos - Mn. datos

38

UNID
DAD I / ES
STADISTIC
CA DESCR
RIPTIVA.

1.5

Pa
armetros para dato
os agrupados.

1.5.1 La
a media.
Sean, x1 ,x2 ,....,xn , n obserrvaciones mustrales,
m
definiremos promedio de estas
observacio
ones al valor dado por:

o bien
N

x + x 2 + x3 + ... + x n
x= 1
=
N
x
x=
N

x
j =1

Ejemplo: La
a media aritm
mtica de los
s nmeros 8, 3. 5, 12 y 10

x=

8 + 3 + 5 + 122 + 10 38
=
= 7.6
5
5

a desviaci
n tpica.
1.5.2 La
A su vez, el desvo estndar
e
pob
blacional ( ) y el mue
estral ( s) se obtienen con
c
la raz
d las respec
ctivas varian
nzas y Repre
esenta el ale
ejamiento de una serie de nmeros
cuadrada de
de su valorr medio. Se calcula
c
a parrtir de todas las desviacio
ones individu
uales con res
specto a la
media.

f (x
k

S=

j =1

x)

f
j =1

39

UNIDAD I / ESTADISTICA DESCRIPTIVA.

xj

x j x ( x j x ) 2 f j (x j x )

fj

68.2

-2.6358 6.9477

34.7385

69.3

11

-1.5358 2.3588

25.9472

70.4

14

-0.4358 0.1900

2.6595

71.5

11

0.6642 0.4411

4.8521

72.6

1.7642 3.1122

21.7856

73.7

2.8642 8.2034

24.6101

74.8

3.9642 15.7145 31.4290

Total 53

x=

146.0219

70.8358

Desv.
Est. = 1.6599
Y la desviacin media para datos agrupados:
k

DM =

f
j =1

xj x

f
j =1

xj

fj

xj x

f j xj x

68.2

2.6358

13.1792

69.3

11

1.5358

16.8943

70.4

14

0.4358

6.1019

71.5

11

0.6642

7.3057

72.6

1.7642

12.3491

73.7

2.8642

8.5925

74.8

3.9642

7.9283

Total

53

72.3509

x=
70.8358
Desv. Med. =

1.3651

40

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.6 Distribucin de frecuencias.


Reglas generales para formar distribuciones de frecuencias
Paso 1: Calcular el intervalo de los datos :
Intervalo = Observacin Grande Observacin Pequea.
Paso 2: Dividir el intervalo entre 5 y 20 clases de igual anchura. El nmero de clases es
arbitrario, pero se obtiene una mejor descripcin grafica si se utiliza pocas clases cuando el
nmero de datos es pequeo y un mayor nmero de clases cuando el conjunto de datos es
grande. La frontera de la clases ms baja ( o primera) deber estar situada por debajo de la
medicin ms pequea, y el ancho de la clase debe ser tal que ninguna observacin pueda
quedar exactamente en la frontera de una clases.

Se pueden calcular de la siguiente

manera:

Intervalo
= anchura de clase
# clases
O bien,

Intervalo
= # clase
anchura de clases
Si la precisin es:
una unidad entera (1) entonces es 1/2 = 0.5, la primera clases comenzar restndole 0.5
a la observacin mas pequeo
una unidad decimal (0.1) entonces es 0.1/2 = 0.05, la primera clases empieza restndole
0.05 a la observacin mas pequea.
Paso 3: para cada clase, contar el numero de observaciones que caen en esa clase. Este
nmero es la frecuencia de clases.
Datos obtenidos.
Por ejemplo: en la tabla que sigue se recogen los pesos de 40 estudiantes varones de una
universidad, con precisin de 1 libra. Construir una distribucin de frecuencias.

41

UNIDAD I / ESTADISTICA DESCRIPTIVA.

138 164 150 132 144 125 149 157


146 158 140 147 136 148 152 144
168 126 138 176 163 119 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 128
El mtodo textual tiene una ventaja importante con respecto a los otros: se puede influenciar
al lector. El autor puede resaltar ciertas cifras de su inters, puede remarcar conceptos
apropiados para sus fines y hacer pasar desapercibidos a los otros. Se puede focalizar la
atencin del lector, de tal manera que pase por alto ciertos datos evitando que saque sus
propias conclusiones.

1.6.1 Distribuciones numricas.


Mtodo de presentacin de datos tabular.
Una ordenacin es un conjunto de datos numricos en orden creciente o decreciente. Este
mtodo de presentacin de la informacin consiste en presentar los datos por medio de una
tabla o cuadro.
Ejercicio: Los tiempos de CPU que se indican en la tabla representan el tiempo ( en
segundos) que 25 trabajos estuvieron en control de la unidad central de proceso (CPU) de
una computadora mainframe grande. Estos 25 valores representan

una muestra

seleccionada de los 1000 tiempos de CPU .


Tabla de muestra de n = 25 tiempos de
CPU de trabajos (en segundos ).
1.17

1.61

1.16

1.38

3.53

1.23

3.76

1.94

0.96

4.75

0.15

2.41

0.71

0.02

1.59

0.19

0.82

0.47

2.16

2.01

0.92

0.75

2.59

3.07

1.40

42

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.6.2 Distribuciones categricas.


Al resumir grandes colecciones de datos, es til distribuirlos en clases o categoras, y
determinar el nmero de individuos que pertenecen a cada clase, llamado frecuencia de
clase. Una disposicin tabular de los datos por clase junto con las correspondientes
frecuencias de clase, se llama distribucin de frecuencia ( o tabla de frecuencia).
Ejemplos:
Intervalo = 4.75 0.02 = 4.73
Anchura aproximada de la clase es:

int ervalo 4.73


=
= 0.676 0.7
7
7
Nota: si deseo saber la anchura de la clases entonces selecciono de manera arbitraria el
numero de clases en este caso el numero 7 indica el numero de clases ( filas) y el resultado
es la anchura de cada clases.
Como la tabla contiene datos con valores de centsimas entonces el grado de precisin es de
0.01 por lo tanto se deber de utilizar 0.01/2 = 0.005. por lo cual al intervalo menor que es de
0.02 se le restara 0.05. Ahora el primer valor en la tabla iniciara en 0.015.
clase Intervalo

de Tabulacin Frec.

clase
1

0.015 0.715

/////

0.715 1.415

/////////

1.415 2.115

////

2.115 2.815

///

2.815 3.515

3.515 4.215

//

4.215 4.915

43

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.6.3 Distribuciones acumuladas.


Intervalo

de Frecuencia Distribucin

clase

de clase

acumulada

0.015 0.715

0.715 1.415

14

1.415 2.115

18

2.115 2.815

21

2.815 3.515

22

3.515 4.215

24

4.215 4.915 1

25

Total

25

Distribucion acumulada

30
25
20
15
10
5
0
1

1.6.4 Distribuciones porcentuales.


En esta distribucin tenemos a la distribucin de frecuencia relativa y ojivas porcentuales que
se encuentra multiplicando la frecuencia relativa por cien para que los resultados estn en
porcentajes . Y la suma de todas estas frecuencias resulte al 100 %.

Frecuencia relativa =

Frecuencia
N

Frecuencia relativa y ojivas = Frec. Re l * 100

44

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Intervalo de clase

Frec.

Frec. relativa

frecuencia relativa y ojivas porcentual (%)

0.015 0.715

0.20

20

0.715 1.415

0.36

36

1.415 2.115

0.16

16

2.115 2.815

0.12

12

2.815 3.515

0.04

3.515 4.215

0.08

0.04

25

1.00

4.215 4.915
Total

Frecuencia relativa porcentual


40
35
30
25
20
15
10
5
0
1

1.6.5 Distribuciones porcentuales acumuladas.


Las distribuciones porcentuales acumuladas resulta dividiendo la distribucin acumulada
entre la frecuencia total y multiplicada por 100 para que los resultados resulten en porcentajes
y al terminar el ultimo calculo debe ser al cien por ciento.

Intervalo de clase

Frec.

Distribucin acumulada Dist. porcentuales acumulada (%)

0.015 0.715

20

0.715 1.415

14

56

1.415 2.115

18

72

2.115 2.815

21

84

2.815 3.515

22

88

3.515 4.215

24

96

25

100

4.215 4.915
Total

25

45

UNIDAD I / ESTADISTICA DESCRIPTIVA.

DPA =

D. A
* 100
N
Distribucion Porcentual Acumulada
120
100
80
60
40
20
0
1

1.7 Tcnicas de agrupacin de datos.


1.7.1 Lmites de clase.
118 y 122 se llaman limite de clase
118 se llama limite inferior y 122 limite superior de clase

1.7.2 Rango de clase.


El tamao o anchura de un intervalo de clase es la diferencia entre las fronteras de clase
superior e inferior.
C = 122.5 117.5 = 5

1.7.3 Fronteras de clase.


Si se dan valores con precisin de 1 unidad, el intervalo
tericamente todas las medias desde 117.5

de clase 118 122 incluye

a 122.5 y se llaman frontera de clase o

verdaderos limites de clase; el menor 117.5 es la frontera inferior y el mayor 122.5 la frontera
superior.

46

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.7.4 Marca de clase.


La marca de clase es el punto medio del intervalo de clase y se obtiene promediando los
limites inferior y superior de clase . As que las marcas de clase del intervalo 118 122 es
(118 + 122 ) / 2 = 120

1.7.5 Intervalo de clase.


Los valores de 118 122 se les llaman intervalo de clases
Ejercicio: en la tabla siguiente se recogen los pesos de 40 estudiantes varones de una
universidad, con precisin de 1 libra. Construir:
a) una distribucin de frecuencia.
b) Distribucin de frecuencia acumulada
c) Grafica de la distribucin de frecuencia acumulada
d) Frecuencia relativa
e) Frecuencia relativa y ojivas porcentuales
f)

Grafica de la frecuencia relativa y ojivas porcentuales

g) Distribucin porcentuales acumuladas


h) Grafica de la distribucin porcentuales acumuladas
119

138

146

156

125

140

147

157

126

140

147

158

128

142

148

161

132

142

149

163

135

144

150

164

135

144

150

165

135

145

152

168

136

145

153

173

138

146

154

176

Los pesos son 176 y 119 lb.; El intervalo es 176 119 = 57 lb.
Si se usan 5 u 20 intervalos de clase su anchura ser:

57
= 11.4 = 11
5

57
= 2.85 = 3
20

47

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Una coleccin razonable es 5 lb.


Se inicia desde un valor de precisin antes para que se considere que los valores deben de
caer dentro del intervalo.
Peso (lb.)

Frecuencia

Distribucin

frecuencia

frecuencia

Distribucin

acumulada

relativa

relativa y ojivas

porcentuales

porcentual (%) acumulada (%)


118 122

0.025

2.5

2.5

123 127

0.05

7.5

128 132

0.05

12.5

133 137

0.1

10

22.5

138 142

15

0.15

15

37.5

143 147

23

0.2

20

57.5

148 152

28

0.125

12.5

70

153 157

32

0.1

10

80

158 162

34

0.05

85

163 167

37

0.075

7.5

92.5

168 172

38

0.025

2.5

95

173 - 177

40

0.05

100

1.00

100

Total 40

Grficos
a) Distribucin acumulada

b) Distribucin relativa y ojivas

c)

Frecuencia

porcentual

acumulada
Distribucin acumulada

frecuencia relativa y ojivas porcentual (%)

25

50

100

20

40
30

15

20

10

10

frecuencia porcentual acumulada

120

80
60

0
1

9 10 11 12

40
20

0
1

9 10 11 12

10 11 12

48

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Histogram

14

12

Frequency

10

2
Mean = 146.8
Std. Dev. = 13.051
N = 40

0
110

120

130

140

150

160

170

180

PESO

Ejercicio. Tabla de una distribucin de frecuencia de puntuaciones de un examen final de lgebra


Grado

Numero de estudiante

Marca de clases (x)

fx

30 39

34.5

34.5

40 49

44.5

133.5

50 59

11

54.5

599.5

60 69

21

64.5

1354.5

70 79

43

74.5

3203.5

80 89

32

84.5

2704

90 - 100

95.0

855

N = f = 120

fx = 8884.5

a) marca de clases
x 1 = 34.5; x2 =44.5; x3 = 54.5 ; x4 = 64.5 ; x5 = 74.5; x6 = 84.5 ; x7 = 95.0
b) media aritmtica

x=

fx = 8884.5 = 74.04
120

c) mediana
120/2 = 60
1 + 3 + 11 + 21 = 36
1 + 3 + 11 + 21 + 43 = 79
70 79

43 clase mediana

49

UNIDAD I / ESTADISTICA DESCRIPTIVA.

120

36

2
(10) = 75.08
mediana = 69.5 +
43

d) moda
70 79

43

22
mod a = 69.5 +
(10 ) = 76.17
22 + 11
Problema: En la tabla siguiente se recogen los pesos de 40 estudiantes varones de una
universidad con precisin de una libra.
Peso (lb.)

Frecuencia (f)

118 126

127 135

136 144

145 153

12

154 162

163 171

172 180

2
N = f = 40

Hallar:
a) Marca de clases
b) Media aritmtica
c) Mediana y moda
d) trazar un histograma y polgono de frecuencia

1.7.6 Diagrama de tallos y hojas.


Un mtodo para iniciar el anlisis exploratorio de los datos, previo al uso de los mtodos
estadsticos tradicionales, y que adems proporciona informacin rpida, visual y es
relativamente nueva, es la representacin grfica de tallos y hoja. Esta representacin se
basa en la ordenacin de los datos a manera de grfico, pero sin llegar a ello, utilizando las
decenas y las unidades.

50

UNIDAD I / ESTADISTICA DESCRIPTIVA.

78

93

61 100 70 83

88 74 97 72

66

73

76 81

91 70 77 86

83 64

Ahora pensaremos en cada uno de los datos separando las decenas de las unidades, es decir,
el nmero 51 se ver como 5 | 1.
6

8 0 4 2 3 6 0 7

10

6
1

Para entenderle un poco ms, hemos de decir que el primer rengln que dice 6 | 1 6 4 quiere
decir que entre la lista de datos se encuentran los valores 61, 66 y 64. Esta es la representacin
grfica tallos y hoja, donde cada rengln es una posicin de tallos y cada dgito de la derecha
es una hoja.
El procedimiento para realizarla es primero empezar con los tallo, es decir la columna de la
izquierda, y despus dato por dato ir llenando las hojas a la derecha de la lnea vertical, en el
tronco correspondiente. Adems, si se desean tener los datos ordenados, y hay gente que lo
prefiere as, se pueden ordenar las hojas en cada rengln para que la representacin quede
como sigue:
6

10

4
0

2
3

6
4

3
3

7
6

8
8
7

En realidad una representacin de tallos y hojas presenta la misma informacin que la lista
original de datos, pero de una manera mucho ms compacta (especialmente si la lista de datos
es ms grande) y manejable.
Ejemplo: Los tiempos de CPU que se indican en la tabla representan el tiempo (en segundos)
que 25 trabajos estuvieron en control de la unidad central de proceso (CPU) de una

51

UNIDAD I / ESTADISTICA DESCRIPTIVA.

computadora mainframe grande. Estos 25 valores representan una muestra seleccionada de los
1000 tiempos de CPU:
1.17

1.61

1.16

1.38

3.53

1.23

3.76

1.94

0.96

4.75

0.15

2.41

0.71

0.02

1.59

0.19

0.82

0.47

2.16

2.01

0.92

0.75

2.59

3.07

1.40

Ramas hojas

Frecuencia

02 15 19 47 71 75 82 92 9

96

16 17 23 38 40 59 61 94 4

01 16 41 59

07 53 76

75
25

1.7.7 Diagrama de Pareto.


El Diagrama de Pareto constituye un sencillo y grfico mtodo de anlisis que permite
discriminar entre las causas ms importantes de un problema (los pocos y vitales) y las que lo
son menos (los muchos y triviales). El Diagrama de Pareto es una grfica en donde se
organizan diversas clasificaciones de datos por orden descendente, de izquierda a derecha por
medio de barras sencillas despus de haber reunido los datos para calificar las causas. De
modo que se pueda asignar un orden de prioridades.
Ventajas:

Ayuda a concentrarse en las causas que tendrn mayor impacto en caso de ser
resueltas.

Proporciona una visin simple y rpida de la importancia relativa de los problemas.

Ayuda a evitar que se empeoren alguna causas al tratar de solucionar otras y puede
ser resueltas.

52

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Su formato altamente visible proporciona un incentivo para seguir luchando por ms


mejoras.

Cundo se utiliza?

Al identificar un producto o servicio para el anlisis para mejorar la calidad.

Cuando existe la necesidad de llamar la atencin a los problema o causas de una forma
sistemtica.

Al identificar oportunidades para mejorar

Al analizar las diferentes agrupaciones de datos (ej: por producto, por segmento, del
mercado, rea geogrfica, etc.)

Al buscar las causas principales de los problemas y establecer la prioridad de las


soluciones

Al evaluar los resultados de los cambios efectuados a un proceso (antes y despus)

Cuando los datos puedan clasificarse en categoras

Cuando el rango de cada categora es importante

Pareto es una herramienta de anlisis de datos ampliamente utilizada y es por lo tanto til en la
determinacin de la causa principal durante un esfuerzo de resolucin de problemas. Este
permite ver cules son los problemas ms grandes, permitindoles a los grupos establecer
prioridades.
En casos tpicos, los pocos (pasos, servicios, tems, problemas, causas) son responsables por
la mayor parte el impacto negativo sobre la calidad. Si enfocamos nuestra atencin en estos
pocos vitales, podemos obtener la mayor ganancia potencial de nuestros esfuerzos por mejorar
la calidad.
Un equipo puede utilizar la Grfica de Pareto para varios propsitos durante un proyecto
para lograr mejoras:

Para analizar las causas

Para estudiar los resultados

Para planear una mejora continua

Las Grficas de Pareto son especialmente valiosas como fotos de antes y despus
para demostrar qu progreso se ha logrado. Como tal, la Grfica de Pareto es una
herramienta sencilla pero poderosa.

53

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Cmo se utiliza?

Seleccionar categoras lgicas para el tpico de anlisis identificado (incluir el periodo


de tiempo).

Reunir datos. La utilizacin de un check List puede ser de mucha ayuda en este paso.

Ordenar los datos de la mayor categora a la menor

Totalizar los datos para todas las categoras

calcular el porcentaje del total que cada categora representa

trazar los ejes horizontales (x) y verticales (y primario - y secundario)

trazar la escala del eje vertical izquierdo para frecuencia (de 0 al total, segn se calcul
anteriormente)

de izquierda a derecha trazar las barras para cada categora en orden descendente. Si
existe una categora otros, debe ser colocada al final, sin importar su valor. Es decir,
que no debe tenerse en cuenta al momento de ordenar de mayor a menor la frecuencia
de las categoras.

trazar la escala del eje vertical derecho para el porcentaje acumulativo, comenzando
por el 0 y hasta el 100%

trazar el grfico lineal para el porcentaje acumulado, comenzando en la parte superior


de la barra de la primera categora (la mas alta)

dar un ttulo al grfico, agregar las fechas de cuando los datos fueron reunidos y citar la
fuente de los datos.

analizar la grfica para determinar los pocos vitales

Consejos para la construccin / interpretacin


Como hemos visto, un Diagrama de Pareto es un grfico de barras que enumera las categoras
en orden descendente de izquierda a derecha, el cual puede ser utilizado por un equipo para
analizar causas, estudiar resultados y planear una mejora contina.
Dentro de las dificultades que se pueden presentar al tratar de interpretar el Diagrama de
Pareto es que algunas veces los datos no indican una clara distincin entre las categoras. Esto
puede verse en el grfico cuando todas las barras son ms o menos de la misma altura.
Otra dificultad es que se necesita ms de la mitad de las categoras para sumar ms del 60%
del efecto de calidad, por lo que un buen anlisis e interpretacin depende en su gran mayora
de un buen anlisis previo de las causas y posterior recogida de datos.

54

UNIDAD I / ESTADISTICA DESCRIPTIVA.

En cualquiera de los casos, parece que el principio de Pareto no aplica. Debido a que el mismo
se ha demostrado como vlido en literalmente miles de situaciones, es muy poco probable que
se haya encontrado una excepcin.
Es mucho ms probable que simplemente no se haya seleccionado un desglose apropiado de
las categoras.
Esto nos lleva a la conclusin que para llevar a cabo un proceso de Resolucin de Problemas
/Toma de Decisiones (RP/TD) es necesario manejar cada una de las herramientas bsicas de la
calidad, tanto desde el punto de vista terico como desde su aplicacin.
La interpretacin de un Diagrama de Pareto se puede definir completando las siguientes
oraciones de ejemplo:
Existen (nmero de categoras) contribuyentes relacionados con (efecto).
Pero estos (nmero de pocos vitales) corresponden al (nmero) % del total (efecto). Debemos
procurar estas (nmero) categoras pocos vitales, ya que representan la mayor ganancia
potencial para nuestros esfuerzos.
Relacin con otras herramientas
Un Diagrama de Pareto generalmente se relaciona con:

diagrama de Causa y Efecto (Ishikawa)

Check List de Revisin

Check List de reunin de datos

Matriz para la Planeacin de Acciones

Ejemplo: Un fabricante de heladeras desea analizar cules son los defectos ms frecuentes que
aparecen en las unidades al salir de la lnea de produccin.
Para esto, empez por clasificar todos los defectos posibles en sus diversos tipos:

55

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Tipo de Defecto

Detalle del Problema

Motor no detiene

No para el motor cuando alcanza Temperatura

No enfra

El motor arranca pero la heladera no enfra

Burlete Def.

Burlete roto o deforme que no ajusta

Pintura Def.

Defectos de pintura en superficies externas

Rayas

Rayas en las superficies externas

No funciona

Al enchufar no arranca el motor

Puerta no cierra

La puerta no cierra correctamente

Gavetas Def.

Gavetas interiores con rajaduras

Motor no arranca

El motor no arranca despus de ciclo de parada

Mala Nivelacin

La heladera se balancea y no se puede nivelar

Puerta Def.

Puerta de refrigerador no cierra hermticamente

Otros

Otros Defectos no incluidos en los anteriores

Posteriormente, un inspector revisa cada heladera a medida que sale de produccin registrando
sus defectos de acuerdo con dichos tipos.
Despus de inspeccionar 88 heladeras, se obtuvo una tabla como esta:

Tipo de Defecto

Detalle del Problema

Frec.

Burlete Def.

Burlete roto o deforme que no ajusta

Pintura Def.

Defectos de pintura en superficies externas

Gavetas Def.

Gavetas interiores con rajaduras

Mala Nivelacin

La heladera se balancea y no se puede nivelar

Motor no arranca

El motor no arranca despus de ciclo de parada

Motor no detiene

No para el motor cuando alcanza Temperatura

36

No enfra

El motor arranca pero la heladera no enfra

27

No funciona

Al enchufar no arranca el motor

Otros

Otros Defectos no incluidos en los anteriores

Puerta Def.

Puerta de refrigerador no cierra hermticamente

56

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Puerta no cierra

La puerta no cierra correctamente

Rayas

Rayas en las superficies externas

Total:

88

Pero Cules son los defectos que aparecen con mayor frecuencia? Para hacerlo ms
evidente, antes de graficar podemos ordenar los datos de la tabla en orden decreciente de
frecuencia:

Tipo de Defecto Detalle del Problema


Motor

no No

para

el

motor

Frec. Frec. Rel. Prop. acum.


cuando

alcanza 36

0.4091

detiene

Temperatura

0.4091

No enfra

El motor arranca pero la heladera no enfra

27

0.3068

0.7159

Burlete Def.

Burlete roto o deforme que no ajusta

0.1023

0.8182

Pintura Def.

Defectos de pintura en superficies externas

0.0568

0.8750

Rayas

Rayas en las superficies externas

0.0455

0.9205

No funciona

Al enchufar no arranca el motor

0.0227

0.9432

Puerta no cierra La puerta no cierra correctamente

0.0227

0.9659

Gavetas Def.

0.0114

0.9773

Mala Nivelacin La heladera se balancea y no se puede 1

0.0114

Gavetas interiores con rajaduras

nivelar
Motor

0.9886

no El motor no arranca despus de ciclo de 1

arranca

parada

Puerta Def.

Puerta

0.0114
1.0000

de

refrigerador

no

cierra 0

0.0000

hermticamente
Otros
Total:

1.0000

Otros Defectos no incluidos en los anteriores 0


88

0.0000

1.0000

1.0000

Vemos que la categora otros siempre debe ir al final, sin importar su valor. De esta manera, si
hubiese tenido un valor ms alto, igual debera haberse ubicado en la ltima fila.

57

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Ahora resulta evidente cuales son los tipos de defectos ms frecuentes. Podemos observar
que los 3 primeros tipos de defectos se presentan en el 82 % de las heladeras,
aproximadamente. Por el Principio de Pareto, concluimos que: La mayor parte de los defectos
encontrados en el lote pertenece slo a 3 tipos de defectos, de manera que si se eliminan las
causas que los provocan desaparecera la mayor parte de los defectos.

1.5000
1.0000
0.5000
0.0000
1

11

Ejemplo: Considere un problema de inters para la Divisin de Economa Comercial ( BED ,


Business Economics Divisin) del Departamento del trabajo de Estados Unidos. Cada ao, la
BED monitorea las empresas que fracasan y clasifican cada fracaso en categoras. Estas
clasificaciones se basan en opiniones de acreedores informados y los informes la BED. Estas
frecuencias se muestran en el diagrama de Pareto.
Causas subyacentes

Frec. Frec. Rel.

Proporcin acum.

Incompetencias

698

0.477

0.477

Experiencia desequilibrada

314

0.215

0.692

Falta de experiencia gerencial

236

0.161

0.853

Falta de experiencia de lnea

111

0.076

0.929

Causas desconocidas

83

0.057

0.986

Otras causas

0.014

1.000

1463

1.000

Totales

1.5
1
0.5
0
1

58

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.7.8 Diagrama de puntos.


78 93 61 100 70 83 88 74 97 72
66 73 76 81

83 64 91 70 77 86

120
100
80
60
40
20
0
0

10

15

20

25

1.8 Histograma.
1.8.1 Diagrama de barras.
En este tipo de grfica, sobre los valores de las variables se levantan barras estrechas de
longitudes proporcionales a las frecuencias correspondientes. Se utilizan para representar
variables cuantitativas discretas. Consiste en representar las cantidades con rectngulos de
igual base, y de altura proporcional a los valores respectivos. Los intervalos libres entre barras
tambin deben ser del mismo tamao, aunque a veces algunos autores las muestran pegadas.

1.8.2 Polgono de frecuencias.


Otra forma de representacin de un uso menos comn, y muy parecida a las grficas de lneas,
es el polgono de frecuencias. La diferencia fundamental entre ambas es que en el polgono de
frecuencias se aaden dos clases con frecuencias cero: una antes de la primera clase con

59

UNIDAD I / ESTADISTICA DESCRIPTIVA.

datos y otra despus de la ltima. El resultado es que se "sujeta" la lnea por ambos extremos al
eje horizontal y lo que podra ser una lnea separada del eje se convierte, junto con ste, en un
polgono.
El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigacin
durante el ao de 1990 en cinco pases (fuente: Revista "Ciencia y Desarrollo", 1994,
XIX(114):12):

Un polgono de frecuencia es un grafico de trozos de las frecuencias de clase con relacin a la


marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los
rectngulos de los histogramas. Se suelen aadirse longitudes PQ y RS a las marcas de clase
extremas como asociadas a una frecuencia de clase cero.

1.8.3 Ojivas.
Una grfica similar al polgono de frecuencias es la ojiva, pero sta se obtiene de aplicar
parcialmente la misma tcnica a una distribucin acumulativa y de igual manera que stas,
existen las ojivas mayor que y las ojivas menor que.

60

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Existen dos diferencias fundamentales entre las ojivas y los polgonos de frecuencias (y por
sto la aplicacin de la tcnica es parcial):
Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el
extremo izquierdo; para la ojiva menor que, con el derecho.
En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase.
Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.
Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que,
utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que est
sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las
4:00 horas (en cuestiones temporales se dira: despus de las 4:00 horas). De forma anloga,
en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el nmero
de observaciones menores que la frontera sealada (en caso de tiempos sera el nmero de
observaciones antes de la hora que seala la frontera).

1.8.4 Grficas circulares.


En un diagrama de este tipo, los 360 de un crculo se reparten proporcionalmente a las
frecuencias de los distintos valores de la variable. Resultan muy adecuados cuando hay pocos
valores, o bien cuando el carcter que se estudia es cualitativo. El diagrama de sectores
siguiente refleja el resultado de una encuesta (realizada a 300 personas) sobre los tipos de
pelcula preferidos por el pblico en general:

61

UNIDAD I / ESTADISTICA DESCRIPTIVA.

1.9 Distribuciones mustrales.


Como una estadstica es una variable aleatoria que depende solo de la muestra observada,
debe tener una distribucin de probabilidad. Esta distribucin de probabilidad de una estadstica
se llama distribucin muestral. La distribucin muestral de la estadstica depende del tamao de
la poblacin, el tamao de las muestras y el mtodo de eleccin de las muestras
Si se selecciona n elementos de una poblacin de modo tal que cada conjunto de n elementos
de la poblacin tenga la misma probabilidad de ser seleccionado, se dice que los n elementos
constituyen una muestra aleatoria.

62

UNIDAD I / ESTADISTICA DESCRIPTIVA.

El resultado de un experimento estadstico se puede registrar como un valor numrico o como


una representacin descriptiva. Cuando se lanza un par de dados y el total es un resultado de
inters, registramos un valor numrico. El estadstico se interesa en primer lugar en el anlisis
de los datos numricos. En cualquier estudio, el nmero de observaciones posibles puede ser
pequeo, grande

pero finito o infinito. Por ejemplo si a los alumnos estudiantes de cierta

escuela se les hacen una pruebas de sangre y el tipo sanguneo se puede clasificar en ocho
maneras. Puede ser AB, A, B u O, con un signo mas o uno menos, que dependen de la
presencia o ausencia del antgeno R h. la clasificacin de tipos sanguneos solo podemos tener
tantas observaciones como estudiantes haya en la escuela. El proyecto por tanto tiene como
resultados un numero finito de observaciones.
Sea x

, x 2, ..., x

variable aleatorias independientes, cada una con la misma distribucin de

probabilidad f (x). Definimos entonces a x 1 , x 2, ..., x n como una muestra aleatoria de tamao n
de la poblacin f(x) y escribimos su distribucin de probabilidad conjunta como:

F ( x1 , x2 ,..., xn ) = f ( x1 ) f ( x2 ),..., f ( xn )
La distribucin de probabilidad de una estadstica se llama distribucin muestral. La distribucin
de probabilidad de x se llama distribucin la media.
La distribucin muestral de una estadstica depende del tamao de la poblacin, el tamao de
las muestras y el mtodo de eleccin de las muestras.
Se debe ver las distribuciones mustrales de x y S2 como el mecanismo a partir del cual
haremos finalmente inferencias de los parmetros y 2.
Cuando las muestras son lo suficientemente grandes, se pueden hacer inferencias analticas
bastante extensas, con pocos y simples recursos, en comparacin con tcnicas ms refinadas
de la Estadstica. Esto es conveniente desde un punto de vista didctico.
La Teora del muestreo es el estudio de las relaciones entre una poblacin y las muestras que
se extraen de ella. Del anlisis de las muestras se pueden estimar o inferir datos de la poblacin
como su media ( ), varianza ( ), etc., llamados parmetros poblacionales. Cuando la
2

poblacin sea finita y de un tamao manejable en tiempo y costo, los valores poblacionales se
calculan directamente, sin necesidad del muestreo.

63

UNIDAD I / ESTADISTICA DESCRIPTIVA.

Uno de los propsitos de la estadstica inferencial es estimar las caractersticas poblacionales


desconocidas, examinando la informacin obtenida de una muestra, de una poblacin. El
punto de inters es la muestra, la cual debe ser representativa de la poblacin objeto de
estudio. Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras
reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden hacer
observaciones probabilsticas sobre una poblacin cuando se usan muestras representativas
de la misma.
Muestras Aleatorias
Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan muestras
por muchas razones; una enumeracin completa de la poblacin, llamada censo, puede ser
econmicamente imposible, o no se cuenta con el tiempo suficiente.
A continuacin se ver algunos usos del muestreo en diversos campos:
1. Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinin pblica y el apoyo en las elecciones.
2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan para
determinar la eficiencia de una tcnica o programa de enseanza.
3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la calidad.
4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban la
eficacia de una tcnica o de un frmaco nuevo.
5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la produccin los
efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los criterios
del pblico sobre cuestiones relacionadas con el bienestar y la seguridad nacional.
Tipos de distribuciones mustrales:

Distribucin muestral de la media con varianza conocida.

Distribucin muestral de diferencia de medias.

Distribucin muestral de proporcin.

Distribucin muestral de diferencia de proporciones.

Distribucin muestral de varianza.

Distribucin muestral de razn de varianza.

64

UNIDAD 2
PROBABILIDAD

Objetivo:
Conocer los conceptos bsicos
de probabilidad para aplicarlos
en la solucin de Problemas.

UNIDAD II / PROBABILIDAD.

2.1 Teora elemental de probabilidad.


La Teora de la Probabilidad constituye la base o fundamento de la Estadstica, ya que las
inferencias que hagamos sobre la poblacin o poblaciones en estudio se movern dentro de
unos mrgenes de error controlado, el cual ser medido en trminos de probabilidad.
As pues, es comn y corriente hablar de la probabilidad de un suceso, entendiendo como tal
un nmero entre 0 y 1, de forma que si ste es cercano a 0 (a l), el suceso tiene poca
(mucha) probabilidad de ocurrir o haber ocurrido.
Vemos, pues, que conviene precisar en cada caso de qu se est hablando, tratando de
evitar afirmaciones tan comunes en los medios de comunicacin como la de "... maana es
posible que llueva pero no es probable...".

2.1.1 Concepto clsico y como frecuencia relativa.

C o n c e p to

E n fo q u e c la s ic o o
a p rio ri
E n fo q u e c o m o fre c u e n c ia re la tiv a o
a p o s te rio ri

Concepto clsico
Est basado en el concepto de resultados igualmente verosmiles y motivado por el
denominado Principio de la Razn Insuficiente, el cual postula que si no existe un
fundamento para preferir una entre varias posibilidades, todas deben ser consideradas
equiprobables.
As, en el lanzamiento de una moneda perfecta la probabilidad de cara debe ser igual que la
de cruz y, por tanto, ambas iguales a 1/2. De la misma manera, la probabilidad de cada uno
de los seis sucesos elementales asociados al lanzamiento de un dado debe ser 1/6. Laplace
recogi esta idea y formul la regla clsica del cociente entre casos favorables y casos
posibles, supuestos stos igualmente verosmiles.
El problema aqu surge porque en definitiva igualmente verosmil es lo mismo que
igualmente probable, es decir, se justifica la premisa con el resultado. Adems qu ocurre

66

UNIDAD II / PROBABILIDAD.

cuando estamos considerando un experimento donde no se da esa simetra?, o, qu hacer


cuando el nmero de resultados posibles es infinito?.
Si un suceso E puede ocurrir en h maneras diferentes de un nmero total de n maneras
posibles, todos igualmente factibles. Entonces la probabilidad de que ocurra E (o sea un
xito) se denota por
p = Pr { E }= h / n
La probabilidad de que no ocurra E (o sea un fracaso) se denota por
q = Pr { no E }
q=(nh)/n
q = 1 h /n
q=1-p
q = 1 - Pr { E }
As pues, p + q = 1 , es decir,
Pr { E } + Pr {no E } = 1.
El suceso no E se denotara por E.
Ejemplo: sea e el suceso de que al tirar un dado una vez salga un 3 o un 4. Hay seis formas
de caer el dado, dando 1, 2, 3, 4, 5, o 6, como E puede ocurrir de dos formas tenemos:
p = Pr { E }= 2/6 = 1/3
La probabilidad de que no salga ni 3 ni 4 es:
q = Pr { no E }= 1 1/3 = 2/3

Concepto frecuentista
Es un hecho, empricamente comprobado, que la frecuencia relativa de un suceso tiende a
estabilizarse cuando la frecuencia total aumenta. Surge as el concepto frecuentista de la
probabilidad de un suceso como un nmero ideal al que converge su frecuencia relativa
cuando la frecuencia total tiende a infinito.

67

UNIDAD II / PROBABILIDAD.

As, solemos afirmar que la probabilidad de que salga un seis al tirar un dado es 1/6 porque
al hacer un gran nmero de tiradas su frecuencia relativa es aproximadamente esa. El
problema radica en que al no poder repetir la experiencia infinitas veces, la probabilidad de
un suceso ha de ser aproximada por su frecuencia relativa para un n suficientemente
grande, y cun grande es un n grande? 0, qu hacer con aquellas experiencias que solo
se pueden repetir una vez?
Si despus de n repeticiones de un experimento, donde n es muy grande, un suceso ocurre
h veces entonces la probabilidad del suceso es h / n. Esto tambin se llama la probabilidad
estimada o emprica, de un suceso se toma como la frecuencia relativa de ocurrencia del
suceso cuando el nmero de observaciones es muy grande.
Ejemplo: Si en 1000 tiradas de una moneda salen 529 caras, la frecuencia relativa de caras
es: 529/1000 = 0.529

Definicin formal de Probabilidad


Los anteriores conceptos de lo que debera ser la probabilidad de un suceso, llevaron a
Kolmogorov a dar una definicin axiomtica de probabilidad. Es decir, a introducir rigor
matemtico en el concepto de probabilidad, de forma que se pudiera desarrollar una teora
slida sobre el concepto definido.
As, llamaremos probabilidad a una aplicacin

P : A a [0,1]
Tal que:
Axioma 1: Para todo suceso A de A sea

P ( A) 0

Axioma 2: Sea P() = 1


Axioma 3: Para toda coleccin de sucesos incompatibles, {Ai } con Ai A j =

i j,

debe ser


P U Ai = P ( Ai )
i =1 i =1

68

UNIDAD II / PROBABILIDAD.

Obsrvese que esta definicin no dice cmo asignar las probabilidades ni siquiera a los
sucesos elementales. Solo dice que cualquier asignacin que hagamos debe verificar estos
tres axiomas para que pueda llamarse Probabilidad.

2.1.2 Interpretacin subjetiva de la probabilidad.


Concepto subjetivo
Se basa en la idea de que la probabilidad que una persona da a un suceso debe depender
de su juicio y experiencia personal, pudiendo dar dos personas distintas probabilidades
diferentes a un mismo suceso. Estas ideas pueden formalizarse, y si las opiniones de una
persona satisfacen ciertas relaciones de consistencia, puede llegarse a definir una
probabilidad para los sucesos. El principal problema a que da lugar esta definicin es, como
antes dijimos, que dos personas diferentes pueden dar probabilidades diferentes a un mismo
suceso.
La probabilidad subjetiva de un evento se la asigna la persona que hace el estudio, y
depende del conocimiento que esta persona tenga sobre el tema. Precisamente por su
carcter de subjetividad no se considera con validez cientfica, aunque en la vida diaria es de
las ms comunes que se utilizan al no apoyarse ms que en el sentido comn y los
conocimientos previos, y no en resultados estadsticos.

2.2 Probabilidad de eventos.

2.2.1 Definicin de espacio muestral.


La Estadstica, y por tanto el Clculo de Probabilidades, se ocupan de los denominados
fenmenos o experimentos aleatorios. El conjunto de todos los resultados posibles
diferentes de un determinado experimento aleatorio se denomina Espacio Muestral asociado
a dicho experimento y se suele representar por . A los elementos de se les denomina
sucesos elementales.
As por ejemplo, el espacio muestral asociado al experimento aleatorio consistente en el
lanzamiento de una moneda es = {Cara, Cruz}; el espacio muestral asociado al
lanzamiento de un dado es ={1, 2, 3, 4, 5, 6}, siendo Cara y Cruz los sucesos elementales
asociados al primer experimento aleatorio y 1, 2, 3, 4, 5 y 6 los seis sucesos elementales del
segundo experimento aleatorio.

69

UNIDAD II / PROBABILIDAD.

A pesar de la interpretacin que tiene el espacio muestral, no es ms que un conjunto


abstracto de puntos (los sucesos elementales), por lo que el lenguaje, los conceptos y
propiedades de la teora de conjuntos constituyen un contexto natural en el que desarrollar el
Clculo de Probabilidades.
Sea A el conjunto de las partes de, es decir, el conjunto de todos los subconjuntos de . En
principio, cualquier elemento de A, es decir, cualquier subconjunto del espacio muestral
contendr una cierta incertidumbre, por lo que trataremos de asignarle un nmero entre 0 y 1
como medida de su incertidumbre.
En Clculo de Probabilidades dichos subconjuntos reciben en el nombre de sucesos, siendo
la medida de la incertidumbre su probabilidad. La tripleta (,A,P) recibe el nombre de
espacio probabilstico.
Por tanto, asociado a todo experimento aleatorio existen tres conjuntos: El espacio muestral
, la clase de los sucesos, es decir, el conjunto de los elementos con incertidumbre asociados
a nuestro experimento aleatorio A, y una funcin real,

P : A a [0,1]
La cual asignar a cada suceso (elemento de A) un nmero entre cero y uno como medida
de su incertidumbre.
Advertimos no obstante, que la eleccin del espacio muestral asociado a un experimento
aleatorio no tiene por qu ser nica, sino que depender de que sucesos elementales
queramos considerar como distintos y del problema de la asignacin de la probabilidad
sobre esos sucesos elementales.
Problema: Liste los elementos de cada uno de los espacios mustrales siguientes:
a) El conjunto de enteros entre 1 y 50 divisibles entre 8
b) El conjunto S = {x | x 2 + 4x 5 = 0}
c)

Describir un espacio muestral para una tirada de un par de dados

Solucin:
a)

S = {8, 16, 24, 32, 40, 48 };

b)

S = {-5, 1}

70

UNIDAD II / PROBABILIDAD.

c)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)

2.2.2 Discreto y continuo.


Modelos discretos: Obedecen a la generacin de variables aleatorias discretas generalmente
asociadas a la frecuencia de eventos.
Modelos continuos que generalmente se usan en la modelacin individual de los montos o
prdidas que de alguna u otra manera puedan afectar la caja de la empresa.

2.2.3 Definicin de evento.


Un evento es un subconjunto de un espacio muestral. La probabilidad de un evento A es
igual a la suma de las probabilidades de los sucesos simples del evento A.

2.2.4 Diagramas de Venn.


La relacin entre eventos y el correspondiente espacio muestral se puede ilustras de forma
grafica mediante diagramas de Venn. En un diagrama de Venn representamos el espacio
muestral como un rectngulo y los eventos con crculos trazados dentro del rectngulo. Un
universo U

puede representarse geomtricamente por el conjunto de puntos dentro de un

rectngulo. Tales diagramas denominados diagramas de Venn, sirven para darnos una
intuicin geomtrica respecto a las posibles relaciones entre conjuntos.

2.2.5 Simbologa, uniones e intersecciones.


La unin de dos eventos A y B es el evento que ocurre si A o B, o ambos, ocurren en una
sola realizacin del experimento. Denotaremos la unin de los eventos A y B mediante el
smbolo

A B.

71

UNIDAD II / PROBABILIDAD.

Interseccin: Dados dos conjuntos cualesquiera A y B llamamos "Interseccin" de A y B al


conjunto formado por todos los elementos que pertenecen a A y pertenecen a B.
Simblicamente: A B

Diferencia: Dados dos conjuntos cualesquiera A y B llamamos "Diferencia" de A "menos" B


al conjunto formado por los elementos que pertenecen a A y no pertenecen a B.
Simblicamente: A - B

Complemento: Dados dos conjuntos cualesquiera A y B con B A (B Subconjunto de A)


llamamos "Complemento de B respecto a A" al conjunto de elementos que pertenecen a A y
no a B, esto es lo que le falta a B para ser igual a A.
Simblicamente: (A B )

72

UNIDAD II / PROBABILIDAD.

2.3 Tcnicas de conteo.


Qu son las tcnicas de conteo?. Las tcnicas de conteo son aquellas que son usadas
para enumerar eventos difciles de cuantificar.
Se les denomina tcnicas de conteo a las combinaciones, permutaciones y diagrama de
rbol, hay que destacar que stas nos proporcionan la informacin de todas las maneras
posibles en que ocurre un evento determinado.
Las bases para entender el uso de las tcnicas de conteo son el principio multiplicativo y el
aditivo, los que a continuacin se definen y se hace uso de ellos.

Anlisis combinatorio.
En muchos casos el nmero de puntos mustrales en un espacio muestral no es muy
grande y as la enumeracin o cuenta directa de los puntos del muestreo necesario para
obtener las probabilidades no es difcil. Sin embargo, surgen problemas cuando la cuenta
directa se convierte en una imposibilidad prctica. En tales casos se emplea el anlisis
combinatorio, que podra llamarse una forma sofisticada de contar.

Principio aditivo.
A menudo es ms fcil calcular la probabilidad de algn evento a partir del conocimiento de
las probabilidades de otros eventos. Esto puede ser cierto si el evento en cuestin se puede
representar como la unin de otros dos eventos o como el complemento de algn evento. A
continuacin se presenta varias leyes importantes que con frecuencia simplifica el clculo de
probabilidades. La primera regla aditiva se aplica a uniones de eventos.
Si se desea llevar a efecto una actividad, la cul tiene formas alternativas para ser realizada,
donde la primera de esas alternativas puede ser realizada de M maneras o formas, la
segunda alternativa puede realizarse de N maneras o formas ..... y la ltima de las
alternativas puede ser realizada de W maneras o formas, entonces esa actividad puede ser
llevada a cabo de,
M + N + .........+ W maneras o formas

73

UNIDAD II / PROBABILIDAD.

Problema: Una persona desea comprar una lavadora de ropa, para lo cual ha pensado que
puede seleccionar de entre las marcas Whirpool, Easy y General Electric, cuando acude a
hacer la compra se encuentra que la lavadora de la marca W se presenta en dos tipos de
carga ( 8 u 11 kilogramos), en cuatro colores diferentes y puede ser automtica o
semiautomtica, mientras que la lavadora de la marca E, se presenta en tres tipos de carga
(8, 11 o 15 kilogramos), en dos colores diferentes y puede ser automtica o semiautomtica
y la lavadora de la marca GE, se presenta en solo un tipo de carga, que es de 11
kilogramos, dos colores diferentes y solo hay semiautomtica. Cuntas maneras tiene esta
persona de comprar una lavadora?
Solucin:
M = Nmero de maneras de seleccionar una lavadora Whirpool
N = Nmero de maneras de seleccionar una lavadora de la marca Easy
W = Nmero de maneras de seleccionar una lavadora de la marca General Electric
M = 2 x 4 x 2 = 16 maneras
N = 3 x 2 x 2 = 12 maneras
W = 1 x 2 x 1 = 2 maneras
M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora
Problema: Rafael Luna desea ir a las Vegas o a Disneylandia en las prximas vacaciones
de verano, para ir a las Vegas l tiene tres medios de transporte para ir de Chihuahua al
Paso Texas y dos medios de transporte para ir del Paso a las Vegas, mientras que para ir
del paso a Disneylandia l tiene cuatro diferentes medios de transporte,
a) Cuntas maneras diferentes tiene Rafael de ir a las Vegas o a Disneylandia?,
b) Cuntas maneras tiene Rafael de ir a las Vegas o a Disneylandia en un viaje
redondo, si no se regresa en el mismo medio de transporte en que se fue?.
Solucin:
a) V = maneras de ir a las Vegas
D = maneras de ir a Disneylandia
V = 3 x 2 = 6 maneras
D = 3 x 4 = 12 maneras
V + D = 6 + 12 = 18 maneras de ir a las Vegas o a Disneylandia

74

UNIDAD II / PROBABILIDAD.

b) V = maneras de ir y regresar a las Vegas

D = maneras de ir y regresar a

Disneylandia
V = 3 x 2 x 1 x 2 = 12 maneras
D = 3 x 4 x 3 x 2 = 72 maneras
V + D = 12 + 72 = 84 maneras de ir a las Vegas o a Disneylandia en un viaje redondo
Cmo podemos distinguir cuando hacer uso del principio multiplicativo y cuando del
aditivo?
Es muy simple, cuando se trata de una sola actividad, la cual requiere para ser llevada a
efecto de una serie de pasos, entonces haremos uso del principio multiplicativo y si la
actividad a desarrollar o a ser efectuada tiene alternativas para ser llevada a cabo, haremos
uso del principio aditivo.

Principio multiplicativo.
Si se desea realizar una actividad que consta de r pasos, en donde el primer paso de la
actividad a realizar puede ser llevado a cabo de N1 maneras o formas, el segundo paso de
N2 maneras o formas y el r-simo paso de Nr maneras o formas, entonces esta actividad
puede ser llevada a efecto de;

N1 x N2 x ..........x Nr maneras o formas


El principio multiplicativo implica que cada uno de los pasos de la actividad debe ser llevado
a efecto, uno tras otro.
Problema: Cuntas placas para automvil pueden ser diseadas si deben constar de tres
letras seguidas de cuatro nmeros, si las letras deben ser tomadas del abecedario y los
nmeros de entre los dgitos del 0 al 9?,
a) Si es posible repetir letras y nmeros,
b) No es posible repetir letras y nmeros,
c) Cuntas de las placas diseadas en el inciso b empiezan por la letra D y empiezan
por el cero,
d) Cuantas de las placas diseadas en el inciso b empiezan por la letra D seguida de la
G.

75

UNIDAD II / PROBABILIDAD.

Solucin:
Considerando 26 letras del abecedario y los dgitos del 0 al 9
a) 26 x 26 x 26 x 10 x 10 x 10 x 10 = 175,760,000 placas para automvil.
b) 26 x 25 x 24 x 10 x 9 x 8 x 7 = 78,624,000 placas para automvil
c) 1 x 25 x 24 x 1 x 9 x 8 x 7 = 302,400 placas para automvil
d) 1 x 1 x 24 x 10 x 9 x 8 x 7 = 120,960 placas para automvil
Problema: Cuntos nmeros telefnicos es posible disear, los que deben constar de seis
dgitos tomados del 0 al 9?,
a) Considere que el cero no puede ir al inicio de los nmeros y es posible repetir
dgitos,
b) El cero no debe ir en la primera posicin y no es posible repetir dgitos,
c) Cuntos de los nmeros telefnicos del inciso b empiezan por el nmero siete?,
d) Cuntos de los nmeros telefnicos del inciso b forman un nmero impar?.
Solucin:
a) 9 x 10 x 10 x 10 x 10 x 10 = 900,000 nmeros telefnicos
b)

9 x 9 x 8 x 7 x 6 x 5 = 136,080 nmeros telefnicos

c) 1 x 9 x 8 x 7 x 6 x 5 = 15,120 nmeros telefnicos


d) 8 x 8 x 7 x 6 x 5 x 5 = 67,200 nmeros telefnicos
Problema: En una ciudad los nmeros de telfono constan de 5 dgitos, cada uno de los
cuales se llama con alguno de los 10 dgitos (0 al 9). Cuntos nmeros diferentes pueden
formularse?
Solucin: 10 x 10 x 10 x 10 x 10 = 100,000 nmeros diferentes

2.3.1 Diagrama de rbol.


Problema: Suponga que una persona tiene 2 formas de ir de una ciudad A a otra ciudad B; y
una vez llegada a B, tiene 3 maneras de llegar a otra ciudad C, De cuntas maneras podr
realizar el viaje de A a C pasando por B?
Solucin: Si empez a pie, podr tomar luego avin, carro o trasatlntico, y si empez en
bicicleta, tambin podr tomar avin, carro o trasatlntico. La persona tuvo 6 formas
diferentes de realizar el viaje que son: (iniciales) pa, pc, pt, ba, bc, bt. (2 x 3 = 6)

76

UNIDAD II / PROBABILIDAD.

Problema: Se va a conformar un comit de 3 miembros compuesto por un representante de


los trabajadores, uno de la administracin y uno del gobierno. Si hay 3 candidatos de los
trabajadores, 2 de la administracin y 4 del gobierno, determinar cuntos comits diferentes
pueden conformarse, empleando un diagrama de rbol

Problema: Un experimento consiste en lanzar una moneda y despus lanzarla una segunda
vez si sale cara. Si sale cruz en el primer lanzamiento, entonces se lanza un dado una vez.
Para listar los elementos del espacio muestral que proporciones mayor informacin.

77

UNIDAD II / PROBABILIDAD.

Problema: Suponga que se selecciona tres artculos de forma aleatoria de un proceso de


fabricacin. Cada articulo se inspecciona y clasifica como defectuoso, D, o sin defectos N.

Problema: Un mdico general clasifica a sus pacientes de acuerdo a: su sexo (masculino o


femenino), tipo de sangre (A, B, AB u O) y en cuanto a la presin sangunea (Normal, Alta o
Baja). Mediante un diagrama de rbol diga en cuantas clasificaciones pueden estar los
pacientes de este mdico?

78

UNIDAD II / PROBABILIDAD.

Si contamos todas las ramas terminales, nos damos cuenta que el nmero de clasificaciones
son 2 x 4 x 3 = 24 mismas que podemos enumerar;
MAN, MAA, MAB, MBN, MBA, MBB, etc, etc.
Problema: Un producto (por ejemplo, hardware para un sistema de computadoras) se puede
embarcar a travs de cuatro aerolneas diferentes, y cada aerolnea puede transportar los
embarques por tres rutas distintas. Cuntas formas distintas de embarcar el producto
existen?

Problema: Dos equipos denominados A y B se disputan la final de un partido de baloncesto,


aquel equipo que gane dos juegos seguidos o complete un total de tres juegos ganados ser
el que gane el torneo. Mediante un diagrama de rbol diga de cuantas maneras puede ser
ganado este torneo,
Solucin:
A = gana el equipo A; B = gana el equipo B

79

UNIDAD II / PROBABILIDAD.

En este diagrama se muestran que hay solo diez maneras de que se gane el torneo, que se
obtienen contando las ramas terminales de este diagrama de rbol, las que es posible
enumerar;
AA, ABB, ABAA, ABABA, ABABB, etc, etc.

2.3.2 Notacin factorial.


En algunos problemas de matemticas se nos presentan multiplicaciones de nmeros
naturales sucesivos tal como:
4 x 3 x 2 x 1 = 24;

3 x 2 x 1 = 6;

2 x 1 = 2.

Para abreviar estas expresiones, se usa una notacin especial llamada notacin factorial y
nos denota las multiplicaciones sucesivas de n hasta l y se define como:
4 x 3 x 2 x 1 = 4!
3 x 2 x 1 = 3!

Se leecuatro factorial
Se lee tres factorial

En trminos generales:
n(n-1)(n-2)...x 2 x 1 = n! Se lee n factorial

Propiedades:
a)

para n natural n! = n(n-1)!

Ejemplo:
7! = 7 x 6! = 7 x 6 x 5 x 4!
0! = 1
5! = 5 x 4 x 3 x 2 x 1 = 120
4! 3! = (24)(6) = 144

8! 8 x7 x6 x5!
=
= 336
5!
5!

80

UNIDAD II / PROBABILIDAD.

10!8! 10 x9! x8 x7 x6!


=
= 560
9!6!
9! x6!
3!
3!
1
=
=
5! 5 x 4 x3! 20
Cuando n es demasiado grande se suele utilizar la frmula de Stirling:

n ! 2 n * n n .e n

2.3.3 Permutacin.
Una permutacin es un arreglo de todo o parte de un conjunto de objetos, el cual tiene una
disposicin de elementos en un orden especifico. Es todo arreglo de elementos en donde
nos interesa el lugar o posicin que ocupa cada uno de los elementos que constituyen dicho
arreglo.

Teorema :
Dado un conjunto de n elementos claramente distintos, se desea seleccionar r elementos de
los n y acomodarlos dentro de r posiciones.
El nmero de permutaciones diferentes de los n elementos tomados r a la vez se denota por
: n P r y es igual

n Pr

= n ( n 1 ) (n 2 ) . . . ( n r + 1 )

n Pr =

n!
( n r )!

para este caso particular r = n se convierte en:


n

P n = n ( n 1 ) (n 2 ) . . . 1 = n !

donde n ! = n (n 1 ) (n 2 ) . . . (3)(2)(1) y se llama n factorial.


Esta frmula nos permitir obtener todos aquellos arreglos en donde el orden es importante
y solo se usen parte (r) de los n objetos con que se cuenta, adems hay que hacer notar
que no se pueden repetir objetos dentro del arreglo, esto es, los n objetos son todos
diferentes.

81

UNIDAD II / PROBABILIDAD.

La demostracin del teorema anterior es : hay n formas de ocupar la primera posicin. Una
vez que se ocupa, hay n 1 formas de ocupar la segunda, n 2 formas de ocupar la
tercera, . . . , y (n r + 1 ) formas de ocupar la n-sima posicin. Aplicaremos la regla de
multiplicativa para obtener
n

Pr = (n )(n 1)(n 2 )...(n r + 1) =

n!
(n r )

Problema: Hallar:
a) 8 P 3

b) 6 P 4

c) 15 P 1

d) 3 P 3

Solucin
a) 336
b) 360
c) 15
d) 6
Problema: El numero de ordenaciones o permutaciones diferentes que consisten de 3 letras
cada una y que puede formarse de las 7 letras A, B , C, D, E, F, G, es n = 7 & r = 3
7P3 = 210
Problema: Se quieren sentar 5 hombres y 4 mujeres en una fila de modo que las mujeres
ocupen los sitios pares de cuantas formas pueden sentarse?
Solucin:
( 5 P 5 ) ( 4 P 4 ) = 2880 formas
Problema: Cuantas representaciones diferentes sern posibles formar, si se desea que
consten de Presidente, Secretario, Tesorero, Primer Vocal y Segundo Vocal?, s esta
representacin puede ser formada de entre 25 miembros del sindicato de una pequea
empresa.
Solucin:
Por principio multiplicativo:
25 x 24 x 23 x 22 x 21 = 6,375,600 maneras
Por Frmula:
n = 25,

r=5

82

UNIDAD II / PROBABILIDAD.

25P5

= 25!/ (25 5)! = 25! / 20! = (25 x 24 x 23 x 22 x 21 x....x 1) / (20 x 19 x 18 x ... x 1) =

6,375,600 maneras de formar la representacin


Problema:
a) Cuntas maneras diferentes hay de asignar las posiciones de salida de 8 autos que
participan en una carrera de frmula uno? (Considere que las posiciones de salida
de los autos participantes en la carrera son dadas totalmente al azar)
b)

Cuntas maneras diferentes hay de asignar los primeros tres premios de esta
carrera de frmula uno?

Solucin:
Por principio multiplicativo:
8 x 7 x 6 x 5 x 4 x 3 x 2 x 1= 40,320 maneras de asignar las posiciones de salida de los
autos participantes en la carrera
Por Frmula:
n = 8, r = 8
8P8=

8! = 8 x 7 x 6 x 5 x 4 x......x 1= 40,320 maneras de asignar las posiciones de salida

......etc., etc.
a) Por principio multiplicativo:
8 x 7 x 6 = 336 maneras de asignar los tres primeros lugares de la carrera
Por frmula:
n =8, r = 3
8P3

= 8! / (8 3)! = 8! / 5! = (8 x 7 x 6 x 5 x ........x1)/ (5 x 4 x 3 x......x1) = 336 maneras de

asignar los tres primeros lugares de la carrera


Problema: Cuntos puntos de tres coordenadas ( x, y, z ), ser posible generar con los
dgitos 0, 1, 2, 4, 6 y 9?, Si,
a) No es posible repetir dgitos,
b) Es posible repetir dgitos.

83

UN
NIDAD II / PROBAB
BILIDAD.

Solucin:
a) Por frmula
n = 6,
6P3

r=3
= 6! / (6 3)! = 6!
6 / 3! = 6 x 5 x 4 x 3! / 3! = 6 x 5 x 4 = 120 puntoss posibles

Nota: este inciso tambin puede se


er resuelto por el principio multiplicatiivo
b) Por el p
principio multtiplicativo
6 x 6 x 6 = 216 puntos posibles
s pueden
Problema: De cuntass maneras 3 fresadorass, 4 tornos, 4 taladros y 2 cepillos
ordenarse en fila en un taller, de mo
odo que el mismo
m
tipo de
e mquina qu
uede juntas.
3F

4T

4T

2C

P3 = 3!

P4 = 4!

P4 = 4!

P2 = 2!

P4 = 4!
3! (4!) (4!) (2!) (4!) = 165888
os distintos de
d matemticcas, seis dife
erentes de fsica
f
y dos diferentes
d
Problema: Cuatro libro
a se colocan en un estantte. De cuantas formas distintas es posible orde
enarlos si
de qumica
a) loss libros de ca
ada asignaturra deben esttar todos junttos,
b) sollamente los libros
l
de mattemticas de
eben estar ju
untos?
Solucin
a) (4 P 4 ) (6 P 6 ) ( 2 P 2 ) ( 3 P 3 ) = 207360
b) (9 P 9 ) (4 P 4 ) = 8709120
Problema: Se sacan dos
d billetes de lotera d
de 20 para un
u primer y un segundo
o premios.
Encuentre el nmero de
e puntos mu
ustrales en el
e espacio S
Solucin:
20 P 2 = 380

84

UNIDAD II / PROBABILIDAD.

Problema: De cuantas formas puede una organizacin local de la sociedad americana de


qumica programar a tres conferencistas para tres reuniones diferentes si todos estn
disponibles en cualquiera de cinco fechas posibles?
Solucin:
5 P 3 = 60
Problema: El testigo de un accidente, en el que el causante se dio a la fuga, le dijo a la
polica que el numero de placas tenias las letras RLH seguidas de tres dgitos, el primero de
los cuales era un 5. si el testigo no puede recordar los dos ltimos dgitos, pero est seguro
que todos los dgitos eran diferentes , encuentre el nmero mximo de registros de
automviles que la polica tendr que revisar.
Solucin:
9 P 2 = 72
Problema: En una carrera de coches (50 coches) queremos saber el nmero de formas
distintas en que se pueden repartir los premios (primero, segundo y tercer lugar)
Solucin: 50 P 3 = 117600
Problema: Alguien desea colocar 6 cuadros en lnea recta sobre la pared de una biblioteca.
De cuantas maneras diferentes lo pueden hacer?
Solucin: 6P6 = 720
Problema: De cuantas maneras pueden 10 personas sentarse en una banca si solo hay 4
puestos disponibles?
Solucin: 10P4 = 5040

Problemas propuestos:
P1.- Un sistema de alarma de seguridad se activa y desactiva introduciendo el cdigo
numrico de tres dgitos apropiados en el orden correcto en un tablero digital.
a) Calcule el nmero total de posibles combinaciones del cdigo si ningn digito se
puede utilizar dos veces.
b) Calcule el numero total de posibles combinaciones del cdigo si los dgitos se puede
utilizar mas de una vez.
Solucin:
a) 10 P 3 = 720

b) (10)(10)(10) = 1000

85

UNIDAD II / PROBABILIDAD.

P2.- Se contrata un servicio de calificacin de computadoras para encontrar las tres mejore
marcas de monitores EGA. Se incluir un total de 10 marcas en el estudio. De cuantas
formas distintas puede el servicio de calificacin llegar al ordenamiento final?
Solucin:
10 P 3 = 720
P3.- en una carrera de coches (50 coches) queremos saber el nmero de formas distintas en
que se pueden repartir los premios (primero, segundo y tercer lugar)
Solucin: 50 P 3 = 117600
P4.- Alguien desea colocar 6 cuadros en lnea recta sobre la pared de una biblioteca. De
cuantas maneras diferentes lo pueden hacer?
Solucin: 6P6 = 720
P5.- De cuantas maneras pueden 10 personas sentarse en una banca si solo hay 4
puestos disponibles?
Solucin: 10P4 = 5040

Permutaciones con repeticiones.


Las permutaciones que ocurren al arreglar objetos en un crculo se llaman permutaciones
circulares. Dos permutaciones circulares no se consideran diferentes a menos que los
objetos correspondientes en los dos arreglos estn precedidos o seguidos por un objeto
diferente conforme recorramos en la direccin de las manecillas del reloj.
Teorema:

El numero de permutaciones distintas de n cosas de las que n 1 son de una

clase, n 2 de una segunda clase , ... , n k de una k esima

Pn1 ,n2 ,..., nk =

n!
n1!, n 2 !,..., n k !

Problemas: Obtenga todas las seales posibles que se pueden disear con seis banderines,
dos de los cuales son rojos, tres son verdes y uno morado.
Solucin:
n = 6 banderines; x1 = 2 banderines rojos; x2 = 3 banderines verdes; x3 = 1 bandern
morado

86

UNIDAD II / PROBABILIDAD.

6P2,3,1

= 6! / 2!3!1! = 60 seales diferentes

Problema:
a) Cuntas claves de acceso a una computadora ser posible disear con los
nmeros 1,1,1,2,3,3,3,3?,
b) cuntas de las claves anteriores empiezan por un nmero uno seguido de un dos?,
c) cuntas de las claves del inciso a empiezan por el nmero dos y terminan por el
nmero tres?
Solucin:
a) n = 8 nmeros;
8P3,1,4

x1 = 3 nmeros uno;

x2 = 1 nmero dos;

x3 = 4 nmeros cuatro

= 8! / 3!1!4! = 280 claves de acceso

b) n = 6 (se excluye un nmero uno y un dos);

x1 = 2 nmeros uno;

x2 = 4 nmeros tres

1 x 1 x 6P2,4 = 1 x 1 x 6! / 2!4! = 15 claves de acceso


El primer nmero uno nos indica el nmero de maneras cmo es posible colocar en la
primera posicin de la clave de acceso un nmero uno, debido a que todos los nmeros uno
son iguales, entonces tenemos una sola manera de seleccionar un nmero uno para la
primera posicin, el siguiente nmero uno nos indica el nmero de maneras como se
colocara en la segunda posicin el nmero dos y la expresin siguiente nos indica todos los
arreglos posibles que es posible disear con los nmeros restantes.
c) n = 6 (se excluye un nmero dos y un tres);

x1 = 3 nmeros uno;

x2 = 3 nmeros tres

1 x 6P3,3 x1 = 1 x 6! / 3!3! = 20 claves de acceso


El nmero uno inicial nos indica que existe una sola manera de seleccionar el nmero dos
que va en la primera posicin del arreglo, mientras que el nmero uno final nos indica que
hay una sola manera de seleccionar el nmero tres que va al final del arreglo an y cuando
haya cuatro nmeros tres, como estos son iguales al disear una permutacin es indistinto
cul nmero tres se ponga, ya que siempre se tendr el mismo arreglo y la expresin
intermedia nos indica todos los arreglos posibles a realizar con los nmeros restantes.
Problema: De cuntas maneras es posible plantar en una lnea divisoria de un terreno dos
nogales, cuatro manzanos y tres ciruelos?

87

UNIDAD II / PROBABILIDAD.

Solucin:
n = 9 rboles; x1 = 2 nogales; x2 = 4 manzanos; x3 = 3 ciruelos
9P2,4,3

= 9! / 2!4!3! = 1260 maneras de plantar los rboles

Problema: Si un equipo de ftbol soccer femenil participa en 12 juegos en una temporada,


cuntas maneras hay de que entre esos doce juegos en que participa, obtenga 7 victorias,
3 empates y 2 juegos perdidos?
Solucin:
n = 12 juegos; x1 = 7 victorias; x2 = 3 empates; x3 = 2 juegos perdidos
12P7,3,2

= 12! / 7!3!2! = 7,920 maneras de que en la temporada este equipo logre siete

victorias, tres empates y dos juegos perdidos.


Problema: De cuantas formas diferentes se pueden arreglar 3 focos rojos, 4 amarillos, y 2
azules en una serie de luces navideas con 9 portalmparas?
Solucin:

9!
= 1260
3!(4!)(2!)
Problema: Usted cuanta con 12 analista de sistemas y desea asignar tres al trabajo 1, cuatro
al trabajo 2 y cinco al trabajo 3. De cuantas formas distintas puede efectuar esta
asignacin?
Solucin:
n1 = 3, n2 = 4, n3 = 5

12!
= 27720
3!(4!)(5!)
Problema: Cuantas muestras de 4 juntas unidades por soldadura blanda de estao-plomo
se pueden seleccionar de un lote de 25 juntas de este tipo que estn disponibles para
pruebas de resistencia?

25!
= 12650
(4!)(21!)

88

UNIDAD II / PROBABILIDAD.

Pruebas ordenadas
Se le llama prueba ordenada al hecho de seleccionar r objetos de entre n objetos contenidos
en una urna uno tras otro. Una prueba ordenada puede ser llevada a efecto de dos maneras:
a) Con sustitucin (con reemplazo).- En este caso se procede a seleccionar el primer
objeto de entre los n que hay, se observa de qu tipo es y se procede a regresarlo a
la urna, luego se selecciona el siguiente objeto, lo anterior se repite hasta que se
han extrado los r objetos de la prueba, por tanto el nmero de pruebas ordenadas
de con sustitucin se obtiene:
Nmero total de pruebas ordenadas con sustitucin = n x n x n x .........x n = nr
Hay n maneras de seleccionar el primer objeto, luego al seleccionar el segundo objeto, dado
que se ha regresado a la urna el primer objeto, tambin se tendrn n objetos y as
sucesivamente.
b) Sin sustitucin (sin reemplazo).- En este caso se procede a seleccionar el primer
objeto, el cual no es regresado a la urna, luego se selecciona el segundo objeto, lo
anterior se repite hasta completar los r objetos de la prueba, por lo que el nmero
total de pruebas ordenadas sin sustitucin se obtiene:
Nmero total de pruebas ordenadas sin sustitucin = n(n-1)(n-2).........(n-r +1) = nPr
Hay n maneras de seleccionar el primer objeto, luego al seleccionar el segundo objeto, hay
n 1 maneras, dado que el primer objeto no se regresa a la urna, luego cuando se extrae el
r-simo objeto, hay (n r +1) de que sea seleccionado.
Problema: Cuntas maneras hay de que se asignen tres premios de un sorteo en donde el
primer premio es una departamento, el segundo premio es un auto y el tercer premio es un
centro de cmputo, si los participantes en este sorteo son 120 personas,
a) s la asignacin se puede hacer con sustitucin,
b) s la asignacin se puede hacer sin sustitucin.
Solucin:
a) Por principio multiplicativo:
120 x 120 x 120 = 1,728,000 maneras de asignar los premios
Por frmula: n =120,

r = 120

89

UNIDAD II / PROBABILIDAD.

nr = 1203 = 1,728,000 maneras de asignar los tres premios


b) Por principio multiplicativo:
120 x 119 x 118 = 1,685,040 maneras de asignar los premios
Por frmula:
n = 120,
120P3

r=3

= 120! / (120 3)! = 120! / 117! = 120 x 119 x 118 = 1,685,040 maneras de asignar los

premios
Hay que hacer notar que en este caso, como los boletos que son seleccionados ya no
regresan a la urna de donde fueron extrados, los participantes solo pueden recibir un premio
en caso de que fueran de los afortunados. Esta es la forma en que generalmente se efecta
un sorteo.
Problema: Cuntas formas hay de asignar las primeras cinco posiciones de una carrera de
autos de frmula K, si participan 26 autos en esta carrera?. Considere que la asignacin es
totalmente al azar.
Solucin:
Esta asignacin debe ser sin sustitucin, esto es, se trata de una prueba ordenada sin
sustitucin, por lo que la solucin es la que se muestra.
n = 26,
26P5

r=5

= 26! / (26 5)! = 26! / 21! = 26 x 25 x 24 x 23 x 22 = 7,893,600 maneras de asignar las

cinco primeras posiciones de salida


Problema: Cuntas formas hay de asignar el orden de participacin de las primeras 5
concursantes de 11 finalistas de un concurso de Miss Mundo?
Solucin:
Esta asignacin debe realizarse sin sustitucin, por lo que se trata de una prueba ordenada
sin sustitucin.
n = 11, r = 5

90

UNIDAD II / PROBABILIDAD.

11P5

= 11! / (11 5)! = 11! / 6! = 11 x 10 x 9 x 8 x 7 = 55,440 maneras de asignar la

participacin

2.3.4 Combinaciones.
Como ya se mencion anteriormente, una combinacin, es un arreglo de elementos en
donde no nos interesa el lugar o posicin que ocupan los mismos dentro del arreglo. En una
combinacin nos interesa formar grupos y el contenido de los mismos.

Teorema
Se desea escoger una muestra de r elementos de un conjunto de n elementos. Entonces, el
numero de muestras distintas de r elementos que se pueden escoger de n se denota por

()
n
r

y es igual

n
= n Cr
r

n!
r!(n r)!

Observe que el orden en que se extraen los r elementos no es importante.


Demostracin del teorema:
La seleccin de una muestra de r elementos de un conjunto de n elementos equivale a
dividir los n elementos entre k = 2 grupos: los r que se escogen para la muestra y los ( n r )
restantes que no se seleccionan. Por tanto, al aplicar el teorema obtenemos:

n
= n Cr
r

n!
r!(n r)!

Problema:
Hallar el valor de
a) 7 C4

b) 6 C 5

c) 4 C 4

Solucin:
a)

91

UNIDAD II / PROBABILIDAD.

C4 =

7!
= 35
4!(7 4)!

b)
6

C5 =

6!
=6
5!(6 5)!

c)

C4 =

4!
=1
4!(4 4)!

Problema: E l nmero de maneras en las cuales 3 cartas pueden escogerse o seleccionarse


de un total de 8 cartas diferentes es:
Solucin:
n

Cr =

8!
= 56
3!(8 3)!

Problema: De cuatro qumicos y tres fsicos encuentre el nmero de comits que se pueden
formar que consistan en dos qumicos y un fsico.
Solucin:
Qumico 4 C 2;

Fsico 3 C 1

3!
4!

=
2!(4 2)! 1!(3 1)!

( 4 C2 )( 3 C1 ) =
( 6 )( 3) = 18

Problema: Se contrataran cinco ingenieros de ventas de entre un grupo de 100 solicitantes.


De cuantas formas (combinaciones) podemos seleccionar grupos de cinco ingenieros de
ventas?
Solucin:
100 C 5 = 75, 287,520
Problema: a) Si se cuenta con 14 alumnos que desean colaborar en una campaa pro
limpieza del Tec, cuantos grupos de limpieza podrn formarse si se desea que consten de 5
alumnos cada uno de ellos, b) si entre los 14 alumnos hay 8 mujeres, cuantos de los

92

UNIDAD II / PROBABILIDAD.

grupos de limpieza tendrn a 3 mujeres?, c) cuntos de los grupos de limpieza contarn


con 4 hombres por lo menos?
Solucin:
a) n = 14, r = 5
14C5 =

2002 grupos

b) n = 14 (8 mujeres y 6 hombres),
8C3*6C2

r=5

= 840

c) En este caso nos interesan grupos en donde haya 4 hombres o ms


6C4* 8C1

6C5* 8C0

= 15 x 8 + 6 x 1 = 120 + 6 = 126

Problema: Para contestar un examen un alumno debe contestar 9 de 12 preguntas,


a) Cuntas maneras tiene el alumno de seleccionar las 9 preguntas?,
b) Cuntas maneras tiene si forzosamente debe contestar las 2 primeras preguntas?,
c) Cuntas maneras tiene si debe contestar una de las 3 primeras preguntas?,
d) Cuntas maneras tiene si debe contestar como mximo una de las 3 primeras
preguntas?
Solucin:
a) n = 12,
12C9

r=9

= 220 maneras de seleccionar las nueve preguntas o dicho de otra manera,

el alumno puede seleccionar cualquiera de 220 grupos de 9 preguntas para contestar el


examen
b) 2C2*

10C7

= 1 x 120 = 120 maneras de seleccionar las 9 preguntas entre las que estn

las dos primeras preguntas


c)

3C1* 9C8

= 3 x 9 = 27 maneras de seleccionar la 9 preguntas entre las que est una

de las tres primeras preguntas


d)

En este caso debe seleccionar 0 o 1 de las tres primeras preguntas

3C0* 9C9

+ 3C1* 9C8 = (1 x 1) + (3 x 9)

= 1 + 27 = 28 maneras de seleccionar las preguntas a contestar

93

UNIDAD II / PROBABILIDAD.

Problema. Una seora desea invitar a cenar a 5 de 11 amigos que tiene


a) Cuntas maneras tiene de invitarlos?,
b) cuntas maneras tiene si entre ellos est una pareja de recin casados y no
asisten el uno sin el otro,
c) Cuntas maneras tiene de invitarlos si Rafael y Arturo no se llevan bien y no van
juntos?
Solucin:
a) n = 11,
11C5

r=5

= 462 maneras de invitarlos

Es decir que se pueden formar 462 grupos de cinco personas para ser invitadas a cenar.
b) Esta seora tiene dos alternativas para hacer la invitacin, la primera es no
invitar a la pareja y la segunda es invitar a la pareja.
2C0* 9C5

2C2* 9C3

= (1 x 126)

+ (1 x 84) = 210 maneras de invitarlos

En este caso separamos a la pareja de los dems invitados para que efectivamente se
cumpla el que no asistan o que asistan a la cena.
c) La seora tiene dos alternativas para hacer la invitacin, una de ellas es que
no invitar a Rafael y a Arturo o que asista solo uno de ellos.
2C0* 9C5

= (1 x 126)

2C1* 9C4

(2 x 126)

= 126 + 252 = 378 maneras de hacer la invitacin


Problema: En un plano hay 10 puntos denominados A, B, C, ....,etc. etc., en una misma lnea
no hay ms de dos puntos,
a) Cuntas lneas pueden ser trazadas a partir de los puntos?,
b) Cuntas de las lneas no pasan por los puntos A o B?,
c) Cuntos tringulos pueden ser trazados a partir de los puntos?,
d) Cuntos de los tringulos contienen el punto A?,
e) Cuntos de los tringulos tienen el lado AB?.
Solucin:
a) Una lnea puede ser trazada a partir de cmo mnimo dos puntos por lo tanto,

94

UNIDAD II / PROBABILIDAD.

10C2

= 10! / (10 2)!2! = 10! / 8!2! = 45 lneas que se pueden trazar

b) En este caso excluiremos los puntos A y B y a partir de los ocho puntos restantes se
obtendrn las lneas.
2C0* 8C2

= 1 x 28 = 28 lneas que no pasan por los puntos A o B

c) Un tringulo puede ser trazado a partir de tres puntos, luego;


10C3

= 10! / (10 3)!3! = 10! / 7!3! = 120 tringulos posibles de trazar


d) En este caso se separa el punto A de los dems, se selecciona y posteriormente
tambin se seleccionan dos puntos ms.

1C1* 9C2

= 1 x 36 = 36 tringulos que contienen el punto A

e) Los puntos A y B forman parte de los tringulos a trazar por lo que;


2C2*8C1

= 1 X 8 = 8 tringulos que contienen el lado AB

Problema: De un total de 5 matemticos y 7 fsicos, se forma un comit de 2 matemticos y


3 fsicos. De cuantas formas puede formarse, si
a) puede pertenecer el cualquier matemtico y fsico,
b) un fsico determinado debe permanecer al comit,
c) dos matemticos determinados no pueden estar en el comit?
a) 2 Mat. de un total de 5 5 C 2
3 Fis. de un total de 7 7 C 3 = (5 C 2) ( 7 C 3) = 350
b ) 2 Mat. de un total de 5 5 C 2
2 Fis. de un total de 6 6 C 2

= (5 C 2) (6 C 2) = 150

c) 2 Mat. de un total de 3 3 C 2
3 Fis. de un total de 7 7 C 3 = (3 C 2) (7 C 3) = 105
Problema: De cuantas formas pueden 10 objetos dividirse en dos grupos de 4 y 6 objetos
respectivamente.
Solucin:
(10 C 4) = 210

95

UNIDAD II / PROBABILIDAD.

Problema: Cuantas manos diferentes de 5 naipes pueden darse con un mazo normal de 52
naipes, no importa el orden en que se reciban las cartas, lo que nos indica que se trata de
una combinacin.
Solucin:
52 C 5 = 2598960
Problema: Si 10 alumnos desean jugar baloncesto, cuntos equipos diferentes pueden
formarse con estos jugadores ? , uno de los muchachos se llama Jos. Solo se desea contar
los equipos que incluyen a Jose
Solucin:
10 C 5 = 252 equipos diferentes
El nmero de equipos que incluyen a Jos son:
9 C 4 = 126
Problema: cuntas parejas distintas pueden formarse con cinco individuos?
Solucin:
5 C 2 = 10

Particiones ordenadas.
Se le llama particin ordenada al hecho de repartir n objetos en clulas de una cantidad de
x1 objetos, x2 objetos,......y xk objetos.
Problema: Cuntas maneras hay de repartir 10 libros diferentes entre tres alumnos, si al
primero le daremos 2, al segundo 3 y el resto al tercer alumno? , esta particin seran las
siguientes si se numeran los libros del 1 al 10;
Solucin:
Lo primero que debemos hacer es seleccionar 2 libros de los 10 que se tienen para el primer
alumno, esto es;
10C2

= 10! / (10 2)!2! = 10! / 8!2! = 45 maneras de seleccionar los libros

Luego se seleccionan 3 libros de los 8 que quedan para el segundo alumno;


8C3

= 8! / (8 3)!3! = 8! / 5!3! = 56 maneras

Y por ltimo se proceder a seleccionar cinco libros de los cinco que quedan para el tercer
alumno, lo que se muestra a continuacin;

96

UNIDAD II / PROBABILIDAD.

5C5

= 5! / (5 5)!5! = 5! / 0!5! = 1 manera

Por tanto el nmero total de particiones ordenadas en clulas de 2, 3 y 5 elementos se


determina:
10C2* 8C3* 5C5

= 2520

La expresin anterior nos recuerda a la frmula utilizada para encontrar las permutaciones
de n objetos, entre los cuales hay algunos objetos que son iguales, por lo que usaremos la
misma frmula para encontrar las particiones ordenadas.
Por tanto la frmula para las particiones ordenadas sera:

nPx1 , x2 .........., xk =

n!
x1! x2 !.......xk !

Esta frmula slo puede ser utilizada cuando se reparten todos los objetos, no parte de
ellos, en ese caso se usarn combinaciones.
Donde:
nPx1,x2,.....,xk = Total de particiones ordenadas o reparticiones que es posible hacer cuando
los n objetos son repartidos en grupos de x1 objetos, x2 objetos ...... y xk objetos.
n = x1 + x2 + ......+ xk
Problema: Cuntas maneras hay de repartir 9 juguetes entre tres nios, si se desea que al
primer nio le toquen 4 juguetes, al segundo 2 y al tercero 3 juguetes?
Solucin:
Por combinaciones,
9C4* 5C2* 3C3

= 126*10*1= 1260 maneras de repartir los juguetes

Por frmula,
n = 9; x1 = 4; x2 = 2; x3 =3
9P4,2,3

= 9! / 4!2!3! = 1,260 maneras de repartir los juguetes

Problema: Cuntas maneras hay de repartir los mismos 9 juguetes entre tres nios, si se
desea darle 3 al primer nio, 2 al segundo nio y 2 al tercer nio?

97

UNIDAD II / PROBABILIDAD.

Solucin:
En este caso nicamente se puede dar solucin por combinaciones, ya que no es posible
usar la frmula debido a que se reparten solo parte de los juguetes.
9C3* 6C2* 4C2

= 84*15*6 = 7,560 maneras de repartir los juguetes (solo se reparten 7 y

quedan dos juguetes)


Problema:
a) Cuntas maneras hay de que se repartan 14 libros diferentes entre 3 alumnos, si
se pretende que al primer alumno y al segundo les toquen 5 libros a cada uno y al
tercero le toque el resto?,
b) Cuntas maneras hay de que se repartan los libros si se desea dar 5 libros al
primer alumno, 3 al segundo y 2 libros al tercer alumno?
Solucin:
a) Por frmula:
n = 14 ; x1 = 5; x2 = 5; x3 = 4
14P5,5,4

= 14! / 5!5!4! = 21,021 maneras de repartir los libros en grupos de 5, 5 y 4 libros

b) Por combinaciones:
14C5* 9C3* 6C2

= 2,002*84*15 = 2,522,520 maneras de repartir 10 de los 14 libros en grupos

de 5, 3 y 2 libros
Problema:
a) Cuntas maneras hay de repartir a 12 alumnos en 4 equipos de 3 personas cada
uno de ellos para que realicen prcticas de laboratorio diferentes?,
b) Cuantas maneras hay de que se repartan los 12 alumnos en 4 equipos de 3
personas si se va a realizar una misma prctica?
Solucin:
a) En este caso al ser prcticas de laboratorio diferentes, es posible resolver el
problema por combinaciones o por la frmula, dado que se reparten todos los
alumnos
Por frmula:
n = 12; x1 = 3 prctica 1; x2 = 3 prctica 2; x3 = 3 prctica 3; x4 = 3 prctica 4

98

UNIDAD II / PROBABILIDAD.

12P3,3,3,3

= 12! / 3!3!3!3! = 369,600 maneras de repartir a los estudiantes en cuatro equipos

de 3 personas para realizar prcticas diferentes


b)

12P3,3,3,3

* 1 /4! = 12! / 3!3!3!3! * 1 / 4! = 369,600 / 4! = 15,400 maneras de repartir a

los alumnos en equipos de 3 personas para realizar una misma prctica


Al multiplicar la solucin que se da al inciso a, por 1/4! se est quitando el orden de los
grupos, que en este caso no nos interesa.

Ejercicios propuestos:
P1.- Se contrata un servicio de calificacin de computadoras para encontrar las tres mejore
marcas de monitores EGA. Se incluir un total de 10 marcas en el estudio. De cuantas
formas distintas puede el servicio de calificacin pero no debe poner los tres en ningn
orden?
Solucin:
10 C 3 = 120
P2.- cuntas parejas distintas pueden formarse con cinco individuos?
Solucin.
5 C 2 = 10
P3.- Con 5 estadistas y 6 economistas quiere formarse un comit de 3 estadistas y 2
economistas. Cuntos comits diferentes pueden formarse si:
a)no se impone ninguna restriccin ,
b)dos estadistas determinados deben estar en el comit
c)un economista determinado no debe estar en el comit?
Solucin:
a) 150

b) 45

c) 100

P4.- Suponga que necesita reemplazar 5 empaques en un dispositivo que funciona con
energa nuclear. Si tiene una caja con 20 empaques de entre los cuales escoger, cuantas
elecciones diferentes son posibles? Es decir, cuantas muestras distintas de 5 empaques se
pueden seleccionar de los 20 ?
Solucin:
20C5 = 15,504

99

UNIDAD II / PROBABILIDAD.

P5.- Se realizo un estudio para examinar la reaccin entre la estructura de costos y la


propiedades mecnicas de granos equieje en lingotes solidificados unidireccionalmente (
Metallurgical Transactions, mayo de 1986 ). Lingotes de aleaciones de cobre se vertieron en
uno de tres tipos de moldes (columnares, mixtos o equieje) con una orientacin ya sea
transversal o longitudinal. De cada lingote se tomaron cinco especimenes para pruebas de
tensin a distintas distancias (10, 35, 60, 85 y 100 milmetros ) de la cara de enfriamiento del
lingote, y se determino la resistencia al vencimiento. Cuantas mediciones de resistencia se
obtendrn si el experimento incluye un lingote para cada combinacin de tipo de molde y
orientacin?
Solucin: (3C2)(5C2) = 30

2.4 Probabilidad con tcnicas de conteo.

2.4.1 Axiomas.
Axioma 1: para cada suceso a en la clase C

P(A) 0

Axioma 2: para el suceso cierto o seguro S en la clase C

P(S) =1

Axioma 3: para cualquier numero mutuamente excluyente A 1, B2, ... en la clase C


P ( A1 A2 ) = p( A1) + p( A2) + ...
En particular , para solo dos sucesos mutuamente excluyentes A1, A2
P (A1A2) = p(A1) + p(A2)

2.4.2 Teoremas.
Teorema 1 . si A1 A2 entonces P (A1) P( A2) y P( A2 - A1) = P( A2 ) P (A1)
Teorema 2. para cada suceso A 0 P ( A) 1 es decir la probabilidad de un suceso entre 0
y 1.
Teorema 3. P ( ) = 0 es decir el suceso imposible tiene probabilidad cero.
Teorema 4. si A es el complemento de A entonces

P(A)=1p(A)

Teorema 5. p(A) = p(A1) + p(A2) + ... + p (A n ); En particular si A = S, el espacio muestral,


entonces

p(A1) + p(A2) + ... + p (A n ) = 1

Teorema 6. si A y B son dos sucesos cualesquiera , entonces


P ( A B ) = P(A) + P(B) - P ( AB )
Teorema 7. para dos sucesos A y B
P ( A) = P ( AB ) + P ( AB )

100

UNIDAD II / PROBABILIDAD.

Teorema 8. si un suceso A debe resultar en uno de los sucesos mutuamente excluyentes A1


, A2, ...,An entonces P ( A) = P( A A1 ) + P ( A A2)+ + P ( A An )

2.5 Probabilidad condicional.

2.5.1 Dependiente.
Hay ocasiones en que nos interesa alterar nuestra estimacin de la probabilidad de un
evento cuando poseemos informacin adicional que podra afectar el resultado. Esta
probabilidad modificada se denomina probabilidad condicional del evento.
La probabilidad de que un evento B ocurra cuando se sabe que ya ocurri algn evento A se
llama probabilidad condicional y se denota por P(B A ). El smbolo P(B A ) por lo
general se lee la probabilidad de que ocurra B dado que ocurri A o simplemente la
probabilidad de B, dado A.

Frmula para la probabilidad condicional


Para determinar la probabilidad condicional de que el evento A ocurra, Dado que ocurra el
evento B, divida la probabilidad de que ocurra tanto A como B entre la probabilidad de
que ocurra B; esto es,

P(A B ) =

P( A B )
P (B )

donde suponemos que P ( B ) 0


Sea un espacio muestral en donde se ha definido un evento E, donde p(E)>0, si
deseamos determinar la probabilidad de que ocurra un evento A (el que tambin es definido
en el mismo espacio muestral), dado que E ya ocurri, entonces deseamos determinar una
probabilidad de tipo condicional, la que se determina como se muestra;

p( A | E ) =

p( A E )
p( E )

Donde:
p(AE) = probabilidad de que ocurra A dado que E ya ocurri; p(AE) = probabilidad de que
ocurra A y E a un mismo tiempo; p(E) = probabilidad de que ocurra E

101

UNIDAD II / PROBABILIDAD.

Luego;

P( A E ) =

A E

P( E ) =

Por tanto:

P( A | E ) =

A E
E

Donde:
AE= nmero de elementos comunes a los eventos A y E
E= nmero de elementos del evento E
Luego entonces podemos usar cualquiera de las dos frmulas para calcular la probabilidad
condicional de A dado que E ya ocurri.
Si la ocurrencia o no de E1 no afecta para nada la probabilidad de ocurrencia de E2 ,
entonces : Pr { E2 E1 } = P { E2 }, y diremos que E1 y E2 son sucesos independientes; en
caso contrario, se dir que son casos dependientes.
Si denotamos por E1 E2 el suceso de que ambos E1 y E2 ocurran, llamado un suceso
compuesto, entonces
Pr {E1 E2 } = Pr {E1 } Pr { E2 E1 }
En particular,
Pr {E1 E2 } = Pr {E1 } Pr { E2 }
Problema: La probabilidad de que un vuelo programado normalmente salga a tiempo es
P(D) = 0.83; la probabilidad de que llegue a tiempo es P ( A ) 0 0.82; y la probabilidad de que
salga y llegue a tiempo es P ( D A ) = 0.78. Encuentre la probabilidad de que un avin
a)

llegue a tiempo, dado que sali a tiempo y

b)

sali a tiempo, dado que llego a tiempo.

Solucin:
a)

La probabilidad de que un avin llegue a tiempo, dado que sali a tiempo es

P ( A | D) =

P( D A) 0.78
=
= 0.94
P ( D)
0.83

102

UNIDAD II / PROBABILIDAD.

La probabilidad de que un avin saliera a tiempo, dado que llego a tiempo es

P ( D | A) =

P ( D A) 0.78
=
= 0.95
P ( A)
0.82

Problema: Sean E1 y E2 los sucesos cara en el quinto lanzamiento y cara en el sexto


lanzamiento de una moneda, respectivamente. Entonces E1 y E2

son sucesos

independientes y por lo tanto, la probabilidad de que salga cara en ambos intentos es


Pr {E1 E2 } = Pr {E1 } Pr { E2 } = ( ) =
Problema: Si las probabilidades de A y B de estar vivos dentro de 20 aos son 0.7 y 0.5,
respectivamente, entonces la probabilidad de que ambos lo estn es
(0.7) (0.5) = 0.35
Problema: Una caja contiene 3 bolas blancas y 2 bolas negras. Sea E1 el suceso la primera
bola extrada es negra y E2 el suceso la segunda bola extrada es negra . las bolas
extradas no se devuelven a la caja E1 y E2 son sucesos dependientes .
Solucin:
Pr {E1 E2 } = Pr {E1 } P { E2 } = ( 2/5 )(1 / 4 ) = 1 /10
Sucesos mutuamente excluyentes
Dos o ms sucesos se llaman sucesos mutuamente excluyentes si la ocurrencia de
cualquiera de ellos excluye la de los otros. De modo que si E1 y E2 son sucesos mutuamente
excluyentes , entonces
Pr {E1 E2 } = 0
Si E1 + E2 denota el suceso de que ocurra E1 o bien E2 o ambos a la vez, entonces
Pr (E1 + E2 ) = Pr (E1 ) + Pr ( E2 ) - Pr (E1 E2 )
En particular
Pr (E1 + E2 ) = Pr (E1 ) + Pr ( E2 ) para suceso
Mutuamente excluyentes
Problema: Sea E1 el suceso sacar un as de una baraja y E2 sacar un rey. Cual es la
probabilidad de sacar o un as o un rey en un solo ensayo es

103

UNIDAD II / PROBABILIDAD.

Solucin:
Pr (E1 ) = 4 / 52 = 1/13
Pr (E2 ) = 4/52 = 1/13
Pr (E1 + E2 ) = 1 / 13 + 1/13 = 2 / 13
Problema: Una bola se extrae aleatoriamente de una caja que contiene 6 bolas rojas, 4
bolas blancas y 5 bolas azules. Determinar la probabilidad de que sea a) roja, b) blanca, c)
azul, d) no roja, e) roja o azul.
Solucin:
a) pr ( roja ) = 6 / ( 6 + 4 + 5 ) = 6 / 15 = 2/5
b)

Pr ( blanca = 4 / 15

c)

Pr ( azul ) = 5 /15 = 1/3

d) Pr(no roja ) = 1 Pr(roja) = 1 2/5 = 3/5


O bien
Pr ( no roja ) = 4 / 15 + 5 / 15 = 9/15 = 3/5
e) Pr ( roja o azul ) = pr (roja) + Pr ( blanca) = 2/5 + 4 /15 = 2/3
Problema: Sea E1 el suceso sacar un as de una baraja y E2

sacar una espada.

Entonces E1 y E2 no son sucesos mutuamente excluyentes, porque pueden sacarse el as


de espadas. Luego la probabilidad de sacar un as o una espada o ambos es
Pr (E1 + E2 ) = Pr (E1 ) + Pr ( E2 ) - Pr (E1 E2 ) = 4 /52 + 13/52 1 /52 = 16 / 52 = 4 /13
Problema: Un dado honesto se lanza dos veces. Hallar la probabilidad de obtener 4, 5 o 6 en
el primer lanzamiento y 1, 2, 3 o 4 en el segundo lanzamiento.
Solucin: E1 = 4, 5 o 6

E2 = 1, 2, 3 o 4

Pr (E1 E2 ) = Pr (E1 )
Pr ( E2 E1 ) = Pr (E1 ) P (E2 ) = (3/6)(4/6) = 1/3
Problema: Se extraen tres bolas sucesivamente de la caja que contiene 6 bolas rojas, 4
bolas blancas y 5 bolas azules. Hallar la probabilidad de que se extraigan en el orden roja,
blanca y azul si las bolas , a) se remplazan, b) no se remplazan.
Solucin:
a)

pr ( se remplazan ) = [6 / ( 6 + 4 + 5 ) ] [4 / ( 6 + 4 + 5 )] [5 / ( 6 + 4 + 5 ) ] = 8/225

104

UNIDAD II / PROBABILIDAD.

Pr ( no se remplazan) = [6 / ( 6 + 4 + 5 ) ] [4 / ( 5 + 4 + 5 )] [5 / ( 5 + 3 + 5 ) ] = 4/91

b)

Problema: Hallar la probabilidad de obtener al menos un 4 en dos lanzamientos de un dado


honrado.
Pr ( al menos un 4 en dos lanzamientos) = Pr (E1 ) + Pr ( E2 ) - Pr (E1 E2 )
= Pr (E1 ) + Pr ( E2 ) - Pr (E1) Pr(E2 ) = 1/6+1/6 - (1/6)(1/6) = 11/36
Problema: Se lanza al aire dos dados normales, si la suma de los nmeros que aparecen es
de por lo menos siete,
a) determine la probabilidad de que en el segundo dado aparezca el nmero cuatro,
b) Determine la probabilidad de que ambos nmeros sean pares,
c)

Determine la probabilidad de que en el primer dado aparezca el nmero dos.

Solucin:
El espacio muestral es el mismo que cuando se lanza un dado dos veces y se muestra a
continuacin;
(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)
(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
= (1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
a) Para calcular una probabilidad condicional es necesario definir los eventos A y E,
siendo estos,
A = evento de que en el segundo dado aparezca el nmero cuatro,
E = evento de que la suma de los nmeros que aparecen sea de por lo menos siete, (que es
que es el evento que est condicionando)
E = {21 elementos, los que suman siete o ms}

(6,1) (5,2) (6,2)(4,3) (5,3) (6,3) (3,4) (4,4) (5,4) (6,4)

E=

(2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
A = {6 elementos, los que en el segundo dado aparece el cuatro}

105

UNIDAD II / PROBABILIDAD.

A = {(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)}


Luego,
AE = {(3,4) (4,4) (5,4) (6,4)}, AE= 4 elementos
Por tanto;
p(AE) = AE/ E= 4/21 = 0.19048
b) E = evento de que la suma de los nmeros que aparecen sea de por lo menos siete

(6,1) (5,2) (6,2)(4,3) (5,3) (6,3)(3,4) (4,4) (5,4) (6,4)

E=

(2,5) (3,5) (4,5) (5,5) (6,5)(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
A = evento de que ambos nmeros sean pares
A = (2,2) (4,2) (6,2) (2,4) (4,4) (6,4) (2,6) (4,6) (6,6)
AE = (6,2) (4,4) (6,4) (2,6) (4,6) (6,6)

AE=6 elementos

p(AE) = AE/ E = 6/ 21 = 0.28571


c) E = evento de que la suma de los nmeros que aparecen sea de por lo menos siete

(6,1) (5,2) (6,2)(4,3) (5,3) (6,3) (3,4) (4,4) (5,4) (6,4)

E=

(2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
A = evento de que en el primer dado aparezca el nmero dos
A = (2,1) (2,2) (2,3) (2,4) (2,5)
AE = {(2,5)},

(2,6)

AE= 1 elemento

P(AE) = AE/E = 1/21

= 0.04762

Problema: Se seleccionan al azar dos nmeros de entre los nmeros del 1 al 9, si la suma
de los nmeros que aparecen es par,
a) Determine la probabilidad de que ambos nmeros sean pares,
b) Determine la probabilidad de que ambos nmeros sean impares.
Solucin:

106

UNIDAD II / PROBABILIDAD.

= {9C2 = 36 maneras de seleccionar dos nmeros de entre nueve que se tienen}


(1,2)
(1,3) (2,3)
(1,4) (2,4) (3,4)
= (1,5) (2,5) (3,5) (4,5)
(1,6) (2,6) (3,6) (4,6) (5,6)
(1,7) (2,7) (3,7) (4,7) (5,7) (6,7)
(1,8) (2,8) (3,8) (4,8) (5,8) (6,8) (7,8)
(1,9) (2,9) (3,9) (4,9) (5,9) (6,9) (7,9) (8,9)
a) E = evento de que la suma de los nmeros que se seleccionan sea par
E = (1,3) (2,4) (1,5) (3,5) (2,6) (4,6) (1,3) (3,7) (5,7) (2,8) (4,8) (6,8) (1,9) (3,9) (5,9) (7,9)
E = {16 elementos }
A = evento de que ambos nmeros Sean pares
A = (2,4) (2,6) (4,6)(2,8) (4,8) (6,8)
A = {6 elementos}
AE = (2,4) (2,6) (4,6) (2,8) (4,8) (6,8)
AE = 6 elementos ,
p(AE) = AE/ E= 6/16 = 0.375
b) E = evento de que la suma de los nmeros seleccionados es par
E = (1,3) (2,4) (1,5) (3,5) (2,6) (4,6) (1,3) (3,7) (5,7) (2,8) (4,8) (6,8) (1,9) (3,9) (5,9) (7,9)
A = evento de que ambos nmeros sean impares
A = (1,3) (1,5) (3,5) (1,7) (3,7) (5,7) (1,9) (3,9) (5,9) (7,9)
A = {10 elementos},
AE = (1,3) (1,5) (3,5) (1,7) (3,7) (5,7) (1,9) (3,9) (5,9) (7,9)
AE= 10 elementos;

p(AE)= AE/ E= 10/16 = 0.625

Problema: Dada la siguiente tabla referente a la produccin de flechas para camin de carga
pesada; se inspeccionan 200 flechas del tipo A y B, 300 del tipo C y 400 del tipo D, a
continuacin se presentan los resultados obtenidos en la inspeccin;

107

UNIDAD II / PROBABILIDAD.

Tipo flecha
DEFECTO A

TOTAL

54

23

40

15

132

II

28

12

14

59

S - DEF

118

165 246

380 909

TOTAL

200

200 300

400 1100

a) Si se selecciona una flecha al azar y resulta que es una flecha del tipo B, cul es la
probabilidad de que no tenga defectos,
b)

Si la flecha seleccionada es del tipo C, cul es la probabilidad de que tenga


defectos del tipo II?,

c) Si la flecha seleccionada tiene defectos del tipo I, cul es la probabilidad de que


sea del tipo A,
d) cul es la probabilidad de que una flecha no tenga defectos?,
e) cul es la probabilidad de que una flecha tenga defectos?
Solucin:
a) Definiremos los eventos;
E = evento de que la flecha seleccionada sea del tipo B = {200 elementos o flechas}
A = evento de que la flecha seleccionada no tenga defectos = {909 flechas o elementos}
AE = {165 elementos del tipo B y que no tienen defectos}
p(AE) = AE/E= 165/200 = 0.825
b)

E = evento de que la flecha sea del tipo C = {300 flechas}

A = evento de que la flecha tenga defectos del tipo II ={59 flechas}


AE = {14 flechas del tipo C y que tienen defectos del II } ;
p(AE) =AE/E= 14/300 = 0.04667
c)

E = evento de que la flecha tenga defectos del tipo I = {132 flechas}

A = evento de que la flecha sea del tipo A = {200 flechas}


AE = {54 flechas con defectos del tipo I y del tipo A}
p(AE) = AE/E= 54 / 132 = 0.40901
d) En este caso se trata de una probabilidad simple, ya que no hay un evento que est
condicionando al evento del cual se desea determinar su probabilidad

108

UNIDAD II / PROBABILIDAD.

D = evento de que una flecha no tenga defectos = {909 flechas}


= {1100 flechas}
p(D) = 909/1100 = 0.82636
e) F = evento de que una flecha tenga defectos = {132 + 59 = 191 flechas}
= {1100 flechas} p(F) = 191 / 1100 = 0.17364
Problema: Segn las estadsticas, la probabilidad de que un auto que llega a cierta
gasolinera cargue gasolina es de 0.79, mientras que la probabilidad de que ponga aceite al
motor es de 0.11 y la probabilidad de que ponga gasolina y aceite al motor es de 0.06,
a) S un auto carga gasolina, cul es la probabilidad de que ponga aceite?,
b) S un auto pone aceite al motor, cul es la probabilidad de que ponga gasolina?
Solucin:
a) E = evento de que un auto cargue gasolina p(E) = 0.79
A = evento de que un auto ponga aceite al motor P(A) = 0.11
AE = evento de que un auto ponga gasolina y aceite p(AE) = 0.07
p(AE) = p(AE)/p(E) = 0.07/ 0.79 = 0.0881
b) E = evento de que un auto ponga aceite al motor P(E) = 0.11
A = evento de que un auto ponga gasolina P(A) = 0.79
AE = evento de que un auto ponga aceite al motor y ponga gasolina P(AE) = 0.07
P(AE) = p(AE)/ p(E) = 0.07/0.11 = 0.63636
Problema: La probabilidad de que un auto de carreras cargue gasolina en cierto circuito en la
primera media hora de recorrido es de 0.58, la probabilidad de que cambie de neumticos en
esa primera media hora de recorrido es de 0.16, la probabilidad de que cargue gasolina y
cambie de neumticos en la primera media hora de recorrido es de 0.05,
a) Cul es la probabilidad de que cargue gasolina o cambie de neumticos en la
primera media hora de recorrido?,
b) cul es la probabilidad de que no cargue combustible y de neumticos en la
primera media hora de recorrido,
c) Si el auto cambia de neumticos en la primera media hora de recorrido, cul es la
probabilidad de que cargue combustible tambin?,

109

UNIDAD II / PROBABILIDAD.

d) Si el auto carga combustible en la primera media hora de recorrido, cul es la


probabilidad de que cambie de neumticos tambin?
Solucin:
a) A = evento de que cargue gasolina en la primera media hora de recorrido P(A) = 0.58
B = evento de que cambie de neumticos en la primera hora de recorrido P(B) = 0.16
AB = evento de que cargue combustible y cambie de neumticos en la primera hora de
recorrido P(AB) = 0.05
P(cargue gasolina o cambie de neumticos) = p(AB) = p(A) + p(B) p(AB)
P(cargue gasolina o cambie de neumticos) = 0.58 + 0.16 0.05 = 0.69
b) p( no cargue combustible y no cambie de neumticos) = 1 p(AB) = 1 0.69 = 0.31
c) E = evento de que el auto cambie de neumticos en la primera media hora de recorrido
A = evento de que el auto cargue combustible en la primera media hora de recorrido
p(AE) = p(AE)/ p(E) = 0.05/0.16 = 0.3125
d) E = evento de que el auto cargue combustible en la primera media hora de recorrido
A = es el evento de que el auto cambie de neumticos en la primera media hora de recorrido
p(AE) = p(AE)/p(E) = 0.05/0.58 = 0.08621

2.5.2 independientes.
Se dice que un evento B es independiente de un evento A, si p(BA) = p(B), esto quiere
decir que la probabilidad de que ocurra B no es afectada por la ocurrencia del evento A, la
expresin anterior se puede sustituir en el teorema de la multiplicacin para probabilidad
condicional,
p(AB) = p(A)p(BA) = p(A)p(B)
Luego,
p(AB) = p(A)p(B)
Concepto de independencia
Si la expresin anterior se cumple, podemos decir que los eventos A y B son
independientes.
Problema: Pruebas repetidas e independientes.

110

UNIDAD II / PROBABILIDAD.

Sea el espacio muestral del lanzamiento de una moneda tres veces,


= {AAA, AAS, ASA, ASS, SAS, SAA, SSA, SSS}
p(AAA) = p(A1A2A3) = p(A1)p(A2A1)p(A3A1A2) = p(A)p(A)p(A) =1/2*1/2*1/2 = 1/8
p(AAS) = p(A)p(A)p(S) =1/2*1/2*1/2 =1/8
p(ASA) = p(A)p(S)p(A) = 1/2*1/2*1/2 = 1/8
etc, etc.
Con lo anterior se comprueba que efectivamente la probabilidad de cada uno de los
elementos del espacio muestral descrito anteriormente es de 1/8 como se consideraba
cuando se calculaban probabilidades para un espacio finito equiprobables.
Problema: Un equipo de ftbol soccer tiene una probabilidad de ganar de 0.6, una
probabilidad de empatar de 0.3 y una probabilidad de perder de 0.1, si este equipo participa
en dos juegos la semana prxima, determine la probabilidad de que; a. Gane el segundo
juego, b. Gane ambos juegos, c. Gane uno de los juegos, d. Gane el primer juego y empate
el segundo.
El espacio muestral sera:
= {GG, GE, GP, EG, EE, EP, PG, PE, PP}
a) p(gane el segundo juego) = p(GG, EG, PG) = (0.6)(0.6) + (0.3)(0.6) + (0.1)(0.6)
= 0.36 + 0.18 + 0.06 = 0.6
b) p(gane ambos juegos) = p(GG) = (0.6)(0.6) = 0.36
c) p(gane uno de los juegos) = p(GE, GP, EG, PG)
= (0.6)(0.3) + (0.6)(0.1) + (0.3)(0.6) + (0.1)(0.6) = 0.18 + 0.06 + 0.18 + 0.06 = 0.48
d) p(gane el primero y empate el segundo) = p(GE) = (0.6)(0.3) = 0.18

Problema: Un boxeador gana 8 de cada 10 peleas en las que compite, si este boxeador
participar en tres peleas en los prximos seis meses, determine la probabilidad de que;
a) Gane dos de las peleas

111

UNIDAD II / PROBABILIDAD.

b) Si gana dos de las peleas, cul es la probabilidad de que sean la primera y tercera
peleas?,
c) Gane la segunda pelea.
Solucin: ={GGG. GGP, GPG, GPP, PGG, PGP, PPG, PPP}
a) p(gane dos de las peleas) = p(GGP, GPG, PGG)
= (0.8)(0.8)(0.2) + (0.8)(0.2)(0.8) + (0.2)(0.8)(0.8) = 0.128 + 0.128 + 0.128 = 0.384
b) E = evento de que gane dos peleas.
E ={ GGP, GPG, PGG }, p(E) = 0.348
A = evento de que gane la primera y la tercer pelea
A={GGG, GPG}

AB = {GPG},

p(AB) = (0.8)(0.2)(0.8) =0.128

P(AE) = p(AE) / p(E) = 0.348/0.128= 0.3333


c) p(gane la segunda pelea) = p(GGG, GGP, PGG, PGP)
= (0.8)(0.8)(0.8) + (0.8)(0.8)(0.2) + (0.2)(0.8)(0.8) + (0.2)(0.8)(0.2)
= 0.512 + 0.128 + 0.128 + 0.032 = 0.8
Problema: Tres hombres tiran a un blanco, A tiene 1/3 de posibilidades de acertar al blanco,
B tiene 1/2 de posibilidades de acertar y C tiene 1/4 de posibilidades de pegar al blanco, si
cada uno de ellos hace un solo disparo, determine la probabilidad de que;
a) Solo uno de ellos acierte al blanco,
b) Si solo uno de ellos acierta al blanco, cul es la probabilidad de que acierte A?,
c) Determine la probabilidad de que ninguno acierte al blanco.
Solucin:
Haciendo uso de un diagrama de rbol se obtiene el siguiente espacio muestral;
= {ABC, ABC`, AB`C, AB`C`, A`BC, A`BC`, A`B`C, A`B`C`}
donde:
A = acierta A, A`= no acierta A, B = acierta B, B`= no acierta B, etc., etc.
a) p(solo uno de ellos acierte al blanco)
= p(AB`C`, A`BC`, A`B`C) = 1/3*1/2*3/4 + 2/3*1/2*3/4 + 2/3*1/2*1/4
= 3/24 + 6/24 + 2/24 = 11/24 = 0.45833

112

UNIDAD II / PROBABILIDAD.

b) E = evento de que solo uno de ellos acierte al blanco


E = {AB`C`, A`BC`, A`B`C};

p(E) =11/24

A = evento de que A acierte al blanco


A = { ABC, ABC`, AB`C, AB`C`}
AE = { AB`C`} = 1/3*1/2*3/4 = 3/24
p(AE)= p(AE)/p(E) = (3/24)/(11/24)
= 3/11 = 0.27273
c) p(ninguno acierte al blanco) = p(ABC) = 2/3*1/2*3/4 = 6/24 = 0.25

2.6. Eventos Independientes

2.6.1 Regla de Bayes.


Teorema de la Probabilidad Total
Sea un espacio probabilstico (, A, P) y

{ An } A una particin de sucesos de .

Es decir,

U An = y

Ai

I Aj = para toda i j

Entonces, para todo suceso

B A es P ( B ) = P( B | An ) * P( An ) .
n

Resultado que se puede parafrasear diciendo que la probabilidad de un suceso que se


puede dar de varias formas es igual a la suma de los productos de las probabilidades de
ste en cada una de esas formas, P(B / A n), por las probabilidades de que se den estas
formas, P(A n).
Problema: Una poblacin est formada por tres grupos tnicos: A (un 30%), B (un 10%) y C
(un 6O%). Adems se sabe que el porcentaje de personas con ojos claros en cada una de
estas poblaciones es, respectivamente, del 20%, 40% y 5%. Por el teorema de la
probabilidad total, la probabilidad de que un individuo elegido al azar de esta poblacin
tenga ojos claros es:

P(ojos claros) = P(A) P(ojos claros/A) + P(B) P(ojos claros/B) + P(C) P(0jos claros/C )
= 0'3 0'2 + 0'1 0'4 + 0'6 0'05 = 0'13.

113

UNIDAD II / PROBABILIDAD.

Teorema de Bayes
El siguiente teorema es un resultado con una gran carga filosfica detrs, el cual mide el
cambio que se va produciendo en las probabilidades de los sucesos a medida que vamos
haciendo observaciones. Paradjicamente a su importancia, su demostracin no es ms que
la aplicacin de la definicin de probabilidad condicionada seguida de la aplicacin del
teorema de la probabilidad total.

Teorema:
Sea un espacio probabilstico (, A, P) y

{ An } A

una particin de sucesos de y

B A

un suceso con probabilidad positiva. Entonces, para todo suceso Ai es

P( Ai | B ) =

P ( Ai ) P ( B | Ai )
P( An ) P( B | An )
n

Este teorema tiene una interpretacin intuitiva muy interesante. Si las cosas que pueden
ocurrir las tenemos clasificadas en los sucesos Ai de los cuales conocemos sus
probabilidaes P(Ai), denominadas a priori, y se observa un suceso B, la frmula de Bayes
nos da las probabilidades a posteriori de los sucesos A<SUB<I< sub>, ajustadas o
modificadas por B.
Problema: Supongamos que tenemos una urna delante de nosotros de la cual solo
conocemos que o es la urna A1 con 3 bolas blancas y 1 negra, o es la urna A2 con 3 bolas
negras y 1 blanca. Con objeto de obtener ms informacin acerca de cual urna tenemos
delante, realizamos un experimento consistente en extraer una bola de la urna desconocida.
Si suponemos que la bola extraida result blanca 1B y a priori ninguna de las dos urnas es
ms verosmil que la otra, P(A1) = P(A2) = 1/2, entonces la frmula de Bayes nos dice que las
probabilidades a posteriori de cada urna son
P(A1/1B) =3/4 y P(A2/1B) =1/4
Habiendo alterado de esta forma nuestra creencia sobre la urna que tenemos delante: Antes
creamos que eran equiprobables y ahora creemos que es tres veces ms probable que la
urna desconocida sea la A1.

114

UNIDAD II / PROBABILIDAD.

Pero, qu ocurrir si extraemos otra bola?. Lgicamente, en la frmula de Bayes


deberemos tomar ahora como probabilidades a priori las calculadas, 3/4 y 1/4, pues stas
son nuestras creencias sobre la composicin de la urna, antes de volver a realizar el
experimento.
Si suponemos que la bola no fue reemplazada (se deja para el lector el caso de
reemplazamiento), y sale una bola negra 2N, la frmula de Bayes nos devolvera a la
incertidumbre inicial, ya que sera
P(A1/2N) =1/2 y P(A2/2N) =1/2
Si hubiera salido blanca, la frmula de Bayes, al igual que la lgica, tambin sera
concluyente,
P(A1/2B) =1 y P(A2/2B) =0
La utilizacin de la frmula de Bayes, es decir, la utilizacin de distribuciones de probabilidad
a posteriori como modelos en la estimacin de parmetros, al recoger sta tanto la
informacin muestral, P(B/Ai), como la informacin a priori sobre ellos, P(Ai), constituye una
filosofa inferencial en gran desarrollo en los ltimos aos, la cual, no obstante, tiene el
inconveniente (o segn ellos la ventaja) de depender de la informacin a priori, la cual en
muchas ocasiones es subjetiva y por tanto, pudiendo ser diferente de un investigador a otro.
Uno de los primeros intentos por utilizar la probabilidad para hacer inferencias es la base de
una rama de la metodologa estadstica llamada mtodos estadsticos bayesianos.
Con referencia a la figura siguiente podemos escribir A como la unin de los dos eventos
mutuamente excluyentes E A y E A.
De aqu :
A = ( E A ) ( E A. ),
Y por el corolario i del teorema y adems podemos escribir
P ( A ) = P [ (E A ) P ( E A ) ] = P (E A ) + P ( E A )
= P (E ) P (A E) + P ( E ) P ( AE ) .

115

UNIDAD II / PROBABILIDAD.

Problema:
P ( E) = 600/900 = 2/3 ; P (A E) = 36/600 = 3/50
P ( E ) = 1/3

P ( AE ) = 12/300 = 1/25

P ( A ) = (2/3)(3/50) + (1/3)(1/25) = 4/75


Una generalizacin de la ilustracin precedente al caso donde el espacio muestral se parte
en k subconjuntos la cubre el siguiente teorema, que algunas veces se denomina teorema
de probabilidad total o regla de eliminacin

Teorema 2.6.1.
Si los eventos B

,B

, ..., B

constituyen una particin del espacio muestral S tal que

P(Bi ) 0
para i = 1, 2, ..., k, , entonces para cualquier evento A de S,
k

i =1

i =1

P ( A) = P ( Bi A) = P ( Bi )( A | Bi )

Problema: En cierta planta de montaje, tres maquinas, B 1, B2 y B3 , montan 30% , 45 % y 25


% de los productos, respectivamente. Se sabe de la experiencia pasada que 2% , 3% y 2%
de los productos ensamblados por cada maquina, respectivamente, tiene defectos. Ahora ,
suponga que se selecciona de forma aleatoria un producto terminado. cual es la
probabilidad de que este defectuoso?
Solucin:
A = el producto esta defectuoso
B 1: el producto esta ensamblado por la maquina B 1
B2: el producto esta ensamblado por la maquina B2
B3: el producto esta ensamblado por la maquina B3
Al aplicar la regla de eliminacin, podemos escribir
P ( A ) = P (B 1 ) P (A B 1) + P (B 2 ) P (A B 2) + P (B 3 ) P (A B 3)

116

UNIDAD II / PROBABILIDAD.

P (B 1 ) P (A B 1) = (0.3) (0.02) = 0.006; P (B 2 ) P (A B 2) = (0.45)(0.03) = 0.0135


P (B 3 ) P (A B 3) = (0.25)(0.02) = 0.005; P ( A ) = 0.006 + 0.0135 + 0.005 = 0.0245
Cul es la probabilidad de que este producto fuera hecho por la maquina B i ?
Preguntas de este tipo se puede contestar mediante la regla de bayes
Problema: con referencia al ejemplo anterior, si se elige al azar un producto y se encuentra
que es defectuoso, cual es la probabilidad de que este ensamblado por la maquina B 3 ?
Solucin:

P ( B3 | A) =

P ( B3 ) P ( A | B3 )
P ( B1 ) P ( A | B1 ) + P ( B2 ) P( A | B2 ) + P( B3 ) P ( A | B3 )

y despus sustituir las probabilidades calculadas en el ejemplo anterior , tenemos:

P( B3 | A) =

0.005
0.005 10
=
=
0.006 + 0.0135 + 0.005 0.0245 49

En vista del hecho de que se selecciono un producto defectuoso, este resultado sugiere que
probablemente no fue hecho con la maquina B 3.
Problema: Tres mquinas denominadas A, B y C, producen un 43%, 26% y 31% de la
produccin total de una empresa respectivamente, se ha detectado que un 8%, 2% y 1.6%
del producto manufacturado por estas mquinas es defectuoso,
a) Se selecciona un producto al azar y se encuentra que es defectuoso, cul es la
probabilidad de que el producto haya sido fabricado en la mquina B?,
b) Si el producto seleccionado resulta que no es defectuoso, cul es la probabilidad de que
haya sido fabricado en la mquina C?
Solucin:

117

UNIDAD II / PROBABILIDAD.

a) Definiremos los eventos;


D = evento de que el producto seleccionado sea defectuoso (evento que condiciona); A =
evento de que el producto sea fabricado en la mquina A; B = evento de que el producto sea
fabricado por la mquina B; C = evento de que el producto sea fabricado por la mquina C

P( B | D) =

P( B) P( D | B)
P( A) P( D | A) + P ( B) P ( D | B ) + P(C ) P( D | C )

P( B | D) =

0.26(0.02)
0.0052
=
= 0.116697
0.43(0.08) + 0.26(0.02) + 0.31(0.016) 0.04456

b) ND = evento de que el producto seleccionado no sea defectuoso (evento que condiciona)


A = evento de que el producto sea fabricado en la mquina A; B = evento de que el producto
sea fabricado por la mquina B; C = evento de que el producto sea fabricado por la mquina
C.

P (C | ND) =

P( B | D) =

P(C ) P ( ND | C )
P ( A) P ( ND | A) + P( B ) P( ND | B ) + P (C ) P( ND | C )

0.31(0.984)
0.30504
=
= 0.31927
0.43(0.92) + 0.26(0.98) + 0.31(0.984) 0.95544

Problema: Una empresa recibe visitantes en sus instalaciones y los hospeda en cualquiera
de tres hoteles de la ciudad; Palacio del Sol, Sicomoros o Fiesta Inn, en una proporcin de

118

UNIDAD II / PROBABILIDAD.

18.5%, 32% y 49.5% respectivamente, de los cuales se ha tenido informacin de que se les
ha dado un mal servicio en un 2.8%, 1% y 4% respectivamente,
a)

Si se selecciona a un visitante al azar cul es la probabilidad de que no se le


haya dado un mal servicio?

b)

Si se selecciona a un visitante al azar y se encuentra que el no se quej del


servicio prestado, cul es la probabilidad de que se haya hospedado en el
Palacio del Sol?,

c)

Si el visitante seleccionado se quej del servicio prestado, cul es la probabilidad


de que se haya hospedado en e hotel Fiesta Inn?

Solucin: Haciendo uso de un diagrama de rbol;

a) NQ = evento de que un visitante no se queje del servicio;

PS = evento de que un

visitante haya sido hospedado en el hotel Palacio del Sol; S = evento de que un
visitante haya sido hospedado en el hotel Sicmoro;

FI = evento de que un visitante

haya sido hospedado en el hotel Fiesta Inn

P ( NQ ) = P ( PS ) P ( NQ | PS ) + P ( S ) P ( NQ | S ) + P ( FI ) P ( NQ | FI )
P ( NQ ) = 0.185(0.972) + 0.32(0.99) + 0.495(0.96) = 0.97182
b) NQ = evento de que un visitante no se queje del servicio; PS = evento de que un
visitante haya sido hospedado en el hotel Palacio del Sol; S = evento de que un
visitante haya sido hospedado en el hotel Sicomoro; FI = evento de que un visitante
haya sido hospedado en el hotel Fiesta Inn

119

UNIDAD II / PROBABILIDAD.

P ( PS | NQ) =

0.185(0.972)
0.17982
=
= 0.1850342
0.185(0.972) + 0.32(0.99) + 0.495(0.96) 0.97182

c) Q = evento de que un visitante se queje del servicio; FI = evento de que un visitante


haya sido hospedado en el hotel Fiesta Inn

P ( FI | Q) =

0.495(0.04)
0.0198
=
= 0.7026
0.185(0.028) + 0.32(0.01) + 0.495(0.04) 0.0.02818

120

UNIDAD 3
FUNCIONES Y
DISTRIBUCIONES
MUESTRALES.
Objetivo:
Establecer las distribuciones de
probabilidad, basndose en datos
de situaciones reales o simuladas
que impliquen eventos aleatorios.
Centrar

su

estudio

distribuciones
Hipergeomtrica,

en

las

Binomial,
Poisson,

Normal, TStudent, chi-cuadrada y


f de Fisher para su aplicacin.

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

3.1 Funcin de probabilidad.

3.1.1 Variables aleatorias discretas.


La estadstica se ocupa de realizar inferencias acerca de poblaciones y sus caractersticas.
Se lleva a cabo experimentos cuyos resultados se encuentran sujetos al azar. Por ejemplo,
el espacio muestral que da una descripcin detallada de cada posible resultado cuando se
prueban tres componentes electrnicos se puede escribir como:
S = {NNN, NND, NDN, DNN, NDD, DND, DDN, DDD}
Donde N denota no defectuoso y D denota defectuoso. Naturalmente, estamos
interesados en el nmero de defectuosos que ocurren. De esta forma a cada punto muestral
se le asignara un valor numrico de 0, 1, 2, o 3. Estos resultados son, por supuesto,
cantidades aleatorias determinadas por el resultado del experimento. Se puede ver como
valores que toma la variable aleatoria X, el nmero de artculos defectuosos cuando se
prueban tres componentes electrnicos.

Definicin
Una variable aleatoria es una funcin que asocia un numero real con cada elemento del
espacio muestral.
Ejemplo: supngase que se lanza una moneda dos veces de tal forma que el espacio
muestral es S = {SS, SA, AS, AA }.
Represntese por X el nmero de sol que puede resultar.
Punto muestral

SS

SA

AS

AA

Ejemplo: se sacan dos bolas de manera sucesiva sin reemplazo de una urna que contiene
cuatro bolas rojas y tres negras. Los posibles resultados y los valores x de la variable
aleatoria. x el numero de bolas rojas, son
Punto muestral RR
X

RB

BR

BB

122

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Definicin
Si un espacio muestral contiene un numero finito de posibilidades o una serie interminable
con tantos elementos como nmeros enteros existen, se llama espacio muestral discreto.

3.1.2 Variables aleatorias continuas.


Una variable aleatoria continua tiene una probabilidad cero de tomar exactamente cualquiera
de sus valores. En consecuencia, su distribucin de probabilidad no se puede dar en forma
tabular. Consideremos una variable aleatoria cuyos valores son las alturas de toda la gente
mayor de 21 aos de edad. Entre cualesquiera dos valores, digamos 163.5 y 164.5
centmetros, o incluso 163.99 y 164.01 centmetros, hay un nmero infinito de alturas unas
de las cuales es 164 centmetros. Tratamos ahora como un intervalo en lugar de un valor
puntual de nuestra variable aleatoria. Trataremos el clculo de probabilidades para varios
intervalos de variables aleatorias continuas como:

P ( a < x < b) ,

P (W > c ) ,

Ntese que cuando x es continua,

P(a < x b) = P(a < X < b) + P( X = b) = P(a < x < b)


Es decir no importa si incluimos o no un extremo del intervalo. Esto no es cierto, sin
embargo, cuando X es discreta. Aunque la distribucin de probabilidad de variable continua
no se puede representar en forma tabular, se puede establecer como una formula. Dicha
frmula necesariamente ser funcin de los valores numricos de la variable continua f(x)
por lo general se llama funcin de densidad de probabilidad o simplemente funcin de
densidad de X.
Definicin
Si un espacio muestral contiene un nmero infinito de posibilidades igual al nmero de
puntos en un segmento de lnea, se llama espacio muestral continuo.

3.2 Distribucin Binomial.

3.2.1 Conceptos de ensayos de Bernoulli.


Binomial. Es la que maneja la distribucin de la probabilidad de obtener cierta cantidad de
xitos al realizar una cantidad de experimentos con probabilidad de xito constante y con
ensayos independientes

123

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Las caractersticas de esta distribucin son:


a)

En los experimentos que tienen este tipo de distribucin, siempre se esperan dos
tipos de resultados, ejem. Defectuoso, no defectuoso, pasa, no pasa, etc, etc.,
denominados arbitrariamente xito (que es lo que se espera que ocurra) o
fracaso (lo contrario del xito).

b)

Las probabilidades asociadas a cada uno de estos resultados son constantes, es


decir no cambian.

c)

Cada uno de los ensayos o repeticiones del experimento son independientes entre
s.

d)

El nmero de ensayos o repeticiones del experimento (n) es constante.

La distribucin Binomial o de Bernoulli


Consideremos los llamados ensayos Bernoulli, stos son aquellos experimentos cuyo
resultado es uno de dos posibles y mutuamente excluyentes, a los que se denominarn xito
y fracaso.
Entonces se tiene lo que se denomina experimento Binomial, donde el nmero de ensayos
se denota con n, la probabilidad de xito con p y la de fracaso con q. Hay que notar que las
probabilidades de xito y de fracaso estn relacionadas de la siguiente manera: p + q =1.

La distribucin de probabilidad Binomial


La distribucin de probabilidad para una variable aleatoria Binomial esta dada por

n

n!
p xq n x
P ( X = x) = p xq n x =
x! ( n x )!
x

x = 0,1,2,..., n

Donde:
p = probabilidad de xito en una sola prueba; q = 1 p (probabilidad de fracaso)
n = nmero de pruebas; x = numero de xitos en n pruebas. La media y la varianza de la
variable Binomial son, respectivamente,

= np

2 = npq

Problema: Hallar la probabilidad de que al lanzar una moneda tres veces resulten (a) tres
sol; (b) dos guilas y un sol; (c) al menos un sol ; ( d) no ms de una guila.

124

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Solucin:
Puede ocurrir 2 posibilidades (sol o guila ) por cada lanzamiento hay un total de
( 2) ( 2) (2) = 8 resultados posibles.
S = { SSS, SSA, SAS, ASS, SAA, ASA, AAS, AAA}
P(caiga un sol en una sola tirada) = p =
P(no caiga sol en una sola tirada) = q = 1 p =
(a) p( tres sol )
n=3yx=3
dbinom 3 , 3 ,

nx=33=0

= 0.125

(b) p ( dos guilas y un sol )


n=3;x=2;nx=32=1
dbinom 2 , 3 ,

= 0.375

( c ) p (al menos un sol ) = p ( 1 , 2 , 3 sol )


o bien = 1 p (ningn sol )
n = 3 ; x = 0; n x = 3 0 = 3
1 dbinom 0 , 3 ,

= 0.875

(e) p(no ms de una guila ) = p( 0 guila 1 guila) = p( 0 guila) +p(1 guila )


para 0 guila : n = 3 ; x = 0 ; n x = 3 0 = 3
para 1 guila :
dbinom 0 , 3 ,

n=3;x=1;nx=31=2

1
+ dbinom 1 , 3 , = 0.5

2
2

Problema: La probabilidad de que cierta clase de componente sobreviva a una prueba de


choque dada es . Encuentre la probabilidad de que sobrevivan exactamente dos de los
siguientes cuatro componentes que se prueben.
Solucin:
p = ; n = 4 ; x = 2;

125

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

b ( 2; 4, ) = 4 C2 ( ) 2 (1/4) 2 = 27/128 = 0.2109


Problema: La probabilidad de que un paciente se recuper de una delicada operacin de
corazn es 0.9 cul es la probabilidad de que exactamente cinco de los siguientes siete
pacientes intervenidos sobrevivan?
Solucin:
n = 7; p = 0.9, q = 0.1,,

x=5
5

b ( 5; 7, 0.9) = 7C5 (0.9) (0.1) 2 = 0.1240


Problema: Hallar la probabilidad de que en cinco lanzamientos de un dado honrado
aparezca 3
a)

dos veces

b)

mximo una vez

c)

al menos dos veces

Solucin:
p = 1/6; q = 1 p = 5/6
a)

n=5;x=2

b( 2; 5, 1/6) = 5C2 (1/6) 2 ( 5/6) 3 = 625/3888 = 0.16075


b) n = 5 ,

x= 0 , 1

b( 0; 5, 1/6) + b( 1; 5, 1/6) = 3125/3888= 0.80386


c) n = 5 ; x = 2, 3, 4, 5
b( 2; 5, 1/6) +b( 3; 5, 1/6) +b( 4; 5, 1/6) +b( 5; 5, 1/6) = 763/3888 = 0.19624
Problema: Si el 20 % de los tornillos producidos por una mquina son defectuosos,
determinar la probabilidad de que de 4 tornillos escogidos aleatoriamente
(a)1,
(b) 0,
(c) menos de 2, sean defectuosos.
Solucin:

126

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

(a) n = 4 x =1 p = 0.2 q = 0.8


b(1 ; 4, 0.2) = 0.4096
(b) n = 4 x = 0 p = 0.2 q = 0.8
b(0 ; 4, 0.2) = 0.4096
(c ) n = 4 x = 0, 1 p = 0.2 q = 0.8
p(x<2) = P(x = 0) + P(x = 1) = 0.8192
Problema: Hallar la probabilidad de obtener un total de 7 al menos una vez en tres
lanzamiento de un par de dados honrados.
Solucin:
n=7

p =1/6

X=0

q = 5/6

P(al menos un 7 en tres lanzamiento) = 1 P( ningn 7 en 3 lanzamiento)


n=3 x=0

p = 1/6

q = 5/6

b ( 0; 3, 1/6) = 125/216 = 0.57870


P(al menos un 7 en tres lanzamiento) = 1 125/216
= 91/216 = 0.42130
Problema: Calcula la probabilidad de que una familia que tiene 4 hijos, 3 de ellos sean
varones.
Solucin: n = 4 y p =1/2 ; x = 3
p(obtener 3 varones) = b(3;4,) = 0.25
Problema: Se tiene una moneda trucada de modo que la probabilidad de sacar cara es
cuatro veces la de sacar cruz. Se lanza 6 veces la moneda. Calcula las siguientes
probabilidades:
a)

Obtener dos veces cruz.

b)

Obtener a lo sumo dos veces cruz.

Solucin:

Calculamos en primer lugar la probabilidad de cara y de cruz:

p(cara) + p(cruz) =1. Si llamamos x a la probabilidad de sacar cruz, podemos escribir:


4 x + x = 1; 5x=1; x =1/5 =0,2

127

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

As resulta: p(cruz)=0,2 y p(cara)=0,8

n = 6 y p = 0,2

a) Probabilidad de obtener dos veces cruz: x = 2


b(2; 6,0.2) = 0.24
b) Probabilidad de obtener a lo sumo dos veces cruz: x 2 o bien x = 0, 1, 2
b(0; 6,0.2) + b(1; 6,0.2)+ b(2; 6,0.2) = 0.90
Problema: La probabilidad de que un alumno de 1 de Bachillerato repita curso es de 0,3.
Elegimos 20 alumnos al azar. Cul es la probabilidad de que haya exactamente 4 alumnos
repetidores?
Solucin:
X = 4 n = 20; p = 0.3 ; q = 0.7
b( 4; 20, 0.3) = 0.13
Problema: Los ingenieros elctricos saben que una corriente neutral elevada en los
sistemas de alimentacin de computadoras son un problema potencial. Un estudio reciente
de las corrientes de carga en sistemas de alimentacin de computadoras en instalaciones
estadounidenses revelo que el 10 % de las instalaciones tenan razones de corriente neutral
a corriente de carga total altas ( IEEE transactions on Industry Applications, Julio / agosto de
2004). Si se escoge una muestra aleatoria de cinco sistemas de alimentacin de
computadora del gran nmero de instalaciones del pas, Que probabilidad hay de que
a) Exactamente tres tengan una relacin de corriente neutral a corriente de carga total
alta?
b) Por lo menos tres tengan una relacin alta?
c) Menos de tres tengan una relacin alta?
Solucin:
a) x = 3; p = 0.1; n = 5
b(3,5,0.1) = 0.0081
b) x 3; p = 0.1; n = 5
b(x = 3,4,5, n = 5, p = 0.1) = 0.0086

128

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

c) x < 3; p = 0.1; n = 5
b(x = 0,1,2, n = 5, p = 0.1) = 0.9914

3.3 Distribucin Hipergeomtrica.


Los tipos de aplicaciones de la distribucin Hipergeomtrica son muy similares a los de la
Binomial. Pero en caso de la Binomial se requiere la independencia entre las pruebas.
El muestreo se debe efectuar con reemplazo de cada artculo despus de que se observe.
Por otro lado, la distribucin Hipergeomtrica no requiere independencia y se basa en el
muestreo que se realiza sin reemplazo.
El experiment Hipergeomtrica posee las siguientes propiedades:
1. Se selecciona sin reemplazo una muestra aleatoria de tamao n de N artculos.
2. K de los N artculos se pueden clasificar como xitos y N K se clasifican como fracaso.
El nmero x de xitos de un experimento Hipergeomtrica se denomina variable aleatoria
Hipergeomtrica. En consecuencia, la distribucin de probabilidad de la variable
Hipergeomtrica se llama distribucin Hipergeomtrica, y sus valores se denotan como h(x,
N, n, k), debido a que dependen del numero de xitos k

en el conjunto N del que

seleccionamos n artculos.

k N k

x n x ( k Cx )( N k Cn x )

=
h(x, N , n, k ) =
N
N Cn

n

x = 0,1,2,..., n

Problema: Se selecciona al azar un comit de cinco personas entre tres qumicos y cinco
fsicos. Encuentre la distribucin de probabilidad para el nmero de qumicos en el comit.
Solucin:

P ( x = 0) = h(0,8,5,3) =

P ( x = 1) = h(1,8,5,3) =

( 3 C0 )( 5 C5 )
= 0.0179
8 C5

( 3 C1 )( 5 C4 )
= 0.2679
8 C5

129

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

P ( x = 2) = h(2,8,5,3) =

( 3 C2 )( 5 C3 )
= 0.5357
8 C5

P ( x = 3) = h(3,8,5,3) =

( 3 C3 )( 5 C2 )
= 0.1786
8 C5

En forma tabular la distribucin Hipergeomtrica de x es como sigue:


x

h (x, N, n k)

0.0179

0.2679

0.5357

0.1786

Problema: Lotes de 40 componentes cada uno se denomina aceptables sino contienen mas
de tres defectuosos. El procedimiento para muestrear el lote es la seleccin de cinco
componentes al azar y rechazar el lote si se encuentra un componente defectuoso. cual es
la probabilidad de que se encuentre exactamente un defectuoso en la muestra si hay tres
defectuosos en todo el lote ?
Solucin:
N = 40, n = 5; k = 3; x = 1

h(1, 40,5,3) =

( 3 C1 )( 37 C4 )
= 0.3011
40 C5

Problema: Una caja contiene 6 bolas blancas y 4 rojas. Se realiza un experimento en el cual
se selecciona una bola aleatoriamente y se observa su color, pero no se reemplaza la bola.
Hallar la probabilidad de que despus de 5 pruebas del experimento se haya escogido 3
bolas blancas.
N = 10; n = 5; x = 3; k = 6

h(3,10,5, 6) =

( 6 C3 )( 4 C2 )
= 0.4762
10 C5

Problema: Un lote de 40 artculos se seleccionan al azar 4 para probarlos y si fallan la


prueba mas de 2 se rechaza el lote completo. Cul es la probabilidad de rechazar un lote
que tenga 8 defectuosos? Dado que el muestreo se hace sin reemplazo y la fraccin de

130

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

muestreo es grande (10%) tenemos una variable aleatoria Hipergeomtrica. Los parmetros
son: N = 40, k = 8, n = 4, x es el numero de defectuosos en la muestra y queremos la
probabilidad p ( x > 2)
Solucin:
P ( x > 2 ) = p (x = 3) + p(x = 4) = h ( 3; 40, 4, 8) + h ( 4 ; 40, 4, 8) = 0.0204
Problema: Esta es la probabilidad de rechazar un lote con 25 % de defectuosos y es muy
baja. Para mejorar el proceso de seleccin, los ingenieros deciden rechazar el lote cuando
haya 2 o mas defectuosos. Cul es la probabilidad de rechazar un lote que tenga 8
defectuosos? Los parmetros permanecen iguales lo que cambia es la probabilidad ahora
es: p ( x 2 ) = p (x = 2) + p ( x > 2)
Solucin:
N = 40 ; n = 4, k = 8 ; x 2
p ( x 2 ) = p (x = 2) + p (x = 3) + p(x = 4)]
= h ( 2; 40, 4, 8) + h ( 3; 40, 4, 8) + h ( 4 ; 40, 4, 8) = 0.1723
Problema: Con esta nueva poltica de rechazar el lote cuando sean 2 o ms cul es la
probabilidad de rechazar un lote con 6 defectuosos? los parmetros son, ahora N = 40, k =
6; n = 4 y queremos la probabilidad:
p (x > 10 ) = 1 - [ p (x = 0) + p ( x = 1)] = 1 [ h (0 , 40, 4, 6) + h ( 1,40, 4,6)]=
= 1 ( 0.5075 + 0.3929 ) = 0.0996
Problema: En el saln de tercer ao de una escuela hay 35 alumnos, de los cuales 10 son
nias y 25 nios. Se nombra un comit de 7 alumnos que represente al saln. La seleccin
se hace al azar. que probabilidad hay de que en el comit haya mayora de nias? En
situaciones se cumple las hiptesis de una Hipergeomtrica. Los parmetros son : N = 35,
k = 10, n = 7, x es el numero de nias en el comit. La probabilidad pedida es:
P (x > 3 ) = p (x = 4) + p (x = 5) + p (x = 6) + p (x = 7)
Solucin:
=h(4,35,7,10)+h(5,35,7,10)+ (6,35,7,10)+h(7,35,7,10)
= 0.0718 + 0.0112 + 7.8072 x 10 4 + 1.7845 x 10 5 = 0.0838

131

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

3.4 Distribucin de Poisson.


Los experimentos que dan valores numricos de una variable aleatoria x, el nmero de
resultados que ocurren durante un intervalo dado o en una regin especifica, se llaman
experimentos de Poisson. El intervalo puede ser de cualquier longitud, como un minuto, un
das , una semana, un mes, o incluso un ao. Por ello un experimento de Poisson puede
generar observaciones para la variable aleatoria x que representa el nmero de llamadas
telefnicas por hora que recibe una oficina, el nmero de das que la escuela permanece
cerrada debido a la nieve durante invierno o el nmero de juegos suspendidos debido a la
lluvia durante la temporada de bisbol. La regin especfica podra ser un segmento de
lnea, un rea o quizs una pieza de material. En tales casos X puede representarse el
numero de ratas de campo por acre, el numero de bacterias en un cultivo dado o el numero
de errores mecanogrficos por pagina.

Un experimento de Poisson se deriva del proceso de Poisson y posee las siguientes


propiedades:
1. el numero de resultados que ocurren en un intervalo o regin especifica es
independiente del numero que ocurre en cualquier otro intervalo o regin del espacio
disjunto. De esta forma vemos que el proceso de Poisson no tiene memoria.
2. la probabilidad de que ocurra un solo resultado durante un intervalo muy corto o una
regin pequea es proporcional a la longitud del intervalo o al tamao de la regin y
no depende del nmero de resultados que ocurren fuera de este intervalo o regin.
3. la probabilidad de que ocurra mas de un resultado en tal intervalo corto o que caiga
en tal regin pequea insignificante.
4. El numero X de resultados que ocurren durante un experimento de Poisson se llama
variable aleatoria de Poisson y su distribucin de probabilidad se llama distribucin
de Poisson. El nmero medio de resultados en cada unidad se denota por la letra
griega lambda, .

132

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

La distribucin de probabilidad de Poisson


La distribucin de probabilidad para una variable aleatoria de Poisson esta dada por :

p ( x, ) =

e
x!

x = 0, 1, 2, ...

donde :

= Numero medio de eventos en una unidad dada de tiempo, rea o volumen.


e = 2.71828...
La media y la varianza de una variable aleatoria de Poisson son , respectivamente,

2 =

Problema: Supongamos que el numero de grietas por espcimen de concreto con cierto tipo
de mezcla de cemento tiene una distribucin de probabilidad de Poisson aproximada.
Adems, suponga que el nmero medio de grietas por espcimen es de 2.5.
a) Calcule la media y la desviacin estndar de x, el numero de grietas por espcimen
de concreto.
b) Calcule la probabilidad de que un espcimen de concreto escogido al azar tenga
exactamente cinco grietas.
c) Calcule la probabilidad de que un espcimen de concreto escogido al azar tenga dos
o mas grietas.
Solucin:
a) Tanto la media como la varianza de una variable aleatoria de Poisson son iguales a
Por tanto,

= = 2.5

2 = = 2 .5

Entonces la desviacin estndar es

= 2.5 = 1.58
b) Queremos conocer la probabilidad de que un espcimen de concreto tenga
exactamente cinco grietas. La distribucin de probabilidad de x

= 2.5

x = 5;

2.5 5 e 2.5
p(5) =
= 0.067
5!
c) Para determinar la probabilidad de que un espcimen de concreto tenga o mas
grietas necesitamos calcular

133

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

p ( x 2) = p (2 ) + p (3) + p (4 ) + ... = p ( x )
x=2

Si queremos calcular la probabilidad de este evento, es preciso considerar el evento


complementario. As,

p ( x 2 ) = 1 p ( x < 2)

= 1 [ p(0) + p(1)]
= 1 0.287 = 0.713

Problema: Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las
probabilidades de que reciba,
a) cuatro cheques sin fondo en un da dado,
b)

10 cheques sin fondos en cualquiera de dos das consecutivos?

Solucin:
a)

x = variable que nos define el nmero de cheques sin fondo que llegan al banco en un

da cualquiera = 0, 1, 2, 3, ....., etc


= 6 cheques sin fondo por da
e = 2.718
p(4, 6 ) = 0.1339
b) x = variable que nos define el nmero de cheques sin fondo que llegan al banco en dos
das consecutivos = 0, 1, 2, 3, ......, etc., etc.
= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos
P(10, 12 ) = 0.1049
Problema: En la inspeccin de hojalata producida por un proceso electroltico continuo, se
identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de
identificar
a) una imperfeccin en 3 minutos,
b) al menos dos imperfecciones en 5 minutos,
c) cuando ms una imperfeccin en 15 minutos.

134

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Solucin:
a) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 3
minutos = 0, 1, 2, 3, ...., etc., etc.
= 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata
P( 1, 0.6) = 0.3293
b) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 5
minutos = 0, 1, 2, 3, ...., etc., etc.
= 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata

p ( x = 2,3,4, etc... = 1) = 1 p ( x = 0,1, = 1) = 1- (0.367918+0.367918) = 0.26416


c) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 15
minutos = 0, 1, 2, 3, ....., etc., etc.
= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata

p( x = 0,1, = 3) = p( x = 0, = 3) + p( x = 1, = 3)
= 0.0498 + 0.1494 = 0.1992
Problema: Durante un experimento de laboratorio el nmero promedio de partculas
radiactivas que pasan a travs de un contador en un milisegundo es cuatro cul es la
probabilidad de que seis partculas entren al contador en un milisegundo dado?
t = 4; x = 6
6
(
4) e4
f ( x) =

6!

= 0.1042

Aproximacin de la binomial por la poisson


En este caso se determinarn probabilidades de experimentos Binomiales, pero que dadas
sus caractersticas, es posible aproximarlas con la distribucin de Poisson, estas
caractersticas son, n ( n es muy grande) y p 0 (p es muy pequea), por lo que:

p( x ,n , p )= n Cx p q
x

n x

x!

135

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

La expresin anterior solo se cumple cuando n y p 0, solo en este caso, si esto no


se cumple, la aproximacin no se puede llevar a efecto, por lo que la frmula a utilizar en
este caso sera:

p( x , ) =

x
x!

Donde:
= = n p = nmero esperado de xitos = tasa promedio de xitos; n = nmero de
repeticiones del experimento; p = probabilidad de xito = p(xito)
Una regla general aceptable es emplear esta aproximacin si n 20 y p 0.05: s n 100, la
aproximacin es generalmente excelente siempre y cuando n p 10.
Problema: Se sabe que el 5% de los libros encuadernados en cierto taller tienen
encuadernaciones defectuosas. Determine la probabilidad de que 2 de 100 libros
encuadernados en ese taller, tengan encuadernaciones defectuosas, usando,
a) la frmula de la distribucin Binomial,
b) la aproximacin de Poisson a la distribucin Binomial.
Solucin:
a) n = 100
p = 0.05 = p(encuadernacin defectuosa) = p(xito)
q = 0.95 = p(encuadernacin no defectuosa) = p(fracaso)
x = variable que nos define el nmero de encuadernaciones defectuosas en la muestra
= 0, 1, 2, 3,....,100 encuadernaciones defectuosas
p(x = 2, n = 100, p = 0.05 ) = 0.0812
b) n = 100 encuadernaciones
p = 0.05
= n p = (100)(0.05)= 5
x = variable que nos define el nmero de encuadernaciones defectuosas en la muestra =
= 0, 1, 2, 3,....,100 encuadernaciones defectuosas
p(2, 5) = 0.0843

136

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Al comparar los resultados de las probabilidades con una y otra distribucin, nos damos
cuenta de que la diferencia entre un clculo y otro es de tan solo 0.0031, por lo que la
aproximacin de Poisson es una buena opcin para calcular probabilidades Binomiales.
Problema: Un fabricante de maquinaria pesada tiene instalados en el campo 3840
generadores de gran tamao con garanta. S la probabilidad de que cualquiera de ellos falle
durante el ao dado es de 1/1200 determine la probabilidad de que
a) 4 generadores fallen durante el ao en cuestin,
b) que ms 1 de un generador falle durante el ao en cuestin.
Solucin:
a) n = 3840 generadores
p = 1/1200 = probabilidad de que un generador falle durante el ao de garanta
= n p = (3840)(1/1200) = 3.2 motores en promedio pueden fallar en el ao de garanta
x = variable que nos define el nmero de motores que pueden fallar en el ao de garanta =
0, 1, 2, 3,....,3840 motores que pueden fallar en el ao de garanta
dpois ( 4 , 3.2) = 0.1781

b) P ( x > 1) = 1 p ( x 1)
1 ( dpois ( 0 , 3.2) + dpois ( 1 , 3.2) ) = 0.8288

Problema: En un proceso de manufactura, en el cual se producen piezas de vidrio, ocurren


defectos o burbujas, ocasionando que la pieza sea indeseable para la venta. Se sabe que en
promedio 1 de cada 1000 piezas tiene una o ms burbujas. Cul es la probabilidad de que
en una muestra aleatoria de 8000 piezas, menos de 3 de ellas tengan burbujas?
Solucin:
n = 8000 piezas
p = 1/1000= 0.001 probabilidad de que una pieza tenga 1 o ms burbujas
= np = (8000)(1/1000) = 8 piezas en promedio con 1 o ms burbujas
x = variable que nos define el nmero de piezas que tienen 1 o ms burbujas =
= 0,1, 2, 3,....,8000 piezas con una o ms burbujas
dpois ( 0 , 8) + dpois ( 1 , 8) + dpois ( 2 , 8) = 0.0138

137

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Problema: Diez por ciento de las herramientas producidas en un proceso de fabricacin


determinado resultan defectuosas. Hallar la probabilidad de que en una muestra de 10
herramientas seleccionadas aleatoriamente, exactamente 2 estn defectuosas, empleando
la aproximacin de Poisson a la distribucin Binomial
p = 0.1; n = 10

= n p = 0.1 (10) = 1 ; x = 2
dpois ( 2 , 1) = 0.1839

Problema: Si la probabilidad de que un individuo sufra una reaccin negativa ante una
inyeccin de cierto suero es 0.001, hallar la probabilidad de que entre 2000 individuos:
(a) exactamente 3 ;
(b) mas de 2 de ellos reaccionen negativamente.
Solucin:
= N p = (2000) ( 0.001) = 2
(a) P r{3 individuos reaccionen negativamente} =
dpois ( 3 , 2) = 0.1804

(b)

P r{ms de 2 de ellos reaccionen negativamente}

= 1 P r(0 1 2 lo sufran)
1 ( dpois ( 0 , 2) + dpois ( 1 , 2) + dpois ( 2 , 2) ) = 0.3233

Problema: Diez por ciento de las herramientas producidas en un proceso de fabricacin


determinado resultan defectuosas. Hallar la probabilidad de que en una muestra de 10
herramientas seleccionadas aleatoriamente, exactamente 2 estn defectuosas, empleando
a)

La distribucin Binomial

b)

la aproximacin de Poisson a la distribucin Binomial.

Solucin.
a) x = 2; n = 10 ; p = 10 % = 0.1 ; q = 0.9
dbinom( 2 , 10, 0.1) = 0.1937

b) = n p = 10 (0.1) = 1; x = 2
dpois ( 2 , 1) = 0.1839

138

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

En general la aproximacin es buena si P 0.1

3.5 Esperanza matemtica.


Media de una variable aleatoria.
Si se lanzan 16 veces dos monedas y X es el nmero de caras que ocurre por lanzamiento,
entonces los valores de X pueden ser 0,1 y 2. Suponga que en el experimento salen cero
caras, una cara y dos caras un total de cuatro, siete y cinco veces, respectivamente. El
numero promedio de caras por lanzamiento de las dos monedas es entonces:

(0 )(4) + (1)(7 ) + (2)(5) = 1.06


16

Este es un valor promedio y no es necesariamente un posible resultado del experimento.


O bien :

(0)

4
7
5
+ (1) + (2 ) = 1.06
16
16
16

Los nmeros 4/16, 7/16, y 5/16 son las fracciones de los lanzamientos totales que tienen
como resultado cero, una y dos caras, respectivamente. Estas fracciones tambin son la
frecuencia relativa de los diferentes valores de X en nuestro experimento. En efecto,
entonces, podemos calcular la media o promedio de un conjunto de datos mediante el
conocimiento de los distintos valores que ocurren y sus frecuencias relativas, sin un
conocimiento del nmero total de observaciones en nuestro conjunto de datos.
Por tanto, si 4/16 o 1/4

de los lanzamientos tiene como resultado cero caras, 7/16 de los

lanzamientos tienen como resultado una cara y 5/16 de estos tiene dos caras, el numero
medio de caras por lanzamiento ser 1.06 sin importar si el nmero total de lanzamiento fue
16,000 o incluso 10,000.
Utilicemos frecuencias relativas para calcular el nmero promedio de caras por lanzamiento
que podramos esperar en el largo plazo. Nos referimos a este valor promedio como la
media de la variable x o la media de la distribucin de probabilidad de X y la denotamos

139

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

por

x o simplemente como

cuando este claro a que variable nos referimos. Tambin es

comn entre los estadsticos referirse a esta media como la esperanza matemtica o el valor
esperado de la variable aleatoria X y denotarla como E(X).
Supongamos que se lanza monedas legales, encontramos un espacio muestral para nuestro
experimento es

S = {HH , HT , TH , TT }.
Como los 4 puntos mustrales son iguales probables, se sigue que

1 1 1
P ( X = 0 ) = P (TT ) = =
2 2 4

P ( X = 1) = P (HT ) + P (TH ) =
P ( X = 2 ) = P (TT ) =

1 1 1
+ =
4 4 2
1
4

Este resultado significa que una persona que lance dos monedas una y otra vez, en
promedio, obtendr una cara por lanzamiento.

Definicin
Sea X una variable aleatoria con distribucin de probabilidad f(x). La media o valor
esperado de X es

= E ( X ) = xf ( x) ; si X es discreta,
x

Problema: Un inspector de calidad muestrea un lote que contiene siete componentes; el lote
contiene cuatro componentes buenos y tres defectuosos. El inspector toma una muestra de
tres componentes. Encuentre el valor esperado del nmero de componentes buenos en esta
muestra.
Solucin: sea X el nmero de componentes buenos en la muestra. La distribucin de
probabilidad de x es

F ( x) =

( )( )
()
4
x

3
3 x
7
3

x = 0, 1, 2, 3

Unos simples clculos dan


f(0) = 1/35 = 0.028571428,

140

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

f(1) = 12/35= 0.342857142;


f(2) = 18/35= 0.514285714;
f(3) = 4/35= 0.114285714. Por tanto.

1
12
18
4 12
+ (1) + (2) + (3) = = 1.71
35
35
35
35 7

= E( X ) = (0)

De esta forma si se selecciona al azar una muestra de tamao tres una y otra vez de un
lote de cuatro componentes buenos y tres defectuosos, contendra, en promedio 1.7
componentes buenos.
Problema: En un juego de azar se pagaran $5 a una persona si solo salen caras(H) o
cruces (T) cuando se lanzan tres monedas, y ella pagara $ 3 si salen una o dos caras.
cual es su ganancia esperada?
Solucin: el espacio muestral para los posibles resultados cuando se lanzan de manera
simultnea tres monedas, o de manera equivalente si se lanzan tres veces una moneda, es
S = {HHH , HHT , HTH , THH , HTT , THT , TTH , TTT

Se podra argumentar que cada una de estas posibilidades es igualmente probable y que
ocurre con la probabilidad de 1/8. un mtodo alternativo seria aplicar la regla de la
multiplicacin de probabilidad para eventos independientes a cada elemento de S. Por
ejemplo,
P ( HHT) = P(H) P(H) P(T) = (1/2)(1/2)(1/2) = 1/8
La variable aleatoria de inters es Y, el monto que el jugador puede ganar; y los valores
posibles de Y son $5 si ocurre el evento

E1 = {HHH , TTT }
Y - $ 3 si ocurre el evento

E 2 = {HHT , HTH , THH , HTT , THT , TTH }

141

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Evento. Como E1 y E2 ocurren con probabilidades y , respectivamente, se sigue que

3
4

1
4

= E (Y ) = (5) + ( 3) = 1

En este juego la persona perder, en promedio, $1 por lanzamiento de las tres monedas. Un
juego se considera equitativo si el jugador, en promedio, queda empatado. Por tanto, una
ganancia esperada de cero define un juego equitativo.
Consideremos una nueva variable aleatoria g(X), que depende de X; es decir, cada valor de
g(X) esta determinado al conocer los valores de X. Por ejemplo, g(X) podra ser X2 o 3X 1 ,
de modo que siempre que x tome el valor 2, g(X) toma el valor g(2). En particular, si X es
una variable aleatoria discreta con distribucin de probabilidad

f (x ),

x = 1,0,1,2 y g ( X ) = X 2 entonces

P[g ( X ) = 0] = P( X = 0 ) = f (0 )

P[g ( X ) = 1] = P( X = 1) + P( X = 1)
= f ( 1) + f (1),
P [ g ( X ) = 4 ] = P ( X = 2 ) = f ( 2)

De modo que la distribucin de probabilidad de g(X) se puede escribir como

g (x )

P[g ( X ) = g ( x)]

f ( 0)

f ( 1) + f (1)

f ( 2)

Por definicin del valor esperado de una variable aleatoria, obtenemos

g ( X ) = E [g ( x ) ]

= 0 f (0 ) + 1[ f ( 1) + f (1)] + 4 f (2 )

= ( 1) f ( 1) + (0 ) f (0 ) + (1) f (1) + (2 ) f (2 )
2

= g ( x) f ( x)
x

142

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

este resultado se generaliza en el siguiente teorema para variables discretas y continuas.


Teorema
Sea x una variable aleatoria con distribucin de probabilidad f(x). La media o valor esperado
de la variable aleatoria g(X) es

g ( X ) = E[g ( X )] = g ( x) f ( x);

si X es discreta

Problema: Suponga que el numero de autos x que pasa por un lavado de autos entre 4:00
pm y 5:00 pm en cualquier viernes soleado tienen la siguiente distribucin de probabilidad :

P(X = x)

1 / 12

1 / 12

1/4

1/4

1/6

1/6

Sea g(x) = 2X 1 la cantidad de dinero en dlares, que el administrador paga al


dependiente. Encuentre las ganancias esperadas de dependiente en este periodo particular.
Solucin:

E[g( X)] = E(2X 1)


9

= (2x 1) f ( X)
x=4

1 1
1
1
1
1
= (7) +(9) +(11) +(13) +(15) +(17) =$12.67
12
4
4
6
12




6
Debemos extender ahora nuestro concepto de esperanza matemtica al caso de dos
variables aleatorias X y Y con distribucin de probabilidad conjunta f ( x, y ) .

Definicin
Sean X y Y variables aleatorias con distribucin de probabilidad conjunta f(x , y ). La media
o valor esperado de la variable aleatoria g(X, Y ) es

g ( X ,Y ) = E [g ( X , Y )] = g ( x, y ) f ( x, y ) ;
x

si X y Y son discretas

143

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Problema: Sean X y Y variables aleatorias con distribucin de probabilidad conjunta que se


indica en la tabla siguiente:
X

f ( x, y )

Totales por

rengln

3/28

9/28

3/28

15/28

3/14

3/14

1/28

Totales por

3/7
1/28

5/14

15/28

3/28

columna

Encuentre el valor esperado de g ( X, Y ) = XY


Solucin:
2

E ( XY ) = xyf ( x, y )
x =0 y =0

E ( XY ) = (0)(0 ) f (0,0) + (0 )(1) f (0,1) + (0 )(2 ) f (0,2) + (1)(0) f (1,0) + (1)(1) f (1,1) + (2)(0) f (2,0)
3
E ( XY ) = f (1,1) =
14

Definicin
Sea X una variable aleatoria con distribucin de probabilidad f(x). La media o valor
esperado de X es

= E ( X ) = xf ( x)dx ;

si X es continua

Un ingeniero se interesa en la vida media de cierto tipo de dispositivo electrnico. Esta es


una ilustracin de problema de tiempo de falla que a menudo se presenta en la prctica. El
valor esperado de la vida del dispositivo es un parmetro importante para su evaluacin.
Problema: Sea X la variable que denota la vida en horas de cierto dispositivo electrnico. La
funcin de densidad de probabilidad es:

144

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

20,000
x3

f ( x) =
0

x > 100
en cualquier otro caso

Encuentre la vida esperada de este tipo de dispositivo.


Solucin:

20000
20000
dx = 100 2 dx = 200
3
x
x

= E( X ) = x
100

Teorema
Sea x una variable aleatoria con distribucin de probabilidad f(x). La media o valor esperado
de la variable aleatoria g(X) es

g ( X ) = E[g ( X )] = g ( x) f ( x)dx ;

si X es continua

Problema: Sea X una variable aleatoria con funcin de densidad

x2 1 < x < 2
,
f ( x) = 3
0
en cualquier otro caso

Encuentre el valor esperado de g(X) = 4X + 3 .


Solucin:

E (4 X + 3 ) =

(4 x + 3 )x 2 dx = 1
3

(4 x
3
2

+ 3 x 2 dx = 8

Debemos extender ahora nuestro concepto de esperanza matemtica al caso de dos


variables aleatorias X y Y con distribucin de probabilidad conjunta f ( x, y ) .
Definicin
Sean X y Y variables aleatorias con distribucin de probabilidad conjunta f(x,y). La media o
valor esperado de la variable aleatoria g(X, Y ) es

g ( X ,Y ) = E[g( X , Y )] =

g( x, y) f ( x, y)dxdy

; si X y Y son continuas.

145

UNIDA
AD III / FUN
NCIONES Y DISTRIBUCIONE
ES MUEST
TRALES.

Y
para la funcin dee densidad
X

Problema: Encuentre E

x 1 + 3y 2

f ( x, y ) =
4
0

0 < x < 2,

0 < y <1

en cualquier otro
o caso

Solucin:
Tenemos
2
3
1 y+ y
5
Y 1 2 y x(1 + 3 y )
dy =
E =
dxdy =
0
0
0
4
2
8
X
x

3.6 Distribucin no
ormal.

stribucin de la prob
babilidad contina.
3.6.1 Dis
La distribuccin continua
a de probab
bilidad ms im
mportante en
n todo el campo de la estadstica
e
es la distriibucin norm
mal. Su gra
afica, que se denomina curva
c
normal, es la curva en forma
de campan
na, la cual de
escribe much
hos fenmen
nos que ocurrren en la natturaleza, la industria y
la investiga
acin.

Adems , los erroress en las me


ediciones cie
entficas se aproximan e
extremadamente bien
u distribucin normal. La
L distribuci
n normal a menudo se d
denomina distribucin
mediante una
gaussiana, en honor de Karl Frie
edrich Gausss (1777 1855), quie
en tambin derivo
d
su
e
en mediciones
m
re
epetidas de la
a misma can
ntidad.
ecuacin a partir de un estudio de errores
ables tienen una distribuccin normal y la funcin de densidad
d recibe el
Se dice que estas varia
nombre de
e curva norm
mal o campa
ana de Gausss. Para exp
presar que u
una variable aleatoria

146

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

continua X, tiene una distribucin normal de media y desviacin tpica , escribimos

N ( , ) .
Distribucin normal
La funcin de densidad de la variable aleatoria normal X, con media

n( x; , ) =

1
( 1 )[( x ) / ]2
e 2
2

y varianza 2 , es

< x <

donde

= 3.14159...

e = 2.71828...

Existen unas tablas que permiten calcular probabilidades en distribuciones normales


reducidas. Por ello es aconsejable transformar cualquier variable aleatoria X que sigue que
sigue una distribucin N ( , ) en otra variable Z que siga una distribucin N(0,1).
El cambio de variable que es necesario hacer es el siguiente:

Z=

Caractersticas:
a)

Es generada por una variable de tipo continuo, denominada x;

-< x <

b) La funcin que nos define esta distribucin es:

f ( x , , 2 ) =

2
2
1
( x ) / 2
2

-< x <

Al dar a la funcin los valores de , 2 y valores a x, obtendremos la

distribucin en

cuestin, la que tiene forma de campana, por lo que tambin se le conoce como
campana de Gauss. Hay un nmero infinito de funciones de densidad Normal, una
para cada combinacin de y . La media mide la ubicacin de la distribucin y la
desviacin estndar mide su dispersin.
c) Es simtrica con respecto a su eje vertical.
d) Es asinttica con respecto a su eje horizontal; esto quiere decir que jams va a tocar
el eje de las equis.
e) El rea total bajo la curva es 1.
f)

S sumamos a

, se observar que aproximadamente el 68.26% de los

datos se encuentran bajo la curva, si sumamos a 2, el 95.44% de los datos


estar entre esos lmites y si sumamos a 3, entonces el 99.74% de los datos
caer dentro de esos lmites. Esta caracterstica es a la vez una forma emprica y

147

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

rpida de demostrar si los datos que se analizan tienen una distribucin Normal; ya
que para trabajar los datos con esta distribucin, debe verificarse que efectivamente
as se distribuyen, ya que de no hacerlo, las decisiones que en un momento dado se
tomarn de un anlisis de los datos con la distribucin Normal, seran errneas.

Definicin
La distribucin de una variable aleatoria normal con media cero y varianza 1 se llama
distribucin normal estndar.

Problema: Encuentre la probabilidad para cada ejercicio,


a) p ( Z 1,23)
La probabilidad pedida se encuentra directamente en las tablas . Basta buscar 1,2 en la
columna y 0,03 en la fila. Su interseccin nos da la probabilidad.

P ( z 1.23) = 0.8907
Para calcularlo a travs de la frmula original se le suma 0.5 que es de la parte de la regin
negativa mas lo que se va a calcular.

1.23

1
2
du = 0.8907
0.5 +

e
2 0

b) p ( Z 1, 24 )

148

UNIDA
AD III / FUN
NCIONES Y DISTRIBUCIONE
ES MUEST
TRALES.

P(Z
Z 1.24) = 1 P(Z < 1.224) = 1 0.8925
8
= 0.10075
Dos formass de calcularr:
1) usando el
e teorema P + q = 1

1.244

1
2
1 0.5 +

e
d u = 0.1075
2 0

2) Restand
do 0.5 que ess la parte com
mpleta de la regin somb
breada de la seccin possitiva

1.24

1
2
0.5

e
d u = 0.1075
0
2 0

c) P ( z - 0.72 )

P( z 0.72) = 0.23558
0

1
2
0.5

e
d u = 0 .2358
2
2 0.72

d)

p (0,5 Z 1,76)

do la figura se
e deduce que
Observand

149

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

p(0.5 z 1.76) = p ( z 1.76) p( z 0.5)


= 0.9608 0.6915 = 0.2693

1.76
u

0.5

1
2
du
du = 0.2693

e
2 0

Problema: El peso de los individuos de una poblacin se distribuye normalmente con media
de 70 Kg. y desviacin tpica 6 Kg. De una poblacin de 2000 personas, calcula cuntas
tendrn un peso comprendido entre 64 y 76 Kg.
Solucin:
Se trata de una distribucin N (70,6)

Z=
Z=

64 70
= 1
6

Z = -1

= 70 Kg. , = 6 Kg. ;

Z=

X = 64 y 76 Kg.

76 70
=1
6

Z= 1

p (64 X 769 = p ( 1 z 1)
= p (z 1) p ( z 1)
Por tanto,
p(64 X 76 ) = 0.8413 0.1587 = 0.6826
Esto significa que el 68,25 % de las personas pesan entre 64 y 76 Kg.
Como hay 2000 personas, calculamos el 68,25% de 2000 y obtenemos 1365 personas.
Problema: El acero que se utiliza para tuberas de agua a menudo se recubre internamente
con un mortero de cemento para evitar la corrosin. En un estudio de los recubrimientos de
mortero de una tubera empleada en un proyecto de transmisin de agua en California
(Transportation Engineering Journal, Noviembre de 1979) se especific un espesor de 7/16
pulgadas para el mortero. Un gran nmero de mediciones de espesor dieron una media de
0.635 pulgadas y

una desviacin estndar de 0.082 pulgadas. S las mediciones de

espesor, tenan una distribucin Normal, qu porcentaje aproximado fue inferior a 7/16 de
pulgada?

150

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Solucin:
x = variable que nos define el espesor del mortero en pulgadas; = 0.635 pulgadas; =
0.082 pulgadas

Z =

7 / 16 0 . 635
0 . 4375 0 . 635
=
= 2 . 4085 2 . 41
0 . 082
0 . 082

P ( Z 2.41) = 0.0080
Por tanto, 0.008 x 100% = 0.8% de los recubrimientos de mortero tienen un espesor menor
de 7/16 pulgadas
Problema: Un tubo fluorescente estndar tiene una duracin distribuida Normalmente, con
una media de 7,000 horas y una desviacin estndar de 1,000 horas. Un competidor ha
inventado un sistema de iluminacin fluorescente compacto que se puede insertar en los
receptculos de lmparas incandescentes. El competidor asegura que el nuevo tubo
compacto tiene una duracin distribuida Normalmente con una media de 7,500 horas y una
desviacin estndar de 1,200 horas.
a)

Cul tubo fluorescente tiene mayor probabilidad de tener una duracin mayor de
9,000 horas?

b) Cul tubo tiene mayor probabilidad de tener una duracin de menos de 5,000
horas?
Solucin:
a) Tubo 1
X1 = variable que nos define la duracin en horas de un tubo fluorescente
= 7,000 horas; = 1,000 horas
Tubo 2
X2 = variable que nos define la duracin del tubo fluorescente del competidor
= 7,500 horas; = 1,200 horas

z1 =

9 ,000 7 ,000
= 2.00
1,000

p(x1 > 9,000 horas) = p (z1 > 2.00 )


= 1 0.9772 = 0.0228

151

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

z2 =

9 ,000 7 ,500
= 1.25
1,200

p(x2 > 9,000 horas) = p(z2 > 1.25) = 1 0.8944 = 0.1056


Por tanto el tubo fluorescente del competidor tiene una probabilidad mayor de durar ms de
9,000 horas.
b)

z1 =

5 ,000 7 ,000
= 2.00
1,000

p(x1 < 5,000 horas) = p(z1 < -2.00) = 0.0228

z2 =

5 ,000 7 ,500
= 2.08
1,200

p(x2 < 5,000 horas) = p(z2 < - 2.08) = 0 0.0188


Por tanto, el tubo fluorescente que tiene una mayor probabilidad de durar menos de 5,000
horas es el del primer fabricante.
Problema: La distribucin de la demanda (en nmero de unidades por unidad de tiempo) de
un producto a menudo puede aproximarse con una distribucin de probabilidad Normal. Por
ejemplo, una compaa de comunicacin por cable ha determinado que el nmero de
interruptores terminales de botn solicitados diariamente tiene una distribucin Normal, con
una media de 200 y una desviacin estndar de 50.
a)En qu porcentaje de los das la demanda ser de menos de 90 interruptores?
b)En qu porcentaje de los das la demanda estar entre 225 y 275 interruptores?
c) Con base en consideraciones de costos, la compaa ha determinado que su mejor
estrategia consiste en producir una cantidad de interruptores suficiente para atender
plenamente la demanda en 94% de todos los das. Cuntos interruptores terminales
deber producir la compaa cada da?
Solucin:
a) X = variable que nos indica el nmero de interruptores demandados por da a una
compaa de cable
= 200 interruptores por da; = 50 interruptores por da

152

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

z=

90 200
= 2.20
50

p(z = - 2.20) = 0.4861

p(x < 90) = p(z < -2.20) = 0.0139


Por tanto, 0.0139 x 100% = 1.39% de los das se tendr una demanda

menor de 90

interruptores.

b)

z1 =

225 200
= 0.50
50

z2 =

275 200
= 1.50
50

p(225 x 275) = p(z2) p(z1) = 0.4332 0.1915 = 0.2417


Por tanto, 0.2417 x 100% = 24.17% de los das se tendr una demanda entre 225 y 275
interruptores.
c)

En este caso se trata de determinar que valor toma x cuando se pretende cumplir con

el 94% de la demanda de todos los das.


Por tanto despejaremos de la frmula de z;

Z=

x = + z

x = + z(p = 0.44) = 200 + z(p = 0.44)(50) =

= 200 + (1.55)(50) = 277.5 278 interruptores terminales por da


Cmo se obtiene el valor de z?
En la tabla buscamos la z que corresponde a una probabilidad de 0.44 y nos damos cuenta
de que no existe un valor exacto de 0.44 por lo que tomamos los valores de rea ms
cercanos; luego,
z(p = 0.4394) = 1.50;

z(p = 0.4406) = 1.60

Por tanto si interpolamos, encontramos que el valor de z para una probabilidad de 0.44 es
de 1.55, y es el valor que se sustituye en la ecuacin.

153

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Cul es la razn de usar un rea de 0.44 en lugar de una de 0.94 para buscar en la tabla el
valor de z?
Es muy simple, la tabla que estamos usando es una tabla que solo trabaja con reas que
son definidas de la media hasta el valor de x y x puede estar tanto del lado derecho de la
media, como del lado izquierdo de la media, es por esto que el rea a utilizar es de 0.44 que
se encuentra al lado derecho de la media.
Problema: La nota media de las pruebas de acceso correspondientes a los estudiantes que
queran ingresar en una facultad era 5,8 y la desviacin tpica 1,75. Fueron admitidos los de
nota superior a 6.
a)

Cul fue el porcentaje de admitidos si la distribucin es normal?

b)

Con qu probabilidad exactamente cuatro de diez estudiantes son admitidos por

distribucin binomial?
Solucin:
a) = 5.8 ; = 1.75 ; x = 6
Z = ( 6 5.8 ) / 1.75 = 0.11
P ( X > 6 ) = p ( Z > 0.11 ) = 1 P ( Z < 0.11 ) = 1 0.5438 = 0.4562 = 45.62 %
b) Es una distribucin Binomial de parmetros n = 10 y p = 0,4562
p(obtener r xitos ) = p (X = r) =

n
r

= p .(1 p)

nr

10
(0,4562) 4 (1 0,4562) 6 =
4

= p ( X = 4) =

10.9.8.7
(0,4562 ) 4 (0,5438) 6 = 0,235
4 .3 .2 .1

Problema: Dada una distribucin normal con = 50 y = 10, encuentre la probabilidad de


que x tome un valor en 45 y y 62.
Z 1 = ( 45 50 ) / 10 = - 0.5

Z 2 = ( 62 50 ) / 10 = 1.2

154

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

p ( 45 < X < 62 ) = p ( -0.5 < Z < 1.2 ) = P ( Z < 1.2 ) P ( Z < - 0.5 )
= 0.8849 0.3085 = 0.5764
Problema: Dada una distribucin normal con = 300 y = 50, encuentre la probabilidad de
que X tome un valor mayor que 362.
Z = ( 362 300 ) / 50 = 1.24
P ( X > 362 ) = P ( Z > 1.24 ) = 1 p ( Z < 1.24 ) = 1 0.8925 = 0.1075
Problema: Una empresa elctrica fabrica focos que tienen una duracin , antes de fundirse,
que se distribuye normalmente con media igual a 800 horas y una desviacin estndar de 40
horas. Encuentre la probabilidad de que un foco se funda entre 778 y 834 horas.
Solucin:
Z 1 = ( 778 800 ) / 40 = - 0.55 ;

Z 2 = ( 834 800 ) / 40 = 0.85

P (778 < X < 834 ) = p ( - 0.55 < Z < 0.85 ) = P ( Z < 0.85 ) P ( -0.55)
= 0.8023 0.2912 = 0.5111
Problema: En un proceso industrial el dimetro de un cojinete es una parte importante del
componente. El comprador establece que las especificaciones en el dimetro sean 3.0
0.01 cm. La implicacin es que ninguna parte que caiga fuera de estas especificaciones se
aceptar. Se sabe que en el proceso el dimetro de un cojinete tiene una distribucin normal
con media 3.0 y una desviacin estndar de 0.005. En promedio, cuntos cojinetes se
descartaran?
Solucin:
X 1 = 3.0 0.01 cm = 2.99 cm;

X 2 = 3.0 + 0.01 cm = 3.01

= 3.0 ; = 0.005

155

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Z 1 = ( 2.99 3.0 ) / 0.005 = - 2.0


Z 2 = ( 3.01 3.0 ) / 0.005 = 2.0
P ( 2.99 < x < 3.01 ) = P (-2.0 < Z < 2.0 ) = p ( Z < 2.0 ) P ( Z < - 2.0 )
= 0.9772 0.0228 = 0.9544
Ejemplo: Cierta maquina fabrica resistores elctricos que tienen una resistencia media de 40
ohmios y una desviacin estndar de 2 ohmios. Suponga que la resistencia sigue una
distribucin normal y se puede medir con cualquier grado de precisin, qu porcentaje de
resistores tendrn una resistencia que exceda 43 ohmios?
Solucin:
X = 43 ; = 40; = 2
Z = (43 40 ) / 2 = 1.5
P ( X > 43 ) = P ( Z > 1.5 ) = 1 P( Z < 1.5 ) = 1 0.9332 = 0.0668 = 6.68 %

3.7 Aproximacin de la Binomial a la normal.


Cuando n es grande y p est prximo a 0,5 el comportamiento de una distribucin binomial
B(n, p) es aproximadamente igual a una distribucin normal,

N (np, npq )
Esto permite sustituir el estudio de una B ( n , p ) por el de una

N (np, npq ) .

Suele considerarse que la aproximacin es buena cuando n p>5 y n q>5


Dado que por mucho que se parezca nunca es igual una binomial que una normal, es
necesario aplicar en el clculo de probabilidades un ajuste que recibe el nombre de
correccin de Yates.
Si X es la binomial y X la normal, la correccin consiste en lo siguiente:

1
1

p( X = r ) = p r X r +
2
2

(Se asocia un intervalo unidad centrado en el punto)

156

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

1
1

p(a X b) = p a X b +
2
2

(se alarga el intervalo por la izquierda y por la derecha.)


Para valores de n mayores de 1.000 se puede suprimir la correccin.
Problema: Se lanza una moneda correcta al aire 400 veces. Calcula la probabilidad de
obtener un nmero de caras comprendido entre 180 y 210, ambos inclusive.
Solucin:
Calculamos la media y la desviacin tpica de la distribucin binomial:

1
2

= np = 400. = 200 ;

1 1
2 2

= npq = 400. . = 10 . Por tanto,

p (180 X 210) = p (179.5 x 210.5)


210.5 200
179.5 200
p
z

10
10

= p(2,05 Z 1,05) = p(Z 1,05) p(Z 2,05)


pero

p ( Z 1,05 ) = 0,8531

p ( z 2.05) = p ( z 2.05) = 1 p ( z 2.05) = 1 0.9798 = 0.0202


luego p (180 X 210 ) = 0,8531 0,0202 = 0,8329

Problema: Un tirador acierta en el blanco en el 70% de los tiros. Si el tirador participa en una
competicin y tira 25 veces, cul es la probabilidad de que acierte ms de 10 tiros?
Solucin:
Es una distribucin B(25; 0,7) que podemos aproximar a travs de la normal:

= n. p = 25.0,7 = 17,5 > 5


n.q = 25.0,3 = 7,5 > 5
La aproximacin ser buena.

= npq = 25.0,7.0,3 = 2,29

157

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

p ( x > 10) = p ( x 11) = p ( x 10.5)


10.5 17.5

p z
= p ( z 3.06) = 1 p ( z 3.06) = 1 0.0010 = 0.999
2.29

= p(Z 3,06) = 0,9998


Problema: Hallar la probabilidad de obtener entre 3 y 6 caras inclusive en 10 lanzamientos
de una moneda honrada utilizando
(a)

La distribucin binomial,

(b)

la aproximacin normal a la distribucin binomial.

Solucin
a)

sea X la variable aleatoria que da el numero de caras en 10 lanzamientos. Entonces :

P ( X = 3 ) = (10C 3) (1/2) 3 (1/2) 7 = 15 /128 = 0.1172


P ( X = 4 ) = (10C4 ) (1/2) 4 (1/2) 6 = 105/512 = 0.2051
P ( X = 5 ) = (10C 5) (1/2) 5 (1/2) 5 = 63/256 = 0.2461
P ( X = 6 ) = (10C 6) (1/2) 6 (1/2) 4 = 105/512 = 0.2051
Entonces la probabilidad pedida es
P ( 3 x 6 ) = 15/128 + 105/512 + 63/256 + 105/512
= 99/128 = 0.7734

numero de caras
0,3
0,25
0,2
0,15
0,1
0,05
0
0

10

15

Figura 1:

158

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

numerodecaras
0,3
0,25
0,2
0,15
0,1
0,05
0
0

10

12

Figura 2:
b) La distribucin de probabilidad para el numero de caras en 10 lanzamientos de la
moneda se presentan grficamente en las figuras 1 y 2 . en la figura 2 trata los datos como si
fueran continuos. La probabilidad pedida es la suma de las reas de los rectngulos
sombreados en la figura 2 y puede aproximarse por el rea bajo la correspondiente curva
normal, mostrada a trazos. Considerando los datos como continuos, se deduce que 3 a 6
caras pueden considerarse como 2.5 a 6.5 caras. Tambin la media y la varianza para la
distribucin Binomial estn dadas por:

= np = 10(0.5) = 5
= npq = 10(0.5)(0.5) = 1.58
z1 =

2.5 5
= 1.58
1.58

z1 =

6.5 5
= 0.95
1.58

p (1.58 < z < 0.95) = p ( z < 0.95) p ( z < 1.58)


= 0.8289 0.0571 = 0.7718
Se compara muy bien con el valor verdadero de 0.7734 obtenido en el inciso a) . La
precisin es aun mejor para valores superiores de n.

159

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Problema: La probabilidad de que un paciente se recupere de una rara enfermedad de la


sangre es 0.4. si se sabe que 100 personas contraen esta enfermedad, cual es la
probabilidad de que menos de 30 sobrevivan ?
Solucin:

= np = 100(0.4) = 40
= npq = 100(0.4)(0.4) = 4.899
29.5 40
= 2.14
4.899
p ( x < 30) = p ( z < 2.14) = 0.0162

z1 =

Problema: Una prueba de opcin mltiple tiene 200 preguntas cada una con cuatro
respuestas posibles de las que solo una es la correcta. Cual es la probabilidad De que con
puras conjeturas se obtengan de 25 a 30 respuestas correctas para 80 de los 200 problemas
acerca de los que el estudiante no tiene conocimiento?
Solucin : La probabilidad de un respuesta correcta para cada una de las 80 preguntas es p
= . Si X representa el nmero de respuesta correcta debidas a conjeturas entonces:

p (25 x 30) =

x = 30

b x,80, 4

x = 25

= np = 80 = 20
4
1 3

= 180 = 3.873
4 4
necesitamos el rea entre X 1 = 24.5 y X 2 = 30.5. Los valores Z correspondientes son
Z1 = (24.5 20 ) / 3.875 = 1.16

Z 2 = (30.5 20 ) / 3.873 = 2.71

160

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

La probabilidad de adivinar correctamente de 25 a 30 preguntas est dada por la regin


sombreada de la figura.
P ( 25 X 30 ) =p ( 1.16 < Z < 2.71 ) = p ( X < 2.71) P ( X < 1.16)
= 0.9966 0.8770 = 0.1196

3.8 Otras distribuciones mustrales.

3.8.1 Distribucin T - Student.

Propiedades de las distribuciones t


1. Cada curva t tiene forma de campana con centro en cero.
2. Cada curva t esta mas dispersa que la curva normal estndar z.
3. A medida que v aumenta, la dispersin de la curva t correspondiente disminuye.

Sean X 1 , X 2 ,..., X n variables aleatorias independientes que son todas normales con
desviacin estndar. Entonces la variable aleatoria t =

x
tiene una distribucin t con v =
s
n

n 1 grados de libertad.
Problema: El valor t con v = 14 grados de libertad que deja un rea de 0.025 a la izquierda y
por tanto un rea de 0.975 a la derecha es

t0.975 = t0.025 = 2.145

161

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Problema: Encuentre la probabilidad de t0.025 < t < t0.05


Solucin:
Como t0.05 deja un rea de 0.05 a la derecha y t0.025 deja un rea de 0.025 a la izquierda
encontramos un rea total de 1- 0.05 0.025 = 0.925

P (t0.025 < t < t0.05 ) = 0.925


Problema: Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto
proceso en lo lotes es 500 gramos por milmetro de materia prima. Para verificar esta
afirmacin toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre

t0.05 y t0.05 , queda satisfecho con su afirmacin. Qu conclusin extraera de una muestra
que tiene una media de 518 gramos por milmetro y una desviacin estndar de 40 gramos?
Suponga que la distribucin de rendimiento es aproximadamente normal.
Solucin:

t=

518 500
= 2.25
40
25

Este es un valor por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor
de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02. De aqu es probable que el fabricante concluya que el proceso
produce un mejor producto del que piensa.

3.8.2 Distribucin X cuadrada.


Propiedades de las distribuciones ji cuadrada.
1. Los valores de son mayores o iguales que cero.
2. La forma de una distribucin depende del gl = n l . En consecuencia , hay un
nmero infinito de distribuciones de .
3. El rea bajo una curva ji cuadrada y sobre el eje horizontal es 1.
Problema: Los siguientes son los pesos en decagramos de 10 paquetes de semillas de
pasto distribuida por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1,45.9,45.8, 46.9, 45.2, 46.

162

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Encuentre un intervalo de confianza de 95 % para la varianza de todos los paquetes de


semillas de pasto que distribuye esta compaa suponga una poblacin normal.
Solucin:

s=

(x x )
i

n 1

= 0.5347

Al elevar este resultado al cuadrado se obtiene la varianza de la muestra


Varianza = 0.286

Para obtener un intervalo de confianza de 95% se elige un

= 0.05

con 9 grados de

libertad se obtiene los valores de .

Se puede observar en la grfica anterior que el valor . Corre en forma normal, esto es de
izquierda a derecha.

163

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

Se observa que la varianza corre en sentido contrario, pero esto es solo en la grafica. Con un
nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los
paquetes de semillas de pasto est entre 0.135 y 0.935 decagramos al cuadrado.

Problemas propuestos
P1. En una cierta rea de la ciudad se da como una razn del 75% de los robos la necesidad
de dinero para comprar estupefacientes. Encuentre la probabilidad que dentro de los 5
prximos asaltos reportados en esa rea
a) exactamente 2 se debieran a la necesidad de dinero para comprar drogas;
b) cuando mucho 3 se debieran a la misma razn arriba indicada.
P2. Un agricultor que siembra fruta afirma que 2/3 de su cosecha de duraznos han sido
contaminada por la mosca del mediterrneo.

Encuentre la probabilidad de que al

inspeccionar 4 duraznos
a)

los 4 estn contaminados por la mosca del mediterrneo

b)

cualquier cantidad entre 1 y 3 est contaminada.

P3. De acuerdo con una investigacin llevada a cabo por la Administrative Management
Society, 1/3 de las compaas en Estados Unidos le dan a sus empleados cuatro semanas
de vacaciones despus de 15 aos de servicio. Encuentre la probabilidad de que 6 de las
compaas investigadas al azar, el nmero que les dan a sus empleados cuatro semanas de
vacaciones despus de 15 aos de servicio es
a) cualquier cantidad entre 2 y 5;
b) menos de 3.

164

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

P4. De acuerdo con un estudio publicado por un grupo de socilogos de la Universidad de


Massachussets, aproximadamente 60% de los adictos al Valium en el estado de
Massachussets, lo tomaron por primera vez debido a problemas psicolgicos. Encuentre la
probabilidad de que los siguientes 8 adictos entrevistados
a)

exactamente 3 hayan comenzado a usarlo debido a problemas psicolgicos.

b)

al menos 5 de ellos comenzaran a tomarlo por problemas que no fueron


psicolgicos.

P5. Al probar una cierta clase de neumtico para camin en un terreno escabroso se
encontr que 25% de los camiones terminaban la prueba con los neumticos daados. De
los siguientes 15 camiones probados encuentre la probabilidad de que
a)

De 3 a 6 tengan ponchaduras;

b)

Menos de 4 tengan ponchaduras;

c)

Mas de 5 tengan ponchaduras

P6. De acuerdo con un reporte publicado en la revista Parade, septiembre 14 de 1980, una
investigacin a nivel nacional llevada a cabo por la Universidad de Michigan revel que casi
el 70% de los estudiantes del ltimo ao desaprueban las medidas para controlar el hbito
de fumar mariguana todos los das. Si 12 de estos estudiantes se seleccionan al azar y se
les pregunta su opinin, encuentre la probabilidad de que el nmero que desaprueba dicha
medida sea
a.

cualquier cantidad entre 7 y 9

b.

cuando mucho 5;

c.

no menos de 8

P7. La probabilidad de que un paciente se recupere de una delicada operacin de corazn


es de 0.9. Cul es la probabilidad de que exactamente 5 de los prximos 7 pacientes que
se sometan a esta intervencin sobrevivan?
P8. Un ingeniero de control de trfico reporta que el 75% de los vehculos que pasan por un
punto de verificacin tienen matrculas del estado. Cul es la probabilidad de que ms de 7
de los siguientes 9 vehculos no sean del estado?
P9. Una investigacin de los residentes de una ciudad de Estados Unidos mostr que 20%
preferan un telfono blanco que de cualquier otro color disponible. Cul es la probabilidad

165

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

de que ms de la mitad de los siguientes 20 telfonos que se instalen en esta ciudad sean
de color blanco?

P10. Se sabe que el 40% de los ratones inyectados con un suero quedan protegidos contra
una cierta enfermedad. Si 5 ratones son inyectados, encuentre la probabilidad de que
a.

Ninguno contraiga la enfermedad;

b.

Menos de 2 la contraigan;

c.

Ms de 3 la contraigan

P11. Suponga que los motores de un aeroplano operan en forma independiente y de que
fallan con una probabilidad de 0.4. Suponiendo que uno de estos artefactos realiza un vuelo
seguro en tanto se mantenga funcionando cuando menos la mitad de sus

motores,

determine qu aeroplano, uno de los 4 motores o uno de 2, tiene mayor probabilidad de


terminar su vuelo exitosamente.
P12. Las probabilidades son de 0.4, 0.2, 0.3 y 0.1, respectivamente, de que un delegado
llegue por aire a cierta convencin, llegue en autobs, 3en automvil o en tren. Cul es la
probabilidad de que entre 9 delegados seleccionados aleatoriamente en esta convencin, 3
hayan llegado por aire, 3 en autobs, 1 en automvil y 2 en tren.
P13. El dueo de una casa planta 6 tallos que selecciona al azar de una caja que contiene 5
tallos de tulipn y 4 de narciso. Cul es la probabilidad de que plante 2 tallos de narciso y 4
de tulipn?
P14. Un comit de tres integrantes se forma aleatoriamente seleccionando de entre 4
doctores y 2 enfermeras. Escriba una frmula para la distribucin de probabilidad de la
variable aleatoria X que representa el nmero de doctores en el comit. Encuentre P(2 X
3).
P15. Una compaa est interesada en evaluar sus actuales procedimientos de inspeccin
en el embarque de 50 artculos idnticos. El procedimiento es tomar una muestra de 5
piezas y autorizar el embarque si se encuentra que no ms de 2 estn defectuosas. qu
proporcin del 20% de embarques defectuosos sern autorizados?

166

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

P16. La probabilidad de que una persona que vive en cierta ciudad posea un perro se estima
en 0.3. Encuentre la probabilidad de que la dcima persona entrevistada aleatoriamente en
esta ciudad sea la quinta persona que posee un perro.
P17. Un cientfico inocula varios ratones, uno a la vez, con un germen de una enfermedad
hasta que obtiene 2 que la han contrado. Si la probabilidad de contraer la enfermedad es
1/6. cul es la probabilidad de que se requieran 8 ratones?
P18. Suponga que la probabilidad de que una persona determinada crea una historia acerca
de los atentados a una famosa actriz es de 0.8. Cul es la probabilidad de que
a)

la sexta persona que escucha tal historia sea la cuarta que la crea?

b)

La tercera persona que escucha tal historia sea la primera en creerla?

P19. Tres personas lanzan una moneda y la que salga dispareja paga los cafs. Si todas las
monedas caen iguales, se lanzan nuevamente.

Encuentre la probabilidad de que se

necesiten menos de 4 lanzamientos.


P20. La probabilidad de que un estudiante para piloto apruebe el examen escrito para
obtener su licencia de piloto privado es de 0.7.

Encuentre la probabilidad de que una

persona apruebe el examen


a. en el tercer intento
b. antes del cuarto intento
P21. El nmero promedio de ratas de campo por acre en un campo de trigo de 5 acres se
estima que es de 12. Encuentre la probabilidad de que menos de 7 ratas de campo se
encuentren
a. en una acre de terreno determinado;
b. en 2 de los siguientes 3 acres inspeccionados.
P22. Un restaurante prepara una ensalada que contiene en promedio 5 verduras diferentes.
Encuentre la probabilidad de que la ensalada contenga ms de 5 verduras
a. en un determinado da;
b. en 3 de los siguientes 4 das;
c.

por primera vez el 5 de abril.

167

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

P23. La probabilidad de que una persona muera debido a cierta infeccin respiratoria es
0.002.

Encuentre la probabilidad de que mueran menos de 5 de las prximas 2000

personas infectadas.
P24. Suponga que en promedio 1 persona de cada 1000 comete un error numrico al
preparar su declaracin de impuestos.

Si se seleccionan al azar 10 000 formas y se

examinan, encuentre la probabilidad de que 6, 7 u 8 formas tengan error.


P25. La probabilidad de que un estudiante presente problemas de escoliosis (desviacin
lateral sufrida por la columna vertebral) en una escuela de la localidad es de 0.004. De los
siguientes 1875 estudiantes revisados encuentre la probabilidad de que
a) menos de 5 presenten este problema
b) 8, 9 o 10 presenten este problema
P26. Se est considerando la produccin de una mquina automtica de soldar.

Se

considerar exitosa si tiene una efectividad del 99% en sus soldaduras. De otra manera, no
se considerar eficiente.

Se lleva a cabo la prueba de un prototipo y se realizan 100

soldaduras. La mquina se aceptar para su fabricacin si no son defectuosas ms de tres


soldaduras.
a. Cul es la probabilidad de que una mquina eficiente sea rechazada?
b. Cul es la probabilidad de que una mquina ineficiente con 95% de
soldaduras correctas sea aceptada?
P27. Una agencia que renta automviles en un aeropuerto local tiene disponibles 5 Ford, 7
Chevrolet, 4 Dodge, 3 Datsun y 4 Toyota. Si la agencia selecciona aleatoriamente 9 de
estos vehculos para transportar delegados desde el aeropuerto hasta el centro de
convenciones en el centro de la ciudad, encuentre la probabilidad de que se utilicen 2 Ford,
3 Chevrolet, 1 Dodge, 1 Datsun y 2 Toyota.
P28. Un investigador de la UCLA reporta que las ratas viven un promedio de 40 meses
cuando sus dietas son muy restringidas y luego enriquecidas con vitaminas y protenas.
Suponiendo que las vidas de tales ratas estn normalmente distribuidas con una desviacin
estndar de 6.3 meses, encuentre la probabilidad de que una rata determinada viva
a) ms de 32 meses;
b) menos de 28 meses;

168

UNIDAD III / FUNCIONES Y DISTRIBUCIONES MUESTRALES.

c) entre 37 y 49 meses.
P29.

Las piezas de pan de centeno distribuidas a las tiendas locales por una cierta

pastelera tienen una longitud de 30cm y una desviacin estndar de 2cm. Suponiendo que
las longitudes estn normalmente distribuidas, qu porcentaje de las piezas son
a)

de ms de 31.7cm de longitud?

b)

entre 29.3 y 33.5 cm de longitud?

c)

de una longitud menor que 25.5 cm?

P38. Una mquina despachadora de refrescos est ajustada para servir un promedio de 200
ml por vaso. Si la cantidad de refresco es normalmente distribuida con una desviacin
estndar igual a 15 ml.
a)

Qu fraccin de los vasos contendr ms de 224 ml?

b)

Cul es la probabilidad de que un vaso contenga entre 191 y 209 ml?

c)

Cuntos vasos probablemente se derramarn si se utilizan vasos de 230 ml en


los siguientes 1000 refrescos?

169

UNIDAD 4
ESTADISTICA
APLICADA.

Objetivo:
Conocer

los

fundamentales

de

aspectos
la

inferencia

estadstica. Definir su aplicacin


en situaciones reales o simuladas.

UNIDAD IV / ESTADISTICA APLICADA.

4.1 Inferencia estadstica.

4.1.1 Concepto.
La teora de la inferencia estadstica consiste en aquellos mtodos por los que se realizan
inferencias o generalizaciones acerca de una poblacin. La tendencia actual es la
distribucin entre el mtodo clsico de estimacin de un parmetro de la poblacin, por
medio del cual las inferencias se basan de manera estricta en informacin que se obtiene de
una muestra aleatoria seleccionada de la poblacin, y el mtodo Bayesiano, que utiliza el
conocimiento subjetivo previo sobre la distribucin de probabilidad de los parmetros
desconocidos junto con la informacin que proporcionan los datos de la muestra. En esta
unidad utilizaremos los mtodos clsicos

para estimar los parmetros de la poblacin

desconocidos como la media, la proporcin y la varianza mediante el clculo de estadstica


de muestras aleatorias y la aplicacin de la teora de las distribuciones mustrales.

4.1.2 Estimacin.
El objetivo principal de la estadstica inferencial es la estimacin, esto es que mediante el
estudio de una muestra de una poblacin se quiere generalizar las conclusiones al total de la
misma. Como vimos en la seccin anterior, los estadsticos varan mucho dentro de sus
distribuciones mustrales, y mientras menor sea el error estndar de un estadstico, ms
cercanos sern unos de otros sus valores.
Existen dos tipos de estimaciones para parmetros; puntuales y por intervalo. Una
estimacin puntual es un nico valor estadstico y se usa para estimar un parmetro, que
se calcula a partir de una muestra dada y sirve como una aproximacin del valor exacto
desconocido del parmetro.
El estadstico usado se denomina estimador. Una estimacin por intervalo, es la estima
de un parmetro poblacional dada por dos nmeros entre los cuales se considera que se
encuentra dicho parmetro generalmente de ancho finito

4.1.3 Prueba de hiptesis.


Las secciones anteriores han mostrado cmo puede estimarse un parmetro a partir de los
datos contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador
puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos

171

UNIDAD IV / ESTADISTICA APLICADA.

problemas de ingeniera, ciencia, y administracin, requieren que se tome una decisin entre
aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el
nombre de hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica,
puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en
el mundo de la ingeniera, pueden formularse como problemas de prueba de hiptesis.

4.1.4 Mtodo clsico de estimacin (puntual).


Una estimacin puntual de un parmetro

como el valor mas razonable de

es un solo numero que se puede considerar

La estimacin puntual se obtiene al seleccionar una

estadstica apropiada y calcular su valor a partir de datos de la muestra dada. La estadstica


seleccionada se llama estimador puntual de

4.1.5 Estimador Insesgado.


Entre todos los estimadores de
mnima. El

que

son insesgados, seleccione al que tenga varianza

resultante recibe el nombre de estimador insesgado con varianza mnima

(MVUE, minimum variance unbiased estimator) de

. En otras palabras, la eficiencia se

refiere al tamao de error estndar de la estadstica. Si comparamos dos estadsticas de una


muestra del mismo tamao y tratamos de decidir cul de ellas es un estimador ms eficiente,
escogeramos la estadstica que tuviera el menor error estndar, o la menor desviacin
estndar de la distribucin de muestreo. Tiene sentido pensar que un estimador con un error
estndar menor tendr una mayor oportunidad de producir una estimacin ms cercana al
parmetro de poblacin que se est considerando.

4.2 Intervalos de confianza.

4.2.1 Estimacin por intervalo.


Las estimaciones por intervalo de un parmetro poblacional desconocido dan idea de la
precisin y exactitud de la inferencia efectuada, junto con la probabilidad de que tal
estimacin sea cierta. Se calculan a travs de los llamados: intervalos de confianza. Estos se

172

UNIDAD IV / ESTADISTICA APLICADA.

construyen con la funcin probabilstica del modelo estadstico adoptado para realizar la
estimacin

4.2.2 Lmites de confianza.


Estimas por intervalo de confianza, de parmetros poblacionales.
Un intervalo de confianza con un nivel de confianza de 95% de la resistencia real promedio a
la ruptura podra tener un lmite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un
nivel de confianza de 95%, es posible tener cualquier valor de

entre 9162.5 y 9482.9. Un

nivel de confianza de 95% implica que 95% de todas las muestras dara lugar a un intervalo
que incluye

o cualquier otro parmetro que se est estimando, y slo 5% de las muestras

producir un intervalo errneo. Cuanto mayor sea el nivel de confianza podremos creer que
el valor del parmetro que se estima est dentro del intervalo.
Intervalos (S

, S 2

, S 3

) son llamados lo limites de confianza del 68.27 %,

95.45 % y 99.73 % o como otras veces se conocen limites fiduciales.


Anlogamente, S 1.96 s y S 2.58

son los limites de confianza del 95 % y 99 % (

0.95 y 0.99 ) para s.


El porcentaje de confianza se llama tambin nivel de confianza. Los nmeros 1.96, 2.58,
etc., de los limites de confianza se llaman coeficientes de confianza o valores crticos y se
denotan por Zc . De los niveles de confianza se pueden obtener los coeficientes de confianza
y recprocamente.
En la tabla siguiente se dan los valores de Z

que corresponden a distintos niveles de

confianza utilizados en la prctica. Para niveles de confianza que no se encuentra en la tabla


, los valores de Z c pueden sacarse de las tablas de la curva normal en el Apndice A.
Nivel de confianza (%)

99.73

3.00

99

2.58

98

2.33

96

2.05

173

UNIDAD IV / ESTADISTICA APLICADA.

95.45

2.00

95

1.96

90

1.645

80

1.28

68.27

1.00

50

0.6745

Estos intervalos abiertos por izquierda o por derecha se denominan de una cola, mientras
que los comunes para la estimacin de parmetros poblacionales son de dos colas.
Niveles de significancia

Niveles de confianza

Coeficiente de confianza

NC = (1 ) *100

0.0005

99.95 %

3.29

0.0010

99.90 %

3.09

0.0013

99.87 %

3.00

0.0050

99.50 %

2.58

0.0100

99.00 %

2.33

0.0227

97.72 %

2.00

0.0250

97.50 %

1.96

0.0500

95.00 %

1.645

0.1587

84.13 %

1.00

99.90%

99.00%

95.00%

1 cola

3.09

2.33

1.645

2 cola

3.29

2.58

1.96

4.2.3 Intervalo de confianza para media con varianza conocida.


1.

Grandes muestras ( n 30 ).

La frmula para el clculo de probabilidad es la siguiente:

Z=

174

UNIDAD IV / ESTADISTICA APLICADA.

Como en este caso no conocemos el parmetro y lo queremos estimar por medio de la


media de la muestra, slo se despejar de la formula anterior, quedando lo siguiente:

= x Zc

De esta frmula se puede observar que tanto el tamao de la muestra como el valor de z se
conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de
confianza establecido.
Pero en ocasiones se desconoce

por lo que en esos casos lo correcto es utilizar otra

distribucin llamada t de Student si la poblacin de donde provienen los datos es normal.


Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual de la
desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de la
poblacin (s = ).
En el caso de muestreo en una poblacin infinita o si el muestreo es con remplazamiento en
una poblacin finita y por

= x Zc

N n
N 1

Si el muestreo es sin remplazamiento en una poblacin finita de tamao N.


En general, la desviacin tpica poblacional es desconocida, de modo que para obtener
los lmites de confianza anteriores se utiliza la estima muestra S.

Muestras grandes.
Problema: Supngase que las estaturas de 100 estudiantes de la universidad XYZ. Hallar
los intervalos de confianza del:
a) 95 % y
b) 99 % .
Para estimar la estatura media de X = 67.45 y

= 2.73 pulgadas de los estudiantes de la

universidad XYZ.

x ZC
a)

Los lmites de confianza del 95% son

175

UNIDAD IV / ESTADISTICA APLICADA.

Zc = 1.96
67.45 + 1.96

2.93

= 68.02

67.45 1.96

100

2.93

= 66.88

100

As, pues, el intervalo de confianza del 95 % para la media poblacional es 66.88 a 68.02
pulgadas, que puede denotarse por 66.88 < < 68.02
b)

Los lmites de confianza del 99 % son


67.45 + 2.58

2.93

= 68.21 67.45 2.58

100

2.93

= 66.69

100

As, pues, el intervalo de confianza del 99 % para la media poblacional es 66.69 a 68.21
pulgadas, que puede denotarse por 66.69 < < 68.21
Problema: Las medidas de los dimetros de una muestra de 200 cojinetes de bolas hechos
por una determinada maquina durante una semana dieron una media de 0.824 pulgadas y
una desviacin tpica de 0.042 pulgadas. Hallar los limites de confianza del
a)

95 %

b)

99 %

Para el dimetro medio de todos los cojinetes.


Solucin:
a)

los limites de confianza del 95% son

Zc = 1.96
0.824 + 1.96

0.042

= 0.83

0.824 1.96

200

b)

0.042

= 0.818

200

los limites de confianza del 99% son

Zc = 2.58
0.824 + 2.58

0.042

= 0.832

200

0.824 2.58

0.042

= 0.816

200

Problema: Hallar los limites de confianza del


a)

98 %

b)

90 %

176

UNIDAD IV / ESTADISTICA APLICADA.

c)

99.73 %

Para el dimetro medio de los cojinetes del problema anterior.


Solucin:
a)

Los limites de confianza del 98 %

Zc = 2.33
0.824 + 2.33

0.042

= 0.831

0.824 2.33

200

b)

0.042

= 0.817

200

Los limites de confianza del 90 %

Zc = 1.645
0.824 + 1.645

0.042

= 0.829

0.824 1.645

200

c)

0.042

= 0.819

200

Los limites de confianza del 99.73 %

Zc = 3.00
0.824 + 3.00

0.042

= 0.833

0.824 3.00

200

0.042

= 0.815

200

Problema: Al medir el tiempo de reaccin, un psiclogo estima que la desviacin tpica del
mismo es de 0.05 segundos.
Cul es el numero de medidas que deber hacer para que sea del
a)

95 %

b)

99 %

la confianza de que error de su estima no exceda de 0.01 segundo ?


Solucin:
a)

Los lmites de confianza del 95 % son.

Tomando = s = 0.05 segundos, se tiene que el error ser igual a 0.01 si:
(1.96 ) ( 0.05 ) / n = 0.01, es decir,
n = (1.96)(0.05) / 0.01
n = 9.8
n = 96.04.
As, pues, se puede estar en la confianza del 95 % de que el error de la estima ser
menor de 0.01 si n es 96 o mayor.

177

UNIDAD IV / ESTADISTICA APLICADA.

b)

Los lmites de confianza del 99 % son.

Tomando = s = 0.05 segundos, se tiene que el error ser igual a 0.01 si:
(2.58) ( 0.05 ) / n = 0.01, es decir,
n = (2.58)(0.05) / 0.01
n = 166.41.
As, pues, se puede estar en la confianza del 99 % de que el error de la estima ser menor
de 0.01 si n es 166 o mayor.
Problema: Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de
zinc en el ro. Suponga que la desviacin estndar de la poblacin es 0.3.
Solucin:
Para el 95 % , Z c = 1.96

2.6 + 1.96

= 2.7
36
0.3

2.6 1.96

= 2.5
36
0.3

2 .5 < < 2 .7
para el 99 % ; Z c = 2.58

2.6 + 2.58

0.3 = 2.73

36

2.6 2.58

0.3 = 2.47

36

2.47 < < 2.73


Problema: Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra de 30

178

UNIDAD IV / ESTADISTICA APLICADA.

focos tiene una duracin promedio de 780 horas, encuentre un intervalo de confianza de
96% para la media de la poblacin de todos los focos que produce esta empresa.
Solucin:

= 765.03
30

780 2.05

40

= 794.97
30

780 + 2.05

40

765 < < 794

Con un nivel de confianza del 96% se sabe que la duracin media de los focos que produce
la empresa est entre 765 y 765 horas.
Problema: La prueba de corte sesgado es el procedimiento ms aceptado para evaluar la
calidad de una unin entre un material de reparacin y su sustrato de concreto. El artculo
Testing the Bond Between Repair Materials and Concrete Substrate informa que, en cierta
investigacin, se obtuvo una resistencia promedio muestral de 17.17 N/mm2, con una
muestra de 48 observaciones de resistencia al corte, y la desviacin estndar muestral fue
3.28 N/mm2. Utilice un nivel de confianza inferior del 95% para estimar la media real de la
resistencia al corte.
Solucin:
Para el intervalo de confianza unilateral, se cargar el rea bajo la curva hacia un solo lado
como sigue:
Inferior a 95 % de la tabla es el 90 % que tiene
Z c = 1.645

3 . 28
17 .17 1 .645
= 16 .39
48
Problema: Suponga que un centro de computo regional desea evaluar el desempeo de su
sistema de memoria en disco. Una medida del desempeo es el tiempo medio entre fallas de
su unidad de disco. A fin de estimar este valor, el centro registro el tiempo entre fallas para
una muestra aleatoria de 45 fallas de la unidad de disco. Se calcularon las siguientes
estadsticas:

x = 1762horas ; s = 215 horas , estime el verdadero tiempo medio entre fallas

con un intervalo de confianza de 90%


Solucin:

179

UNIDAD IV / ESTADISTICA APLICADA.

1762 1.645

215
45

= 1709.3

1762 + 1.645

215
45

= 1814.7

1709.3 < < 1814.7


Problema: Una muestra aleatoria de 50 calificaciones de matemticas de un total de 200,
arrojo una media de 75 y una desviacin tpica de 10
a)

Cuales son los limites de confianza del 95 % para la estima de la media de las

200 calificaciones?
b)

Con que grado de confianza podr decirse que la media de las 200 calificaciones

es 75 1?
Solucin:
a)

Se debe emplearse la formula para poblaciones finitas con muestreo sin

remplazamiento. Entonces los limites de confianza del 95 % son :


75 + 1.96

b)

200 50

= 77.41
50 200 1

10

75 1.96

200 50

= 72.59
50 200 1

10

Los lmites de confianza pueden representarse por:

75 + Z
c

10

200 50

50

200 1

75 1.23 Z c
Puesto que esto debe ser igual a 75 1 , se tiene que 1.23 Z

=1Z

= 0.81. El rea

bajo la curva desde


Por simetra es : z = - 0.81 y z = 0.81 es :

p (0.81 z 0.81) = p ( z 0.81) p ( z 0.81)


= 0.7910 0.2090 = 0.5820 = 50.2%
De aqu el grado de confianza pedido es de 58.20%
Clculo del Tamao de la Muestra para Estimar una Media
Qu tan grande debe ser una muestra si la media muestral se va a usar para estimar la
media poblacional? . La respuesta depende del error estndar de la media, si este fuera
cero, entonces se necesitara una sola media que ser igual necesariamente a la media
poblacional desconocida , porque = 0. Este caso extremo no se encuentra en la prctica,

180

UNIDAD IV / ESTADISTICA APLICADA.

pero refuerza el hecho de que mientras menor sea el error estndar de la media, menor es el
tamao de muestra necesario para lograr un cierto grado de precisin.
Se estableci antes que una forma de disminuir el error de estimacin es aumentar el
tamao de la muestra, si ste incluye el total de la poblacin, entonces

x sera igual

a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible
determinar un tamao de la muestra tal que el error de estimacin sea tan pequeo como
queramos, para ser mas preciso, dado un nivel de confianza y un error fijo de estimacin
se puede escoger un tamao de muestra n tal que

P ( x < ) = Nivel de confianza.

Con el propsito de determinar n. El error mximo de estimacin esta dado por:

Z
n

Si se eleva al cuadrado ambos lados de esta ecuacin y se despeja n de la ecuacin


resultante, obtenemos:

Z
n=

Como n debe de ser un nmero entero, redondeamos hacia arriba todos los resultados
fraccionarios.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de
estimacin se convierte en:

Z N n

n N 1

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

n=

Z 2 2 N
2 ( N 1) + Z 2 2

Problema: Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado
de Maryland. Un estudio anterior de diez ciervos cazados mostr que la desviacin estndar
de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el bilogo
tenga el 95% de confianza de que el error de estimacin es a lo ms de 4 libras?
Solucin:

181

UNIDAD IV / ESTADISTICA APLICADA.

Z
(1 . 96 )(12 . 2 )
n =
=
= 35 . 736
4

En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza en


que m difiere en menos de 4 libras de x .
Problema: Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
normal con una desviacin estndar de 40 horas. De qu tamao se necesita una muestra
si se desea tener 96% de confianza que la media real est dentro de 10 horas de la media
real?
Solucin.

( 2 . 053 ) (40 )
Z
n=
=
= 67 . 45
10

Se necesita una muestra de 68 focos para estimar la media de la poblacin y tener un error
mximo de 10 horas. Qu pasara si en lugar de tener un error de estimacin de 10 horas
slo se requiere un error de 5 horas?

( 2 . 053 ) (40 )
Z
n=
=

= 269 . 74

Se puede observar como el tamao de la muestra aumenta, pero esto tiene como beneficio
una estimacin ms exacta.
Problema: Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se
desea saber de que tamao debe de ser la muestra. El muestreo se realizar sin reemplazo.
Solucin:

( 2.053) ( 40 ) ( 300 )
z 2 2 N
n= 2
=
= 55.21
2
2
2 2
( N 1) + z
(10 ) ( 300 1) + ( 2.0532 ) ( 40 )
2

182

UNIDAD IV / ESTADISTICA APLICADA.

Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la poblacin una
muestra sin reemplazo de 55 focos para poder estimar la duracin media de los focos
restantes con un error mximo de 10 horas.

4.2.4. Intervalo de confianza para una diferencia de medias.


Si se tienen dos poblaciones con medias
estimador puntual de la diferencia entre

1 y 2

1 y 2

varianzas

12 y 22 , respectivamente, un

est dado por la estadstica

1 - 2 se

tanto. Para obtener una estimacin puntual de

x1 x2 . Por

seleccionan dos muestras

aleatorias independientes, una de cada poblacin, de tamao n1 y n2, se calcula la diferencia

x1 x2 , de las medias mustrales. Recordando a la distribucin muestral de diferencia de


medias:

Z =

( x1 x 2 ) ( 1 2 )

12
n1

Al despejar de esta ecuacin

1 - 2

2
2

n2

se tiene:

1 2 = ( x1 x 2 ) Z

12
n1

22
n2

En el caso en que se desconozcan las varianzas de la poblacin y los tamaos de muestra


sean mayores a 30 se podr utilizar la varianza de la muestra como una estimacin puntual.
Problema: Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B.
Se mide el rendimiento en millas por galn de gasolina. Se realizan 50 experimentos con el
motor tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las dems condiciones se
mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas
por galn y el promedio para el motor B es 42 millas por galn. Encuentre un intervalo de
confianza de 96% sobre la diferencia promedio real para los motores A y B. Suponga que las
desviaciones estndar poblacionales son 6 y 8 para los motores A y B respectivamente.
Solucin:

183

UNIDAD IV / ESTADISTICA APLICADA.

Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la
media mayor menos la media menor. En este caso ser la media del motor B menos la
media del motor A. El valor de z para un nivel de confianza del 96% es de 2.05.

1 2 = ( x1 x 2 ) Z

12
n1

22
n2

= (42 36) 2.05

36 64
+
50 75

3.43 < A B < 8.57


La interpretacin de este ejemplo sera que con un nivel de confianza del 96% la diferencia
del rendimiento promedio esta entre 3.43 y 8.57 millas por galn a favor del motor B. Esto
quiere decir que el motor B da ms rendimiento promedio que el motor A, ya que los dos
valores del intervalo son positivos.
Problema: Una compaa de taxis trata de decidir si comprar neumticos de la marca A o de
la B para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un
experimento utilizando 12 de cada marca. Los neumticos se utilizan hasta que se
desgastan, dando como resultado promedio para la marca A 36,300 kilmetros y para la
marca B 38,100 Kilmetros. Calcule un intervalo de confianza de 95% para la diferencia
promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de forma
aproximadamente normal con desviacin estndar de 5000 kilmetros para la marca A y
6100 kilmetros para la marca B.
Solucin:
2
2
2
2
1 2 = ( x1 x 2 ) Z 1 + 2 = (38100 36300) 1.96 5000 + 6100

n1

n2

12

12

2662.68 < B A < 6262.67


Como el intervalo contiene el valor cero, no hay razn para creer que el promedio de
duracin del neumtico de la marca B es mayor al de la marca A, pues el cero nos est
indicando que pueden tener la misma duracin promedio.

Clculo del Tamao de la Muestra para Estimar la Diferencia de Medias


Si se recuerda a la distribucin muestral de diferencia de medias se tiene que error esta
dado por:

184

UNIDAD IV / ESTADISTICA APLICADA.

=Z

12
n1

22
n2

En esta ecuacin se nos pueden presentar dos casos:

Los tamaos de muestra son iguales.

Los tamao de muestra son diferentes

Para el primer caso no se tiene ningn problema, se eleva al cuadrado la ecuacin y se


despeja n ya que n1 es igual a n2.

n=

Z 2 ( 12 + 22 )

Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza cuando las
poblaciones son de diferente tamao y se sabe que una es K veces mayor que la otra.
Problema: Un director de personal quiere comparar la efectividad de dos mtodos de
entrenamiento para trabajadores industriales a fin de efectuar cierta operacin de montaje.
Se divide un nmero de operarios en dos grupos iguales: el primero recibe el mtodo de
entrenamiento 1, y el segundo, el mtodo 2. Cada uno realizar la operacin de montaje y se
registrar el tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan
una desviacin estndar aproximadamente de 2 minutos. Si se desea que la estimacin de
la diferencia en tiempo medio de montaje sea correcta hasta por un minuto, con una
probabilidad igual a 0.95,
Cuntos trabajadores se tienen que incluir en cada grupo de entrenamiento?
Solucin:

n=

Z 2 ( 12 + 22 )

(1.969) 2 (22 + 22 )
= 31
12

Cada grupo debe contener aproximadamente 31 empleados.

185

UNIDAD IV / ESTADISTICA APLICADA.

4.2.5 Intervalo de confianza para proporciones.


Un estimador puntual de la proporcin P en un experimento Binomial est dado por la
estadstica P = X / N, donde x representa el nmero de xitos en n pruebas.
Por tanto, la proporcin de la muestra p = x /n se utilizar como estimador puntual del
parmetro P. Si no se espera que la proporcin P desconocida est demasiado cerca de 0
de 1, se puede establecer un intervalo de confianza para P al considerar la distribucin
muestral de proporciones.

Z=

pP
Pq
n

Al despejar P de esta ecuacin nos queda:

P = p Zc

Pq
n

En este despeje podemos observar que se necesita el valor del parmetro P y es


precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporcin de la
muestra p siempre y cuando el tamao de muestra no sea pequeo.

P = p Zc

Pq
n

Cuando n es pequea y la proporcin desconocida P se considera cercana a 0 a 1, el


procedimiento del intervalo de confianza que se establece aqu no es confiable, por tanto, no
se debe utilizar. Para estar seguro, se debe requerir que np nq sea mayor o igual a 5. El
error de estimacin ser la diferencia absoluta entre p y P, y podemos tener el nivel de
confianza de que esta diferencia no exceder

P = p Zc

Pq
n

El error de estimacin ser la diferencia absoluta entre p y P, y podemos tener el nivel de


confianza de que esta diferencia no exceder

Pq
n

186

UNIDAD IV / ESTADISTICA APLICADA.

Problema: Un fabricante de reproductores de discos compactos utiliza un conjunto de


pruebas amplias para evaluar la funcin elctrica de su producto. Todos los reproductores
de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra
aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o ms pruebas.
Encuentre un intervalo de confianza de 90% para la proporcin de los reproductores de
discos compactos de la poblacin que no pasan todas las pruebas.
Solucin:

n = 500;

p = 15 / 500 = 0.03;

z = 1.645

pq
n
0.0175 < P < 0.0425
P = pz

Problema: En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se
encontraron 20 defectuosas. Si la proporcin p de pilas defectuosas en esa muestra se usa
para estimar P, que vendr a ser la proporcin verdadera de todas las pilas defectuosas tipo
B fabricadas por la Everlast Company, encuentre el mximo error de estimacin e tal que se
pueda tener un 95% de confianza en que P dista menos de

de p.

Solucin:
P = x / n = 20 / 400 = 0.05
Z c = 1.96

=Z

(0.05)(0.95)
pq
= 1.96
= 0.021
400
n

Si p = 0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista
menos de 0.021 de p. En otras palabras, si p = 0.05 se usa para estimar P, el error mximo
de estimacin ser aproximadamente 0.021 con un nivel de confianza del 95%. Para calcular
el intervalo de confianza se tendra: P = 0.05 0.021
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se
sabe que la proporcin de pulas defectuosas de esta compaa est entre 0.029 y 0.071. Si
se requiere un menor error con un mismo nivel de confianza slo se necesita aumentar el
tamao de la muestra.

187

UNIDAD IV / ESTADISTICA APLICADA.

Problema: En un estudio de 300 accidentes de automvil en una ciudad especfica, 60


tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90%
de confianza para aproximar la proporcin de todos los accidentes automovilsticos que en
esa ciudad tienen consecuencias fatales.
Solucin:
P = 60/300 = 0.20

; Zc = 1.645

P = 0.20 1.645

(0.20)(0.8)
300

0.162 < P < 0.238


Problema: Es comn utilizar aceros inoxidables en las plantas qumicas para manejar fluidos
corrosivos. Sin embargo, estos aceros tienen especial susceptibilidad al agrietamiento por
corrosin causada por esfuerzos en ciertos entornos. En una muestra de 295 fallas de
aleaciones de acero que ocurrieron en refineras de petrleo y plantas petroqumicas en
Japn durante los ltimos 10 aos, 118 se debieron a agrietamiento por corrosin causada
por esfuerzos y a fatiga de corrosin ( Materials Performance, junio de 1981). Establezca un
intervalo de confianza de 95 % para verdadera proporcin de fallas de aleaciones causadas
por agrietamiento por corrosin debida a esfuerzos.
Solucin:
P = 118 / 295 = 0.4

(0.4)(0.6)
pq
= 0.4 (1.96)
= 0.4 0.056
295
n
0.344 < P < 0.456
P = pZ

Problemas propuestos:
P1. Una encuesta sobre vivienda estadounidense realizada por el Departamento de
Comercio de Estados Unidos revelo que 750 de 1500 propietarios de casa muestreados
siguen la filosofa de hgalo usted mismo , es decir, realizaron ellos mismos la mayor parte
del trabajo en por lo menos una de las mejoras o reparaciones de su hogar ( Bureau of the
Census, Statistical Brief, mayo de 1992). Estime, con un intervalo de confianza de 95 %, la
verdadera proporcin de propietarios de casas estadounidenses que realizan ellos mismos
la mayor parte del trabajo de mejoramiento o reparacin de sus hogares.

188

UNIDAD IV / ESTADISTICA APLICADA.

P2. La encuesta del Agujero Negro, patrocinada por el Consejo de Investigacin sobre
Empleo Profesional, informa cuales son los puestos mas difciles de llenar en las listas de los
reclutadores. En la encuesta mas recientes, 95 de 285 reclutadores consideraron los
puestos de ingeniera como los mas difciles de llenar. ( Industrial Engineering, agosto de
1990). Estime el verdadero porcentaje de reclutadores que consideran que los puestos mas
difciles de llenar son los de ingeniera. Utilice un intervalo de confianza de 99 % .
P3. Como parte de un convenio de cooperacin en investigacin entre Estados Unidos y
Japn, se diseo un edificio de concreto armado a escala completa y se aprob en
condiciones simuladas de carga de un terremoto en Japn (Journal of Structural
Enginnering, enero de 1986). En una parte del estudio se pidi a varios ingenieros de diseo
estadounidense que evaluaron el nuevo diseo. De los 48 ingenieros encuestados, 36
opinaron que la pared de cizallamiento de la estructura tena un refuerzo demasiado ligero.
Establezca un intervalo de confianza de 95 % para la verdadera proporcin de ingenieros de
diseo estadounidenses que consideran que la pared de cizallamiento del edificio tiene un
refuerzo demasiado ligero.

4.2.6. Intervalo de confianza para diferencia de proporciones.


Para este caso en particular se utilizar la distribucin muestral de diferencia de
proporciones para la estimacin de la misma. Recordando la formula:

Z =

Despejando

( p 1 p 2 ) ( P1 P 2 )
P1 q 1
P2 q 2
+
n1
n2

P1 P2 de esta ecuacin:
P1 P2 = ( p 1 p 2 ) Z

P1 q 1
P q
+ 2 2
n1
n2

Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al hacer el
despeje nos queda las dos proporciones poblacionales y es precisamente lo que queremos
estimar, por lo que se utilizarn las proporciones de la muestra como estimadores puntuales:

P1 P 2 = ( p 1 p 2 ) Z

P1 q 1
P q
+ 2 2
n1
n2

189

UNIDAD IV / ESTADISTICA APLICADA.

Problema: Se considera cierto cambio en un proceso de fabricacin de partes componentes.


Se toman muestras del procedimiento existente y del nuevo para determinar si ste tiene
como resultado una mejora. Si se encuentra que 75 de 1500 artculos del procedimiento
actual son defectuosos y 80 de 2000 artculos del procedimiento nuevo tambin lo son,
encuentre un intervalo de confianza de 90% para la diferencia real en la fraccin de
defectuosos entre el proceso actual y el nuevo.
Solucin:

P1 P 2 = ( p 1 p 2 ) Z

P1 q 1
P q
+ 2 2
n1
n2

0.0017 < P1 P2 < 0.0217


Como el intervalo contiene el valor de cero, no hay razn para creer que el nuevo
procedimiento producir una disminucin significativa en la proporcin de artculos
defectuosos comparada con el mtodo existente.
Problema: Un artculo relacionado con la salud, reporta los siguientes datos sobre la
incidencia de disfunciones importantes entre recin nacidos con madres fumadoras de
marihuana y de madres que no la fumaban:
Usuario

No usuario

Tamao muestral

1246

11178

Numero de disfunciones

42

294

Proporcin muestral

0.0337

0.0263

Encuentre el intervalo de confianza del 99% para la diferencia de proporciones.


Solucin:
Representemos P1 la proporcin de nacimientos donde aparecen disfunciones entre todas
las madres que fuman marihuana y definamos P2, de manera similar, para las no fumadoras.
El valor de z para un 99% de confianza es de 2.58.

P1 P2 = ( p1 p 2 ) Z

P1 q1 P2 q 2
+
n1
n2

190

UNIDAD IV / ESTADISTICA APLICADA.

0.0064 < P1 P2 < 0.0212


Este intervalo es bastante angosto, lo cual sugiere que P1-P2 ha sido estimado de manera
precisa.
Problema: Un ingeniero de trfico realizo un estudio de velocidades vehiculares en un
segmento de calle en la cual se cambio varias veces el lmite de velocidad sealizado.
Cuando el lmite era

de 30 millas por hora, el ingeniero vigilo las velocidades de 100

vehculos elegidos al azar que transitaron por la calle y observo 49 violaciones del lmite de
velocidad. Despus de que el limite se elevo a 35 millas por hora, el ingeniero volvi a vigilar
las velocidades de 100 vehculos elegidos aleatoriamente y observo 19 que violaron el
limite. Establezca un intervalo de confianza de 99% para

( p1 p2 ) , donde p1 es la

verdadera proporcin de vehculos que excedieron el lmite de velocidad menor ( 30 millas


por hora) y p2 es la verdadera proporcin de vehculos que ( en condiciones de circulacin
similares) excedieron el lmite de velocidad mayor ( 35 millas por hora).
Solucin:
p1 = 49/100 = 0.49
p2 = 19/100 = 0.19

P1 P2 = ( p1 p 2 ) Z
P1 P2 = (0.49 0.19) 2.58

P1 q1 P2 q 2
+
n1
n2

(0.49)(0.51) (0.19)(0.81)
+
= 0.30 0.164
100
100

0.136< P1 P2 < 0.464

Determinacin de Tamaos de Muestra para Estimaciones


Al iniciar cualquier investigacin, la primer pregunta que surge es: de qu tamao debe ser
la o las muestras?. La respuesta a esta pregunta la veremos en esta seccin, con conceptos
que ya se han visto a travs de este material.
Se desea saber que tan grande se requiere que sea una muestra para asegurar que el error
al estimar P sea menor que una cantidad especfica .

pq
n

191

UNIDAD IV / ESTADISTICA APLICADA.

Elevando al cuadrado la ecuacin anterior se despeja n y nos queda:

n =

pq
2

Esta frmula est algo engaosa, pues debemos utilizar p para determinar el tamao de la
muestra, pero p se calcula a partir de la muestra.
Existen ocasiones en las cuales se tiene una idea del comportamiento de la proporcin de la
poblacin y ese valor se puede sustituir en la frmula, pero si no se sabe nada referente a
esa proporcin entonces se tienen dos opciones:

Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimacin
de P. Despus con el uso de la frmula se podra determinar de forma aproximada
cuntas observaciones se necesitan para proporcionar el grado de precisin que se
desea.

Tomar el valor de p como 0.5 ya que sustituyendo este en la frmula se obtiene el


tamao de muestra mayor posible.

En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de
estimacin se convierte en:

=Z

pq
n

N n
N 1

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

n=

Z 2 pqN
2 ( N 1) + Z 2 pq

Problema: En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de
Hamilton, Canad, se encuentra que 340 estn suscritas a HBO. Qu tan grande se
requiere que sea una muestra si se quiere tener 95% de confianza de que la estimacin de P
est dentro de 0.02?
Solucin:
p = 340/500=0.68.

n=

Z 2 pq

(1.96) 2 (0.68)(0.32)
= 2089.83
(0.02) 2

192

UNIDAD IV / ESTADISTICA APLICADA.

Por lo tanto si basamos nuestra estimacin de P sobre una muestra aleatoria de tamao
2090, se puede tener una confianza de 95% de que nuestra proporcin muestral no diferir
de la proporcin real por ms de 0.02.
Problema: Una legisladora estatal desea encuestar a los residentes de su distrito para
conocer qu proporcin del electorado conoce la opinin de ella, respecto al uso de fondos
estatales para pagar abortos. Qu tamao de muestra se necesita si se requiere un
confianza del 95% y un error mximo de estimacin de 0.10?

Solucin:
En este problema, se desconoce totalmente la proporcin de residentes que conoce la
opinin de la legisladora, por lo que se utilizar un valor de 0.5 para p.

n=

Z 2 pq

(1.96) 2 (0.50)(0.50)
= 96.04
(0.10) 2

Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la
estimacin tenga un error mximo de 0.10.

Clculo del Tamao de la Muestra para Estimar la Diferencia de Proporciones


Si se recuerda a la distribucin muestral de diferencia de medias se tiene que error esta
dado por:

=Z

p1q1 p2 q2
+
n1
n2

En esta ecuacin se nos pueden presentar dos casos:

Los tamaos de muestra son iguales.

Los tamaos de muestra son diferentes.

n=

z 2 ( p1 q1 + p 2 q 2 )

Problema: Una compaa de productos alimenticios contrat a una empresa de investigacin


de mercadotecnia, para muestrear dos mercados, I y II, a fin de comparar las proporciones
de consumidores que prefieren la comida congelada de la compaa con los productos de
sus competidores. No hay informacin previa acerca de la magnitud de las proporciones P1 y

193

UNIDAD IV / ESTADISTICA APLICADA.

P2. Si la empresa de productos alimenticios quiere estimar la diferencia dentro de 0.04, con
una probabilidad de 0.95, Cuntos consumidores habr que muestrear en cada mercado?
Solucin:
n=

Z 2 ( p1q1 + p 2 q 2 )

(1 .96 ) 2 [(0 .5 )(0 .5 ) + (0 .5 )(0 .5 )]


= 1200 . 5
(0 .04 )2

Se tendr que realizar encuestas a 1201 consumidores de cada mercado para tener una
estimacin con una confianza del 95% y un error mximo de 0.04.

Problemas propuestos
P1. Se prob una muestra aleatoria de 400 cinescopios de televisor y se encontraron 40
defectuosos. Estime el intervalo que contiene, con un coeficiente de confianza de 0.90, a la
verdadera fraccin de elementos defectuosos.
P2. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un trabajo,
exacto dentro de 4 segundos y con una probabilidad de 0.90, para terminar un trabajo de
montaje. Si la experiencia previa sugiere que

= 16 seg. mide la variacin en el tiempo de

montaje entre un trabajador y otro al realizar una sola operacin de montaje, cuntos
operarios habr que incluir en la muestra?
P3. El decano registr debidamente el porcentaje de calificaciones D y F otorgadas a los
estudiantes por dos profesores universitarios de matemticas. El profesor I alcanz un 32%,
contra un 21% para el profesor II, con 200 y 180 estudiantes, respectivamente. Estime la
diferencia entre los porcentajes de calificaciones D y F otorgadas por los dos profesores.
Utilice un nivel de confianza del 95% e interprete los resultados.
P4. Suponga que se quiere estimar la produccin media por hora, en un proceso que
produce antibitico. Se observa el proceso durante 100 perodos de una hora, seleccionados
al azar y se obtiene una media de 34 onzas por hora con una desviacin estndar de 3
onzas por hora. Estime la produccin media por hora para el proceso, utilizando un nivel de
confianza del 95%.
P5. Un ingeniero de control de calidad quiere estimar la fraccin de elementos defectuosos
en un gran lote de lmparas. Por la experiencia, cree que la fraccin real de defectuosos

194

UNIDAD IV / ESTADISTICA APLICADA.

tendra que andar alrededor de 0.2. Qu tan grande tendra que seleccionar la muestra si
se quiere estimar la fraccin real, exacta dentro de 0.01, utilizando un nivel de confianza fe
95%?
P6. Se seleccionaron dos muestras de 400 tubos electrnicos, de cada una de dos lneas de
produccin, A y B. De la lnea A se obtuvieron 40 tubos defectuosos y de la B 80. Estime la
diferencia real en las fracciones de defectuosos para las dos lneas, con un coeficiente de
confianza de 0.90 e intrprete los resultados.
P7. Se tienen que seleccionar muestras aleatorias independientes de n1 = n2 = n
observaciones de cada una de dos poblaciones binomiales, 1 y 2. Si se desea estimar la
diferencia entre los dos parmetros binomiales, exacta dentro de 0.05, con una probabilidad
de 0.98. qu tan grande tendra que ser n?. No se tiene informacin anterior acerca de los
valores P1 y P2, pero se quiere estar seguro de tener un nmero adecuado de
observaciones en la muestra.
P8. Se llevan a cabo pruebas de resistencia a la tensin sobre dos diferentes clases de
largueros de aluminio utilizados en la fabricacin de alas de aeroplanos comerciales. De la
experiencia pasada con el proceso de fabricacin se supone que las desviaciones estndar
de las resistencias a la tensin son conocidas. La desviacin estndar del larguero 1 es de
1.0 Kg/mm2 y la del larguero 2 es de 1.5 Kg/mm2. Se sabe que el comportamiento de las
resistencias a la tensin de las dos clases de largueros son aproximadamente normal. Se
toma una muestra de 10 largueros del tipo 1 obtenindose una media de 87.6 Kg/mm2, y
otra de tamao 12 para el larguero 2 obtenindose una media de 74.5 Kg/mm2. Estime un
intervalo de confianza del 90% para la diferencia en la resistencia a la tensin promedio. 50
P9. Se quiere estudiar la tasa de combustin de dos propelentes slidos utilizados en los
sistemas de escape de emergencia de aeroplanos. Se sabe que la tasa de combustin de
los dos propelentes tiene aproximadamente la misma desviacin estndar; esto es 1 = 2 =
3 cm/s. Qu tamao de muestra debe utilizarse en cada poblacin si se desea que el error
en la estimacin de la diferencia entre las medias de las tasas de combustin sea menor que
4 cm/s con una confianza del 99%?.

195

UNIDAD IV / ESTADISTICA APLICADA.

4.3 Pruebas de hiptesis.


La Teora de la Decisin Estadstica como herramienta bsica para la toma de decisiones,
basadas en evidencia cientfica. La manera de hacerlo es plantear las hiptesis posibles y
luego efectuarle una prueba o test estadstico. Llamada en algunas obras: la docimasia
estadstica. Cuando una conclusin se valida con un test estadstico se la llama de tipo
cuantitativo, en caso contrario la decisin adoptada es de tipo cualitativo, o sea, una decisin
tomada en forma subjetiva. El mtodo consiste en definir una probabilidad de aceptacin del
orden del 95% (o rechazo) de una hiptesis de trabajo planteada, que permite calcular los
valores crticos (o lmites de aceptacin) de un estadgrafo calculado a partir de los valores
medidos. La importancia de este tema es muy grande. Basta decir que el objeto final de la
Estadstica es la toma de decisiones
Hiptesis estadstica es una suposicin hecha con respecto a la funcin de
distribucin de una variable aleatoria.

Las pruebas que se realizan para plantear las hiptesis se conocen con el nombre de
ensayos de validacin estadstica. El problema bsico es determinar si las diferencias
observadas entre el valor obtenido y el valor esperado se deben al azar, o si realmente son
diferentes.
Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido
utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters
se centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae
en decir si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de
manera formal como

H 0 ; = 50 cm / s
H 1 ; 50 cm / s
La proposicin Ho; = 50 cm/s, se conoce como hiptesis nula, mientras que la
proposicin H1; 50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la
hiptesis alternativa especifica valores de que pueden ser mayores o menores que 50

196

UNIDAD IV / ESTADISTICA APLICADA.

cm/s, tambin se conoce como hiptesis alternativa bilateral. En algunas situaciones, lo


que se desea es formular una hiptesis alternativa unilateral, como en
Ho; = 50 cm/s

Ho; = 50 cm/s

H1; < 50 cm/s

H1; > 50 cm/s

Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres
maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso,
entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha
cambiado el valor del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora
o modelo.
3.

Cuando el valor del parmetro proviene de consideraciones externas, tales como


las especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de
las especificaciones.

Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el
nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del
empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si
esta informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin
embargo si esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa.
Debe hacerse hincapi en que la verdad o falsedad de una hiptesis en particular nunca
puede conocerse con certidumbre, a menos que pueda examinarse a toda la poblacin.
Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es necesario
desarrollar un procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad de
llegar a una conclusin equivocada. La hiptesis nula, representada por Ho, es la
afirmacin sobre una o ms caractersticas de poblaciones que al inicio se supone cierta (es

197

UNIDAD IV / ESTADISTICA APLICADA.

decir, la creencia a priori). La hiptesis alternativa, representada por H1, es la afirmacin


contradictoria a Ho, y sta es la hiptesis del investigador.
La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia
muestral sugiere que es falsa. Si la muestra no contradice decididamente a Ho, se contina
creyendo en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un
anlisis por prueba de hiptesis son rechazar Ho o no rechazar Ho.
Para establecer la verdad o falsedad de una hiptesis estadstica con certeza total, ser
necesario examinar toda la poblacin. En la mayora de las situaciones reales no es posible
o practico efectuar este examen, y el camino ms aconsejable es tomar una muestra
aleatoria de la poblacin y con base a ella decidir si la hiptesis es verdadera o falsa.
En la prueba de una hiptesis estadstica, es costumbre declarar la hiptesis como
verdadera si la probabilidad calculada excede el valor tabular llamado el nivel de
significacin y se declara falsa si la probabilidad calculada es menor que el valor tabular. La
prueba a realizar depender del tamao de las muestras de la homogeneidad de las
varianzas y de la dependencia o no de las variables.

Prueba de una Hiptesis Estadstica


Para ilustrar los conceptos generales, considere el problema de la rapidez de combustin del
agente propulsor presentado con anterioridad. La hiptesis nula es que la rapidez promedio
de combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es igual a 50
cm/s. Esto es, se desea probar:

H 0 ; = 50 cm / s
H 1 ; 50 cm / s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se
observa cual es la rapidez de combustin promedio muestral. La media muestral es un
estimador de la media verdadera de la poblacin. Un valor de la media muestral x que este
prximo al valor hipottico = 50 cm/s es una evidencia de que el verdadero valor de la
media m es realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis nula Ho. Por otra
parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la
hiptesis alternativa H1. Por tanto, en este caso, la media muestral es el estadstico de
prueba.

198

UNIDAD IV / ESTADISTICA APLICADA.

La media muestral puede tomar muchos valores diferentes. Supngase que si


48.5 x 51.5, entonces no se rechaza la hiptesis nula Ho; = 50 cm/s, y que si

x <48.5 x > 51.5, entonces se acepta la hiptesis alternativa H1; 50 cm/s. Los
valores de x que son menores que 48.5 o mayores que 51.5 constituyen la regin crtica de
la prueba, mientras que todos los valores que estn en el intervalo 48.5 x 51.5 forman la
regin de aceptacin. Las fronteras entre las regiones crticas y de aceptacin reciben el
nombre de valores crticos. La costumbre es establecer conclusiones con respecto a la
hiptesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en
la regin crtica, de lo contrario, no se rechaza Ho.
Contrastes de hiptesis y significacin o reglas de decisiones:
Si suponemos que una hiptesis particular es cierta pero vemos que los resultados hallados
en una muestra aleatoria difieren notablemente de los esperados bajo tal hiptesis entonces
diremos que las diferencias observadas son significativas y nos veramos inclinados a
rechazar la hiptesis.
Los procedimientos que nos capacitan para determinar si las muestras observadas difieren
significativamente de los resultados esperados y por tanto nos ayuda a decidir si aceptamos
o rechazamos hiptesis, se llama contraste (o tests) de hiptesis o de significacin o reglas
de decisin.

Nivel de significacin.
Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuestos a
correr el riesgo de cometer un error tipo I se llama nivel de significacin del contraste. Esta
probabilidad se denota a menudo por , se suele especificar antes de tomar una muestra, de
manera que los resultados obtenidos no influyan a nuestra eleccin.
Es frecuente un nivel de significacin de 0.05 o 0.01, si bien se usan otros valores si por
ejemplo, se escoge el nivel de significacin 0.05 (o 5 %) al disear una regla de decisiones
entonces hay 5 oportunidades entre 100 de rechazar la hiptesis cuando debiera haberse
aceptado; es decir, tenemos un 95 % de confianza de que hemos adoptado la decisin
correcta y por lo tanto tiene una probabilidad de 0.05 de ser falsa.

Tipos de Ensayo (Contrastes de una y de dos colas).


Se pueden presentar tres tipos de ensayo de hiptesis que son:

199

UNIDAD IV / ESTADISTICA APLICADA.

Bilateral

Unilateral Derecho

Unilateral Izquierdo

En el test precedente estbamos interesados en los valores extremos del estadstico S o en


su correspondiente valor de Z a ambos lados de la media (o sea en las dos colas de la
distribucin) tales test se llaman contraste de dos colas o bilaterales.
Con frecuencia, no obstante, estaremos interesados tan solo en valores extremos aun lado
de la media (o sea, en una de las colas de la distribucin), tal como sucede cuando se
contrasta la hiptesis de que un proceso es mejor que el otro (lo cual no es lo mismo que
contrastar si un proceso es mejor o peor que el otro). Tales contrastes se llaman unilaterales
o de una cola. En tales situaciones, la regin crtica es una regin situada a un lado de la
distribucin, con rea igual al nivel de significacin. Tabla de valores crticos de z para
contrastes de una o de dos colas en varios niveles de significacin.
Nivel de significancia ,

Valores criticos z,

Valores

para tests unilateral

para tests bilateral

0.10

-1.28 o 1.28

-1.645 y 1.645

0.05

-1.645 0 1.645

-1.96 y 1.96

0.01

-2.33 o 2.33

-2.58 y 2.58

0.005

-2.58 0 2.58

-2.81 y 2.81

0.002

-2.88 o 2.88

-3.08 y 3.08

Bilateral

criticos

z,

Unilateral Derecho

200

UNIDAD IV / ESTADISTICA APLICADA.

Unilateral Izquierdo

Uso de valores P para la toma de decisiones


Al probar hiptesis en las que la estadstica de prueba es discreta, la regin crtica se puede
elegir de forma arbitraria y determinar su tamao. Si

es demasiado grande, se puede

reducir al hacer un ajuste en el valor crtico. Puede ser necesario aumentar el tamao de la
muestra para compensar la disminucin que ocurre de manera automtica en la potencia de
la prueba (probabilidad de rechazar Ho dado que una alternativa especfica es verdadera).
Por generaciones enteras de anlisis estadstico, se ha hecho costumbre elegir un nivel de
significancia de 0.05 0.01 y seleccionar la regin crtica en consecuencia. Entonces, por
supuesto, el rechazo o no rechazo estricto de Ho depender de esa regin crtica. En la
estadstica aplicada los usuarios han adoptado de forma extensa la aproximacin del valor
P. La aproximacin se disea para dar al usuario una alternativa a la simple conclusin de
rechazo o no rechazo.
La aproximacin del valor P como ayuda en la toma de decisiones es bastante natural pues
casi todos los paquetes de computadora que proporcionan el clculo de prueba de hiptesis
entregan valores de P junto con valores de la estadstica de la prueba apropiada.

Un valor P es el nivel (de significancia) ms bajo en el que el valor observado de la


estadstica de prueba es significativo.

El valor P es el nivel de significancia ms pequeo que conduce al rechazo de la


hiptesis nula Ho.

El valor P es el mnimo nivel de significancia en el cual Ho sera rechazada cuando


se utiliza un procedimiento de prueba especificado con un conjunto dado de
informacin. Una vez que el valor de P se haya determinado, la conclusin en
cualquier nivel particular resulta de comparar el valor P con :

201

UNIDAD IV / ESTADISTICA APLICADA.

1. Valor P rechazar Ho al nivel .


2. Valor P > No rechazar Ho al nivel .

Errores de tipo I y de tipo II


Si rechazamos una hiptesis cuando debiera ser aceptada diremos que se ha cometido un
error de tipo I, la probabilidad de cometer un error tipo I se denota por el smbolo

. Por

otra parte, si aceptamos una hiptesis que debiera ser rechazada, diremos que se ha
cometido un error de tipo II, la probabilidad de cometer un error tipo II se denota por el
smbolo

. En ambos casos se ha producido un juicio errneo.


Decisin

Ho es verdadera

Ho es falsa

Aceptar Ho

No hay error

Error tipo II

Rechazar Ho

Error tipo I

No hay error

202

UNIDAD IV / ESTADISTICA APLICADA.

1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de


uno por lo general tiene como resultado un aumento en la probabilidad del otro.
2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I,
siempre se puede reducir al ajustar el o los valores crticos.
3. Un aumento en el tamao muestral n reducir y de forma simultnea.
4. Si la hiptesis nula es falsa, es un mximo cuando el valor real del parmetro se
aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor
hipottico, ser menor .
Pasos para establecer un ensayo de hiptesis independientemente de la distribucin que se
est tratando:
1.

Interpretar correctamente hacia que distribucin muestral se ajustan los datos del

enunciado.
2.

Interpretar correctamente los datos del enunciado diferenciando los parmetros de los

estadsticos. As mismo se debe determinar en este punto informacin implcita como el tipo
de muestreo y si la poblacin es finita o infinita.
3.

Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del

problema. El ensayo de hiptesis est en funcin de parmetros ya que se quiere evaluar el


universo de donde proviene la muestra. En este punto se determina el tipo de ensayo
(unilateral o bilateral).
4.

Establecer la regla de decisin. Esta se puede establecer en funcin del valor crtico, el

cual se obtiene dependiendo del valor de

(Error tipo I o nivel de significancia) o en

funcin del estadstico lmite de la distribucin muestral. Cada una de las hiptesis deber
ser argumentada correctamente para tomar la decisin, la cual estar en funcin de la
hiptesis nula o Ho.
5.

Calcular el estadstico real, y situarlo para tomar la decisin.

6.

Justificar la toma de decisin y concluir.

4.3.1 Prueba de hiptesis para la media poblacional.


Z=

203

UNIDAD IV / ESTADISTICA APLICADA.

Problema: Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao


pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar
poblacional de 8.9 aos, esto parece indicar que la vida media de hoy en da es mayor que
70 aos? Utilice un nivel de significancia de 0.05
Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:

= 70
= 8.9
x = 71.8
n = 100

= 0.05
3. Ho : = 70 aos
H1 : > 70 aos

4. Regin critica o regla de decisin


Si Z R 1.645 no se rechaza Ho.
Si Z R > 1.645 se rechaza Ho y se acepta H 1.
5. Clculos:

Z =

x 0

71 . 8 70
= 2 .02
89
100

6. Justificacin y decisin:
Como 2.02 > 1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la
vida media hoy en da es mayor que 70 aos.

204

UNIDAD IV / ESTADISTICA APLICADA.

Problema: Una empresa elctrica fabrica focos que tienen una duracin que se distribuye de
forma aproximadamente normal con una media de 800 horas y una desviacin estndar de
40 horas. Si una muestra aleatoria de 30 focos tiene una duracin promedio de 788 horas,
muestran los datos suficiente evidencia para decir que la duracin media ha cambiado?
Utilice un nivel de significancia del 0.04.
Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:

= 800 horas

= 40 horas
x = 788 horas
n = 30

= 0.04

3. Ensayo de hiptesis
Ho;

= 800 horas

H1;

1 800 horas

4. Regla de Decisin:
Si 2.052 ZR 2.052 No se rechaza Ho
Si ZR < -2.052 si ZR > 2.052 Se rechaza Ho
5. Clculos:

Z=

x 0

788 800
= 1 .643
40
30

205

UNIDAD IV / ESTADISTICA APLICADA.

6.Justificacin y decisin:
2.052 -1.643 2.052 por lo tanto, no se rechaza Ho y se concluye con un nivel de
significancia del 0.04 que la duracin media de los focos no ha cambiado.
Problema: Un fabricante de equipo deportivo desarrolla un nuevo sedal sinttico que afirma
tiene una resistencia media a la tensin de ocho kilogramos con una desviacin estndar de
0.5 Kg. Pruebe la hiptesis = 8 Kg. Contra la alternativa 8 Kg. si se prueba una
muestra aleatoria de 50 sedales y se encuentra que tiene una resistencia media a la tensin
de 7.78 Kg. utilice un nivel de significancia de 0.01
Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:

= 8 Kg.

= 0.5 Kg.
x = 7.8 Kg.
n = 50

= 0.01

3. Ho : = 8 Kg.
H1 :
4.

8 Kg.

Regla de Decisin:

Si 2.58 ZR 2. 58 No se rechaza Ho
Si ZR < -2.58 si ZR > 2.58 Se rechaza Ho
5. Clculos:

Z =

x 0

n
6.

7 .8 8 .0
= 2 . 83
0 .5
50

Justificacin y decisin:

206

UNIDAD IV / ESTADISTICA APLICADA.

Como Si 2.83 < -2.58 por lo tanto, se rechaza Ho y se concluye que la resistencia
promedio a la tensin no es igual a 8 Kg. sino que, de hecho, es menor que 8 Kg. con un
nivel de significancia del 0.01 .
Problema: Una muestra aleatoria de 64 bolsas de palomitas de maz pesan, en promedio
5.23 onzas con una desviacin estndar de 0.24 onzas. Pruebe la hiptesis de que

= 5.5

onzas contra al hiptesis alternativa, < 5.5 onzas en el nivel de significancia de 0.05.
Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar
desconocida, pero como el tamao de muestra es mayor a 30 se puede tomar la
desviacin muestral como un estimador puntual para la poblacional.
2. Datos:
= 5.5 onzas
= 0.24 onzas
x = 5.23 onzas
n = 64
a = 0.05
3. Ensayo de hiptesis
Ho;

= 5.5 onzas

H1;

< 5.5 onzas

4. Regla de decisin:
Si ZR

-1.645 No se rechaza Ho

Si ZR < -1.645 Se rechaza Ho


5. Clculos:

207

UNIDAD IV / ESTADISTICA APLICADA.

Z=

x 0

5 .25 5 .5
= 9
0 .24

64

6. Justificacin y decisin:
Como 9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de significancia del
0.05 que las bolsas de palomitas pesan en promedio menos de 5.5 onzas.
Problema: La duracin media de una muestra de 100 tubos fluorescentes producidos por
una compaa resulta ser 1570 hrs. Con una desviacin tpica de 120 hrs. Si es la duracin
media de todos los tubos producidos por la compaa, comprobar la hiptesis = 1600 hrs.
Contra la hiptesis alternativa 1600 hrs. Con un nivel de significancia de (a) 0.05 y (b)
0.01
Solucin:
a)
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:
= 0.05
n = 100
x = 1570
= 120 hrs.
3. Ensayo de hipotesis
H0 : = 1600 hrs.
H1 : 1600 hrs.
4. Regla de decisin
Si 1.96 ZR 1.96 No se rechaza Ho
Si ZR < -1.96 si ZR > 1.96 Se rechaza Ho
5. Clculos

208

UNIDAD IV / ESTADISTICA APLICADA.

Z=

1570 1600
= 2.50
120
100

6. Justificacin y decisin
Como Si 2.50 < -1.96 por lo tanto, se rechaza Ho y se concluye que La duracin media
de una muestra de 100 tubos fluorescentes producidos por una compaa no resulta ser
1570 hrs., sino que, de hecho , es menor que 1570 hrs. con nivel de significancia del
0.05 que la duracin media de todos los tubos producidos por la compaa no ha
cambiado.
b)
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:
= 0.01
n = 100
x = 1570
= 120 hrs.
3. Ensayo de hipotesis
H0 : = 1600 hrs.
H1 : 1600 hrs.
4. Regla de decisin
Si 2.58 ZR 2.58 No se rechaza Ho
Si ZR < -2.58 si ZR > 2.58 Se rechaza Ho
5. Clculos

Z=

1570 1600
= 2.50
120
100

6. Justificacin y decisin
Como Si 2.58 -2.50 2.58 como se encuentra dentro de este rango, se acepta Ho (o no
se toma ninguna decisin) al nivel de significacin del 0.01

209

UNIDAD IV / ESTADISTICA APLICADA.

Problema: La resistencia a la rotura de los cables producidos por un fabricante tiene una
media de 1800 libras y una desviacin tpica de 100 libras. Mediante una nueva tcnica en el
proceso de fabricacin se aspira a una resistencia pueda ser incrementada. Para ensayar
esta aspiracin, se ensaya una muestra de 50 cables y se encuentra que su resistencia
media es de 1850 libras. Puede mantenerse que, en efecto, hay un aumento de resistencia
al nivel de significacin del 0.01?
Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:
= 0.01
n = 50
x = 1850 lbs
= 100 lbs
3. Ensayo de hipotesis
H0 : = 1800 lbs
H1 : > 1800 lbs.
4. Regla de decisin
Si ZR 2..33 No se rechaza Ho
Si ZR > 2.33 Se rechaza Ho
5. Clculos
Z =

1850

1800
100
50

= 3 . 54

6. Justificacin y decisin
Como Si 3.54 > 2.33 por lo tanto, se rechaza Ho y se acepta H

1,

por lo tanto se

concluye que su resistencia media no es de 1850 libras si no que mayor.


Problema: Se ha estudiado la tasa de quemado de un propulsor a chorro. Las
especificaciones requieren que la tasa media de quemado sea 40 cm/s. Adems, supngase
que sabemos que la desviacin estndar de la tasa de quemado es aproximadamente de 2

210

UNIDAD IV / ESTADISTICA APLICADA.

cm/ s. El experimentador decide especificar una probabilidad de error tipo I

= 0.05 , y el

basara la prueba en una muestra aleatoria de tamao n = 25. Pruebe la hiptesis de

= 40cm / s

40com / s .

Si se prueban veinticinco especmenes, y la tasa de

quemado media de muestra que se obtiene es

x = 41.25cm / s

1. Se trata de una distribucin mustrales de medias con desviacin estndar


conocida.
2. datos:

x = 41.25cm / s
= 40cm / s
= 2cm / s
n = 25

= 0.05
3. Ensayo de hiptesis

H 0 : = 40cm / s
H1 : 40cm / s
4. regla de decisin
-1.96 Z 1.96 se acepta H0
Z<-1.96 Z>1.96 se acepta H1
5. clculos

Z=

x 0

41.25 40
= 3.13
2
25

6. justificacin y decisin
3.13 >1.96 se acepta H1 y se concluye que la tasa de quemado media no es igual a
40 cm/s, sino que mas de 40 cm/s.

Varianza desconocida.
Las variables aleatorias X1, X2, ... X

representan una muestra aleatoria de una distribucin

normal con y desconocidas. Entonces la variable aleatoria

n( x )
tiene una
s

distribucin t de student con n 1 grados de libertad.

211

UNIDAD IV / ESTADISTICA APLICADA.

La estructura de la prueba es idntica a la del caso con conocida, con la excepcin de que
el valor en la estadstica de prueba se reemplaza por la estimacin de S calculada y la
distribucin normal estndar se reemplaza con una distribucin . Como resultado; para la
hiptesis bilateral
Ho : = o
Hi : o
El rechazo de Ho en un nivel de significancia resulta cuando una estadstica calculada.

t=

x 0
s
n

Problema: Los cientficos han citado al benceno, un disolvente qumico de uso comn en la
sntesis de plsticos, como un posible agente causante de cncer. Ciertos estudios han
demostrado que las personas que trabajan con benceno durante mas de cinco aos tienen
una incidencia de leucemia 20 veces mayor que la poblacin en general. En consecuencia,
el gobierno federal estadounidense ha bajado el nivel mximo permisible de benceno en
lugar de trabajo de 10 partes por milln (ppm) a 1 ppm ( informacin en el Florida Times
Union, 2 de abril de 1984). Suponga que una fabrica de artculos de acero, que expone a sus
trabajadores diariamente a benceno, esta siendo investigada por la Administracin de
Seguridad y Salud Ocupacional (OSHA) de Estados Unidos. Se examinan 20 muestras de
aire, tomada durante un periodo de un mes, parar determinar el contenido de benceno. Los
anlisis produjeron las siguientes estadsticas resumidas:

x = 2.1 ppm s = 1.7 ppm


La fabrica de artculos de acero esta violando las nuevas normas del gobierno? Pruebe la
hiptesis de que el nivel medio de benceno en la planta es mayor que 1 ppm ., utilizando

= 0.05
Solucin:
1. se trata de una distribucin muestral de medias con varianza desconocida.
2. datos:

212

UNIDAD IV / ESTADISTICA APLICADA.

x = 2.1 ppm
s = 1.7 ppm
n = 20
= 1 ppm

= 0.05
3. Ensayo de hiptesis
H0:

=1

H1:

>1

4. Regla de decisin :

t > 1.729 se acepta H1 y se rechaza H0


-1.729 se acepta H0 y se rechaza H1

t
5.

clculos :

t=

x 0
s
n

Supuesto: La distribucin de frecuencia relativa de la poblacin de niveles de benceno


para todas las muestras de aire tomadas en la planta de fabricacin de artculos de
acero es aproximadamente normal.
Regin de rechazo: para

t=

= 0.05 y gl = (n l) = 19, se rechazara H0 si t > t 0.05 = 1.729

2.1 1
x 0
=
= 2.89
s
1.7
n
20

6. justificacin y decisin.
2.89

> 1.729 se acepta H1 y se rechaza H0 . se llega a la conclusin de que la

planta esta violando las nuevas normas gubernamentales .


Problema: La resistencia al rompimiento de una fibra textil es una variable aleatoria
distribuida normalmente. Las especificaciones requieren que la resistencia media al
rompimiento deba igualar el valor de 15 psi. Al fabricante le gustara detectar cualquier
desviacin significativa respecto a este valor. En consecuencia se desea probar

= 150 psi

150 psi .

Con un nivel de significancia de

= 0.05 .

Si una muestra

213

UNIDAD IV / ESTADISTICA APLICADA.

aleatoria de 15 especimenes de prueba se selecciona y se determinan sus resistencias al


rompimiento. La media y la varianza de la muestra se calculan a partir de los datos de la
misma como

x = 152.18 y s 2 = 16.63 .

1. se trata de una distribucin muestral de medias con varianza desconocida.


2. datos:

x = 152.18
s 2 = 16.63
n = 15

= 150
= 0.05
3. Ensayo de hiptesis

H 0 : = 150
H1 : 150
por ser bilateral

= 0.05

0.05
= 0.025
2

t0.025, (15 1) = 2.145

t0.025 , (15 1) = 2.145

4. regla de decisin

2.145 t 2.145 se acepta H0


t < 2.145 t > 2.145 se acepta H1
5. Clculos

t=

x 152.18 150
= 2.07
=
s
16.63
n
15

6. justificacin y decisin

2.145 2.07 2.145 se acepta H0 y concluiramos que no hay evidencia suficiente


para rechazar la hiptesis de que

= 150 psi

214

UNIDAD IV / ESTADISTICA APLICADA.

4.3.2 Prueba de hiptesis para diferencias de medias.


Problema: Un diseador de productos est interesado en reducir el tiempo de secado de
una pintura tapaporos. Se prueban dos frmulas de pintura; la frmula 1 tiene el contenido
qumico estndar, y la frmula 2 tiene un nuevo ingrediente secante que debe reducir el
tiempo de secado. De la experiencia se sabe que la desviacin estndar del tiempo de
secado es ocho minutos, y esta variabilidad inherente no debe verse afectada por la adicin
del nuevo ingrediente. Se pintan diez especmenes con la frmula 1, y otros diez con la
frmula 2. Los dos tiempos promedio de secado mustrales son 121 min. y 112 min.
Respectivamente. A qu conclusiones puede llegar el diseador del producto sobre la
eficacia del nuevo ingrediente, utilizando = 0.05?
Solucin:
1.

Se trata de una distribucin muestral de diferencias de medias

2.

Datos:

1 = 2 = 8
x1 = 121min
x2 = 112 min
n1 = n2 = 10

= 0.05
3.

Ensayo de hiptesis

H 0 : 1 2 = 0
H1 : 1 2 > 0

4.

Regla de decisin

Z 1.645 se acepta H 0
Z > 1.645 se acepta H1
5.

Clculos

215

UNIDAD IV / ESTADISTICA APLICADA.

Z=

6.

(121 112) 0
82 82
+
10 10

= 2.52

Justificacin y decisin

Puesto que 2.52 > 1.645, se acepta H1, y se concluye con un nivel de significancia de 0.05
que la adicin del nuevo ingrediente a la pintura si disminuye de manera significativa el
tiempo promedio se secado.
Problema: Se utiliza dos mquinas para llenar botellas de plstico con un volumen neto de
16.0 onzas. Las distribuciones de los volmenes de llenado pueden suponerse normales,
con desviaciones estndar de 0.020 y 0.025 onzas. Un miembro del grupo de ingeniera de
calidad sospecha que el volumen neto de llenado de ambas mquinas es el mismo, sin
importar si este es o no de 16 onzas. De cada mquina se toma una muestra aleatoria de 10
botellas.
Se encuentra el ingeniero en lo correcto?
Utilice un nivel de significancia de 0.05.
MAQUINA 1

MAQUINA 2

16.03

16.01

16.02

16.03

16.04

15.96

15.97

16.04

16.05

15.98

15.96

16.02

16.05

16.02

16.01

16.01

16.02

15.99

15.99

16.00

Solucin:
1.

Se trata de una distribucin muestral de diferencias de medias

2.

Datos:

1 = 0.020; 2 = 0.025
x1 = 16.015; x2 = 16.005
n1 = n2 = 10; = 0.05
3. Ensayo de hiptesis

216

UNIDAD IV / ESTADISTICA APLICADA.

H 0 : 1 2 = 0
H1 : 1 2 0

4.

Regla de decisin

1.96 Z 1.96 se acepta H 0


Z < 1.96 o Z > 1.96 se acepta H1
5. Clculos

Z=

(16.015 16.005) 0
(0.020) 2 (0.025) 2
+
10
10

= 0.987

6. Justificacin y decisin
Puesto que

1.96 Z 1.96 , se acepta H0, y se concluye con un nivel de significancia de

0.05 que las dos mquinas tienen el mismo promedio de llenado.


Problema: Existen dos tipos de plasticos apropiados para su uso por un fabricante de
componentes electrnicos. La tensin de ruptura de es plstico es un parmetro importante.
Se sabe que la desviacin estandar es de 1.0 Psi. De una muestra aleatoria de tamao 10 y
12 para cada plstico respectivamente. Se tiene ua media de 162.5 para el plastico 1 y de 155
para el plastico 2. La compaa no adoptara el plastico 1 a menos que la tensin de ruptura de
este exceda a la del plastico 2 al menos por 10 Psi. Con base a la informacin contenidad en
la muestra. La compaa debera utilizar el plastico 1?. Utilice un nivel de significancia de 0.05
para llegar a una decisin.
Solucin:
1.

Se trata de una distribucin muestral de diferencias de medias

217

UNIDAD IV / ESTADISTICA APLICADA.

2.

Datos:

1 = 2 = 1.0 psi
x1 = 162.5 psi
x2 = 155 psi
n1 = 10
n2 = 12

= 0.05
3.

Ensayo de hiptesis

H 0 : 1 2 = 10
H1 : 1 2 > 10

4. Regla de decisin

Z 1.645 se acepta H 0
Z > 1.645 se acepta H1
5. Clculos

Z=

(162.5 155) 10
(1) 2 (1) 2
+
10 12

= 5.83

.
6. Justificacin y decisin
No existe evidencia suficiente para apoyar el uso del plstico 1 ya que

5.83 1.645 , se

acepta H0.

218

UNIDAD IV / ESTADISTICA APLICADA.

Problema: La gerente de planta de una fbrica enlatadora de jugo de naranja est interesada
en comprar el rendimiento de dos diferentes lneas de produccin. Como la lnea nmero 1
es relativamente nueva, sospecha que el nmero de cajas que se producen al da es mayor
que el correspondiente a la vieja lnea 2. se toman datos al azar durante diez das para cada
lnea, encontrndose que

x1 = 824.9cajas por da y x2 = 818.6 cajas por da. De la

experiencia con la operacin de este tipo de equipo se sabe qu

12 = 40

22 = 50. con

un nivele de significancia de 0.05


Solucin:
1. se trata de una distribucin muestral de diferencias de medias.
2. datos:

x1 = 824.9cajas ; x2 = 818.6

12 = 40 ; 22 = 50.
n1 = n2 = 10 ; = 0.05
3. ensayo de hiptesis

H 0 : 1 = 2
H1 : 1 > 2
4. regla de decisin
Z > 1.645 se acepta H1
Z -1.645 se acepta H0
5. Clculos
Z

6.

(824.9 818.6) 0
= 2.10
40 50
+
10 10
justificacin y decisin

219

UNIDAD IV / ESTADISTICA APLICADA.

2.10 > 1.645 se acepta H1. se concluye que el numero medio de cajas producidas
diariamente por la nueva lnea de produccin es mayor que el numero medio de caja
producidas por la vieja lnea.

4.3.3 Prueba de hiptesis para proporciones.


Problema: Un constructor afirma que se instalan bombas de calor en 70% de todas las
casas que se construyen hoy en da en la ciudad de Richmond. Estara de acuerdo con
esta afirmacin si una investigacin de casas nuevas en esta ciudad muestra que 8 de 15
tienen instaladas bombas de calor? Utilice un nivel de significancia de 0.10.
Solucin:
1. Se trata de una distribucin muestral de proporciones.
2. Datos:

P = 0.70
p = 8 / 15 = 0.5333
n = 15
= 0.10
3. Ensayo de hiptesis
Ho; P = 0.70
H1; P

0.70

4. Regla de Decisin:
Si 1.645 Z 1.645 No se rechaza Ho
Si ZR < -1.645 si ZR > 1.645 Se rechaza Ho
5. Clculos:

220

UNIDAD IV / ESTADISTICA APLICADA.

Z=

0.533 0.70
pP
=
= 1.41
Pq
(0.70)(0.30)
n
15

6. Justificacin y decisin :
Como 1.645 -1.41 1.645 No se rechaza Ho y se concluye con un nivel de significancia
de 0.10 que la afirmacin del constructor es cierta.
Problema: El fabricante de una patente mdica sostiene que la misma tiene un 90 % de
efectividad en el alivio de una alergia, por un periodo de 8 hrs. En una muestra de 200
individuos que tenan la alergia, la medicina suministrada alivio a 160 personas. Determinar
si la aseveracin del fabricante es cierta. El nivel de significancia es 0.01
Solucin:
1. Se trata de una distribucin muestral de proporciones.
2. Datos:

P = 0.90
p = 160 / 200 = 0.8
n = 200

= 0.01
3. Ensayo de hiptesis
H0 : p = 0.9
H1 : p < 0.9
4. Regla de decisin
Z < -2.33 se acepta H1 y se rechaza H0
Z -2.33 se acepta H0
5. Clculos

221

UNIDAD IV / ESTADISTICA APLICADA.

Z=

pP
=
Pq
n

0.8 0.90
= 4.71
(0.90)(0.10)
200

6. justificacin y decisin
- 4.71 < - 2.33 se acepta H1 y se rechaza H0 . se concluye que es menor al 90 % de
efectividad
Problema: Un fabricante de semiconductores produce controladores que se emplean en
aplicaciones de motores automovilsticos. El cliente requiere que la fraccin de controladores
defectuosos en uno de los pasos de manufactura crticos no sea mayor que 0.05, y que el
fabricante demuestre esta caracterstica del proceso de fabricacin con este nivel de calidad,
utilizando =0.05. El fabricante de semiconductores toma una muestra aleatoria de 200
dispositivos y encuentra que cuatro de ellos son defectuosos. El fabricante puede
demostrar al cliente la calidad del proceso?
Solucin:
1. Se trata de una distribucin muestral de proporciones.
2. Datos:
P = 0.05
p = 4/200 = 0.02
n = 200
= 0.05
3. ensayo de hiptesis

H 0 : P = 0.05
H1 : P < 0.05

222

UNIDAD IV / ESTADISTICA APLICADA.

4. Regla de decisin:
Si ZR -1.645 No se rechaza Ho
Si ZR < -1.645 Se rechaza Ho
5. Clculos:

Z=

pP
=
Pq
n

0.02 0.05
= 1.946
(0.05)(0.95)
200

6. Justificacin y decisin:
Puesto que 1.946<-1.645, se rechaza Ho y se concluye con un nivel de significancia del
0.05 que la fraccin de artculos defectuosos es menor que 0.05.

4.3.4. Prueba de hiptesis para diferencia de proporciones.


Problema: Se evalan dos tipos diferentes de soluciones para pulir, para su posible uso en
una operacin de pulido en la fabricacin de lentes intraoculares utilizados en el ojo humano
despus de una ciruga de cataratas. Se pulen 300 lentes con la primera solucin y, de
stos, 253 no presentaron defectos inducidos por el pulido. Despus se pulen otros 300
lentes con la segunda solucin, de los cuales 196 resultan satisfactorios. Existe alguna
razn para creer que las dos soluciones para pulir son diferentes? Utilice = 0.01
Solucin:
1. Se trata de una distribucin muestral de diferencia de proporciones.
2. Datos:
p1= 253/300= 0.8433
p2 = 196/300= 0.6533
n1 = n2 = 300
3. Ensayo de hiptesis:
Ho; P1 = P2
H1; P1

P2

223

UNIDAD IV / ESTADISTICA APLICADA.

4. Regla de decision.

Si 2.575 z 2.575 se acepta Ho


Si Z < 2.575 o Z > 2.575 Se acepta H1
5. Clculos

P=

x1 + x2 253 + 196
=
= 0.7483
n1 + n2 300 + 300

P = P1 = P2 = 0.7483
q = 1 P = 0.2517

Z=

Z=

( p1 p2 ) ( P1 P2 )
1 1
Pq +
n1 n2
(0.8433 0.6533) 0
1
1
(0.7483)(0.2517)
+

300 300

= 5.36

6. Justificacin y decisin :
Puesto que 5.36 > 2.575 se rechaza la hiptesis nula y se concluye con un nivel de
significancia de 0.01 que los dos fluidos para pulir son diferentes.
Problema: Se tomar el voto entre los residentes de una ciudad y el condado
circundante para determinar si se debe construir una planta qumica propuesta. El lugar
de construccin est dentro de los lmites de la ciudad y por esta razn muchos votantes
del condado consideran que la propuesta pasar debido a la gran proporcin de
votantes que favorecen la construccin. Para determinar si hay una diferencia

224

UNIDAD IV / ESTADISTICA APLICADA.

significativa en la proporcin de votantes de la ciudad y votantes del condado que


favorecen la propuesta, se realiza una encuesta. Si 120 de 200 votantes de la ciudad
favorecen la propuesta y 240 de 500 residentes del condado tambin lo hacen.
Estara de acuerdo en que la proporcin de votantes de la ciudad que favorecen la
propuesta es ms alto que la proporcin?. Utilice un nivel de significancia de 0.025.
Solucin:
1. Se trata de una distribucin muestral de diferencia de proporciones.
2. Datos:
p1= 120/200 = 0.60; p2 = 240 / 500 = 0.48
n1 = 200; n2 = 500
3. Ensayo de hiptesis:
Ho; P1 = P2
H1; P1 > P2
4. Regla de decision.

Si Z 1.96 se acepta Ho
Si Z > 1.96 Se acepta H1
5. Clculos

P=

Z=

x1 + x2 120 + 240
=
= 0.48
n1 + n2 200 + 500

( p1 p2 ) ( P1 P2 )
1 1
Pq +
n1 n2

(0.60 0.48) 0
1
1
(0.51)(0.49)
+

200 500

= 2.9

6. Justificacin y decisin :
Puesto que 2.9 > 1.96 se acepta H1 y se concluye estar de acuerdo en que la proporcin
de votantes de la ciudad a favor de la propuesta es ms alta que la proporcin de
votantes del condado..

225

UNIDAD 5
REGRESION Y
CORRELACION.

Objetivo:
Comprender
correlacin

el
y

concepto
regresin,

de
los

expresar matemticamente y los


usar para tomar decisiones.

UNIDAD V / REGRESIN Y CORRELACIN.

5.1 Introduccin.
A menudo, en la prctica, se requiere resolver problemas que incluyen conjuntos de
variables

cuando se sabe que existen algunas relaciones inherentes entre ellas. Por

ejemplo, en una situacin industrial se puede saber que el contenido de alquitrn en el flujo
saliente de un proceso qumico se relaciona con la temperatura de entrada. Ya que una de
las aplicaciones ms importantes de la estadstica implica la estimacin del valor medio de
una variable de respuesta y o la prediccin de algn valor futuro y con base en el
conocimiento de un conjunto de variables independientes relacionadas,

x1 , x2 ,..., xk .

5.1.1 Grficas de los datos.


En la grafica de los datos es la interpretacin de la informacin que se ha recopilado a travs
de un experimento en la cual consiste en la comparacin por pares de datos y solo marca
cada dato a travs de puntos.

Problema: El calor especifico Cp (cal / kgmol ) del

Mn3O4 vara

con la temperatura de

acuerdo a la siguiente tabla:


Punto

T ( K)

Cp

280

32.7

650

45.4

1000

52.15

1200

53.7

1500

52.9

1700

50.3

Elabore la grafica de los datos que muestra la tabla.


Grafica de datos
Calor especifico

60
40
20
0
0

500

1000
Temperatura

1500

2000

217

UNIDAD V / REGRESIN Y CORRELACIN.

5.1.2 Variables de regresin independientes.


Una de las aplicaciones ms importantes de la estadstica implica la estimacin del valor
medio de una variable de respuesta y o la prediccin de algn valor futuro de y con base
en el conocimiento de un conjunto de variables independientes relacionadas x1 , x2 ,..., xk .

Por ejemplo, el gerente de un centro de procesamiento de datos podra querer relacionar el


tiempo de espera

y (la variable dependiente) entre el momento en que se presenta un

trabajo a una computadora y el momento en que se completa, con variables tales como el
numero y el tamao de los trabajos que ya estn esperando para ejecutarse y el tamao de
los trabajos que se estn presentando ( las variables independientes). El objetivo sera
crear una ecuacin de prediccin (o un modelo) que exprese y como una funcin de las
variables independientes. Esto permitira la gerente predecir y para valores especficos de
las variables independientes y, en ltima instancia, utilizar los conocimientos derivados de un
estudio de la ecuacin de prediccin para instaurar polticas de control del tiempo de espera.
Los modelos que se emplean para relacionar una variable dependiente y con las variables
independientes x1 , x2 ,..., xk se denominan modelos de regresin o modelos estadsticos
lineales porque expresan el valor medio de y para valores dados de x1 , x2 ,..., xk como una
funcin lineal de un conjunto de parmetros desconocidos.

Definicin
La variable por predecir (o por modelar), y , es la variable dependiente (o de respuesta)

Definicin
Las variables que se utilizan para predecir (o modelar)

y se denominan variables

independiente y se denotan con los smbolos x1 , x2 , x3 , , etctera.

218

UNIDAD V / REGRESIN Y CORRELACIN.

5.1.3 Regresin lineal simple.


En el caso de

la regresin lineal simple donde hay una sola variable de regresin

independiente x y una sola variable Y, los datos se pueden representar mediante los pares
de observaciones

{(xi , yi );i = 1,2,...,n}.

El ejemplo ms simple de una aproximacin por mnimos cuadrados es el ajuste de una


lnea recta a un conjunto de parejas de datos observadas: ( x1 , y1 ) , ( x 2 , y 2 ) ,. . .

( xn , yn ) .

La expresin matemtica de una lnea recta es:

y = a0 + a1x +
En donde

a0

y a1 son coeficientes que representan la interseccin con el eje de las

abscisas y la pendiente, respectivamente y E es el error o residuo entre el modelo y las


observaciones, que se pueden representar reordenando la ecuacin como:

E = y a0 a1 x
Por lo tanto, el error o residuo es la diferencia entre el valor real de y y el valor aproximado

a0 + a1x , predicho por la ecuacin lineal.


y = a0 + a1 x

Ecuacin de la lnea recta

Entonces, podramos escoger un modelo que relacione a y con x trazando una lnea resta
a travs de los puntos de la figura. Semejante modelo deterministico

uno que no

contempla errores de prediccin podra ser adecuado si todos los puntos de la figura,
quedaran sobre la lnea ajustada. Sin embargo, es evidente que esta situacin ideal no
ocurre para los datos de la tabla. Sin importar como tracemos una lnea recta desviaran
significativamente de la lnea ajustada.

La solucin al problema anterior es construir un modelo probabilstico que relacione y con x;


uno que contemple la variacin aleatoria de los puntos de datos a los lados de una lnea
recta. Un tipo de modelo probabilstico, el modelo de regresin lineal simple, supone que
el valor medio de y para un valor dado de x se grafica como una lnea recta y que los puntos
se desvan de esta lnea de medias en una cantidad aleatoria (positiva o negativa) igual a

, es decir,

y = a0 + a1x +
219

UNIDAD V / REGRESIN Y CORRELACIN.

Donde

a0

y a1 son parmetros desconocidos de la porcin deterministico (no aleatoria) del

modelo. Si suponemos que los puntos se desvan por encima y por debajo de la lnea de
medias, siendo algunas desviaciones positivas, otras negativas, y con E ( ) = 0 entonces el
valor medio de y es

E( y) = E(a0 + a1 x + )
= a0 + a1 x + E( )
= a0 + a1 x
Por tanto, el valor medio de y para un valor dado de x, representado por el smbolo E (y), *
se grafica como una lnea recta con ordenada al origen igual a

La validez de las inferencias acerca de

a0y pendiente igual a a1 .

a0 y a1 depender de las distribuciones de muestreo

de los estimadores, que a su vez dependen de la distribucin de probabilidad del error


aleatorio,

; por tanto, primero debemos hacer supuestos especficos respecto a . Tales

supuestos, que se resumirn a continuacin, son bsicos para todo anlisis de regresin
estadstico.

Lneas de regresin ajustada.


Supuesto I: La media de la distribucin de probabilidad de

es 0. Es decir, la media de los

errores a lo largo de una serie infinitamente larga de experimentos es 0 para cada valor de la
variable independiente x. Este supuesto implica que el valor medio de y , E ( y ) , para un
valor dado de x es

E( y) = a0 + a1x
Supuesto II: La varianza de la distribucin de probabilidad de

es constante para todos los

valores de la variable independiente x. En el caso de nuestro modelo de lnea recta, este


supuesto significa que la varianza de

es igual a una constante, digamos , para todos


2

los valores de x.

Supuesto III: La distribucin de probabilidad de

es normal.

Supuesto IV: Los errores asociados a cualesquier dos observaciones distintas son

220

UNIDAD V / REGRESIN Y CORRELACIN.

independientes. Es decir, el error asociado a un valor de y en particular no tiene efecto


alguno sobre los errores asociados a otros valores de y .
Las implicaciones de los tres primeros supuestos pueden apreciarse en la figura siguiente,
que muestra las distribuciones de errores para tres valores especficos de x, a saber,

x1 , x2

y x3 .

Observe que las distribuciones de frecuencia relativa de los errores son normales, con una
media de 0 y una varianza constante de . La lnea recta de la figura es el valor medio y
2

para un valor dado de x,

En la prctica, los supuestos no tienen que cumplirse al pie de la letra para que los
estimadores de mnimos cuadrados y las estadsticas de prueba (que se describirn ms
adelante) tengan el grado de con fiabilidad que esperamos de un anlisis de regresin.

5.2. Diagrama de dispersin

5.2.1. Tabla de datos


Ejemplo: Supongamos que el inventor de un material aislante quiere determinar la magnitud
de la compresin que se producir en un espcimen de 2 pulgadas de espesor cuando se
someta a diferentes cantidades de presin. Se prueban cinco trozos experimentales del
material bajo diferentes presiones.

Los valores de x (en unidades de 10 libras por pulgada cuadrada) y las magnitudes de
compresin resultantes y (en unidades de 0.1 pulgada) se presentan en la tabla.

221

UNIDAD V / REGRESIN Y CORRELACIN.

Tabla Compresin vs. presin


para un material aislante
Espcimen Presin Compresin

X
1

5.2.2. Construccin de diagramas.

Comprensin

En la figura se muestra una grafica de los datos llamada diagrama de dispersin.

5
4
3
2
1
0
0

Presin

Supongamos que creemos que el valor de y tiende a aumentar de forma lineal conforme x
aumenta.

5.3. Estimacin mediante la lnea de regresin

5.3.1. Ecuacin de la recta como ajuste de datos


El mtodo ms simple de ajustar una curva a un conjunto de datos es el de trazar los puntos
y unirlos con una lnea recta. Aunque es una alternativa validad y se utiliza cuando se
requiere hacer estimaciones rpidas, los resultados son independientes, desde un punto de
vista subjetivo, de la persona que traza la recta.

222

UNIDAD V / REGRESIN Y CORRELACIN.

Para quitar esta dependencia se usa la regresin lineal o mnimos cuadrados.

Ecuacin de la lnea recta

y = a0 + a1 x
Polinomio de segundo grado o cuadrtico:

y = a0 + a1 x + a2 x 2 + e
Una extensin til en la regresin lineal es el caso en que y es una funcin lineal de dos o
ms variables. Por ejemplo, y pudiera ser una funcin lineal de x1 y x 2 , de la forma:

y = a0 + a1 x1 + a2 x2
5.3.2. Modelos
Algoritmo de la solucin
1. Inicio
2. Solicitud de los datos discretos ( tabla de datos encontrados experimentalmente) a
los cuales se le va a encontrar la recta que de aproxima mas a ellos.
3. Calcular con base a los datos dados el valor de n.

y
Encontrar la sumatoria x

4. encontrar la sumatoria
5.

xy
Encontrar la sumatoria de la potencia x

6. encontrar la sumatoria del producto


7.

8. Sustituir los valores encontrados en los pasos 3, 4, 5, 6, 7, en las ecuaciones del


mtodo de mnimos cuadrados.
9. Resolver el sistema de ecuaciones para encontrar a las constantes A y B
10. sustituir los valores de A y B en la ecuacin de la recta.
11. impresin de los resultados
12. Fin.

5.4. Mtodos de mnimos cuadrados.


El significado de mnimos cuadrados consiste en obtener la recta que ajuste a una serie de
datos numricos, con la condicin que la suma de los cuadrados de los residuos sea mnima
posible.

223

UNIDAD V / REGRESIN Y CORRELACIN.

a) Muestra de datos con un error significativo.


b) Ajuste polinomial con oscilaciones que violan el rango de datos.
c) Se obtienen resultados ms satisfactorios usando el ajuste de mnimos cuadrados.

Si queremos escoger la lnea recta "de mejor ajuste" para un conjunto de datos, debemos
estimar los parmetros desconocidos

a0

a1

del modelo de regresin lineal simple. Estos

estimadores podran obtenerse empleando el mtodo de mxima verosimilitud pero el


mtodo ms fcil y el ms atractivo desde un punto de vista intuitivo es el mtodo de
mnimos cuadrados. Cuando se satisfacen los supuestos de la seccin anterior, los
estimadores de mxima verosimilitud y de mnimos cuadrados de

a0 y a1 son idnticos.

5.4.1. Estimacin de los coeficientes de regresin


Ecuacin de la lnea recta (regresin lineal)

y = a0 + a1 x
a1 =

n xi y i xi y i
n xi2 ( xi )

a0 = y a1 x

224

UNIDAD
D V / REGR
RESIN Y CORREL
LACIN.

Problema: Ajstese una


a lnea recta a los valores x y y de la tabla siguien
nte:
i
1
2
3
4
5
6
7

X
1
2
3
4
5
6
7

y
0.5
2.5
2.0
4.0
3.5
6.0
5.5

Solucin:

Problema:

Las

bode
egas

mode
ernas

utiliza
an

vehculo
os

guiados

computariizados

ados para el manejo de materiales. En consecu


uencia, la disposicin fssica de la
automatiza
bodega debe disearse
e con cuidad
do a modo de
e evitar el co
ongestionamiento de los vehculos
d respuesta
a. En The Jo
oumal of En
ngineering fo
or industry (a
agosto de
y optimizarr el tiempo de
1993) se esstudi el dise
eo ptimo de
d una bodeg
ga automatizzada.

La disposiccin empleada supone que


q
los vehculos no se bloquean e
entre s cuan
ndo viajan
dentro de la
l bodega, es
e decir, que
e no hay con
ngestionamie
ento. La valid
dez de este supuesto
se verific
simulando (en una computadora
c
) las opera
aciones de la bodega. En cada
simulacin se vari el nmero
n
de vehculos
v
y se
s registr ell tiempo de ccongestionam
miento (el
tiempo tota
al que un ve
ehculo bloqu
ue a otro). Los datos se muestran en la siguie
ente tabla.
Algo que in
nteresa a loss investigado
ores es la re
elacin entre
e el tiempo d
de congestio
onamiento
(y) y el nm
mero de vehculos (x).

225

UNIDAD V / REGRESIN Y CORRELACIN.

Nmero de Tiempo de congestionamiento Nmero de Tiempo de congestionamiento


vehculos

en minutos

0.02

0.01

0.01

0.01

0.03

0.03

vehculos

en minutos

0.02

10

0.04

11

0.04

12

0.04

13

0.03

14

0.04

15

0.05

a) Construya un diagrama de dispersin para los datos.


b) Encuentre la lnea de mnimos cuadrados que relaciona el nmero de vehculos (x)
con el tiempo de congestionamiento (y).
c) Trace la lnea de mnimos cuadrados en la grfica del inciso a.

Solucin:
Tiempo de congestionamiento

0.06
0.05

y = 0.00319118x - 0.00400000

0.04
0.03
0.02
0.01
0
-0.01 0

10

15

20

Problema: En la tabla siguiente se presentan los alargamientos de un resorte


correspondientes a fuerzas de diferente magnitud que lo deforman.

Puntos

Fuerza (kgf) : x

0.120

0.153

0.170

0.225

0.260

Longitud

del

resorte

(m) : y

226

UNIDAD
D V / REGR
RESIN Y CORREL
LACIN.

Aproxime esta
e
informaccin por el mtodo
m
de mnimos cuadrrados, usand
do regresin lineal.

Solucin:
0.300
y = 0.0194x + 0. 1156
5
R2 = 0.9875

0.250
0.200
0.150
0.100
0.050
0.000
0

Problema: El calor esspecifico Cp


p(cal / kgmool ) del

Mnn3O4 vara

co
on la temperatura de

t
acuerdo a la siguiente tabla:

Punto

T ( K)

280

650

1000

1200
0

150
00

17
700

Cp

32.7

45.4

52.15

53.7

52.9
9

50
0.3

Aproxime esta
e
informaccin por el mtodo
m
de mnimos cuadrrados. Usand
do regresin lineal.

227

UNIDAD V / REGRESIN Y CORRELACIN.

Polinomio de segundo grado o cuadrtico (regresin polinomial)

y = a0 + a1 x + a2 x 2
a 0 n + a1 xi + a 2 xi2 = y i

a 0 xi + a1 xi2 + a 2 xi3 = xi y i

a 0 xi2 + a1 xi3 + a 2 xi4 = xi2 y i


Problema: Ajuste un polinomio de segundo orden a los datos de las dos columnas del
cuadro:

m=2
n=6
x = 2.5
y = 25.433

x
y
x
x

= 15

= 152.6

2
i

= 55

3
i

= 225

xi

yi

2.1

7.7

13.6

27.2

40.9

61.1

152.6

x
x
x

4
i

= 979

y i = 585 .6

2
i

y i = 2488 .8

6a0 + 15a1 + 55a2 = 152.6


15a0 + 55a1 + 225a2 = 585.6
55a0 + 225a1 + 979a2 = 2488.8

228

UNIDAD V / REGRESIN Y CORRELACIN.

70
y = 1.853x2 + 2.397x + 2.464
R = 0.998

60
50
40
30
20
10
0
0

Regresin lineal mltiple

y = a0 + a1 x1 + a2 x2
Ahora tenemos el conjunto de ecuaciones normales:

a0 n + a1 x1,i + a2 x2,i = yi

a0 x1,i + a1 x1,2i + a2 x1,i x2,i = x1,i yi

a0 x2,i + a1 x1,i x2,i + a2 x2,2 i = x2,i yi

Problema: Veinte tipos de hojas de aceros procesadas en fro tienen diferentes


composiciones de cobre y temperaturas de templado. Al medir su dureza resultante se
obtuvieron los siguientes valores:

229

UNIDAD V / REGRESIN Y CORRELACIN.

Se sabe que la dureza depende en forma lineal del contenido de u de cobre en % y de la


temperatura del templado v

y = a0 + a1u + a2 v
Determine los parmetros

a0 , a1

y a 2 , siguiendo el criterio de los mnimos cuadrados.

Solucin:

1.2
13800
795.7
12

A :=
1.2 0.1712 1380
81.258

13800 1380 16020000 902230

1 0 0 161.336
rref ( A ) = 0 1 0 32.969

0 0 1 0.086
y := 161.336 + 32.969u 0.086v

5.5 Error estndar de estimacin

Los segmentos de lnea verticales representan desviaciones de los puntos respecto a la


lnea en la siguiente figura. Se puede constatar, desplazando una regla dentro de la grfica
que es posible encontrar muchas lneas para las cuales la suma de las desviaciones (o
errores) es igual a 0, pero puede demostrarse que hay una y slo una lnea para la cual la
suma de los cuadrados de las desviaciones es mnima. La suma de los cuadrados de las
desviaciones se denomina suma de cuadrados del error y se denota con el smbolo SSE. La
lnea recibe el nombre de lnea de mnimos cuadrados, lnea de regresin o ecuacin de
prediccin de mnimos cuadrados.

230

UNIDAD V / REGRESIN Y CORRELACIN.

Grafica que muestra las desviaciones de los puntos respectos a una lnea recta.

Si queremos encontrar la lnea de mnimos cuadrados para un conjunto de datos,


suponemos que tenemos una muestra de n puntos de datos que se pueden identificar
mediante los correspondientes valores de x y y , digamos, (x1, y1) , (x2, y2), . . . , (xn , Yn ). El
modelo de lnea recta para la respuesta y en trminos de x es

y = a0 + a1x +
La lnea de medias es

E( y) = a0 + a1x

y la lnea ajustada, que esperamos encontrar, se

= a0 + a1x .
representa como y
Entonces, la suma de los cuadrados de las desviaciones de los valores de y respecto a sus
valores estimados para toda las n puntos de datos es
n

SSE = [ yi (a0 + a1 xi )] Para una regresin lineal.


i =1
n

SSE = yi (a0 + a1 xi + a2 xi2 ) Para una regresin polinomial.


i =1

En la mayor parte de las situaciones prcticas, la varianza

2 del error aleatorio es

desconocida y se debe estimar a partir de los datos de muestra. Puesto que

2 mide la

231

UNIDAD V / REGRESIN Y CORRELACIN.

variacin de los valores de y respecto de la lnea


razonable estimar

E( y) = a0 + a1x

parece intuitivamente

2 dividiendo SSE entre un nmero apropiado.

Teorema
Sea s = SSE /( n 2). entonces , si se satisfacen los supuestos, la estadstica
2

2 =

SSE

(n 2) s 2

Tiene una distribucin ji cuadrada con v = (n 2 ) grados de libertad.

s2 =

2 2
n2

Entonces,

E (s 2 ) =
Donde E(

2
n2

E( 2 )

2 ) = v = (n - 2).

Por tanto,

E (s 2 ) =

2
n2

(n 2) = 2

Y negamos a la conclusin de que s2 es un estimador insesgado de

2.

El procedimiento empleado para calcular SSE puede dar pie a errores de redondeo
considerables. En el siguiente recuadro se presentan la frmula para s2 y un mtodo para
calcular SSE.

Estimacin de

s2 =

SSE
SSE
=
n2
Grados de libertad para error

donde

SSE = ( yi y i ) = SS yy SS xy
2

232

UNIDAD V / REGRESIN Y CORRELACIN.

SS yy = ( yi y )
Donde

( y )
= y
n

2
i

= a1

Advertencia: al realizar estos clculos tal vez se sienta tentado a redondear los valores
calculados de SS yy ,

y SS xy . Asegrese de conservar por lo menos seis cifras

significativas para cada una de estas cantidades a fin de evitar un error importante en el
clculo de SSE.

5.6 Coeficiente de determinacin y correlacin

5.6.1 Coeficiente de determinacin de la muestra


Otra forma de medir la contribucin de x a la prediccin de y es considerar hasta dnde
pueden reducirse los errores de la prediccin de y aprovechando la informacin
proporcionada por x.

a) Diagrama de dispersin de los datos


b) Supuesto: x no contribuye con informacin a la prediccin de y ; y = y
c) Supuesto: x contribuye con informacin a la prediccin de y ;

y = a0 + a1x

Como ilustracin, supongamos que una muestra de datos tiene el diagrama de dispersin
que se muestra en la figura anterior del inciso a. Si suponemos que x no contribuye con
informacin a la prediccin de y, la mejor prediccin de y ser la media de la muestra, y, que
se grafica como una lnea horizontal en la figura inciso b.

233

UNIDAD V / REGRESIN Y CORRELACIN.

Los segmentos de lnea verticales trazados en esa figura son las desviaciones de los puntos
respecto de la media y. Observe que la suma de los cuadrados de las desviaciones para el
modelo:

y = y es SS yy = ( yi y ) 2 .
Supongamos ahora que ajustamos una lnea de mnimos cuadrados al mismo conjunto de
datos y marcamos las desviaciones de los puntos respecto de la lnea como se hace en la
figura del inciso c.

Compare las desviaciones respecto de las lneas de prediccin en los incisos b y c de la


figura anterior.

Es evidente que:
1. Si x contribuye con poca o ninguna informacin a la prediccin de y , las sumas de
los cuadrados de las desviaciones para las dos lneas,

SS yy = ( yi y ) 2
SSE = ( yi yi ) 2
2. Si x contribuye con informacin a la prediccin de y , entonces SSE ser menor que
SSyy. De hecho, si todos los puntos caen en la lnea de mnimos cuadrados, entonces
SSE = 0.
Una forma cmoda de medir qu tan bien se desempea la ecuacin de mnimos
cuadrados

y = a0 + a1x

como predictora de y es calcular la reduccin en la suma de los

cuadrados de las desviaciones que se puede atribuir a x, expresada como una proporcin de
SSyy. Esta cantidad, llamada coeficiente de determinacin, es

SS yy SSE
SS yy
En la regresin lineal simple se puede demostrar que esta cantidad es igual al cuadrado del
coeficiente de correlacin lineal simple r.

234

UNIDAD V / REGRESIN Y CORRELACIN.

Definicin:
El coeficiente de determinacin es

r2 =

SS yy SSE
SS yy

= 1

SSE
SS yy

Este coeficiente representa la proporcin de la suma de los cuadrados de las desviaciones


de los valores de y respecto de sus valores estimados

( y ) que se puede atribuir a una

relacin lineal y y x . (En una regresin lineal simple, este coeficiente tambin puede
calcularse elevando al cuadrado el coeficiente de correlacin r )
Observe que r2 siempre est entre 1 y 1, porque r est entre -1 y +1. Por tanto, r2 = 0.60
significa que la suma de los cuadrados de las desviaciones de los valores de y respecto de
sus valores estimados se redujo en 60% al utilizar y , en lugar de y , para predecir y. O bien,
en trminos ms prcticos, r2 = 0.60 implica que el modelo de lnea recta que relaciona a y
con x puede explicar (o dar cuenta de) 60% de la variacin presente en la muestra de
valores de y.

Problema: Calcule el coeficiente de determinacin para el ejemplo de compresin de aislante. Los datos se repiten en la tabla siguiente:

Presin

Compresin

X, 10 libras

Y, 0.1 de

por pulg

pulgada

235

UNIDAD V / REGRESIN Y CORRELACIN.

SSyy = y

2
i

(y )

(10)
= 26
5

=6

SSE = ( yi yi ) = 1.10
2

r2 =

SSyy SSE 6.0 1.1


=
= 0.82 = 82%
SSyy
6.0

(Observe que este valor tambin podra haberse obtenido elevando al cuadrado el
coeficiente de correlacin r = 0.904.)

Ahora sabemos que al usar la presin x para predecir la compresin y con la lnea de
mnimos cuadrados y = -0.1 + 0.7x, la suma total de los cuadrados de las desviaciones de
los cinco valores de y respecto de sus valores estimados se redujo en 82% gracias al
empleo del predictor lineal y . Es decir, 82% de la variacin de los valores de compresin de
la muestra se puede explicar mediante la lnea de mnimos cuadrados.

Interpretacin prctica del coeficiente de determinacin, r2


Aproximadamente 100(r2) % de la suma total de los cuadrados de las desviaciones de los
valores y de la muestra respecto de su media y se puede explicar por ( o atribuirse a) el
empleo de x para predecir y con el modelo de lnea recta.

En situaciones en las que un modelo de regresin de lnea recta resulta ser un predictor
estadsticamente satisfactorio de y, el valor de r2 puede servir al analista de regresin como
gua en la bsqueda de mejores y ms tiles modelos. Por ejemplo, Crandall y Cedercreutz
(1976) emplean un modelo lineal simple para relacionar el costo del trabajo mecnico
(calefaccin, ventilacin y plomera) en la construccin con el rea de piso.

236

UNIDAD V / REGRESIN Y CORRELACIN.

Con base en los datos asociados a la construccin de 26 fbricas y bodegas, se obtuvo la


ecuacin de prediccin de mnimos cuadrados que se indica en la figura siguiente. Se lleg
a la conclusin de que el rea de piso y el costo mecnico tienen una relacin lineal, ya que
la estadstica t (para probar Ho:
un

a0

a1 = 0 ) produjo un valor de 3.61, el cual es significativo con

tan pequeo como 0.002.

Por tanto, el rea de piso debe servirnos para predecir el costo mecnico de una fbrica o
bodega. Sin embargo, el valor del coeficiente de determinacin r2 fue de 0.35. Esto nos dice
que slo 35% de la variacin en los costos mecnicos se puede atribuir a las diferencias en
el rea de piso.
Este valor relativamente pequeo de r2 impuls a Crandall y Cedercreutz a incluir en el
modelo otras variables independientes (por ejemplo, volumen, cantidad de vidrio) en un
intento por dar cuenta de una porcin significativa del 65% restante de la variacin en el
costo mecnico que no puede explicarse con el rea de piso.

Modelo lineal simple que relaciona el costo con el rea de piso.

237

UNIDAD V / REGRESIN Y CORRELACIN.

5.6.2 Coeficiente de correlacin de la muestra


La pendiente de mnimos cuadrados,

a1

proporciona informacin til sobre la relacin o

"asociacin" lineal entre dos variables y y x. Otra forma de medir la asociacin es calcular el
coeficiente de correlacin r del momento de producto de Pearson. El coeficiente de
correlacin, que se define en el recuadro, ofrece una medida cuantitativa de la fortaleza de la
relacin lineal entre x y y en la muestra, como lo hace la pendiente de mnimos cuadrados

a1 .

Sin embargo, a diferencia de la pendiente, el coeficiente de correlacin r es

adimensional. El valor de r siempre est entre -1 y + 1, sin importar en qu unidades se


exprese x y y..

Definicin :
El coeficiente de correlacin r del momento de producto de Pearson es una medida de la
fortaleza de la relacin lineal entre dos variables x y y en la muestra. El coeficiente se
calcula ( para una muestra de n mediciones de x y y ) como sigue

r=

SS xy
SS xx SS yy

Puesto que tanto r como a1 proporcionan informacin acerca de la utilidad del modelo, no
debe sorprendemos que las frmulas mediante las cuales se calculan sean similares. En
particular, observe que SSxy aparece en los numeradores de ambas expresiones y que, dado
que ambos denominadores siempre son positivos, r y

a1

siempre tienen el mismo signo

(ambos positivos o bien ambos negativos). Un valor de r cercano o igual a 0 implica poca o
ninguna relacin lineal entre y y x.

En contraste, cuanto ms se acerque r a 1 o -1, ms fuerte ser la relacin lineal entre x y y.


Y, si r = 1 o r = -1, todos los puntos caern exactamente en la lnea de mnimos cuadrados.
Un valor positivo de r implica que y aumenta cuando x aumenta; un valor negativo implica
que y disminuye cuando x aumenta.

238

UNIDAD V / REGRESIN Y CORRELACIN.

Problema: En la tabla siguiente .Calcule el coeficiente de correlacin r entre la presin x y la


compresin y.
Presin

Compresin

X, 10 libras por pulg

Y, 0.1 de pulgada

Solucin:
SSxy = 7, SSxx = 10, :

= 10 y

2
i

= 26 .

Entonces,

SS yy = y

2
i

( y )

(10 )
= 26
5

=6

y el coeficiente de correlacin es

r=

SS xy
SS xx SS yy

7
7
=
= 0.904
(10)(6) 7.746

Por tanto, la presin y la magnitud de la compresin tienen una correlacin elevada, al


menos para esta muestra de cinco trozos de material aislante. La implicacin es que existe
una relacin lineal positiva fuerte entre estas variables. No obstante, debemos tener cuidado
de no precipitamos a conclusiones injustificadas. Por ejemplo, el inventor de un nuevo
material aislante podra sentirse tentado a concluir que un aumento en la presin siempre
producir una mayor compresin. La implicacin de semejante conclusin es que existe una
relacin causal entre las dos variables. Sin embargo, una correlacin elevada no implica
causalidad. Muchos otros factores, como la temperatura y la humedad, podran contribuir al
aumento en el grado de compresin que se produce en los especmenes.

239

UNIDAD V / REGRESIN Y CORRELACIN.

Advertencia
Una correlacin elevada no implica causalidad. Si se observa un valor positivo o negativo
grande del coeficiente de correlacin r de la muestra, no es correcto llegar a la conclusin de
que un cambio en x causa un cambio en y. La nica conclusin puede existir una tendencia
lineal entre x y y .

Tenga presente que el coeficiente de correlacin r mide la correlacin entre los valores x y
los valores y de la muestra, y que existe un coeficiente de correlacin lineal similar para la
poblacin de la cual se seleccionaron los puntos de datos.

El coeficiente de correlacin de poblacin se denota con el smbolo

(rho). Como era

se estima con la estadstica de muestra correspondiente, r . Por otro lado, en

de esperar,

lugar de estimar

H0:

= 0 contra

Ha:

0,

, podramos querer probar la hiptesis :

es decir, probar la hiptesis de que x no contribuye con informacin a la prediccin de y


empleando el modelo de lnea recta contra la alternativa de que las dos variables tienen por
10 menos una relacin lineal.

La nica diferencia real entre la pendiente de mnimos cuadrados

a1

y el coeficiente de

correlacin r es la escala de medicin. Por tanto, la informacin que proporcionan acerca de


la utilidad del modelo de mnimos cuadrados es en cierta medida redundante. Adems, la
pendiente

a1

proporciona informacin adicional sobre la magnitud del incremento (o

decremento) de y con cada incremento unitario de x.

Por esta razn, recomendamos utilizar la pendiente para hacer inferencias acerca de la
existencia de una relacin lineal positiva o negativa entre dos variables.

Para quienes prefieren probar si hay o no una relacin lineal entre dos variables empleando
el coeficiente de correlacin r, bosquejamos el procedimiento en el recuadro.

240

UNIDAD V / REGRESIN Y CORRELACIN.

Prueba de hiptesis para la correlacin lineal


Prueba de un cola

Prueba de dos colas

Ho : = 0

Ho : = 0
H1 : 0

H1 : > 0
( < 0)

Estadstica de prueba: t =

Regin de rechazo:

t > t

r n2
1 r2

Regin de rechazo:

t > t / 2

(t < t )
Donde la distribucin de t depende de (n 2) gl .

Problema: Es importante que los investigadores cientficos en el rea de los productos


forestales sean capaces de estudiar la correlacin entre la anatoma y las propiedades
mecnicas de los rboles. De acuerdo con el estudio Quantitative Anatomical Characteristics
of Plantation Grown Loblolly Pine (pinus Taeda L.) and Cottonwood (populus deltoides Bart.
Ex Marsh.) and Their Relationship to Mechanical Properties que llev a cabo el
Departamento de Silvicultura y Productos Forestales del Instituto Politcnico y Universidad
Estatal de Virginia, un experimento en el que se seleccionaron aleatoriamente 29 pinos
loblolly para investigacin que produjeron los datos de la tabla siguiente sobre la gravedad
especfica en gramos /cm3 y el mdulo de ruptura en kilo pascales (kPa). Calcule e interprete
el coeficiente de correlacin muestra!.

Gravedad

Modulo de

Gravedad

Modulo de

especifica, x

ruptura, y

especifica, x

ruptura, y

( g / cm3 )

(kPa)

( g / cm3 )

(kPa)

0.414

29186

0.581

85156

0.383

29266

0.557

69571

0.399

26215

0.550

84160

0.402

30162

0.531

73466

0.442

38867

0.550

78610

0.422

37831

0.556

67657

241

UNIDAD V / REGRESIN Y CORRELACIN.

0.466

44576

0.523

74017

0.500

46097

0.602

87291

0.514

59698

0.569

86836

0.530

67705

0.544

82540

0.569

66088

0.557

81699

0.558

78486

0.530

82096

0.577

89869

0.547

75657

0.572

77369

0.585

80490

0.548

67095

Solucin

Sxx = 0.11273;

Syy = 11807324786

Sxy = 34422.75972
r=

34422.75972
= 0.9435
(0.11273)(11807324786)

Un coeficiente de correlacin de 0.9435 indica una buena relacin lineal entre X y Y. Como
r2 = 0.8902, podemos decir que aproximadamente 89% de la variacin en los valores de Y
se explica por una relacin lineal con X.

Una prueba de la hiptesis especial


a probar

= 0 contra una alternativa apropiada es equivalente

= 0 para el modelo de regresin lineal simple que utilizan la distribucin t con

n 2 grados de libertad o la distribucin F con 1 y n - 2 grados de libertad. Sin embargo, si


se desea evitar el procedimiento del anlisis de varianza y calcular slo el coeficiente de
correlacin muestral, se puede verificar que el valor t dado por

t=

b
=
s
S xx

SSR
s

Tambin se puede escribir como t =

r n2
1 r2

que, como antes, es un valor de la

estadstica T que tiene una distribucin t con n - 2 grados de libertad.

242

UNIDAD V / REGRESIN Y CORRELACIN.

Problema: Para los datos del ejemplo anterior pruebe la hiptesis de que no hay una
asociacin lineal entre las variables.
Solucin:

1. H o : = 0
2. H1 : 0
3. =0.05
4. Regin critica: t < 2.052 y t > 2.052

5. Calculos

t=

0.9435( 27)
1 ( 0.9435 )

= 14.79,

P < 0.001

6. Decisin
Rechazar la hiptesis de no asociacin lineal.

Una prueba de la hiptesis ms general

= o contra una alternativa adecuada se lleva a

cabo fcilmente a partir de la informacin muestral. Si X y Y siguen la distribucin normal


bivariada, la cantidad

1 1+ r
ln

2 1 r
Es un valor de una variable aleatoria que sigue de manera aproximada la distribucin normal
con media (1/2) In [(1 +

) / (1- )] y varianza 1/ (n - 3). De esta forma el procedimiento de

prueba es calcular

z=
=

1 + 0
n 3 1+ r

ln
ln
2 1 r
1

n 3 (1 + r )(1 0 )
ln

2
(1 r )(1 + 0 )

243

UNIDAD V / REGRESIN Y CORRELACIN.

y comparar con los puntos crticos de la distribucin normal estndar.

Problema: Para los datos del ejemplo antes de que acabamos de resolver pruebe la
hiptesis nula

= 0.9 contra la alternativa de que > 0.9 . Utilice un nivel de significancia

de 0.05

Solucin:
1.

.H 0 : = 0.9

2.

H1 : > 0.9

3.

= 0.05

4. Regin critica :

z > 1.645

5. Clculos

z=

26 (1 + 0.9435)0.1
ln
= 1.51
2
(1 0.9435)1.9

P = 0.0655
6. Decisin : Hay en realidad alguna evidencia de que el coeficiente de
correlacin excede 0.9

Relacin no lineal.

Diagrama de dispersin que muestra correlacin cero

244

UNIDAD V / REGRESIN Y CORRELACIN.

5.7. Problemas prcticos de ajustes de curvas

Problema: Partir de un estudio experimental acerca de la estabilidad de arcilla muy platica,


se observo que el contenido de agua para moldeo con densidad optima dependa
linealmente de los porcentajes de cal y puzolana mezclado con la arcilla. Se tuvieron as los
resultados que dan abajo. Ajuste una ecuacin de la forma:

y = a0 + a1u + a2 v

Solucin:

45
62.5 206.4
7

A := 45 407.5 291.25 1367.85

62.5 291.25 816.25 1789.65

1 0 0 28.692
rref( A ) = 0 1 0 0.257

0 0 1 0.096
y := 28.692 + 0.257u 0.096v

Problema: Al medir la velocidad (con un tubo de Pitot) en una tubera circular de dimetro
interior de 20 cm, se encontr la siguiente informacin:

245

UNIDAD V / REGRESIN Y CORRELACIN.

V ( cm / s )

600

550

450

312

240

R ( cm)

Donde R es la distancia en cm. medida a partir del centro del tubo.


a) Obtenga la curva v = f(R) que aproxima estos datos experimentales

700
600
500
400
300
y = -5.3472x 2 - 3.0667x + 601.71

200
100
0
0

10

b) Calcule la velocidad en el punto R = 4 cm.

Problema: Si aproxima la funcin dada abajo por un polinomio de segundo grado

246

UNIDAD V / REGRESIN Y CORRELACIN.

45000
40000
35000
30000
25000
20000
15000
10000
5000
0

y = -8.8218x 2 - 1412.1x + 39694

10

15

20

Problema: En la siguiente tabla, r es la resistencia de una bobina en ohms y T la temperatura


de la bobina en C. Por mnimos cuadrados determine el mejor polinomio lineal que
represente la funcin dada:

100
y = 35.744x - 361.8

90
80
70
60
50
40
30
20
10
0
0

10

15

Problema: En una reaccin gaseosa de expansin a volumen constante, se observa que la


presin del reactor (batch) aumenta con el tiempo de reaccin segn se muestra en la tabla
de abajo.

Que grado de polinomio aproxima mejor la funcin P = f(t) ?

247

UNIDAD V / REGRESIN Y CORRELACIN.

3.5

3.5

3
y = 1.2386x + 0.8702
2.5

2.5

1.5

1.5

0.5

0.5

y = 0.5234x 2 + 0.479x + 1.0089

0
0

0.5

1.5

0.5

1.5

Problema: ajstese una lnea recta a los valores x y y de la tabla siguiente:

xi

yi

0.5

2.5

2.0

4.0

3.5

6.0

5.5

Solucin:
8
6
4
2
0
0

248

UNIDAD V / REGRESIN Y CORRELACIN.

Ejercicios propuestos

P1. En cada caso, grafique la lnea que pasa por los puntos.
a. (0, 2) Y (2, 6)
b. (0, 4) Y (2, 6)
c.

(0,-2) y (-1,-6)

d. (0, -4) Y (3, -7)

P2. Grafique las siguientes lneas:


a. y = 3 + 2x
b. y = l + x
c.

y = - 2 + 3x

d. y = 5x
e. y = 4 - 2x

P3. Dos procesos para el taladrado hidrulico de roca son el taladrado en seco y el taladrado
hmedo. En un agujero seco se introduce aire comprimido por las varillas de taladrar para
expulsar las partculas e impulsar el martillo; en un agujero hmedo se introduce agua a
presin. Se realiz un experimento para determinar si el tiempo y que se requiere para
taladrar una distancia de cinco pies en roca aumenta con la profundidad x (The American
Statistician, febrero de 1991). Los resultados para una porcin del experimento se muestran
en la siguiente tabla.

Profundidad a la que se inicia el taladro x,

Tiempo para taladrar 5 pies y , minutos

pies
0

4.90

25

7.41

50

6.19

75

5.57

100

5.17

125

6.89

150

7.05

175

7.11

249

UNIDAD V / REGRESIN Y CORRELACIN.

200

6.19

225

8.28

250

4.84

275

8.29

300

8.91

325

8.54

350

11.79

375

12.12

395

11.02

a)

Elabore un diagrama de dispersin para datos.

b)

Encuentre la ecuacin de prediccin de mnimos cuadrados.

c)

Grafique la lnea de mnimos cuadrados en el diagrama de dispersin

d)

Interprete los valores de a0 y

a1

P4. Se realiz un estudio para modelar el desempeo trmico de los tubos con aletas
integrales empleados en las industrias de refrigeracin y de proceso (Journal of Heat
Transfer, agosto de 1990). En el experimento se utilizaron 24 tubos con aletas integrales de
fabricacin especial, con aletas rectangulares hechas de cobre. Se liber vapor hacia abajo
en cada tubo y se midi el coeficiente de transferencia de calor del lado del vapor (con base
en el rea superficial exterior del tubo). La variable dependiente en este estudio es la tasa de
promocin de la transferencia de calor y, definida como el cociente entre el coeficiente del
lado del vapor del tubo con aletas y el coeficiente del lado del vapor de un tubo liso,
evaluados a la misma temperatura. En teora, la transferencia de calor est relacionada con
el rea de la parte superior del tubo que no est "inundada" por la condensacin del vapor.
Los datos de la tabla son los valores de proporcin de rea no inundada (x) y promocin de
la transferencia de calor (y) registrados para los 24 tubos con aletas integrales.

Proporcin de rea

Promocin de la transferencia de

no inundada, x

calor, y

1.93

4.4

1.95

5.3

1.78

4.5

1.64

4.5

250

UNIDAD V / REGRESIN Y CORRELACIN.

a) Determine

1.54

3.7

1.32

2.8

2.12

6.1

1.88

4.9

1.70

4.9

1.58

4.1

2.47

7.0

2.37

6.7

2.00

5.2

1.77

4.7

1.62

4.2

2.77

6.0

2.47

5.8

2.24

5.2

1.32

3.5

1.26

3.2

1.21

2.9

2.26

5.3

2.04

5.1

1.88

4.6

la lnea de mnimos cuadrados que relaciona la promocin de la

transferencia de calor y con la proporcin de rea no inundada x.


b) Grafique los puntos de datos y trace la lnea de mnimos cuadrados como verificacin
de sus clculos.
c) Interprete los valores de a0 y

a1

.
P5. La Comisin Federal de Comunicaciones (FCC) de Estados Unidos especifica que las
emisiones electromagnticas radiadas por dispositivos digitales se deben medir en un sitio
de prueba de campo abierto. A fin de verificar la aceptabilidad de un sitio de prueba es
preciso evaluar la atenuacin del sitio (es decir, la prdida de transmisin desde la entrada
de un dipolo de media onda hasta la salida de otro cuando ambos dipolos se colocan sobre
el plano de tierra).

251

UNIDAD V / REGRESIN Y CORRELACIN.

Un estudio realizado en un sitio de prueba en Fort Collins, Colorado, produjo los siguientes
datos de atenuacin del sitio (en decibeles) y frecuencia de transmisin (en megahertz) para
dipolos a una distancia de 3 metros.
Atenuacin del sitio y ,dBL

Frecuencia de
Transmisin X, MHZ
50

11.5

100

15.8

200

18.2

300

22.6

400

26.2

500

27.1

600

29.5

700

30.7

800

31.3

900

32.6

1000

34.9

P6. Como parte de un estudio sobre la rapidez de combustin de grafito artificial en un flujo
de aire hmedo, se llevo a cabo un experimento con miras a investigar la difusividad del
oxgeno a travs de una mezcla de vapor de agua (Combustion and Flame, vol. 50, 1983).
Se prepararon muestras de mezclas de nitrgeno y oxgeno con una fraccin molar de agua
de 0.017 a nueve temperaturas distintas, y se midi la difusividad del oxgeno en cada una.
Los datos se reproducen en la siguiente tabla.
Temperatura

Difusividad de oxigeno

1,000

1.69

1,100

1.99

1,200

2.31

1,300

2.65

1,400

3.01

1,500

3.39

1,600

3.79

1,700

4.21

1,800

4.64

252

UNIDAD V / REGRESIN Y CORRELACIN.

a) Grafique los puntos de datos en un diagrama de dispersin.


b) Ajuste un modelo lineal simple que relacione la difusividad media del oxgeno, E ( y )
, con la temperatura, x. Interprete las estimaciones de los parmetros del modelo.
c) Calcule SSE y S2

P7. El equilibrio termogravimtrico (TG ) es una nueva tcnica que se desarroll para evaluar
el comportamiento trmico de los compuestos qumicos. Abou El Naga y Salem (1986)
compararon la tcnica TG con el mtodo estndar de evaluar la estabilidad respecto a la
termooxidacin de aceite, base y sus mezclas aditivas (por ejemplo, aceites de
transformador, de turbina y de transmisin). En cada espcimen de una muestra de 10
aceites base se determin la cantidad y de compuestos oxidativos formados en el punto de
oxidacin empleando la tcnica TG, as como el porcentaje total de productos de oxidacin x
empleando el mtodo estndar. Los resultados del experimento se muestran en la siguiente
tabla.
Aceite

Tcnica TG: cantidad de

base

compuestos oxidativos y , % en

Mtodo estndar:
Total de productos de oxidacin

peso

X, %

25.4

2.3

27.11

2.5

28.0

2.65

17.9

1.3

18.9

1.45

22.9

1.9

30.8

3.3

18.6

1.4

24.4

2.1

10

29.8

2.9

253

UNIDAD V / REGRESIN Y CORRELACIN.

a) Ajuste un modelo lineal simple que relacione la cantidad y de compuestos oxidativas


determinados por la tcnica TG con el porcentaje total de productos de oxidacin x
determinados por

el mtodo estndar.

b) Grafique los puntos de datos y la lnea de mnimos cuadrados en un diagrama de


dispersin.
d)

Interprete los valores de a0 y

a1

c) Calcule SSE, S2 y s.
d) Interprete el valor de s.

254

ANEXOS
TABLAS

ANEX
XOS / TAB
BLAS

APNDIC
CE A
Tabla de la dis
stribucin normal
n
(rea
a bajo la currva normal)

z
0,,0
0,,1
0,,2
0,,3
0,,4

0,00
0,5000
0,5398
0,5793
0,6179
0,6554

0,01
0,5040
0,5438
0,5832
0,6217
0,6591

0,02
0
0,,5080
0,,5478
0,,5871
0,,6255
0,,6628

0,03
3
20
0,512
0,5517
0,5910
0,629
93
0,666
64

0,04
0,5160
0,5557
0,5948
0,6331
0,6700

0,05
0,5199
0,5596
0,5987
0,6368
0,6736

0,06
0
0,5239
0,5636
0,6026
0,6406
0,6772

0,07
7
0,527
79
0,567
75
0,606
64
0,644
43
0,680
08

0,08
0,5319
0,5714
0,6103
0,6480
0,6844

0,09
0,5359
0,5753
0,6141
0,6517
0,6879

0,,5
0,,6
0,,7
0,,8
0,,9

0,6915
0,7257
0,7580
0,7881
0,8159

0,6950
0,7291
0,7611
0,7910
0,8186

0,,6985
0,,7324
0,,7642
0,,7939
0,,8212

0,7019
57
0,735
0,767
73
0,796
67
0,823
38

0,7054
0,7389
0,7703
0,7995
0,8264

0,7088
0,7422
0,7734
0,8023
0,8289

0,7123
0,7454
0,7764
0,8051
0,8315

0,715
57
0,748
86
0,779
94
0,807
78
0,834
40

0,7190
0,7517
0,7823
0,8106
0,8364

0,7224
0,7549
0,7852
0,8133
0,8389

1,,0
1,,1
1,,2
1,,3
1,,4

0,8413
0,8643
0,8849
0,9032
0,9192

0,8438
0,8665
0,8869
0,9049
0,9207

0,,8461
0,,8686
0,,8888
0,,9066
0,,9222

85
0,848
0,870
08
0,890
07
0,908
82
0,923
36

0,8508
0,8729
0,8925
0,9099
0,9251

0,8531
0,8749
0,8944
0,9115
0,9265

0,8554
0,8770
0,8962
0,9131
0,9278

0,857
77
0,879
90
0,898
80
0,914
47
0,929
92

0,8599
0,8810
0,8997
0,9162
0,9306

0,8621
0,8830
0,9015
0,9177
0,9319

1,,5
1,,6
1,,7
1,,8
1,,9

0,9332
0,9452
0,9554
0,9641
0,9713

0,9345
0,9463
0,9564
0,9649
0,9719

0,,9357
0,,9474
0,,9573
0,,9656
0,,9726

70
0,937
0,948
84
0,958
82
0,966
64
0,973
32

0,9382
0,9495
0,9591
0,9671
0,9738

0,9394
0,9505
0,9599
0,9678
0,9744

0,9406
0,9515
0,9608
0,9686
0,9750

0,9418
0,952
25
0,9616
0,969
93
0,975
56

0,9429
0,9535
0,9625
0,9699
0,9761

0,9441
0,9545
0,9633
0,9706
0,9767

2,,0
2,,1
2,,2
2,,3
2,,4

0,9772
0,9821
0,9861
0,9893
0,9918

0,9778
0,9826
0,9864
0,9896
0,9920

0,,9783
0,,9830
0,,9868
0,,9898
0,,9922

88
0,978
0,993
34
0,987
71
0,990
01
0,992
25

0,9793
0,9838
0,9875
0,9904
0,9927

0,9798
0,9842
0,9878
0,9906
0,9929

0,9803
0,9846
0,9881
0,9909
0,9931

0,980
08
0,985
50
0,988
84
0,9911
0,993
32

0,9812
0,9854
0,9887
0,9913
0,9934

0,9817
0,9857
0,9890
0,9916
0,9936

2,,5
2,,6
2,,7
2,,8
2,,9

0,9938
0,9953
0,9965
0,9974
0,9981

0,9940
0,9955
0,9966
0,9975
0,9982

0,,9941
0,,9956
0,,9967
0,,9976
0,,9982

43
0,994
0,995
57
0,996
68
0,997
77
0,998
83

0,9945
0,9959
0,9969
0,9977
0,9984

0,9946
0,9960
0,9970
0,9978
0,9984

0,9948
0,9961
0,9971
0,9979
0,9985

0,994
49
0,996
62
0,997
72
0,997
79
0,998
85

0,9951
0,9963
0,9973
0,9980
0,9986

0,9952
0,9964
0,9974
0,9981
0,9986

3,,0
3,,1
3,,2
3,,3
3,,4

0,9987
0,9990
0,9993
0,9995
0,9997

0,9987
0,9991
0,9993
0,9995
0.9997

0,,9987
0,,9991
0,,9994
0,,9995
0,,9997

88
0,998
0,999
91
0,999
94
0,999
96
0,999
97

0,9988
0,9992
0,9994
0,9996
0,9997

0,9989
0,9992
0,9994
0,9996
0,9997

0,9989
0,9992
0,9994
0,9996
0,9997

0,998
89
0,999
92
0,999
95
0,999
96
0,999
97

0,9990
0,9993
0,9995
0,9996
0,9997

0,9990
0,9993
0,9995
0,9997
0,9998

3,,5

0,9998

0,9998

0,,9999 0,999
99

0,9999

0,9999 0,9999 0,999


99

0,9999

0,9999

256

ANEXOS / TABLAS

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

-3.4
-3.3
-3.2
-3.1
-3.0

0.0003
0.0005
0.007
0.0010
0.0013

0.0003
0.0005
0.0007
0.0009
0.0013

0.0003
0.0005
0.0006
0.0009
0.0013

0.0003
0.0004
0.0006
0.0009
0.0012

0.0003
0.0004
0.0006
0.0008
0.0012

0.0003
0.0004
0.0006
0.0008
0.0011

0.0003
0.0004
0.0006
0.0008
0.0011

0.0003
0.0004
0.0005
0.0008
0.0011

0.0003
0.0004
0.0005
0.0007
0.0010

0.0002
0.0003
0.0005
0.0007
0.0010

-2.9
-2.8
-2.7
-2.6
-2.5

0.0019
0.0026
0.0035
0.0047
0.0062

0.0018
0.0025
0.0034
0.0045
0.0060

0.0017
0.0024
0.0033
0.0044
0.0059

0.0017
0.0023
0.0032
0.0043
0.0057

0.0016
0.0023
0.0031
0.0041
0.0055

0.0016
0.0022
0.0030
0.0040
0.0054

0.0015
0.0021
0.0029
0.0039
0.0052

0.0015
0.0021
0.0028
0.0038
0.0051

0.0014
0.0020
0.0027
0.0037
0.0049

0.0014
0.0019
0.0026
0.0036
0.0048

-2.4
-2.3
-2.2
-2.1
-2.0

0.0082
0.0107
0.0139
0.0179
0.0228

0.0080
0.0140
0.0136
0.0174
0.0222

0.0078
0.0102
0.0132
0.0170
0.0217

0.0075
0.0099
0.0129
0.0166
0.0212

0.0073
0.0096
0.0125
0.0162
0.0207

0.0071
0.0094
0.0122
0.0158
0.0202

0.0069
0.0091
0.0119
0.0154
0.0197

0.0068
0.0089
0.0116
0.0150
0.0192

0.0066
0.0087
0.0113
0.0146
0.0188

0.0064
0.0084
0.110
0.0143
0.0183

-1.9
-1.8
-1.7
-1.6
-1.5

0.0287
0.0359
0.0446
0.0548
0.0668

0.0281
0.0352
0.0436
0.0537
0.0655

0.0274
0.0344
0.0427
0.0526
0.0643

0.0268
0.0336
0.0418
0.0516
0.0630

0.0262
0.0329
0.0409
0.0505
0.0618

0.0256
0.0322
0.0401
0.0495
0.0606

0.0250
0.0314
0.0392
0.0485
0.0594

0.0244
0.0307
0.0384
0.0475
0.0582

0.0239
0.0301
0.0375
0.0465
0.0571

0.0233
0.0294
0.0367
0.0455
0.0559

-1.4
-1.3
-1.2
-1.1
-1.0

0.0808
0.0968
0.1151
0.1357
0.1587

0.0793
0.0951
0.1131
0.1335
0.1562

0.0778
0.0934
0.1112
0.1314
0.1539

0.0764
0.0918
0.1093
0.1292
0.1515

0.0749
0.0901
0.1075
0.1271
0.1492

0.0735
0.0885
0.1056
0.1251
0.1469

0.0722
0.0869
0.1038
0.1230
0.1446

0.0708
0.0853
0.1020
0.1210
0.1423

0.0694
0.0838
0.1003
0.1190
0.1401

0.0681
0.0823
0.0985
0.1170
0.1379

-0.9
-0.8
-0.7
-0.6
-0.5

0.1841
0.2119
0.2420
0.2743
0.3085

0.1814
0.2090
0.2389
0.2709
0.3050

0.1788
0.2061
0.2358
0.2676
0.3015

0.1762
0.2033
0.2327
0.2643
0.2981

0.1736
0.2005
0.2296
0.2611
0.2946

0.1711
0.1977
0.2266
0.2566
0.2578

0.1685
0.1949
0.2236
0.2546
0.2877

0.1660
0.1922
0.2206
0.2514
0.2843

0.1635
0.1894
0.2177
0.2483
0.2810

0.1611
0.1867
0.2148
0.2451
0.2776

-0.4
-0.3
-0.2
-0.1
-0.0

0.3446
0.3821
0.4207
0.4602
0.5000

0.3409
0.3783
0.4168
0.4562
04960

0.3372
0.3745
0.4129
0.4522
0.4920

0.3336
0.3707
0.4090
0.4483
0.4880

0.3300
0.3669
0.4052
0.4443
0.4840

0.3264
0.3632
0.4013
0.4404
0.4801

0.3228
0.3594
0.3974
0.4364
0.4761

0.3192
0.3557
0.3936
0.4325
0.4721

0.3156
0.3520
0.3897
0.4286
0.4681

0.3121
0.3483
0.3859
0.4247
0.4641

257

ANEXOS / TABLAS

APNDICE B
Valores crticos de la distribucin t

V
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

0.40
0.325
0.289
0.277
0.271
0.267
0.265
0.263
0.262
0.261
0.260
0.260
0.259
0.259
0.258
0.258
0.258
0.257
0.257
0.257
0.257
0.257
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.255
0.254
0.254
0.253

0.30
0.727
0.617
0.584
0.569
0.559
0.553
0.549
0.546
0.543
0.542
0.540
0.539
0.537
0.537
0.536
0.535
0.534
0.534
0.533
0.533
0.532
0.532
0.532
0.531
0.531
0.531
0.531
0.530
0.530
0.530
0.529
0.527
0.526
0.524

0.20
1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.851
0.848
0.845
0.842

0.15
1.963
1.386
1.250
1.190
1.156
1.134
1.119
1.108
1.100
1.093
1.088
1.083
1.079
1.076
1.074
1.071
1.069
1.067
1.066
1.064
1.063
1.061
1.060
1.059
1.058
1.058
1.057
1.056
1.055
1.055
1.050
1.045
1.041
1.036

0.10
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.303
1.296
1.289
1.282

0.05
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.684
1.671
1.658
1.645

0.025
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.021
2.000
1.980
1.960

258

ANEXOS / TABLAS

Continuacin de valores crticos de la distribucin t

V
1
2
3
4
5

0.02
15.895
4.849
3.482
2.999
2.757

0.015
21.205
5.643
3.896
3.298
3.003

0.01
31.821
6.965
4.541
3.747
3.365

0.0075
42.434
8.073
5.047
4.088
3.634

0.005
63.657
9.925
5.841
4.604
4.032

0.0025
127.322
14.089
7.453
5.598
4.773

0.0005
636.590
31.598
12.924
8.610
6.869

6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

2.612
2.517
2.449
2.398
2.359
2.328
2.303
2.282
2.264
2.249
2.235
2.224
2.214
2.205
2.197
2.189
2.183
2.177
2.172
2.167
2.162
2.158
2.154
2.150
2.147
2.125
2.099
2.076
2.054

2.829
2.715
2.634
2.574
2.527
2.491
2.461
2.436
2.415
2.397
2.382
2.368
2.356
2.346
2.336
2.328
2.320
2.313
2.307
2.301
2.296
2.291
2.286
2.282
2.278
2.250
2.223
2.196
2.170

3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.423
2.390
2.358
2.326

3.372
3.203
3.085
2.998
2.932
2.879
2.836
2.801
2.771
2.746
2.724
2.706
2.689
2.674
2.661
2.649
2.639
2.629
2.620
2.612
2.605
2.598
2.592
2.586
2.581
2.542
2.504
2.468
2.432

3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.704
2.660
2.617
2.576

4.317
4.029
3.833
3.690
3.581
3.497
3.428
3.372
3.326
3.286
3.252
3.222
3.197
3.174
3.153
3.135
3.119
3.104
3.091
3.078
3.067
3.057
3.047
3.038
3.030
2.971
2.915
2.860
2.807

5.959
5.408
5.041
4.781
4.587
4.437
4.318
4.221
4.140
4.073
4.015
3.965
3.922
3.883
3.849
3.819
3.792
3.768
3.745
3.725
3.707
3.690
3.674
3.659
3.646
3.551
3.460
3.373
3.291

259

ANEXOS / TABLAS

APNDICE C
Tabla de valores crticos de la distribucin ji cuadrada

260

ANEXOS / TABLAS

261

BIBLIOGRAFIA.

Chapra, S. y Canales R.; Mtodos numricos para ingenieros. Mc Graw Hill


Irwin R. Miller, John E. Freud, Richard Jhonston; Probabilidad y Estadistica para ingenieros; Ed.
Prentice Hall;
Mendenhall, Sincich; Probabilidad y estadstica para ingeniera y ciencias ; Ed. Prentice Hall.
Meyer.: Probabilidad y aplicaciones Estadsticas. Ed. Addison-Wesley.
Murray Spiegel.; Probabilidad y estadstica .;Ed. McGraw Hill.
Nieves Dominguez; Numricos para ingenieros; Mc Graw Hill
Paul L. Meyer; Probabilidad y aplicaciones Estadisticas. Ed. Fondo Educativo Interamericana.
Richard I. Levin, David S. Rubin; Estadistica para administradores; Prentice Hall.
Walpole , Myers.; Probabilidad y estadstica para ingenieros Prentice Hall

262

También podría gustarte