Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadisticay Probabilidad
Estadisticay Probabilidad
PROBABILIDADES
Editado Por
G. Aaron Estuardo Morales
Contenido Pgina
1
Autoevaluacin 1 128
Autoevaluacin 2 131
2
Unidad N1: Estadstica Descriptiva
Introduccin
La Estadstica, nace de las necesidades reales del hombre. La variada y cuantiosa informacin
relacionada con ste y que es necesaria para la toma de decisiones, hace que la estadstica sea hoy, una
importante herramienta de trabajo.
Entre las tareas principales de la Estadstica, est el de reunir la informacin integrada por un
conjunto de datos, con el propsito de obtener conclusiones vlidas del comportamiento de stos, como
tambin hacer una inferencia sobre comportamientos futuros.
En cuanto al uso y la aplicacin, puede decirse que abarca todo el mbito humano encontrndose
en las relaciones comerciales, financieras, polticas, sociales, etc. siendo fundamental en el campo de la
investigacin y en la toma de decisiones.
3
Estadstica
1) Poblacin o Universo: Conjunto completo de individuos, objetos, o medidas los cuales poseen
una caracterstica comn observable y que sern considerados en un estudio.
3) Variable: Caracterstica o fenmeno de una poblacin o muestra que ser estudiada, la cual
puede tomar diferentes valores.
4) Datos: Nmeros o medidas que han sido recopiladas como resultado de la observacin.
5) Estadstico: Es una medida, un valor que se calcula para describir una caracterstica a partir de
una sola muestra.
4
Recopilacin de Informacin
La Estadstica Descriptiva tiene como funcin el manejo de los datos recopilados en cuanto se
refiere a su ordenacin y presentacin, para poner en evidencia ciertas caractersticas en la forma que sea
ms objetiva y til.
Una poblacin o universo objeto de una investigacin estadstica puede ser finita si sus
elementos se pueden contar. Por ejemplo, nmero de alumnos de un curso.
Una poblacin o universo es infinita cuando no es finita. En Estadstica, el sentido del trmino
poblacin infinita se refiere a una poblacin con un nmero tan grande de elementos que no le es posible al
investigador someter a medida cada uno de ellos.
Cuando se miden cualitativamente las caractersticas de una poblacin, resultan categoras que
deben ser exhaustivas, es decir, que se pueda clasificar a toda la poblacin, y tambin deben ser
mutuamente excluyentes, es decir, un mismo elemento no puede pertenecer simultneamente a dos o ms
categoras. Por ejemplo, sexo de una persona: masculino o femenino.
Una muestra debe cumplir ciertas condiciones, de aqu surge el concepto de muestra aleatoria
que es aquella obtenida de modo que cada elemento de la poblacin tiene una oportunidad igual e
independiente de ser elegido.
La investigacin puede ser tan simple como la recopilacin de datos estadsticos obtenidos de
informaciones provenientes de fuentes oficiales a nivel institucional o de publicaciones de organismos
altamente especializados en estas materias, o tan complejas que requiera de la colaboracin de especialistas
en diferentes materias, como ocurre en los censos de poblacin de un pas.
5
Variables
Es muy probable que un especialista en Estadstica que realiza una encuesta desee desarrollar un
instrumento que le permita hacer varias preguntas y manejar diversos fenmenos o caractersticas. A estos
fenmenos o caractersticas se les denomina variables aleatorias.
1) Variables Cualitativas: son aquellas que pueden expresarse slo en forma de atributo.
Ejemplo:
1) Estado civil :
c soltero
c casado
c viudo
c separado
3) Tamao de un tablero :
c grande
c mediano
c pequeo
2) Variables Cuantitativas, son aquellas variables que pueden expresarse en forma numrica Se
dividen en discretas y continuas.
2.1) Variables Cuantitativas Discretas, son respuestas numricas que surgen de un proceso de
conteo, siendo siempre un nmero entero.
Ejemplos :
2.2) Variables Cuantitativas Continuas, son respuestas numricas que surgen de un proceso de
medicin, las cuales pueden tomar valores entre dos nmeros enteros.
Ejemplo :
1) Estatura
2) Temperatura
3) Peso
6
Tabulacin de los datos
En los experimentos estadsticos los datos recolectados pueden corresponder a una poblacin o
muestra. En ambos casos los procedimientos de resumen de datos son anlogos y designaremos por:
Con el objeto de realizar un mejor estudio de los datos es necesario organizar stos, mediante el
uso de distribuciones de frecuencia.
Una distribucin de frecuencia es una tabla resumen en la que se disponen los datos divididos en
grupos ordenados numricamente y que se denominan clases o categoras.
Ejemplo:
Considrese una muestra trabajadores de una cierta empresa de la regin los cuales han sido
encuestados sobre su actual estado civil. La informacin es tabulada de la siguiente manera:
Estado Civil
Soltero
Casado
Viudo
Separado
Total
7
B) Tabulacin de variable cuantitativa
Distinguiremos dos casos:
~ ~ nmero de clases distintas
~
~ Obs: a) ~
b)
- ~
~
/ ~ Obs: a) / ~
~
b) /
Ejercicio
Una empresa que tiene trabajadores se propone reestructurar las remuneraciones, se estudia los
aos de servicio de los trabajadores determinndose los siguientes resultados:
8
5 ~ (tamao de la poblacin)
Se pide:
c Tabular la informacin.
c Si aquellos trabajadores que tengan a lo menos siete aos de servicio reciben un aumento del
% . Qu porcentaje de los trabajadores recibi dicho aumento?.
c Si todos los trabajadores que tengan a lo ms cinco aos de servicio reciben una bonificacin
de $ . Qu cantidad de trabajadores recibi dicha bonificacin?.
c Si la empresa decide otorgar una bonificacin especial de $ por cada ao de servicio.
Cunto ser el dinero necesario para cumplir dicha bonificacin?.
Solucin
c
Aos de servicio - /
Total
c $
se necesitan para la bonificacin por ao de servicio.
9
B.2) Tabulacin de variable continua o discreta
Para tabular una variable continua o discreta (que tome un gran nmero de datos distintos) se
necesitan los siguientes elementos:
a) Rango o recorrido : Es la diferencia entre el valor mximo y valor mnimo que toma la
variable.
9 ~ %mx c %mn
b) Nmero de intervalos o clases () : Es el nmero de grupos en que es posible dividir los
valores de la variable.
El nmero de clases no debe ser ni muy grande ni muy pequeo, un nmero pequeo de clases
puede ocultar la naturaleza general de los datos y un nmero muy grande puede ser demasiado detallado
como para revelar alguna informacin til. Como regla general se recomienda que el nmero de clases est
entre cinco y veinte. Hay una regla llamada Regla de Sturges que puede dar una aproximacin razonable
para el nmero de clases, ella es:
Recorrido 9
~ ~
N de clases
d) Lmites de un intervalo : Son los valores extremos de una clase. El menor valor es considerado
como el lmite inferior y el valor que se obtiene sumando al lmite inferior la amplitud del intervalo es el
lmite inferior de la segunda clase.
Observacin: ~ ~ tamao de la muestra
~
10
h) Frecuencia relativa : es la proporcin de datos que se encuentra en un intervalo, se
determina dividiendo la frecuencia absoluta del intervalo por el tamao de la muestra.
~
- ~ Obs: - ~
~
/ ~
~
Ejemplo
Los siguientes datos corresponden a las notas obtenidas por alumnos en un curso de
Estadstica
11
c Cuntos alumnos tienen una nota superior a
?
c Interprete la frecuencia acumulada del sexto intervalo.
Solucin:
9 ~ c ~
~
~ b ~
~ ~
c
c
c
c
c
c
c
Total
c Existen
alumnos con nota inferior a .
c El
% de los alumnos tiene una nota inferior a
.
12
Ejercicios
1) Los siguientes datos corresponden al sueldo (en miles de pesos) de trabajadores de una
empresa
2) En una industria es necesario realizar un estudio respecto al peso de engranajes de gran tamao.
Los siguientes datos corresponden al peso, en kilgramos, de de estas piezas, que poseen las mismas
dimensiones, pero distinta aleacin.
3) En una industria automotriz es necesario realizar un estudio debido a una partida defectuosa de
discos de embrague. Para ello se ha recopilado la siguiente informacin referente a la duracin en horas de
de ellos.
13
4) En un conjunto habitacional se pretende hacer un estudio del nmero de personas que
consumen productos enlatados. Los datos que han sido obtenidos de 50 bloques del conjunto habitacional
son
14
Solucin
1) a) 9 ~
c
~
5 ~
~ b ! ~
~ ~
15
3) a) Duracin Lmites reales % - /
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
Total
4) a) N de personas - /
c
c
c
c
c
c
c
c
Total
b) La frecuencia absoluta del tercer intervalo es , es decir, existen compaas cuyas ganancias
estn entre y
por accin.
c) El
% de las compaas tienen a lo ms una ganancia de
por accin.
d) compaas tienen a lo menos una ganancia de por accin.
e) compaas tienen una ganancia igual o menor a por accin.
f) El
% de las compaas tienen una ganancia por accin de a lo ms .
16
Representacin Grfica
Su objetivo es captar la informacin obtenida en los datos en forma rpida por cualquier persona,
as cada representacin debe llevar un ttulo adecuado.
Tipos de grficos
Departamento %
A (1)
B (2)
C (3)
D (4)
E (5)
Total
Pe rs o n a l p o r D e p a rta m e n to
5
1
9%
1 5%
4
1 5%
1
2
3
2
4
2 8%
5
3
3 3%
17
b) Pictograma: es un grfico cuyo uso es similar al de sector circular, pero la frecuencia es
representada por medio de una figura o dibujo que identifique a la variable en estudio. Este grfico se
utiliza para mostrar producciones en una serie cronolgica.
~ alumnos
1996:
1997:
1998:
1999:
2000:
2001:
18
c) Grfico lineal: se utiliza para mostrar las frecuencias absolutas o relativas de una variable
discreta, son representadas mediante lneas verticales proporcionales a dichas frecuencias.
%
Total
%
19
d) Grfico de barra: Se utiliza para representar tablas de frecuencia con atributos o con
variables discretas y pocos valores. Sobre un eje horizontal se construyen bases de rectngulo del mismo
ancho cada uno correspondiente a una modalidad del atributo, sobre estas bases se levantan rectngulos
cuya altura es proporcional a la frecuencia absoluta de la modalidad. El espacio entre ellas debe ser
uniforme.
Departamento
A
B
C
D
E
Total
140
120
100
Fre cue ncia
80
60
40
20
0
A B C D E
De partam e nto
20
e) Histograma: es el grfico adecuado cuando los datos estn ordenados en tablas con intervalos,
es decir, para datos de variables continuas. Tambin el histograma es una conformacin de rectngulos,
pero uno al lado de otro cuya rea es proporcional a la frecuencia de cada intervalo. Los extremos de la
base de cada rectngulo son los lmites reales del intervalo.
Lmites Reales
c
c
c
c
c
c
Total
Fre cue ncia Absoluta
H IS T O G R AMA
12
10
0
8,5 12,5 16,5 20,5 24,5 28,5
21
f) Polgono de frecuencia: este grfico sirve para mostrar la tendencia de la variable, se puede
determinar a partir de un histograma uniendo los puntos medios superiores de cada rectngulo del
histograma. Tambin, se determina el polgono uniendo los puntos formado por la marca de clase con la
frecuencia absoluta del intervalo respectivo.
Lmites reales %
c
c
c
c
c
c
Total
P o lg o n o d e F re c u e n c ia s
F r e c u e n c ia Ab s o lu ta
12
10
0
2 ,5 6 ,5 1 0 ,5 1 4 ,5 1 8 ,5 2 2 ,5 2 6 ,5 3 0 ,5
M a r c a s d e C la s e s
22
Observacin: El polgono de frecuencias se convierte en polgono de frecuencias relativas,
cambiando la frecuencia absoluta por la frecuencia relativa, en este caso, el rea bajo el polgono de
frecuencias relativas es igual a .
10
Fre cue ncia Absoluta
0
Lm ite s Re a le s
23
e) Ojiva: es un grfico que se usa para mostrar como se acumulan las frecuencias absolutas,
relativas o porcentuales. Se obtiene al unir los puntos formados por los lmites superiores de cada intervalo
con la frecuencia absoluta o relativas acumuladas del intervalo respectivo. Si se consideran las frecuencias
porcentuales acumuladas se llama ojiva porcentual.
Lmites reales % -
c
c
c
c
c
c
Total
Ojiva
Fr e cue ncia Acum ulada
40
36
32
28
24
20
16
12
0
4 8 12 16 20 24 28
L m ite s Su p e r io r e s
24
Ejercicios
a) Tabular la informacin.
b) Realizar grfico circular.
c) Indique frecuencias relativas porcentuales en cada grupo.
M A P CC A CC M P P M
P CC M A M CC P P M P
A P A M M A M A P M
M A CC A A M P M M P
25
3) Los siguientes datos corresponden a la duracin, en horas, de vlvulas que fueron sometidas
a un cierto control.
4) Se realizaron dos experimentos referente al peso, en Kg., aplicado sobre una cierta cantidad de
tableros.
Peso (Kg.) A B
c
c
c
c
c
c
Total
26
5) Dado el siguiente Polgono de Frecuencias:
N Alu mn o s P es o s d e lo s Alu m n o s d e C . C iv il
10
9
8
7
6
5
4
3
2
1
0
3 5 ,5 4 5 ,5 5 5 ,5 6 5 ,5 7 5 ,5 8 5 ,5 9 5 ,5
Pe s o (K g .)
27
Solucin
1) a) Departamento
A
CC
M
P
Total
b) Grfico Circular
A
P
25%
28%
A
CC
M
CC
P
13%
M
34%
c) Departamento %
A
CC
M
P
Total
28
2) a) Volumen % - / Lmites reales
c c
c c
c
c
c
c
c
c
Total
M a rca s de Cla se s
29
3) a) Tiempo % - / Lmites reales
c
c
c
c
c
c
c
c
c
c
c
c
c
c
Total
b) Ojiva
Du ra ci n V lvu la s
60
50
Fr e cu e n cia A cu m u lad a
40
30
20
10
0
449,5 499,5 549,5 599,5 649,5 699,5 749,5 799,5
L m ite s Su p e r io r e s
30
4) a) Histograma
E xperimento A
12
Frecuencia Absoluta
0
19,5 24,5 29,5 34,5 39,5 44,5
b) Ojiva Porcentual
Ex pe rim e nto B
Fr e c. Acum . Por c.
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
14,5 19,5 24,5 29,5 34,5 39,5 44,5
L m ite s Su p e r io r e s
31
c) Polgonos de Frecuencia
Ex pe rim e nto A y B
Fr e cue ncia
12
11
10
9
8
7
6
5
4
3
2
1
0
12 17 22 27 32 37 42 47
M ar cas de Clas e s
Se r ie 1 Se r ie 2
d) Ojivas
Experimento A y B
45
40
35
Frecuencia Acumulada
30
25
20
15
10
5
0
14,5 19,5 24,5 29,5 34,5 39,5 44,5
Lmites Superiores
Serie1 Serie2
32
5) a) Los lmites reales del cuarto intervalo son c
b) alumnos de C. Civil tienen pesos que van desde kilos hasta kilos
33
Medidas de tendencia central y de dispersin
En todo anlisis y/o interpretacin se pueden utilizar diversas medidas descriptivas que
representan las propiedades de tendencia central, dispersin y forma para extraer y resumir las principales
caractersticas de los datos. Si se calculan a partir de una muestra de datos, se les denomina estadsticos; si
se les calcula a partir de una poblacin se les denomina parmetros.
La mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de un
punto "central" y por lo general es posible elegir algn valor que describa todo un conjunto de datos. Un
valor tpico descriptivo como ese es una medida de tendencia central o "posicin". Las medidas de
tendencia central a estudiar son: media aritmtica, mediana y moda.
Media aritmtica
% b % b b % %
Media muestral: % ~ ~ ; ~ tamao de la muestra
~
5
% b % b b %5 %
Media poblacional: ~ ~ ; 5 ~ tamao de la poblacin
5 5
~
Ejemplo Calcular la media aritmtica de los siguientes datos relacionados con las notas de test en
Estadstica obtenidas por un cierto alumno:
b b
b b b
%~ ~
34
b) Para datos agrupados:
Si los datos estn ordenados en tablas de frecuencia la media aritmtica se obtiene como sigue
Muestra Poblacin
% b % b b % % %
%~ ~ ~
b b b 5
~ ~
Ejemplo Calcular la media aritmtica para el peso de trabajadores, segn tabla adjunta:
Peso (Kg.) % %
c
c
c
c
c
Total
%
%~ ~ ~
~
% % % % %
valores
b b b b
%~ ~ ~
Por lo tanto, % ~
35
Propiedad 2 La media aritmtica de una variable ms una constante es igual a la media
aritmtica de la variable ms la constante.
% % % % %
& % b % b % b % b
&
&~
~
% b
~ % b ! b % b ! b b % b !
&~ ~
% b % b % b b % b
~
%
~ b
~
~%b
Propiedad 3 La media aritmtica de una variable por una constante es igual al producto de la
constante por la media de la variable.
% % % %
' % % %
% b % b b %
'~
% b % b b %
~
~ %
% h b % h b b % h
%~
b b b
36
Ventajas y desventajas del uso de la media aritmtica:
Ventajas Desventajas
- Estable muestra a muestra - No aplicable a atributos
- Fcil clculo e interpretacin - Influyen en su valor los valores extremos
Ejemplos:
Solucin:
c) % ~ h
c ~
La nueva media aritmtica es $
Solucin:
h b
h b
h
%~ ~ ~
b b
37
Mediana
Su smbolo es 4 .
Se deben ordenar los datos de forma creciente o decreciente. Para muestras con un nmero par de
observaciones, la mediana es el dato que queda en el centro de dicha ordenacin y para muestras con
nmero impar de observaciones la mediana es el promedio de los dos datos centrales.
Ejemplos
datos
datos ordenados
4 ~ ? b ~ ? ~
? b ? b
2) Para muestra con nmero par de datos: 4 ~
datos
datos ordenados
? b ? b ? b ? b
4 ~ ~ ~ ~
38
Ejemplo Distribucin de frecuencias de la duracin, en horas, de uso continuo de
dispositivos electrnicos iguales, sometidos a un cierto control.
Duracin -
c
c
c
c
c
c
c
c
c
c
Total
c
~ 4 ~
b 8 9 h
- ~ 4 ~
horas
~
3
~
39
Moda
La moda es el valor de un conjunto de datos que aparece con mayor frecuencia. Se le obtiene
fcilmente a partir de un arreglo ordenado. A diferencia de la media aritmtica, la moda no se afecta ante la
ocurrencia de valores extremos. Sin embargo, slo se utiliza la moda para propsitos descriptivos porque
es ms variable, para distintas muestras, que las dems medidas de tendencia central. Un conjunto de datos
puede tener ms de una moda o ninguna.
Su smbolo es 4 .
Ejemplos
1) datos
4 ~
2) datos
4 ~ y
3) datos 4 ~
4) datos 4 ~ no existe
Caso a) 4 ~ 3 b 8 9h
b
b
Caso b) 4 ~ 3 b 8 9h
c b b
40
Ejemplo Sea la tabla:
Duracin -
c
c
c
c
80 9
c
c
c
c
c
c
Total
~ 4 ~
b 8 9 h
b
~ c ~ 4 ~ horas
~ c ~
3 ~
~
Caso b): ~
b ~ ~
c ~ ~
3 ~
~
4 ~
b 8 9 h
b
4 ~ horas
41
Ejercicios
1) En una industria dos operarios en siete das de trabajo, son capaces de producir, por da, y en
forma individual la siguiente cantidad de rboles para fresa de mm de longitud por mm de
dimetro.
Operario A
Operario B
Determine
2) Se hace una encuesta entre personas acerca del nmero de horas diarias que se dedican a
ver televisin, obtenindose la siguiente informacin
N de horas
c
c
c
c
c
c
Total
3) De un total de datos, 20 son 4, 40 son 5, 30 son 6 y el resto 7. Hallar la media y la moda.
y
kilos. Hallar el peso medio de los estudiantes.
42
6) La siguiente tabla corresponde a la estatura de estudiantes de una determinada carrera.
Estatura
c
c
c
c
c
c
Total
c
c
c
Total
43
Solucin
% A ~ % B ~
4 B ~
% ~ 4 ~ (Caso a) 4 ~
(Caso b) 4 ~
% ~ 4 ~
% ~ 4 ~ 4 no existe
% ~ 4 ~ 4 ~
Hombre Mujer
%
4
4 (caso a)
4 (caso b)
y
44
Medidas de dispersin
Los estadgrafos de dispersin nos indican si la distribucin o conjunto de datos forma grupos
homogneos o heterogneos. Las medidas de dispersin a estudiar son: rango, desviacin media, varianza
y desviacin estndar.
Rango
Indica el nmero de valores que toma la variable. El rango es la diferencia entre el valor mximo
y el valor mnimo de un conjunto de datos.
9 ~ %mx c %mn
Si los datos estn agrupados en una tabla de frecuencias, el recorrido es la diferencia entre el
lmite real superior del ltimo intervalo y el lmite real inferior del primer intervalo.
9 ~ 3mx c 3mn
Ejemplo:
%mx ~ %mn ~ 9 ~ c ~
45
El rango mide "la dispersin total" del conjunto de datos. Aunque el rango es una medida de
dispersin simple y que se calcula con facilidad, su debilidad preponderante es que no toma en
consideracin la forma en que se distribuyen los datos entre los valores ms pequeos y los ms grandes.
Desviacin Media
Es la media aritmtica de los valores absolutos de las desviaciones de todos los datos respecto a la
media aritmtica. Su smbolo es +4 .
O % c % O
~
+4 ~
b b b b
%~ ~
O c
O b O c
O b O c
O b O c
O b O
c
O
+4 ~
+4 ~
+4 ~
O % c % O
~
+4 ~ donde % es la marca de clase
Pesos (Kg.)
c
c
c
c
c
Total
46
Pesos (Kg.) % % h % c % O % c % O
c
c
c
c
c
Total
%~ ~
+4 ~ ~
Dos medidas de dispersin que se utilizan con frecuencia y que s toman en consideracin la
forma en que se distribuyen los valores son la varianza y su raz cuadrada, la desviacin estndar. Estas
medidas establecen la forma en que los valores fluctan con respecto a la media.
Varianza
La varianza se define como el promedio aritmtico de las diferencias entre cada uno de los valores
del conjunto de datos y la media aritmtica del conjunto elevadas al cuadrado.
Su smbolo es : si estamos trabajando con una muestra y 2 si estamos trabajando con una
poblacin.
% c %
~
: ~ donde % representa los datos de la muestra.
c
5
% c
~
~ donde % representa los datos de la poblacin.
5 c
47
Ejemplo Determine la varianza del siguiente conjunto de datos:
b b b b b
%~ ~
: ~ : ~
( en unidades al cuadrado )
Muestra Poblacin
% c % % c
~ ~
: ~ ~
c 5 c
Edades ( aos )
c
c
c
c
c
Total
Edades ( aos ) % % h % c % % c %
c
c
c
c
c
Total
%~ ~
aos
: ~ ~
( en aos2 )
48
Las frmulas anteriores para calcular la Varianza muestral tienen una forma abreviada:
% c % % c %
~ ~
: ~ : ~
c c
Propiedades de la Varianza
= % ~ :%
= % ~ si % ~ constante
= % ~ = %
= % b ~ = %
= % b ~ = %
Las unidades de medida de la varianza son las unidades al cuadrado de los datos.
Solucin:
a) = % ~
h ~
La nueva varianza es $
b) = % ~
La nueva varianza es $
c) = % ~
h
~ La nueva varianza es $
49
Desviacin Tpica o Desviacin Estndar
Es la raz cuadrada positiva de la Varianza. Su smbolo es : si se est trabajando con una muestra
y es si se est trabajando con una poblacin.
q
q
q
q % c %
q
~
:~p donde % representa los datos de la muestra.
c
q
q 5
q
q % c
q
~
~p donde % representa los datos de la poblacin.
5 c
: ~ l
~
( unidades )
Muestra Poblacin
q q
q q
q q
q % c % q % c
q q
~ ~
:~p ~p
c 5 c
: ~ l
~ ( aos )
50
Qu indican la Varianza y la Desviacin Estndar?
La varianza tiene ciertas propiedades matemticas tiles. Sin embargo, al calcularla se obtienen
unidades al cuadrado cm2 , pulgadas2 , mm2 , (edades)2 , (horas)2 , etc. por ello, en la prctica, la principal
medida de dispersin que se utiliza es la desviacin estndar, cuyo valor est dado en las unidades
originales cm, pulgadas, mm, edades, horas, etc.
Edades ( aos )
c
c
c
c
c
Total
51
Criterio de Homogeneidad
9 ~ c ~
: ~
9 9
@ A ~
:
Edades ( aos )
c
c
c
c
c
Total
9 ~ c ~ ( aos ) : ~ ( aos )
9 9
@ A ~
Observaciones
1) Cuanto ms separados o dispersos estn los datos, es decir, para muestras heterogneas, tanto
mayores sern el rango, la varianza y la desviacin estndar.
2) Si los datos estn ms concentrados, es decir, para muestras homogneas, tanto menores sern
el rango, la varianza y la desviacin estndar.
3) Si todas las observaciones son iguales ( de manera que no haya variacin en los datos ), el
rango, la varianza y la desviacin estndar sern iguales a cero.
52
Ejercicios
1) En una industria dos operarios en siete das de trabajo, son capaces de producir, por da, y en
forma individual la siguiente cantidad de rboles para fresa de mm de longitud por mm de
dimetro.
Operario A
Operario B
Determine
2) Se hace una encuesta entre personas acerca del nmero de horas diarias que se dedican a
ver televisin, obtenindose la siguiente informacin
N de horas
c
c
c
c
c
c
Total
y
kilos. Hallar la varianza de los estudiantes.
53
6) La siguiente tabla corresponde a la estatura de estudiantes de una determinada carrera:
Estatura
c
c
c
c
c
c
Total
c
c
c
Total
Obtener las medidas de dispersin ( rango, varianza y desviacin estndar ) tanto para los
hombres como para las mujeres. Determine, adems si las muestras son homogneas o no.
54
Solucin
9A ~
9B ~
A ~
A ~
B ~
~
~
~
~
9 ~ ~ ~
Hombres Mujeres
9
55
Autoevaluacin
U. de Chile, Colo Colo, U. Catlica, ublense, Colo Colo, U. de Chile, Colo Colo
Colo Colo, U. de Chile, Colo Colo, U. Catlica, ublense, Colo Colo, U. de Chile, U. de Chile, U. de
Chile, Colo Colo, U. Catlica, ublense, Colo Colo, U. de Chile, U. Catlica, Colo Colo, U. de Chile,
Concepcin
3) Los impuestos pagados por un grupo de contribuyentes han dado origen a la siguiente tabla de
frecuencia:
Monto de impuestos en miles N personas
1 - 20 4
21 - 40 15
41 - 60 21
61 - 80 18
81 - 100 2
Total 60
Determine:
a) Desviacin Estndar Muestral y explique su significado
b) Determine si la muestra es homognea o heterognea. Justifique su respuesta.
56
Solucin:
1) a) Categoras - /
U. de Chile
Colo Colo
U. Catlica
ublense
Concepcin
Total
b)
F re cu e n cia
E q u ip o s d e F tb o l F a v o rito s
10
9
8
7
6
5
4
3
2
1
0
il e
lo
o
h
C
C
lo
e
.D
C a te g o ra s
C
U
2) a) % ~
El salario promedio es de $
c) 4 ~
y
Los salarios ms comunes son $
y $
3) a) : ~
La desviacin estndar es un estadstico que nos indica que tan dispersos estn
los datos, con respecto a la media aritmtica.
57
Unidad N2: Probabilidades
Elementos de Probabilidades
Los primeros estudios de probabilidad fueron motivados por la posibilidad de acierto o fracaso en
los juegos de azar. La probabilidad es un mecanismo por medio del cual pueden estudiarse sucesos
aleatorios, es decir, operaciones cuyo resultado no puede ser predicho de antemano con seguridad. Por
ejemplo, el lanzamiento de una moneda.
Enfoques de probabilidad
1) Experimento aleatorio o experimento: cualquiera operacin cuyo resultado no puede ser
predicho de anterioridad con seguridad.
Ejemplo:
a) lanzamiento de una moneda
b) lanzamiento de un dado
c) extraccin de una carta de una baraja de 52 cartas
Ejemplo:
a) experimento:lanzamiento de un dado
+ ~
Ejemplo:
A ~ obtener un nmero impar al lanzar un dado
A ~
Como los eventos son subconjuntos de +, entonces es posible aplicar la teora de conjuntos para
obtener nuevos eventos.
Si A y B son eventos, entonces tambin lo son A r B, A q B, Ac
A r B ocurre si, y slo si slo ocurre A o slo ocurre B u ocurren A y B a la vez.
A q B ocurre si, y slo si ocurre A y ocurre B a la vez.
Ac ocurre si, y slo si no ocurre A.
58
En todo experimento aleatorio + se considera el conjunto universal, por lo tanto, todos los
complementos son tomados respecto a +.
Ejemplo
c) Encuentre, si es posible, A r B, C q D, Bc , Bc q Cc
r ! ! ! ! !
! u
t ! ! ! ! !
! w
t w
t ! ! ! ! !
! w
+ ~ Pt w Q
t ! ! ! ! !
! w
t w
! ! ! ! !
!
s
!
!
!
!
!
! v
! ! ! ! !
!
A ~ J ! ! ! ! !
! K
! ! !
!
!
!
B ~ ! ! ! ! !
!
! ! !
C ~ J ! ! ! I
! ! !
D ~ ! !
! ! !
!
ArB~A
C q D ~ ! !
Bc ~ % &!% &
r ! ! ! !
! ! u
c t !
c
! ! !
! ! w
B qC ~t w
! ! !
! ! !
s
!
!
!
!
!
! v
59
Concepto de probabilidad en espacio finito equiprobable
Si + es un espacio muestral con elementos, entonces la probabilidad de un evento A es el
cuociente , donde es el nmero de elementos de A
Esto se denota: P A! ~
Ejemplo
+ ~ lanzamiento de un dado + ~
P A! ~ ~
Axiomas de probabilidad
Sea + un espacio muestral y sean A y B dos eventos cualesquiera de este:
Axioma1 P +! ~
Axioma2 P A! DA +
Axioma3 P A r B! ~ P A! b P B! si A q B ~ J
B
En general, P8 r ( 9 ~ P ( ! b P ( ! b P ( ! b b P ( ! con
~
( q ( ~ J D
Teorema1
a) P J! ~
Demostracin
+~+rJ
P +! ~ P + r J!
P + ! ~ P +! b P J ! pues + q J ~ J
~b
~ P J!
60
b) P Ac ! ~ 1 c P A!
Demostracin
+ ~ A r Ac
P +! ~ P A r A c !
P + ! ~ P A! b P A c ! pues A q Ac ~ J
~ P A! b P A c !
1 c P A! ~ P A c !
c) Si A B, entonces P A ! P B!
Demostracin
B ~ A r B c A!
P B! ~ P[A r B c A!]
P B! ~ P A! b P B c A! pues A q B c A! ~ J
Luego P A ! P B!
Corolario
P A! 1
Demostracin
JA+
P J! P A! P +!
0 P A! 1
61
Teorema 2
a) P A r B! ~ P A! b P B! c P A q B!
Demostracin
A r B ~ A r B c A!
P A r B! ~ P[A r B c A!]
P A r B! ~ P A! b P B c A! pues A q B c A! ~ J
P A r B! c P A! ~ P B c A! 1!
B ~ A q B! r B c A!
P B! ~ P A q B! b P B c A! pues A q B! q B c A! ~ J
P B! c P A q B! ~ P B c A! 2!
de 1! y 2!
P A r B! c P A! ~ P B! c P A q B!
P A r B! ~ P A! b P B! c P A q B!
62
b) P A c B! ~ P A! c P A q B!
Demostracin
A r B ~ A c B! r B
P A r B! ~ P[ A c B! r B]
P A! b P B! c P A q B! ~ P A c B! b P B! pues A c B! q B ~ J
P A! c P A q B! ~ P A c B!
Corolario
P A r B r C! ~ P A! b P B! b P C! c P A q B! c P A q C! c P B q C! b P A q B q C!
Demostracin
A r B r C ~ A r B! r C
P A r B r C! ~ P[ A r B! r C]
~ P A r B! b P C! c P[ A r B! q C]
~ P A! b P B! c P A q B! b P C! c P[ A q C! r B q C!]
~ P A! b P B! c P A q B! b P C! c P A q C! b P B q C! c P A q B q C!
~ P A! b P B! b P C! c P A q B! c P A q C! c P B q C! b P A q B q C!
63
Teorema3
P A! ~ P A1 ! b P A2 ! b P A3 ! b b P Ak !
~ P Ai ! Donde Ai son eventos disjuntos cuya unin es A
~
Demostracin
A ~ A1 r A2 r A3 r ... r Ak
P A! ~ P A1 r A2 r A3 r ... r Ak !
P A! ~ P A1 ! b P A2 ! b P A3 ! b b P Ak ! pues Ai q Aj ~ J
P A! ~ P A i !
~
Ejemplos
a) P Ac r Bc !
b) P Ac r B !
c) P Ac q B !
d) P Ac q Bc !
Solucin
a) P Ac r Bc ! ~ P[ A q B!c ]
~ 1 c P A q B!
~c'
b)P Ac r B ! ~ P[ A c B!c ]
~ 1 c P A c B!
~ c P A! c P A q B!
~c%b'
c) P Ac q B ! ~ P B c A!
~ P B! c P A q B!
~&c'
64
d) P Ac q Bc ! ~ P[ A r B!c ]
~ c P A r B!
~ c P A! c P B! b P A q B!
~c%c&b'
Solucin
a) P A r B! ~ P A! b P B! c P A q B!
~ b c
~
c) P A c B! b P B c A! ~ ! b P B! c P A q B!
~ b c
~
d) P A r B! ~ c P A r B!
~ c
~
65
3) La alimentacin de cierta especie se considera completa si cada individuo consume tres tipos de
alimentos en cantidades adecuadas. En una poblacin se encontr que el 75 % consume alimento tipo A, el
70 % alimento tipoB, el 50 % alimento tipo C, el 50 % alimento tipo A y B, el 30 % alimento tipo A y C, el
30 % alimento tipo B y C y el 15 % consume de los tres tipos de alimentos. Se elige un individuo al azar en
la poblacin, calcular la probabilidad que:
a) consuma slo alimento tipo C.
b) consuma slo un tipo de alimento.
c) consuma al menos dos tipos de alimentos
Solucin
66
Ejercicios
a) P(A U B U C) b) P< Ac q ( B U C ) =
c) P( B U C )
2) Sean A y B eventos tales que P A! ~ P B! ~ P A q B! ~ calcule
a) P Ac ! b) P Bc !
c) P A r B! d) P A c B!
e) P Ac r Bc ! f) P Ac q Bc !
3) De un total de 500 estudiantes, se encuentra que 210 fuman, que 258 toman bebidas
alcohlicas, que 216 toman alimentos entre comidas, que 122 fuman y toman bebidas alcohlicas, que 83
toman alimentos entre comidas y tambin bebidas alcohlicas, que 97 fuman y toman alimentos entre
comidas y que 52 practican estos tres dainos hbitos. Si se escoge aleatoriamente a un miembro de esta
generacin, encuentre la probabilidad de que el estudiante
a) fumen, pero no tome bebidas alcohlicas.
b) tome alimentos entre comidas e ingiera bebidas alcohlicas, pero no fume.
c) no fume y no tome alimentos entre comidas.
5) En una bolsa hay 36 fichas numeradas del 1 al 36, respectivamente. Si se extrae una ficha,
calcular la probabilidad de que la ficha extrada sea
a) un nmero par b) un nmero primo
c) un mltiplo de 5 d) un nmero terminado en 2
e) un nmero divisible por 6 f) un nmero impar mayor que 20.
67
Solucin
1)
a) P(A U B U C) ~ b) P< Ac q ( B U C ) = ~
c) P( B U C ) ~
2)
a) P Ac ! ~ b) P Bc ! ~
c) P A r B! ~ d) P A c B! ~
e) P Ac r Bc ! ~ f) P Ac q Bc ! ~
3)
a) La probabilidad de que fumen, pero no tome bebidas alcohlicas es
b) La probabilidad de que tome alimentos entre comidas e ingiera bebidas alcohlicas, pero no
fume es
c) La probabilidad de que no fume y no tome alimentos entre comidas es
4)
a) La probabilidad de que la industria se localice en ambas ciudades es
5)
a) La probabilidad de que la ficha extrada sea un nmero par es
b) La probabilidad de que la ficha extrada sea un nmero primo es
c) La probabilidad de que la ficha extrada sea un mltiplo de 5 es
d) La probabilidad de que la ficha extrada sea un nmero terminado en 2 es
e) La probabilidad de que la ficha extrada sea un nmero divisible por 6 es
f) La probabilidad de que la ficha extrada sea un nmero impar mayor que 20 es
68
Probabilidad Condicional
P A q B!
P A/B! ~ con P B!
P B!
1) P +/B! ~
P + q B!
P +/B! ~
P B!
P B!
~
P B!
~
P[ A r C! q B]
P[ A r C!/B] ~
P B!
P[ A q B! r C q B!]
~
P B!
P A q B! P C q B!
~ b
P B! P B!
~ P A/B! b P C/B!
Ejemplos
Solucin
D ~ despegar a tiempo
A ~ llegar a tiempo
P A q D!
a) P A/D! ~
P D!
~ ~
La probabilidad de que el avin llegue a tiempo dado que despeg a tiempo es de 0, 94 .
69
P D q A!
b) P D/A! ~
P A!
~
2
~
La probabilidad de que el avin despegue a tiempo dado que lleg a tiempo es de 0,95 .
2) En una oficina hay 100 mquinas calculadoras, algunas de ellas son elctricas E! mientras que
otras son manuales M!. De ellas unas son nuevas N! y otras usadas U!. El nmero de mquinas por
categora est dada en la siguiente tabla:
E M Total
N 40 30 70
U 20 10 30
Una persona entra a la oficina y escoge una mquina al azar, descubre que es nueva. Cul es la
probabilidad que sea elctrica?
P E q N!
P E/N! ~
P N!
~
~
La probabilidad es de 0,57 .
70
a) P H! ~ ~
P H q SP!
b) P H/SP! ~
P SP!
~
~
La probabilidad de que una persona con sobrepeso sea tambin hipertensa es de 0,40 .
P N q Hc !
c) P N/Hc ! ~
P Hc !
~
~
Uno de los usos ms frecuentes de la probabilidad condicional es dar un procedimiento fcil para
asignar probabilidades a intersecciones de eventos. Del concepto de probabilidad condicional es posible
encontrar una expresin til, llamada regla del producto, para la probabilidad de interseccin de eventos,
esta es:
P A q B!
P A/B! ~
P B!
P AB! ~ P AB! h P B!
As,
P A q B q C! ~ P A/B q C! h P B q C!
~ P A/B q C! h P B/C! h P C!
P A q B q C q D! ~ P A/B q C q D! h P B q C q D!
~ P A/B q C q D! h P B/C q D! h P C q D!
~ P A/B q C q D! h P B/C q D! h P C/D! h P D!
71
Ejemplos:
1) Se seleccionan 2 fichas al azar, sin reemplazo, de una urna que contiene 4 blancas y 8 negras.
Calcular la probabilidad de que:
a) ambas sean blancas.
b) la segunda sea blanca.
a) B ~ {fichas blancas}
N ~ {fichas negras}
P B! ~ P N! ~
P B1 q B2 ! ~ P B1 ! h P B2 /B1 !
~ h
~
b) P B1 q B2 ! b P N1 q B2 ! ~ b P N1 ! h P B2 /N1 !
~ b h
~
2) Una caja de fusibles contiene 20 unidades, de las cuales 5 son defectuosas. Si tres de estos
fusibles son tomados al azar, en sucesin y sin reemplazo.
a) Cul es la probabilidad que los tres sean defectuosos?
b) Si en cada una de las dos primeras se extrajo un defectuoso.Cul es la probabilidad que el
tercero extraido sea bueno?
c) Si los dos primeros estaban buenos. Cul es la probabilidad que el tercero extrado sea
defectuoso?
d) Cul es la probabilidad que los dos primeros sean buenos y el tercero defectuoso?
D ~ {fusible defectuoso}
Dc ~ {fusible no defectuoso}
P D! ~ P Dc ! ~
a) P D1 q D2 q D3 ! ~ P D1 ! h P D2 /D1 ! h P D3 /D1 q D2 !
~ h h ~
La probabilidad es de
72
b) P Dc3 /D1 q D2 ! ~
La probabilidad es de un .
c) P D3 /Dc1 q D2c ! ~
La probabilidad es de un .
~ h h
~
La probabilidad es de un .
73
Ejercicios
2) Para parejas de casados que viven en una cierta ciudad de los suburbios., la probabilidad de que
el esposo vote en alguna eleccin es de 0,21, la de que su esposa lo haga, de 0,28 y la de que ambos voten,
de 0,15. Cul es la probabilidad de
a) al menos un miembro de la pareja de casados vote?.
b) vote la esposa, dado que su esposo lo hace?.
c) vote un esposo, dado que su esposa no lo hace?.
3) De una caja que contiene 6 pelotas negras y 4 verdes, se sacan tres en sucesin,
reemplazndose cada pelota en la caja antes de extraer la siguiente.
a) Cul es la probabilidad de que las tres sean del mismo color?.
b) Cul es la probabilidad de que primera pelota sea negra, la segunda verde y la tercera negra?.
c) Repita las mismas preguntas anteriores, pero asuma que no hay reemplazo.
4) Una urna contiene 7 bolas rojas y 3 bolas blancas. Se sacan 3 bolas de la urna . Hallar la
probabilidad de que las dos primeras sean rojas y la tercera blanca.
a) las bolas se devuelven a la urna.
b) las bolas no se devuelven a la urna.
6) Sean A y B eventos con P A! ~ , P B! ~ y P A q B! ~ . Hallar
a) P A/B! b) P B/A!
c) P A r B! d) P Ac /Bc !
e) P Bc /Ac !
7) A un jugador le reparten 5 cartas de una baraja corriente de 52 cartas. Cul es la probabilidad
de que todas sean corazones?.
8) Una clase tiene 15 nias y 19 nios. Si se escogen tres estudiantes al azar.Cul es probabilidad
de que
a) todos sean nios.
b) todos sean nias.
c) al menos uno sea nio
d) dos sean mujeres.
e) al menos dos sean nios.
74
9) Se estima que la probabilidad de que aumenten las ventas de automviles en el siguiente mes es
de 0,40. Se estima que la probabilidad de que aumenten las ventas de refacciones es de 0,30. Se estima que
la probabilidad de que ambas industrias experimenten un aumento en ventas es de 0,10. Cul es la
probabilidad de que
a) hayan aumentado las ventas de automviles durante el mes, dado que existe informacin de que
han aumentado las ventas de refacciones?
b) hayan aumentado las ventas de refacciones, dado que existe informacin de que aumentaron
las ventas de automviles durante el mes?
75
Solucin
a) P B/A! ~
b) P A/B! ~
a) P A r B! ~ b) P B/A! ~
c)P A/Bc ! ~
a) P N1 q N2 q N3 ! b P V1 q V2 q V3 ! ~ ~
b) P N1 q V2 q N3 ! ~ ~
c) P N1 q N2 q N3 ! b P V1 q V2 q V3 ! ~ ~
P N1 q V2 q N3 ! ~ ~
a) P R1 q R2 q B3 ! ~
b) P R1 q R2 q B3 ! ~
a)P A/B ! ~ b) P B/A! ~
c) P A r B! ~
6)
a) P A/B ! ~ b) P B/A ! ~
c) P A r B ! ~ d) P Ac /Bc ! ~
e) P Bc /Ac ! ~
76
7) P C1 q C2 q C3 q C4 q C5 ! ~
8) A ~ nias B ~ nios
a) P B1 q B2 q B3 ! ~
b) P A1 q A2 q A3 ! ~
c) P B1 q A2 q A3 ! b P B1 q B2 q A3 ! b P B1 q B2 q B3 ! ~
d) P B1 q A2 q A3 ! ~
e) P B1 q B2 q A3 ! b P B1 q B2 q B3 ! ~
a) P A/B! ~ b) P B/A! ~
77
Teorema: Probabilidad total! Suponga que los eventos A1 ,A2 ,...,Ak forman una particin de +,
es decir, A1 r A2 r ... r Ak ~ + , A J y Ai q Aj ~ J D . Entonces para cualquier evento E +
se tiene:
P E! ~ P Ai ! h P E/Ai !
~
Teorema de Bayes:
Si A1 ,A2 ,...,Ak es una particin de +, es decir, A1 r A2 r ... r Ak ~ + , A J y Ai q Aj ~ J
D . Entonces para cualquier evento B + se tiene:
P Ai q B!
P Ai /B! ~
P B!
P B q Ai !
P Ai /B! ~
P B q A1 ! b P B q A2 ! b ... b P B q Ak !
P B/Ai ! h P Ai !
P Ai /B! ~
P B/A1 ! h P A1 ! b P B/A2 ! h P A2 ! b ... b P B/Ak ! h P Ak !
Ejemplos:
1) La probabilidad de que Alicia estudie para su examen final de Estadstica es 0,2 . Si estudia la
probabilidad de que apruebe el examen es 0,8, en tanto que si no estudia la probabilidad es 0,5.
a) Cul es la probabilidad que Alicia apruebe estadstica?.
b) Dado que Alicia aprob su examen. Cul es la probabilidad de que haya estudiado?.
E ~ Alicia estudia
Ec ~ Alicia no estudia
A ~ Alicia aprueba estadstica
P E! ~ P Ec ! ~ P A/E! ~ P A/Ec ! ~
a) P A! ~ P A q E! b P A q Ec !
P A! ~ P A/E! h P E! b P A/Ec ! h P Ec !
P A! ~ ! ! b ! !
P A! ~
78
P E q A!
b) P E/A! ~
P A!
P A q E!
~
P A!
P A/E! h P E!
~
P A!
! !
~
~
La probabilidad de que Alicia haya estudiado dado que aprob estadstica es de 0,29 .
2) Componentes complejas son ensambladas en una planta que usa dos lneas de ensamblado A y
B. La lnea A usa equipos ms viejos que la lnea B de manera que es algo ms lenta y menos confiable.
Suponga que en un da dado, la lnea A ha ensamblado 8 componentes de los cuales 2 son defectuosos y 6
son no defectuosos, mientras que la lnea B ha producido 1 componente defectuoso y 9 componentes no
defectuosos. El encargado de ventas selecciona al azar una de estas 18 componentes para una demostracin
y encuentra que es defectuosa. Cul es la probabilidad que esta componente haya sido ensamblada por la
lnea A?.
A ~ lnea A
B ~ lnea B
D ~ artculo defectuoso
P A! ~ P B! ~ P D/A! ~ P D/B! ~
P A q D!
P A/D! ~
P D!
P D q A!
~
P D q A! b P D q B!
P D/A! h P A!
~
P D/A! h P A! b P D/B! h P B!
h
~
h b h
~
79
3) De un grupo gande de habitantes de una ciudad que tiene igual nmero de personas en
administracin, comercio, servicio de salud y servicio municipal se encontr que el 35 % de los
administrativos, el 25 % de los comerciantes, el 20 % del servicio de salud y el 15 % del servicio municipal
eran mujeres.
a) Cul es la probabilidad que una mujer escogida al azar del grupo sea administrativa?
b) Cul es la probabilidad que un individuo del grupo elegido al azar sea hombre?
A ~ administrativo B ~ comerciante
C ~ servicio salud D ~ servicio municipal
M ~ mujer Mc ~ hombre
P A! ~ P B! ~ P C! ~ P D! ~
P M/A! ~ P M/B! ~
P M/C! ~ P M/D! ~
P A q M!
a) P A/M! ~
P M!
P M q A!
~
P M q A! b P M q B! b P M q C! b P M q D!
P M/A! h P A!
~
P M/A! h P A! b P M/B! h P B! b P M/C! h P C! b P M/D! h P D!
! !
~
! ! b ! ! b ! ! b ! !
~
b) P Mc ! ~ c P M!
~ c
~
80
Ejercicios
2) Suponga que se distribuyen pelotas de colores en tres cajas idnticas de la siguiente manera
Una caja se selecciona aleatoriamente, de ella se saca una pelota, tambin aleatoriamente, y se
observa que es roja. Cul es la probabilidad de que la caja 3 sea la que se escogi?.
5) Existen tres teoras econmicas principales I, que la inflacin va a desaparecer pronto; D, que
ocurrir la depresin, y R, que ocurrir la recesin. Las probabilidades de que I, D o R ocurran son 0,40 ;
0,35 y 0,25 , respectivamente. Las probabilidades de que las acciones de la Compaa Goldmine tripliquen
su valor si ocurre I, D o R son 0,90 ;0,60 y 0,20 respectivamente. Si las acciones triplican su valor, cul es
la probabilidad de que la inflacin haya desaparecido?.
81
Solucin
1) M ~ multa
P M! ~
P C3 /R! ~
3) A ~ mquina A B ~ mquina B
P C/D! ~
P O/G! ~
P I/A! ~
6) A ~ mquina A B ~ mquina B
P A/D! ~
82
Eventos Independientes
Ejemplos
1) Si dos dados son lanzados una vez y sean los siguientes eventos
A ~ la suma es 7
B ~ los dos dados muestran el mismo nmero
C ~ el primer dado es par
Son A y B , A y C independientes?
A ~
! ! ! ! !
! P A! ~
B ~ ! ! ! ! !
! P B! ~
! ! ! ! !
!
C ~ J ! ! ! ! !
! K P C! ~
!
!
!
!
!
!
AqB~J P A q B! ~
P A q B! P A! h P B! A y B no son independientes
A q C ~ ! !
! P A q C! ~
P A! h P C! ~ h ~
P A q C! ~ P A! h P C! A y C son independientes
P F q C! ~ P F! ~ P C! ~
83
P F! h P C! ~ ! h
! ~
P F q C! P F! h P C! F y C no son independientes
a) A y Bc son independientes
b) Ac y B son independientes
A ~ A q B! r A c B!
P A! ~ P[ A q B! r A c B!]
P A! ~ P A q B! b P A c B!
P A! ~ P A! h P B! b P A q Bc !
P A! c P A! h P B! ~ P A q Bc !
P A![ c P B!] ~ P A q Bc !
P A! h P Bc ! ~ P A q Bc !
b)
B ~ A q B! r B c A!
P B! ~ P[ A q B! r B c A!]
P B! ~ P A q B! b P B c A!
P B! ~ P A! h P B! b P B q Ac !
P B! c P A! h P B! ~ P B q Ac !
P B![ c P A!] ~ P B q Ac !
P B! h P Ac ! ~ P B q Ac !
84
Ejercicios
1) Sea el caso de lanzar dos monedas corrientes al aire. Sean los eventos
A ~ {todas caras o todas sellos}
B ~ {aparece una cara}
C ~ {aparece a lo menos una cara}
a) Son A y B, A y C, B y C independientes?
Solucin
1) Ninguno es independiente.
85
Variables Aleatorias v.a!
Concepto: una variable aleatoria es una funcin que asocia un nmero real a cada elemento del
espacio muestral.
Se usarn letras maysculas para denotar a una v.a y letras minsculas para denotar los valores
que ella adquiere.
Ejemplos:
1) Se sacan dos pelotas en sucesin, sin reemplazo, de una urna que contiene 4 pelotas rojas y 3
negras. Los resultados posibles y los valores % de la v.a X, donde ? es el nmero de pelotas rojas son:
Espacio muestral %
RR
RN
NR
NN
Espacio muestral
PGM
PMG
MPG
MGP
GPM
GMP
Conceptos:
Una v.a se llama v.a discreta si se puede contar su conjunto de resultados posibles.Una v.a se
llama v.a continua si se puede tomar en una escala continua.
86
En la mayora de los problemas prcticos, las v.a continuas representan datos medidos , tales
como alturas, pesos, temperatursa, distancias o perodos de vida; mientras que las v.a discretas representan
datos que se cuentan ,tales como el nmero de artculos defectuosos de una muestra de k artculos o el
nmero de accidentes por ao en una va rpida en una determinada ciudad.
Una v.a discreta asume cada uno de sus valores con una cierta probabilidad.
Con mucha frecuencia es conveniente representar con una frmula todas las probabilidades de una
v.a ? . Dicha frmula, necesariamente, debe ser funcin de los valores numricos %, y que se representa
por %! %! %!, etc.Por lo tanto, %! ~ P ? ~ %!. Al conjunto de pares ordenados % %!! se le
llama funcin de probabilidad o distribucin de probabilidad de la v.a discreta ? .
%! D% l
%! ~
%
P ? ~ %! ~ %!
Ejemplos
Espacio muestral %
9 ? ~
! ~ P % ~ ! ~ ! ~ P % ~ ! ~
! ~ P % ~ ! ~
%
P ? ~ %!
87
2) De un lote de 25 artculos de los cuales 5 son defectuosos se eligen 4 al azar. Sea @ la v.a que
representa el nmero de artculos defectuosos encontrados. Obtener la distribucin de probabilidades de la
v.a @ si los artculos se eligen sin sustitucin.
9@ ~
P +! ~ P + ! ~
! ~ P & ~ ! ~ P + q + q + q + ! ~ h h h ~
! ~ P & ~ ! ~ P D q + q + q + ! ~ h h h h ~
! ~ P & ~ ! ~
P D q + q + q + ! ~
h h h h ~
! ~ P & ~ ! ~ P D q + q + q + ! ~ h h h h ~
! ~ P & ~ ! ~ P D q + q + q + ! ~ h h h ~
&
P @ ~ &!
88
Distribuciones continuas de probabilidades
Una v.a continua tiene probabilidad cero de asumir cualquiera de sus valores. Luego, su
distribucin de probabilidad no puede darse en forma tabular.
Como una distribucin de probabilidad de una v.a continua no puede presentarse en forma tabular,
si puede tener una frmula. Esta frmula es una funcin, es decir, %! y para este tipo de variables se
llama funcin de densidad de probabilidad o funcin de densidad .
Las reas bajo la curva representarn las probabilidades, por lo tanto, el grfico de la funcin de
densidad se ubica siempre sobre el eje X
Una funcin de densidad se construye de tal forma que el rea comprendida bajo la curva es
siempre igual a uno, cuando se calcula sobre todo el recorrido de la v.a ? .
As P % ! ~ %! %
89
Concepto : La funcin %! es una funcin de densidad de probabilidad para la v.a continua ? ,
definida en el conjunto de los nmeros reales, si:
%! D% l
bB
%! % ~
cB
P % ! ~ %! %
Ejemplos
Muestre que cumple las dos primeras condiciones de una funcin de densidad y adems determine
P & !
&
90
bB c bB
& ! & ~ & ! & b & ! & b & ! &
cB cB c
bB c bB
&
&! & ~ & b & b &
cB cB c
bB
&
&! & ~ f
cB
c
bB
&! & ~ b
cB
bB
&! & ~
cB
Por lo tanto &! cumple con las dos primeras condiciones de una funcin de densidad.
& &
P & ! ~ & ~ f ~
c!
2) Para la funcin !! ~ H ! Determine:
en otro caso
a) P ! ! b) P ! ! c) P ! ~ !
P ! ! ~ !! !
cB
~ ! b c! !
cB
~ c c! e
~ c c b
c
~
P ! ! ~ !! !
~ c! !
~ c c! e
91
~ c c b c
c
~
P ! ~ ! ~ !! ! ~
Ejercicios
1) De una caja que contiene 4 monedas de $ 100 y 2 de $ 50 , se seleccionan tres de ellas al azar
sin reemplazo. Determine la distribucin de probabilidad para el total T de las tres monedas.
2) De una caja que contiene 4 pelotas negras y 2 verdes, se seleccionan 3 de ellas en sucesin con
reemplazo. Encuentre la distribucin de probabilidad para el nmero de pelotas verdes.
Encuentre
a) P( % , )
b) P(% ,
)
Encuentre
a)P(& )
b) P( & )
92
Solucin
Monedas ! %
VVV
%!
VVN
VNV
NVV
VNN
NVN
NNV
NNN
a) P( % , ) ~
b) P(% ,
) ~
a)P(& ) ~
b) P( & ) ~
93
Esperanza o valor esperado
El valor esperado se usa como una medida de centro de una distribucin de probabilidad de una
v.a
Concepto
Sea ? una v.a con funcin de probabilidad o funcin de densidad %!. Sea ? ! una funcin de
la v.a ? . El valor esperado de ? , simbolizado por , ? ! es:
~
%! h %! si ? es una v.a discreta
, ? ! ~ %bB
%! h %! % si ? es una v.a continua
cB
Observaciones
~
% h %! si ? es una v.a discreta
, ? ! ~ %bB
% h %! % si ? es una v.a continua
cB
, ?! ~
~
? c ! h % ! si ? es una v.a discreta
2
~ , ? ! ~ %
bB
? c ! h %! % si ? es una v.a continua
cB
Propiedades de la esperanza
, ! ~
, ? ! ~ h , ? !
, ? ! f ? ! ~ , ? ! f , ? !
94
Usando las propiedades de la esperanza es posible determinar una forma ms simple para calcular
~ = ? !
~ , ? c !
~ , ? c ? b !
~ , ? ! c , ? ! b , !
~ , ? ! c , ? ! b pero , ? ! ~
~ , ? ! c , ? !, ? ! b , ? !
~ , ? ! c , ? !
Luego, = ? ! ~ ~ , ? ! c , ? !
As,
~
% h %! c @ % h %!A si ? es una v.a discreta
= ? ! ~ % %
bB bB
%
h % ! c @ % h % ! A si ? es una v.a continua
cB cB
Propiedades de varianza
= ! ~
= ? ! ~ h = ? !
= ? b ! ~ = ? !
Ejemplos:
1) Se lanza una moneda tres veces, si las tres veces aparece cara o parece sello un jugador gana
$5, pero si no es as pierde $3.Cul es la esperanza de este juego?
+ ~ ! ! ! ! ! ! ! !
% c
%!
, ? ! ~ 8 9 c 8 9 ~ c
95
2) Sea @ la v.a que representa la vida en horas de un cierto dispositivo electrnico. La funcin de
densidad es
~
& Encuentre la vida esperada de este dispositivo.
@! ~ @
e.o.c.
bB bB
, @! ~ @ h @ ! @ ~ @ h &
cB @
~ lim @ c &
bB
~ lim c f
bB @
~ lim c b
bB
~
3) Las ventas por hora de una mquina automtica puede ser 20 , 21 o 22 cajetillas de cigarros con
probabilidad 0,3 ; 0,5 y 0,2 respectivamente . Cul es la venta esperada por hora para esta mquina? Cul
es la varianza de ventas por hora ?
%
%!
= ? ! ~ , ? ! c , ? !
, ? ! ~ ! ! b ! ! b ! !
, ? ! ~
= ? ! ~ c
= ? ! ~
96
4) Sea = la velocidad del viento, em Km/hr.,y suponga que = tiene funcin de densidad
~
#
= ! ~
e.o.c.
La presin > en libras/pie2 , sobre la superficie del ala de un aeroplano est dada por la relacin:
> ~ = . Determine el valor esperado y la varianza de la presin.
, >! ~ , = !
~ , = !
~ =h =
=
~ h h f
~ La presin promedio es de 0,1 libra/pie2 .
= > ! ~ , > ! c , > !
, > ! ~ , ! =
~ ! =h =
=
~ ! h h f
~
= > ! ~ c
= > ! ~
2
La varianza es de 0,008 libra/pie2 !
5) Sea ? una v.a con ~ y ~
. Calcule el valor esperado de la v.a @ ~ ? c ! y la
varianza
, ?! ~ = ? ! ~
,@ ? c !A ~ h , ?! c , 8 9
~ h c
~
97
= @ ? c !A ~ 8 9 h = ? !
~ h
~
6) Suponga que el nmero de autos A , que pasan a travs de una mquina lavadora, entre las 4:00
P.M. y las 5:00 P.M. de un viernes, tiene la siguiente distribucin de probabilidades
'
'!
Sea A ! ~ A c que representa la cantidad de dinero, en dlares, que el gerente del negocio le
paga al encargado. Encuentre las ganancias esperadas del encargado en este perodo en particular.
, A ! ~ !8 9 b ! 8 9 b
! 8 9 b ! 8 9 b ! 8 9 b
! 8 9
, A! ~
, A c ! ~ , A ! c
~h c
~
La ganancia esperada del encargado es 12,67 dlares estre las 4:00 P.M. y las 5:00 P.M.
, ?! ~
98
, ? b ! ~ , ? ! b
~h b
~
%
%!
, ? ! ~ ! 8 9 b ! 8 9 b ! 8 9 b !8 9
, ?! ~
= ? ! ~ , ? ! c , ? !
, ? ! ~ ! 8 9 b ! 8 9 b ! 8 9 b
!8 9
, ?! ~
= ? ! ~ c
= ? ! ~
= ? b ! ~ h = ? !
~h
99
Ejercicios
1) Por invertir en unas acciones en particular, una persona puede obtener ganancias de $ 4.000
con una probabilidad de 0,3; o una prdida de $ 1.000 con una probabilidad de 0,7. Cul es la ganancia
que espera esta persona?.
2) Suponga que un distribuidor de joyas antiguas est interesado en comprar un collar de oro para
el cual las probabilidades son 0,22; 0,36; 0,28 y 0,14 respectivamente, de que la poseedora estara
dispuesta a venderla en $ 250.000, en $ 150.000, al costo $100.000! o con una prdida de $ 150.000.
Cul es la utilidad que ella espera?.
c ? %
? ~ H
e.o.c.
4) La funcin de densidad de la v.a. Y, el nmero total de horas, en unidades de 100 horas, de que
una familia utilice una aspiradora durante un ao es
~@ &
@ ~ c @ &
e.o.c.
cA '
A ~ H
e.o.c.
100
Solucin
, %! ~ = %! ~
, A ! ~ c = A ! ~
101
Distribuciones discretas de probabilidad
1) Distribucin Bernoulli
El experimento ms sencillo es aquel que puede resultar en uno de dos resultados posibles.
Ejemplo
Cualquier experimento puede usarse para definir un ensayo Bernoulli, simplemente denotando
algn evento A como xito y su complemento Ac como fracaso.
%A
? %! ~ H
% Ac
P % ~ ! ~ P A! ~
P % ~ ! ~ P Ac ! ~ c ~
%! ~ % h c % % ~ y se denota ? Bernoulli !
b) Los resultados de cada uno de los intentos pueden clasificarse como un xito o un fracaso.
102
d) Los intentos repetidos son independientes .
e) , ? ! ~ = ? ! ~ h
2) Distribucin Binomial
Concepto: un experimento que consiste de ensayos Bernoulli independientes, cada uno con
probabilidad de xito , se llama experimento binomial con ensayos y parmetro .
Ensayos independientes indica que los ensayos son eventos independientes, esto es, lo que ocurre
en un ensayo no influye en el resultado de cualquier otro ensayo.
%! ~ 8 h % h c % % ~
%9
!
%! ~ h % h c % % ~
c %! ! h % !
, ? ! ~ h = ? ! ~ h h
Ejemplos
~
? es la v.a que denota el nmero de tres al lanzar cinco dados
? ~
P E! ~ P obtener un nmero tres! ~
P F! ~ P no obtener un nmero tres! ~
? 8 9
%
c%
%! ~ 8 98 9 8 9 % ~
%
103
P % ! ~ c P % ~ !
c
P % ~ ! ~ 8 98 9 8 9 ~8 9
P % ! ~ c 8 9 ~
P % ! ~ c P % ! ~ c P % ~ ! c P % ~ !
c
P % ~ ! ~ 8 98 9 8 9 ~
P % ! ~ c ~
2) La probabilidad de que una cierta clase de componente pase con xito una determinada prueba
de impacto es . Encuentre la probabilidad de que exactamente dos de los siguientes cuatro
componentes que se prueben pasen la prueba.
~
? ~ pasar con xito la prueba de impacto
? ~
~ ~
? 8 9
%
c%
%! ~ 8 98 9 8 9 % ~
%
P % ~ ! ~ 8 98 9 8 9 ~ ~
La probabilidad de que exactamente dos de las siguientes piezas cuatro componentes que se
prueben pasen la prueba es de 0,2109 .
104
3) La probabilidad de que un paciente se recupere de una cierta enfermedad a la sangre es 0,4 . Si
se sabe que 15 personas han contrado esta enfermedad.
a) Cul es la probabilidad de que al menos 10 sobrevivan?
b) Cul es la probabilidad de que sobrevivan entre 3 y 8 personas?
c) Cul es la probabilidad de que sobrevivan 5 personas?
~ ~
? !
%! ~ 8 !%
! c %
%9
P % ~ ! ~ 8 !
! ~
9
? ~ piezas reprocesadas
? ~
~ ~
?
!
%! ~ 8 9 !% !
c %
%
P % ! ~ P % ~ ! b P % ~ ! b P % ~ ! b P % ~
! ~
105
P % ~ ! ~ 8 9 ! !
~
P % 1! ~ c P % ~ ! ~ c
~
Ejercicios
1) Al probar una cierta clase de neumtico para camin en un terreno escabroso se encontr que
el 25 % de los camiones terminaban la prueba con los neumticos daados. De los siguientes 6 camiones
probados, encuentre la probabilidad de que
a) de 3 a 6 tengan los neumticos daados.
b) Menos de 2 tengan los neumticos daados.
c) ms de cinco tengan los neumticos daados.
3) Un ingeniero de control de trfico reporta que el 75 % de los vehculos que pasan por un punto
de verificacin tienen matrculas del estado. Cul es la probabilidad de que ms de 4 de los siguientes 9
vehculos no sean del estado?.
4) Una investigacin demostr que el 20 % de los habitantes de una ciudad prefieren un telfono
blanco que cualquier otro. Cul es la probabilidad de que ms de la mitad de los siguientes 8 telfonos que
se instalen en esta cuidad sean de color blanco?.
5) Se sabe que el 40 % de los ratones inyectados con un suero quedan protegidos contra una cierta
enfermedad. Si 5 ratones son inyectados, encuentre la probabilidad de que
a) Ninguno contraiga la enfermedad
b) menos de 2 la contraigan.
c) ms de tres la contraigan.
106
Solucin
P %
! ~
P % ! ~
P % ! ~
P % ~ ! ~
P % ! ~
P % ! ~
P % ~ ! ~
P % ! ~
P % ! ~
107
3) Distribucin Hipergeomtrica
Tanto la distribucin binomial como la distribucin hipergeomtrica persiguen un mismo
objetivo: el nmero de xitos en una muestra que contiene observaciones. Lo que establece una
diferencia entre estas dos distribuciones de probabilidad discreta es la forma en que se obtiene la
informacin. Para el caso de la distribucin binomial la informacin de la muestra se toma con reposicin
de una muestra finita, o sin reposicin de una poblacin infinita. Para el modelo hipergeomtrico la
informacin de la muestra se toma sin reposicin de una poblacin finita. Por lo tanto, la probabilidad de
xito, ,es constante a lo largo de todas las observaciones de un experimento binomial, en cambio, en una
distribucin hipergeomtrica el resultado de una observacin afecta el resultado de las obseravciones
previas.
5 c
8 % 98 c % 9
%! ~ % ~
5
89
? / 5 !
5 c 5 c
, ?! ~ h = ? ! ~ h 8 98 9
5 5 5 5 c
Ejemplos
? / !
108
8 % 98 c % 9
%! ~ % ~
8 9
8 98 9 8 98 9
P % ~ ! ~ ~ P % ~ ! ~ ~
8 9 8 9
8 98 9 8 98 9
P % ~ ! ~ ~ P % ~ ! ~ ~
8 9 8 9
%
%!
2) Entre 16 postulantes para un trabajo, 10 tenan un grado universitario. Si tres de los postulantes
son elegidos al azar para una entrevista. Cul es la probabilidad de que:
a) ninguno tenga grado universitario?.
b) exactamente uno tenga grado universitario?.
c) dos tengan grado universitario?.
d) los tres tengan grado universitario?.
? / !
8 % 98 c % 9
%! ~ % ~
8 9
8 98 9
P % ~ ! ~ ~
8 9
La probabilidad de que ninguno tenga grado universitario es de 0,0357 .
109
8 98 9
P % ~ ! ~ ~
8 9
La probabilidad de que uno tenga grado universitario es de 0,2679 .
8 98 9
P % ~ ! ~ ~
8 9
La probabilidad de que dos tengan grado universitario es de 0,4821 .
8 98 9
P % ~ ! ~ ~
8 9
La probabilidad de que los tres tengan grado universitario es de 0,2143 .
? ~ artculos defectuosos
? ~
5 ~ ~ ~ 5 c ~
? / !
8 % 98 c % 9
%! ~
8 9
8 98 9
P % ~ ! ~ ~
8 9
La probabilidad es de 0,3011 .
110
Ejercicios
2) El dueo de una casa planta 6 tallos que selecciona al azar de una caja que contiene 5 tallos de
tulipn y 4 de narciso. Cul es la probabilidad de que plante 2 tallos de narciso y 4 de tulipn?.
4) Cul es la probabilidad de que una mesera se rehse a servir bebidas alcohlicas nicamente a
2 menores de edad, si verifica aleatoriamente slo 5 identificaciones de entre 9 estudiantes, de los cuales 4
no tienen la edad suficiente?.
5) Una compaa manufacturera utiliza un esquema para aceptacin de los artculos producidos
antes de ser embarcados. El plan es de dos etapas. Se preparan cajas de 25 para embarque y se selecciona
una muestra de tres para verificar si tiene algn artculo defectuoso. Si se encuentra uno, la caja entera se
regresa para verificarla al 100 %. Si no se encuentra ningn artculo defectuoso la caja se embarca.
a) Cul es la probabilidad de que se embarque una caja que contiene 3 artculos defectuosos?.
b) Cul es la probabilidad de que una caja que contiene slo un artculo defectuoso regrese para
la verificacin?.
111
Solucin
P % ! ~
P % ~ ! ~
P % ~ ! ~
P % ! ~
P % ~ ! ~
P % ~ ! ~
P % ~ ! ~
112
4) Distribucin Poisson
Los experimentos que resultan en valores numricos de una v.a ? y que representan el nmero de
resultados durante un intervalo de tiempo dado o en una regin especfica frecuentemente se llaman
experimentos Poisson . El intervalo de tiempo dado puede ser de cualquier duracin, por ejemplo, un
minuto, un da, una semana, un mes o inclusive un ao. Por tal motivo un experimento Poisson puede
generar observaciones para una cierta v.a ? que representen el nmero de llamadas telefnicas por hora
que se recibe en una oficina, el nmero de das en que una determinada escuela se cierra en invierno debido
a la nieve, o al nmero de juegos pospuestos debido a la lluvia durante una temporada de ftbol.
c! !!%
?! ~ % ~
%!
c !%
?! ~
%!
? 7 !
Ejemplos
? 7 !
c !%
?! ~ % ~
%!
c !
P % ~
! ~ ~
!
113
2) Se sabe que 10 es el nmero promedio de camiones tanque de aceite que llegan por da a una
cierta ciudad portuaria. Las instalaciones del puerto pueden atender cuando mucho a 15 camiones tanque
en un da. Cul es la probabilidad de que en un da determinado tengan que regresar los camiones
tanque?.
? 7 !
c !%
?! ~ % ~
%!
P % ! ~ c P % !
~ c P % ~ ! b P % ~ ! b P % ~ ! b b P % ~ !
~
3) Suponga que los clientes llegan a una fila de espera a una tasa de 4 por minuto. Suponiendo que
el nmero de personas que llegan a la fila en cualquier intervalo de tiempo dado tiene distribucin
Poisson.Cul es la probabilidad de que al menos una persona llegue a la fila en un intervalo de minuto?.
clientes minuto
clientes minuto ~ clientes
? ~ N de clientes que llegan en minuto
? 7 !
c !%
?! ~ % ~
%!
P % ! ~ c P % ~ !
c !
~c
!
~
La probabilidad de que al menos una persona llegue a la fila en un intervalo de minuto es de un
0,8647 .
114
Ejercicios
1) En promedio, en una cierta interseccin ocurren 3 accidentes viales por mes. Cul es la
probabilidad de que en un determinado mes en esta interseccin
a) ocurran exactamente 5 accidentes?.
b) ocurran menos de 3 accidentes?.
2) Una cierta rea de la ciudad XX es afectada en promedio por 6 huracanes al ao. Encuentre la
probabilidad de que en un determinado ao esta rea sea afectada por
a) menos de 4 huracanes.
b) cualquier cantidad entre 6 y 8 huracanes.
3) El nmero promedio de ratas de campo por acre en un campo de trigo de 5 acres se estima que
es de 12. Encuentre la probabilidad de que menos de ratas de campo se encuentren en este campo de
trigo.
4) Un restaurante prepara una ensalada que contiene en promedio 5 verduras diferentes. Encuentre
la probabilidad de que la ensalada contenga ms de 5 verduras en un determinado da.
115
Solucin
P % ~ ! ~
P % ! ~
P % ! ~
P
% ! ~
P % ! ~
P % ! ~
P % ! ~
P % ~ ! ~
116
Distribuciones continuas de probabilidad
1) Distribucin Normal
Es la distribucin continua de probabilidad ms importante en el campo de la estadstica. Su
grfica recibe el nombre de curva normal, su forma es la de una campana
Esta curva permite describir muchos fenmenos que ocurren en la naturaleza, la industria y la
investigacin.
Una v.a continua ? que tiene distribucin en forma de campana se llama v.a. normal.
?c
c 8 9
?! ~ h cB%B
l h
? 5 !
117
4) La curva es asinttica al eje ? .
P ? ! ~ ? ! ?
Sin embargo, resolver esta integral con la funcin de densidad de la v.a normal no es tan simple.
Por tal motivo, se recurre a un proceso denominado estandarizacin basndose en una v.a normal ' que
tiene ~ y ~ y que se denomina distribucin normal estndar
c A
A! ~ h cB%B
l
A 5 !
?c
Si ? 5 !, entonces A ~
Los valores de la v.a normal ' se encuentran tabulados
118
Ejemplos:
P ' !
P ' ! ~ c P ' !
~ c
~
P c
'
!
P c
'
! ~ P '
! c P ' c
!
~ c
~
P ' ' ! ~
119
P ' ' ! ~
c P ' ' ! ~
c
~ P ' ' !
~ P ' ' ! ' ~ c
% c
P8' 9 ~
% c
~ c % ~
b) P ? %! ~
% c
c P8' 9 ~
% c
P8' 9 ~
% c
~ % ~
120
Ejercicios
a) P' Resp.:0,7967
b) P' c Resp.:0,1020
c) P' Resp.:0,2033
d) P' c Resp.:0,898
e) P ' Resp.:0,1791
f) PO ' O Resp.:0,5354
g) P' ' ~
Resp.:' ~ 1,55
II) Dada la v.a. X distribuida normalmente con media 18 y desviacin estndar 2,5. Encuentre
a) P% Resp.:0,1151
b) P% % ~
Resp.:% ~ 16,1
c) P% % ~ Resp.:% ~ 20,28
d) P % Resp.:0,5403
121
Problemas de aplicacin
1) Cierto tipo de batera dura un promedio de tres aos, con una desviacin estndar de 0,5 aos.
Suponiendo que las duraciones de las bateras son normalmente distribuidas, encuentre la probabilidad de
que una determinada batera dure menos de 2,3 aos.
? 5 ! ? ~ duracin de la batera
c
P % ! ~ P8' 9
~ P ' c !
~
La probabilidad de que una determinada batera dure menos de 2,3 aos es de un 808 .
2) Una compaa fabrica focos cuya duracin es normalmente distribuida con una media de 800
horas y una desviacin estndar de 40 horas. Encuentre la probabilidad de que un foco dure entre las 778 y
834 horas de uso.
? 5
! ? ~ duracin de los focos
c c
P % ! ~ P8 ' 9
~ P c ' !
~ P ' ! c P ' c !
~ c
~
La probabilidad de que un foco dure entre las 778 y 834 horas de uso es de un 5111 .
3) Una cierta mquina produce resistencias elctricas que tienen un valor medio de 40 ohms y una
desviacin stndar de 2 ohms. Suponiendo que los valores de las resistencias siguen una distribucin
normal y que pueden medirse con cualquier grado de precisin. Qu porcentaje de las resistencias tendr
un valor que exceda a 43 ohms?
c
P % ! ~ c P8' 9
~ c P ' !
~ c
~
El 668 de las resistencias tendr un valor que exceda a 43 ohms.
122
4) En una empresa las edades de los trabajadores se distribuye normalmente con media 50 aos y
desviacin estndar es de 5 aos.
a) Qu porcentaje de los trabajadores tiene entre 50 y 52,5 aos?
b) Cul es la probabilidad que un trabajador cualquiera no sea mayor de 45 aos?
c) Cul es la probabilidad que un trabajador tenga entre 41 y 58 aos?
d) El 20 % de los trabajadores estn bajo cierta edad Cul es esa edad?
c c
P % ! ~ P8 ' 9
~ P ' !
~ P ' ! c P ' !
~
c
~
c
P % ! ~ P8' 9
~ P ' c !
~
c c
P % ! ~ P8 ' 9
~ P c '
!
~ P '
! c P ' c !
~ c
~
123
P ? %! ~
% c
P8' 9 ~
% c
~ c % ~
Ejercicios
1) Las piezas de pan de centeno distribuidas a las tiendas locales por una cierta pastelera tienen
una longitud promedio de 30 cm. y una desviacin estndar de 2 cm. Suponiendo que las longitudes estn
normalmente distribuidas, qu porcentaje de las piezas son
a) de ms de 31,7 cm. de longitud?.
b) entre 29,3 y 33,5 cm. de longitud?.
c) de una longitud menor que 25,5 cm.?.
2) Una mquina despachadora de refrescos est ajustada para servir un promedio de 200 millitros
por vaso. Si la cantidad de refresco es normalmente distribuida con una desviacin estndar de 15
millitros.
a) Qu fraccin de los vasos contendr ms de 224 millitros?.
b) Cul es la probabilidad de un vaso contenga entre 191 y 209 millitros?.
3) El dimetro interno ya terminado de un anillo de pistn est normalmente distribuido con una
media de 10 cm. y una desviacin estndar de 0,03 cm.
a) Qu proporcin de los anillos tendr un dimetro interno que exceda de 10,075 cm.?.
b) Cul es la probabilidad de que un anillo de pistn tenga un dimetro interno entre 9,97 y 10,03
cm.?.
c) Para que valor el dimetro interno de un anillo de pistn ser menor que el 15 %?.
4) La resistencia a la tensin de cierto componente metlico est normalmente distribuida con una
media de 10.000 Kg./cm2 y una desviacin estndar de 100 Kg./cm2 .
a) Cul es la proporcin de estos componentes que exceden de 10.150 Kg./cm2 de resistensia a la
tensin?.
b) Si las especificaciones requieren que todos los componentes tengan una resistencia a la tensin
entre 9.800 y 10.200 Kg./cm2 inclusive, qu porcentaje de piezas se esperara que se desecharan?.
5) La vida promedio de cierto tipo de motor pequeo es de 10 aos con una desviacin estndar
de 2 aos. El fabricante repone sin cargo todos los motores que fallen dentro del perodo de garanta. Si
est dispuesto a reponer slo 3 % de los motores que fallan, qu tan larga deber ser la garanta que
otorgue?. Suponga que las vidas de los motores siguen una distribucin normal.
124
6) Suponga que un consultor est investigando cunto tiempo necesitaran los obreros de la
fbrica para montar cierta pieza en una planta de automviles Volvo, y determin que la informacin(
tiempo en segundos ) estaba distribuida normalmente con una media de 75 segundos y una desviacin
estndar de 6 segundos.
a) Cul es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la pieza
en menos de 75 segundos o en ms de 81 segundos?
b) Cul es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la pieza
de 69 a 81 segundos?.
c) Cul es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la pieza
en menos de 62 segundos?.
d) Cul es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la pieza
de 62 a 69 segundos?.
e) Cuntos segundos deben pasar antes de que el 50 % de los obreros monten la pieza?.
f) Cuntos segundos deben pasar antes de que el 10 % de los obreros monten la pieza?.
7) El espesor de un lote de 10.000 arandelas de bronce de un cierto tipo fabricadas por una gran
compaa tiene una distribucin normal con media 0,0191 pulgadas y desviacin estndar 0,000425
pulgadas. Compruebe que se puede esperar que el 99,04 % de estas arandelas tenga un espesor entre
0,0180 y 0,0202 pulgadas.
8) El tiempo de reaccin para un cierto experimento psicolgico est distribuido normalmente con
media 20 segundos y desviacin estndar 4 segundos.
a) Cul es la probabilidad de que una persona tenga un tiempo de reaccin entre 14 y 30
segundos?.
b) Cul es la probabilidad de que una persona tenga un tiempo de reaccin entre 25 y 30
segundos?.
c) Qu porcentaje de personas tienen un tiempo de reaccin de ms de 14 segundos?.
d) Cul es el tiempo de reaccin de modo que slo el 1 % de todas las personas reaccionen con
mayor rapidez?.
9) Un procesador de alimentos envasa caf en pequeos tarros, los pesos de los tarros estn
normalmente distribuidos con una desviacin estndar de 0,3 onzas. Si el 5 % de los tarros pesa ms de
12,492 onzas. Cul es el promedio de los tarros?.
125
Solucin
1)
b) El 59,67 % de las piezas tiene una longitud entre 29,3 y 33,5 cm.
2)
3)
4)
6)
a) Existe un 0,6587 de probabilidad que un obrero pueda montar una pieza en menos de 75 seg. o
en ms de 81 seg.
b) Existe un 0,6826 de probabilidad que un obrero pueda montar una pieza entre 69 y 81 seg.
c) Existe un 0,015 de probabilidad que un obrero pueda montar una pieza en menos de 62 seg.
d) Existe un 0,1437 de probabilidad que un obrero pueda montar una pieza entre 62 y 69 seg.
126
7) Se cumple que el 99,04 % de las arandelas tiene un espesor entre 0,0180 y 0,0202 pulgadas.
8)
127
Autoevaluacin 1
1) En una ciudad se publican los peridicos A, B y C. Una encuesta reciente a 800 lectores indica
lo siguiente 208 lee A, 240 lee B, 192 lee C, 64 lee A y B; 40 lee A y C; 32 lee B y C; 24 lee A, B y C.
Para un adulto escogido al azar, calcular la probabilidad de que:
2) Si P A! ~ P B! ~ y P A q B! ~ Determine
a) P A r B! b) P B !
c) P B c A! d) P Ac /Bc !
e) A y B independientes?. Justifique
3) Si se sacan al azar y sin reemplazo cuatro pelotas de una bolsa que contiene 6 pelotas rojas y 7
negras.
a) Cul es la probabilidad de que la primera pelota sea negra y tres restantes rojas?.
b) Si las tres primeras pelotas fueron rojas. Cul es la probabilidad de que la cuarta pelota sea
negra?
c) Si las dos primeras pelotas fueron rojas. Cul es la probabilidad que la tercera sea negra y la
cuarta roja?
d) Cul es la probabilidad de que las dos primeras pelotas sean rojas y las dos ltimas negras?
e) Cul es la probabilidad de que aparezca una de cada color?
4) Se recibieron dos cajas de camisas para hombre, provenientes de la fbrica. La caja uno
contena 15 camisas deportivas y 25 camisas de vestir. La caja dos contena 10 camisas deportivas y 30
camisas de vestir.
128
Solucin
a) La probabilidad de no lea ningn peridico es
b) La probabilidad de que lea exactamente uno de los peridicos es
c) La probabilidad de que lea B y C, pero no A es
d) La probabilidad de que lea slo A o slo C es
P A r B! ~ P B ! ~
P B c A! ~ P A /B ! ~
P A q B! ~ P A! h P B! ~
Por lo tanto, A y B no son independientes.
3)
a) P N q R q R q R ! ~ h h h ~
129
b) P N /R q R q R ! ~
c) P N q N /R q R ! ~ h ~
d) P R q R q N q N ! ~ h h h ~
e) P R q N q R q N ! b P N q R q N q R !
~ h h h b h h h ~
4)
a) P D! ~ b) P V! ~
c) P C /V! ~
130
Autoevaluacin 2
% c % %
% ~ H
e.o.c.
a) Determine el valor de .
b) Obtener
b.1) P% ~ b.2) P8 % 9
b.3) P8% 9
c) Calcule E % b
2) De acuerdo con un estudio publicado por un grupo de socilogos de una cierta universidad,
aproximadamente el 60 % de los adictos al Valium en el estado XX, lo tomaron por primera vez debido a
problemas sicolgicos. Encuentre la probabilidad de que de los siguientes 8 adictos entrevistados
a) ms de 4 veces?.
b) ni una sola vez?.
131
Solucin
~
P % ~ ! ~ P8 % 9~
P8% 9~
, % b ! ~
%! ~ 8 9
!% !c%
%
P % ~ ! ~
%! ~ 8 9 !%
!c%
%
P % ! ~ c P % ~ ! b P % ~ ! b P % ~ ! ~
8 % 98 c % 9
%! ~
89
%
%!
P % ! ~
c h %
%! ~
%!
P % ! ~
P % ~ ! ~
132
~ ~ ? 5
!
e) La calificacin es de un
133
Unidad N3:Intervalos de Confianza
Inferencia Estadstica
La teora de Inferencia Estadstica consiste en aquellos mtodos con los cuales se pueden realizar
inferencias o generalizaciones acerca de una poblacin.
a) Estimacin de Parmetros
b) Pruebas de Hiptesis
Estimacin de parmetros
Los parmetros a estudiar son parmetros poblacionales como la media y la varianza.
w
Si es un parmetro desconocido, entonces ser su estimador.
As, % es un estimador de y
es un estimador de 2 y ellos cumplen con la propiedad de
insesgamiento.
w w w
Basado en la distribucin muestral de se puede determinar si el intervalo 8 1 9 con una
probabilidad dada contiene realmente el parmetro que se supone que va a estimar.
w w
Esto es P8 9 ~ c donde
w w
El intervalo 8 1 9 calculado de una muestra particular se llama intervalo de confianza del
c ! % , la fraccin c se denomina coeficiente de confianza, grado de confianza o nivel de
w w
confianza y los puntos y se llaman lmites de confianza.
134
Por ejemplo:
A1 ) Se conoce su varianza
Obs.: Si ? 5 4 5, entonces % 5 8 9
%c
Como % 5 8 9, entonces A ~
l
P A A A ! ~ c
P A A ! ~ bc~c
P A A ! ~
A ~ A pero A ~ c A
Luego: A ~ c A
c
135
As, P A A A ! ~ c
r u
t %c w
Pt c A A w ~c
c c
s l v
r u
P cA %cA ~c
s c l c l v
r u
P c%cA c c%bA ~c
s c l c l v
r u
P %cA %bA ~c
s c l c l v
Si % es la media de una muestra aleatoria de tamao de una poblacin normal con varianza 2 ,
el intervalo de confianza de c ! % para es :
r u
%cA % b A
s c l c l v
Ejemplo: Si una muestra aleatoria de tamao de una poblacin normal con varianza tiene
una media muestral de
. Construya un intervalo de confianza del
% de confianza para
c !% ~
% ~
~
~ ~
% ~
:
c Ac
l
b Ac
l ;
:
c
! l
b
! l ;
!
136
Teorema: Si se usa % como una estimacin de , se puede tener una confianza del c !%
de que el error no exceder de: A
c l
En el ejemplo anterior: A ~ A ~
c
! ~
l
Se puede tener una confianza del
% de que % difiere de por una cantidad menor que
.
Teorema: Si se utiliza % como una estimacin de , entonces se puede tener una confianza del
c !% de que el error no exceder una cantidad especfica cuando el tamao de la muestra es:
rr u u
t A w
t s c v w
t w
~t w
t w
t w
s v
Ejemplo: Qu tan grande se requiere que sea la muestra del ejemplo 1! si se desea una confianza
del
% de que la estimacin de difiera de sta por menos de ?
~ A ~ A
~
~
c
~
!
~8 9 ~
Luego, se puede tener una confianza del
% de que la muestra aleatoria de tamao
proporcionar una estimacin de % que difiere de por una cantidad menor que .
137
Ejercicios
1) Las medidas de los dimetros de los rodamientos tiene una desviacin estndar de 0,042 cm. Se
selecciona una muestra aleatoria de 200 bolas de rodamientos producidas por una mquina en una semana,
los dimetros dieron una media de 0,824 cm. Hallar un intervalo de confianza del 95 % y 99 % para el
dimetro de todos los rodamientos.
4) Al medir el tiempo de reaccin de una persona, un psiclogo estima que la desviacin estndar
es de segundos. De qu tamao ha de tomarse una muestra de medidas para tener una confianza del
% y
% de que el error de la estimacin no supera los segundos?
138
Solucin
1)
%
!
%
!
2)
!
3)
a)
!
b)
c)
4)
% ~
% ~
139
A2 ) Varianza desconocida
Sea % % % una muestra aleatoria de ? 5 ! con desconocida.
%c
; ~ tiene distribucin ! c !"! con c ! grados de libertad
l
es la desviacin estndar de la muestra!.
0
t
P ! ; ! ! ~ c
r u
t %c w
Pt c ! ! w ~c
s l v
P:% c ! % b ! ~c
l l ;
140
Si % es la media de la muestra aleatoria m.a.! de tamao de una poblacin normal con varianza
desconocida, el intervalo de confianza de c !% para es:
Ejemplo: Un fabricante de pintura quiere determinar el tiempo de secado promedio para una
nueva pintura para pared interior. Si para una prueba de reas de igual tamao obtiene un tiempo medio
de secado de
Solucin: ~ c ~
% ~
! ~ ! ! ~
~ ~
:
c ! l
b ! l ;
!
Teorema: Si se usa % como una estimacin de , se puede tener una confianza del c !%
de que el error no exceder de:
~ !
l
~
Como: ~ !
l
!
l ~
!
~8 9 (Tamao de la muestra)
141
En el ejemplo del fabricante de pintura, determine el tamao de la muestra si el error no debe
exceder de :
~8 9
~
Ejercicios
2) Suponga que se hacen 20 mediciones sobre la resistencia de cierto tipo de alambre. La media de
la muestra es 10,48 ohms y la desviacin estndar 1,36 ohms. Obtener un intervalo de confianza de un 99
% para la resistencia promedio real si ellas se distribuyen normalmente.
3) Una muestra aleatoria de 100 propietarios de automviles indica que, en el estado XX, un
automvil recorre un promedio de 23.500 Km. por ao con una desviacin estndar de 3.900 Km.
Determine un intervalo de confianza de 98 % para la cantidad promedio de Km. que un automvil recorre
anualmente en el estado XX. Suponga distribucin normal.
4) Una muestra aleatoria de 8 cigarros de una marca determinada tiene un contenido promedio de
nicotina de 2,6 milgramos y una desviacin estndar de 0,9 milgramos. Determine un intervalo de
confianza de 95 % para el contenido promedio real de nicotina en esta marca de cigarros en particular, si se
sabe que la distribucin de los contenidos de nicotina son normales.
142
Solucin
1)
!
2)
!
3)
!
4) !
143
B) Intervalo de confianza para la varianza ! de una poblacin normal
c !
? ~ tiene distribucin " con c ! grados de libertad
es la varianza de la muestra!.
a
0 X 2a
144
P6?c ? ? 7 ~ c
c !
P8?c ? 9 ~ c
P:
;~c
? c ! ?c
c ! c !
P: ;~c
?
?c
c ! c !
: ;
?
?c
donde ? y ?c
son valores ? con c grados de libertad, con reas de y c , respectivamente,
a la derecha.
Ejemplo:
~ c ~
~
~ c~
~
?c ~
? ~
!
!
8 9
!
145
2) Se obtiene una m. a. de estudiantes con una media de % ~ y una varianza de ~
en
un examen de Estadstica. Suponga que las calificaciones tienen distribucin normal. Determine un
intervalo de confianza del
% para la varianza poblacional
~ c ~
~ c ~
~
?c ~ ?
!
! ~
? ~ ? !
! ~
!
!
8 9
!
Ejercicios
1) Un fabricante de baterias para automvil asegura que sus baterias duran en promedio, 3 aos
con una desviacin estndar de un ao. Si 5 de estas baterias tienen una desviacin estndar de 0,9028
aos. determine un intervalo de confianza de 95 % para la varianza real e indique si es vlida la afirmacin
del fabricante. Suponga que la poblacin de las duraciones de las baterias se distribuye aproximadamente
en forma normal.
2) Suponga que se hacen 20 mediciones sobre la resistencia de cierto tipo de alambre. La media de
la muestra es 10,48 ohms y la desviacin estndar 1,36 ohms. Obtener un intervalo de confianza de un 95
% para la varianza real si las resistencias se distribuyen normalmente.
3) Una muestra aleatoria de 25 cigarros de una cierta marca tiene un contenido promedio de
nicotina de 1,3 milgramos y una desviacin estndar de 0,17 milgramos. Encuentre un intervalo de
confianza del 90 % y 98 % para la varianza real de esta determinada marca de cigarros si se supone que las
mediciones se distribuyen normalmente.
4) Una muestra aleatoria de 100 propietarios de automviles indica que, en el estado XX, un
automvil recorre un promedio de 23.500 Km. por ao con una desviacin estndar de 3.900 Km.
Determine un intervalo de confianza de 99 % para la varianza real de la cantidad de Km. por ao que
recorren los automviles del estado XX.
146
Solucin
1)
! La afirmacin del fabricante es vlida, porque la varianza poblacional
est dentro del intervalo que se determin con una confianza del
%.
2)
!
3) % !
%
!
4)
!
147
Autoevaluacin
1) Suponga que una tienda de pinturas quisiera estimar la cantidad correcta de pintura que hay en
latas de un galn, compradas a un conocido fabricante. Por las especificaciones del productor se sabe que
la desviacin estndar de la cantidad de pintura es igual a 0,02 galones. Se selecciona una muestra aleatoria
de 50 galones y la cantidad promedio de pintura es 0,975 galones. Establezca un intervalo de confianza del
95 % y 99 % de la cantidad promedio real de la poblacin de pintura incluida en una lata de un galn.
2) La vida til promedio de una muestra aleatoria de 10 focos es de 4000 horas con una
desviacin estndar de 200 horas. Se supone que la vida til de los focos tiene una distribucin
normal.Estime un intervalo de confianza del 90 y 95 % para la vida til promedio
148
Solucin
Para 95% :
!
Para 99% :
!
Para 90% :
!
Para 95% : !
Para 99% :
!
149
Unidad N4: Pruebas de Hiptesis
Son procedimientos de decisin basado en datos que puedan producir una conclusin acerca de
algn sistema cientfico.
No es posible saber con absoluta certeza la verdad o falsedad de una hiptesis estadstica, pues
para ello habra que trabajar con toda la poblacin. En la prctica se toma una muestra aleatoria de la
poblacin de inters y se utilizan los datos que contiene tal muestra para proporcionar evidencias que
confirmen o no la hiptesis. Si la evidencia de la muestra es inconsistente con la hiptesis planteada,
entonces sta se rechaza y si la evidencia apoya a la hiptesis planteada, entonces se acepta sta.
La aceptacin de una hiptesis implica tan slo que los datos no proporcionan evidencia suficiente
para refutarla. Por otro lado, el rechazo implica que la evidencia de la muestra la refuta.
Una hiptesis nula referente a un parmetro poblacional siempre debe establecerse de manera que
especifique un valor exacto del parmetro, mientras que la hiptesis alternativa admite la posibilidad de
varios valores.
Por ejemplo:
/ ~ / ~ / ~
/ / /
b) regin de no rechazo
Para decidir con relacin a la hiptesis nula, primero se tiene que determinar el valor crtico para
la distribucin estadstica de inters. El valor crtico separa la regin de no rechazo de la de rechazo.
150
Errores al realizar una prueba de hiptesis
Al utilizar una muestra para obtener conclusiones sobre una poblacin existe el riesgo de llegar a
una conclusin incorrecta. Pueden ocurrir dos errores diferentes:
Al probar cualquier hiptesis estadstica, existen cuatro posibles situaciones que determinan si la
decisin es correcta o equivocada.
/ es verdadera / es falsa
se acepta / decisin correcta error tipo II
se rechaza / error tipo I decisin correcta
La probabilidad de cometer error tipo II, es decir, aceptar / cuando es falsa, se representa por
.P error tipo II! ~
La probabilidad de no cometer error tipo II, es decir, rechazar / cuando es falsa, se denomina
potencia de la prueba y se denota por c .P error tipo I!c ~ c
El ideal al rechazar una prueba de hiptesis es determinar los procedimientos o reglas que
conduzcan a maximizar la potencia de una prueba, para un fijo. se suele especificar antes de tomar una
muestra, es frecuente que ~ o ~
/ / / ~
/ / /
151
2) Seleccionar el test estadstico o estadstico de prueba.
3) Fijar !
5) Extraer una muestra aleatoria de tamao y calcular el valor del test estadstico.
6) Si el valor calculado del test estadstico cae en la regin crtica rechazar / , en caso contrario
no rechazar / y concluir que la muestra aleatoria no proporciona evidencia para rechazarla.
Una prueba de hiptesis ser unilateral de una cola! en los siguientes casos
/ ~
/
/ ~
/
/
/
/
/
/ ~
/ v !
152
Pruebas de hiptesis
%c
'~
l
/ ~ o /
/ /
/ ~ o /
/ /
153
2) Para pruebas bilaterales
/ ~
/
Ejemplos
/ ~
/
~
Regin crtica ~ 9*
9* c
'
% ~
~
~
c
'~ ~ c
154
2) Una muestra aleatoria de 100 muertos registrados en Chile durante el ao pasado mostr una
vida promedio de 71,8 aos. Suponiendo una desviacin estndar poblacional de 8,9 aos. Parecera esto
indicar que la vida promedio hoy da es mayor que 70 aos? Utilice un nivel de significacin de 0,05
/
/
~
% ~ ~ ~
c
'~ ~
Se rechaza / , es decir, es verdad que la vida promedio hoy en da supera los 70 aos.
155
3) Un fabricante de equipo deportivo ha desarrollado un nuevo sedal sinttico para pesca que se
considera tiene una resistencia a la ruptura de 8 kilgramos con una desviacin stndar de 0,5 kilgramos.
Prubese la hiptesis de que ~ Kg. en contraposicin a la alternativa de que Kg. si se prueba una
muestra aleatoria de 50 sedales y se encuentra que tiene una resistencia promedio a la ruptura de 7,8 Kg.
Utilice un nivel de significacin de 0,01
/ ~
/
~
9* c '
% ~ ~ ~
c
'~ ~ c
l
156
Ejercicios
1) Una empresa elctrica fabrica focos que tienen una duracin que est distribuida
aproximadamente en forma normal con una media de 800 horas y una desviacin estndar de 40 horas.
Pruebe la hiptesis de que ~ horas en contraposicin de la alternativa de que horas si
una muestra aleatoria de 30 focos tiene una duracin promedio de 788 horas. Utilice un nivel de
significacin de 0,04.
3) Las tensiones de ruptura de los cables fabricados por una empresa tienen media de 1800 lb y
una desviacin estndar de 100 lb. Se desea comprobar si un nuevo proceso de fabricacin aumenta dicha
tensin media. Para ello se toma una muestra de 50 cables y se encuentra que su tensin media de ruptura
es 1850 lb. Se puede afirmar la mejora del nuevo proceso al nivel de significacin del 1%?
Solucin
1) Se acepta / es decir, los focos tienen una duracin promedio de 800 horas .
157
b) Para la media ! si la varianza !es desconocida
%c
!~
l
/ ~ o /
/ /
/ ~ o /
/ /
158
2) Para pruebas bilaterales
/ ~
/
Ejemplos
/ ~
/
~ % ~ ~ ~
9* c ! ~ c
c
!~ ~ c
l
159
Se acepta / , es decir, la muestra elegida no da pruebas que el consumo de kilowtts-hora al ao
de la aspiradora sea menor que 46.
2) El gerente de produccin de una empresa cuyo proceso consiste en llenar cajas de cereal desea
saber si efectivamente en cada caja se est depositando, en promedio, los 368 gramos que se supone es lo
que la empresa asegura a sus vendedores. Para ello, se selecciona una muestra aleatoria de 25 de estas
cajas obtenindose una media de 364,1 gramos y una desviacin stndar de 17,3 gramos. Considere que la
distribucin de los pesos de las cajas de cereales es normal y trabaje con un nivel de significacin de 0,05.
Qu decide el gerente de produccin?.
/ ~
/
~
% ~
~ ~
9* c ! ! ! 9* c
!
c
!~ ~ c
Se acepta / , es decir, el gerente de produccin puede estar seguro que, en promedio, cada caja
contiene 368 gramos de cereal.
160
3) Suponga que en el mismo ejemplo anterior, del proceso de llenado de cajas de cereal, que la
empresa es visitada por un representante de la oficina de proteccin al consumidor y que le interesa
averiguar si las cajas, en promedio, estn faltas de peso, es decir, si el peso promedio es inferior a 368
gramos. Considere un nivel de significacin de 0,01.
/
/
~
% ~
~ ~
9* c ! ~ c
c
!~ ~ c
161
Ejercicios
3) En un informe de una investigacin de J.M.N. se afirma que los ratones con una vida promedio
de 32 meses llegarn hasta casi 40 cuando 40 % de las caloras en su alimentacin se reemplacen con
vitaminas y protenas. Hay alguna razn para creer que la vida promedio ser inferior a 40 meses si 64
ratones que se han sujetado a esta dieta tienen una vida promedio de 38 meses con una desviacin estndar
de 5,8 meses?. Utilice un nivel de significacin de 0,025.
4) Una empresa elctrica afirma que un compactador de basura se usa un promedio de 125 horas
al ao. Si una muestra aleatoria de 49 hogares equipados con compactadores de basura indica un uso
promedio de anual de 126,9 horas con una desviacin estndar de 8,4 horas, sugiere esto con un nivel de
significacin de 0,05 , que estos aparatos se usan en promedio ms de 125 horas?.
5) En el pasado una mquina ha producido arandelas con un grosor promedio de 0,050 pulgadas.
Para determinar si la mquina sigue en buenas condiciones de produccin, se toma una muestra de 10
arandelas, que resulta tener un grosor medio de 0,053 pulgadas y una desviacin estndar de 0,003
pulgadas. Ensayar la hiptesis de que la mquina est en buenas condiciones de produccin al nivel de
significacin del
a) 0,05
b) 0,01
6) La duracin media de una muestra de 100 tubos fluorescentes producidos por una compaa
resulta ser 1570 horas, con una desviacin estndar de 120 horas. Si es la duracin media de todos los
tubos producidos por la compaa, comprobar la hiptesis ~
horas contra la hiptesis alternativa
horas con un nivel de significacin de
a) 0,05
b) 0,01
162
Solucin
6) a) Se rechaza / , es decir,
horas .
b) Se acepta / , es decir, ~
horas .
163
c) Pruebas de hiptesis relacionadas con varianzas
Se utilizan para probar uniformidad de una poblacin. Para ello se usa como prueba estadstica la
distribucin ji cuadrada
c !
~
/ ~ o /
/ /
/ ~ o /
/ /
164
2) Para pruebas bilaterales
/ ~
/
Ejemplos
1) Un fabricante de bateras para automvil asegura que la duracin de sus bateras tiene
distribucin aproximadamente normal con una desviacin stndar de 0,9 aos. Si una muestra aleatoria de
10 baterias tiene una desviacin stndar de 1,2 aos Piensa usted que 0,9 aos? Utilice un nivel de
significacin de 0,05
/ ~
/
~
~ ~
9*
~
h
~ ~
No es posible rechazar /
165
2) Se sabe que el contenido de nicotina de una marca de cigarros tiene distribucin
aproximadamente normal con una varianza de 1,3 milmetros. Pruebe la hiptesis de que ~ en
contraposicin a la alternativa de que si una muestra aleatoria de 8 de estos cigarros tiene una
desviacin stndar de 1,8 milmetros. Use un nivel de significacin de 0,05.
/ ~
/
~
~ ~
9*
~
~
h
~ ~
Se rechaza / , es decir,
166
3) Experiencias pasadas indican que el tiempo para que alumnos del ltimo ao realicen un
examen estandarizado es una v.a normal con una desviacin stndar de 6 minutos. Pruebe la hiptesis de
que ~
en contraposicin a la alternativa de que
si una muestra aleatoria de 20 studiantes tiene
una desviacin stndar de 4,51 minutos al realizar este examen. Utilice un nivel de significacin de 0,01
/ ~
/
~
~ ~
9*
~
h
~ ~
167
Ejercicios
2) Se sabe que el contenido de nicotina de una marca de cigarros tiene una distribucin
aproximadamente normal con una varianza de 1,3 milgramos. Pruebe la hiptesis de que ~ en
contraposicin a la alternativa de que 2 si una muestra aleatoria de 8 de estos cigarros tiene una
desviacin estndar de 1,8. Use nivel de significacin de 0,05.
3) En el pasado la desviacin estndar de los pesos de ciertos paquetes de 40 onzas, llenados por
una mquina era de 0,25 onzas. Una muestra aleatoria de 20 paquetes dio una desviacin estndar de 0,32
onzas. Es el aparente incremento de variabilidad significativa al nivel de significacin del
a) 0,05
b) 0,01
4) Se formula la hiptesis de que la desviacin estndar del ingreso domstico anual de cierta
comunidad es de 3.000 dlares. En una muestra de 15 hogares aleatoriamente seleccionados, la desviacin
estndar es 2.000 dlares. Se supone que las cifras de ingreso domstico de la poblacin siguen una
distribucin normal. Con base en este resultado muestral, puede rechazarse la hiptesis nula con un nivel
de significacin del
a) 0,05 ?
b) 0,01 ?
Solucin
1) Se acepta / , es decir, ~
2) Se rechaza / , es decir,
168
Autoevaluacin
1) Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por un
combustible slido. Una de las caractersticas importantes de este producto es la rapidez de combustin.
Las especificaciones requieren que la rapidez promedio de combustin sea 50 cm/seg. Se sabe que la
desviacin estndar de esta rapidez es 2 cm/seg. El experimentador decide especificar un nivel de
significacin de 0,05. Selecciona una muestra aleatoria de 25 y obtiene una rapidez promedio de
combustin de 51,3 cm/seg. A qu conclusiones debe llegar?
4) El contenido de azcar del almibar de los duraznos enlatados tiene una distribucin normal,
donde se cree que la varianza es 18 mg . Pruebe la hiptesis ~ contra la alternativa si al
tomar una muestra de 10 latas la desviacin estndar es 4,8 mg. Use un nivel de significacin de 0,01
5) Un ingeniero civil hace pruebas con la resistencia a la compresin del concreto. Para ello
examina 12 especmenes obteniendo una media de 2260 psi y una desviacin estndar de 36 psi.Pruebe la
hiptesis ~ psi contra la alternativa psi . Use un nivel de significacin de 0,05
169
Solucin
/
/
2) / !
/ !
Aceptar / , es decir, no existe evidencia fuerte que indique que la desviacin estndar del
dimetro del agujero es menor que 0,01 mm
3) / ~
/
Rechazar / , es decir, el cinescopio requiere sobre 300 microamperes de corriente para producir
el nivel deseado de brillantez.
4) / ~
/
5) / ~
/
170
Unidad N5 : Regresin Lineal
A menudo existen relaciones entre 2 ms variables, por ejemplo, entre el peso y la estatura de
una persona, las horas de estudio y la calificacin obtenida, etc. Suele ser deseable expresar tales relaciones
en forma matemtica determinando una ecuacin que conecte a las variables.
Para hallar una ecuacin que relacione las variables, el primer paso es recoger datos que muestran
valores correspondientes de las variables bajo consideracin.
As por ejemplo, la siguiente tabla muestra las alturas y peso de una muestra de 10 personas:
Altura %
Peso &
70
65
60
55
50
45
1,45 1,5 1,55 1,6 1,65 1,7 1,75
Altura
A partir del Diagrama de Dispersin es posible (a veces), visualizar una curva que aproxima los
datos. Tal curva se denomina Curva Apoximante.
171
Los siguientes diagramas de dispersin:
Y Re la cin Line a l
R e l a c i n N o L in e a l
muestran una relacin lineal en el primer caso y una relacin no lineal en el segundo.
Uno de los propsitos principales de la curva de ajuste es estimar una de las variables (la variable
dependiente) conocida otra (la variable independiente). El proceso de estimacin se conoce como
Regresin.
172
Los tipos ms comunes de curvas aproximantes y sus ecuaciones se representan en la siguiente
lista:
Parbola & ~ b % b %
Todas las letras excepto % e & representan constantes. La variable % es la variable independiente
y la variable & es la variable dependiente. Aunque esto se puede cambiar, es decir, en algunos casos la
variable % ser la dependiente y la variable & la independiente.
Para decidir que curva usar es til observar el diagrama de dispersin. Con el diagrama de
dispersin se puede tener una idea aproximada de la relacin entre las variables. La relacin ms sencilla es
la lineal.
A menudo se recurre a la intuicin personal para dibujar una curva que se ajuste a un conjunto de
datos. Este mtodo tiene la desventaja de que diferentes observadores obtendrn distintas curvas y
ecuaciones.
Para evitar juicios subjetivos al construir rectas, parbolas u otras curvas aproximantes de ajuste
de datos se utiliza el Mtodo de Mnimos Cuadrados.
Una medida de la bondad del ajuste de la curva a los datos dados est proporcionada por la
cantidad:
173
+ b + b + b b +
Definicin: De todas las curvas que aproximan un conjunto de datos, la que tiene la
propiedad de que + b + b + b b + es mnimo se llama una Curva de Ajuste Optimo.
Una curva que cumpla con la condicin de que + b + b + b b + sea mnimo se
denomina Curva de Mnimos Cuadrados. Esta curva puede ser: una recta, una parbola, una parbola
cbica, etc.
El anlisis de regresin lineal simple tiene por objeto encontrar la lnea recta que mejor se ajuste a
los datos, esto significa que se desea encontrar la lnea recta para la cual las diferencias entre los valores
w
reales de & y los valores estimados & sean lo ms pequeas posible.
& ~ b %
% & ~ % b %
Otra forma de determinar estas constantes y , es a travs de las siguientes frmulas que se
deducen de las Ecuaciones Normales:
%& c % &
~
~ & c %
% c 8%9
donde: % e & corresponden al promedio de los datos dados para % e & , respectivamente.
174
Si se toma % como la variable dependiente, la recta toma la forma % ~ b & , y las ecuaciones
normales seran:
% ~ b &
%& c % &
~
~ % c &
& c 8&9
La recta de mnimos cuadrados resultante no es, generalmente, la misma que la obtenida antes.
Ejemplo:
%
&
D ia g r a m a d e D is p e r s i n
Y
10
9
8
7
6
5
4
3
2
1
0
0 2 4 6 8 10 12 14 16
X
175
a) % como la variable independiente & ~ b %
& ~ b %
% & ~ % b %
% ~ %& ~
~ b
c
~
b
c ~ c
c
~
b
~
~ ~ ~
Reemplazando ~ en: ~ b
se tiene:
~ b
8 9 ,e
~ b ~ c ~
Luego, la recta de mnimos cuadrados es: &~ b %
176
b) % como la variable dependiente % ~ b &
% ~ b &
& ~
%& ~
~ b c
~ b
c ~ c c
~ b
~
~ ~
Reemplazando ~ en:
~ b se tiene:
~ b 8 9 ,e
~ b ~ c ~ c
Luego, la recta de mnimos cuadrados es: %~ c b &
&~ b %
177
Podemos estimar el valor & para % ~ de la siguiente forma:
w
&~ b ! & ~ b &~
w
Para % ~ &~ b ! &~ b &~
La ecuacin % ~ c b & permite estimar el valor de % a partir de un valor de & . Esta
ecuacin se denomina Ecuacin de Regresin de % sobre &
% &
%~ &~
%~ ~ &~ ~ Centroide ~ % & ~
Conocer el grado de relacin existente entre ambas variables, permitir saber si la prediccin
realizada con el modelo matemtico establecido, es buena o mala.
178
Para medir el grado de relacin existente entre la variable independiente y la variable dependiente,
lo que ms se utiliza es el Coeficiente de Correlacin Lineal ( de Pearson ), cuyo mtodo abreviado de
clculo est dado por la siguiente frmula:
Ejemplo: La siguiente tabla representa las notas en Algebra y Fsica de estudiantes elegidos al
azar:
Algebra%
Fsica&
a) Diagrama de Dispersin
D ia g ra m a d e D i sp e rsi n
Fs ica
100
90
80
70
60
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100
A lg e b r a
179
De los datos dados se tiene que: % ~
& ~
~ %& ~
% ~
& ~
& ~ b %
% & ~ % b %
~ b ,
~
b
, c
~
b
c ~ c
c
c ~ c ~
c
0 ~ ~
& ~ b
%~ ~
& ~ ~
180
d) Halle el coeficiente de correlacin lineal
c
~
l"
c
#"
c
#
~ Por lo tanto, la correlacin entre las variables es buena.
l
% ~
& ~ b
~
w
El valor estimado para % ~ es & ~
% ~
& ~ b
~
w
El valor estimado para % ~
es & ~
w
La nota esperada en Fsica es: & ~
b
w
& ~
w
&
puntos
181
Ejercicios
1) Determine para los datos del ejemplo anterior la ecuacin de regresin de % sobre &
%
&
4) El gerente de personal de una empresa intuye que quizs exista relacin entre el ausentismo
laboral y la edad de los trabajadores. Desea tomar la edad de los trabajadores para desarrollar un modelo de
prediccin de das de ausencia durante un ao laboral. Se seleccion una muestra aleatoria de
trabajadores y se obtuvo los siguientes datos:
a) Diagrama de Dispersin
b) Determine la recta de regresin de & sobre %
c) Calcule el coeficiente de correlacin lineal e interprete
d) Estime los das de ausentismo laboral para trabajadores que tienen aos, aos y aos
de edad
182
Solucin
1) % ~ c b &
2) a)
b) & ~
b
%
w w w
c) & ~ & ~ & ~
(Respectivamente)
3) a)
40
35
30
25
20
15
10
0
0 2 4 6 8 10 12 14 16
X
183
b) & ~ c %
40
35
30
25
20
15
10
5
0
1 3 5 7 9 11 13 15 17 19
X
w
d) % ~ & ~
w
% ~ & ~
e) ~ c
El coeficiente de correlacin lineal ~ c nos indica que la correlacin lineal entre las
variables es buena y negativa, es decir, a mayor experiencia laboral menos artculos defectuosos elabora un
trabajador.
f) Centroide % & ~
184
4) a)
18
16
14
12
10
0
0 10 20 30 40 50 60 70
Ed ad
b) & ~ c
%
w
d) % ~ aos & ~ das
w
% ~ aos & ~ das
w
% ~ aos & ~ das
185
Anlisis de Residuos
El anlisis de residuos sirve para verificar si el modelo lineal es el que mejor se ajusta a los datos
dados.
w
Se define un residuo ( como la diferencia entre el valor observado & y el valor estimado & , es
decir,
c) El modelo de regresin lineal se ajusta a todas excepto una o varias observaciones atpicas.
Estas observaciones atpicas pueden no considerarse si el nmero de datos es grande (mayor que ).
G r fico d e Re sid u o s
Re siduos
1,0
0,8
0,6
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
X
186
Las siguientes figuras, muestran diferentes situaciones que se presentan con cierta frecuencia:
a)
G r fi c o d e R e sid u o s
Re sid u o s
1,0
0,8
0,6
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
La figura anterior muestra un caso tpico de residuos cuando el modelo lineal es adecuado. Todos
los residuos tienden a caer en una banda horizontal centrada alrededor del cero.
b)
G r fi c o d e R e sid u o s
Re sid u o s
-5
-10
-15
-20
-25
-30
La figura anterior indica una desviacin clara de la linealidad, sugiriendo la necesidad de ajustar
una funcin de regresin no lineal.
187
c)
Gr fico de Re siduos
Re siduos
2,0
1,5
1,0
0,5
0,0
-0,5
-1,0
-1,5
-2,0
La figura anterior presenta una observacin atpica, es decir, se escapa del modelo lineal que
tienen los otros datos. La influencia de estos puntos atpicos, ser mayor si el nmero de datos es pequeo
(menor o igual a ).
%
&
& ~ b
%
Determine:
Solucin:
& ~ b
%
& Z ~
188
b) Los residuos , que aparecen en la tabla, se determinan de la siguiente forma:
Para & ~
se tiene: ~ & c & Z
~
c
~
%
&
&Z
c c c c c
c)
An lisis d e Re sid uo s
Re s id uos
3,0
2,0
1,0
0,0
60 62 64 66 68 70 72
-1,0
-2,0
-3,0
x
d) Los residuos nos indican que la recta de regresin dada en algunos casos no es la mejor
estimadora para & . Existen 5 puntos que se escapan del intervalo " c #
189
Ejercicio
%
&
&Z
Solucin:
1)
%
&
&Z
c c
c c
Re s id u o s
An lisis d e Re sid uo s
1,2
1
0,8
0,6
0,4
0,2
0
-0,2 0 2 4 6 8 10 12 14
-0,4
-0,6
-0,8
-1
X
Los residuos son muy grandes para los datos dados. Por lo tanto, no existe una relacin lineal
entre los datos dados.
190
Autoevaluacin
%
&
Determine:
a) Diagrama de Dispersin
Hrs. Estudio %
Nota Examen &
191
Solucin
1) a)
y D iagrama de D ispersin
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 11 12
x
b) &~ c b %
d) % ~ & ~ % ~
& ~
2) a)
Nota Exame n
D iagrama de D ispersin
100
90
80
70
60
50
10 15 20 25 30 35 40
Ho ras d e Estu d io
b) ~
La correlacin entre las variables es buena.
c) & ~
b %
d) % ~ & ~
192