Está en la página 1de 221

ESTADISTCA Y

PROBABILIDADES
Indic
e

Contenido
Pgina

Unidad N1: Estadstica Descriptiva


Introduccin
Estadstica: conceptos previos
Variables
Tabulacin de datos:
a) cualitativos
b) cuantitativos
Representacin grfica
Medidas de tendencia central:
a) Media aritmtica

3
4
6
7
8
17
39

b) Mediana
c) Moda
Medidas de dispersin:
a) Rango
b) Desviacin media
c) Varianza
d) Desviacin estndar
Criterio de homogeneidad
Autoevaluacin

38
40
45
46
47
50
52
56

Unidad N2: Probabilidades


Elementos de probabilidades
Concepto de probabilidad en espacio finito equiprobable
Axiomas de probabilidad
Probabilidad condicional
Teorema de Bayes
Eventos independientes
Variables aleatorias
Distribucin discreta de probabilidades
Distribucin continua de probabilidades
Esperanza
Varianza
Distribuciones discretas:
Bernuolli
Binomial
Hipergeomtrica
Distribucin Poisson
Distribucin continua:
Normal
Normal estndar
Problemas de aplicacin

58
60
60
69
78
83
86
87
89
94
94

Autoevaluacin 1
Autoevaluacin 2

128
131

102
103
108
113
117
118
122

Unidad N3: Intervalos de Confianza


Inferencia estadstica
Estimacin de parmetros
Estimacin por intervalo
Intervalo de confianza para la media de una poblacin normal:
a) conocida su varianza
b) desconocida su varianza
Intervalo de confianza para la varianza de una poblacin normal

134
134
134
135
140
144

Autoevaluacin

148

Unidad N4: Pruebas de Hiptesis


Pruebas de hiptesis
Pruebas de unilaterales y bilaterales
Pruebas de hiptesis para:
a) la media si se conoce su varianza
b) la media si se desconoce su varianza
c) la varianza
Autoevaluacin

150
152
153
158
164
169

Unidad N5: Regresin Lineal


Diagrama de dispersin
Mtodo de mnimos cuadrados
Recta de los mnimos cuadrados
Coeficiente de correlacin lineal
Anlisis de residuos
Autoevaluacin

171
173
174
179
186
191

Unidad N1: Estadstica


Descriptiva

Introducci
n
La Estadstica, nace de las necesidades reales del hombre. La variada y cuantiosa informacin
relacionada con ste y que es necesaria para la toma de decisiones, hace que la estadstica sea hoy, una
importante herramienta de trabajo.

Entre las tareas principales de la Estadstica, est el de reunir la informacin integrada por un
conjunto de datos, con el propsito de obtener conclusiones vlidas del comportamiento de stos, como
tambin hacer una inferencia sobre comportamientos futuros.

En cuanto al uso y la aplicacin, puede decirse que abarca todo el mbito humano
encontrndose en las relaciones comerciales, financieras, polticas, sociales, etc. siendo fundamental en
el campo de la investigacin y en la toma de decisiones.

Es as tambin como en el rea de las empresas de servicio y manufactura es posible realizar un


anlisis profundo del proceso estadstico al control de la productividad y de la calidad.

Estadsti
ca
Es el conjunto de mtodos y procedimientos que implican recopilacin, presentacin,
ordenacin y anlisis de datos, con el fin que a partir de ellos puedan inferirse conclusiones.
Pueden distinguirse dos ramas diferentes en Estadstica:
c Estadstica Descriptiva, la cual es la que se utiliza en la descripcin y anlisis de conjuntos
de datos o poblacin.
c Inferencia Estadstica, la cual hace posible la estimacin de una caracterstica de
una poblacin, o la toma de una decisin con respecto a una poblacin, con base nicamente en
resultados muestrales.

Conceptos de elementos utilizados en el anlisis estadstico


1) Poblacin o Universo: Conjunto completo de individuos, objetos, o medidas los cuales
poseen una caracterstica comn observable y que sern considerados en un estudio.
2) Muestra: Es un subconjunto o una porcin de la poblacin.
3) Variable: Caracterstica o fenmeno de una poblacin o muestra que ser estudiada, la
cual puede tomar diferentes valores.
4) Datos: Nmeros o medidas que han sido recopiladas como resultado de la observacin.
5) Estadstico: Es una medida, un valor que se calcula para describir una caracterstica a partir
de una sola muestra.
6) Parmetro: Es una caracterstica cuantificable de una poblacin.

Recopilacin de Informacin
La Estadstica Descriptiva tiene como funcin el manejo de los datos recopilados en cuanto se
refiere a su ordenacin y presentacin, para poner en evidencia ciertas caractersticas en la forma que sea
ms objetiva y til.
Una

poblacin o universo
objeto de una investigacin estadstica puede ser
finita
si sus
elementos se pueden contar. Por ejemplo, nmero de alumnos de un curso.
Una poblacin o universo es infinita cuando no es finita. En Estadstica, el sentido del trmino
poblacin infinita se refiere a una poblacin con un nmero tan grande de elementos que no le es posible
al investigador someter a medida cada uno de ellos.
Cuando se miden cualitativamente las caractersticas de una poblacin, resultan categoras
que
deben ser
exhaustivas, es decir, que se pueda clasificar a toda la poblacin, y tambin deben ser
mutuamente excluyentes, es decir, un mismo elemento no puede pertenecer simultneamente a dos o
ms categoras. Por ejemplo, sexo de una persona: masculino o femenino.
Una muestra debe cumplir ciertas condiciones, de aqu surge el concepto de muestra aleatoria
que es aquella obtenida de modo que cada elemento de la poblacin tiene una oportunidad igual e
independiente de ser elegido.
La investigacin estadstica es toda operacin orientada a la recopilacin de informacin
sobre una poblacin.
La investigacin puede ser tan simple como la recopilacin de datos estadsticos obtenidos de
informaciones provenientes de fuentes oficiales a nivel institucional o de publicaciones de organismos
altamente especializados en estas materias, o tan complejas que requiera de la colaboracin de
especialistas en diferentes materias, como ocurre en los censos de poblacin de un pas.
Se denomina
variable
a fenmenos o caractersticas que son medidas en algn tipo de
investigacin estadstica.

Variabl
es
Es muy probable que un especialista en Estadstica que realiza una encuesta desee desarrollar
un instrumento que le permita hacer varias preguntas y manejar diversos fenmenos o caractersticas. A
estos fenmenos o caractersticas se les denomina variables aleatorias.
Segn la forma en que se expresen las variables, se dividen en:
1) Variables Cualitativas: son aquellas que pueden expresarse slo en forma de atributo.

Ejemp
lo:
1)
Estado
civil :
c
soltero
c
casado
c
viudo
c
separado
2) Satisfaccin con un producto:
c muy insatisfecho
c regularmente insatisfecho
c neutral
c satisfecho
c muy satisfecho
3) Tamao de un tablero :
c grande
c mediano
c pequeo

2) Variables Cuantitativas, son aquellas variables que pueden expresarse en forma numrica
Se dividen en discretas y continuas.
2.1) Variables Cuantitativas Discretas, son respuestas numricas que surgen de un proceso
de conteo, siendo siempre un nmero entero.
Ejemplos :
1) Nmero de asignaturas inscritas en el primer semeste.
2) Nmero de integrantes del grupo familiar.
3) Nmero de salas de clases del IPVG.
2.2) Variables Cuantitativas Continuas, son respuestas numricas que surgen de un proceso
de medicin, las cuales pueden tomar valores entre dos nmeros enteros.
Ejemplo :
1) Estatura
2) Temperatura
3) Peso

Tabulacin de los
datos

En los experimentos estadsticos los datos recolectados pueden corresponder a una poblacin
o
muestra. En ambos casos los procedimientos de resumen de datos son anlogos y designaremos por:
5 ~ Tamao de la poblacin estudiada
~ Tamao de la muestra (parte de la poblacin)
Con el objeto de realizar un mejor estudio de los datos es necesario organizar stos, mediante
el uso de distribuciones de frecuencia.
Una distribucin de frecuencia es una tabla resumen en la que se disponen los datos divididos
en grupos ordenados numricamente y que se denominan clases o categoras.

A) Tabulacin de datos cualitativos


La construccin de una distribucin de frecuencia de atributos o distribucin de frecuencia de
variable cualitativa es simple, basta enumerar los diversos atributos con su respectiva frecuencia de
ocurrencia.
Frecuencia absoluta :

indica el nmero de veces que se repite un atributo.

Ejemplo:
Considrese una muestra
trabajadores de una cierta empresa de la regin los cuales
han sido encuestados sobre su actual estado civil. La informacin es tabulada de la siguiente manera:
Estado Civil
Soltero
Casado
Viudo
Separado
Total
~
~

(tamao de la muestra)
(nmero de clases)

B) Tabulacin de variable cuantitativa


Distinguiremos dos casos:

B.1) Tabulacin de variable discreta (que toma un conjunto pequeo


de datos distintos)
Las tablas de frecuencia de variable discreta llevan cinco columnas donde los elementos
que participan son los siguientes:

a) Frecuencia absoluta :

indica el nmero de veces que se repite una variable.

b) Tamao de la muestra :
indica la cantidad de elementos que conforman la
muestra, se obtiene sumando todas las frecuencias absolutas.

~
~

~ nmero de clases distintas


c) Frecuencia relativa :
es la proporcin de datos que se encuentra en una clase, se
obtiene dividiendo la frecuencia absoluta de la clase por el tamao de la muestra.

Obs:

a)

b)

d) Frecuencia absoluta acumulada : - indica la cantidad de datos que se encuentran


hasta cierta clase.

~
~

e) Frecuencia relativa acumulada :


/ es la proporcin de datos acumulados que se
encuentran hasta cierta clase.
/

~
~

Obs:

a) /

~
b)

Ejercicio

Una empresa que tiene


trabajadores se propone reestructurar las remuneraciones, se
estudia los aos de servicio de los trabajadores determinndose los siguientes resultados:

5 ~

(tamao de la poblacin)

Se pide:
c Tabular la informacin.
c Qu cantidad de trabajadores tiene
c Qu porcentaje de trabajadores tiene

aos de servicio ?.
aos de servicio ?.

c Si aquellos trabajadores que tengan a lo menos siete aos de servicio reciben un aumento
del
% . Qu porcentaje de los trabajadores recibi dicho aumento?.
c Si todos los trabajadores que tengan a lo ms cinco aos de servicio reciben una
bonificacin de $
. Qu cantidad de trabajadores recibi dicha bonificacin?.
c Si la empresa decide otorgar una bonificacin especial de $
servicio. Cunto ser el dinero necesario para cumplir dicha bonificacin?.

Solucin

c
-

Aos de servicio

por cada ao de

Total

c Ocho trabajadores tienen

aos de servicio

c El

% de los trabajadores tiene

c El

% de los trabajadores recibi el aumento de sueldo.

aos de servicio.

trabajadores recibieron la bonificacin.

c $

se necesitan para la bonificacin por ao de servicio.

B.2) Tabulacin de variable continua o discreta


Para tabular una variable continua o discreta (que tome un gran nmero de datos distintos)
se necesitan los siguientes elementos:

variable.
a) Rango o recorrido : Es la diferencia entre el valor mximo y valor mnimo que toma la
9 ~ %mx c %mn

b) Nmero de intervalos o clases ( ) : Es el nmero de grupos en que es posible dividir


los valores de la variable.
El nmero de clases no debe ser ni muy grande ni muy pequeo, un nmero pequeo de clases
puede ocultar la naturaleza general de los datos y un nmero muy grande puede ser demasiado detallado
como para revelar alguna informacin til. Como regla general se recomienda que el nmero de clases
est entre cinco y veinte. Hay una regla llamada Regla de Sturges que puede dar una aproximacin
razonable para el nmero de clases, ella es:
~
donde

es el nmero de datos de la muestra.

c) Amplitud del intervalo o amplitud de la clase ( ) :


~

9
Recorrido
~
N de clases

d) Lmites de un intervalo : Son los valores extremos de una clase. El menor valor es
considerado como el lmite inferior y el valor que se obtiene sumando al lmite inferior la amplitud del
intervalo es el lmite inferior de la segunda clase.

e) Lmites reales de un intervalo : Se obtienen calculando el promedio entre el lmite superior


de una clase y el lmite inferior de la clase siguiente.

f) Marca de clase : %

Es el punto medio de un intervalo.

dado.
g) Frecuencia absoluta :

indica el nmero de observaciones que pertenece a un intervalo


Observacin:

~ tamao de la muestra

h) Frecuencia relativa :
es la proporcin de datos que se encuentra en un
intervalo, se determina dividiendo la frecuencia absoluta del intervalo por el tamao de la muestra.

i) Frecuencia absoluta acumulada : - indica el nmero de datos de la muestra


menores o iguales al lmite real superior del intervalo .

Obs:

~
~

j) Frecuencia relativa acumulada : / indica la proporcin de datos de la muestra


menores o iguales al lmite real superior del intervalo .

~
~

~
~

Observacin: Existe ms de un mtodo para construir una tabla de distribucin de


frecuencias, a continuacin se presentan dos formas de construirla:

Ejemplo
Los siguientes datos corresponden a las notas obtenidas por
curso de
Estadstica

alumnos en un

c Construya la correspondiente distribucin de frecuencia.


c En qu clase se concentra el mayor nmero de notas?
c Cul es la frecuencia absoluta del cuarto intervalo?. Interprete el resultado .
c Qu porcentaje de los alumnos tienen una nota inferior a

c Cuntos alumnos tienen una nota superior a

c Interprete la frecuencia acumulada del sexto intervalo.


c Interprete la frecuencia relativa acumulada del quinto intervalo.

Solucin:
9 ~

~
~

Notas

Lmites reales

c
c
c
c

c
c
c
c

c
c
Total

c
c

c El mayor nmero de notas se concentra en el quinto intervalo, que coresponde al


intervalo entre
c .

c La frecuencia absoluta del cuarto intervalo es


alumnos que tienen una nota entre
c .

. Esto nos indica que son

c El

% de los alumnos tiene una nota inferior a

c El

% de los alumnos tiene una nota superior a

c Existen
c El

alumnos con nota inferior a

los

.
.

% de los alumnos tiene una nota inferior a

Ejercicios
1) Los siguientes datos corresponden al sueldo (en miles de pesos) de
de una empresa

trabajadores

a) Construya la tabla de frecuencia con todos sus elementos.


b) En qu clase se encuentra el mayor nmero de trabajadores?.
c) Qu porcentaje de trabajadores gana entre $ 139.000 y $ 168.000
?. d) Cuntos trabajadores ganan a lo menos $ 159.000 ?.
e) Cuntos trabajadores ganan a lo ms $ 148.000 ?.

2) En una industria es necesario realizar un estudio respecto al peso de engranajes de gran


tamao. Los siguientes datos corresponden al peso, en kilgramos, de
de estas piezas, que
poseen las mismas dimensiones, pero distinta aleacin.

a) Construir una tabla de frecuencias de amplitud comenzando desde


b) Cuntos engranajes pesan entre
y
Kg.?.
c) Qu porcentaje representa a aquellos engranajes cuyo peso es inferior a 1
Kg.?. d) Cul es la frecuencia relativa para aquel intervalo cuya marca de clase
es
?.
e) Qu porcentaje representa a aquellas piezas que pesan ms de
Kg. ? .

3) En una industria automotriz es necesario realizar un estudio debido a una partida defectuosa
de discos de embrague. Para ello se ha recopilado la siguiente informacin referente a la duracin en
horas de
de ellos.

a) Construir una tabla de frecuencia de amplitud cinco comenzando desde


b) Cuntos discos duraron entre
y
horas?.
c) Cuntos discos no alcanzaron a durar
horas?.
d) Qu porcentaje representan los discos que duraron entre
y
horas?. e) Qu porcentaje representan los discos que duraron menos de
horas?.
f) Cuntos discos duraron ms de
horas?.
g) Cuntos discos duraron menos de
horas?.
h) Qu porcentaje representan los discos que duraron entre
y
horas?. i) Cul es el intervalo de mayor frecuencia absoluta?.

4) En un conjunto habitacional se pretende hacer un estudio del nmero de personas


que consumen productos enlatados. Los datos que han sido obtenidos de 50 bloques del conjunto
habitacional son

a) Construir una tabla de fecuencia de amplitud


partiendo desde
b) Cuntas personas consumen entre
y
productos enlatados ?.
c) Qu porcentaje representa a las personas que consumen menos de
productos
enlatados?. d) Qu cantidad de personas consumen ms de
productos enlatados?.

5) Las ganancias por accin de 40 compaas de la industria de la construccin son:

a) Construya una distribucin de frecuencias que comience en


y tenga una amplitud de
b) Cul es la frecuencia absoluta del tercer intervalo?. Interprete el
resultado . c) Qu porcentaje de las compaas tienen a lo ms una
ganancia de
?
d) Cuntas compaas tienen una ganancia a lo menos de
?
e) Interprete la frecuencia acumulada del segundo intervalo.

f) Interprete la frecuencia relativa acumulada del cuarto intervalo.

Solucin

1) a) 9 ~
5

~
~

! ~

Lmites reales

Sueldo

c
c
c

c
c
c

c
c
c

c
c
c

Total
b) En la tercera clase se encuentra el mayor nmero de
trabajadores. c) 67,5 % de los trabajadores gana entre $139.000 y
$ 168.000
d) 7 trabajadores ganan a lo menos $
159.000 e) 24 trabajadores ganan a lo ms
$ 148.000

Peso

Lmites reales

Total

2) a)

b) 11 engranajes pesan entre 46 y 55 kilos.


c) El 77 % de las piezas pesan menos de 51
kilos. d) La frecuencia relativa es 0,17
e) El 23 % de las piezas pesa ms de 50 kilos.

Duracin

Lmites reales

c
c

c
c

c
c

c
c

c
Total
3) a)

b) 13 discos duraron entre 290 y 299


horas.
c) 22 discos no alcanzaron a durar 300
horas.
d) El 6 % de los engranajes duraron entre 300 y 314
horas. e) El 58 % de los engranajes duraron menos de
305 horas. f) 16 engranajes duraron ms de 309 horas.
g) 29 engranajes duraron menos de 305
horas.
h) El 16 % de los engranajes duraron entre 285 y 294
horas. i) El primer intervalo.
-

N de personas
c
c
c
c

c
Total

4) a)

b) 18 personas consumen entre 100 y 129 productos enlatados.


c) El 28 % de las personas consume menos de 90 productos
enlatados. d) 41 personas consume ms de 79 productos enlatados.
Ganancias

c
c

Lmites Reales

c
c

c
c

c
Total

c
c

5) a)

b) La frecuencia absoluta del tercer intervalo es , es decir, existen


compaas cuyas
ganancias estn entre
y
por accin.
c) El
% de las compaas tienen a lo ms una ganancia de
por accin. d)
compaas tienen a lo menos una ganancia de
por accin.
e)
compaas tienen una ganancia igual o menor a
por accin.
f) El
% de las compaas tienen una ganancia por accin de a lo ms
.

Representacin
Grfica
Su objetivo es captar la informacin obtenida en los datos en forma rpida por cualquier
persona, as cada representacin debe llevar un ttulo adecuado.
Las normas en la construccin de un grfico estadstico son similares a los de grficos
de funciones, las variables independientes, se ubican en las abscisas y las dependientes en las ordenadas.

Tipos de
grficos
a) Grfico circular:
se usan para mostrar el comportamiento de las frecuencias relativas,
absolutas o porcentuales de las variables. Dichas frecuencias son representadas por medio de
sectores circulares, proporcionales a las frecuencias.
Departamento
A (1)
B (2)
C (3)

D (4)
E (5)
Total

P e rs o n a l p o r D e p a rt a m e n t o
5
9%
4
15 %

1
15 %

1
2
3

2
4

28 %
5

3
33
%

b) Pictograma:
es un grfico cuyo uso es similar al de sector circular, pero la frecuencia es
representada por medio de una figura o dibujo que identifique a la variable en estudio. Este grfico
se utiliza para mostrar producciones en una serie cronolgica.

Por ejemplo, Alumnos del Instituto Profesional Dr. Virginio Gmez:

1996:

1997:

1998:

1999:

2000:

2001:
~

alumnos

c) Grfico lineal:
se utiliza para mostrar las frecuencias absolutas o relativas de una variable
discreta, son representadas mediante lneas verticales proporcionales a dichas frecuencias.
%

Total

d) Grfico de barra:

Se utiliza para representar tablas de frecuencia con atributos o con


variables discretas y pocos valores. Sobre un eje horizontal se construyen bases de rectngulo del mismo
ancho cada uno correspondiente a una modalidad del atributo, sobre estas bases se levantan
rectngulos cuya altura es proporcional a la frecuencia absoluta de la modalidad. El espacio entre
ellas debe ser uniforme.

Departamento
A
B
C
D
E
Total

P e rsona l por De pa rta m


e nto

140
120
Fr e cue ncia

100
80
60
40
20
0

De p ar tam e n to

e) Histograma:
es el grfico adecuado cuando los datos estn ordenados en tablas con intervalos,
es decir, para datos de variables continuas. Tambin el histograma es una conformacin de
rectngulos, pero uno al lado de otro cuya rea es proporcional a la frecuencia de cada intervalo. Los
extremos de la base de cada rectngulo son los lmites reales del intervalo.

Lmites Reales

Total

c
c

c
c
c
c

H IS T O G R A M A

12

10

F re c ue n ci a A b so l u ta
8

0
8,5

1 2, 5

1 6, 5

2 0, 5

2 4, 5

2 8, 5

4,5

8 ,5

12, 5

16, 5

20, 5

24, 5
L m i te s R e a l e s

f) Polgono de frecuencia:
este grfico sirve para mostrar la tendencia de la variable, se puede
determinar a partir de un histograma uniendo los puntos medios superiores de cada rectngulo del
histograma. Tambin, se determina el polgono uniendo los puntos formado por la marca de clase con la
frecuencia absoluta del intervalo respectivo.

Lmites reales

Total

c
c

c
c
c
c

P o lg o n o d e F re c u e n c ia s

12
10
8
F r e c u e n c ia Ab s o lu t a
6
4
2
0
2 ,5

6 ,5

1 0 ,5

1 4 ,5

1 8 ,5

2 2 ,5

2 6 ,5

3 0 ,5

M a r c a s d e C la s e s

Observacin:
El polgono de frecuencias se convierte en polgono de frecuencias relativas,
cambiando la frecuencia absoluta por la frecuencia relativa, en este caso, el rea bajo el polgono
de frecuencias relativas es igual a .

Histograma y Polgono de Frecuencias

H is togra m a y P o lgono de Fre c ue nc ia s


12

10

Fre cue ncia Absoluta


8

0
L m ite s Re a l e s

e) Ojiva: es un grfico que se usa para mostrar como se acumulan las frecuencias absolutas,
relativas o porcentuales. Se obtiene al unir los puntos formados por los lmites superiores de cada
intervalo con la frecuencia absoluta o relativas acumuladas del intervalo respectivo. Si se consideran las
frecuencias porcentuales acumuladas se llama ojiva porcentual.

Lmites reales

c
c
c
c
c
c
Total

O
jiva
40
36
32

28
Fr e cue ncia A cum ulad a
24
20
16
12
8
4
0
4

12

16

20

24

28

L m it e s Su p e r io r e s

Ejercicios

1) Dada la informacin referente a la ubicacin de personas dentro de cuatro departamentos


de una empresa, se pide
a) Tabular la
informacin. b) Realizar
grfico circular.
c) Indique frecuencias relativas porcentuales en cada grupo.
M
P
A
M

A
CC
P
A

P
M
A
CC

CC
A
M
A

A
M
M
A

CC
CC
A
M

M
P
M
P

P
P
A
M

P
M
P
M

M
P
M
P

donde
A ~ abastecimiento ; CC ~ control de calidad ; M ~ mantencin ; P ~ produccin.

2) Se realiz un nmero determinado de compras de materia prima. El volumen de la


materia prima viene dado en m3 .Parte de la informacin se registra en la siguiente tabla
Volumen

Lmites reales

c
c
c
c
c
Total
a) Complete la tabla dada.
b) En un slo grfico, dibuje un histograma y un polgono de
frecuencia. c) Cuntas compras se realizaron entre
y
d) Cuntas compras se realizaron entre
y
m3 ?.
e) Qu porcentaje de compras se realizaron entre
y
m3 ?. f) Cuntas compras se realizaron en total?.

3) Los siguientes datos corresponden a la duracin, en horas, de


sometidas a un cierto control.

Tiempo

m3 ?.

vlvulas que fueron

Lmites reales

c
c
c
c
c
c
c
Total

a) Complete la tabla
dada. b) Grafique la
ojiva
c) Qu porcentaje de las vlvulas duraron, en promedio

d) Qu porcentaje de las vlvulas duraron entre


y
horas?. e) Cuntas vlvulas duraron menos de
horas?.
f) Qu porcentaje de las vlvulas duraron ms de
horas?

horas?.

tableros.
4) Se realizaron dos experimentos referente al peso, en Kg., aplicado sobre una cierta cantidad de
Peso (Kg.) A
c

c
c
c
c
c
Total

a) Grafique el histograma del experimento A.


b) Grafique la ojiva porcentual del experimento B.
c) Realice, en un mismo grfico, los polgonos de
frecuencia. d) Realice, en un mismo grfico, las ojivas.

5) Dado el siguiente Polgono de Frecuencias:

P e s o s d e lo s A lu m n o s d e C . C iv il

1
0
9
8
N Alu m n o s
7
6
5
4
3
2
1
0
3 5 ,5

4 5 ,5

5 5 ,5

6 5 ,5

7 5 ,5

8 5 ,5

9 5 ,5

Pe s o (K g .)

a)Cules son los lmites reales del cuarto


intervalo?. b) Interprete la frecuencia del cuarto
intervalo.
c) Interprete el porcentaje de datos que hay en el quinto
intervalo. d) Qu porcentaje de pesos es igual o menor que
Kg.?.
e) Cuntos pesos son iguales o mayores que
Kg.?.

Solucin

Departamento
A
CC
M
P
Total
1) a)

b) Grfico Circular

Pe r s onal por De par tam e n to

P
28%
A
25%

A CC
M
CC

13%

M
34
%

Departamento

A
CC
M
P
Total
c)

Volumen

Lmites reales

Total

2) a)

b) Histograma y Polgono de Frecuencia

C o m p ras d e Mate ria P rim a


10

9
8
7
Fre cue ncia Absoluta
6
5
4
3
2
1
0
3

13

18

23

28

33

M a rca s d e Cl a se s

c) Entre 11 y 30 m3 se realizaron 26 compras


d) Entre 16 y 25 m3 se realizaron 15 compras
e) Entre 16 y 20 m3 se realizaron un porcentaje de 22,2 % de compras
f) En total se realizaron 27 compras

Tiempo
c
c
c

Lmites reales

c
c
c

c
c
Total

c
c

3) a)

b) Ojiva

D u ra c i n V l v u l a s

60
Fr e c u e n cia A cu m u lad a

50
40
30
20
10
0

449, 5 499, 5 549, 5 599, 5 649, 5 699, 5 749, 5


799, 5
L m it e s S u p e
r io r e s

c) 30 % de las vlvulas duraron en promedio 674,5


horas d) 36 % de las vlvulas duraron entre 650 y 749
horas
e) 9 vlvulas duraron menos de 550 horas
f) 38 % de las vlvulas duraron ms de 649 horas

4) a) Histograma

E xperim ento A
Frecue ncia Abs oluta
12

0
19,5

14,5

24,5

19,5

29,5

24,5

34,5

29,5

39,5

34,5

44,5

39,5
Lm ite s Re a le s

b) Ojiva Porcentual

Ex pe ri m e n to B
1
0,9
0,8
0,7
Fr e c. A cu m . Po r c.
0,6
0,5
0,4
0,3
0,2
0,1
0

14,5

19,5

24,5

29,5

34,5

39,5

44,5
L m it e s Su p e r io r e s

c) Polgonos de Frecuencia

Ex p e rim e n to A y B

12
11
Fr e cue ncia
10
9
8
7
6
5
4
3
2
1
0
12

Se r ie 1

17

22

27

32

37

42

47

Se r ie 2

M ar cas d e C las e s

Serie 1 ~ Experimento A

Serie 2 ~ Experimento B

d) Ojivas

Experimento A y B

45
40
Frecuencia Acumulada
35
30
25
20
15
10
5
0
14,5

19,5

24,5

29,5

34,5

39,5

44,5

Lmites Superiores
Serie1

Serie2

Serie 1 ~ Experimento A

Serie 2 ~ Experimento B

5) a) Los lmites reales del cuarto intervalo son


b)
c)
d) El
e)

alumnos de C. Civil tienen pesos que van desde


% de los alumnos pesan ms de

kilos hasta

% de los pesos de los alumnos es igual o menor que


alumnos pesan a lo menos

kilos y menos de

kilos
kilos
kilos

Kg.

Medidas de tendencia central y de dispersin


En todo anlisis y/o interpretacin se pueden utilizar diversas medidas descriptivas que
representan las propiedades de tendencia central, dispersin y forma para extraer y resumir las
principales caractersticas de los datos. Si se calculan a partir de una muestra de datos, se les denomina
estadsticos; si se les calcula a partir de una poblacin se les denomina parmetros.

Medidas de tendencia
central
La mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de
un punto "central" y por lo general es posible elegir algn valor que describa todo un conjunto de datos.
Un valor tpico descriptivo como ese es una medida de tendencia central o "posicin". Las
medidas de tendencia central a estudiar son: media aritmtica, mediana y moda.

Media
aritmtica
La media aritmtica ( tambin denominada media ) es la medida de tendencia central que
se utiliza con mayor frecuencia. Se calcula sumando todas las observaciones de un conjunto de datos,
dividiendo despus ese total entre el nmero total de elementos involucrados.
La media aritmtica de un conjunto de valores % % %
se define como el
cuociente entre la
suma de los valores y el nmero de ellos. Su smbolo es % si la media aritmtica es de una muestra y
si la media aritmtica es de una poblacin.
a) Para datos no agrupados:

Media muestral: % ~

b %

b %

~ tamao de la muestra

Media poblacional:
%

b %

b %5

; 5 ~ tamao de la poblacin
5

Ejemplo Calcular la media aritmtica de los siguientes datos relacionados con las notas de
test en
Estadstica obtenidas por un cierto alumno:

% ~

El promedio de test es

puntos.

b) Para datos agrupados:


Si los datos estn ordenados en tablas de frecuencia la media aritmtica se obtiene como sigue
Muestra
%

b%

Poblacin

b b%

%
%

% ~

b b

~
~

donde:
%

es la marca de clase del intervalo i-simo


es la frecuencia del intervalo i-simo
es el nmero de datos de la muestra y 5 es el nmero de datos de la poblacin
es el nmero de intervalos
Ejemplo Calcular la media aritmtica para el peso de
%

Peso (Kg.)

c
c

c
c
Total

%
~

% ~

trabajadores, segn tabla adjunta:

~
El peso promedio de los

trabajadores es de

kilos

Propiedades de la media aritmtica

Propiedad 1 La media aritmtica de una constante es igual a la constante.


%
%

%
%
valores

% ~

b b
~

Por lo tanto, % ~

Propiedad 2 La media aritmtica de una variable ms una constante es igual a la

media aritmtica de la variable ms la constante.


%

%
&
%

% b

% b

% b

&
& ~
~

% b
~

& ~

b ! b %

b ! b

b %

% b % b % b b % b

%
b

~
~
~ % b

Propiedad 3 La media aritmtica de una variable por una constante es igual al producto
de la constante por la media de la variable.
%

'

%
%

%
%

b%

b b%

' ~

% b %

b %

~ %

Propiedad 4 Media Ponderada


% h
% ~

b % h
b

b b %

b b

Ventajas y desventajas del uso de la media aritmtica:


Ventajas
- Estable muestra a muestra
- Fcil clculo e interpretacin

Desventajas
- No aplicable a atributos
- Influyen en su valor los valores extremos

Ejemplos:

1) De un grupo de contribuyentes se determin que el promedio de impuestos es de


$32.200. Determinar en cada uno de los siguientes casos, la nueva media aritmtica:
a) Los impuestos aumentan en un 2 %
b) A los impuestos se les disminuye la cantidad de $2.300
c) A cada contribuyente, se le disminuye un 3 % y adems se le condona $2.550
Solucin:
1) a)
% ~

La nueva media aritmtica es $


b) % ~

La nueva media aritmtica es $

La nueva media aritmtica es $


c) % ~

2) En tres cursos de un mismo nivel los promedios de las calificaciones fueron


y
si los cursos tenan respectivamente

alumnos, determine la calificacin promedio de los tres cursos.


Solucin:

% ~

~
b

El promedio de las calificaciones de los tres cursos es

Media
na
La mediana es el valor que se encuentra en el centro de una secuencia ordenada de datos. La
mediana no se ve afectada por observaciones extremas en un conjunto de datos. Por ello, cuando
se presenta alguna informacin extrema, resulta apropiado utilizar la mediana, y no la media, para
describir el conjunto de datos.
Su smbolo es 4 .
a) Mediana para datos no agrupados
Se deben ordenar los datos de forma creciente o decreciente. Para muestras con un nmero par
de observaciones, la mediana es el dato que queda en el centro de dicha ordenacin y para muestras
con nmero impar de observaciones la mediana es el promedio de los dos datos centrales.
Ejemplos
1) Para muestra con nmero impar de datos: 4
datos

datos ordenados

~ ?

?
4

2) Para muestra con nmero par de datos:

datos

datos ordenados

?
? b ?

b ?

b ?

~ ?

~ ?

b) Mediana para datos agrupados

c-

~ 3 b
c

h
8

donde:

es el primer intervalo cuya frecuencia acumulada supera a


3

es el lmite real inferior del intervalo de la mediana.


es el nmero de datos.
-

es la frecuencia acumulada anterior al intervalo de la mediana.


es la frecuencia absoluta del intervalo de la mediana.
es la amplitud del intervalo.

Ejemplo Distribucin de frecuencias de la duracin, en horas, de uso continuo


de dispositivos electrnicos iguales, sometidos a un cierto control.
Duracin
c
c
c
c
c
c
c
c
c
c
Total

El intervalo donde se encuentra la Mediana es el primer intervalo en el cual:


~

En este caso,

intervalo

~
c
~
- ~
~
3 ~

4
4

8
9

horas

Mo
da
La moda es el valor de un conjunto de datos que aparece con mayor frecuencia. Se le obtiene
fcilmente a partir de un arreglo ordenado. A diferencia de la media aritmtica, la moda no se afecta ante
la ocurrencia de valores extremos. Sin embargo, slo se utiliza la moda para propsitos descriptivos
porque es ms variable, para distintas muestras, que las dems medidas de tendencia central. Un conjunto
de datos puede tener ms de una moda o ninguna.
Su smbolo es 4 .
a) Moda para datos no agrupados
Ejemplos
1) datos

2) datos

3) datos

4) datos

Existe ms de una forma de calcular la moda:


~ 3 b

b) Moda para datos agrupados

Caso a) 4

~ no existe

8
donde

es el intervalo de mayor frecuencia absoluta.


3 es el lmite real inferior del intervalo que contiene a la moda.
es la diferencia entre la frecuencia absoluta del intervalo de la
moda y el intervalo anterior
~
c c
es la diferencia entre la frecuencia absoluta del intervalo de la
moda y el intervalo posterior
~
c b
es la amplitud del intervalo.

Caso b) 4

~ 3 b
b

8
donde

es el intervalo de mayor frecuencia absoluta.

Ejemplo Sea la tabla:


-

Duracin
c
c
c
c

80

c
c
c
c
c
c
Total
Caso a): En este caso, el intervalo de mayor frecuencia absoluta es el
~

b 8

~
9 h

4 ~
horas

Caso b):
b

9 h

horas

Ejercicios
1) En una industria dos operarios en siete das de trabajo, son capaces de producir, por da, y en
forma individual la siguiente cantidad de rboles para fresa de
mm de longitud por
mm de dimetro.
Operario A
Operario B
Determine
a) Produccin media de cada
operario. b) Moda del operario A.
c) Mediana del operario B.

2) Se hace una encuesta entre


personas acerca del nmero de horas diarias que se
dedican a ver televisin, obtenindose la siguiente informacin
N de horas
c

c
c
c
c
c
Total
Calcular la media, la mediana y la moda (caso a y b).

3) De un total de
moda.

datos, 20 son 4, 40 son 5, 30 son 6 y el resto 7. Hallar la media y la

4) Cuatro grupos de estudiantes, consistentes en


y
kilos. Hallar el peso medio de los estudiantes.
y

individuos, dieron pesos de

5) Las notas de un estudiante en sus certmenes han sido


media, la mediana y la moda.

6) La siguiente tabla corresponde a la estatura de

. Hallar la

estudiantes de una determinada carrera.

Estatura

c
c

c
Total

Hallar la media, mediana y moda (caso a y b) de la estatura.


7) La oficina de Censo, proporcion las edades de hombres y mujeres divorciados ( en miles
de personas de
aos de edad o ms ).
Edad
c
c

Hombre

Mujer

c
c
c
c
c
c
Total
Obtener las medidas de tendencia central

Solucin

No hay moda, todos los datos tienen frecuencia uno.


4

%
(Caso a) 4
(Caso b) 4

~
~
%

El peso promedio de los estudiantes es

% ~
~

%
4
4 (caso a)
4 (caso b)

Hombre

kilos.

4 no existe

Mujer

Medidas de
dispersin

Una segunda propiedad que describe a un conjunto de datos es la dispersin. Dispersin es


el grado de variacin o diseminacin de los datos. Dos conjuntos de datos pueden diferir tanto en
tendencia central como en dispersin o dos conjuntos de datos pueden tener las mismas medidas de
tendencia central, pero diferir mucho en trminos de dispersin.
Ejemplo:
1)
% ~
2)
% ~
Los estadgrafos de dispersin nos indican si la distribucin o conjunto de datos forma grupos
homogneos o heterogneos. Las medidas de dispersin a estudiar son: rango, desviacin media,
varianza y desviacin estndar.

Ran
go
Indica el nmero de valores que toma la variable. El rango es la diferencia entre el valor
mximo y el valor mnimo de un conjunto de datos.
9 ~ %mx c %mn

Si los datos estn agrupados en una tabla de frecuencias, el recorrido es la diferencia entre
el lmite real superior del ltimo intervalo y el lmite real inferior del primer intervalo.
9 ~ 3mx c 3mn

Ejemplo:
1) Sea el siguiente conjunto de datos

%mx ~
~

%mn ~

9 ~

2) Sea la siguiente tabla:


3

Peso (Kg.)

c
c

c
Total

9 ~

9 ~

Kg.

El rango mide "la dispersin total" del conjunto de datos. Aunque el rango es una medida de
dispersin simple y que se calcula con facilidad, su debilidad preponderante es que no toma en
consideracin la forma en que se distribuyen los datos entre los valores ms pequeos y los ms grandes.

Desviacin
Media
Es la media aritmtica de los valores absolutos de las desviaciones de todos los datos respecto a
la media aritmtica. Su smbolo es +4 .

a) Desviacin media para datos no agrupados

+4

O %
~

c % O

Ejemplo Obtener la desviacin media para los datos


b b b

% ~

+4 ~

+4 ~
O c O

b O c O b O c O
b O

b O
c O

+4

b) Desviacin media para datos agrupados

+4

O % c % O
~

donde

es la marca de clase

Ejemplo Determine la desviacin media de los siguientes datos agrupados


Pesos (Kg.)
c
c
c
c
c
Total

Pesos (Kg.)

% h

% c%

O % c% O

Total

% ~

+4 ~
~

Varianza y Desviacin
Estndar
Dos medidas de dispersin que se utilizan con frecuencia y que s toman en consideracin
la forma en que se distribuyen los valores son la varianza y su raz cuadrada, la desviacin estndar.
Estas medidas establecen la forma en que los valores fluctan con respecto a la media.

Varian
za
La varianza se define como el promedio aritmtico de las diferencias entre cada uno de los
valores del conjunto de datos y la media aritmtica del conjunto elevadas al cuadrado.
Su smbolo es :

si estamos trabajando con una muestra y poblacin.

a) Varianza para datos no agrupados


2

si estamos trabajando con una

: ~

% c %
~
c

donde %

representa los datos de la muestra.


5
% c
~

donde %

5 c

representa los datos de la poblacin.

Ejemplo Determine la varianza del siguiente conjunto de datos:

% ~

: ~
:

: ~

( en unidades al cuadrado )

b) Varianza para datos agrupados


Muestra

% c
~

Poblacin

% c %
~

donde %

5 c

es la marca de clase.

Ejemplo Considere la tabla con los datos de los edades de

personas

Edades ( aos )
c
c
c
c
c
Total

Edades ( aos )
c
c
c
c
c
Total

% c %

% c %

% ~

aos

: ~

( en aos )

Las frmulas anteriores para calcular la Varianza muestral tienen una forma abreviada:
Para datos no agrupados

% c

:
:

Para datos agrupados

donde:
c

donde: %

representa los datos

representa la marca de clase

Propiedades de la
Varianza
%

% ~ :

% ~

si % ~ constante
=

% ~

% b ~ =

% b ~

%
%
=

Las unidades de medida de la varianza son las unidades al cuadrado de los datos.

Ejemplo: De un grupo de contribuyentes se determin que el promedio de impuestos es


de
$32.200, con una varianza de $7.600. Determinar en cada uno de los siguientes casos, la nueva varianza:
a) Los impuestos aumentan en un 2 %
b) A los impuestos se les disminuye la cantidad de $2.300
c) A cada contribuyente, se le disminuye un 3 % y adems se le condona $2.550
Solucin:
a) =

% ~

La nueva varianza es $
b) =

% ~

La nueva varianza es $
c) =

% ~

La nueva varianza es $

Desviacin Tpica o Desviacin Estndar

Es la raz cuadrada positiva de la Varianza. Su smbolo es : si se est trabajando con una


muestra y es si se est trabajando con una poblacin.
a) Desviacin estndar para datos no agrupados

q
q
q
q

% c %

q
: ~ p
q q
~
c
5
donde %
representa los datos de la muestra.
q
% c
q
q
p

~
donde %

: ~

5 c

representa los datos de la poblacin.

Ejemplo Para el conjunto de datos


varianza era

; tendremos entonces que su desviacin estndar es


: ~ l

( unidades )

b) Desviacin estndar para datos agrupados


Muestra
q
q
q

Poblacin
q q

c %

donde se obtuvo que su

q
q

q q

: ~ p
~
c
~ p
~
5 c
donde %

es la marca de clase.

Ejemplo Para el ejemplo de los datos tabulados sobre las edades de


obtuvo como varianza : ~
; luego su desviacin estndar ser
: ~ l

personas se

( aos )

Qu indican la Varianza y la Desviacin Estndar?

La varianza y la desviacin estndar miden la dispersin "promedio" en torno a la


media aritmtica, es decir, cmo fluctan las observaciones mayores por encima de la media aritmtica y
cmo se distribuyen las observaciones menores por debajo de ella.
La varianza tiene ciertas propiedades matemticas tiles. Sin embargo, al calcularla se obtienen
unidades al cuadrado cm2 , pulgadas2 , mm2 , (edades)2 , (horas)2 , etc. por ello, en la prctica, la
principal medida de dispersin que se utiliza es la desviacin estndar, cuyo valor est dado en
las unidades originales cm, pulgadas, mm, edades, horas, etc.

En los ejemplos anteriores:


a) Para la muestra de datos

se obtuvo por desviacin estndar
: ~
( unidades ). Esto indica que la mayor parte de los datos de esta muestra se
agrupan dentro de
unidades por encima y por debajo de la media aritmtica, es decir, entre
c
~

y
b
~

b) Para el caso de los datos tabulados correspondientes a las edades de


personas, se
obtuvo una desviacin estndar de : ~
aos. Esto indica que la mayor parte de los datos
estn agrupados entre

c
~
aos y
b
~
aos.
Edades ( aos )

c
c
c
c
c
Total

Criterio de
Homogeneidad

Una distribucin se considera homognea, si la desviacin estndar se encuentra entre la


quinta y la cuarta parte del rango. Si no es as, entonces se considera que la muestra es heterognea.
a) Para la muestra de datos
9 ~
@

9 9

: ~

A ~

Por lo tanto, la muestra es heterognea.

b) Para el caso de los datos tabulados de las edades de


Edades ( aos )
c
c
c
c
c
Total
9 ~
: ~

( aos )

( aos )
@

9 9

A ~

personas

Por lo tanto, la muestra es homognea.

Observaciones
1) Cuanto ms separados o dispersos estn los datos, es decir, para muestras heterogneas,
tanto mayores sern el rango, la varianza y la desviacin estndar.

2) Si los datos estn ms concentrados, es decir, para muestras homogneas, tanto menores
sern el rango, la varianza y la desviacin estndar.

3) Si todas las observaciones son iguales ( de manera que no haya variacin en los datos ),
el rango, la varianza y la desviacin estndar sern iguales a cero.

Ejercicios

1) En una industria dos operarios en siete das de trabajo, son capaces de producir, por da, y en
forma individual la siguiente cantidad de rboles para fresa de
mm de longitud por
mm de dimetro.
Operario A
Operario B
Determine
a) Rango del operario A y del operario B
b) Varianza del operario A.
c) Desviacin estndar de ambos
operarios. d) Son las muestras
homogneas?.

2) Se hace una encuesta entre


personas acerca del nmero de horas diarias que se
dedican a ver televisin, obtenindose la siguiente informacin
N de horas
c
c
c
c

c
c
Total
Calcular la varianza y la desviacin estndar.

estndar.
3) De un total de

datos, 20 son 4, 40 son 5, 30 son 6 y el resto 7. Hallar la desviacin

4) Cuatro grupos de estudiantes, consistentes en


y
kilos. Hallar la varianza de los estudiantes.
y

individuos, dieron pesos de

5) Las notas de un estudiante en sus certmenes han sido


desviacin estndar. Las notas , son homogneas?.
.

Hallar la

6) La siguiente tabla corresponde a la estatura de

estudiantes de una determinada carrera:

Estatura

c
c

c
Total

Hallar rango, varianza y desviacin estndar de la estatura.

7) La oficina de Censo, proporcion las edades de hombres y mujeres divorciados ( en miles


de personas de
aos de edad o ms ).
Edad
c
c
c

Hombre

Mujer

c
c
c
c
c
Total
Obtener las medidas de dispersin ( rango, varianza y desviacin estndar ) tanto para
los hombres como para las mujeres. Determine, adems si las muestras son homogneas o no.

Solucin

9A ~

9B ~

Ambas muestras no son homogneas.

9 ~

Las notas no son homogneas.


~

Hombres
9

Mujeres

Ambas muestras son homogneas.

Autoevaluacin

1) En una encuesta realizada a


personas en la ciudad de Chilln, sobre su equipo de
ftbol preferido, se obtuvieron los siguientes resultados:
U. de Chile, Colo Colo, U. Catlica, ublense, Colo Colo, U. de Chile, Colo Colo
Colo Colo, U. de Chile, Colo Colo, U. Catlica, ublense, Colo Colo, U. de Chile, U. de Chile, U.
de Chile, Colo Colo, U. Catlica, ublense, Colo Colo, U. de Chile, U. Catlica, Colo Colo, U. de Chile,
Concepcin
a) Construya una tabla para la informacin obtenida
b) Construya un grfico adecuado para la informacin
dada c) Cuntas personas son hinchas de Colo Colo?
d) Qu porcentaje de personas prefiere a U. de Chile?
e) Qu porcentaje de encuestados no es hincha de ublense?

2) Los salarios ofrecidos a 16 personas son ( en miles de pesos ):


165
155

149
170

166
150

167
151

154
142

165
148

144
149

135
100

Determine e interprete para la muestra:


a) Media
aritmtica b)
Moda
c) Mediana

3) Los impuestos pagados por un grupo de contribuyentes han dado origen a la siguiente tabla
de frecuencia:
Monto de impuestos en miles
1 - 20
21 - 40
41 - 60
61 - 80

N personas
4
15
21
18

81 - 100
Total

2
60

Determine:
a) Desviacin Estndar Muestral y explique su significado
b) Determine si la muestra es homognea o heterognea. Justifique su respuesta.

Solucin:
Categoras

U. de Chile
Colo Colo

U. Catlica

ublense

Concepcin

Total

1) a)

Fr e c u e nc i a

b)
E q u ip o s d e F tb o l F a v o r ito s
1
0
9
8
7
6
5
4
3
2
1
lo
C

o
0

C a te g o r a s

c) Las personas hinchas de Colo Colo son


d) El porcentaje de personas que prefiere a U. de Chile es

e) El porcentaje de personas que no prefiere a ublense es


2) a) % ~

El salario promedio es de $
b) 4
El

% de las personas tiene un salario superior a $


c) 4

y
Los salarios ms comunes son $
y $

3) a) : ~
La desviacin estndar es un estadstico que nos indica que tan dispersos
estn los datos, con respecto a la media aritmtica.
b) Los datos no son homogneos.

Unidad N2: Probabilidades

Elementos de Probabilidades

Los primeros estudios de probabilidad fueron motivados por la posibilidad de acierto o fracaso
en los juegos de azar. La probabilidad es un mecanismo por medio del cual pueden estudiarse sucesos
aleatorios, es decir, operaciones cuyo resultado no puede ser predicho de antemano con seguridad. Por

ejemplo, el lanzamiento de una moneda.

Enfoques de probabilidad
1) Experimento aleatorio o experimento: cualquiera operacin cuyo resultado no puede
ser
predicho de anterioridad con seguridad.
Ejemplo:
a) lanzamiento de una
moneda b) lanzamiento de
un dado
c) extraccin de una carta de una baraja de 52 cartas
2) Espacio muestral: es el conjunto de todos los posibles resultados asociados a un
experimento. Su smbolo es + . Si el espacio muestral tiene un nmero finito de elementos o
infinito numerable, entonces se dice que ste es discreto y si el espacio muestral tiene como
elementos todos los puntos de algn intervalo real, entonces se dice que ste es continuo .
Ejemplo:
a) experimento:lanzamiento de un dado
+~

b) experimento: tiempo de duracin de un tubo fluorescente


+~ {! ! }
3) Evento o suceso: es cualquier subconjunto de un espacio muestral. Todo subconjunto es un
evento, en particular + mismo es un evento, llamado suceso seguro y el conjunto vaco, J, tambin es
un evento, llamado suceso imposible .
Ejemplo:
A ~ obtener un nmero impar al lanzar un dado
A~

B ~ obtener al menos una cara al lanzar una moneda dos veces


B~

Como los eventos son subconjuntos de +, entonces es posible aplicar la teora de conjuntos
para obtener nuevos eventos.
Si A y B son eventos, entonces tambin lo son A r B, A q B, Ac
A r B ocurre si, y slo si slo ocurre A o slo ocurre B u ocurren A y B a la
vez. A q B ocurre si, y slo si ocurre A y ocurre B a la vez.
Ac ocurre si, y slo si no ocurre A.

En todo experimento aleatorio +


complementos son tomados respecto a +.
se considera el conjunto universal, por lo tanto, todos los
Ejemplo

Considere el experimento lanzamiento de dos


dados. a) Determine el espacio muestral
b) Obtenga los siguientes eventos:
A ~ la suma de los dos nmeros es un mltiplo de dos
B ~ ambos dados muestran la misma cara
C ~ los dos nmeros son primos
D ~ la resta de los dos nmeros es divisible por tres
c) Encuentre, si es posible, A r B, C q D, Bc , Bc q Cc

r
t

! u
! w
t

w
t
+ ~ Pt

!
!

! w
w
! Q

t
s

!
!
!
!

!
!
!
!
w
!
! v

A~ J

!
!
!

!
!
!

!
!
!

!
!
!

!
!
!

!
!

! K
!
B~

!
!

!
!

C~ J

!
!
!

!
!
!
!
! I
!
D~

Ar B~ A

!
!

!
!

!
Cq D~

!
!
Bc ~ % &!% &

r
t
Bc q Cc ~

t
s

!
!
!
!

!
!
!
!
!
!
!
!

!
!
!
!
!
!
!
!
! u
! w
w
!
! v

Concepto de probabilidad en espacio finito equiprobable


Si + es un espacio muestral con
elementos, entonces la probabilidad de un evento A
es el cuociente
, donde
es el nmero de elementos de A

Esto se denota: P A! ~
Ejemplo
+ ~ lanzamiento de un dado
A ~ aparece un mltiplo de tres

+~
A~

P A! ~

Definicin: Diremos que dos eventos A y B son mutuamente excluyentes o disjuntos si


no pueden ocurrir juntos, es decir A q B ~ J
Por ejemplo,
+~
+ ~ lanzamiento de un dado
A ~ aparece un mltiplo de tres
( ~
B ~ aparece un mltiplo de cuatro
) ~

Luego, A y B son eventos disjuntos, porque A q B ~ J

Axiomas de probabilidad
Sea + un espacio muestral y sean A y B dos eventos cualesquiera de este:
Axioma1 P +! ~
Axioma2 P A!

D A +
Axioma3 P A r B! ~ P A! b P B!
B

si A q B ~ J
En general, P8
r ( 9 ~ P ( ! b P ( ! b P ( ! b
~
( q (

~ J

b P ( ! con

De estos tres axiomas fundamentales es posible determinar algunas propiedades y


consecuencias:
Teorema1
a) P J! ~
Demostracin
+~ +r J
P +! ~ P + r J!
P +! ~ P +! b P J!
~
b
~ P J!

pues + q J ~ J

b) P Ac ! ~ 1 c P A!
Demostracin
+ ~ A r Ac
P +! ~ P A r Ac !
P +! ~ P A! b P Ac !
~ P A! b P Ac !
1 c P A! ~ P Ac !

pues A q Ac ~ J

c) Si A B, entonces P A!
P B!

Demostracin

B~ Ar
B c A!
P B! ~ P[A r
B c A!]
P B! ~ P A! b P B c A!
Luego P A!
P B!

Corolario
pues A q
B c A! ~ J

P A!
1

Demostracin
J
P
P
P

A +
J!
A!
+!
0
P A!
1

Teorema 2
a) P A r B! ~ P A! b P B! c P A q B!

Demostracin
Ar B~ Ar
B c A!
P A r B! ~ P[A r
B c A!]
P A r B! ~ P A! b P B c A!
P A r B! c P A! ~ P B c A!
pues A q
1!
B c A! ~ J
Por otro lado

B ~ A q B! r
B c A!
P B! ~ P A q B! b P B c A!
P B! c P A q B! ~ P B c A!
pues A q B! q
2!
B c A! ~ J
de 1! y 2!
P A r B! c P A! ~ P B! c P A q B!
P A r B! ~ P A! b P B! c P A q B!

b) P A c B! ~ P A! c P A q B!

Demostracin
Ar B~
A c B! r B
P A r B! ~ P[ A c B! r B]
P A! b P B! c P A q B! ~ P A c B! b P B!
P A! c P A q B! ~ P A c B!

pues A c B! q B ~ J

Corolario
P A r B r C! ~ P A! b P B! b P C! c P A q B! c P A q C! c P B q C! b P A q B
q C!

Demostracin
Ar Br C~
P A r B r C!
A r B! r C
~ P[ A r B! r C]
~ P A r B! b P C! c P[ A r B! q C]
~ P A! b P B! c P A q B! b P C! c P[ A q C! r

B q C!]
~ P A! b P B! c P A q B! b P C! c P A q C! b P B q C! c P A q B q C!
~ P A! b P B! b P C! c P A q B! c P A q C! c P B q C! b P A q B q C!

Teorema3
Sea + un espacio muestral y A un evento de + , A + , entonces
P A! ~ P A1 ! b P A2 ! b P A3 ! b

b P Ak !

P Ai !

Donde Ai son eventos disjuntos cuya unin es A


~

Demostracin
A ~ A1 r A2 r A3 r ... r Ak
P A! ~ P A1 r A2 r A3 r ... r Ak !
P A! ~ P A1 ! b P A2 ! b P A3 ! b

b P Ak !

pues Ai q Aj ~ J
P A! ~
P Ai !
~
Ejempl
os
1) Suponga que A y B son eventos para los cuales P A! ~ % ; P B! ~ &
~ ' . Determine:
a) P Ac r
Bc ! b) P
Ac r B! c)
P Ac q B!
d) P Ac q
Bc !

Solucin
a) P Ac r Bc !

~ P[ A q B! ]
~ 1 c P A q B!
~ c '

b)P Ac r B!

y P A q B!

c) P Ac q B!
c

~ P[ A c B! ]
~ 1 c P A c B!
~ c P A! c P A q B!
~
c%b'
~ P B c A!
~ P B! c P A q B!
~ & c '

d) P Ac q Bc !
c

~ P[ A r B! ]
~ c P A r B!
~ c P A! c P B! b P A q B!
~
c%c& b'
2) De la produccin de tornillos de cierta magnitud resulta que el 5 % de ellos no tienen el largo
especificado, el 7 % no tienen el dimetro especificado y el 2 % tiene ambos defectos. Se elige un
tornillo al azar de la produccin de estas magnitudes. Cul es la probabilidad que:
a) tenga al menos uno de los dos
defectos?. b) tenga slo el defecto del
largo?
c) tenga slo uno de los dos defectos?
d) no tenga
defectos? Solucin
A ~ tornillos con defecto del largo
B ~ tornillos con defecto del dimetro

a) P A r B!
~ P A! b P B! c P A q B!
~
b
c
~
La probabilidad de que tenga al menos uno de los dos defectos es de 0,10
b) P A c B!
~ P A! c P A q B!
~
c
~
La probabilidad de que tenga slo el defecto del largo es de 0,03
c) P A c B! b P B c A! ~
~

! b P B! c P A q B!
b
c

La probabilidad de que tenga slo uno de los dos defectos es de 0,08


d
~
~
~

) P A r B!

c P A r B!
c

La probabilidad de que no tenga defectos es de 0,90

3) La alimentacin de cierta especie se considera completa si cada individuo consume tres tipos
de alimentos en cantidades adecuadas. En una poblacin se encontr que el 75 % consume alimento tipo
A, el
70 % alimento tipoB, el 50 % alimento tipo C, el 50 % alimento tipo A y B, el 30 % alimento tipo A y C,
el
30 % alimento tipo B y C y el 15 % consume de los tres tipos de alimentos. Se elige un individuo al azar
en la poblacin, calcular la probabilidad que:
a) consuma slo alimento tipo C.
b) consuma slo un tipo de alimento.
c) consuma al menos dos tipos de alimentos
Solucin
M ~ individuo de la poblacin que consume alimento tipo A
N ~ individuo de la poblacin que consume alimento tipo B
Q ~ {individuo de la poblacin que consume alimento tipo C}

a) La probabilidad de que un individuo slo consuma alimento tipo C es de 0,05


b) La probabilidad de que un individuo consuma slo un tipo de alimento es de 0,20 .
c) La probabilidad de que un individuoconsuma al menos dos tipos de alimentos es de 0,80.

Ejercicios

1) Si A,B y C son eventos mutuamente excluyentes, y P(A) ~

Encuentre
a) P(A U B U C)

P(B) ~

P(C) ~

b) P< Ac q ( B U C ) =

c) P( B U C )

2) Sean A y B eventos tales que P A! ~

P B! ~

P A q B! ~

calcule

a) P Ac !
c) P A r B!
e) P Ac r Bc !
b) P Bc !
d) P A c B!
f) P Ac q Bc !
3) De un total de 500 estudiantes, se encuentra que 210 fuman, que 258 toman bebidas
alcohlicas, que 216 toman alimentos entre comidas, que 122 fuman y toman bebidas alcohlicas, que 83
toman alimentos entre comidas y tambin bebidas alcohlicas, que 97 fuman y toman alimentos entre
comidas y que 52 practican estos tres dainos hbitos. Si se escoge aleatoriamente a un miembro de esta
generacin, encuentre la probabilidad de que el estudiante
a) fumen, pero no tome bebidas alcohlicas.
b) tome alimentos entre comidas e ingiera bebidas alcohlicas, pero no
fume. c) no fume y no tome alimentos entre comidas.
4) La probabilidad de que una industria XX se ubique en la ciudad A es de 0,7; de que se
localice en la cuidad B es de 0,4 y de que se encuentre en A o en B, o en ambas es de 0,8. Cul es la
probabilidad de que la industria se localice
a) en ambas
cuidades?. b) en
ninguna de ellas?.
5) En una bolsa hay 36 fichas numeradas del 1 al 36, respectivamente. Si se extrae una ficha,
calcular la probabilidad de que la ficha extrada sea
a) un nmero par
b) un nmero primo
c) un mltiplo de 5
d) un nmero terminado en 2
e) un nmero divisible por 6
f) un nmero impar mayor que 20.

Solucin

1)
a) P(A U B U C) ~
c) P( B U C ) ~
2)
a)

P Ac ! ~

b) P< Ac
q (BUC)= ~

) P Bc ! ~
c)

P A r B! ~

) P A c B! ~
e)

f)

P Ac r Bc ! ~

P A c q Bc ! ~
3)
a) La probabilidad de que fumen, pero no tome bebidas alcohlicas es
b)

La probabilidad de que tome alimentos entre comidas e ingiera bebidas alcohlicas, pero

no fume es

c) La probabilidad de que no fume y no tome alimentos entre comidas es

4)
a) La probabilidad de que la industria se localice en ambas ciudades es
b) La probabilidad de que la industria no se localice en ninguna de ellas es

5)
a) La probabilidad de que la ficha extrada sea un nmero par es

b) La probabilidad de que la ficha extrada sea un nmero primo es

c) La probabilidad de que la ficha extrada sea un mltiplo de 5 es

d) La probabilidad de que la ficha extrada sea un nmero terminado en 2 es

e) La probabilidad de que la ficha extrada sea un nmero divisible por 6 es

f) La probabilidad de que la ficha extrada sea un nmero impar mayor que 20 es

Probabilidad
Condicional

Cuando se est calculando la probabilidad de un evento A en particular, y se tiene informacin


sobre la ocurrencia de otro evento B, esta probabilidad se conoce como probabilidad condicional, la
cual se denota por P A/B!, se lee "probabilidad de A dado B" y se define como:

P A/B! ~
P A q B!
P B!

con P B!
Las probabilidades condicionales satisfacen los axionas de probabilidad
1) P +/B! ~

P +/B! ~
P + q B!
P B!
~

P B!
P B!

~
2) P[ A r C!/B] ~ P A/B! b P C/B!
Aq C~ J

P[ A r C!/B]
~

P[ A r C! q B] P B!
~

P[ A q B! r
P B!

C q B!]
~

P A q B!

P B!

P C q B!
P B!
~ P A/B! b P C/B!
Ejemplos
1) La probabilidad de que un vuelo de programacin regular despegue a tiempo es P D! ~
; la que llegue a tiempo es P A! ~
y la que despegue y llegue a tiempo es
P D q A! ~
. Encuentre la probabilidad de que el avin:
a) llegue a tiempo dado que despeg a tiempo.
b) despegue a tiempo dado que lleg a tiempo
Solucin
D ~ despegar a tiempo
A ~ llegar a tiempo

a) P A/D! ~
P A q D!
P D!

La probabilidad de que el avin llegue a tiempo dado que despeg a tiempo es de 0, 94 .

b) P D/A! ~
P D q A!
P A!

~
La probabilidad de que el avin despegue a tiempo dado que lleg a tiempo es de 0,95 .
2) En una oficina hay 100 mquinas calculadoras, algunas de ellas son elctricas E! mientras
que otras son manuales M!. De ellas unas son nuevas N! y otras usadas U!. El nmero de
mquinas por categora est dada en la siguiente tabla:

N
U

E
40
20

M
30
10

Total
70
30

Una persona entra a la oficina y escoge una mquina al azar, descubre que es nueva. Cul es
la probabilidad que sea elctrica?

P E/N! ~
P E q N!
P N!
~

La probabilidad es de 0,57 .
3) Un grupo de 500 ejecutivos es clasificado de acuerdo a las caractersticas del peso y a
la insidencia del peso en la hipertensin. Se da la siguiente tabla:
Sobre peso SP! Peso normal PN! Bajo peso BP! Total
Hipertenso H!
50
40
10
100
c
No hipertenso H ! 75
225
100
400
Total
125
265
110
500
a) Cul es la probabilidad de que una persona elegida al azar sea hipertensa?
b) Una persona elegida al azar tiene sobrepeso. Cul es la probabilidad que tambin
sea hipertensa?
c) Una persona elegida al azar no es hipertensa. Cul es la probabilidad de que tenga
peso
normal?

a) P H! ~

La probabilidad de que una persona sea hipertensa es de 0,20 .

b) P H/SP! ~
P H q SP!
P SP!
~

La probabilidad de que una persona con sobrepeso sea tambin hipertensa es de 0,40 .

c) P N/Hc ! ~
PNq Hc !
P Hc !
~

La probabilidad de que una persona no hipertensa tenga tambin peso normal es de 0,

Uno de los usos ms frecuentes de la probabilidad condicional es dar un procedimiento fcil


para asignar probabilidades a intersecciones de eventos. Del concepto de probabilidad condicional es
posible encontrar una expresin til, llamada regla del producto, para la probabilidad de interseccin de
eventos, esta es:

P A/B! ~
P A q B!
P B!

P AB! ~ P AB! h P B!

As,
P A q B q C!
~ P A/B q C! h P B q C!
~ P A/B q C! h P B/C! h P C!
P A q B q C q D! ~ P A/B q C q D! h P B q C q D!
~ P A/B q C q D! h P B/C q D! h P C q D!
~ P A/B q C q D! h P B/C q D! h P C/D! h P D!

Ejemplos:

1) Se seleccionan 2 fichas al azar, sin reemplazo, de una urna que contiene 4 blancas y 8
negras. Calcular la probabilidad de que:
a) ambas sean blancas.
b) la segunda sea blanca.
a) B ~ {fichas blancas} N ~ {fichas negras}
P B! ~

P N! ~
P B1 q B2 ! ~ P B1 ! h P B2 /B1 !

~
h

~
La probabilidad de ambas fichas sean blancas es de 0,09 .

b) P B1 q B2 ! b P N1 q B2 !
~

b P N1 ! h P B2 /N1 !

La probabilidad de que la segunda ficha sea blanca es de 0,33 .


2) Una caja de fusibles contiene 20 unidades, de las cuales 5 son defectuosas. Si tres de
estos fusibles son tomados al azar, en sucesin y sin reemplazo.
a) Cul es la probabilidad que los tres sean defectuosos?
b) Si en cada una de las dos primeras se extrajo un defectuoso.Cul es la probabilidad que
el tercero extraido sea bueno?
c) Si los dos primeros estaban buenos. Cul es la probabilidad que el tercero extrado

sea defectuoso?
d) Cul es la probabilidad que los dos primeros sean buenos y el tercero defectuoso?
D ~ {fusible defectuoso}
Dc ~ {fusible no defectuoso}
P

D! ~

Dc ! ~

a) P D1 q D2 q D3 !
~ P D1 ! h P D2 /D1 ! h P D3 /D1 q D2 !

La probabilidad es de

b) P Dc /D
q D ! ~

La probabilidad es de un

c) P D3 /Dc q Dc ! ~
La probabilidad es de un

d) P Dc q Dc q D !
~ P Dc ! h P Dc /Dc ! h P3 D /Dc q Dc !
1

h
h

La probabilidad es de un

Ejercicios

1) La probabilidad de que un automvil al que se le llena el tanque de gasolina necesite


tambin un cambio de aceite es de 0,25 ; la de que requiera un nuevo filtro de aceite es de 0,40 y de
que le haga falta tanto cambio de aceite como de filtro es de 0,14.
a) Si se debe cambiar el aceite, cul es la probabilidad de que necesite un filtro nuevo?.
b) Si se necesita un filtro nuevo, cul es la probabilidad de que requiera un cambio de aceite?.
2) Para parejas de casados que viven en una cierta ciudad de los suburbios., la probabilidad de
que el esposo vote en alguna eleccin es de 0,21, la de que su esposa lo haga, de 0,28 y la de que ambos
voten, de 0,15. Cul es la probabilidad de
a) al menos un miembro de la pareja de casados
vote?. b) vote la esposa, dado que su esposo lo
hace?.
c) vote un esposo, dado que su esposa no lo hace?.
3) De una caja que contiene 6 pelotas negras y 4 verdes, se sacan tres en sucesin,
reemplazndose cada pelota en la caja antes de extraer la siguiente.
a) Cul es la probabilidad de que las tres sean del mismo color?.
b) Cul es la probabilidad de que primera pelota sea negra, la segunda verde y la tercera
negra?. c) Repita las mismas preguntas anteriores, pero asuma que no hay reemplazo.
4) Una urna contiene 7 bolas rojas y 3 bolas blancas. Se sacan 3 bolas de la urna . Hallar la
probabilidad de que las dos primeras sean rojas y la tercera blanca.
a) las bolas se devuelven a la urna.
b) las bolas no se devuelven a la urna.
5) En cierta facultad, 25 % de los estudiantes perdieron matemticas, 15 % perdieron qumica y
10
% perdieron las dos. Se selecciona un estudiante al
azar.
a) Si perdi qumica, cul es probabilidad de que perdi
matemticas? b) Si perdi matemticas, cul es probabilidad de que
perdi qumica? c) Cul es probabilidad de que perdi matemticas
o qumica?

6) Sean A y B eventos con P A! ~

, P B! ~

y P A q B! ~
. Hallar
a) P A/B!
c) P A r B!
e) P Bc /Ac !

b) P B/A!
d) P Ac /Bc !
7) A un jugador le reparten 5 cartas de una baraja corriente de 52 cartas. Cul es la
probabilidad de que todas sean corazones?.

de que
8) Una clase tiene 15 nias y 19 nios. Si se escogen tres estudiantes al azar.Cul es probabilidad
a) todos sean nios. b)
todos sean nias.
c) al menos uno sea nio d) dos
sean mujeres.
e) al menos dos sean nios.

9) Se estima que la probabilidad de que aumenten las ventas de automviles en el siguiente mes
es de 0,40. Se estima que la probabilidad de que aumenten las ventas de refacciones es de 0,30. Se
estima que la probabilidad de que ambas industrias experimenten un aumento en ventas es de 0,10.
Cul es la probabilidad de que
a) hayan aumentado las ventas de automviles durante el mes, dado que existe informacin de
que han aumentado las ventas de refacciones?
b) hayan aumentado las ventas de refacciones, dado que existe informacin de que
aumentaron las ventas de automviles durante el mes?

Solucin

1) A ~ cambio de aceite
B ~ nuevo filtro

a) P B/A! ~
b) P A/B! ~

2) A ~ esposo vota
B ~ esposa vota
a) P A r B! ~
c)P A/Bc ! ~
3) N ~ pelota negra
b) P B/A! ~

V ~ pelota verde

a) P N q N q N ! b P V q V q V ! ~

c) P N1 q N2 q N3 ! b P V1 q V2 q V3 ! ~

b) P N q V q N ! ~

P N q V q N ! ~

4) R ~ pelota roja
B ~ pelota blanca

a) P R1 q R2 q B3 ! ~
b) P R1 q R2 q B3 ! ~

5) A ~ perder matemticas

a)P A/B! ~
B ~ perder qumica

b) P B/A! ~
c) P A r B! ~
a)

6)

P A/B! ~

) P B/A! ~

c) P A r B! ~
d) P Ac /Bc ! ~
e) P Bc /Ac ! ~

7) P C1 q C2 q C3 q C4 q C5 ! ~

8) A ~ nias
B ~ nios
a) P B1 q B2 q B3 ! ~

b) P A1 q A2 q A3 ! ~

c) P B1 q A2 q A3 ! b

P B1 q B2 q A3 ! b P B1 q B2 q B3 ! ~

d) P B1 q A2 q A3 ! ~

e) P B1 q B2 q A3 ! b P B1 q B2 q B3 ! ~

9) A ~ aumento venta de automviles

B ~ aumento ventas de refacciones

a) P A/B! ~

b) P B/A! ~

Teorema: Probabilidad total! Suponga que los eventos A1 ,A2 ,...,Ak forman una particin de
+,
es decir, A1 r A2 r ... r Ak ~
se tiene:
+,A

J y Ai q Aj ~ J
P E! ~

. Entonces para cualquier evento E +

P Ai ! h P E/Ai !
~

Teorema de Bayes:
D
,A

Si A1 ,A2 ,...,Ak es una particin de +, es decir, A1 r A2 r ... r Ak ~ +


. Entonces para cualquier evento B + se tiene:

J y Ai q Aj ~ J
P Ai /B! ~
P Ai q B!
P B!
P Ai /B! ~
P B q Ai !
P B q A1 ! b P B q A2 ! b ... b P B q Ak !
P Ai /B! ~
P B/Ai ! h P Ai !
P B/A1 ! h P A1 ! b P B/A2 ! h P A2 ! b ... b P B/Ak ! h P Ak !

Ejemplos:
1) La probabilidad de que Alicia estudie para su examen final de Estadstica es 0,2 . Si estudia
la probabilidad de que apruebe el examen es 0,8, en tanto que si no estudia la probabilidad es 0,5.
a) Cul es la probabilidad que Alicia apruebe estadstica?.
b) Dado que Alicia aprob su examen. Cul es la probabilidad de que haya estudiado?.
E ~ Alicia estudia
Ec ~ Alicia no estudia
A ~ Alicia aprueba estadstica
P E! ~
P Ec ! ~

P A/E! ~

P A/Ec ! ~

a) P A!
P A!
P A!
P A!

~ P A q E! b P A q Ec !
~ P A/E! h P E! b P A/Ec ! h P Ec !
~
!

! b
!

La probabilidad de que Alicia apruebe estadstica es de 0,56 .

b) P E/A! ~
P E q A!
P A!
~

~
~

P A q E!
P
A!
P A/E! h P E!
P A!

La probabilidad de que Alicia haya estudiado dado que aprob estadstica es de 0,29 .

2) Componentes complejas son ensambladas en una planta que usa dos lneas de ensamblado
A y B. La lnea A usa equipos ms viejos que la lnea B de manera que es algo ms lenta y menos
confiable. Suponga que en un da dado, la lnea A ha ensamblado 8 componentes de los cuales 2 son

defectuosos y 6 son no defectuosos, mientras que la lnea B ha producido 1 componente defectuoso y 9


componentes no defectuosos. El encargado de ventas selecciona al azar una de estas 18 componentes
para una demostracin y encuentra que es defectuosa. Cul es la probabilidad que esta componente
haya sido ensamblada por la lnea A?.
A ~ lnea A
B ~ lnea B
D ~ artculo defectuoso

A! ~ P B! ~

D/A! ~

D/B! ~

P A/D!
~

P A q D!
P D!
~

P D q A!
P D q A! b P D q B!
P D/A! h P A!
P D/A! h P A! b P D/B! h P B!

h
~
h
b

La probabilidad de que la componente defectuosa la haya producido la lnea A es de 0,71 .

3) De un grupo gande de habitantes de una ciudad que tiene igual nmero de personas en

administracin, comercio, servicio de salud y servicio municipal se encontr que el 35 % de los


administrativos, el 25 % de los comerciantes, el 20 % del servicio de salud y el 15 % del servicio
municipal eran mujeres.
a) Cul es la probabilidad que una mujer escogida al azar del grupo sea administrativa?
b) Cul es la probabilidad que un individuo del grupo elegido al azar sea hombre?
A ~ administrativo
C ~ servicio salud
M ~ mujer

P A! ~ P B! ~ P C! ~ P D! ~
P M/A! ~

B ~ comerciante
D ~ servicio municipal
Mc ~ hombre

P M/B! ~

P M/C! ~
P M/D! ~

a) P A/M! ~
P A q M!
P M!
~

P M q A!
P M q A! b P M q B! b P M q C! b P M q D!
P M/A! h P A!
P M/A! h P A! b P M/B! h P B! b P M/C! h P C! b P M/D! h P D!

!
! b

! b

La probabilidad de que la mujer sea administrativa es de

! b

0,37 . b) P Mc ! ~ c P M!
~
c
~
La probabilidad de que el individuo sea un hombre es de 0,7625 .

Ejercicios

1) La polica planea reforzar el respeto a los lmites de velocidad mediante la utilizacin


de sistemas de radar en cuatro diferentes sitios dentro de la ciudad. Los sistemas de radar en cada sitio
L1 , L2 , L3 y L4 se ponen a funcionar, respectivamente, el 40 %, 30 %, 20 % y 30 % del tiempo,
y si una persona que conduce a gran velocidad rumbo a su trabajo tiene, respectivamente, las
probabilidades de 0,2
; 0,1 ; 0,5 y 0,2 de pasar por alguno de estos sitios y que le multen. Cul es la probabilidad de que
le levanten una multa?.
2) Suponga que se distribuyen pelotas de colores en tres cajas idnticas de la siguiente manera
Caja 1

Caja 2

Caja 3

Roja
Blanca
Azul
Una caja se selecciona aleatoriamente, de ella se saca una pelota, tambin aleatoriamente, y se
observa que es roja. Cul es la probabilidad de que la caja 3 sea la que se escogi?.
3) Tres mquinas A, B y C producen respectivamente 60 %, 30 % y 10 % del nmero total de
artculos de una fbrica. Los porcentajes de desperfectos de produccin de estas mquinas son
respectivamente 2 %, 3 % y 4 %. Seleccionando un artculo al azar result defectuoso. Hallar
la probabilidad de que el artculo hubiera sido producido por la mquina C.
4) Una compaa necesita tomar la decisin de patrocinar en la TV uno de los
siguientes programas juegos de futbol F!, una serie del oeste O! o un programa musical M!. Las
probabilidades de que decidan por F, O o M son 0,40 ;0,35 y 0,25 respectivamente. Las probabilidades
de que las ganancias
aumenten sustancialmente si escogen F, O o M son 0,50 ;0,40 y 0,30 respectivamente. Si las ganancias
aumetan sustancialmente, encontrar la probabilidad de que la compaa haya escogido la serie del oeste.
5) Existen tres teoras econmicas principales I, que la inflacin va a desaparecer pronto;
D, que ocurrir la depresin, y R, que ocurrir la recesin. Las probabilidades de que I, D o R ocurran
son 0,40 ;
0,35 y 0,25 , respectivamente. Las probabilidades de que las acciones de la Compaa Goldmine
tripliquen su valor si ocurre I, D o R son 0,90 ;0,60 y 0,20 respectivamente. Si las acciones triplican su
valor, cul es la probabilidad de que la inflacin haya desaparecido?.
6) Tres mquinas A, B y C producen componentes mecnicos similares. A produce el 45 %
del total de componentes, B el 30 % y C el 25 %. Para el programa de produccin usual, el 8 % de

los componentes producidos por A no cumplen con las especificaciones establecidas, para B y C, las
cifras correspondientes son 6 % y 3 % , respectivamente; un componente es extrado al azar de la
produccin total y se encuentra defectuoso. Encontrar la probabilidad de que el componente
seleccionado fuera producido por la mquina A.

Solucin

1) M ~ multa
P M! ~

2) R ~ roja
B ~ blanca
A ~ azul
C1 ~ caja 1
C2 ~ caja 2
C3 ~ caja 3
P C3 /R! ~

3) A ~ mquina A
B ~ mquina B
C ~ mquina C
D ~ artculo defectuoso
P C/D! ~

4) F ~ juego de ftbol
O ~ serie del oeste
G ~ programa musical
G ~ aumento de ganacias

P O/G! ~

5) I ~ inflacin va a desaparecer D ~ ocurrir depresin


C ~ ocurrir recesin
A ~ acciones triplicadas
P I/A! ~

6) A ~ mquina A
B ~ mquina B
C ~ mquina C
D ~ artculo defectuoso
P A/D! ~

Eventos
Independientes

Concepto: Los eventos A y B se dicen independientes si, y slo si P A q B! ~ P A! h P B!


Teorema: Suponga que P A! y P B! , entonces A y B independientes implica que
ellos no son excluyentes y A , B mutuamente excluyentes implica que ellos no son independientes.
Ejemplos
1) Si dos dados son lanzados una vez y sean los siguientes eventos
A ~ la suma es 7
B ~ los dos dados muestran el mismo nmero
C ~ el primer dado es par
Son A y B , A y C independientes?
A~

B~

P A! ~

P B! ~

C~ J

!
!
!

!
!
!
!
!
!

!
!
!
!
!
!

!
! K
!

P C! ~

Aq B~ J

P A q B! ~

P A q B! P A! h P B!
A y B no son independientes

Aq C~

P A q C! ~

P A! h P C! ~

P A q C! ~ P A! h P C!

A y C son independientes

2) Dada la siguiente tabla


con cncer C! sin cncer Cc !
fumador F!

no fumador Fc !

Son F y C eventos independientes?


P F q C! ~
P F! ~

P C! ~

P F! h P C! ~

! h

! ~

P F q C! P F! h P C!
F y C no son independientes

3) Sabiendo que A y B son eventos independientes, demuestre que:


a) A y Bc son
independientes b) Ac y B
son independientes
a) A y B independientes si, y slo si P A q B! ~ P A! h P B!

A ~ A q B! r
A c B!
P A! ~ P[ A q B! r
A c B!]
P A! ~ P A q B! b P A
c B!
P A! ~ P A! h P B! b P A

q Bc ! P A! c P A! h P B!
~ P A q Bc ! P A![
c P
B!] ~ P A q Bc !
P A! h P Bc ! ~ P A
q Bc !
Por lo tanto, si A y B son independientes, entonces A y Bc tambin lo
son.
b)

B ~ A q B! r
B c A!
P B! ~ P[ A q B! r
B c A!]
P B! ~ P A q B! b P B c
A!
P B! ~ P A! h P B! b P B
q Ac ! P B! c P A! h P B!
~ P B q Ac ! P B![
c P
A!] ~ P B q Ac !
P B! h P Ac ! ~ P B
q Ac !
Por lo tanto, si A y B son independientes, entonces B y Ac tambin lo
son.

Ejercicios

1) Sea el caso de lanzar dos monedas corrientes al aire. Sean los eventos
A ~ {todas caras o todas
sellos} B ~ {aparece una
cara}
C ~ {aparece a lo menos una cara}
a) Son A y B, A y C, B y C independientes?
2) Se lanzan dos dados. Sean los eventos
A ~ {la suma de cinco}
B ~ {el primer nmero es impar}
C ~ {el segundo nmero es divisible por
tres} D ~ {la suma es mayor que siete}
Cules eventos son indepentientes tomados en parejas?
3) Si A y B son eventos independientes, pruebe que Ac y Bc tambin lo son.

Solucin

1) Ninguno es independiente.
2) Slo son independientes A y B ; A y C ; B y C
3) La demostracin
entonces
P Ac q Bc ! ~ P Ac ! h
P Bc !

es

verdadera,

es

decir,

si

P A q B! ~ P A! h P B!,

Variables Aleatorias
v.a!

Concepto: una variable aleatoria es una funcin que asocia un nmero real a cada elemento
del espacio muestral.
Se usarn letras maysculas para denotar a una v.a y letras minsculas para denotar los
valores que ella adquiere.
Ejemplos:
1) Se sacan dos pelotas en sucesin, sin reemplazo, de una urna que contiene 4 pelotas rojas
y 3 negras. Los resultados posibles y los valores % de la v.a X, donde ? es el nmero de pelotas rojas
son:
Espacio muestral
RR
RN
NR
NN

2) El encargado de un almacn le devuelve tres cascos de seguridad,


seleccionados aleatoriamente, a tres obreros del taller, quienes ya se lo haban probado previamente.
Suponiendo que el orden de los obreros Prez, Gonzlez y Muoz es el correcto para recibir su
casco original, seale los
posibles rdenes en que los tres obreros reciben un casco y encuentre los valors
de la v.a 4
representa el nmero de asociaciones correctas.
que

Espacio muestral
PGM
PMG
MPG
MGP
GPM
GMP
En los ejemplos anteriores, el espacio muestral tiene un nmero finito de elementos.

Conceptos:
1) Si en espacio muestral contiene un nmero finito de posibilidades o una secuencia
interminable con tantos elementos como nmeros naturales existen, entonces se llama espacio muestral
discreto.
Los dos ejemplos anteriores corresponden a espacio muestral discreto.
2) Si en espacio muestral contiene un nmero infinito de posibilidades igual al nmero de
puntos de un segmento de lnea, entonces se llama espacio muestral continuo.
Por ejemplo: tiempo necesario para ejecutar una reaccin qumica.
Una v.a se llama v.a discreta si se puede contar su conjunto de resultados posibles.Una v.a
se llama v.a continua si se puede tomar en una escala continua.

En la mayora de los problemas prcticos, las v.a continuas representan datos medidos ,
tales como alturas, pesos, temperatursa, distancias o perodos de vida; mientras que las v.a discretas
representan datos que se cuentan ,tales como el nmero de artculos defectuosos de una muestra de k
artculos o el nmero de accidentes por ao en una va rpida en una determinada ciudad.

Distribuciones discretas de probabilidad

Una v.a discreta asume cada uno de sus valores con una cierta probabilidad.
Con mucha frecuencia es conveniente representar con una frmula todas las probabilidades de
una v.a ?. Dicha frmula, necesariamente, debe ser funcin de los valores numricos %, y que se
representa
por
%!
%!
%!, etc.Por lo tanto,
%! ~ P ? ~ %!. Al conjunto de pares ordenados
llama funcin de probabilidad o distribucin de probabilidad de la v.a discreta ?.
%

%!! se le
Concepto : El conjunto de pares ordenados

%!! es una funcin de probabilidad, funcin

masa de probabilidad o distribucin de probabilidad de la v.a discreta ?


condiciones

%!

D %

%! ~
%

si satisface las siguientes


P ? ~ %! ~
Ejemplos

%!

1) Una moneda se lanza dos veces, entonces + ~


consiste en observar el nmero de caras.
!

! Sea ? la v.a que


Espacio muestral

? ~

La funcin de probabilidad es:

! ~ P % ~

! ~ P % ~

! ~

! ~

! ~ P % ~

%
P ? ~ %!

! ~

2) De un lote de 25 artculos de los cuales 5 son defectuosos se eligen 4 al azar. Sea @


la v.a que
representa el nmero de artculos defectuosos encontrados. Obtener la distribucin de probabilidades de
la v.a @ si los artculos se eligen sin sustitucin.
9

Sea + ~ artculo defectuoso, por lo tanto, + ~ arculo no defectuoso

P +! ~
P + ! ~
! ~ P & ~

! ~ P +

q +

q +

! ~ P& ~ ! ~ PD
q

q +

q + ! ~

! ~ P& ~ ! ~ PD
q

q +

q + ! ~

! ~ P& ~ ! ~ PD
q

q +

q + ! ~

q + ! ~

! ~ P& ~ ! ~ PD

q + q + q + ! ~

&
P@

~ &

Distribuciones continuas de probabilidades

Una v.a continua tiene probabilidad cero de asumir cualquiera de sus valores. Luego, su
distribucin de probabilidad no puede darse en forma tabular.
Como una distribucin de probabilidad de una v.a continua no puede presentarse en forma
tabular, si puede tener una frmula. Esta frmula es una funcin, es decir,
%! y para este tipo
de variables se llama funcin de densidad de probabilidad o funcin de densidad .
Algunas de las formas de la funcin de densidad son

Las reas bajo la curva representarn las probabilidades, por lo tanto, el grfico de la funcin de
densidad se ubica siempre sobre el eje X

Una funcin de densidad se construye de tal forma que el rea comprendida bajo la curva es
siempre igual a uno, cuando se calcula sobre todo el recorrido de la v.a ?.

As P
%!

! ~

Concepto : La funcin
%! es una funcin de densidad de probabilidad para la v.a
continua ?, definida en el conjunto de los nmeros reales, si:

%!

D %

bB

cB

%!

% ~

! ~

Ejemplos
%!

1) Suponga que el error en la temperatura de reaccin, en grados celcius, para un


experimento controlado de laboratorio es una v.a continua @ , que tiene funcin de densidad
~ &
&! ~
c

&

en otro caso

Muestre que cumple las dos primeras condiciones de una funcin de densidad y adems
determine
&

P
!

&

bB

bB

&!

& ~

&!

& b

&!

& b

&!

&
cB

cB

bB

&!

&

c
bB

&

& b
& b
&
cB

cB

bB

&!
&

& ~

cB

bB

&! & ~
b
cB
bB

&!
cB

& ~

Por lo tanto

&

&! cumple con las dos primeras condiciones de una funcin de densidad.

! ~
&

& ~

&
f

H
2) Para la funcin

!! ~

c!

!
en otro caso

Determine:
a) P !
!
!

b) P
!

c) P ! ~

P!

!!

cB

! b
cB

c!

~ c
~

!!

! ! ~

c!

c!

~ c
~
~

P ! ~
!!

c!

! ~

! ~

Ejercicios

1) De una caja que contiene 4 monedas de $ 100 y 2 de $ 50 , se seleccionan tres de ellas al


azar sin reemplazo. Determine la distribucin de probabilidad para el total T de las tres monedas.
2) De una caja que contiene 4 pelotas negras y 2 verdes, se seleccionan 3 de ellas en sucesin
con reemplazo. Encuentre la distribucin de probabilidad para el nmero de pelotas verdes.
3) Una v.a. X continua tiene funcin de densidad
~
% ~

e.o.c.
Encuentre
a) P( %
, )
b) P(%
, )
4) Una v.a. Y continua tiene funcin de densidad
~ b &
& ~

&
e.o.c.
Encuentre
a)P(&
)
b) P(
)

&

Solucin

T ~ total de las tres monedas

A ~ moneda de $

B ~ moneda de $

!
!
!

X ~ nmero de pelotas verdes

M
o
n
e
d
a
s
A
A
A
A
A
B
A
B
A
B
A
A
A
B
B
B
A
B
B
B
A
B
B
B

V ~ pelota verde N ~ pelota negra

%
%
!

Monedas
VVV
VVN
VNV
NVV
VNN
NVN
NNV
NNN

a) P(

, )~

b) P(% , ) ~

a)P(&

b) P(

&

)~

)~

Esperanza o valor
esperado

v.a
El valor esperado se usa como una medida de centro de una distribucin de probabilidad de una
Concepto
Sea ? una v.a con funcin de probabilidad o funcin de densidad
funcin de la v.a ? . El valor esperado de ?, simbolizado por , ?! es:

%!. Sea

?! una
~

%! h

%!

si ? es una v.a discreta


bB

, ?! ~
%

%! h

%!

cB

si ? es una v.a continua


Observaciones
?! ~ ? , entonces se est calculando la esperanza de la v.a ?

1) Si

%h

%!

si ? es una v.a discreta


bB

, ?! ~
%

%h

%!

cB

si ? es una v.a continua

?! ~

2) Si
como

%! ~ ? c !
2

, entonces ,

%! se llama varianza de la v.a ? y se simboliza


~

? c !

%!

si ? es una v.a discreta


bB
2

~ ,

?! ~

? c !

%!

cB

si ? es una v.a continua

~ l=

?! se conoce como desviacin estndar.

mide la dispersin de los valores de la v.a ? con respecto a su media

Propiedades de la esperanza
Sea ? una v.a, entonces
,

! ~

, ?! ~
,

h , ?!

?! f

?! ~ ,

?! f ,

?!

Usando las propiedades de la esperanza es posible determinar una forma ms simple para
calcular
~ =
?!
~ , ? c !
~ , ? c ? b !
~ , ? ! c , ? ! b , !
~ , ? ! c , ?! b
~ , ? ! c , ?!, ?! b ,
~ , ? ! c , ?!
Luego, =
pero ,

?!

?! ~

? ! c ,

?!

?! ~
As,

%! c @

si ? es una v.a discreta

% h

%!A

=
%

?! ~
%
bB

bB

%! c @

cB

% h

cB

%!A

si ? es una v.a continua

Propiedades de varianza
Sea ? una v.a, entonces
=

! ~

?! ~

h =

?!

? b ! ~ =

?!

Ejemplos:
1) Se lanza una moneda tres veces, si las tres veces aparece cara o parece sello un jugador
gana
$5, pero si no es as pierde $3.Cul es la esperanza de este juego?
Sea ? la v.a que denota ganancia o prdida

+~

!
!

c
%!

?! ~

9 c

9 ~

El jugador pierde, en promedio $1 por lanzamiento de las tres monedas.

2) Sea @ la v.a que representa la vida en horas de un cierto dispositivo electrnico. La


funcin de densidad es
~
@ ! ~

&
e.o.c.
Encuentre la vida esperada de este dispositivo.

@ ! ~

bB

bB

@ !

cB

&

~
@

lim

&
bB

@
~ lim c
bB

~ lim
bB

~
La duracin promedio de este dispositivo es de 200 horas.
3) Las ventas por hora de una mquina automtica puede ser 20 , 21 o 22 cajetillas de cigarros

con probabilidad 0,3 ; 0,5 y 0,2 respectivamente . Cul es la venta esperada por hora para esta
mquina? Cul es la varianza de ventas por hora ?
? ~ ventas por hora de cigarrillos
%
%!

, ?! ~
, ?! ~

! b

! b

La venta esperada por hora es de 20,9 cajetillas.


=

?! ~ ,

? ! c ,

, ? ! ~
, ? ! ~

=
=

?! ~
?! ~

?!

! b

! b

La varianza de ventas por hora es de 0,49 cajetillas2 .

4) Sea =

la velocidad del viento, em Km/hr.,y suponga que =

tiene funcin de densidad


~
= ! ~

e.o.c.

> ~

La presin > en libras/pie2 , sobre la superficie del ala de un aeroplano est dada por la
relacin:
= . Determine el valor esperado y la varianza de la presin.
, > !

~ ,

, =

=
=

h
h

=
h

~
=

> ! ~ ,

>

! c ,

> !

, > ! ~ ,

! =

La presin promedio es de 0,1 libra/pie2 .

~
=

=
=

> ! ~
> ! ~

La

! h

varianza es de 0,008 libra/pie2 !

varianza
5) Sea ? una v.a con ~

. Calcule el valor esperado de la v.a @

? c ! y la

?! ~

? c !

h ,

?! c ,

?! ~

=
~
8

h =

? c !
@

?!

~
h

~
6) Suponga que el nmero de autos A , que pasan a travs de una mquina lavadora, entre las
4:00
P.M. y las 5:00 P.M. de un viernes, tiene la siguiente distribucin de probabilidades
'
'!

Sea
A ! ~ A c que representa la cantidad de dinero, en dlares, que el gerente del
negocio le paga al encargado. Encuentre las ganancias esperadas del encargado en este perodo en
particular.

, A ! ~

!8

9 b

!8

, A ! ~

A c

! ~

A ! c

h
c

9 b

!8

9 b

!8

9 b

!8

9 b

!8

La ganancia esperada del encargado es 12,67 dlares estre las 4:00 P.M. y las 5:00 P.M.
7) Sea ? una v.a con funcin de densidad
~ ?
?! ~

e.o.c.
Encuentre el valor esperado de g ?! ~

? b

?! ~
c

?
? h

, ?! ~

? f
c

, ?! ~

? b

! ~

?! b

h
b

~
8) Calcule la varianza de
%
%!

?! ~ ? b donde ? es una v.a con distribucin de probabilidad

, ?! ~

!8

9 b

!8

9 b

!8

9 b

!8

, ?! ~

?! ~ ,

, ? ! ~

? ! c ,

!8 9 b

?!

!8 9 b

!8 9 b

!8 9

, ? ! ~

?! ~

?! ~

? b ! ~

h =

?!

Ejercicios

1) Por invertir en unas acciones en particular, una persona puede obtener ganancias de $
4.000 con una probabilidad de 0,3; o una prdida de $ 1.000 con una probabilidad de 0,7. Cul es la
ganancia que espera esta persona?.
2) Suponga que un distribuidor de joyas antiguas est interesado en comprar un collar de oro
para el cual las probabilidades son 0,22; 0,36; 0,28 y 0,14 respectivamente, de que la poseedora
estara dispuesta a venderla en $ 250.000, en $ 150.000, al costo $100.000! o con una prdida de
$ 150.000.
Cul es la utilidad que ella espera?.
3) Si la utilidad de un distribuidor , en unidades de $ 1.000, en un nuevo automvil puede

considerarse como una v.a. X con funcin de densidad

? ~ H

c ?

e.o.c.
Encuentre la utilidad promedio por automvil.
4) La funcin de densidad de la v.a. Y, el nmero total de horas, en unidades de 100 horas, de
que una familia utilice una aspiradora durante un ao es
~ @
@ ~
c @

&

&

e.o.c.

Encuentre el nmero promedio de horas por ao que la familia utiliza la aspiradora.


5) Si X representa el resultado cuando se lanza un dado balanceado. Encuentre la esperanza y
la varianza de la variable g(X) ~ X b
6) Una v.a. continua Z tiene funcin de densidad
cA

A ~ H
'
e.o.c.

Encuentre el valor esperado y la varianza de (Z) ~

A c

Solucin

Esta persona espera una ganancia de $

Espera una utilidad de $

La utilidad promedio del automvil es $

La familia utiliza la aspiradora , en promedio,

%! ~

A ! ~

horas .

%! ~

A ! ~

Distribuciones discretas de probabilidad

El comportamiento de una v.a queda descrito por su distribucin de probabilidad.

1) Distribucin Bernoulli
El experimento ms sencillo es aquel que puede resultar en uno de dos resultados
posibles. Ejemplo
a) aprobar o reprobar una asignatura
b) obtener cara o sello al lanzar una
moneda c) sexo de un nio al nacer
El experimento con dos resultados posibles se denomina ensayo Bernoulli
Cualquier experimento puede usarse para definir un ensayo Bernoulli, simplemente
denotando algn evento A como xito y su complemento Ac como fracaso.
La distribucin de probabilidad para un ensayo Bernoulli depende slo de un parmetro
,
probabilidad de xito, y entonces c es la probabilidad de fracaso
c

!, donde

Concepto:
Sea +
el espacio muestral de un experimento, sea A +
cualquier evento con
P A! ~ ,

y sea ? la v.a definida por

? %! ~ H
%
A
%

Ac
Entonces ? se llama v.a Bernoulli con parmetro

La distribucin de probabilidad de una v.a Bernoulli es de la siguiente forma


P % ~
P % ~

! ~ P A! ~
! ~ P Ac ! ~

%
%!
la cual se puede resumir de la siguiente forma
%! ~ % h

c%

% ~
y se denota ? Bernoulli

El smbolo
denota distribucin
El proceso Bernoulli debe tener las siguientes propiedades:
a) El experimento consiste en

intentos repetidos.

b) Los resultados de cada uno de los intentos pueden clasificarse como un xito o un
fracaso. c) La probabilidad de xito,

, permanece constante para todos los intentos.

d) Los intentos repetidos son independientes .


e) ,

?! ~

?! ~

2) Distribucin Binomial
Concepto: un experimento que consiste de
ensayos Bernoulli independientes, cada uno
con probabilidad de xito
, se llama experimento binomial con
ensayos y parmetro
.

Ensayos independientes indica que los ensayos son eventos independientes, esto es, lo que
ocurre en un ensayo no influye en el resultado de cualquier otro ensayo.
El espacio muestral para un experimento binomial es el producto cartesiano de los
espacios muestrales de los ensayos Bernoulli consigo mismo
veces
+~ +

Luego P

d + d + d d + donde +

~ xito ,! fracaso F!D

c upla, $ ~ $ $ $ $ ! donde $ ~
~
D
~

Cada elemento de + es una


E! ~
P F! ~
c

EoF

Concepto: Sea ?
el nmero total de xitos en un experimento binomial con
ensayos y
parmetro
.Entonces ? se llama v.a binomial con parmetro
! y su distribucin de probabilidades es:
%

c%
%! ~ 8

9h

% ~
!
%

c % %! ~
,

?! ~

c %!! h %!
h

h
?! ~

% ~
h

Ejemplos
1) Cinco dados son lanzados una vez
a) Cul es la probabilidad de obtener al menos un tres?
b) Cul es la probabilidad de obtener al menos dos tres?
~
? es la v.a que denota el nmero de tres al lanzar cinco dados
? ~

P E! ~ P obtener un nmero tres! ~


P F! ~ P no obtener un nmero tres! ~

.Luego ?

9
%

%! ~ 8

98 9 8 9

c%

% ~

P%

! ~

c P% ~

!
c

P% ~

! ~ 8

98

9 8

~ 8 9

P% ! ~
~

c 8

La probabilidad de obtener al menos un tres es de 0,5981 .


P% ! ~ c P%
! ~ c P% ~
! c P% ~

!
c

P% ~ ! ~ 8

98 9 8 9

P % ! ~

La probabilidad de obtener al menos dos tres es de 0,19 .


2) La probabilidad de que una cierta clase de componente pase con xito una determinada
prueba
de impacto es

. Encuentre la probabilidad de que exactamente dos de los siguientes cuatro


componentes que se prueben pasen la prueba.
~
? ~ pasar con xito la prueba de impacto
? ~

9
%

%! ~ 8

98 9 8 9

c%

% ~

P% ~ ! ~ 8

98 9 8 9

La probabilidad de que exactamente dos de las siguientes piezas cuatro componentes que
se prueben pasen la prueba es de 0,2109 .

3) La probabilidad de que un paciente se recupere de una cierta enfermedad a la sangre es 0,4 .


Si se sabe que 15 personas han contrado esta enfermedad.
a) Cul es la probabilidad de que al menos 10 sobrevivan?
b) Cul es la probabilidad de que sobrevivan entre 3 y 8 personas?
c) Cul es la probabilidad de que sobrevivan 5 personas?
? ~ persona que sobreviva a la enfermedad
? ~

c %
%! ~ 8
%

P%
! b P% ~
~

! ~ P% ~
!

! b P% ~

! b P% ~

! b P% ~

! b P% ~

La probabilidad de que al menos 10 sobrevivan es de 0,0338 .


P %
! ~ P% ~
! b P% ~
! b P% ~
! b P% ~
! b P% ~
~

! b P% ~

La probabilidad de que sobrevivan tres y ocho personas es de 0,8779 .

P % ~

! ~ 8

La probabilidad de que sobrevivan cinco personas es de 0,1859

4) Se sabe que el 30 % de las piezas defectuosas de un proceso de manufactura pueden


quedar bien mediante un trabajo de reprocesado.
a) Cul es la probabilidad de que en un lote de seis piezas defectuosas se puedan reprocesar
por lo menos tres de ellas?
b) Cul es la probabilidad de que ninguna de ellas se puedan reprocesar?
c) Cul es la probabilidad de que todas ellas se puedan reprocesar?
? ~ piezas reprocesadas
? ~

c %
%! ~ 8
%

P % ! ~ P % ~

! b P % ~

! b P % ~

! b P % ~

! ~

La probabilidad de que se puedan reprocesar al menos tres piezas es de 0,2557 .

P % ~

! ~ 8

La probabilidad de que ninguna de las piezas se pueda reprocesar es de 0,1176 .

P % 1! ~

c P % ~

! ~

La probabilidad de que todas las piezas se pueda reprocesar es de 0,8823 .

Ejercicios

1) Al probar una cierta clase de neumtico para camin en un terreno escabroso se encontr
que el 25 % de los camiones terminaban la prueba con los neumticos daados. De los siguientes 6
camiones probados, encuentre la probabilidad de que
a) de 3 a 6 tengan los neumticos daados.
b) Menos de 2 tengan los neumticos
daados. c) ms de cinco tengan los
neumticos daados.
2) La probabilidad de que un paciente se recupere de una delicada operacin de corazn es 0,9
.
Cul es la probabilidad de que exactamente 5 de los prximos 7 pacientes que se sometan a
esta intervencin sobrevivan?.
3) Un ingeniero de control de trfico reporta que el 75 % de los vehculos que pasan por un
punto de verificacin tienen matrculas del estado. Cul es la probabilidad de que ms de 4 de los
siguientes 9 vehculos no sean del estado?.
4) Una investigacin demostr que el 20 % de los habitantes de una ciudad prefieren un
telfono blanco que cualquier otro. Cul es la probabilidad de que ms de la mitad de los siguientes 8
telfonos que se instalen en esta cuidad sean de color blanco?.
5) Se sabe que el 40 % de los ratones inyectados con un suero quedan protegidos contra una
cierta enfermedad. Si 5 ratones son inyectados, encuentre la probabilidad de que
a) Ninguno contraiga la
enfermedad b) menos de 2 la
contraigan.
c) ms de tres la contraigan.

Solucin

% ! ~

P %

! ~

P %

! ~

P % ~

! ~

P %

! ~

P % ! ~

P % ~

! ~

P %

! ~

P %

! ~

3) Distribucin Hipergeomtrica
Tanto la distribucin binomial como la distribucin hipergeomtrica persiguen un
mismo
objetivo: el nmero de xitos en una muestra que contiene
observaciones. Lo que establece una
diferencia entre estas dos distribuciones de probabilidad discreta es la forma en que se obtiene la
informacin. Para el caso de la distribucin binomial la informacin de la muestra se toma con
reposicin de una muestra finita, o sin reposicin de una poblacin infinita. Para el modelo
hipergeomtrico la informacin de la muestra se toma sin reposicin de una poblacin finita. Por lo
tanto, la probabilidad de xito,
,es constante a lo largo de todas las observaciones de un experimento
binomial, en cambio, en una distribucin hipergeomtrica el resultado de una observacin afecta el
resultado de las obseravciones previas.
En general, el inters que se tiene es en la probabilidad de seleccionar % xitos de los
posibles resultados o artculos tambin considerados xitos y c % fracasos de los 5 c
posibles
resultados o artculos tambin considerados fracasos, cuando una muestra aleatoria de tamao
se
selecciona de 5 resultados o artculos totales. Esto se conoce como un experimento hipergeomtrico.
La funcin de probabilidad de una v.a ? con distribucin hipergeomtrica es

5c
8 % 98 c % 9
%! ~

% ~
5
8

? / 5

5
c

5 c

, ?! ~ h
?! ~ h
8

98

5
5 c

Ejemplos
1) Un comit compuesto por cinco personas se selecciona aleatoriamente de un grupo
formado por tres qumicos y cinco fsicos. Encuentre la distribucin de probabilidad para el nmero de
qumicos en el comit.
? ~ v.a que indica el nmero de qumicos
? ~

5 ~
~
? /

8 % 98
9

c %
% ~

8
9

8
9

98

9
8

P% ~

5 c

%! ~

! ~

9
~

98

P% ~ ! ~

8
8

98

8
P% ~
8

! ~
98

9
~

P% ~ ! ~

%
%!

2) Entre 16 postulantes para un trabajo, 10 tenan un grado universitario. Si tres de los


postulantes son elegidos al azar para una entrevista. Cul es la probabilidad de que:
a) ninguno tenga grado universitario?.
b) exactamente uno tenga grado
universitario?. c) dos tengan grado
universitario?.
d) los tres tengan grado universitario?.
? ~ v.a que indica postulante con grado universiatrio
? ~

5 ~
~
? /
8 %

98
9

5 c

c %

%! ~

% ~
8
9

98

9
P% ~

! ~

~
8
9

La probabilidad de que ninguno tenga grado universitario es de 0,0357 .

98
9

P% ~

! ~

~
8
9

La probabilidad de que uno tenga grado universitario es de 0,2679 .

98
9

P% ~

! ~

~
8
9

La probabilidad de que dos tengan grado universitario es de 0,4821 .

98
9

P% ~

! ~

~
8
9

La probabilidad de que los tres tengan grado universitario es de 0,2143 .

3) Lotes de 40 componentes cada uno se consideran acptables si no contienen ms de


tres defectuosos. El procedimiento de muestreo del lote consiste en seleccionar 5 componentes
aleatoriamente y rechazar el lote si se encuentra un componente defectuoso. Cul es la probabilidad de
que exactamente un defectuoso se encuentre en la muestra si hay tres defectuosos en todo el lote?.
? ~ artculos defectuosos
? ~

5 ~
~

5 c

? /

%! ~

8 % 98
8

c % 9
9

98
9

P % ~
~

! ~
8
9

La probabilidad es de 0,3011 .

Ejercicios

1) Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narctico


en una botella que contiene 9 pldoras de vitamina que son similares en apariencia. Si el oficial de la
aduana selecciona 3 tabletas aleatoriamente para analizarlas, cul es la probabilidad de que el
viajero sea arrestado por posesin ilegal de narcticos?.
2) El dueo de una casa planta 6 tallos que selecciona al azar de una caja que contiene 5 tallos
de tulipn y 4 de narciso. Cul es la probabilidad de que plante 2 tallos de narciso y 4 de tulipn?.
3) De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene 3
proyectiles defectuosos que no explotarn, cul es la probabilidad de que
a) los 4 exploten?.
b) al menos 2 no exploten?.
4) Cul es la probabilidad de que una mesera se rehse a servir bebidas alcohlicas nicamente
a
2 menores de edad, si verifica aleatoriamente slo 5 identificaciones de entre 9 estudiantes, de los
cuales 4 no tienen la edad suficiente?.

5) Una compaa manufacturera utiliza un esquema para aceptacin de los artculos producidos
antes de ser embarcados. El plan es de dos etapas. Se preparan cajas de 25 para embarque y se selecciona
una muestra de tres para verificar si tiene algn artculo defectuoso. Si se encuentra uno, la caja entera se
regresa para verificarla al 100 %. Si no se encuentra ningn artculo defectuoso la caja se embarca.
a) Cul es la probabilidad de que se embarque una caja que contiene 3 artculos defectuosos?.
b) Cul es la probabilidad de que una caja que contiene slo un artculo defectuoso regrese
para la verificacin?.

Solucin

P % ! ~

P % ~

! ~

P % ~

! ~

P %

! ~

P % ~

! ~

P % ~

! ~

P % ~

! ~

4) Distribucin Poisson
Los experimentos que resultan en valores numricos de una v.a ? y que representan el nmero

de resultados durante un intervalo de tiempo dado o en una regin especfica frecuentemente se llaman
experimentos Poisson . El intervalo de tiempo dado puede ser de cualquier duracin, por ejemplo, un
minuto, un da, una semana, un mes o inclusive un ao. Por tal motivo un experimento Poisson
puede
generar observaciones para una cierta v.a ? que representen el nmero de llamadas telefnicas por
hora
que se recibe en una oficina, el nmero de das en que una determinada escuela se cierra en invierno
debido a la nieve, o al nmero de juegos pospuestos debido a la lluvia durante una temporada de ftbol.
El nmero % de resultados que ocurren en un experimento Poisson se llama v.a. de Poisson .
El nmero promedio de resultados se calcula de la forma ~ , ?! ~ ! , donde ! es el tiempo o
regin especficos de inters.
La funcin de distribucin es de la forma:
c

!!%

?! ~

?! ~
%!
c

%!
% ~

!%

? 7

Ejemplos
1) El nmero promedio de partculas radioactivas que pasan a travs de un contador durante un
milisegundo en un experimento de laboratorio es 4. Cul es la probabilidad de que entren 6 partculas al
contador en un milisegundo determinado?.
~

? ~ N de partculas que entran en el contador.

? 7

?! ~
% ~

!%
%!

c

!
P % ~ ! ~
~
!

0,1042 .
La probabilidad de que entren 6 partculas al contador en un milisegundo determinado es de

2) Se sabe que 10 es el nmero promedio de camiones tanque de aceite que llegan por da a una
cierta ciudad portuaria. Las instalaciones del puerto pueden atender cuando mucho a 15 camiones
tanque en un da. Cul es la probabilidad de que en un da determinado tengan que regresar los
camiones tanque?.
~

? ~ N de camiones tanque por da.

? 7

!
c

?! ~

!%

P%
!
% ~

! b P% ~

! b P% ~

%!
~ c P%
!
~ c P % ~
~

! b

b P% ~

La probabilidad de que en un da determinado tengan que regresar los camiones tanque es


de
0,00487 .
3) Suponga que los clientes llegan a una fila de espera a una tasa de 4 por minuto. Suponiendo
que el nmero de personas que llegan a la fila en cualquier intervalo de tiempo dado tiene
distribucin
Poisson.Cul es la probabilidad de que al menos una persona llegue a la fila en un intervalo de
minuto?.

clientes
clientes
minuto
minuto

clientes
? ~ N de clientes que llegan en
? 7

P%

c P% ~
c

% ~

!%
%!

?! ~

minuto

!
!


~ c
!

0,8647 .
~

La probabilidad de que al menos una persona llegue a la fila en un intervalo de

minuto es de un

Ejercicios

1) En promedio, en una cierta interseccin ocurren 3 accidentes viales por mes. Cul es la
probabilidad de que en un determinado mes en esta interseccin
a) ocurran exactamente 5
accidentes?. b) ocurran menos de 3
accidentes?.
2) Una cierta rea de la ciudad XX es afectada en promedio por 6 huracanes al ao. Encuentre
la probabilidad de que en un determinado ao esta rea sea afectada por
a) menos de 4 huracanes.
b) cualquier cantidad entre 6 y 8 huracanes.
3) El nmero promedio de ratas de campo por acre en un campo de trigo de 5 acres se estima

que es de 12. Encuentre la probabilidad de que menos de


campo de trigo.

ratas de campo se encuentren en este

4) Un restaurante prepara una ensalada que contiene en promedio 5 verduras diferentes.


Encuentre la probabilidad de que la ensalada contenga ms de 5 verduras en un determinado da.
5) En un estudio de un inventario se determin que, en promedio, la demanda por un artculo en
particular en una bodega era de 5 veces al da. Cul es la probabilidad de que en un determinado da
este artculo sea requerido
a) ms de cinco
veces?. b) ni una
sola vez?.

Solucin

P % ~

! ~

P %

! ~

! ~

P %
P

% ! ~

P %

! ~

P % ! ~

P % ! ~

P % ~

! ~

Distribuciones continuas de probabilidad

1) Distribucin Normal
Es la distribucin continua de probabilidad ms importante en el campo de la estadstica.
Su grfica recibe el nombre de curva normal, su forma es la de una campana

Esta curva permite describir muchos fenmenos que ocurren en la naturaleza, la industria y
la investigacin.

Una v.a continua ? que tiene distribucin en forma de campana se llama v.a. normal.

Concepto: la funcin de densidad de la v.a normal ? , con media

y varianza

, es:

8
? c
c

?! ~

h
h
c B
%
B

? 5

Propiedades de la curva normal


1) El mximo valor de la curva es en % ~
2) La curva es simtrica respecto a la recta % ~
3) La curva es cncava hacia arriba en ] c B
abajo en ] c
b [.

b B y es cncava hacia

4) La curva es asinttica al eje ?.


5) El rea bajo la curva y sobre el eje ? es uno.

Areas bajo la curva normal

P
?!

! ~

Sin embargo, resolver esta integral con la funcin de densidad de la v.a normal no es tan simple.
Por tal motivo, se recurre a un proceso denominado estandarizacin basndose en una v.a normal '
que tiene ~ y
~ y que se denomina distribucin normal estndar
Concepto: Si ' es una v.a normal con
c

A ! ~
l

~ , tiene funcin de densidad:

c B
%
B
A 5

El proceso de estandarizacin se realiza de la siguiente forma:


Si ? 5

!, entonces A ~

? c

Los valores de la v.a normal ' se encuentran tabulados

Ejemplos:

P'
!

P'

!
~

~
~

c P'
!
c

c
'

P c
'

~ P'

c
~
~

! c P'
!

P ' ' ! ~

P ' ' ! ~
c P ' ' ! ~
c
~ P'
'!

~ P ' ' ! ' ~

Sea ? una v.a normal con ~


a) P ? %! ~

, determine

P8'
%c

9 ~

%c

% ~

b) P ? %! ~

c P
%c
'

P8'
%c

9 ~

%c

% ~

Ejercicios

I ) Usando la tabla determine


a) P'

b) P'
c

c) P'

d) P'
c

e) P
'

f) PO ' O

g) P' '

Resp.:0,7967
Resp.:0,1020
Resp.:0,2033
Resp.:0,898
Resp.:0,1791
Resp.:0,5354
Resp.:'

~ 1,55
h) P c

Resp.:'

' ' ~

~ 1,28

II) Dada la v.a. X distribuida normalmente con media 18 y desviacin estndar 2,5. Encuentre
a) P%


b) P% % ~

Resp.:0,1151
Resp.:%

~ 16,1
c) P% %

Resp.:%

~ 20,28
d) P
%

Resp.:0,5403

Problemas de
aplicacin
1) Cierto tipo de batera dura un promedio de tres aos, con una desviacin estndar de 0,5
aos. Suponiendo que las duraciones de las bateras son normalmente distribuidas, encuentre la
probabilidad de que una determinada batera dure menos de 2,3 aos.
? 5

? ~ duracin de la batera
P%

~ P8'

9
~ P'
c
~

La probabilidad de que una determinada batera dure menos de 2,3 aos es de un 808 .
2) Una compaa fabrica focos cuya duracin es normalmente distribuida con una media de
800 horas y una desviacin estndar de 40 horas. Encuentre la probabilidad de que un foco dure entre las
778 y
834 horas de uso.

? 5

? ~ duracin de los focos


P
%
!

~ P8
'
9

~ P c
'

~ P'
! c P'
c
!

La probabilidad de que un foco dure entre las 778 y 834 horas de uso es de un
5111 .
3) Una cierta mquina produce resistencias elctricas que tienen un valor medio de 40 ohms y
una desviacin stndar de 2 ohms. Suponiendo que los valores de las resistencias siguen una
distribucin normal y que pueden medirse con cualquier grado de precisin. Qu porcentaje de las
resistencias tendr un valor que exceda a 43 ohms?
? 5

? ~ valor de las resistencias elctricas


P%
!

~ c P8'
c
9

~ c P'

El

!
c

~
668 de las resistencias tendr un valor que exceda a 43
ohms.

4) En una empresa las edades de los trabajadores se distribuye normalmente con media 50
aos y desviacin estndar es de 5 aos.
a) Qu porcentaje de los trabajadores tiene entre 50 y 52,5 aos?
b) Cul es la probabilidad que un trabajador cualquiera no sea mayor de 45 aos?
c) Cul es la probabilidad que un trabajador tenga entre 41 y 58 aos?
d) El 20 % de los trabajadores estn bajo cierta edad Cul es esa edad?
? 5

? ~ edad de los trabajadores

P
%
!
~ P8
'
9

~ P

'
!
~ P'
! c P'
!

El 19,15 % de los trabajadores tiene entre 50 y 52,5 aos.

P%
!

~ P8'
9

~ P'
c !
~

La probabilidad que un trabajador cualquiera no sea mayor de 45 aos es de 1587 .

!
c

~ P8
9

'

~ P c
'

~
~

~ P'
! c P'
c
!
c

La probabilidad que un trabajador tenga entre 41 y 58 aos es de 9093

P ? %! ~

P8'
%c

9 ~

%c

% ~

El 20 % de los trabajadores tiene una edad menor o igual a 45,75 aos.

Ejercicios

Resuelva los siguientes problemas


1) Las piezas de pan de centeno distribuidas a las tiendas locales por una cierta pastelera
tienen una longitud promedio de 30 cm. y una desviacin estndar de 2 cm. Suponiendo que las
longitudes estn normalmente distribuidas, qu porcentaje de las piezas son
a) de ms de 31,7 cm. de longitud?.
b) entre 29,3 y 33,5 cm. de longitud?.
c) de una longitud menor que 25,5 cm.?.

2) Una mquina despachadora de refrescos est ajustada para servir un promedio de 200
millitros por vaso. Si la cantidad de refresco es normalmente distribuida con una desviacin
estndar de 15 millitros.
a) Qu fraccin de los vasos contendr ms de 224 millitros?.
b) Cul es la probabilidad de un vaso contenga entre 191 y 209 millitros?.
3) El dimetro interno ya terminado de un anillo de pistn est normalmente distribuido con
una media de 10 cm. y una desviacin estndar de 0,03 cm.
a) Qu proporcin de los anillos tendr un dimetro interno que exceda de 10,075 cm.?.
b) Cul es la probabilidad de que un anillo de pistn tenga un dimetro interno entre 9,97 y
10,03
cm.?.

c) Para que valor el dimetro interno de un anillo de pistn ser menor que el

15 %?.

4) La resistencia a la tensin de cierto componente metlico est normalmente distribuida con


una media de 10.000 Kg./cm2 y una desviacin estndar de 100 Kg./cm2 .
a) Cul es la proporcin de estos componentes que exceden de 10.150 Kg./cm2 de resistensia a
la tensin?.
b) Si las especificaciones requieren que todos los componentes tengan una resistencia a la
tensin entre 9.800 y 10.200 Kg./cm2 inclusive, qu porcentaje de piezas se esperara que se
desecharan?.
5) La vida promedio de cierto tipo de motor pequeo es de 10 aos con una desviacin
estndar de 2 aos. El fabricante repone sin cargo todos los motores que fallen dentro del perodo de
garanta. Si est dispuesto a reponer slo 3 % de los motores que fallan, qu tan larga deber ser la
garanta que otorgue?. Suponga que las vidas de los motores siguen una distribucin normal.

6) Suponga que un consultor est investigando cunto tiempo necesitaran los obreros de
la fbrica para montar cierta pieza en una planta de automviles Volvo, y determin que la
informacin( tiempo en segundos ) estaba distribuida normalmente con una media de 75 segundos y una
desviacin estndar de 6 segundos.
a) Cul es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la
pieza en menos de 75 segundos o en ms de 81 segundos?
b) Cul es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la
pieza de 69 a 81 segundos?.
c) Cul es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la
pieza en menos de 62 segundos?.
d) Cul es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la
pieza de 62 a 69 segundos?.
e) Cuntos segundos deben pasar antes de que el 50 % de los obreros monten la
pieza?. f) Cuntos segundos deben pasar antes de que el 10 % de los obreros monten
la pieza?.
7) El espesor de un lote de 10.000 arandelas de bronce de un cierto tipo fabricadas por una gran
compaa tiene una distribucin normal con media 0,0191 pulgadas y desviacin estndar 0,000425
pulgadas. Compruebe que se puede esperar que el 99,04 % de estas arandelas tenga un espesor
entre
0,0180 y 0,0202 pulgadas.
8) El tiempo de reaccin para un cierto experimento psicolgico est distribuido normalmente
con media 20 segundos y desviacin estndar 4 segundos.
a) Cul es la probabilidad de que una persona tenga un tiempo de reaccin entre 14 y 30
segundos?.
b) Cul es la probabilidad de que una persona tenga un tiempo de reaccin entre 25 y 30
segundos?.
c) Qu porcentaje de personas tienen un tiempo de reaccin de ms de 14 segundos?.
d) Cul es el tiempo de reaccin de modo que slo el 1 % de todas las personas reaccionen con
mayor rapidez?.
9) Un procesador de alimentos envasa caf en pequeos tarros, los pesos de los tarros estn
normalmente distribuidos con una desviacin estndar de 0,3 onzas. Si el
5 % de los tarros pesa ms
de
12,492 onzas. Cul es el promedio de los tarros?.

Solucin

1)
a) El 19,77 % de las piezas tiene una longitud de ms de 31,7 cm.
b) El 59,67 % de las piezas tiene una longitud entre 29,3 y 33,5
cm. c) El 1,22 % de las piezas tiene una longitud de menor a 25,5

cm.
2)
a) El 0,0548 de los vasos contendr ms de 224
milmetros. b) El 0,4514 de los vasos tendr entre 191 y
209 milmetros.
3)
a) El 0,0062 de los anillos tendr un dimetro superior a 10,075
cm. b) El 0,6826 de los anillos tendr un dimetro entre 9,97 y
10,03 cm. c) El 15 % de los anillos tendr un dimetro de 9,9688
cm.
4)
a) El 0,0668 de los componentes exceden de 10150 Kg/cm2 de resistencia a la tensin.
b) El 4,56 % de las piezas se desecharn.

5) Debe tener una garanta de a lo ms 6,24 aos.

6)
a) Existe un 0,6587 de probabilidad que un obrero pueda montar una pieza en menos de 75 seg.
o en ms de 81 seg.
b) Existe un 0,6826 de probabilidad que un obrero pueda montar una pieza entre 69 y 81
seg. c) Existe un 0,015 de probabilidad que un obrero pueda montar una pieza en menos de
62 seg. d) Existe un 0,1437 de probabilidad que un obrero pueda montar una pieza entre 62
y 69 seg. e) Deben pasar 75 segundos antes de que el 50 % de los obreros monten la pieza.
f) Deben pasar 67,26 segundos antes de que el 10 % de los obreros monten la pieza.

7) Se cumple que el 99,04 % de las arandelas tiene un espesor entre 0,0180 y 0,0202 pulgadas.

8)
a) El 0,927 de las personas tiene un tiempo de reaccin entre 14 y 30 segundos.
b) El 0,0994 de las personas tiene un tiempo de reaccin entre 25 y 30
segundos. c) El 93,32 % de las personas tiene un tiempo de reaccin de ms de
14 segundos. d) El tiempo de reaccin es de 29,28 segundos.

9) El promedio de los tarros es 12 onzas.

Autoevaluacin 1
1) En una ciudad se publican los peridicos A, B y C. Una encuesta reciente a 800 lectores
indica lo siguiente 208 lee A, 240 lee B, 192 lee C, 64 lee A y B; 40 lee A y C;
32 lee B y C; 24
lee A, B y C. Para un adulto escogido al azar, calcular la probabilidad de que:
a) no lea ninguno de los peridicos.
b) lea exactamente uno de los
peridicos c) lea B y C, pero no A
d) lea slo A o slo C

) Si P A! ~

P B! ~

P A q B! ~

Determine
a) P A r B!
c) P B c A!
b) P B !
d) P Ac /Bc !
e) A y B independientes?. Justifique

negras.
3) Si se sacan al azar y sin reemplazo cuatro pelotas de una bolsa que contiene 6 pelotas rojas y 7

negra?
a) Cul es la probabilidad de que la primera pelota sea negra y tres restantes rojas?.
b) Si las tres primeras pelotas fueron rojas. Cul es la probabilidad de que la cuarta pelota sea
c) Si las dos primeras pelotas fueron rojas. Cul es la probabilidad que la tercera sea negra y la
cuarta roja?
d) Cul es la probabilidad de que las dos primeras pelotas sean rojas y las dos ltimas negras?
e) Cul es la probabilidad de que aparezca una de cada color?
4) Se recibieron dos cajas de camisas para hombre, provenientes de la fbrica. La caja
uno contena 15 camisas deportivas y 25 camisas de vestir. La caja dos contena 10 camisas deportivas y
30 camisas de vestir.
a) Cul es la probabilidad de elegir una camisa deportiva?
b) Cul es la probabilidad de elegir una camisa de vestir?
c) Se seleccion al azar una de las dos cajas y se eligi aleatoriamente una camisa de esa caja
para inspeccionarla. La camisa era de vestir. Dada esta informacin, cul es la probabilidad de que la
caja de la que proviene la camisa deportiva sea la uno?

Solucin

a) La probabilidad de no lea ningn peridico es

b) La probabilidad de que lea exactamente uno de los peridicos es

c) La probabilidad de que lea B y C, pero no A es

d) La probabilidad de que lea slo A o slo C es

P A r B! ~

P B ! ~

P B c A! ~

P A /B ! ~

P A q B! ~
P A! h P B! ~
Por lo tanto, A y B no son independientes.
3)

a) P N

q R

q R q R ! ~

b) P N /R q R q R ! ~

c) P N q N /R q R ! ~

d) P R q R q N q N ! ~
q N

e) P R

~
~

q R

q N ! b P N

q R

h
q N

4)
Sea D ~ camisa deportiva y V ~ camisa de vestir
Sea C

~ caja uno y C

~
q R !

a) P D! ~
caja dos

b) P V! ~

c) P C /V! ~

Autoevaluacin 2

1) Dada la funcin de densidad de la v. a. X


% ~ H

c %

e.o.c.
a) Determine el valor de
b.1) P% ~

. b) Obtener

9
b.3) P8%
c) Calcule E % b

b.2) P

8
%
9

2) De acuerdo con un estudio publicado por un grupo de socilogos de una cierta universidad,
aproximadamente el 60 % de los adictos al Valium en el estado XX, lo tomaron por primera vez debido a
problemas sicolgicos. Encuentre la probabilidad de que de los siguientes 8 adictos entrevistados
a) exactamente 3 hayan comenzado a usarlo debido a problemas sicolgicos.

b) al menos 3 de ellos comenzaron a tomarlo por problemas que no fueron sicolgicos.

3) Un comit de 3 integrantes se forma aleatoriamente seleccionado de entre 5 doctores y 3


enfermeras. Encuentre la distribucin de probabilidades para el nmero de enfermeras y determine P

4) En un estudio de un inventario se determin que, en promedio, la demanda por un artculo en


particular en una bodega era de 5 veces al da. Cul es la probabilidad que en un determinado da este
artculo sea requerido
a) ms de 4
veces?. b) ni una
sola vez?.
5) Se encontr que un grupo de calificaciones de exmenes finales en un curso de estadstica
elemental estaba normalmente distribuida con una media de 80 y una desviacin estndar de 8.
a) Cul es la probabilidad de obtener cuando mucho una calificacin de 81 en este examen
?. b) Qu porcentaje de los estudiantes alcanzaron calificaciones entre 55 y 89 ?.
c) Cul es la probabilidad de obtener a lo menos un 47?
d) Cul es la probabilidad de obtener una nota superior a 51, pero inferior a 85?
c) Cul es la calificacin del examen final si slo el 5 % de los estudiantes que pasaron la
prueba tuvieron calificaciones ms altas?.

Solucin

P % ~
9 ~

P %
8
9

, % b ! ~

P8

! ~

%! ~ 8
% 9

P % ~

! ~

c%

c%

%! ~ 8
% 9

P % ! ~

c P % ~

%! ~

8 % 98

c % 9

%
%!

% ! ~

%! ~
c

h
%!

P % ! ~

P % ~

! ~

~
~

? 5

! b P % ~

! b P % ~

! ~

a) La probabilidad de obtener cuando mucho una calificacin 81 es


b) El

% de los estudiantes obtuvieron calificaciones entre 55 y 89

c) La probabilidad de obtener a lo menos un 47 es 1


d) La probabilidad de obtener una nota superior a 51, pero no inferior a 85 es

e) La calificacin es de un

Unidad N3:Intervalos de
Confianza

Inferencia
Estadstica

La teora de Inferencia Estadstica consiste en aquellos mtodos con los cuales se pueden
realizar inferencias o generalizaciones acerca de una poblacin.

La Inferencia Estadstica puede dividirse en 2 reas:


a) Estimacin de
Parmetros b) Pruebas de
Hiptesis

Estimacin de
parmetros
Los parmetros a estudiar son parmetros poblacionales como la media y la varianza.

Si es un parmetro desconocido, entonces

As, % es un estimador de
insesgamiento.

ser su estimador.

es un estimador de

y ellos cumplen con la propiedad de

Estimacin por
intervalo
Una estimacin por intervalo de un parmetro poblacional
w

es un intervalo de la forma

, donde

y
w

dependen del valor de


para una muestra particular y tambin de la
distribucin muestral de .

Basado en la distribucin muestral de


w

se puede determinar si el intervalo 8

9 con una

probabilidad dada contiene realmente el parmetro que se supone que va a estimar.


w

Esto es P8

El intervalo 8
confianza del
c !

9 ~

donde

9 calculado de una muestra particular se llama intervalo de

% , la fraccin

se denomina coeficiente de confianza, grado de confianza o nivel de


w

confianza y los puntos

se llaman lmites de confianza.

Por ejemplo:
a) Si

, entonces se tiene un intervalo de confianza del

b) Si

, entonces el intervalo de confianza es del

A) Intervalo de confianza para la media


! de una poblacin normal
A1 ) Se conoce su varianza

Si ? 5 4

Obs.:

5, entonces % 5 8

Como % 5 8

9, entonces

%c

A ~

P A
P

A A ! ~

A A

! ~

A A

! ~

c
c

Luego:
A

~ A

por construccin
A

Luego: A
pero

~ c A

~ A

c A

As,

P A

A A ! ~

P
t

cA

%c

A
w
w~

c
c

u
P

% c
A
~
s

cA

c
c

c
v

~
s

u
c%cA

P
c %bA

P % c A

% b A

v
c
~

Si % es la media de una muestra aleatoria de tamao


2
,
el intervalo de confianza de
c !

% para

de una poblacin normal con varianza

es :

u
%cA

%bA

s
l

c
l

Ejemplo: Si una muestra aleatoria de tamao


de una poblacin normal con varianza
tiene una media muestral de . Construya un intervalo de confianza del % de confianza para
c !
%~
~
~
~
% ~

c A

b A
c

l ;

Teorema: Si se usa % como una estimacin de

, se puede tener una confianza del

c !
%
de que el error no exceder de:

A
l

En el ejemplo anterior:
~ A

Se puede tener una confianza del


.

% de que % difiere de

por una cantidad menor que

Teorema: Si se utiliza % como una estimacin de , entonces se puede tener una confianza
del
c !
% de que el error no exceder una cantidad especfica cuando el tamao de la muestra
es:

u u
r r
A
t
t s
c v w
t

w
t
t
w t
w
s

Ejemplo: Qu tan grande se requiere que sea la muestra del ejemplo 1! si se desea una

confianza del

% de que la estimacin de

difiera de sta por menos de

A
c

~ A

~
~ 8

Luego, se puede tener una confianza del


% de que la muestra aleatoria de tamao

proporcionar una estimacin de % que difiere de por una cantidad menor que
.
Observacin: Todo lo anterior tambin es aplicable a poblaciones no normales con
varianza conocida cuando

Ejercicios

1) Las medidas de los dimetros de los rodamientos tiene una desviacin estndar de 0,042 cm.
Se selecciona una muestra aleatoria de 200 bolas de rodamientos producidas por una mquina en una
semana, los dimetros dieron una media de 0,824 cm. Hallar un intervalo de confianza del 95 % y 99 %
para el dimetro de todos los rodamientos.
2) Suponga que la duracin de un componente tiene distribucin normal con

. Se
prueban 20 componentes y se anotan sus tipos de fallas %
%
%

%
.
Suponga adems que la media de la muestra es 100,9 horas. Obtener un intervalo de confianza del 99
% para la duracin media de todos
los componentes.
3) Se administra un test estndar a una numerosa clase de estudiantes. La puntuacin media
de una muestra de 100 estudiantes es de 75 puntos. Supngase que la varianza admitida de las
puntuaciones para este test sea de 2.500 puntos. Hallar
a) Intervalo de confianza del 98 % para .
b) Lmite superior del intervalo de confianza del 95 % para
. c) Lmite inferior del intervalo de confianza del 90 % para
.
4) Al medir el tiempo de reaccin de una persona, un psiclogo estima que la desviacin
estndar es de
segundos. De qu tamao ha de tomarse una muestra de medidas para tener
una confianza del
% y
% de que el error de la estimacin no supera los
segundos?

Solucin

1)

2)

3)
a)

b)

c)

4)

A2 ) Varianza desconocida
Sea %

! con

una muestra aleatoria de ? 5

desconocida.

%c

; ~

tiene
! c !"

con

distribucin
!

c !

grados de libertad
es la desviacin estndar de la muestra!.

normal.
La funcin de densidad de la ! c

!"

! grficamente es similar a la funcin de densidad de la

Su funcin de distribucin acumulada se encuentra tabulada.


El parmetro que caracteriza a la ! c

P !
r
t
Pt
s

! ! ~

c !
l

! se conoce como grados de libertad.

c
u
%c

!"

w
w~

P:% c !

l
l

; ~

% b !

Si % es la media de la muestra aleatoria m.a.! de tamao


varianza

de una poblacin normal con

desconocida, el intervalo de confianza de


c !

% para

es:

:% c ! l % b !

con
l ;

c grados de libertad

Ejemplo: Un fabricante de pintura quiere determinar el tiempo de secado promedio para


una nueva pintura para pared interior. Si para una prueba de
reas de igual tamao obtiene un
tiempo medio de secado de

minutos y una desviacin estndar de

minutos.
Construya un intervalo del
% de
confianza para si el tiempo de secado tiene distribucin normal.
~

Solucin:

% ~

~
~ !

! ~

l ;

Teorema: Si se usa % como una estimacin de


error no exceder de:
c !

, se puede tener una confianza del de que el

%
~ !
l

Para el ejemplo anterior:

~ l

~
Como:

~ !

!
~

~ 8

9
(Tamao de la muestra)

En el ejemplo del fabricante de pintura, determine el tamao de la muestra si el error no


debe exceder de
:

~ 8

Ejercicios

1) Se van a realizar durante un mes pruebas de mercado de un nuevo instrumento, en


determinadas tiendas de una ciudad. Los resultados para una muestra de 16 tiendas sealaron ventas
promedio de $ 12.000 con una desviacin estndar de $ 180. Estime un intervalo de confianza del 99 %
de las ventas promedio reales de este nuevo instrumento. Suponga distribucin normal.
2) Suponga que se hacen 20 mediciones sobre la resistencia de cierto tipo de alambre. La media
de la muestra es 10,48 ohms y la desviacin estndar 1,36 ohms. Obtener un intervalo de confianza de
un 99
% para la resistencia promedio real si ellas se distribuyen normalmente.
3) Una muestra aleatoria de 100 propietarios de automviles indica que, en el estado XX, un
automvil recorre un promedio de 23.500 Km. por ao con una desviacin estndar de 3.900
Km. Determine un intervalo de confianza de 98 % para la cantidad promedio de Km. que un automvil
recorre anualmente en el estado XX. Suponga distribucin normal.
4) Una muestra aleatoria de 8 cigarros de una marca determinada tiene un contenido promedio

de nicotina de 2,6 milgramos y una desviacin estndar de 0,9 milgramos. Determine un


intervalo de confianza de 95 % para el contenido promedio real de nicotina en esta marca de cigarros en
particular, si se sabe que la distribucin de los contenidos de nicotina son normales.

Solucin

1)

2)

3)

4)

B) Intervalo de confianza para la varianza


! de una poblacin normal
Sea %

! con

desconocida.
c !

? ~

tiene

es la varianza de la muestra!.

"

con
c !

grados

de

una muestra aleatoria de ? 5

libertad

distribucin

La grfica de la funcin de densidad de esta distribucin es:

a
0

P6?

? 7 ~

P8?
c !

9 ~

P:

c
; ~

?
?

?
:

c !

c !
c

; ~

Si
es la varianza de una muestra aleatoria de tamao
intervalo
de confianza es del
c !

% para

de una poblacin normal, su

es:

c!

?
:

c!
?
;
c

donde ?

y?

son valores ?

a la derecha.

Ejemplo:

con

grados de libertad, con reas de

, respectivamente,
1) Determine un intervalo de confianza del
paquetes de semilla, si la varianza de la muestra es

% para la varianza de una muestra de

~
~

estudiantes con una media de % ~

2) Se obtiene una m. a. de

y una varianza de

~
en
un examen de Estadstica. Suponga que las calificaciones tienen distribucin normal. Determine
un intervalo de confianza del
% para la varianza poblacional

c
~

~ ?

~ ?

Ejercicios

1) Un fabricante de baterias para automvil asegura que sus baterias duran en promedio, 3
aos con una desviacin estndar de un ao. Si 5 de estas baterias tienen una desviacin estndar de
0,9028 aos. determine un intervalo de confianza de 95 % para la varianza real e indique si es vlida la
afirmacin del fabricante. Suponga que la poblacin de las duraciones de las baterias se distribuye
aproximadamente en forma normal.
2) Suponga que se hacen 20 mediciones sobre la resistencia de cierto tipo de alambre. La media
de la muestra es 10,48 ohms y la desviacin estndar 1,36 ohms. Obtener un intervalo de confianza de
un 95
% para la varianza real si las resistencias se distribuyen normalmente.
3) Una muestra aleatoria de 25 cigarros de una cierta marca tiene un contenido promedio de
nicotina de 1,3 milgramos y una desviacin estndar de 0,17 milgramos. Encuentre un intervalo de
confianza del 90 % y 98 % para la varianza real de esta determinada marca de cigarros si se supone que
las mediciones se distribuyen normalmente.
4) Una muestra aleatoria de 100 propietarios de automviles indica que, en el estado XX, un
automvil recorre un promedio de 23.500 Km. por ao con una desviacin estndar de 3.900
Km. Determine un intervalo de confianza de 99 % para la varianza real de la cantidad de Km. por ao
que recorren los automviles del estado XX.

Solucin

1)

La afirmacin del fabricante es vlida, porque la varianza poblacional


est dentro del intervalo que se determin con una confianza del
%.

2)

3)

4)

!
!

Autoevaluacin

1) Suponga que una tienda de pinturas quisiera estimar la cantidad correcta de pintura que hay
en latas de un galn, compradas a un conocido fabricante. Por las especificaciones del productor se
sabe que
la desviacin estndar de la cantidad de pintura es igual a 0,02 galones. Se selecciona una muestra
aleatoria de 50 galones y la cantidad promedio de pintura es 0,975 galones. Establezca un intervalo de
confianza del
95 % y 99 % de la cantidad promedio real de la poblacin de pintura incluida en una lata de un galn.

2) La vida til promedio de una muestra aleatoria de 10 focos es de 4000 horas con
una desviacin estndar de 200 horas. Se supone que la vida til de los focos tiene una
distribucin normal.Estime un intervalo de confianza del 90 y 95 % para la vida til promedio

3) El departamento de servicios a clientes de una empresa local de servicios pblicos de gas


querra estimar la variacin en el tiempo entre la llegada de la solicitud de servicio y la conexin del
mismo. De los registros disponibles del ao anterior se seleccion una muestra aleatoria de 15 casas
que dieron una desviacin estndar de 20,03. Estime un intervalo de confianza del 92 y 96 % para la
varianza poblacional.

Solucin

1) Usar Tabla Normal


Para 95%

Para 99%

!
:

Usar Tabla t-student


Para 90%

Para 95%

3) Usar Tabla ji cuadrado


Para 95%

Para 99%

Unidad N4: Pruebas de


Hiptesis

Son procedimientos de decisin basado en datos que puedan producir una conclusin acerca
de algn sistema cientfico.
Una hiptesis estadstica es una afirmacin o conjetura acerca de una o ms
poblaciones.
No es posible saber con absoluta certeza la verdad o falsedad de una hiptesis estadstica,
pues para ello habra que trabajar con toda la poblacin. En la prctica se toma una muestra aleatoria de
la poblacin de inters y se utilizan los datos que contiene tal muestra para proporcionar evidencias que
confirmen o no la hiptesis. Si la evidencia de la muestra es inconsistente con la hiptesis planteada,
entonces sta se rechaza y si la evidencia apoya a la hiptesis planteada, entonces se acepta sta.
La aceptacin de una hiptesis implica tan slo que los datos no proporcionan evidencia
suficiente para refutarla. Por otro lado, el rechazo implica que la evidencia de la muestra la refuta.
La estructura de una prueba de hiptesis consiste en la formulacin de una hiptesis nula ,
es decir, cualquier hiptesis que se desee probar, se denota por / . El rechazo de / , genera la aceptacin
de una hiptesis alternativa , que se denota por / .

Una hiptesis nula referente a un parmetro poblacional siempre debe establecerse de manera
que especifique un valor exacto del parmetro, mientras que la hiptesis alternativa admite la posibilidad
de varios valores.
Por ejemplo:

/
/

/
/

/
/

En la hiptesis alternativa se plantea usualmente lo que se cree verdadero y en la hiptesis nula


lo que se desea rechazar.
Para tomar una decisin acerca de un parmetro es necesario una
prueba estadstica
para
cuantificar esta decisin. Esto se logra al establecer primero la distribucin muestral que sigue la muestra
estadstica es decir, la media! y despus calcular la prueba estadstica apropiada. Esta prueba
estadstica mide qu tan cerca de la hiptesis nula se encuentra el valor de la muestra. La prueba
estadstica suele
seguir una distribucin estadstica conocida normal, t-student, ji
cuadrado!

La distribucin apropiada de la prueba estadstica se divide en dos


regiones a) regin de rechazo regin crtica!
b) regin de no rechazo
Si la prueba estadstica cae en la regin de no rechazo no se puede rechazar la hiptesis nula y
si cae en la regin de rechazo, se rechaza la hiptesis nula.
Para decidir con relacin a la hiptesis nula, primero se tiene que determinar el valor crtico
para la distribucin estadstica de inters. El valor crtico separa la regin de no rechazo de la de rechazo.

Errores al realizar una prueba de hiptesis

Al utilizar una muestra para obtener conclusiones sobre una poblacin existe el riesgo de
llegar a una conclusin incorrecta. Pueden ocurrir dos errores diferentes:
1) Error tipo I consiste en rechazar / cuando sta es verdadera.

2) Error tipo II consiste en aceptar /0 cuando sta es falsa.


Al probar cualquier hiptesis estadstica, existen cuatro posibles situaciones que determinan si
la decisin es correcta o equivocada.

se acepta /
se rechaza /

/ es verdadera
decisin correcta
error tipo I

/ es falsa
error tipo II
decisin correcta

La probabilidad de cometer error tipo I, es decir, rechazar / cuando es verdadera, se


denomina
nivel de significacin y se denota por .P error tipo I! ~
La probabilidad de no cometer error tipo I, es decir, aceptar / cuando es verdadera, se
c
denota por c .P error tipo I! ~
c
La probabilidad de cometer error tipo II, es decir, aceptar / cuando es falsa, se representa por
.P error tipo II! ~
La probabilidad de no cometer error tipo II, es decir, rechazar / cuando es falsa, se
denomina
c
potencia de la prueba y se denota por c .P error tipo I! ~
c
El ideal al rechazar una prueba de hiptesis es determinar los procedimientos o reglas
que conduzcan a maximizar la potencia de una prueba, para un fijo. se suele especificar antes de
tomar una
muestra, es frecuente que ~
~

Esquema para realizar una prueba de hiptesis acerca de un parmetro


1) Plantear la hiptesis nula y la hiptesis alternativa.

/
/

/
/

/
/

2) Seleccionar el test estadstico o estadstico de prueba.


3) Fijar

4) Construir la regla de decisin o regin crtica con el valor elegido de

5) Extraer una muestra aleatoria de tamao

y calcular el valor del test estadstico.

6) Si el valor calculado del test estadstico cae en la regin crtica rechazar / , en caso
contrario no rechazar / y concluir que la muestra aleatoria no proporciona evidencia para rechazarla.

Pruebas unilaterales y bilaterales

Una prueba de hiptesis ser unilateral de una cola! en los siguientes casos

Una prueba de hiptesis ser bilateral de dos colas! si


/
/

v
!

Pruebas de
hiptesis

a) Para la media
! si la varianza

!es conocida

debe ser
Recuerde que si ? 5
! entonces ? 5 8

9. Luego la prueba estadsta adecuada


' ~

%c
l

1) Para pruebas de hiptesis unilaterales

/
/

/
/

/
/
/

2) Para pruebas bilaterales

/
/

Ejemplos
1) Considere la hiptesis nula de que el peso promedio de estudiantes hombres de un
cierto instituto es 68 kilos contra la hiptesis alternativa de que es diferente de 68 kilos. Suponga que los
pesos se distribuyen normalmente con una desviacin estndar de 3,6 kilos. Se elige una muestra
aleatoria de 36 estudiantes y se obtiene un peso promedio de 67,5 kilos. Utilice un nivel de significacin
del 5 %.
/
/

Regin crtica ~ 9*
9*
9*

c '

c '

' '

' '

9*
% ~
~

'

' ~

Se acepta / , es decir, no es posible decidir si el peso promedio de los estudiantes de un


cierto instituto es distinto de 68 kilos.

2) Una muestra aleatoria de 100 muertos registrados en Chile durante el ao pasado mostr una
vida promedio de 71,8 aos. Suponiendo una desviacin estndar poblacional de 8,9 aos. Parecera
esto indicar que la vida promedio hoy da es mayor que 70 aos? Utilice un nivel de significacin de
0,05
/
/

9* '
9* '

9* ' ~

% ~

' ~

Se rechaza / , es decir, es verdad que la vida promedio hoy en da supera los 70 aos.

3) Un fabricante de equipo deportivo ha desarrollado un nuevo sedal sinttico para pesca que se
considera tiene una resistencia a la ruptura de 8 kilgramos con una desviacin stndar de 0,5
kilgramos. Prubese la hiptesis de que ~ Kg. en contraposicin a la alternativa de que Kg. si
se prueba una
muestra aleatoria de 50 sedales y se encuentra que tiene una resistencia promedio a la ruptura de 7,8
Kg. Utilice un nivel de significacin de 0,01
/
/

9*
9*

c '

c '

' '

' '

9*
% ~

'

' ~

Se rechaza / , por tanto la resistencia a la ruptura es distinta de 8 Kg

Ejercicios

1) Una empresa elctrica fabrica focos que tienen una duracin que est
distribuida aproximadamente en forma normal con una media de 800 horas y una desviacin
estndar de 40 horas.
Pruebe la hiptesis de que
~

horas en contraposicin de la alternativa de que

horas si
una muestra aleatoria de 30 focos tiene una duracin promedio de 788 horas. Utilice un nivel
de significacin de 0,04.

2) Un fabricante de cigarros afirma que el contenido promedio de nicotina no excede de 3,5


milgramos , con una desviacin stndar de 1,4 milmetros. Para una muestra de 8 cigarros se tiene un
contenido promedio de nicotina de 4,2 milgramos .Est esto de acuerdo con la afirmacin del
fabricante
?. Use nivel de significacin de 0,05.

3) Las tensiones de ruptura de los cables fabricados por una empresa tienen media de 1800 lb
y una desviacin estndar de 100 lb. Se desea comprobar si un nuevo proceso de fabricacin aumenta
dicha tensin media. Para ello se toma una muestra de 50 cables y se encuentra que su tensin media
de ruptura es 1850 lb. Se puede afirmar la mejora del nuevo proceso al nivel de significacin del
1%?

4) Se requiere que la tensin de ruptura promedio de un hilo utilizado en la fabricacin de

material de tapicera sea al menos de 100 psi. La experiencia ha indicado que la desviacin estndar de
la tensin de ruptura es 2 psi. Se prueba una muestra aleatoria de nueve especmenes, y la tensin de
ruptura promedio observada en ella es de 98 psi.
Debe aceptarse la fibra como aceptable con ~ 0,05?

Solucin

1) Se acepta / es decir, los focos tienen una duracin promedio de 800 horas .

2) Se acepta / es decir, es correcta la afirmacin del fabricante .

3) Se rechaza / es decir, el nuevo proceso de fabricacin aumenta la tensin de ruptura.

4) Se rechaza / es decir, la tensin de ruptura promedio es menor que 100 psi.

b) Para la media
! si la varianza
!es desconocida
Recuerde que cuando

es desconocida se usa

!
y por lo tanto la prueba estadstica adecuada es
! ~

%c
l

1) Para pruebas de hiptesis unilaterales

/
/

/
/

/
o

/
/

2) Para pruebas bilaterales

/
/

Ejemplos
1) Una compaa de electricidad ha publicado cifras acerca de la cantidad anual de kilowttshora consumida por varios aparatos para el hogar. Se afirma que la aspiradora consume un promedio de
46 kilowtts-hora al ao. Si una muestra aleatoria de 12 hogares incluidos en un estudio planeado indica
que las aspiradoras consumen un promedio de 42 kilowtts-hora al ao con una desviacin stndar de
11,9 kilowtts- hora. Sugiere esto, con un nivel de significacin de 0,05 , que las aspiradoras consumen,
en promedio, menos de 46 kilowtts-hora al ao?. Suponga que la poblacin de kilowtts-hora es normal.
/
/

9*

% ~
c !

! ~

Se acepta / , es decir, la muestra elegida no da pruebas que el consumo de kilowtts-hora al


ao de la aspiradora sea menor que 46.
2) El gerente de produccin de una empresa cuyo proceso consiste en llenar cajas de cereal
desea saber si efectivamente en cada caja se est depositando, en promedio, los 368 gramos que se
supone es lo que la empresa asegura a sus vendedores. Para ello, se selecciona una muestra aleatoria
de 25 de estas cajas obtenindose una media de 364,1 gramos y una desviacin stndar de 17,3 gramos.
Considere que la distribucin de los pesos de las cajas de cereales es normal y trabaje con un nivel de
significacin de 0,05.
Qu decide el gerente de produccin?.
/
/

% ~

9*

c !

! !

9*

! ~

Se acepta / , es decir, el gerente de produccin puede estar seguro que, en promedio, cada
caja contiene 368 gramos de cereal.

3) Suponga que en el mismo ejemplo anterior, del proceso de llenado de cajas de cereal, que la
empresa es visitada por un representante de la oficina de proteccin al consumidor y que le interesa
averiguar si las cajas, en promedio, estn faltas de peso, es decir, si el peso promedio es inferior a 368
gramos. Considere un nivel de significacin de 0,01.
/
/

% ~
9*

c !

! ~

Se acepta / , es decir, el representante de la oficina de proteccin al consumidor puede


estar seguro que, en promedio, el peso de cada caja de cereal no es inferior a 368 gr.

Ejercicios

1) Una muestra aleatoria de 36 refrescos de una mquina despachadora automtica tiene


un contenido promedio de 21,9 declitros con una desviacin estndar de 1,42 declitros. Pruebe la
hiptesis
de que
~

declitros en contraposicin a la hiptesis alternativa,

declitros, en el nivel de
significacin 0,05.

2) Se afirma que un automvil recorre un promedio anual de ms de 20.000 kilmetros.


Para probar esta afirmacin, se le solicita a una muestra aleatoria de 100 propietarios de automvil que
lleve un registro de los kilmetros que recorren. Estara usted de acuerdo con esta afirmacin si en la
muestra aleatoria resulta un promedio de 23.500 kilmetros y una desviacin estndar de 3.900
kilmetros?. Use un nivel de significacin de 0,01.
3) En un informe de una investigacin de J.M.N. se afirma que los ratones con una vida
promedio de 32 meses llegarn hasta casi 40 cuando 40 % de las caloras en su alimentacin se
reemplacen con vitaminas y protenas. Hay alguna razn para creer que la vida promedio ser inferior a
40 meses si 64 ratones que se han sujetado a esta dieta tienen una vida promedio de 38 meses con una
desviacin estndar de 5,8 meses?. Utilice un nivel de significacin de 0,025.
4) Una empresa elctrica afirma que un compactador de basura se usa un promedio de 125

horas al ao. Si una muestra aleatoria de 49 hogares equipados con compactadores de basura indica un
uso promedio de anual de 126,9 horas con una desviacin estndar de 8,4 horas, sugiere esto con un
nivel de significacin de 0,05 , que estos aparatos se usan en promedio ms de 125 horas?.
5) En el pasado una mquina ha producido arandelas con un grosor promedio de 0,050
pulgadas. Para determinar si la mquina sigue en buenas condiciones de produccin, se toma una
muestra de 10 arandelas, que resulta tener un grosor medio de 0,053 pulgadas y una desviacin
estndar de 0,003 pulgadas. Ensayar la hiptesis de que la mquina est en buenas condiciones de
produccin al nivel de significacin del
a)
0,05
b)
0,01
6) La duracin media de una muestra de 100 tubos fluorescentes producidos por una
compaa resulta ser 1570 horas, con una desviacin estndar de 120 horas. Si es la duracin media
de todos los tubos producidos por la compaa, comprobar la hiptesis ~
horas contra la
hiptesis alternativa

horas con un nivel de significacin


de a) 0,05
b) 0,01

Solucin

1) Se acepta / , es decir,

declitros.

2) Se rechaza / , es decir, un automvil recorre un promedio anual superior a 20000 Km.

3) Se rechaza / , es decir, la vida promedio es inferior a 40 meses.

ao.
4) Se acepta / , es decir, un compactador de basura se usa en promedio menos de 125 horas al

5)

a) Se rechaza / , es decir, la mquina no est en buenas condiciones de produccin.


b) Se acepta / , es decir, la mquina est en buenas condiciones de produccin.

6)

a) Se rechaza / , es decir,
b) Se acepta / , es decir,

horas .
horas .

c) Pruebas de hiptesis relacionadas con varianzas


Se utilizan para probar uniformidad de una poblacin. Para ello se usa como prueba estadstica
la distribucin ji cuadrada
c !

1) Para pruebas de hiptesis unilaterales

/
/

/
/

/
/
/

2) Para pruebas bilaterales


/
/

Ejemplos
1) Un fabricante de bateras para automvil asegura que la duracin de sus bateras
tiene distribucin aproximadamente normal con una desviacin stndar de 0,9 aos. Si una muestra
aleatoria de
10 baterias tiene una desviacin stndar de 1,2 aos Piensa usted que
0,9 aos? Utilice un nivel de
significacin de 0,05
/
/

9*

~
~

No es posible rechazar /

2) Se sabe que el contenido de nicotina de una marca de cigarros tiene


distribucin aproximadamente normal con una varianza de 1,3 milmetros. Pruebe la hiptesis de
que
~
en
contraposicin a la alternativa de que

si una muestra aleatoria de 8 de estos cigarros tiene una
desviacin stndar de 1,8 milmetros. Use un nivel de significacin de 0,05.
/
/

9*

Se rechaza / , es decir,

3) Experiencias pasadas indican que el tiempo para que alumnos del ltimo ao realicen
un examen estandarizado es una v.a normal con una desviacin stndar de 6 minutos. Pruebe la
hiptesis de que ~ en contraposicin a la alternativa de que
si una muestra aleatoria de 20
studiantes tiene
una desviacin stndar de 4,51 minutos al realizar este examen. Utilice un nivel de significacin de 0,01
/
/

9*

h
~

Con la informacin de la muestra, no es posible rechazar /

Ejercicios

1) Se sabe que la capacidad de los recipientes de un determinado lubricante tiene


distribucin
normal con una varianza de 0,03 litros2 . Pruebe la hiptesis de que
~
en contraposicin a la
alternativa de que
2

0,03 para la muestra aleatoria de 10 recipientes que tiene una desviacin estndar
de 0,25. Use nivel de significacin de 0,01.
2) Se sabe que el contenido de nicotina de una marca de cigarros tiene una
distribucin aproximadamente normal con una varianza de 1,3 milgramos. Pruebe la hiptesis de
que
~
en
contraposicin a la alternativa de que 2

si una muestra aleatoria de 8 de estos cigarros tiene una


desviacin estndar de 1,8. Use nivel de significacin de 0,05.
3) En el pasado la desviacin estndar de los pesos de ciertos paquetes de 40 onzas, llenados
por una mquina era de 0,25 onzas. Una muestra aleatoria de 20 paquetes dio una desviacin estndar de
0,32 onzas. Es el aparente incremento de variabilidad significativa al nivel de significacin del
a)
0,05
b)
0,01

4) Se formula la hiptesis de que la desviacin estndar del ingreso domstico anual de cierta
comunidad es de 3.000 dlares. En una muestra de 15 hogares aleatoriamente seleccionados, la
desviacin estndar es 2.000 dlares. Se supone que las cifras de ingreso domstico de la poblacin
siguen una distribucin normal. Con base en este resultado muestral, puede rechazarse la hiptesis
nula con un nivel de significacin del
a) 0,05 ?
b) 0,01 ?

Solucin

1) Se acepta / , es decir,

2) Se rechaza / , es decir,

3)

a) Se rechaza / , es decir, existe un aumento de variabilidad


b) Se acepta / , es decir, no existe un aumento de variabilidad

4)

a) Se acepta / , es decir,

dlares

b) Se acepta / , es decir,

dlares

Autoevaluacin

1) Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por
un combustible slido. Una de las caractersticas importantes de este producto es la rapidez de
combustin. Las especificaciones requieren que la rapidez promedio de combustin sea 50 cm/seg. Se
sabe que la desviacin estndar de esta rapidez es 2 cm/seg. El experimentador decide especificar un
nivel de significacin de 0,05. Selecciona una muestra aleatoria de 25 y obtiene una rapidez promedio
de combustin de 51,3 cm/seg. A qu conclusiones debe llegar?

2) Se inserta un remache en un agujero. Si la desviacin estndar del dimetro del agujero es


mayor que 0,01 mm, entonces existe una probabilidad inaceptablemente grande de que el remache no
entre en el agujero. Se toma una muestra aleatoria de 15 piezas, y se mide el dimetro del agujero, la
desviacin estndar es de 0.008 mm. Existe evidencia fuerte que indique que la desviacin estndar del
dimetro del agujero es mayor que 0,01 mm? Utilice un nivel de significacin de 0,01

3) La brillantez de un cinescopio de televisin puede evaluarse midiendo la corriente necesaria


para alcanzar un nivel de brillantez particular. Un ingeniero ha diseado un cinescopio para el que cree
que requiere , en promedio, 300 microamperes de corriente para producir el nivel deseado de brillantez.
Se
toma una muestra de 10 cinescopios y se obtiene una media de 317,2 microamperes con una
desviacin estndar de 15,7 microamperes. Utilice un nivel de significacin de 0,05

4) El contenido de azcar del almibar de los duraznos enlatados tiene una distribucin
normal, donde se cree que la varianza es 18 mg . Pruebe la hiptesis
~
contra la alternativa

si al tomar una muestra de 10 latas la desviacin estndar es 4,8 mg. Use un nivel de
significacin de 0,01

5) Un ingeniero civil hace pruebas con la resistencia a la compresin del concreto. Para ello
examina 12 especmenes obteniendo una media de 2260 psi y una desviacin estndar de 36 psi.Pruebe
la hiptesis ~
psi contra la alternativa
psi . Use un nivel de significacin de 0,05

Solucin

/
/

Rechazar / , es decir, la rapidez promedio es superior a 50 cm/seg.

/
/

!
!

Aceptar / , es decir, no existe evidencia fuerte que indique que la desviacin estndar
del dimetro del agujero es menor que 0,01 mm

3)

/
/

Rechazar / , es decir, el cinescopio requiere sobre 300 microamperes de corriente para


producir el nivel deseado de brillantez.

4)

/
/

Aceptar / , es decir, la varianza es de 18 mg

5)

/
/

Aceptar / , es decir, la resistencia promedio a la compresin del concreto es de 2250 psi.

Unidad N5 : Regresin Lineal


El anlisis de Regresin se utiliza para fines de prediccin.
A menudo existen relaciones entre 2 ms variables, por ejemplo, entre el peso y la estatura
de una persona, las horas de estudio y la calificacin obtenida, etc. Suele ser deseable expresar tales
relaciones en forma matemtica determinando una ecuacin que conecte a las variables.

Para hallar una ecuacin que relacione las variables, el primer paso es recoger datos que
muestran valores correspondientes de las variables bajo consideracin.
As por ejemplo, la siguiente tabla muestra las alturas y peso de una muestra de 10 personas:
Altura %
Peso &

El prximo paso es marcar los puntos % & en un sistema de coordenadas


rectangulares, el conjunto de puntos resultantes se denomina Diagrama de dispersin

Diag r a ma d e Dis p e r si n

Pe so
70

65

60

55

50

45
1,45

1,5

1 ,55

1 ,6

1,65

1,7

1 ,75
Altur a

A partir del Diagrama de Dispersin es posible (a veces), visualizar una curva que aproxima
los datos. Tal curva se denomina Curva Apoximante.

Los siguientes diagramas de dispersin:

R e l a ci n Li n e a l

Re lacin No Line al

muestran una relacin lineal en el primer caso y una relacin no lineal en el segundo.
El problema general de hallar ecuaciones de curvas aproximantes que se ajusten a un conjunto
de datos se denomina Ajuste de curvas
Uno de los propsitos principales de la curva de ajuste es estimar una de las variables (la
variable dependiente) conocida otra (la variable independiente). El proceso de estimacin se
conoce como Regresin.

lista:
Los tipos ms comunes de curvas aproximantes y sus ecuaciones se representan en la siguiente
Lnea Recta
Parbola & ~

Curva Cbica

& ~
b

& ~

Todas las letras excepto %

% b

%b

% b

e &

representan constantes. La variable % es la variable independiente


y la variable & es la variable dependiente. Aunque esto se puede cambiar, es decir, en algunos
casos la variable % ser la dependiente y la variable & la independiente.
Para decidir que curva usar es til observar el diagrama de dispersin. Con el diagrama de
dispersin se puede tener una idea aproximada de la relacin entre las variables. La relacin ms sencilla
es la lineal.
A menudo se recurre a la intuicin personal para dibujar una curva que se ajuste a un conjunto
de datos. Este mtodo tiene la desventaja de que diferentes observadores obtendrn distintas curvas y
ecuaciones.
Para evitar juicios subjetivos al construir rectas, parbolas u otras curvas aproximantes de
ajuste de datos se utiliza el Mtodo de Mnimos Cuadrados.
Dado el siguiente Diagrama de Dispersin:

Una medida de la bondad del ajuste de la curva a los datos dados est proporcionada por
la cantidad:

b + b + b b +

Si esta cantidad es pequea, el ajuste es bueno. Si la cantidad es grande, el ajuste es malo.

Definicin:
la

De todas las curvas que aproximan un conjunto de datos, la que tiene

propiedad de que
+

b + b + b b +

es mnimo se llama una Curva de Ajuste Optimo.


Estas diferencias +
~

con

pueden ser positivas, negativas o iguales a cero.

Una curva que cumpla con la condicin de que


+

b + b + b b +

sea mnimo se
denomina Curva de Mnimos Cuadrados. Esta curva puede ser: una recta, una parbola, una
parbola cbica, etc.

La Recta de los Mnimos Cuadrados


El anlisis de regresin lineal simple tiene por objeto encontrar la lnea recta que mejor se
ajuste a los datos, esto significa que se desea encontrar la lnea recta para la cual las diferencias entre
los valores
w

reales de &

y los valores estimados & sean lo ms pequeas posible.


La recta de mnimos cuadrados que aproxima el conjunto de puntos: % &
% &
% & % &
tiene por ecuacin la recta
&~

, donde las constantes


se
y
determinan al resolver el siguiente sistema de ecuaciones:
& ~

%& ~

% b

que se denominan las Ecuaciones Normales para la recta de mnimos cuadrados.

Otra forma de determinar estas constantes


que se deducen de las Ecuaciones Normales:

, es a travs de las siguientes frmulas

~
%& c

~ & c

c 8

donde:
%

e &

corresponden al promedio de los datos dados para % e & , respectivamente.


Lo anterior se utiliza cuando % es la variable independiente e & es la variable dependiente.

Si se toma % como la variable dependiente, la recta toma la forma % ~


ecuaciones normales seran:

% ~

%& ~

& b

&

&

& , y las

&

%9

~
%& c

&

~ % c

&

c 8

&9

&

La recta de mnimos cuadrados resultante no es, generalmente, la misma que la obtenida


antes. Ejemplo:
1) Determine la recta de mnimos cuadrados considerando:
a) % como la variable independiente
b) % como la variable dependiente
para la siguiente tabla:
%
&

10
9
8
7
6
5
4
3
2
1
0

D i a g r a m a d e D i sp e r si n

10

12

14

16
X

a) % como la variable independiente & ~

Para determinar las constantes usamos las ecuaciones normales:


& ~

%& ~

% b

%
%

De la tabla se tiene que:


% ~
& ~

%
%& ~

Luego, las ecuaciones normales que se deben resolver son:

c
b

c
~

c
b

Reemplazando

en:

se tiene:

b
, e

Luego, la recta de mnimos cuadrados es:

&~

La ecuacin determinada se puede graficar sobre el diagrama de dispersin de los datos.

b) % como la variable dependiente % ~

&

Para determinar las constantes usamos las ecuaciones normales:


% ~

%& ~

& b

De la tabla se tiene que:

&
&

% ~
& ~
&
%& ~

Las ecuaciones normales son:

c
b

~
~

Reemplazando

en:

se tiene:

b
, e

~ c

~c

Luego, la recta de mnimos cuadrados es:

%~ c b &

La ecuacin determinada se puede graficar sobre el diagrama de dispersin de los datos.


Las rectas de mnimos cuadrados que hemos determinado nos sirven para estimar, basados
en datos de una muestra, el valor de una variable & correspondiente a un valor dado de la variable %. La
curva resultante se denomina Curva de Regresin de & sobre %, ya que & se estima a partir de %.
En el ejemplo anterior, la ecuacin de la curva de regresin de & sobre % es:

&~

Podemos estimar el valor & para % ~


& ~

& ~

!
& ~

Para % ~

de la siguiente forma:

& ~

& ~
w

& ~

La ecuacin

% ~

&

permite estimar el valor de % a partir de un valor de &. Esta


ecuacin se denomina Ecuacin de Regresin de % sobre &

Los valores estimados a travs de las ecuaciones encontradas no necesariamente


corresponden a los valores dados en la tabla.
Las ecuaciones de las rectas de regresin
& ~
y % ~

b
b

%
&

se intersectan en un
punto llamado Centroide que se denota por % &, donde:

% ~

&

& ~

Para el ejemplo anterior, se tiene que el centroide es:

% ~

Centroide ~ % & ~

& ~

El mtodo de regresin responde a tres tipos de objetivos:


1) Estudiar si ambas variables estn relacionadas
2) Determinar que tipo de relacin, si existe, las une
3) Predecir los valores de una variable a partir de valores conocidos de la otra.
Conocer el grado de relacin existente entre ambas variables, permitir saber si la
prediccin realizada con el modelo matemtico establecido, es buena o mala.

Para medir el grado de relacin existente entre la variable independiente y la variable


dependiente, lo que ms se utiliza es el Coeficiente de Correlacin Lineal (
de Pearson ), cuyo
mtodo abreviado de clculo est dado por la siguiente frmula:

%& c 6 %76 &7


~
o > % c 6 %7 ?> & c 6 &7 ?

El valor de
se encuentra en el intervalo " c

Si

~ , entonces no existe correlacin entre las variables

Si

~ c , entonces la correlacin es perfecta y negativa

Si

~ , entonces la correlacin es perfecta y positiva

Si

= c

<

entonces la correlacin es mala


Si

= c

<

entonces la correlacin es buena

azar:
Ejemplo: La siguiente tabla representa las notas en Algebra y Fsica de
Algebra%
Fsica&

a)

Diagrama de Dispersin
D i a g r a m a d e D i sp e r si n

Fs ic a
10 0

90
80

estudiantes elegidos al

70
60
50
40
30
20
10
0
0

10

20

30

40

50

60

70

80

90

100

A lg e b r a

De los datos dados se tiene que:

% ~

& ~
~

%& ~

&

Determine la recta de regresin de & sobre %

b)

& ~

Para determinar las constantes


y

, tenemos:
& ~

%& ~

% b

%
%

Luego, el sistema de ecuaciones que debemos resolver es el siguiente:

~
~

~
~ c

, c

b
c

Luego, reemplazando

en:

se tiene que:

Por lo tanto, la ecuacin de la recta de regresin de & sobre % es:


& ~

Determine el centroide % &

c)

% ~

& ~

Luego, el centroide es % & ~

d)

Halle el coeficiente de correlacin lineal

l"

c
c

#"
#

Por lo tanto, la correlacin entre las variables es buena.

Estimar el valor de &

e)

para % ~

y % ~
% ~
& ~

&
El valor estimado para % ~

es

% ~
& ~

&
El valor estimado para % ~

f)

Si un estudiante tiene

La nota esperada en Fsica es:

es

puntos en Algebra. Cul es su nota esperada en Fsica?


w

& ~

& ~
w

&
puntos

Ejercicios

1) Determine para los datos del ejemplo anterior la ecuacin de regresin de % sobre &

2) Dados los siguientes datos en forma de pares % &:


, ,
,

a) Dibujar el diagrama de dispersin


b) Hallar la ecuacin de la recta de regresin de & sobre %
c) Estimar los valores de & para % ~ % ~ % ~
3) En la siguiente tabla se presentan datos que relacionan el nmero de semanas de
experiencia
(%) de un trabajador y el nmero de artculos defectuosos (&) elaborado por cada uno de ellos:
%

&

a) Trace el diagrama de dispersin


b) Determine la ecuacin de la recta de regresin de & sobre %
c) Grafique la recta de regresin de & sobre %
d) Estime el nmero de artculos defectuosos para empleados que tienen:
- Tres semanas de experiencia laboral
- Doce semanas de experiencia laboral
e) Calcule el coeficiente de correlacin lineal e
interprete f) Determine el centroide de los datos dados
4) El gerente de personal de una empresa intuye que quizs exista relacin entre el ausentismo
laboral y la edad de los trabajadores. Desea tomar la edad de los trabajadores para desarrollar un modelo
de prediccin de das de ausencia durante un ao laboral. Se seleccion una muestra aleatoria
de
trabajadores y se obtuvo los siguientes datos:
Trabajador

Edad% Das Ausentes&

de edad
a) Diagrama de Dispersin
b) Determine la recta de regresin de & sobre %
c) Calcule el coeficiente de correlacin lineal e interprete
d) Estime los das de ausentismo laboral para trabajadores que tienen

aos,

aos y

aos

Solucin

% ~ c

1)

&

2) a)

10
9
8
7
6
5
4
3
2
1
0

Diagrama de Dispe rsin

10

11
X

b)

& ~

c)

& ~

b
w

%
w

& ~

& ~

(Respectivamente)

3) a)
Dia g ra m a d e Disp e rsi n
40
35
30
25
20
15
10
5
0
0

10

12

14

16
X

b)

& ~

c)

Grfico de la recta de regresin: & ~

Ex pe r ie nc ia & Ar t. De fe c tuos os

4
0
3
5
3
0
2
5
2
0
1
5
1
0
5
0
1

11

13

15

17

19
X

&
d)

% ~

~
w

% ~
e)

& ~
c

El coeficiente de correlacin lineal


~ c
nos indica que la correlacin lineal entre las
variables es buena y negativa, es decir, a mayor experiencia laboral menos artculos defectuosos elabora
un trabajador.
f)

4) a)

Centroide % & ~

D i a g ra m a d e D i sp e rsi n
20

18

A u s e n t is m o
16

14

12

10

2
0
0

10

20

30

40

50

60

70
Ed a d

b)

& ~

c)

La correlacin entre la edad y el ausentismo laboral es muy buena y


negativa, es decir, a mayor edad menos das de ausencia laboral.
d)

% ~

aos & ~

% ~

aos & ~

% ~

das

das

aos & ~
das

Anlisis de
Residuos

dados.
El anlisis de residuos sirve para verificar si el modelo lineal es el que mejor se ajusta a los datos

decir,
Se define un residuo (

como la diferencia entre el valor observado &

y el valor estimado , es

&
~ & c &Z
donde
&

~ valor observado
& Z ~ valor estimado
El anlisis de residuos nos permite llegar a conclusiones tales como:
a) La funcin de regresin es lineal
b) La funcin de regresin no es lineal
c) El modelo de regresin lineal se ajusta a todas excepto una o varias observaciones
atpicas. Estas observaciones atpicas pueden no considerarse si el nmero de datos es grande (mayor que
).
La forma ms comn de enfrentar el problema del anlisis de residuos, es mediante un
estudio grfico de ellos. Para graficar los residuos se considera el siguiente grfico:

G r fi c o d e R e si d u o s
1,0

Re si duos
0,8
0,6
0,4
0,2

0,0
-0 ,2
-0 ,4
-0 ,6
-0 ,8
-1 ,0

Las siguientes figuras, muestran diferentes situaciones que se presentan con cierta frecuencia:
a)
G r fi c o d e R e si d u o s
1 ,0
0 ,8

R e si d u o s
0 ,6
0 ,4
0 ,2
0 ,0
-0 ,2
-0 ,4
-0 ,6
-0 ,8
-1 ,0

La figura anterior muestra un caso tpico de residuos cuando el modelo lineal es adecuado.
Todos los residuos tienden a caer en una banda horizontal centrada alrededor del cero.

b)

G r fi c o d e R e si d u o s

R e si d u o s
0

-5

-1 0

-1 5

-2 0

-2 5

-3 0

La figura anterior indica una desviacin clara de la linealidad, sugiriendo la necesidad de


ajustar una funcin de regresin no lineal.

c)
G r fi co de Re si duo s
2,0

Re siduos
1,5
1,0
0,5
0,0
-0,5
-1,0
-1,5

-2,0

La figura anterior presenta una observacin atpica, es decir, se escapa del modelo lineal
que tienen los otros datos. La influencia de estos puntos atpicos, ser mayor si el nmero de datos es
pequeo (menor o igual a
).
Ejemplo: Dada la siguiente tabla y la recta de regresin de & sobre %:
%
&

& ~

b
%

Determine:
a) Los valores estimados de &
b) Los residuos para cada caso
c) Represente grficamente los
residuos d) Qu puede concluir de
este grfico?

Solucin:
a) Los valores estimados de recta dada:
& ~

& , que aparecen en la tabla, se determinan reemplazando


%

en la
Por ejemplo, para % ~

se tiene que & ~

&Z ~

El mismo procedimiento se debe realizar para los dems valores de %

b) Los residuos

, que aparecen en la tabla, se determinan de la siguiente forma:


Para

& ~

se tiene:
~ & c &
~

El mismo procedimiento se debe realizar para los dems valores de &


%
&
&Z

c)

A n l i si s d e R e si d u o s
Re s id uos
3,0

2,0

1,0

0,0

-1,0

60

62

64

66

68

70

72

-2,0

-3,0
x

d) Los residuos nos indican que la recta de regresin dada en algunos casos no es la
mejor estimadora para &. Existen 5 puntos que se escapan del intervalo " c
#

Ejercicio

1) Dada la siguiente informacin, qu puede concluir a travs del anlisis de residuos?


%
&
&Z

Solucin:
1)
%
&
&Z

Re s id u o s
1,2
1
0,8
0,6
0,4
0,2
0

A n l i si s d e R e si d u o s
-0 ,2 0
-0 ,4

10

12

14

-0 ,6
-0 ,8
1

Los residuos son muy grandes para los datos dados. Por lo tanto, no existe una relacin
lineal entre los datos dados.

Autoevaluacin

1) Dada la siguiente tabla:


%
&
Determine:
a) Diagrama de Dispersin
b) La ecuacin de la recta de regresin de & sobre %. Grafquela
c) El coeficiente de correlacin lineal. Interprete.
d) Estime los valores de &, para % ~

% ~

2) Dada la siguiente tabla:


Hrs. Estudio %
Nota Examen &

a) Elabore el Diagrama de Dispersin


b) Determine el Coeficiente de Correlacin Lineal.
Concluya. c) Determine la recta de regresin de & sobre %.

Grafique.
d) Estime la nota de Examen para un alumno que estudi

horas

Solucin
1) a)
y

D iag ra m a d e D isp ersi n

9
8
7
6
5
4
3
2
1
0
0

10

11

12
x

b)

& ~ c

c)

La correlacin entre las variables es buena.


d)

% ~

& ~

% ~

& ~

No ta Exa me n

2) a)

10 0

D iag ra m a d e D is p ersi n
90
80
70
60
50

10

15

20

25

30

35

40

Ho r a s d e Es tu d io

b)

La correlacin entre las variables es buena.


c)
& ~
b
d)
% ~

%
& ~