Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NDICE
Presentacin 5
Red de contenidos 6
Presentacin
En la primera parte del curso, se exponen las herramientas metodolgicas para recopilar,
organizar, presentar y analizar datos con la finalidad de describirlos o de realizar
generalizaciones. La segunda comprende la aplicacin de la teora de probabilidades y de
los modelos de distribucin probabilstica. Finalmente, en la tercera etapa, se desarrollan
modelos predictivos de regresin lineal simple que permiten contar con una herramienta,
estadsticamente confiable, para la toma de decisiones.
En las sesiones de teora, el curso se desarrolla en forma terico prctica; por lo que las
sesiones de clase tendrn exposiciones dialogadas sobre los fundamentos de los temas
que se tratarn y la resolucin de ejercicios, dndole mayor nfasis a esta ltima parte y al
anlisis e interpretacin de resultados.
Red de Contenidos
1. RECOPILAR 2. ORGANIZAR
3. PRESENTAR 4. ANALIZAR
UNIDAD DE
APRENDIZAJE
1
ESTADSTICA DESCRIPTIVA
TEMARIO
La Estadstica
Poblacin y muestra
Medidas de posicin
Medidas de dispersin
ACTIVIDADES PROPUESTAS
1. LA ESTADSTICA
Estadstica Descriptiva
Estadstica Inferencial
2. POBLACIN Y MUESTRA
3. VARIABLES
Son aquellas variables que indican alguna cualidad, atributo o categora del
elemento estudiado. Se caracterizan porque por s mismos no proporcionan
valores numricos.
Las variables cualitativas se denominan ORDINALES cuando los datos
proporcionados por la variable son susceptibles de ser ordenados a travs de
una jerarqua.
Las variables cualitativas se denominan NOMINALES cuando no es posible
ordenar los datos bajo una determinada regla.
Cuando los datos son recolectados, estos se deben ordenar y clasificar. Para realizar
esta tarea, los datos se pueden clasificar utilizando cuadros estadsticos y grficos
estadsticos.
EJEMPLO:
A continuacin, se muestra el nmero de hijos de 36 familias de Lima:
2 3 4 5 1 2 3 2 1
0 2 1 5 3 1 2 3 2
2 4 3 5 2 0 2 1 3
1 1 4 2 3 4 5 1 0
SOLUCIN:
La variable de estudio (X) es el nmero de hijos de 36 familiares. Luego,
construyendo la Tabla de Distribucin de Frecuencias, se tiene lo siguiente:
X fi Fi hi Hi
0 3 3 0,0833 0,0833
1 8 11 0,2222 0,3055
2 10 21 0,2778 0,5833
3 7 28 0,1944 0,7777
4 4 32 0,1111 0,8888
5 4 36 0,1111 0,9999
36 1
EJEMPLO:
Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un
examen:
33 50 61 69 80 35 52 64 71 81
35 53 65 73 84 39 54 65 73 85
41 55 65 74 85 41 55 66 74 88
42 57 66 76 89 45 59 66 77 91
47 48 60 68 78 97 60 67 77 94
SOLUCIN:
Intervalos mi fi Fi hi Hi
[ 33 42,143 > 37,5715 7 7 0,14 0,14
[ 42,143 51,286 > 46,7145 4 11 0,08 0,22
[ 51,286 60,429 > 55,8575 9 20 0,18 0,40
[ 60,429 69,572 > 65,0005 11 31 0,22 0,62
[ 69,572 78,715 > 74,1435 9 40 0,18 0,80
[ 78,715 87,858 > 83,2865 5 45 0,10 0,90
[ 87,858 97 ] 92,4295 5 50 0,10 1
Total 50 XXX 1 XXX
Actividades
1. Una empresa dedicada a la fabricacin de conservas de pescado tiene planeado
introducir al mercado conservas de trucha. Para ello, le encarg a una empresa
investigadora de mercado la realizacin de un estudio mediante el que le interesaba
averiguar, entre otras cosas, la aceptacin del nuevo producto y el precio que las
personas estaran dispuestas a pagar. La encuesta fue realizada en Lima y se
entrevistaron a 250 personas. De los encuestados, el 67% estaran dispuestos a
consumir el nuevo producto. Adems, se concluy que el precio del producto debera
oscilar entre S/. 1,50 y S/. 2,5. Determine lo siguiente:
1.1. La poblacin y la muestra del estudio
1.2. Las variables y sus respectivos tipos
1.3. El o los tipos de estimaciones utilizadas en el estudio
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 557 432 591 428
440 340 558 460 560 607 382 671 512 492
Establezca un grfico que permita comparar las opiniones de los hombres y mujeres
acerca de sus ingresos. Asimismo, indique qu grupo tiene un mayor porcentaje de
personas que no estn conformes con sus ingresos.
Los valores determinados como medidas de tendencia central son aquellos valores
que se toman como referencia para sealar y/o analizar el comportamiento de un
conjunto de datos. Estos valores tienen por objetivo reemplazar a todo un conjunto de
datos dentro de los anlisis y clculos estadsticos. Los ms utilizados son la Media
Aritmtica, la Mediana y la Moda
X=
x .f i i
X=
m .f i i
X=
xi n n
n
X= x .h i i
X= m .hi i
5.2. Mediana
n / 2 Fj 1
Me = L j + A j
f
j
5.3. Moda
f j f j 1
Mo = L j + A j
( f j f j 1 ) + ( f j f j + 1 )
EJEMPLO DE APLICACIN
Los datos que a continuacin se muestran son las edades de las personas que han
acudido a un policlnico solicitando exmenes de despistaje de cncer.
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
SOLUCIN:
Intervalos mi fi Fi hi Hi
[ 26 34 > 30 1 1 0,022 0,022
[ 34 42 > 38 2 3 0,044 0,066
[ 42 50 > 46 4 7 0,089 0,154
[ 50 58 > 54 10 17 0,222 0,376
[ 58 66 > 62 16 33 0,356 0,732
[ 66 74 > 70 8 41 0,178 0,910
[ 74 82 > 78 3 44 0,067 0,977
[ 82 90 ] 86 1 45 0,022 1
Total 45 1
(30 x1) + (38 x 2) + ( 46 x 4 ) + (54 x10 ) + (62 x16 ) + (70 x8) + (78 x3) + (86 x1)
X=
45
X = 60,044
45 / 2 17
Me = 58 + 8 = 60,750
16
16 10
Mo = 58 + 8 = 61,429
(16 10 ) + (16 8 )
Actividades
1. A continuacin, se muestran los sueldos de los 35 empleados de una empresa:
Enciclopedias Vendidas 0 1 2 3 4 5 6
Cantidad de das 7 11 18 20 19 1 5
440 560 335 587 613 400 424 466 585 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 557 432 591 428
440 340 558 460 560 607 382 671 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
Efecte un anlisis comparativo sobre el tiempo de uso del servicio de Internet de los
estudiantes de ambas facultades. Utilice las medidas estadsticas necesarias.
6. El 40% de los sueldos de los empleados de una empresa es mayor o igual a 50 soles
pero menor de 60 soles; el 30% mayor o iguales a 60 soles pero menor de 70 soles;
el 15% de los empleados tienen como mnimo sueldos de 70 soles pero menores de
80 soles; y los sueldos del 15% restante son mayores o iguales a 80 soles pero como
mximo 100 soles. Halle la media aritmtica de los sueldos de los empleados.
7. El quinto ciclo de una facultad de ingeniera tiene tres secciones. La seccin A tiene
45 alumnos y la nota promedio en el curso de matemtica fue de 13. La seccin B
tiene 40 alumnos y la nota promedio en el mismo curso fue de 12. Por ltimo, la
seccin C tiene 35 alumnos y la media aritmtica de las notas en el curso de
matemtica fue de 15. Halle el promedio final del quinto ciclo de la mencionada
facultad de ingeniera.
6. MEDIDAS DE POSICIN
PK = LPk
n k
+ A
(
100
)
Fj 1
fj
Se denomina CUARTIL a cada uno de los tres percentiles P25, P50, P75. El cuartil
uno (denotado por Q1) es igual a P25; el cuartil dos (denotado por Q2) es igual al
percentil P50 (que es la mediana); y el cuartil tres (denotado por Q3) es igual al
percentil P75.
Se denomina DECIL a cada uno de los nueve percentiles P10, P20, P30, P40, P50, P60,
P70, P80, P90 que dividen a todo el conjunto de datos en 10 partes iguales.
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
SOLUCIN:
Intervalos mi fi Fi hi Hi
[ 26 34 > 30 1 1 0,022 0,022
[ 34 42 > 38 2 3 0,044 0,066
[ 42 50 > 46 4 7 0,089 0,154
[ 50 58 > 54 10 17 0,222 0,376
[ 58 66 > 62 16 33 0,356 0,732
[ 66 74 > 70 8 41 0,178 0,910
[ 74 82 > 78 3 44 0,067 0,977
[ 82 90 ] 86 1 45 0,022 1
Total 45 1
P10 = 42 + 8
(
45 10
100
)
3
a)
4 = 45
P 25 = 50 + 8
(
45 25
100
)
7
b) = 53 ,4
10
P50 = 58 + 8
(
45 50
100
)
17
c)
16 = 60 ,75
= 66 + 8
(
45 75
100
)
33
d) P75
8 = 66 ,75
P90 = 66 + 8
(
45 90
100
)
33
e) = 73 ,5
8
(X ) () (X ) .f n(X) (m ) .f n(X)
2 2 2
n X
2 2 2
V= i
V= i i
V= i i
n* n* n*
S= V
7.3. Coeficiente de Variacin
S
CV = x100
X
Si en una empresa A de 100 trabajadores el sueldo promedio es 500 soles, con una
varianza de 900 soles, y en la empresa B el coeficiente de variacin de los sueldos es
del 5.6%, qu podra afirmar acerca de la dispersin de los sueldos de las empresas
A y B?
SOLUCIN:
Como se trata de dos poblaciones diferentes, entonces requerimos el coeficiente de
variacin para poder compararlas.
30
Entonces: CV = x100 = 6%
500
Para la empresa B: CV = 5,6%
Por lo tanto, podemos afirmar que, en la empresa A, los sueldos son ms dispersos
que en la empresa B. Igualmente, podemos afirmar que en la empresa B los sueldos
son ms homogneos que en la empresa A.
Actividades
1. En una prueba de aptitud mental, la menor y mayor puntacin fueron 50 y 200,
respectivamente. Los puntajes (sin decimales) se tabularon en una distribucin de
frecuencias simtrica de 5 intervalos de igual amplitud donde el 20% de los casos son
menores de 95 y el 70% de los casos son menores que 140. Halle el intervalo
centrado en la mediana donde se encuentran el 50% de los puntajes.
6. El consumo mensual de agua (en metros cbicos) de una muestra de 225 viviendas
se tabul en una distribucin de frecuencias simtrica de cinco de amplitud iguales. Si
el consumo mnimo es de 35 m3, el consumo promedio de 45m3, y si 1/3 de la muestra
consume al menos 43m3 pero menos de 47m3, calcule lo siguiente:
2.1. Qu porcentaje de la muestra consume al menos 47 m3?
2.2. Cuntos metros cbicos como mnimo consumen el 60% de las viviendas?
Intervalos mi fi Fi hi Hi
[ 26 34 > 30 1 1 0,022 0,022
[ 34 42 > 38 2 3 0,044 0,066
[ 42 50 > 46 4 7 0,089 0,154
[ 50 58 > 54 10 17 0,222 0,376
[ 58 66 > 62 16 33 0,356 0,732
[ 66 74 > 70 8 41 0,178 0,910
[ 74 82 > 78 3 44 0,067 0,977
[ 82 90 ] 86 1 45 0,022 1
Total 45 1
11. Una prueba de conocimientos tipo A se calific sobre 20 puntos dando una media de
12 y una desviacin estndar de 2 puntos. mientras que una prueba de aptitud tipo B
se calific sobre 100 puntos, con una media de 70 y una desviacin estndar de 5.
7.1. En cul de las dos pruebas los puntajes son ms homogneos?
7.2. Si Juan tiene 14 en A y Luis 73 en B, quin tiene mejor rendimiento?
Resumen
Una misma variable estadstica puede tener distintas clasificaciones: puede ser
cualitativa o cuantitativa.
El promedio es, por lo general, la medida que mejor representa los datos.
Si los datos son muy dispersos o encontramos valores extremos es posible que el
promedio no sea representativo de los mismos. En este caso es mejor utilizar la
mediana.
Los percentiles nos brindan la misma informacin que nos proporciona la mediana,
pero en diferentes posiciones ya sea cuartiles, deciles, etc.
Las medidas de posicin son tiles para establecer valores mnimos o mximos que
se deben lograr como pautas para mejorar el rendimiento de la produccin, de las
personas, etc.
Una mayor dispersin de datos implica una menor concentracin de los mismos y
viceversa.
Una mayor homogeneidad en los datos equivale a una menor dispersin de los
mismos y viceversa.
Bibliografa
ANDERSON, DAVID R.
2008 Estadstica para administracin y economa. Editorial Thomson
(519.5 ANDE 2008)
WEIERS, RONALD
2006 Introduccin a la estadstica para negocios. Mxico, D.F.: Thomson
(519.5 WEIE)
UNIDAD DE
APRENDIZAJE
PROBABILIDADES
TEMARIO
Anlisis combinatorio
Permutaciones
Combinaciones
Probabilidad clsica
Probabilidad condicional
Probabilidad total
Teorema de Bayes
ACTIVIDADES PROPUESTAS
1. ANLISIS COMBINATORIO
2. PERMUTACIONES
Pnn = n !
n!
Prn =
(n r ) !
2.3. El nmero de permutaciones posibles de n elementos, todos distintos,
agrupados en sub grupos de r elementos no necesariamente distintos (con
repeticin) es:
Prn( repeticin ) = nr
n!
Pnn1 ,n 2 ,n 3 ,..... n k =
n1!n 2 !n 3 ! n k !
Algunos ejemplos en los que se aplican las permutaciones son los nmeros que se
pueden formar con 3 cifras; la combinacin de 3 colores para hacer una camiseta; las
formas en que se pueden ordenar 10 personas en una fila, etc.
3. COMBINACIONES
n!
C nr =
r! (n r ) !
Algunos ejemplos en los que se aplican las combinaciones son el nmero de
apretones de mano en un reunin; seleccionar a los invitados de una fiesta;
seleccionar preguntas para un examen a partir de un banco de preguntas.
Actividades
1. De cuntas maneras se pueden colocar 10 chicas en una fila, de manera que dos
chicas en particular queden juntas?
4. PROBABILIDAD CLSICA
nA
P( A ) =
n
0 P(A) 1
P() = 1
P() = 0
P(A) = 1 P(A)
P(AUBUC)=P(A)+P(B)+P(C)P(AB)P(AC) P(BC)+P(ABC)
5. PROBABILIDAD CONDICIONAL
P ( A B ) n( A B )
P( A / B ) = =
P (B ) n( B )
6. PROBABILIDAD TOTAL
B1 ; B2 ; B3
B1 B2 = ; B1 B3 = ; B2 B3 =
B1 U B2 U B3 =
Se define la Probabilidad Total de la siguiente manera: sean los eventos B1, B2 y B3,
los cuales forman una particin del espacio muestral y sea A otro evento cualquiera de
; entonces, la probabilidad de ocurrencia del evento A est dada por:
4. TEOREMA DE BAYES
Sean los eventos B1, B2 y B3; los cuales forman una particin del espacio muestral y
sea A otro evento cualquiera de , la probabilidad de ocurrencia de Bk (k = 1, 2, 3)
dado que ocurri el evento A est dada por:
P(B k ) P A
P B k = Bk
A P(B ) P A + P(B ) P A + P(B ) P A
1 B 2 B 3 B
1 2 3
P(B k ) P A
P k =
B Bk
A P(A )
P (A B ) = P (A ) x P (B )
Actividades
BLOQUE 1 (Probabilidad clsica)
2. Una empresa que ofrece servicios de soporte informtico cuenta con 5 profesionales
que slo manejan Visual Basic, 4 manejan slo Unix y 3 que manejan Windows NT.
Una compaa le solicit que enven un equipo de tres personas. Calcule la
probabilidad que el equipo est formado por las siguientes personas:
2.1. Una persona que maneje slo VB, otra Unix y la otra Windows NT.
2.2. Personas que slo manejan una sola especialidad.
2.3. 2 personas que slo manejen Windows NT.
5. Una urna A contiene 3 bolas rojas y 3 bolas negras, mientras que la urna B contiene 4
bolas rojas y 6 negras. Si una bola es extrada aleatoriamente de cada urna. Cul es
la probabilidad de que las bolas sean del mismo color?
6. En una caja, hay 7 bolas rojas y 3 verdes. Se sacan dos bolas al azar de una en una.
Halle la probabilidad de que la primera sea roja y la segunda tambin si es que no
hay reposicin.
8. En una oficina donde se ensamblan computadoras, en una mesa hay 20 chips de los
cuales 6 estn malogrados. Primero llega el Sr. Gates y recoge 8 chips y ms tarde
llega el Sr. Apple y se lleva los restantes. Halle la probabilidad de que solamente uno
de ellos se haya llevado todos los chips defectuosos.
2. Suponga en una oficina que hay 100 calculadoras de las cuales 60 son elctricas y
las otras son manuales. Adems, hay 70 mquinas nuevas mientras que las otras son
usadas. Hay 30 mquinas nuevas y manuales. Si se escoge una mquina al azar:
2.1. Cul es la probabilidad de que sea elctrica?
2.2. Cul es la probabilidad de que sea manual si se sabe que es usada?
8. En una ciudad, el 70% de los adultos escuchan radio, el 40% lee peridico y el 10%
ve televisin; entre los que escuchan radio el 30% lee peridicos y el 4% ve
televisin. El 50% de los que ven TV lee el peridico y slo el 2% de la poblacin total
lee peridico, ve TV y escucha radio. Si se elige una persona al azar, calcule la
probabilidad:
8.1. Que slo realice una de las tres actividades.
8.2. Sabiendo que lee peridico, que vea televisin.
8.3. Escuche radio o vea TV.
1. En un laboratorio, hay tres jaulas: en la jaula I hay tres conejos negros y dos blancos;
la jaula II tiene dos conejos negros y cuatro blancos; y en la jaula tres hay cinco
conejos negros y cinco blancos. Se selecciona al azar una jaula y se saca un conejo
al azar de esta jaula. Cul es la probabilidad de que el conejo escogido sea negro?
2. Del rcord pasado, se conoce que cierta mquina que produce tornillos trabaja
correctamente el 90% del tiempo. Si la mquina no trabaja correctamente, el 5% de
los tornillos producidos son defectuosos. Si se escoge un tornillo aleatoriamente.
Cul es la probabilidad de que este sea defectuoso?
3. Una urna contiene tres bolas rojas y X blancas. Se extrae una bola de la urna y se
reemplaza por una de otro color, se saca de la urna una segunda bola. Sabiendo que
la probabilidad de que la segunda bola sea roja es 17/50. Determine el nmero de
bolas blancas.
4. En una urna, hay dos bolas rojas y una negra. Hugo, Paco y Luis (en ese orden)
deben sacar, uno despus del otro, una bola sin restituirla posteriormente. Cul de
las tres personas tiene mayor posibilidad de sacar la bola negra?
5. Una estacin meteorolgica suele acertar el 60% de las veces que pronostica da
lluvioso. La probabilidad de que acierte su pronstico dado de que el da no es
lluvioso es 0,8. Se sabe que la probabilidad de que llueva un da cualquiera es 0,25.
Cul es la probabilidad de que llueva si el pronstico es correcto?
6. En un almacn de una firma de fusibles, se encuentra 80 cajas con 100 fusibles cada
una: 20 cajas contienen fusibles producidos por una empresa A, 30 cajas contienen
fusibles producidos por una compaa B, el resto de cajas contiene fusibles
producidos por una compaa C. A produce el 3% de artculos defectuosos, B el 5% y
C el 4% de artculos defectuosos. Si se selecciona una de estas cajas al azar, se
toma uno de sus fusibles y se encuentra que es defectuoso. Cul es la probabilidad
de que haya sido producida por B?
Resumen
Para el anlisis estadstico, por lo general, no es necesario saber cules son los
elementos de un experimento, sino cuntos elementos son.
Los eventos tienen un comportamiento similar al de los conjuntos. Por ello, los
diagramas de Venn-Euler son bastante tiles en el clculo de probabilidades.
Bibliografa
MOYA CALDERON, RUFINO
2007 Probabilidad e inferencia estadstica. Editorial San Marcos.
(519.5 MOYA 2007)
ANDERSON, DAVID R.
2008 Estadstica para administracin y economa. Editorial Thomson
(519.5 ANDE 2008)
DEVORE, JAY L.
2005 Probabilidad y estadstica para ingeniera y ciencias. Editorial Thomson
(519.5 DEVO 2005)
WEIERS, RONALD
2007 Introduccin a la estadstica para negocios. Mxico, D.F.: Thomson
(519.5 WEIE)
UNIDAD DE APRENDIZAJE
DISTRIBUCIONES DE PROBABILIDAD
TEMARIO
Experimento de Bernoulli
Distribucin Binomial
Distribucin de Poisson
ACTIVIDADES PROPUESTAS
1. EXPERIMENTO DE BERNOULLI
2. DISTRIBUCIN BINOMIAL
P[X = k / B : n, ] = C ( ) (1 )
n k n k
k
3. DISTRIBUCIN DE POISSON
e .k
P[X = k / P : ] =
k!
Donde: X = Variable aleatoria
= Valor promedio de ocurrencias para el intervalo en que est definida la
variable.
K = Nmero de eventos comprendidos en la frecuencia del parmetro
Cuando N tiende a infinito y es tal que el producto entre ambos parmetros tiende
a ser igual al parmetro ; entonces, la distribucin de la variable aleatoria Binomial
tiende, o sea, se puede aproximar, a una distribucin de Poisson. Para esto, la
equivalencia de parmetros es la siguiente:
= (n)
En la prctica, esta aproximacin se suele utilizar cuando es pequeo y el valor de n
es muy grande.
Actividades
BLOQUE 1 (Distribucin Binomial)
3. Se sabe que el 40% de las personas que se presentan a un empleo son altamente
capacitadas en el manejo de Visual Basic. Si 25 personas se presentan a un empleo:
3.1. Cul es la probabilidad de que 10 sean altamente capacitadas en VB?
3.2. Cul es la probabilidad de que por lo menos 2 sean altamente capacitadas en
el manejo de Visual Basic?
2. Los accidentes de trabajo, que se producen por semana en una fbrica, siguen la ley
de Poisson, de tal manera que la de probabilidad que haya 5 accidentes es 16/15 de
que haya 2.
2.1. Halle el parmetro de la distribucin de Poisson.
2.2. La probabilidad de que no haya accidentes en tres semanas.
3. Una de cada cinco veces que se lleg a un puente levadizo, ste se encontraba
levantado por lo que se tuvo que detener el auto para luego continuar el camino.
3.1. Calcule la probabilidad de que en las siguientes siete aproximaciones al puente
este no se halle levantado.
3.2. Cul es el nmero de veces que se espera encontrar el puente levantado?
4. Suponga que cierto alimento produce una reaccin alrgica en un 0,01% de una
poblacin grande. Si 100 000 personas comen este alimento diario en promedio:
4.1. Cul es la probabilidad de que 5 de ellos sean, alrgicos a este alimento?
4.2. Cul es el nmero esperado de personas con reaccin alrgica?
5. DISTRIBUCIN NORMAL
1 x 2
1
2
f (x) = e dx
2
Una variable aleatoria continua Z tiene distribucin normal estndar si sigue una
distribucin normal con = 0 y = 1. Esto se suele denotar por: Z N (0,1)
X ~ N( , 2 ) Z ~ N(0 , 1)
x
z=
Este proceso de transformacin permite el uso de tablas estadsticas previamente
elaboradas, en las cuales se tienen los valores de probabilidad de la variable
normalizada Z. Con esto, el clculo de la probabilidad resulta ms prctico, sencillo y
rpido.
Se dice que N variables aleatorias X1, X2, X3,......, XN tienen la misma distribucin de
probabilidad con media y desviacin estndar , si tienen la misma funcin de
probabilidad en el caso de variable discreta, o una misma funcin de densidad en el
caso de variable continua.
Zn =
(X1 + X2 + X3 + .... + Xn ) n
n
X N [n , n (1 - )]
X 0,5 n
Z=
n(1 )
Si una muestra aleatoria de tamao "N" es extrada de una poblacin con distribucin
dada, con media y desviacin estndar , entonces la distribucin de la variable
aleatoria con media muestral (X ) se aproxima cada vez ms a una distribucin
normal cuando "n" tiende al infinito; es decir:
X N (X , X )
( X ) n
Z=
Sin embargo, cuando la muestra de tamao n es extrada de una poblacin finita N
sin reemplazamiento con media aritmtica y desviacin estndar , la media
muestral debe multiplicarse por el factor de correccin relacionado con su poblacin
N. As, para los casos en que hay que aplicar esta correccin, la distribucin de la
variable aleatoria ser la siguiente:
(X ) n
Z =
Nn
N 1
Si una muestra aleatoria de tamao "n" es extrada de una poblacin con distribucin
dada, con proporcin poblacional , entonces la distribucin de la variable aleatoria
de una proporcin muestral (p) se aproxima cada vez ms a una distribucin normal
cuando "n" tiende a infinito; es decir:
p N ( p , p )
As, la distribucin de la variable aleatoria para una distribucin muestral de medias
se realiza de la siguiente manera:
X
Z=
(1 )
n
Ntese que representa la probabilidad de xito de un experimento de Bernoulli.
Z=
X 1
2n
( )
(1 ) N n
n N 1
X 1
Z= 2n
(1 )
n
Actividades
BLOQUE 1 (Distribucin Normal Estndar)
1. Los pesos de las impresoras marca ZZ se distribuyen normalmente con media 1,5 kg.
y desviacin estndar 0,3 kg. Determine lo siguiente:
1.1. La probabilidad de que una impresora elegida al azar pese menos de 1,3 Kg.
1.2. El porcentaje de impresoras que pesan entre 1,4 y 1,65 Kg.
1.3. Si la produccin de impresoras es de 5 000, cuntas pesan ms de 1,75 Kg.?
5. Se ha encontrado que el tiempo de servicio que se requiere por persona en una caja
bancaria tiene una distribucin aproximadamente normal con media de 130 segundos
y varianza de 2025 segundos.
5.1. Calcule la probabilidad de que se requiera menos de 100 segundos
5.2. Cul es el tiempo mnimo que utilizan el 20% de las personas que ms se
demora?
7. Una fbrica de neumticos hace una prueba para medir la duracin de sus llantas y
verific que la duracin de las llantas tena distribucin normal, con media 48000 Km.
y desviacin estndar de 2000 Km. Si se sabe que las llantas se venden asegurando
que duran ms de 45 000 Km., cul es la probabilidad de que de 5 llantas vendidas,
exactamente tres tengan una duracin menor a la asegurada?
2. Una linterna grande es alimentada por cinco bateras. Suponga que la vida de una
batera est normalmente distribuida con media de 120 horas y varianza de 100
horas. La linterna dejar de funcionar si se agota una o ms de sus bateras.
Suponiendo que las vidas de las bateras son independientes, cul es la
probabilidad que la linterna funcione ms de 100 horas?
5. Un motor industrial tiene una vida promedio de 5200 horas con una desviacin
estndar de 530 horas. En una planta de refrigeracin, se instalan 3 de estos
motores: uno principal y los otros dos de reserva, de manera que cuando uno falla,
otro lo reemplazar de manera automtica. Si la vida de cada motor es
independiente, cul es la probabilidad de que los motores de la planta funcionen en
conjunto al menos 15500 horas pero menos de 15800 horas?
6. Suponga que los pesos de los pasajeros que viajan por aire en los vuelos
establecidos que parten de un aeropuerto grande siguen una distribucin normal con
media de 78kg. y varianza de 100 kg. Encuentre los lmites (simtricos alrededor de la
media), de tal manera que el 95% de los pasajeros tengan un peso lmite dentro de
estos valores. Cul es la probabilidad de que el peso total de una muestra al azar de
100 pasajeros exceda a 8 000 Kg.?
1. Una firma comercializa sus productos va Internet a una lista de 100 000 clientes
potenciales para decidir acerca de la comercializacin de un nuevo producto. La firma
selecciona una muestra de 100 personas para ofrecerles dicho artculo. Si 30 o ms
de estos clientes estn dispuestos a adquirirlo, se proceder a su comercializacin.
1.1. Cul es la probabilidad de que comercialice el artculo si en realidad slo el
20% de todos los clientes lo comprasen?
1.2. Cul es la probabilidad de que comercialice el artculo si en realidad slo el
36% de todos los clientes lo comprasen?
3. En una poblacin grande de moscas, el 25% tiene mutacin de alas. Una muestra de
300 insectos es escogida al azar. Calcule la probabilidad de que ms de 60, pero no
ms que 90 insectos de la muestra, tengan mutacin de alas.
4. Cierto virus ha invadido una escuela y ataca a la mitad de los estudiantes. Si se toma
una muestra aleatoria de 200 alumnos, calcule la probabilidad de que:
4.1. En dicha muestra, el 49% sea atacada por el virus.
4.2. En la misma muestra, ninguno presente sntomas del virus.
5. Suponga que un 10% de las llantas de un fabricante tienen defectos en la superficie, y que
los embarca en lotes de 100.
5.1. Cul es la probabilidad de que un lote contenga 8 menos llantas con defectos en
su superficie?
5.2. Un comprador mayorista recibe 500 lotes. Cul es la probabilidad de que al menos
140 lotes contengan 8 menos llantas con defectos en la superficie cada uno?
1. Las lmparas que fabrica cierta empresa tienen una vida de 800 hrs. y una desviacin
tpica de 60 hrs. Halle la probabilidad de que una muestra aleatoria de 16 lmparas
tengan una vida media entre 769 y 810 hrs.
4. Ciertos tubos fabricados por una compaa tienen una duracin media de 800 horas y
una desviacin estndar de 60 horas. Halle la probabilidad de que una muestra al
azar de 196 tubos, tomada entre ellos, tenga una duracin media:
4.1. Entre 790 y 810
4.2. Menor de 785 horas
5. Una firma de pedidos por correo sabe por experiencias anteriores que de las
circulares que enva por correo, el 10% tendr respuesta. Suponga que se envan 20
circulares como prueba de mercado en una regin geogrfica. Adems, suponiendo
que se puede aplicar la tasa de respuestas del 10% en la nueva regin, calcule la
probabilidad de que menos del 20% de la gente responda. Asimismo, calcule la
probabilidad de que contesten entre el 25% y 35% de la gente.
Resumen
En una distribucin normal, se debe tener en cuenta que la variable que se estudia
debe ser continua.
Para una distribucin normal estndar, se debe tener en cuenta la media promedio y
la desviacin estndar.
Los valores de las muestras con sus respectivas distribuciones son considerados
vlidos para cualquier poblacin finita o infinita, discreta o continua cuando n es
mayor o igual a 30.
Bibliografa
MOYA CALDERON, RUFINO
2007 Probabilidad e inferencia estadstica. Editorial San Marcos.
(519.5 MOYA 2007)
DEVORE, JAY L.
2005 Probabilidad y estadstica para ingeniera y ciencias. Editorial Thomson
(519.5 DEVO 2005)
UNIDAD DE APRENDIZAJE
TEMARIO
Anlisis de regresin
Anlisis de correlacin
ACTIVIDADES PROPUESTAS
1. ANLISIS DE REGRESIN
Son diagramas que utilizan el sistema cartesiano para mostrar los valores de
dos variables para todo un conjunto de datos. Estos datos se representan en
una grfica como un conjunto de puntos, relacionando el valor de una variable
(eje X) con su valor correspondiente en la otra variable (eje Y)
X=
X y Y=
Y
n n
( X) 2
( Y )2
SC( X) = X 2
y SC( Y ) = Y 2
n n
SP( XY) = XY
( X)( Y )
n
SP( XY)
b= y a = y bx
SC( X)
SC( Y ) b 2SC( X)
S XY =
n2
4. ANLISIS DE CORRELACIN
SP ( XY )
r=
[SC ( X )][ SC ( Y )]
La interpretacin del Coeficiente de Pearson se muestra en la siguiente Tabla:
Como se puede observar, cuando r tiende a 1, diremos que la relacin entre las
variables es bastante intensa y adems directa; en cambio, si el valor de r es
cercano a 1, la relacin tambin es muy intensa pero inversa. Por otra parte, si el
valor de r se acerca a cero, podemos afirmar que no existe ninguna correlacin.
Una vez que se ha establecido el modelo de regresin, nos tenemos que hacer una
pregunta final: qu tan confiables son las predicciones que se hagan a travs del
modelo obtenido? Para determinar esto, tendremos que calcular el Coeficiente de
Determinacin (r2). Este coeficiente nos indica el porcentaje en que la variacin de la
variable dependiente es explicada por la variable independiente. Dicho de otra
manera, el Coeficiente de Determinacin nos indica el nivel de confiabilidad que se
debe tener para los resultados estimados con la ecuacin de regresin. Los valores
b 2 [ SC ( X )]
r =
2
SC ( Y )
5. EJEMPLO DE APLICACIN
En la siguiente tabla, se muestran las ventas que tuvo una empresa en 10 aos
pasados. Sobre la base de esta informacin, se pide determinar lo siguiente:
a) La recta de regresin y el error estndar de estimacin.
b) El coeficiente de correlacin y el coeficiente de determinacin.
c) El estimado de ventas que esta empresa tuvo en el ao 2001.
AO VENTAS
1991 0.2
1992 0.4
1993 0.5
1994 0.9
1995 1.1
1996 1.5
1997 1.3
1998 1.1
1999 1.7
2000 1.9
SOLUCIN:
Primeramente, es necesario determinar cul de las variables es independiente (X) y
cul es dependiente (Y). Seguidamente, se realizan los primeros clculos para
determinar los promedios y las sumatorias. (ver cuadro adjunto)
2
N
N
X
(19955)2 = 82,5
i=1
SC( X) =
i=1
Xi2
N
= 39820285-
10
2
N
N
Y
(10,6)2 = 2,884
i=1
SC( Y) =
i=1
Yi2
N
= 14,12
10
N N
N
X Y
i=1 i=1 19955x10,6
SP( XY) =
i=1
Xi Yi
N
= 21166,8
10
= 14,5
SP( XY ) 14,5
b= = = 0,176
SC( X) 82,5
Y = 350,148 + 0,176 X
SP( XY ) 14,5
r= = = 0,94003
[SC( X)][SC( Y )] 82,5 x 2,884
r 2 = (0,94003 ) = 0,88366
2
Y = 350,148 + 0,176X
Y = 350,148 + 0,176(2001)
Y = 2,028
Actividades
1. Un analista toma una muestra aleatoria a 10 embarques recientemente enviados por
camin de una compaa y registra la distancia en kilmetros y el tiempo que demora
la entrega desde que el embarque estuvo listo para su transportacin. Estos datos se
muestran a continuacin:
Embarque 1 2 3 4 5 6 7 8 9 10
Tiempo (das) 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0
Distancia (Km) 825 215 1070 550 480 920 1350 325 670 1215
y 2
= 47225
y = 673 xy = 101,570
2.1. Determine la recta de regresin.
2.2. Estime el tiempo que la computadora se demorar en ejecutar el programa
cuando se utiliza un archivo datos de 180 KB.
4. El tiempo (en segundos) que demora un cajero automtico en atender a un cliente se cree
que se puede estimar en funcin del nmero de operaciones (X1) que realiza el cliente y el
monto retirado (X2, en cientos de soles). Para ello, se han establecido tres modelos:
Precio por unidad (P) 20,0 17,5 16,0 14,0 12,5 10,0 8,0 6,5
Cantidad vendida (Q) 125 156 183 190 212 238 250 276
Halle la ecuacin de regresin lineal y estime la cantidad vendida si los precios fueran
de 15 dlares. Qu tan confiable es esta ecuacin? Justifique su respuesta.
Resumen
El Anlisis de Regresin Lineal Simple es un mtodo estadstico que permite
establecer un modelo estadstico que permita encontrar una relacin cuantitativa
entre dos variables. Este modelo sigue la ecuacin de una recta: Y = a + bX
Bibliografa
ANDERSON, DAVID R.
2008 Estadstica para administracin y economa. Editorial Thomson
(519.5 ANDE 2008)
WEIERS, RONALD
2009 Introduccin a la estadstica para negocios. Mxico, D.F.: Thomson
(519.5 WEIE)
P [X k / B: n,k]
P [X k / B: n,k]
P [X k / B: n,k]
P [X k / B: n,k]
P [X k / B: n,k]
P [X k / P: ]
P [X k / P: ]