Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Probabilidad PDF
Probabilidad PDF
La teoría de la probabilidad tuvo sus comienzos a principio del siglo XVII como
resultado de investigaciones sobre los juegos de azar.
La definición de probabilidad se produjo debido al deseo del ser humano por conocer
con certeza los eventos que sucederán en el futuro, es por eso que a través de la
historia se han desarrollado diferentes enfoques para tener un concepto de la
probabilidad y determinar sus valores.
Laplace (1774) hizo el primer intento para deducir una regla para la combinación de
observaciones a partir de los principios de la teoría de las probabilidades. Durante el
siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, el
cálculo de probabilidades tuvo un notable desarrollo sobre la base de la definición de
probabilidad. Destacan en 1713 el teorema de Bernoulli y la distribución binomial,
Ejemplo. N Z Q R C
Álgebra de conjuntos
UNION
A B = { x/x A ó x B }
INTERSECCION
A B = { x/x A y x B }
2
CONJUNTO VACIO
A B= { }
A B=
COMPLEMENTO
A'= { x U/x y x A }
DIFERENCIA
A - B={ x/x A y X B }
B – A = ={ x/x B y X A }
DIFERENCIA SIMÉTRICA
3
Conjuntos. Operaciones conjuntos
A (B C) = (A B) A (B C) = (A B)
Di Distributiva
(B A) (A C)
N Neutralidad A Ø=A A U=A
A U=U A Ø=Ø
C Complementación A Al = U A Al = Ø
Le de De Morgan (A B) l = A l Bl (A B) l = A l Bl
Además se cumple: (A l) l = A A - B = A Bl
PRODUCTO CARTESIANO
4
A x B = {(x, y) / x ∈ A ∧ y ∈ B}.
En consecuencia:
(x, y) ∈ A x B ⇔ x ∈ A ∧ y ∈ B
(x, y) ∉ A x B ⇔ x ∉ A ∨ y ∉ B
Ejemplo
5
NTRODUCCIÓN ALCÁLCULOS DE PROBABILIDADES
TÉCNICAS DE CONTAR
y así sucesivamente, entonces el número de maneras en que pueden ocurrir todos los
eventos viene dado por: 𝑛1 ∗ 𝑛2 ∗ 𝑛3 ….
Ejemplo.
Cuántas placas para automóvil puede hacerse, si cada placa consta de 3 letras y de
3 dígitos?
1.2. PERMUTACIONES
nPn n!
6
Ejemplo
8P8= 8! = 40.320
n!
n Pr
(n r )!
Ejemplo
n!
P * ( n,n )
n1!n2 !....nr !
Ejemplo
7
maneras se puede presentar el resultado 5 votos por el candidato A, 3 por el B y 2 en
blanco ?
10!
,10) 2.520
*
P(10 posibilidades
5!*3!*2!
Cuando escogemos un elemento de un conjunto, uno tras otro, r veces, llamamos a esta
escogencia una prueba ordenada de tamaño r.
Ejemplo
Diez personas van a votar a favor o en contra de un proyecto, cuántos resultados existen
?
1.5 COMBINACIONES
n P(n, r )
C (n, r )
n!
C (n, r )
r r! (n r )!*r!
Ejemplo
8
50!
C (50,4) 230.300 grupos diferentes.
(50 4)!*4!
Podemos realizar todas las operaciones de conjuntos para generar nuevos sucesos.
Ocurre el suceso A, si x A.
Ocurre solamente A, si x (A – B)
No ocurre A, si x Ac
1.8 PROBABILIDAD
r #A
P( A)
n #S
Ejemplo
r 22.800
Así que P( A) 0,16 16%
n 142.506
10
1.8.2. PROBABILIDAD FRECUENCIAL O APOSTERIORI.
f frecuencia
P( A)
n total.casos
Ejemplo
f 120
Así que P( A) 0,4 40%
n 300
Las probabilidades de los sucesos pueden ser arbitrarias y dependen del grado de
conocimiento que tenga un sujeto acerca de una determinada situación.
ii) P(S) = 1
11
1.8.5 LEYES DE PROBABILIDAD
1) P() = 0
3) P(AUB) = P(A) + P(B) - P(A∩B) probabilidad de que ocurra alguno de los sucesos
Consecuencias
P(A∩Bc ) = P(A-B)
P(Ac ∩ Bc) = P[(AUB)c ] = 1 - P(AUB) probabilidad de que no ocurran los dos al tiempo
Sea S un espacio muestral finito así: S = {a1 a2, a3,.....an}, obtenemos un espacio de
probabilidad si a cada punto ai, le asignamos un número real pi llamado probabilidad,
entonces:
pi 0 y
p1 + p2+...+pn = 1
Ejemplo
12
Si el suceso A indica obtener un número mayor que 3, la P(A)= ½
13
2. PROBABILIDAD CONDICIONAL
Sea A un suceso arbitrario de un espacio muestral S, con P(A) >0, y sea B otro suceso
del mismo S. La probabilidad de que ocurra B una vez haya sucedido A, se llama
probabilidad condicional de B dado A, se denota así: P(B/A), y se define
P( A B)
P (B / A)
P( A)
P(A∩B) = P(A).P(B/A)
P(A∩B) = P(A).P(B)
Ejemplo
Una sucesión finita de experimentos, en los cuales cada uno tiene un número finito de
resultados con probabilidades conocidas se llama una proceso estocástico finito y se
representa por medio de un diagrama de árbol. La ley del producto se puede aplicar para
encontrar la probabilidad en cualquiera de las ramas.
Sean los sucesos A1, A2,...An tales que formen una partición del espacio muestral S;
esto es que los eventos son mutuamente excluyentes y su unión es S. Entonces:
B= (A1UA2U......UAn)∩B
P(B) = ∑P(Ai∩B)
14
P(B)= P( Ai ). P(B / Ai )
P( Ai B)
P( Ai /B) =
P(B)
P( Ai ) * P( B / Ai )
P( Ai /B) =
P(B)
Ejemplo
Por estudios de tránsito en una vía, se sabe que el 25% de los vehículos que transitan
son de servicio público pesado, el 30% de servicios público liviano y el 45% de servicio
particular. También se conoce que la probabilidad de accidente en cada clase de
vehículos son 0.2; 0.3 y 0.15 respectivamente. Se desea conocer:
a ) La probabilidad de accidente en dicha vía.
b ) Si hubo accidente cual es la probabilidad de que el vehículo accidentado sea de
servicio particular
Sea B = accidente
a)
P(B)= P( Ai ). P(B / Ai ) = 0.25*0.2+0.30*0.3+0.45*0.15 = 0.2075
P(B/A1) B
A1
P(Bc /A1) BC
P(A1)
P(B/A2) B
P(A2) A2
P(Bc /A2) BC
P(A3)
P(B/A3)
A3 B
P(Bc /A3)
BC
16
17
3. VARIABLES ALEATORIAS
X (S ) {x1 , x2 ,.... xn }}
X (S ) {x1 , x2 ,....................}
f(xi)0 y f(xi) = 1
² = (X-)²f(x)
Ejemplo
19
El número de resultados posibles es 210 =1.024
f(X)
30.00%
24.61%
25.00%
20.51% 20.51%
20.00%
15.00%
11.72% 11.72%
10.00%
4.39% 4.39%
5.00%
0.10% 0.98% 0.98% 0.10%
0.00%
0 1 2 3 4 5 6 7 8 9 10
20
f(x) 0 , y f ( x)dx 1
En este caso f se llama función de probabilidad o de densidad más no representa la
probabilidad.
x
F (x ) P ( X x ) f (t )dt
Las probabilidades ahora se calculan como áreas bajo la curva f(x) en un intervalo
(a,b), entonces,
b
P (a x b) f (x )dx F (b) F (a )
a
E ( X ) xf (x )dx
VAR(( X ) (x )2 f (x)dx
a. Bernoulli
b. Binomial
c. Poissón
d. Geométrico
e. Hipergeométrico
f. Multinomial
Todo experimento que tenga dos resultados exhaustivos y excluyentes es una prueba
de Bernoulli.
A uno de los resultados se le llama éxito y al otro fracaso, la variable aleatoria asigna el
valor 1 al éxito y 0 al fracaso y las probabilidades correspondientes son p y q.
A Éxito 1 p
B Fracaso 0 q
Entonces:
n!
f ( x) p x q ( n x )
x!(n x)!
22
donde x: 0, 1, 2, 3,...n
f(x) = 1
E(X) = np
Var(X) = npq
Función acumulativa
n!
F(a)= p x q n-x
x a x!(n - x)!
Ejemplo
Debido a las altas tasas de interés, una compañía informa que el 30% de sus cuentas
por cobrar están vencidas. Si un contador escoge aleatoriamente 5 de esas cuentas.
a) Ninguna cuenta vencida.
b) Exactamente 2 vencidas.
n!
f ( x) p x q ( n x )
x!(n x)!
5!
f ( x) 0.3 x 0.7 (5 x )
x!(5 x)!
5!
f (0) 0.30 0.7 (50) 0
0!(5 0)!
5!
f (2) 0.32 0.7 (52) 0.3087
2!(5 2)!
23
4.1.3 MODELO DE POISSON
Es decir,
e
- x
n! x n-x
Lim p p =
n p 0
x!(n - x)! x!
Entonces
e x
f (x )
x!
donde, X: 0, 1, 2,......
La media = np
La varianza V(x) = npq = np(1-p) = np = , porque p 0
Ejemplo
e x e 3 3 x e 3 34
f (x ) → f ( x) → f (4) 0.1680
x! x! 4!
24
c) La v.a. X indica el número de éxitos en la muestra
Si la población es muy grande o infinita no importa que la muestra se haya tomado con
o sin sustitución, en ambos casos las pruebas son independientes.
N 1 N 2
f ( x) N
X n X
n
Donde:
La media de x,
N1
E( X ) n
N
N1 N 2 N n
Var( x) n
N N N 1
25
Ejemplo
N 1 N 2 10 8 10 8
f ( x) N f ( x) 18 f (3) 18 0.3921
X n X X 5 X 3 53
n 5 5
y la función de probabilidad
f ( x) pq x 1
Ejemplo
26
4.1.6 MODELO MULTINOMIAL
Si en una prueba hay mas de 2 resultados ya no se puede hablar de éxito y fracaso sino
que debemos designar por Xi al número de veces que se repite cada uno de ellos en la
muestra de tamaño n.
k
Cada Xi: 0, 1, 2,....n, además x1
i n
n!
P(X 1 = a1 , X 2 = a 2 ,...X k = a k ) = P1a1 P2a 2 .....PKak
a1 !.a2 !...ak !
E(Xi) = npi
Var(Xi) = npiqi
Ejemplo
n!
P(X 1 = a1 , X 2 = a 2 ,...X k = a k ) = P1a1 P2a 2 .....PKak
a1 !.a2 !...ak !
27
12!
P(X 1 = 5, X 2 = 4, X k = 3 ) = 0.40 5 * 0.35 4 * 0.25 3 0.000
5!.4!3!
a. Normal
b. Gamma
c. Exponencial
d. Chi-cuadrado
Una variable aleatoria X de distribución normal puede tomar cualquier valor entre
- y +.
1 x 2
1 ( )
f ( x) e 2
2
Si graficamos esta función obtenemos una curva en forma de campana es por eso que
comúnmente se la conoce como la campana de Gauss.
28
Como la curva es simétrica alrededor de X = , y el área total es 1 se puede afirmar
que:
P( X ) f (x )dx 0,5
0
0
P( X ) f (x )dx 0,5
Observe que si cambia la media m la curva se desplaza en el eje X, y si cambia la
desviación estándar s, la curva se concentra o se dispersa de la media.
x
z
y la función estandarizada es
29
1
1 2 z2
( z) e
2
2.- Para pasar un modelo Binomial a normal, en primer lugar se corrige la variable
discreta X a continua, aumentando o restando 0,5 según el caso, enseguida se
encuentra la media = np y la desviación estándar npq , luego se calcula z
con la fórmula
( x 0,5) np
z , y busca las probabilidades en la tabla normal estandarizada.
npq
30
5.DISTRIBUCIONES MUESTRALES
x
z
n
población 1 población 2
media = 1 media = 2
Varianza = 12 Varianza = 2
2
Muestra 1 = n1 muestra 2 = n2
31
12 22
Desviación estándar de la diferencia D
n1 n2
D
La variable z en este caso toma la forma: z
D
x1 x2
p1 y p2
n1 n2
p1 q1 p 2 q 2
p
n1 n2
( p1 p 2 ) ( p1 p 2 )
z
p
1. Calcular probabilidades
2. Estimación por intervalos
3. Contraste de hipótesis.
Una empresa eléctrica, fabrica baterías que tienen una duración que se
distribuye normalmente con media de 800 horas y desviación estándar de 40
32
horas. Calcular la probabilidad de que en una muestra aleatoria de 16 baterías,
tenga una vida promedio de menos de 775 horas.
Datos:
x 775
µ=800
n=16
40
𝜎𝑥̅ = 𝜎/√𝑛 = = 10
√16
𝑥̅ − µ
Z=
𝜎𝑥̅
una mue
𝑥̅ − µ 775 − 800
Z = = = -2.5
𝜎𝑥̅ 10
P (Z<-2,5)= 0,0062
33
La probabilidad de que en una muestra aleatoria de 16 baterías, tenga una
vida promedio de menos de 775 horas es de 0,62%
Ejemplo
𝑃̅ − 𝑃
𝑍=
𝑝∗𝑞
√
𝑛
0.65 − 0.60
𝑍=
√0.60 ∗ 0.40
40
0.05
𝑍= = 0.71
0.07
34
.
35
6.ESTIMACIÓN DE PARÁMETROS.
Límites de confianza = X z Si la población es infinita.
n
La probabilidad P X Z X Z 1
n n
se conoce con el nombre de grado de confianza y cuando este valor es:
36
1- = 90% , Z = 1,65
1- = 95% , Z = 1,96
1- = 98% , Z = 2,33
1- = 99% , Z = 2,58
Z 2 2
n Para poblaciones infinitas
E2
Z ( N n)
E Para poblaciones finitas de tamaño N.
n ( N 1)
El último radical se conoce como FCPF
factor de corrección para poblaciones finitas
y despejando el tamaño de la muestra n,
Z 2 2 N
n Para poblaciones finitas de tamaño N.
( N 1) E 2 Z 2 2
Ejemplo
Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que
se tarda en cobrar a los clientes.
Datos:
𝑋̅ = 5,2 minutos
𝜎 = 0,5 minutos
n = 25 clientes
1 − 𝛼 = 95%
𝛼 = 5%
37
𝜎
𝐸=𝑍∗
√𝑛
0,5
𝐸 = 1,96 ∗
√25
𝐸 = 0,196
𝜎
𝐿𝑠 = 𝑋̅ + 𝑍 ∗
√𝑛
0,5
𝐿𝑠 = 5,2 + 1,96 ∗ = 5,396
√25
𝜎
𝐿𝑖 = 𝑋̅ − 𝑍 ∗
√𝑛
0,5
𝐿𝑖 = 5,2 − 1,96 ∗ = 5,004
√25
38
6.2 Estimación por intervalos para la proporción.
pq
Límites de confianza = P z
n
pq pq
La probabilidad: P P z PPz 1
n n
1-: Se conoce con el nombre de grado de confianza y cuando este valor es:
pq
El valor : z , se conoce como el margen de error
n
pq
Ez , de donde se puede despejar el tamaño de la muestra n,
n
Z 2 pq
n Para poblaciones infinitas
E2
pq ( N n)
EZ Para poblaciones finitas de tamaño N.
n ( N 1)
El último radical se conoce como FCPF
factor de corrección para poblaciones finitas
y despejando el tamaño de la muestra n,
Z 2 pqN
n Para poblaciones finitas de tamaño N
( N 1) E 2 Z 2 pq
Ejemplo
39
El director de la empresa Colácteos toma una muestra de 100 productos, de los
cuales 30 cumplen con los estándares requeridos para su venta. Estimar el verdadero
porcentaje de todos los productos que cumplen con los estándares, con una
confiabilidad del 99%.
Datos:
𝑥 30
𝑃̅ = = = 0.30 = 30%
𝑛 100
1 − 𝛼 = 99%
𝑝̅ ∗𝑞̅ 0.30∗0.70
Error estándar √ =√ = 0,04
𝑛 100
𝑝̅ ∗𝑞̅
Margen de error 𝐸 = 𝑍 ∗ √ = 2.58 * 0.04 = 0.103
𝑛
40
6.3 Límites de confianza para la diferencia de medias.
D X1 X 2
12 22
D
n1 n2
Límites de confianza = D Z D
1 2 22 1 2 22
P Dz D z 1
n1 n2 n1 n2
Ejemplo
D X1 X 2 D 85 80 5
12 22 240 340
D D 4.06
n1 n2 30 40
X1 X2
p1 y p2
n1 n2
p p1 p2
41
p1 q1 p 2 q 2
p
n1 n2
Ejemplo
X1 25 X2 15
p1 p1 0.83 , p2 p2 0.75
n1 30 n2 20
p1 q1 p 2 q 2
Límites de confianza = ( p1 p 2 ) z
n1 n2
pq pq pq pq
P p1 p2 ) z 1 1 2 2 P p1 p2 ) z 1 1 2 2 1
n1 n2 n1 n2
42
7.PRUEBAS DE HIPÓTESIS.
Las hipótesis son supuestos que el investigador hace acerca de los parámetros. Para
resolver un problema y tomar una decisión adecuada es conveniente seguir este
procedimiento:
Acepto Ho
Rechazo Ho
Zα
43
e) Calcular el estadígrafo de prueba Z, aplicando la fórmula de la distribución muestral
correspondiente.
Ejemplo
Un fabricante de autos sostiene que sus autos consumen en promedio 55.5 galones
cada 1000 km. Un vendedor de la compañía comprueba el consumo de gasolina de
60 autos y encuentra que el consumo medio de este grupo es de 55.65 galones por
cada 100 km. Si la desviación estándar del consumo es 70 galones es cierta la
afirmación del fabricante a un nivel de significancia del 1%?
Si 𝑥̅ > k, se rechaza la Ho
Si 𝑥̅ < k, se acepta la Ho
Potencia de la prueba
𝑘−µ1
Z= 𝜎
√𝑛
Ahora reemplazamos en la formula, tomando las diferentes medias ( 80, 85, 90 y 95)
76.5−80 −3.5
z= 70 = = - 0.51
6.76
√60
Se busca en la tabla el valor - 0.51, y obtenemos un resultado de 0,3050.
Entonces:
76.5−85 −8.5
z= 70 = 6.76
= - 1.25
√60
Se busca en la tabla el valor -1.25, y obtenemos un resultado de 0. 1056
45
Entonces:
76.5−90 −13.5
z= 70 = 6.76
= - 1.99
√60
Entonces:
β
0.6
0.5
0.4
0.3
0.2
0.1
0
µ1 = 76.5 µ1 = 80 µ1 = 85 µ1 = 90 µ1 = 95
1-β
1.5
1 0.8944 0.9767 0.9967
0.695
0.5 0.5
0
µ1 = 76.5 µ1 = 80 µ1 = 85 µ1 = 90 µ1 = 95
46
47
De acuerdo con la anterior grafica podemos observar que la potencia(1- β) va
aumentando y β (error tipo II) va disminuyendo, es decir, disminuye la probabilidad
de aceptar la Ho cuando ésta es falsa.
Ejemplo.
Nivel de significancia = 5%
Acepto Ho
Rechazo Ho
Z crítico =1.64
X 77 75
Calculamos Z, Z Z = 1,38
13
n 80
Como Z calculado es menor que Z crítico., se Acepta Ho. No existe evidencia para
concluir que el curso aumenta el rendimiento.
Datos
n = 356
P = 40%
𝑃̅ = 48%
𝛼 = 5%
𝐻0 : 𝑃 = 40%
𝐻1 : 𝑃 > 40%
𝑆𝑖 𝑃̅ ≤ 𝐾 → 𝐴𝑐𝑒𝑝𝑡𝑎𝑟 𝐻0
𝑆𝑖 𝑃̅ > 𝐾 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0
𝑝∗𝑞
𝐾 = 𝑃+𝑍∗√
𝑛
0,40 ∗ 0,60
𝐾 = 0.40 + 1,64 ∗ √
356
𝐾 = 0; 40 + 1,64 ∗ (0,02)
𝐾 = 0,40 + 0,012
49
𝐾 = 0,412
𝐾 = 41,2%
50
8. DISTRIBUCIÓN T DE STUDENT
X X
observar lo siguiente: Z t
s
n n 1
Para encontrar los límites de confianza, es necesario tomar una muestra de tamaño
n, definir el grado de confiabilidad igual 1- α, calcular el promedio y la desviación
estándar de la muestra. Los límites se encuentran de manera similar a la distribución
normal.
Ejemplo 8.1
X (edad): 10 12 18 18 15 20 21 14 13 20
51
El promedio es 16.1 y la desviación estándar 3.62. Para buscar el valor de t en la
tabla ubicamos en v=9 y si el área a la izquierda es 0.975 buscamos t 0.975 y el valor
correspondiente a t es 2.26.
0,975
2,26
s
LIMITES DE CONFIANZA = X t para poblaciones infinitas y,
n 1
s N n
X t
n 1 N 1
Ejemplo.
Encontrar los límites del 95% de confiabilidad para los datos anteriores
El valor de t para 9 grados de libertad y con un área a la izquierda de 0.975 es 2.26,
el promedio de los datos es 16.1 y la desviación 3.62; entonces los límites de
confianza serían:
3.62
Límites 16.1 2.26 * = 16.1±2.73
9
Límite inferior = 16.1- 2.73 = 13.37
Límite superior = 16.1+2.73 = 18.83 P(13,37 18,83) 95%
Para encontrar los límites de la diferencia es necesario tener en cuenta si las muestras
son dependientes o independientes.
( X 1 X 2 ) ( 11 2 )
t
S12 S 22
n1 n2
S12 S 22
(X1 X 2 ) t
n1 n2
Varianza 1 : S12
(X X ) 2
y Varianza 2: S 22
(X X ) 2
n1 n2
n1 S12 X X n2 S 22 X X
2 2
y
n1 S12 n2 S 22
S
2
y
n1 n2 2
Si se asume que las varianzas son iguales:
S2 S2 1 12 n1 n2
S12 S 22 S 2 , SD S S
n1 n2 n1 n2 n1 * n2
53
n1 n2 n1 S12 n2 S 22 n1 n2
SD S entonces: S D
n1 * n2 n1 n2 2 n1 * n2
D
el valor del estadígrafo t y los límites de confianza serían:
SD
Límites D tS D
Ejemplo 8.3
Muestra 1 Muestra 2
20 17
18 15
19 15
15 14
14 13
13 13
Promedios 16,5 14,5
Varianzas 6,92 1,92
n1S12 n2 S 22 n1 n2
SD 1,33
n1 n2 2 n1 * n2
D X1 X 2 2
= 2+/- 1,81*1,33
Límites D tS D
Límite inferior = -0.41
Límite superior = 4.41 P(0,41 4,41) 95%
Con una confiabilidad del 95% podemos concluir que la verdadera diferencia de
medias está comprendida entre –0,41 y 4,41. No existe diferencia significativa entre
los promedios de población.
54
CASO 2. MUESTRAS DEPENDIENTES
En este caso las muestras son del mismo tamaño y el procedimiento para encontrar
los límites de confianza sería el siguiente:
límites D tS D
( D ) 2
D2 n
n 1
SD
n
Ejemplo
No. X1 X2 D D2
1 70 68 2 4
2 75 73 2 4
3 83 80 3 9
4 83 84 -1 1
5 78 75 3 9
6 69 70 -1 1
7 78 72 6 36
TOTAL 14 64
El promedio D
D 14 2 D 2
D 2
64
9.14
n 7 n 7
Valor de t con n-1 grados de libertad y 98% d confiabilidad t(0.99; 6) = 3.14
( D ) 2 14 2
D2 n
64
7
n 1 6 6 2.45
SD = SD 0.92
n 7 7 2.64
H0:µ = µ0
H1: µ0 >µ0
X
t
s
n 1
56
9. DISTRIBUCION CHI CUADRADO, ( 2 )
Ejemplo 9.1
Ho: El dado está perfectamente equilibrado (los datos se ajustan a una distribusión
uniforme)
H1: El dado está cargado (los datos no se ajustan a una distribución Uniforme)
Cara 1 2 3 4 5 6
Frecuencia observada 25 17 15 23 24 16
Frecuencia esperada 20 20 20 20 20 20
( fo fe) 2
2
fe
(25 20) 2 (17 20) 2 (15 20) 2 (23 20) 2 (24 20) 2 (16 20) 2
2 50
.
20 20 20 20 20 20
Este valor se compara con el chi cuadrado crítico que se lo busca en la tabla, según
el nivel de significancia , en este caso 5%, y los grados de libertad v = (n-1)(k-1) es
decir número de columnas menos uno por número de filas menos uno. (6-1)(2-1) =5.
El valor crítico es 11.1. como 2 calculado < 2 crítico, se acepta la hipótesis nula, es
decir el dado está perfectamente equilibrado.
Ejemplo 9.2
Dos grupos A y B formados cada uno por 100 individuos padecen una enfermedad .
Se administra el suero al grupo A pero no al grupo B (que se llama grupo control o
testigo) siendo en todo lo demás los dos grupos tratados idénticamente se encuentra
los siguientes resultados.
Para aplicar la prueba chi cuadrado, es necesario construir una tabla de frecuencias
esperadas, bajo la hipótesis de que la recuperación es independiente del suero así:
(140x100)/200 = 70
(60x100)/200 = 30
Conociendo la primera frecuencia se sabe las demás, por eso esta tabla tiene un solo
grado de libertad., el valor de 2 calculado sería:
([75 70] 0,5) 2 ([65 70] 0,5) 2 ([25 70] 0,5) 2 ([35 70] 0,5) 2
2 1,93
70 70 70 70
58
9.2.CONTRASTE DE INDEPENDENCIA
59
(O e) 2
Cálculo de Chi-cuadrado 2
e
Los grados de libertad se encuentran multiplicando columnas menos uno, por filas
menos 1 asÍ: (3-1)(3-1) = 4. El chi cuadrado que separa el 1% superior con 4 grados
de libertad, según el anexo 3, es 13,3 Por lo tanto como chi cuadrado calculado es
mayor que chi cuadrado crítico. se rechaza la hipótesis nula, en consecuencia se
puede concluir que el rendimiento en el trabajo si depende de la formación
académica.
Ho : 0
H1 : 0
n=6
Nivel de significancia = 5%
r n2 0,51 4
t t 1,38
1 r2 1 0,512
60
10. ANÁLISIS DE VARIANZA
Paso 1: sumar los datos de cada grupo, elevar al cuadrado y dividir por
el número de idividuos de cada grupo. Sumar los resultados Ti2/ni
Cuadro 1
Grupo 1 Grupo 2 Grupo 3 TOTAL
79 74 81 234
83 85 65 233
62 72 79 213
51 55 106
77 77
Ti 352 231 280 863 T
Ti2 123904 53361 78400 744769 T2
ni 5 3 4 12 N
Ti2/ni 24780,8 17787 19600 62167,8 Ti2/ni
62064,08 T 2/N
Ti2/ni - T2/N = SCE = 103,72
cuadro 2
Grupo 1 Grupo 2 Grupo 3 TOTAL
6241 5476 6561 18278
6889 7225 4225 18339
3844 5184 6241 15269
2601 0 3025 5626
5929 0 0 5929
25504 17885 20052 63441 Xi2
62064,08 T2/N
Xi2 2
- T /N = SCT = 1376,92
61
6. Como: SCT = SCE + SCD Entonces,
Cuadro 3. Resultados
SCT 1376,92
Grados de libertad
V1 = 2 (numero de grupos - 1)
V2 = 9 (N -número de grupos)
Conclusión
Decisión: Acepto Ho
62
10.2. ANÁLISIS DE VARIANZA DE DOS FACTORES
MAQUINAS C1 C2 C3
Tj T j2 n= 2
10 14 18 J= 3
R1 13 16 22 93 8649 J-1 2
13 19 14 K= 3
R2 16 27 18 107 11449 K-1 2
9 11 14
R3 14 17 17 82 6724
TJ2
J
T 2
J
4470,33
J 1 nj
n* J 1441,5 1908,17 1120,67 nj= 6
DATOS AL CUADRADO
100 196 324
169 256 484
169 361 196
256 729 324
81 121 196 n , j,k
196 289 289 4736
i, j,k 1
X i2, j , k
63
n, j , k
T2
SCT = X 2ijk
i , j , k 1 N
318
j
T2 j T2
SCC =
nk N
j1
90,33
k
T 2k T 2
SCF =
k 1 nj
N
52,33
23 30 40
29 46 32
23 28 31
n, j, k j, k ( X ijk ) 2
Sce =
i, j, k 1
X 2
ijk
j, k 1
i 1
n 94
SCI = 81,33
COLUMNAS
Ho: No hay Diferencia en el rendimiento de los trabajadores
F calculado 4,32
Fcrítico(2,9) 4,26
Decisión: Si F calculado > que F crítico Rechazo Ho
Conclusión: Rechazo la Hipótesis nula
Es decir: Si existe diferencia significativa en el rendimiento de los trabajadores
65
EJERCICIOS DE PROBABILIDADES
2.- Una delegación de 4 estudiantes de un colegio se selecciona todos los años para
asistir a la Asamblea Anual de la Asociación de Estudiantes.
a) De cuántas maneras puede escogerse la delegación si hay 12 estudiantes
elegibles?.
b) De cuántas maneras si dos de los estudiantes elegibles no asisten al mismo
tiempo?.
4.- El jefe de personal de una compañía desea contratar dos agentes de ventas de
un total de 4 solicitantes .Suponga que los solicitantes varían en cuanto a sus
capacidades y habilidades , denote por 1,2,3,4 a los solicitantes donde 1 es el mejor,
2 el que sigue y así sucesivamente.
a) Defina el experimento aleatorio.
b) Cuántos puntos tiene el experimento.
c) Cual es el espacio muestral.
d) Escriba los elementos del suceso A= seleccionar los dos mejores. B=
seleccionar al menos uno de los mejores.
5.- Cuatro socios elegidos al azar deben expresar su opinión favorable o contraria a
un proyecto determinado.
a) Cuántos puntos tiene el experimento?
b) Cuales son los resultados.
c) Represente los resultados en un diagrama de árbol.
d) Escriba los resultados del suceso A= todos están a favor, B= todos están en
contra, C= por lo menos uno está a favor.
66
a) Cuántos puntos tiene el espacio muestral.
b) Cuál es el espacio.
c) Cuál es la probabilidad de que el proyecto sea aprobado.?
8.- Encuentre la probabilidad para cada uno de los sucesos de los problemas
anteriores.
10- Sean los eventos A y B con P(A) = 1/4, P(AUB) = 1/3. Hallar P(B) si:
a) Si A y B son mutuamente excluyente.
b) Hallar P(B) Si A y B son independientes
12.- Sea S = { a, b, c, d, e, f } con P(a) = 1/16, P(b) = 1/16 P(c) = 1/8, P(d) =3/16
P(e) = 1/4, P(f) = 5/16. Sean los sucesos A = { a, c, e } , B = { c, d, e, f} . Hallar:
a) P(AB)
b) P(A / B)
c) P(A U B)
d) P(A - B)
67
17.- Cuántas placas para automóvil pueden hacerse, si cada placa consta de 2 letras
diferentes seguidas de 3 dígitos diferentes?
19.- Durante una semana dada, la probabilidad de que unas acciones ordinarias
aumenten de precio (A) es 0.30. La probabilidad de que permanezcan constantes (C)
es 0.20. La probabilidad de que disminuyan de precio (D) es 0.50.
a)Los sucesos A, C, D son excluyentes?. Por qué?.
b)Cuál es la probabilidad de que esas acciones aumenten de precio o permanezcan
sin cambio?.
c)Cuál es la probabilidad de que el precio cambie durante la semana?.
20.- Un aparato electrónico consta de dos partes A y B. A partir de una serie de pruebas
previas se presuponen las siguientes probabilidades. La probabilidad de que A falle
es de 0.20; la probabilidad de que B falle solo, es 0.15 y la probabilidad de que
ambas partes fallen es 0.15. Hallar las siguientes probabilidades:
a) De que A o B fallen
b) De que falle B.
c) De que falle solamente A.
d) De que falle A si se sabe que ha fallado B.
21.- Por estudios de tránsito en una vía, se sabe que el 25% de los vehículos que
transitan son de servicio público pesado, el 30% de servicios público liviano y el 45%
de servicio particular. También se conoce que la probabilidad de accidente en cada
clase de vehículos son 0.2; 0.3 y 0.15 respectivamente. Se desea conocer: La
probabilidad de accidente en dicha vía.
22.- El 80% de los obreros que ingresan a una planta electrónica asisten a un curso de
capacitación. El 86% de ellos cumplen con la cuota de producción. Además el 35%
de los obreros que no asistieron al curso cumplen la cuota de producción.
a) Qué probabilidad existe de que un obrero cumpla con la cuota?
b) Si cumple con la cuota cuál es la probabilidad de que haya asistido al curso?
c) Cuál es la probabilidad de que no cumpla con la cuota.
d) Si no cumple con la cuota cuál es la probabilidad de que no haya asistido?
Tabla 1
68
Material Resiste ( C ) No Resiste (D ) TOTAL
TIPO (A) 70 50 120
TIPO (B) 40 40 80
TOTAL 110 90 200
24.- Sí A, B y C son eventos mutuamente excluyentes y P(A) = 0.2, P(B) = 0.3 y P(C)
= 0.2 encuentre :
P (AUBUC), P[Ac ∩ (BUC)]
28.- A partir de experiencias previas, un corredor de acciones considera que, bajo las
condiciones económicas actuales, un cliente invertirá en bonos libres de impuestos
con una probabilidad de 0.6, en fondos Mutualistas con una probabilidad de 0.3 y
tanto en bonos libres de impuestos como en fondos Mutualistas con una probabilidad
de 0.15. Encuentre la probabilidad de que el cliente invierta.
a) En bonos libres de impuestos o en fondos mutualistas.
b) Que no inviertan en bonos libres de impuestos ni en fondos mutualistas.
a) P(R/D)
b) P(Dc/R)
c) P(Rc/D)
31.- En la tabla que aparece en seguida se clasifica una muestra aleatoria de 200
adultos, de acuerdo al género y nivel de educación.
Tabla 2
34.- La policía planea hacer respetar los límites de velocidad utilizando radares en 4
ubicaciones diferentes dentro de los límites de la ciudad. Se operan radares en cada
una de las ubicaciones L1, L2, L3, L4 en 40%, 30%, 20% y 10% del tiempo, y si una
persona que rebasa los límites de velocidad en su camino al trabajo tiene
probabilidades de 0.2, 0.1, 0.5 y 0.2 respectivamente, de pasar estos lugares cual es
la probabilidad de que reciba una multa?
35.- A un sospechoso se le aplica un suero de la verdad que se sabe es confiable en
el 90% cuando la persona es culpable y en el 99% cuando es inocente. Si el
70
sospechoso se escogió de un grupo del cual solo 5% han cometido alguna vez un
crimen y el suero indica que la persona es culpable, cuál es la probabilidad de que la
persona sea inocente?
a) Cuál es el experimento.
b) Cuántos puntos tiene el espacio muestral
c) Encontrar la probabilidad de que mínimo uno de los proyectos que producen
ganancia sea escogido.
d) Encontrar la probabilidad de que máximo dos de los proyectos que no producen
ganancia fue escogido.
37.- Una empresa de servicios evalúa el funcionamiento de una podadora para sus
clientes. si el cliente encuentra muchas posibilidades de escoger puesto que hay
podadoras fáciles de podar, de dificultad mediana y de difícil operación, las hay caras
o baratas, con reparación costosa, regular o barata.
Cual es la probabilidad de que:
a) un cliente solicite una podadora de fácil operación, barata y de reparación regular.
b) Solicite un podadora de dificultad mediana en la operación.
c) Solicite un podadora barata.
Tabla 3
72
MODELOS DE PROBABILIDAD
41.- Debido a las altas tasas de interés, una firma informa que el 30% de sus cuentas
por cobrar están vencidas. Si un contador escoge aleatoriamente 5 de esas cuentas
encuentre la probabilidad de que:
a) Ninguna de las cuentas esté vencida.
b) Exactamente dos estén vencidas.
c) La mayoría de las cuentas de la muestra, estén vencidas.
42.- Se piensa elegir una junta directiva formada por un Presidente un Tesorero y un
Secretario.
a) Cuántas planchas diferentes se podrán postular si la asamblea está
compuesta por 20 miembros y todos tienen igualdad de derechos para
pertenecer a la junta ?
b) Si su candidato para presidente es la persona A, cuál es la probabilidad de
que él quede elegido en ese cargo ?
43.- Las calificaciones de una examen se distribuyen normalmente, con media 3,8 y
desviación estándar 0,3. .Qué porcentaje de estudiantes obtuvieron
calificaciones:
a) Por debajo de 4.
b) Por encima de 3,5.
c) Entre 3,5 y 4 ?
44.- La probabilidad de que un presunto cliente haga una compra es del 20%.
a)Cuál es la probabilidad de que un vendedor que visita a 10 presuntos clientes,
menos de 3 hagan una compra ?
b) Cuál sería el valor esperado y la varianza asociada a los 10 clientes ?
45.- Suponga que en una plantación de café, el 40% de las matas están infectados con
Broca. Para detectar la presencia del insecto se toma una muestra aleatoria de 100
Matas a.)Cuál sería la variable aleatoria para medir la infección. Que distribución de
probabilidad sería la adecuada. Encuentre la probabilidad de que más del 50% de
las matas examinadas tengan Broca
46.- El 10% de las semillas de cierta planta NO GERMINAN. Las semillas se empaquetan
en cajas de 10 unidades y se venden con la garantía de que por lo menos 9 de ellas
germinarán. Si un cliente compra una caja cuál es la probabilidad de que ésta cumpla
la garantía ?.
73
costo o valor que paga el cliente por adquirir la póliza, observe que si al cliente
no le ocurre accidente, este valor sería una utilidad para la Cía.
50.- Debido a las altas tasas de interés, una compañía informa que el 30% de sus
cuentas por cobrar están vencidas. Si un contador escoge aleatoriamente 5 de esas
cuentas.
e) Qué modelo de probabilidad utilizaría para encontrar las siguientes
probabilidades,.
f) Ninguna cuenta vencida.
g) Exactamente 2 vencidas.
h) La mayoría vencidas.
i) Cuál es la variable?
53.- El 40% de los empleados de una compañía tienen seguro de vida. si se toma una
muestra aleatoria de 10 empleados.
a) Cuál es la función de probabilidad para las personas aseguradas ?
b) Qué indica la variable aleatoria.
c) Cuál es la probabilidad de que todas las personas estén aseguradas ?.
d) Cuál es la probabilidad de que por lo menos una persona esté asegurada?
e) Cuál es y como se interpreta el valor esperado, y la desviación estándar
74
por cuadrícula es igual a 4. Encuentre la probabilidad de que en las próximas
mediciones se encuentre por lo menos 3 células por cuadrícula.
55.- El salario promedio de los trabajadores de una empresa es de $ 3.800 por hora
y desviación estándar de $ 250.
a) Qué % de empleados ganan menos de $ 4.000 la hora ?.
b) Si se toma una muestra de 25 empleados.
c) Cuál es la probabilidad de que el promedio sea superior a $ 3.600.
59.- Los recaudos diarios del impuesto predial se distribuyen normalmente con un
promedio de 35 millones diarios y desviación estándar 5 millones de pesos,
Encuentre la probabilidad de que un día cualquiera se recaude.
a) Más de 48.
b) Menos de 40
c) Entre 30 y 40 millones.
60.- La distribución salarial de los empleados de una empresa es normal con media
$800.000 y desviación típica $60.000.
a) Que porcentaje de empleados gana menos de $900.000.
b) Más de $ 620.000
61.- La vida útil de cierta marca de baterías es normal, con media 30 meses y
desviación estándar 6 meses. Qué porcentaje de baterías tendrán una duración.
75
a) Menor de 24 meses.
b) Entre 24 y 40 meses.
c) Superior a 40 meses.
62.- Los agentes de aduanas de los E.E.U.U. chequean los documentos de las
mercancías que entran al país para ver si cada envío se encuentra debidamente
legalizado. Los registros del departamento muestran que el 50% de los envíos tienen
su documentación correcta. Si se toma un muestra aleatoria de 8 envíos. Utilizando
el modelo Binomial encuentre la probabilidad de que por lo menos uno tenga su
documentación debidamente legalizada.
65.- Hallar el área bajo la curva normal en cada uno de los siguientes casos:
a) P(Z< K) = 0,05
b) P(Z> K) = 0,01
c) P(Z< K) = 0,95
d) P(K1<Z<K2) = 0,98
e) P(Z> K)= 0,90
76
afirma que el 70% de los residentes en la ciudad donde está la empresa A, ha
reducido su uso de energía eléctrica lo suficiente para ser tenidos en cuenta en tarifas
de descuento. Supongamos que selecciona al azar 10 usuarios.
cual es la probabilidad de que:
a) Por lo menos 7 reciban descuentos.
b) Máximo 4 reciban descuentos.
c) Todos reciban descuentos
3. Los diámetros interiores de tubos de acero producidos por una fábrica tienen
distribución normal con media 10 pulgadas y desviación estándar 0.1 pulgada. Tubos
con diámetros superiores a 10,17 e inferiores a 9,83 pulgadas se consideran de mala
calidad. Que porcentaje de la producción cumple las especificaciones de Buena
Calidad ?.
5. Cierto aparato electrónico tiene una duración media de 1500 horas y una desviación
estándar de 120 horas. Si se toma una muestra aleatoria de 36 aparatos, cuál es la
probabilidad de que el promedio a) Sea inferior a 1540 horas ? Esté entre 1480 y
1540 horas ?
77
7. La media y la desviación típica de la carga máxima soportada por 60 cables son
11.09 y 0.73 toneladas, respectivamente. Hallar los límites del 95% de confianza
para la media de todos los cables de este tipo.
10. Se desea conocer la resistencia media a la ruptura de cierta clase de material, una
muestra de 40 cables elegidos al azar revela una tensión media de ruptura igual a
2400 lbs. y una desviación típica de 150 lbs. Hallar un intervalo del 95% de confianza
para la verdadera resistencia media a la ruptura de los cables.
11. Un fabricante afirma que al menos el 20% del público prefiere su producto. Se toma
una muestra aleatoria de 100 personas para verificar su afirmación, 16 de las cuales
expresaron su preferencia por el producto. Es esta suficiente evidencia para refutar
la afirmación del fabricante a un nivel de significancia del 5%.
12. Los salarios diarios en cierta industria están distribuidos normalmente con una
media de $ 1320. Si el 9% de las medias de los salarios diarios en una muestra de
36 obreros es inferior a $ 1250. Cuál es la desviación estándar de los salarios diarios
de esa industria ?.
13. De cada una de dos poblaciones normales e independientes con iguales medias y
desviaciones 6,40 y 7,20 respectivamente se extraen muestras de 64 elementos.
Encontrar la probabilidad de que la diferencia entre las medias muestrales sea
superior a 0,60.
14. Cuarenta y seis por ciento de los sindicatos del país están en contra de comerciar
con China Continental. Cuál es la probabilidad de que una muestra de 100 sindicatos
muestre que mas del 52% tengan la misma posición?
15. Sea X la vida útil de cierta aparato electrónico, con media desconocida y desviación
típica 4000 horas. Una muestra aleatoria de 100 observaciones dio como resultado
78
una media de 30.000 horas de duración. Construir un intervalo del 95% de confianza
para la verdadera media de duración.
16. A y B fabrican dos tipos de cables que tienen resistencia media a la rotura de 4500
y 4000 libras con desviaciones 200 y 300 libras respectivamente. Si se comprueban
50 cables de A y 100 de B. Cuál es la probabilidad de que la media de resistencia a
la rotura de A sea al menos 600 libras mas que B ?
17. Un fabricante de autos sostiene que sus autos consumen en promedio 5,5 galones
cada 100 kilómetros. Un vendedor de la compañía comprueba el consumo de
gasolina de 35 autos y encuentra que el consumo medio de este grupo es de 5.65
galones por cada 100 Kms. Si la desviación estándar del consumo es 0.35 galones
es cierta la afirmación del fabricante a un nivel de significancia del 1 % ?.
19. Las lámparas que fabrica cierta empresa tienen una vida media de 800 horas y una
desviación estándar de 60 h. Hallar la probabilidad de que en una muestra aleatoria
de 406 lámparas, la vida media a) esté entre 790 y 810 horas, b) sea superior a 820
horas
20. Una muestra de 200 artículos producidos por una máquina debe tener como
especificaciones un diámetro medio de 3.6 cms. Si la desviación estándar es de
0.21 cms. Plantear una regla de decisión del 5% de significancia para determinar
a partir de que valores la máquina no cumple con las especificaciones. Sugerencia
Ho: = 3.6 cms. cumple las especificaciones.
21. El número de horas de duración de una pila del tipo para transistores tiene
distribución normal, con media 100 horas y desviación 20 horas. Qué proporción
de pilas durarán entre 100 y 120 horas. Si se toma muestras de 36 pilas qué
porcentaje de muestras tendrán promedio entre 97 y 105 horas ?
22. Se sabe que cierta marca de Computadores tiene el 65% del mercado. Si se toma
dos muestras de 200 usuarios cada una. Cuál es la probabilidad de que la
79
diferencia entre la primera y la segunda muestra sea superior al 10% en las
preferencias de los usuarios de esa clase de computadores.
27. Contrastar la hipótesis de que la variabilidad de las compras anuales de los dos tipo
de clientes son iguales frente a la alternativa de que no son iguales a un nivel de
significancia del 5%.
80
31. La proporción de audiencia de TV que ve cierto programa el sábado en la noche fue
del 50% según se ha encontrado previamente, se cree que la proporción ha bajado,
para comprobarlo se tomó una muestra de 100 televidentes y se encontró que el 45
veían el programa. Si el nivel de significancia del 1% es de concluir que la
proporción ha bajado efectivamente ?.
Muestra1 (A): 20 18 19 15 14 13
Muestra 2 (B): 17 15 15 14 13 13
33. La siguiente tabla indica el número de artículos producidos por tres máquinas. El
jefe de control de calidad afirma que todas están funcionando correctamente si
el porcentaje de defectuosos esperado, es igual al 15% en cada una de las
máquinas. (Ho)
Calcular las frecuencias esperadas bajo la hipótesis del jefe, y comprobar con un
nivel de significancia del 5% si las máquinas están operando correctamente
35. Una empresa de la construcción proporciona a sus empleados guantes para que
desarrollen adecuadamente sus funciones. En estas condiciones se recomienda
un nuevo tipo de guantes de mayor duración pero que evidentemente serán mas
caros. La empresa comprará los nuevos guantes si su vida media es
significativamente superior a 120 días de lo contrario seguirá usando los actuales.
La empresa toma una muestra de 36 pares de guantes encontrando un promedio
81
de 125 días si la desviación estándar de 18 días y el nivel de significancia del 1%
Cuál será la decisión de la empresa ? Ho: µ = 120 dias
38. Las siguientes son las cifras de ventas (X) que 12 vendedores reportaron a su
empresa:
X: 10 12 13 15 20 24 22 25 20 24 25 23
39. El director de una empresa quiere averiguar si existe alguna relación entre la
participación de los empleados en los programas de la empresa y el estrato según
el área residencial con =5%
Planta A B C D E F
82
Antes del programa 40 64 42 70 58 30
Después del programa 37 58 40 65 52 29
41. La siguiente tabla muestra la relación existente entre las notas de estudiantes en
Matemáticas y Estadística. Contrastar la hipótesis de que los resultados son
independientes a un nivel de significancia del 5%.
46. Se desea estimar el salario promedio () de todos los empleados público del
municipio. Para tal fin se toma una muestra de 200 empleados y se encuentra
que el promedio es $ 280.000 y la desviación estándar $ 30.000. Encuentre un
intervalo de 95% de confiabilidad para el verdadero promedio. Cuál sería el
margen de error ?
48. Probar la hipótesis Ho; El número de fallas mecánicas de una planta se aproxima
a la distribución de Poisson con media 2,5 ; n = 40 y nivel de significancia del
1%.
Número de fo
accidentes
1,45 -- 1.75 6
1,75 -- 2,05 12
2,05 -- 2,35 14
2,35 – 2,65 9
2,65 – 2,95 8
2,95 -- 325 7
TOTAL 56
Anexo.
PRUEBA DE HIPOTESIS PARA µ
PLANTEAMIENTO DATOS
PROCESO
Z critico 1 Z1 -2,58
Z critico 2 Z2 2,58
x
Error estandar del promedio n 0,08
x
Z
Z calculado n 1,80
k1 0 Z1
Punto crítico 1 n 3,39
k 2 0 Z 2
Punto crítico 2 n 3,81
Si k1 x1 k2 , acepto Ho Acepto Ho
85