Está en la página 1de 85

INTRODUCCION

La teoría de la probabilidad tuvo sus comienzos a principio del siglo XVII como
resultado de investigaciones sobre los juegos de azar.

La definición de probabilidad se produjo debido al deseo del ser humano por conocer
con certeza los eventos que sucederán en el futuro, es por eso que a través de la
historia se han desarrollado diferentes enfoques para tener un concepto de la
probabilidad y determinar sus valores.

El diccionario de la Real Academia Española (R.A.E) define «azar» como una


casualidad, un caso fortuito, y afirma que la expresión «al azar» significa «sin orden».
La idea de probabilidad está íntimamente ligada a la idea de azar y nos ayuda a
comprender nuestras posibilidades de ganar un juego de azar o analizar las
encuestas. Laplace afirmó: "Es notable que una ciencia que comenzó con
consideraciones sobre juegos de azar haya llegado a ser el objeto más importante del
conocimiento humano". Comprender y estudiar el azar es indispensable, porque la
probabilidad es un soporte necesario para tomar decisiones en cualquier ámbito.

Laplace (1774) hizo el primer intento para deducir una regla para la combinación de
observaciones a partir de los principios de la teoría de las probabilidades. Durante el
siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, el
cálculo de probabilidades tuvo un notable desarrollo sobre la base de la definición de
probabilidad. Destacan en 1713 el teorema de Bernoulli y la distribución binomial,

A principios del siglo XX el matemático ruso Andrei Kolmogorov la definió de


forma axiomática y estableció las bases para la moderna teoría de la
probabilidad.

La importancia de la probabilidad ha crecido enormemente en los últimos años


y en la actualidad junto con la Estadística se aplica en todos los campos de la
ciencias como la física, la química, la biología, la medicina, la sicología, las
ciencias políticas, la economía, la educación, los negocios y en todas las
ramas de la ingeniería.
TEORIA DE CONJUNTOS.

Algunas ideas, propiedades y operaciones de conjuntos son muy importantes


y necesarios para comprender y aplicar los conceptos y leyes de probabilidad..
Un conjunto es una lista o colección bien definida de objetos, llamados
elementos, puntos o resultados.

A∩B, AUB, A-B, B-A y A ∆ B.

El desarrollo histórico de la teoría de conjuntos se atribuye a Georg Cantor, siglo


XIX, La pertenencia de un elemento a a un conjunto A se indica como a ∈ A.

B es un subconjunto de A, y se indica como B ⊆ A.

Ejemplo. N  Z  Q  R  C

Álgebra de conjuntos

UNION

A  B = { x/x  A ó x  B }

INTERSECCION

A  B = { x/x  A y x  B }

2
CONJUNTO VACIO

A  B= { }

A  B=

CONJUNTOS AJENOS, EXCLUYENTES, O DISYUNTOS

Sí la intersección de dos conjuntos es igual al conjunto vacío, entonces a estos


conjuntos les llamaremos conjuntos ajenos, es decir:

Si A  B =  entonces A y B son ajenos.

COMPLEMENTO

A'= { x  U/x y x  A }

DIFERENCIA

A - B={ x/x  A y X  B }

B – A = ={ x/x  B y X  A }

DIFERENCIA SIMÉTRICA

A ∆ B =(A – B) U (B – A) = (AUB) - (A∩B)

3
Conjuntos. Operaciones conjuntos

Propiedades de las operaciones con conjuntos. Anexo

Pr Propiedad: Unión intersección


AsAsociativa (A B) C=A (B C) (A B) C=A (B C)
C Conmutativa A B=B A A B=B A
Id Idempotente A A=A A A =A

A (B C) = (A B) A (B C) = (A B)
Di Distributiva
(B A) (A C)
N Neutralidad A Ø=A A U=A
A U=U A Ø=Ø
C Complementación A Al = U A Al = Ø
Le de De Morgan (A B) l = A l Bl (A B) l = A l Bl

Además se cumple: (A l) l = A A - B = A Bl

PRODUCTO CARTESIANO

Definición. Sean A y B conjuntos. Al conjunto formado por todos los


pares ordenados de primera componente en A y segunda
componente en B, se le denota A x B y se le llama producto
cartesiano de A y B. Simbólicamente:

4
A x B = {(x, y) / x ∈ A ∧ y ∈ B}.

En consecuencia:

(x, y) ∈ A x B ⇔ x ∈ A ∧ y ∈ B

(x, y) ∉ A x B ⇔ x ∉ A ∨ y ∉ B

Ejemplo

Sean A = {1, 2} y B = {3, 4, 5} el producto cartesiano A x B será:

A x B = {(1, 3),(1, 4),(1, 5),(2, 3),(2, 4),(2, 5)}.

5
NTRODUCCIÓN ALCÁLCULOS DE PROBABILIDADES

TÉCNICAS DE CONTAR

Permiten determinar el número de elementos de un conjunto o el número de resultados


posibles de un experimento sin necesidad de acudir a la enumeración directa.

1.1. PRINCIPIO FUNDAMENTAL

Sean los eventos: 𝐸1, 𝐸2, 𝐸3 …..

Si 𝐸1 , puede ocurrir de 𝑛1 maneras diferentes,

𝐸2 , puede ocurrir de 𝑛2 maneras diferentes,

𝐸3 , puede ocurrir de 𝑛3 maneras diferentes,

y así sucesivamente, entonces el número de maneras en que pueden ocurrir todos los
eventos viene dado por: 𝑛1 ∗ 𝑛2 ∗ 𝑛3 ….

Ejemplo.

Cuántas placas para automóvil puede hacerse, si cada placa consta de 3 letras y de
3 dígitos?

26x26x26x10x10x10 = 17.576.000 placas diferentes.

1.2. PERMUTACIONES

Una ordenación de los n elementos de un conjunto en un orden dado, es una


permutación.

Número de permutaciones de n elementos tomados todos a la vez

nPn  n!

6
Ejemplo

De cuántas maneras pude ordenarse en un estante 8 libros diferentes

8P8= 8! = 40.320

Número de permutaciones de tamaño r  n

n Pr  n(n  1)(n  2)...(n  r  1) o también


𝑃(𝑛,𝑟)= 𝑛∗ (𝑛 − 1)∗ (𝑛 − 2) … .∗ (𝑛 − 𝑟 + 1)

n!
n Pr 
(n  r )!

Ejemplo

30P3 = 30x29x28 =24.360 maneras diferentes

Si en una competencia participan 30 atletas, de cuántas manera se puede entregar las


medalla de oro, plata y bronce ?

1.3. PERMUTACIONES CON REPETICION

El número de permutaciones de los n elementos de un conjunto, en el cual 𝑛1 son


iguales, 𝑛2 son iguales,.... 𝑛𝑟 son iguales viene dado por:

n!
P * ( n,n ) 
n1!n2 !....nr !
Ejemplo

Si en un proceso de elección estudiantil, el tarjetón tiene tres opciones. Candidato A,


candidato B y voto en blanco y son 10 alumnos los autorizados a votar De cuantas

7
maneras se puede presentar el resultado 5 votos por el candidato A, 3 por el B y 2 en
blanco ?

10!
,10)   2.520
*
P(10 posibilidades
5!*3!*2!

1.4. PRUEBAS ORDENADAS

Cuando escogemos un elemento de un conjunto, uno tras otro, r veces, llamamos a esta
escogencia una prueba ordenada de tamaño r.

a) Si la escogencia se hace con sustitución tendremos.


n * n * n * ...n  n r pruebas ordenadas con sustitución.

Ejemplo

Diez personas van a votar a favor o en contra de un proyecto, cuántos resultados existen
?

2 x2 x2......x2  210  1024 resultados posibles

b) Si la escogencia se hace sin sustitución, el número de pruebas ordenadas de tamaño


r es igual a n Pr

1.5 COMBINACIONES

Una combinación de tamaño r es un subconjunto de r elementos.


El número de combinaciones se encuentra dividiendo el número de permutaciones entre
r!

n P(n, r )
C (n, r ) 
n!
   C (n, r ) 
r r! (n  r )!*r!

Ejemplo

Si en un curso hay 50 alumnos cuantos grupos de 4 es posible formar ?

8
50!
C (50,4)   230.300 grupos diferentes.
(50  4)!*4!

1.6 ESPACIO MUESTRAL

El espacio muestral S, es el conjunto de todos los resultados posibles de un


experimento.

El conjunto puede ser finito, infinito contable o continuo.

Un elemento de este conjunto se llama Punto muestral.

Un subconjunto del espacio es un suceso o evento.

El número de subconjuntos o partes de S es igual a 2n

El conjunto vacío , se llama suceso imposible

El conjunto S, se llama suceso seguro o cierto.

Podemos realizar todas las operaciones de conjuntos para generar nuevos sucesos.

En probabilidades se dice que ocurre un suceso A, si el resultado del experimento


pertenece al conjunto A.

Ocurre el suceso A, si x  A.

Ocurre al menos uno de los sucesos A, B si x  (AUB)

Ocurren ambos sucesos si x  (A∩B)

Si A∩B =  entonces A y B son excluyentes.

Ocurre solamente A, si x  (A – B)

Ocurre solamente uno de los sucesos si x  {(AUB ) - (A∩B)}

No ocurre A, si x  Ac

No ocurre ninguno de los dos sucesos, si x  (AUB)c

No ocurren los dos sucesos simultáneamente si x  (A∩B)c


9
1.7 ALGEBRA DE CONJUNTOS

Una clase no vacía de conjuntos se llama álgebra si es cerrada bajo la unión y la


complementación.

& es álgebra si:

i) & es diferente de vacío


ii) Para todo A,B  & , (AUB)  &
iii) Para todo A  & , Ac  &

1.8 PROBABILIDAD

1.8.1 PROBABILIDAD CLÁSICA O APRIORI

Si un experimento tiene n resultados mutuamente excluyentes e igualmente probables,


y si r de ellos poseen una característica A entonces la probabilidad de A se anota y se
encuentra así:
Es decir número de elementos de A sobre número de elementos de S.

r #A
P( A)  
n #S

Ejemplo

Si en un curso de Estadística hay 30 estudiantes de los cuales 10 son mujeres, Cuantos


grupos de 5 alumnos se puede formar, encontrar la probabilidad de que el grupo este
conformado por 2 hombres y 3 mujeres

Total de grupos 30C5 = 142.506


Sea el suceso A: grupos de 2 hombres y 3 mujeres, entonces el número de elementos
de A es 20C2*10C3= 190*120 = 22.800

r 22.800
Así que P( A)    0,16  16%
n 142.506

10
1.8.2. PROBABILIDAD FRECUENCIAL O APOSTERIORI.

La probabilidad de un suceso A se basa en la experimentación y se encuentra dividiendo


el número de veces que se presenta A (frecuencia) entre el número de veces que se
realiza el experimento.

f frecuencia
P( A)  
n total.casos

Ejemplo

Se dese encontrar la probabilidad de que un estudiante de la universidad de Nariño


pague menos de un salario mínimo por concepto de matrícula. Para lo cual se tomó una
muestra de 300 estudiantes de y se encontró que 120 de ellos pagan menos de un
salario mínimo (A)

f 120
Así que P( A)    0,4  40%
n 300

1.8.3 PROBABILIDAD SUBJETIVA.

Las probabilidades de los sucesos pueden ser arbitrarias y dependen del grado de
conocimiento que tenga un sujeto acerca de una determinada situación.

1.8.4 DEFINICIÓN AXIOMÁTICA DE PROBABILIDAD

Sea S un espacio muestral de un experimento E, y sea una -álgebra de sucesos. P


se llama función de probabilidad de & sobre el intervalo [0,1], si cumple los siguientes
axiomas:

i) Para todo suceso A, 0  P(A)  1

ii) P(S) = 1

iii) P(AB) = P(A) + P(B) si A, B son excluyentes

iv) Si A1 A2,.. Son sucesos excluyentes entonces:

P(A1 A2.....) = P(A1) + P(A2) + ....

11
1.8.5 LEYES DE PROBABILIDAD

1) P() = 0

2) P(Ac) = 1 - P(A) probabilidad de que no ocurra A

3) P(AUB) = P(A) + P(B) - P(A∩B) probabilidad de que ocurra alguno de los sucesos

4) P(A-B) = P(A) - P(AB) probabilidad de que ocurra solamente A

Consecuencias

P(A∩Bc ) = P(A-B)

P(A ∆ B) = P[(AU B) - (A∩B)] = P(AU B) - P(A∩B) probabilidad de ocurra solo uno


de los dos sucesos

P(Ac U Bc ) = P[(A∩B)c] = 1 - P(A∩B) probabilidad de que no ocurra ninguno

P(Ac ∩ Bc) = P[(AUB)c ] = 1 - P(AUB) probabilidad de que no ocurran los dos al tiempo

1.8.6 ESPACIOS FINITOS DE PROBABILIDAD

Sea S un espacio muestral finito así: S = {a1 a2, a3,.....an}, obtenemos un espacio de
probabilidad si a cada punto ai, le asignamos un número real pi llamado probabilidad,
entonces:
pi  0 y
p1 + p2+...+pn = 1

La probabilidad de un suceso A, se obtiene sumando las probabilidades de todos


sus puntos.

Si todos los pi son iguales obtenemos un espacio finito equiprobable.

Ejemplo

Al lanzar un dado se obtiene 6 resultados posibles y la probabilidad de cada punto es


1/6.

12
Si el suceso A indica obtener un número mayor que 3, la P(A)= ½

13
2. PROBABILIDAD CONDICIONAL

Sea A un suceso arbitrario de un espacio muestral S, con P(A) >0, y sea B otro suceso
del mismo S. La probabilidad de que ocurra B una vez haya sucedido A, se llama
probabilidad condicional de B dado A, se denota así: P(B/A), y se define

P( A  B)
P (B / A) 
P( A)

De aquí se desprende la ley del producto:

P(A∩B) = P(A).P(B/A)

Cuando la ocurrencia del suceso A no afecta la ocurrencia de B se llaman sucesos


INDEPENDIENTES, en este caso,

P(A∩B) = P(A).P(B)

Ejemplo

2.1 PROCESOS ESTOCÁSTICOS FINITOS

Una sucesión finita de experimentos, en los cuales cada uno tiene un número finito de
resultados con probabilidades conocidas se llama una proceso estocástico finito y se
representa por medio de un diagrama de árbol. La ley del producto se puede aplicar para
encontrar la probabilidad en cualquiera de las ramas.

2.2 PROBABILIDAD TOTAL

Sean los sucesos A1, A2,...An tales que formen una partición del espacio muestral S;
esto es que los eventos son mutuamente excluyentes y su unión es S. Entonces:

B= (A1UA2U......UAn)∩B

Como U(Ai∩B)= B entonces,

P(B) = ∑P(Ai∩B)

y por la ley del producto,

P(B)  P( A1 ) P(B / A1 )  P( A2 ) P(B / A2 ).... P( An ) P(B / An )

14
P(B)= P( Ai ). P(B / Ai )

2.3 PROBABILIDAD DE BAYES

Dadas las condiciones de la probabilidad total se trata de encontrar la P(Ai/B)

P( Ai  B)
P( Ai /B) =
P(B)

P( Ai ) * P( B / Ai )
P( Ai /B) =
P(B)

Ejemplo

Por estudios de tránsito en una vía, se sabe que el 25% de los vehículos que transitan
son de servicio público pesado, el 30% de servicios público liviano y el 45% de servicio
particular. También se conoce que la probabilidad de accidente en cada clase de
vehículos son 0.2; 0.3 y 0.15 respectivamente. Se desea conocer:
a ) La probabilidad de accidente en dicha vía.
b ) Si hubo accidente cual es la probabilidad de que el vehículo accidentado sea de
servicio particular

A1 =Vehículos de servicio público pesado P(A1)= 0.25

A2 = Servicio público liviano P(A2)= 0.30

A3 = servicio particular P(A3)= 0.45

Sea B = accidente

P(B/ A1) =0.2 P(B/ A2) =0.3 P(B/ A3) =0.15

a)
P(B)= P( Ai ). P(B / Ai ) = 0.25*0.2+0.30*0.3+0.45*0.15 = 0.2075

P( A3) * P( B / A3 ) 0.45 * 0.15


b) P( A3 /B) =   0.32
P(B) 0.2075
15
MARGINAL CONDICIONAL CONJUNTA
TIPO DE VEHICULOS TIPO P(Ai) P(B/Ai) P(Ai∩B)
Servicio público pesado A1 0,25 0,2 5%
Servicio público liviano A2 0,30 0,3 9%
servicio particular A3 0,45 0,15 6,75%
PROBABILIDAD TOTAL 20,75%

TIPO DE VEHICULOS TOTAL


TIPO P(Ai∩B) P(Ai∩Bc)
Servicio Público pesado 0,05 0,20
A1 0,25 P(A1)
Servicio público liviano 0,09 0,21
A2 0,30 P(A2)
Servicio particular 0,0675 0,38
A3 0,45 P(A3)
PROBABILIDAD TOTAL 0,2075 0,7925 1,00
P(B) P(BC)

P(B/A1) B

A1
P(Bc /A1) BC
P(A1)
P(B/A2) B
P(A2) A2
P(Bc /A2) BC
P(A3)
P(B/A3)
A3 B

P(Bc /A3)
BC

16
17
3. VARIABLES ALEATORIAS

Una v.a. X de un espacio muestral S, es un función que transforma los resultados de un


experimento en números reales. Las variables aleatorias se clasifican en Discretas y
Continuas.

3.1 VARIABLES ALEATORIAS DISCRETAS.

Una v.a. X de un espacio muestral S, es Discreta si su con conjunto imagen es finito o


infinito contable así:

X (S )  {x1 , x2 ,.... xn }}
X (S )  {x1 , x2 ,....................}

3.2 ESPACIO DE PROBABILIDAD

Obtenemos un espacio de probabilidad (Discreto) si a cada punto xi, le asignamos una


probabilidad f(xi)= P(X=xi)
tal que:

f(xi)0 y f(xi) = 1

En este caso f se llama función de probabilidad o de cuantía y generalmente se expresa


en forma de tabla.
_________________________________________
xi x1 x2 .... xn Σ
_________________________________________
f(xi ) f( x1 ) f(x2 ) .... f( xn ) 1
_________________________________________

3.3 FUNCION ACUMULATIVA O DE DISTRIBUCIÓN

La Función acumulativa F(x) está definida así:

F(a) = P(Xa) =  f(x),


xa.

3.4 MEDIA VARIANZA Y DESVIACION ESTANDAR

El valor esperado, promedio, o media de una v.a. se denota por E(X) = 


y se calcula de la siguiente forma:E(X) =  = xf(x)
18
La varianza se define como el promedio de los cuadrados de las desviaciones
(diferencias) con respecto al promedio.

Varianza(X) = Var(X) = V(X) = ²

² = (X-)²f(x)

que desarrollando el cuadrado se obtiene:

² = x²f(x) - [xf(x)]² = E(X²) - [E(X)]²

La desviación típica o estándar se define como la raíz cuadrada no negativa de la


varianza.
  Var (x )

Ejemplo

10 personas votarán a favor o en contra de un proyecto. Encontrar el


número de resultados posibles de la variable aleatoria X= votos a favor,
la probabilidad de cada uno de los puntos, el valor esperado, la
varianza y la desviación estándar.
Variable aleatoria X= # de votos a favor {O,1,2,3,4,5,6,7,8,9,10}
Casos favorables: se encuentran aplicando combinaciones 10Cx
Casos posibles: 210 = 1024

X 10Cx f(x) xf(x) (x-µ)2f(x)


0 1 0,00098 0,00000 0,02441
1 10 0,00977 0,00977 0,15625
2 45 0,04395 0,08789 0,39551
3 120 0,11719 0,35156 0,46875
4 210 0,20508 0,82031 0,20508
5 252 0,24609 1,23047 0,00000
6 210 0,20508 1,23047 0,20508
7 120 0,11719 0,82031 0,46875
8 45 0,04395 0,35156 0,39551
9 10 0,00977 0,08789 0,15625
10 1 0,00098 0,00977 0,02441
1024 1,00000 5 2,5
E(X) Var(X)

19
El número de resultados posibles es 210 =1.024

El valor esperado E(x)=µ= 5 votos a favor

La varianza 2,5 y la desviación estándar 1,58 aproximar a 2


En conclusión, se espera 5 votos a favor, pero como la desviación estándar es 2, los
votos a favor estarán entre 3 y 7. Y la probabilidad de que esto ocurra es: 89,07%

f(X)
30.00%
24.61%
25.00%
20.51% 20.51%
20.00%

15.00%
11.72% 11.72%
10.00%
4.39% 4.39%
5.00%
0.10% 0.98% 0.98% 0.10%
0.00%
0 1 2 3 4 5 6 7 8 9 10

3.5 VARIABLES ALEATORIAS CONTINUAS

Una v.a. X de un espacio muestral S, es Continua si su con conjunto imagen X(S) es


continuo.

X(S)= {x  R / - < X < + }

3.6 ESPACIO DE PROBABILIDAD

Obtenemos un espacio de probabilidad (Continuo) si a cada punto x, le asignamos un #


real f(x) tal que:

20
f(x)  0 , y  f ( x)dx  1
En este caso f se llama función de probabilidad o de densidad más no representa la
probabilidad.

3.7 FUNCIÓN ACUMULATIVA

La Función acumulativa F(x) está definida así:

x
F (x )  P ( X  x )   f (t )dt


Las probabilidades ahora se calculan como áreas bajo la curva f(x) en un intervalo
(a,b), entonces,
b
P (a  x  b)   f (x )dx  F (b)  F (a )
a

3.8 MEDIA VARIANZA Y DESVIACION ESTANDAR

El valor esperado, promedio, o media de una v.a.c. se denota por E(X) = m


y se calcula de la siguiente forma:

E ( X )     xf (x )dx

La varianza se define como el promedio de los cuadrados de las desviaciones


(diferencias) con respecto al promedio.

Varianza(X) = Var(X) = V(X) = ²

VAR(( X )   (x   )2 f (x)dx

que desarrollando el cuadrado se obtiene:

Var ( X )   x 2 f (x)dx  [ xf (x)dx]2  E (x 2 )  [E (x)]2

La desviación típica o estándar se define como la raíz cuadrada no negativa de la


varianza.
  Var (x )
21
4. MODELOS DE PROBABILIDAD

4.1 MODELOS DISCRETOS

a. Bernoulli
b. Binomial
c. Poissón
d. Geométrico
e. Hipergeométrico
f. Multinomial

4.1.1 MODELO O PRUEBA DE BERNOULLI

Todo experimento que tenga dos resultados exhaustivos y excluyentes es una prueba
de Bernoulli.

A uno de los resultados se le llama éxito y al otro fracaso, la variable aleatoria asigna el
valor 1 al éxito y 0 al fracaso y las probabilidades correspondientes son p y q.

A  Éxito  1  p
B  Fracaso  0  q

Como la suma de probabilidades es 1 entonces q = 1-p

La media de la variable de Bernoulli es: p


La varianza es: pq
y la desviación estándar pq

4.1.2 MODELO BINOMIAL

El modelo binomial se aplica cuando se presentan las siguientes condiciones:


a) Una prueba de Bernoulli se repite n veces (Muestra)
b) Las pruebas son independientes (p constante)
c) La v.a. X indica el número de éxitos en la muestra.

Entonces:

n!
f ( x)  p x q ( n x )
x!(n  x)!
22
donde x: 0, 1, 2, 3,...n

Usted puede comprobar que:

f(x) = 1

E(X) = np

Var(X) = npq

Función acumulativa

n!
F(a)=  p x q n-x
x  a x!(n - x)!

Ejemplo

Debido a las altas tasas de interés, una compañía informa que el 30% de sus cuentas
por cobrar están vencidas. Si un contador escoge aleatoriamente 5 de esas cuentas.
a) Ninguna cuenta vencida.
b) Exactamente 2 vencidas.

n!
f ( x)  p x q ( n x )
x!(n  x)!

5!
f ( x)  0.3 x 0.7 (5 x )
x!(5  x)!

5!
f (0)  0.30 0.7 (50)  0
0!(5  0)!

5!
f (2)  0.32 0.7 (52)  0.3087
2!(5  2)!

23
4.1.3 MODELO DE POISSON

Un modelo de Poissón se aplica cuando en un modelo binomial n es muy grande y p


muy pequeño.

Es decir,

e 
- x
n! x n-x
Lim p p =
n p 0
x!(n - x)! x!

Entonces

e   x
f (x ) 
x!

donde, X: 0, 1, 2,......

La media  = np
La varianza V(x) = npq = np(1-p) = np =  , porque p  0

Este modelo también se aplica cuando se observa un fenómeno en una unidad de


tiempo o espacio, siendo m el promedio de éxitos en esa unidad.

Ejemplo

El promedio de clientes que llegan a la ventanilla de un banco es 3 por minuto.


Encuentre la probabilidad de que en el próximo minuto lleguen 4 clientes.

e   x e 3 3 x e 3 34
f (x )  → f ( x)  → f (4)   0.1680
x! x! 4!

4.1.4 MODELO HIPERGEOMÉTRICO

Para aplicar un modelo Hipergeométrico el problema debe cumplir las siguientes


condiciones:

a) Una prueba de Bernoulli que se repita n veces


b) Las pruebas son Dependientes (p es variable)

24
c) La v.a. X indica el número de éxitos en la muestra

Para analizar la dependencia o independencia de las pruebas se debe tener en cuenta


tanto el tamaño de la población y el tipo de muestra seleccionada así:

Si la población es muy grande o infinita no importa que la muestra se haya tomado con
o sin sustitución, en ambos casos las pruebas son independientes.

Si la Población es finita y pequeña y la muestra se toma con sustitución se mantiene la


independencia y sólo en el caso de que la muestra sea sin sustitución las pruebas son
dependientes.

La función de probabilidad hipergeométrica viene dada por la siguiente expresión:

 N 1  N 2 
  
f ( x)   N 
X n X

 
 
n

Donde:

N1 = Total de éxitos en la población


N2 = Total de fracasos en la población
N = N1 + N2
n = Tamaño de la muestra
x = número de éxitos en la muestra
n-x = número de fracasos en la muestra

La media de x,

N1
E( X )  n
N

 N1  N 2   N  n 
Var( x)  n   
 N   N   N  1 

25
Ejemplo

Un curso de matemáticas está conformado por 10 hombres y 8 mujeres, si se toma una


muestra al alzar de 5 estudiantes encuentre la probabilidad de que la muestra contenga
3 hombres y 2 mujeres.

Sea la variable x = al número de hombres en la muestra, entonces

 N 1  N 2   10  8   10  8 
        
f ( x)   N  f ( x)   18  f (3)   18   0.3921
X n X X 5 X 3 53

     
     
n 5 5

4.1.5 MODELO GEOMÉTRICO

Un problema se ajusta al modelo geométrico cuando:


a) Existe una prueba de Bernoulli que se repite n veces
b) Las pruebas son independientes (p constante)
c) La v.a. X indica el número de pruebas que se realizan hasta lograr el objetivo.

En este caso X: 1, 2, 3, .....

y la función de probabilidad

f ( x)  pq x 1

La media de X, E(X) = 1/p

y la varianza Var(X) = q/p²

Ejemplo

Un vendedor vista a 10 presuntos clientes, si la probabilidad de hagan una compra es


del 80% . cuál es la probabilidad de que el objetivo se logre con el tercer cliente?

Sea X el número de de clientes visitados, entonces

f ( x)  pq x 1 → f ( x)  0.8 * 0.2 x 1 → f (3)  0.8 * 0.2 31  0.032

26
4.1.6 MODELO MULTINOMIAL

Si en una prueba hay mas de 2 resultados ya no se puede hablar de éxito y fracaso sino
que debemos designar por Xi al número de veces que se repite cada uno de ellos en la
muestra de tamaño n.

x1: el número de veces que aparece el primer resultado


x2: " " " " " segundo "
x3: " " " " " tercero "
......
xn: " " " " " n-ésimo "

k
Cada Xi: 0, 1, 2,....n, además x1
i n

La función de probabilidad multinomial se expresa así:

n!
P(X 1 = a1 , X 2 = a 2 ,...X k = a k ) = P1a1 P2a 2 .....PKak
a1 !.a2 !...ak !

La media para cada variable Xi

E(Xi) = npi

Var(Xi) = npiqi

Ejemplo

En una empresa de la ciudad los empleados se clasifican según su grado de


preparación, el 40% son profesionales, el 35% son bachilleres y el 25 % restante tienen
solamente educación primaria. Si se toma una muestra de 12 empleados, cuál es la
probabilidad de que en la muestra haya 5 profesionales, 4 bachilleres y 3 de primaria.

n!
P(X 1 = a1 , X 2 = a 2 ,...X k = a k ) = P1a1 P2a 2 .....PKak
a1 !.a2 !...ak !

27
12!
P(X 1 = 5, X 2 = 4, X k = 3 ) = 0.40 5 * 0.35 4 * 0.25 3  0.000
5!.4!3!

4.2 MODELOS CONTINUOS

a. Normal
b. Gamma
c. Exponencial
d. Chi-cuadrado

4.2.1 DISTRIBUCIÓN NORMAL

Una variable aleatoria X de distribución normal puede tomar cualquier valor entre
-  y +.

La función de probabilidad o función de densidad planteada por GAUSS es la siguiente:

1 x 2
1  ( )
f ( x)  e 2 

 2

Donde como ya se dijo antes:


-  < x < +.
 y  , son la media y la desviación estándar de la variable X, respectivamente.

Si graficamos esta función obtenemos una curva en forma de campana es por eso que
comúnmente se la conoce como la campana de Gauss.

28
Como la curva es simétrica alrededor de X = , y el área total es 1 se puede afirmar
que:


P( X   )   f (x )dx  0,5
0

0
P( X   )   f (x )dx  0,5

Observe que si cambia la media m la curva se desplaza en el eje X, y si cambia la
desviación estándar s, la curva se concentra o se dispersa de la media.

Como según los valores de s y m existirían infinidad de curvas normales se ha hecho


una transformación lineal para estandarizar la distribución en una sola curva de media 0
y desviación estándar 1.

La variable que transforma a X se llama variable estandarizada o tipificada Z

x
z

y la función estandarizada es

29
1
1 2 z2
 ( z)  e
2

donde E(Z) = 0 y Var(Z) = 1

1. Existen muchos fenómenos en la naturaleza que se distribuyen normalmente.

2. Es una excelente aproximación de distribuciones discretas como la binomial y


Poissón, cuando se cumplen ciertas condiciones.

3. Algunas distribuciones muestrales (cuando las muestras son grandes) se pueden


trabajar con la Normal.

1.- Cuando una variable X, es normal, para calcular probabilidades es necesario


conocer la media  y la desviación estándar . Para luego estandarizar la variable
mediante la fórmula :
x
Z

Una vez encontrado z, las probabilidades (áreas) se buscan en la tabla normal.

2.- Para pasar un modelo Binomial a normal, en primer lugar se corrige la variable
discreta X a continua, aumentando o restando 0,5 según el caso, enseguida se
encuentra la media  = np y la desviación estándar   npq , luego se calcula z
con la fórmula
( x  0,5)  np
z , y busca las probabilidades en la tabla normal estandarizada.
npq

3.- Las distribuciones muestrales para la media, la proporción, la diferencia de medias


y proporciones, también se distribuyen normalmente cuando las muestras son
grandes.

30
5.DISTRIBUCIONES MUESTRALES

5.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA. x

La media de una muestra de tamaño n, (para n  30), tomada de una población


normal con media , y desviación estándar , se distribuye normalmente con media
, y desviación  x   de tal manera que:
n

x
z

n

5.2 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN DE ÉXITOS p

La proporción de éxitos en una muestra, p para muestras grandes n  100, se


pq
distribuye normalmente con media  y desviación estándar  p 
n
p p
así que: z 
pq
n
5.3 DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE MEDIAS D

Si tomamos dos muestras de dos poblaciones (o de la misma población), con


promedios y varianzas conocidas, la distribución muestral de la diferencia de medias
también se distribuye normalmente.

población 1 población 2
media = 1 media = 2
Varianza =  12 Varianza =  2
2

Muestra 1 = n1 muestra 2 = n2

Promedio muestra 1 = X1 promedio muestra 2 = X 2


Diferencia de medias muestrales D  X1  X 2

Diferencia de medias poblacionales     2

31
 12  22
Desviación estándar de la diferencia D  
n1 n2

D 
La variable z en este caso toma la forma: z 
D

5.4 DISTRIBUCIÓN DE DIFERENCIA DE PROPORCIONES

Si tomamos dos muestras de dos poblaciones (o de la misma población) encontramos


la proporción de éxitos en cada muestra dividiendo el # de éxitos entre el tamaño de
la muestra así:

x1 x2
p1  y p2 
n1 n2

La distribución muestral de diferencia de proporciones (p) se distribuye normalmente


con media  = 1 - 2 y desviación estándar :

p1 q1 p 2 q 2
 p  
n1 n2

( p1  p 2 )  ( p1  p 2 )
z
 p

5.5 APLICACIONES DE LA DISTRIBUCIÓN NORMAL.

1. Calcular probabilidades
2. Estimación por intervalos
3. Contraste de hipótesis.

1.- Para calcular un probabilidad solamente se encuentra z con la fórmula


correspondiente y se busca los valores en la tabla.

Distribución muestral de medias

Una empresa eléctrica, fabrica baterías que tienen una duración que se
distribuye normalmente con media de 800 horas y desviación estándar de 40
32
horas. Calcular la probabilidad de que en una muestra aleatoria de 16 baterías,
tenga una vida promedio de menos de 775 horas.

Datos:

x  775
µ=800
n=16
40
𝜎𝑥̅ = 𝜎/√𝑛 = = 10
√16

𝑥̅ − µ
Z=
𝜎𝑥̅

0 Calcular probabilidad de que en


P (𝑥̅ <775) =?

una mue

𝑥̅ − µ 775 − 800
Z = = = -2.5
𝜎𝑥̅ 10

P (Z<-2,5)= 0,0062
33
La probabilidad de que en una muestra aleatoria de 16 baterías, tenga una
vida promedio de menos de 775 horas es de 0,62%

Ejemplo

La probabilidad de que un trabajador ascienda de cargo es del 60%. Si en una


empresa hay 40 trabajadores, encontrar la probabilidad de que la proporción de la
muestra de personas que ascienden de cargo sea mayor del 65%.

P = 0.60 Probabilidad de que asciendan


n = 40 trabajadores
𝑃(𝑃̅ > 65%) =?

𝑃̅ − 𝑃
𝑍=
𝑝∗𝑞

𝑛

0.65 − 0.60
𝑍=
√0.60 ∗ 0.40
40

0.05
𝑍= = 0.71
0.07

34
.

𝑃 (𝑃̅ > 65%) = 1 − 𝑃 (𝑍 < 0.71)

𝑃 (𝑃̅ > 65%) = 1 − 0.7611

𝑃 (𝑃̅ > 65%) = 0.2389 = 23,68%


La probabilidad de que el porcentaje de la muestra sea superior al 65% es 0,2389 o
23,89%

35
6.ESTIMACIÓN DE PARÁMETROS.

La estimación de un parámetro puede ser puntual, basta calcular el estadígrafo en la


muestra y ese resultado se toma como estimación del parámetro. Pero con este
sistema no es posible detectar el margen de error de la estimación ni la precisión ni
el grado de confiabilidad, en cambio si hacemos una estimación por intervalos,
buscando un límite inferior y otro superior dentro de los cuales estér incluido el
parámetro podremos medir la precisión, el margen de error y la confiabilidad.

Un estadígrafo se considera un buen estimador del parámetro si cumple las


siguientes condiciones:

a) INSESGABILIDAD Un estadígrafo ˆ es insesgado si su valor esperado es


igual al parámetro E (ˆ)  

b) CONSISTENCIA O PRECISIÓN: Un estadígrafo es consistente si:


P( ˆ    e)  1 Cuando n tiende a infinito

c) EFICIENCIA: si existen dos estadígrafos para estimar un parámetro es mas


eficientes aquel que tenga menor varianza.

d) SUFICIENCIA: Un estadígrafo es suficiente de un parámetro si para calcularlo


se agota toda la información de la muestra,

Los estadígrafos estudiados en la sección anterior como promedio aritmético,


proporción de éxitos, diferencia de promedios y diferencia de proporciones cumplen
con estas características.

6.1 Estimación por intervalos para la media.

Los límites de confianza para la media poblacional se obtienen así:

PROMEDIO DE MUESTRA  Z(DESVIACIONES DEL PROMEDIO)


Límites de confianza = X  z Si la población es infinita.
n
   
La probabilidad P X  Z   X Z   1  
 n n
se conoce con el nombre de grado de confianza y cuando este valor es:

36
1- = 90% , Z = 1,65
1- = 95% , Z = 1,96
1- = 98% , Z = 2,33
1- = 99% , Z = 2,58

El valor : Z (/n) se conoce como el margen de error

E = Z (/n) de donde se puede despejar el tamaño de la muestra n,

Z 2 2
n Para poblaciones infinitas
E2

Z ( N  n)
E Para poblaciones finitas de tamaño N.
n ( N  1)
El último radical se conoce como FCPF
factor de corrección para poblaciones finitas
y despejando el tamaño de la muestra n,

Z 2 2 N
n Para poblaciones finitas de tamaño N.
( N  1) E 2  Z 2 2

Ejemplo

Estimación de parámetros para la media

El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes


sigue una ley normal con media desconocida y desviación típica 0,5 minutos.
Para una muestra aleatoria de 25 clientes se obtuvo un tiempo medio de 5,2
minutos.

Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que
se tarda en cobrar a los clientes.

Datos:

𝑋̅ = 5,2 minutos
𝜎 = 0,5 minutos
n = 25 clientes
1 − 𝛼 = 95%
𝛼 = 5%
37
𝜎
𝐸=𝑍∗
√𝑛
0,5
𝐸 = 1,96 ∗
√25

𝐸 = 0,196

𝜎
𝐿𝑠 = 𝑋̅ + 𝑍 ∗
√𝑛
0,5
𝐿𝑠 = 5,2 + 1,96 ∗ = 5,396
√25

𝜎
𝐿𝑖 = 𝑋̅ − 𝑍 ∗
√𝑛
0,5
𝐿𝑖 = 5,2 − 1,96 ∗ = 5,004
√25

P (5,004 < μ < 5,396) = 95%

Con un 95% de confiabilidad se puede afirmar que el tiempo medio que se


tarda en cobrar a los clientes se encuentra entre 5.004 y 5.396 minutos,

38
6.2 Estimación por intervalos para la proporción.

Los límites de confianza para la proporción de la población se obtienen así:

PROPORCIÓN MUESTRAL  Z(DESVIACIONES DE LA PROPORCIÓN)

pq
Límites de confianza = P  z
n

 pq pq 
La probabilidad: P P  z PPz   1
 n n 

1-: Se conoce con el nombre de grado de confianza y cuando este valor es:

1- = 90% , Z =1,65


1- = 95% , Z = 1,96
1- = 98% , Z = 2,33
1- = 99% , Z = 2,58

pq
El valor : z , se conoce como el margen de error
n

pq
Ez , de donde se puede despejar el tamaño de la muestra n,
n

Z 2 pq
n Para poblaciones infinitas
E2

pq ( N  n)
EZ Para poblaciones finitas de tamaño N.
n ( N  1)
El último radical se conoce como FCPF
factor de corrección para poblaciones finitas
y despejando el tamaño de la muestra n,

Z 2 pqN
n Para poblaciones finitas de tamaño N
( N  1) E 2  Z 2 pq

Ejemplo
39
El director de la empresa Colácteos toma una muestra de 100 productos, de los
cuales 30 cumplen con los estándares requeridos para su venta. Estimar el verdadero
porcentaje de todos los productos que cumplen con los estándares, con una
confiabilidad del 99%.

Datos:

n= 100 productos, 30 cumplen con los estándares

𝑥 30
𝑃̅ = = = 0.30 = 30%
𝑛 100

1 − 𝛼 = 99%

𝑝̅ ∗𝑞̅ 0.30∗0.70
Error estándar √ =√ = 0,04
𝑛 100

𝑝̅ ∗𝑞̅
Margen de error 𝐸 = 𝑍 ∗ √ = 2.58 * 0.04 = 0.103
𝑛

𝐿𝐼 = 𝑃̅ − 𝐸 = 0.30 − 0.103 = 0.197

𝐿𝑠 = 𝑃̅ + 𝐸 = 0.30 + 0.103 = 0.403

𝑃(19,7% < 𝑃 < 40,3%) = 99%

El verdadero porcentaje de productos que cumplen con los estándares requeridos


para su venta está entre el 19,7% y el 40,3% con una probabilidad del 99%.

40
6.3 Límites de confianza para la diferencia de medias.

D  X1  X 2

 12  22
D  
n1 n2

Límites de confianza = D  Z D

  1 2  22  1 2  22 

P Dz    D  z   1
 n1 n2 n1 n2 
 

Ejemplo

Suponga que se someten dos clases de estudiantes a idéntico examen. La primera


clase está formada por 30 estudiantes del colegio 1, con promedio 85 y varianza 240
y la segunda por 40 estudiantes del colegio 2 con promedio 80 y varianza 340. a)
encuentre los límites de 95 % de confianza para la verdadera diferencia de promedios.

D  X1  X 2 D  85  80  5

 12  22 240 340
D   D    4.06
n1 n2 30 40

Límites de confianza = D  Z D = 5  1.96 * 4.06 = 5  7.95


Li = -2.95 Ls = 12.95 P(2.95    12.95)  95%

La verdadera diferencia de promedios está comprendida entre -2.95 y 12.95


Es decir no existe diferencia significativa entre los promedios de los dos colegios

6.4 Límites de confianza para la diferencia de proporciones

X1 X2
p1  y p2 
n1 n2

p  p1  p2

41
p1 q1 p 2 q 2
 p  
n1 n2

Como el valor de p1 y p2 son desconocidos se utiliza las proporciones de la


muestra.
p1 q1 p 2 q 2
Límites de confianza = ( p1 p 2 )  z 
n1 n2

Ejemplo

Se desea conocer con un intervalo de confianza del 98 %, la verdadera diferencia de


porcentajes de alumnos que aprueban la materia de Estadística según género. Si
de 30 hombres aprobaron 25 y de 20 mujeres aprobaron 15

X1 25 X2 15
p1  p1   0.83 , p2  p2   0.75
n1 30 n2 20

p  p1  p2 p  0.83  0.75  0.08

p1 q1 p 2 q 2 0.83 * 0.17 0.75 * 0.25


 p    p    0.12
n1 n2 30 20

p1 q1 p 2 q 2
Límites de confianza = ( p1 p 2 )  z 
n1 n2

 pq pq pq pq 
P p1 p2 )  z 1 1  2 2  P  p1 p2 )  z 1 1  2 2   1

 n1 n2 n1 n2 

Límites de confianza = 0.08  2.33 * 0.12  0.08  0.28

Li = -0.2 Ls = 0.36 P(0,2  P  0,369)  0,98

Esto es la verdadera diferencia de proporciones está entre -0.2 y 0.36


Cuando el límite inferior es negativo, se puede concluir que no existe diferencia
significativa entre los porcentajes poblacionales.

42
7.PRUEBAS DE HIPÓTESIS.

Las hipótesis son supuestos que el investigador hace acerca de los parámetros. Para
resolver un problema y tomar una decisión adecuada es conveniente seguir este
procedimiento:

a) Plantear las hipótesis. La primera se denomina hipótesis nula y se la representa


por Ho, en esta hipótesis se considera que el valor del parámetro es igual a una
determina cantidad. La segunda se llama hipótesis alterna o de trabajo y debe
contradecir a la primera; afirmando que el parámetro no es igual, es mayor o es
menor que el valor dado en la hipótesis nula. Por ejemplo si éstas se refieren a la
media de la población se pueden presentar tres casos:

Ho: µ = µo Ho: µ = µo Ho: µ = µo


H1: µ > µo H1: µ < µo H1: µ  µo

Unilateral Derecho Unilateral izquierdo Bilateral.

b) Escoger el nivel de significancia  = probabilidad de rechazar la Ho, cuando es


verdadera (Error tipo I) generalmente este valor se escoge entre 1% y 5%. Cuando
se trabaja con el 5% y se rechaza la hipótesis nula se dice que los resultados son
significativos y si el nivel es del 1% son altamente significativos. Al ubicar el valor
de significancia en la curva quedan definidas las regiones de Aceptación y de
Rechazo de la Ho.

c) Determinar la distribución de probabilidades adecuada, puede ser normal, student,


chi cuadrado, F (Fisher), según el caso. Cuando las muestras son grandes se
utiliza la distribución normal.

d) Representar gráficamente la situación, si la prueba es unilateral derecha el valor


de  se ubica en el extremo derecho de la curva.

Acepto Ho
Rechazo Ho

43
e) Calcular el estadígrafo de prueba Z, aplicando la fórmula de la distribución muestral
correspondiente.

f) Comparar Z calculado con Z crítico. Si el contraste es unilateral derecho se plantea


la siguiente regla de decisión: Rechazar Ho, cuando Z calculado > Z crítico. O si
p-value (probabilidad calculada) es menor que el Nivel de Significancia .

Ejemplo

Prueba de hipótesis para la media

Un fabricante de autos sostiene que sus autos consumen en promedio 55.5 galones
cada 1000 km. Un vendedor de la compañía comprueba el consumo de gasolina de
60 autos y encuentra que el consumo medio de este grupo es de 55.65 galones por
cada 100 km. Si la desviación estándar del consumo es 70 galones es cierta la
afirmación del fabricante a un nivel de significancia del 1%?

Ho: µ = 55.5 galones


H1: µ > 55.5 galones
α = 1%
n= 60
𝑥̅ = 55.65
σ = 70

Fórmula de k (punto crítico)


𝜎
k= µ0 + z
√𝑛
44
Remplazamos los datos en la fórmula
70
K= 55.5 + 2.33 * = 76.5
√60

Si 𝑥̅ > k, se rechaza la Ho
Si 𝑥̅ < k, se acepta la Ho

Como 𝑥̅ es igual a 55.65 y éste es menor que k = 76.5, entonces se acepta la


hipótesis nula. El fabricante tiene la razón.

Potencia de la prueba

La potencia de una prueba estadística o el poder estadístico es la probabilidad de que


la hipótesis nula sea rechazada cuando ésta es falsa (es decir, la probabilidad de no
cometer un error del tipo II). La potencia es en general una función de las
distribuciones posibles, a menudo determinada por un parámetro, bajo la hipótesis
alternativa. A medida que aumenta la potencia, las posibilidades de que se presente
un error del tipo II disminuyen. La probabilidad de que ocurra un error de tipo II se
conoce como la tasa de falsos negativos (β) que es la probabilidad de aceptar la Ho
cuando ésta es falsa. Por lo tanto la potencia es igual a 1 - β, que también se conoce
como la sensibilidad.

Con el anterior problema y basándonos en la gráfica del mismo vamos a encontrar


las medias para los valores de 80, 85, 90 y 95

𝑘−µ1
Z= 𝜎
√𝑛

Ahora reemplazamos en la formula, tomando las diferentes medias ( 80, 85, 90 y 95)

76.5−80 −3.5
z= 70 = = - 0.51
6.76
√60
Se busca en la tabla el valor - 0.51, y obtenemos un resultado de 0,3050.

Entonces:

β = P( 𝑥̅ < 76.5 / µ1 = 80) = p (z < -0.51) = 0.3050

76.5−85 −8.5
z= 70 = 6.76
= - 1.25
√60
Se busca en la tabla el valor -1.25, y obtenemos un resultado de 0. 1056

45
Entonces:

β = P( 𝑥̅ < 76.5 / µ1 = 85) = p (z < -1.25) = 0.1056

76.5−90 −13.5
z= 70 = 6.76
= - 1.99
√60

Se busca en la tabla el valor -1.99, y obtenemos un resultado de 0,0233

Entonces:

β = P( 𝑥̅ < 76.5 / µ1 = 90) = p (z < -1.99) =0,0233

β
0.6
0.5
0.4
0.3
0.2
0.1
0
µ1 = 76.5 µ1 = 80 µ1 = 85 µ1 = 90 µ1 = 95

1-β
1.5
1 0.8944 0.9767 0.9967
0.695
0.5 0.5
0
µ1 = 76.5 µ1 = 80 µ1 = 85 µ1 = 90 µ1 = 95

46
47
De acuerdo con la anterior grafica podemos observar que la potencia(1- β) va
aumentando y β (error tipo II) va disminuyendo, es decir, disminuye la probabilidad
de aceptar la Ho cuando ésta es falsa.

Ejemplo.

Una compañía que comercializa un programa de adiestramiento basado en la


motivación, asegura que las tasas de rendimiento de los trabajadores se eleva
después de realizar el curso. Para probar esta aseveración, la compañía está
considerando la posibilidad de comprar el programa, hace un muestreo aleatorio de
80 empleados de otra corporación que hace poco lo puso en práctica. La tasa
promedio por trabajador era de 75. Los resultado del muestreo fueron:
Tasa promedio X  77 , desviación estándar   13 , tamaño de muestra n = 80

Ho: µ = 75 El curso no aumenta el rendimiento


H1: µ > 75 El curso aumenta el rendimiento

Nivel de significancia  = 5%

Acepto Ho
Rechazo Ho

Z crítico =1.64

X  77  75
Calculamos Z, Z Z = 1,38
 13
n 80

Como Z calculado es menor que Z crítico., se Acepta Ho. No existe evidencia para
concluir que el curso aumenta el rendimiento.

Prueba de hipótesis para proporción de éxitos.

El director de servicios profesionales de la universidad de Nariño, informa que el 40%


de sus egresados se insertan en el mercado laboral en puestos que guardan relación
48
directa con su campo de estudio. Para comprobarlo los directivos tomaron una
muestra de 356 estudiantes en los cuales se implementaron políticas de
fortalecimiento en emprendimiento y empresa ismo, donde se encontró una mejora
del 48%. Comprobar si las políticas tomadas mejoraron la aceptación en el mercado
laboral, con un nivel de significancia del 5%.

Datos

n = 356
P = 40%
𝑃̅ = 48%
𝛼 = 5%

𝐻0 : 𝑃 = 40%
𝐻1 : 𝑃 > 40%

𝑆𝑖 𝑃̅ ≤ 𝐾 → 𝐴𝑐𝑒𝑝𝑡𝑎𝑟 𝐻0
𝑆𝑖 𝑃̅ > 𝐾 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0

𝑝∗𝑞
𝐾 = 𝑃+𝑍∗√
𝑛
0,40 ∗ 0,60
𝐾 = 0.40 + 1,64 ∗ √
356
𝐾 = 0; 40 + 1,64 ∗ (0,02)

𝐾 = 0,40 + 0,012
49
𝐾 = 0,412

𝐾 = 41,2%

𝐶𝑜𝑚𝑜 𝑃̅ = 48% > 𝐾 = 41,2% , 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0

50
8. DISTRIBUCIÓN T DE STUDENT

La distribución normal se utilizó para hacer inferencias sobre muestras grandes en


distribución muestral de medias y de diferencia de medias, tanto para estimación por
intervalos como para prueba de hipótesis.

Cuando las muestras son pequeñas (n≤30) y la desviación estándar de la población


(σ) desconocida se utiliza la distribución t de student.

Haciendo una comparación entre el estadígrafo z y el estadígrafo t, podríamos

X  X 
observar lo siguiente: Z t
 s
n n 1

La diferencia está en el denominador cuando se aplica la distribución normal


utilizamos el valor de (σ), que corresponde a la desviación estándar de la población y
cuando se aplica la distribución t de student utilizamos (s), que representa la
desviación estándar de una muestra de tamaño n. El valor n-1 = v indica el número
de grados de libertad de la distribución.

Para la solución de problemas en lugar de utilizar la distribución normal se utilizaría


la distribución t, teniendo en cuenta el valor de α, y los grados de libertad (v)
encontrando el valor t(1- α,v). Por ejemplo: si una muestra es de tamaño 20 (n=20), y
el área (1-α) a la izquierda es de 95%, entonces t es 1.73.

8.1 ESTIMACIÓN POR INTERVALOS PARA LA MEDIA DE POBLACIÓN

Para encontrar los límites de confianza, es necesario tomar una muestra de tamaño
n, definir el grado de confiabilidad igual 1- α, calcular el promedio y la desviación
estándar de la muestra. Los límites se encuentran de manera similar a la distribución
normal.

Ejemplo 8.1

Supongamos que en una muestra de 10 personas medimos la variable edad y


obtenemos los siguientes resultados:

X (edad): 10 12 18 18 15 20 21 14 13 20

51
El promedio es 16.1 y la desviación estándar 3.62. Para buscar el valor de t en la
tabla ubicamos en v=9 y si el área a la izquierda es 0.975 buscamos t 0.975 y el valor
correspondiente a t es 2.26.

0,975

2,26

De igual manera que se trabajó con la distribución normal es necesario definir un


grado de confiabilidad, tomar una muestra pequeña y calcular el promedio aritmético
y la desviación estándar y así se puede calcular los límites de confianza de la siguiente
manera:

8.2. LIMITES DE CONFIANZA PARA LA MEDIA DE LA POBLACIÓN.

s
LIMITES DE CONFIANZA = X  t para poblaciones infinitas y,
n 1

para poblaciones finitas.

s N n
X t
n 1 N 1

Ejemplo.

Encontrar los límites del 95% de confiabilidad para los datos anteriores
El valor de t para 9 grados de libertad y con un área a la izquierda de 0.975 es 2.26,
el promedio de los datos es 16.1 y la desviación 3.62; entonces los límites de
confianza serían:
3.62
Límites  16.1  2.26 * = 16.1±2.73
9
Límite inferior = 16.1- 2.73 = 13.37
Límite superior = 16.1+2.73 = 18.83 P(13,37    18,83)  95%

Es decir que con un 95% de confiabilidad se puede concluir que la media de la


población está comprendida entre 13,37 y 18,83 años de edad.
52
8.3 LIMITES DE CONFIANZA PARA DIFERENCIA DE MEDIAS POBLACIONALES.

Para encontrar los límites de la diferencia es necesario tener en cuenta si las muestras
son dependientes o independientes.

CASO 1. MUESTRAS INDEPENDIENTES

El estadígrafo t de manera similar al valor de z en la distribución normal se puede


calcular de esta manera :

( X 1  X 2 )  ( 11   2 )
t
S12 S 22

n1 n2

y los límites de confianza para la diferencia de medias seerían:

S12 S 22
(X1  X 2 )  t 
n1 n2

Para obtener un mejor aproximación de la varianza muestral es posible agrupar los


datos de las dos muestras como si fueran una sola, teniendo en cuenta qque:

Varianza 1 : S12 
(X  X ) 2

y Varianza 2: S 22 
(X  X ) 2

n1 n2

n1 S12   X  X  n2 S 22   X  X 
2 2
y

La varianza por agrupación quedaría expresada de la siguiente manera:

n1 S12  n2 S 22
S 
2
y
n1  n2  2
Si se asume que las varianzas son iguales:

S2 S2 1 12 n1  n2
S12  S 22  S 2 , SD    S   S
n1 n2 n1 n2 n1 * n2

53
n1  n2 n1 S12  n2 S 22 n1  n2
SD  S entonces: S D 
n1 * n2 n1  n2  2 n1 * n2

D 
el valor del estadígrafo t  y los límites de confianza serían:
SD
Límites  D  tS D

Ejemplo 8.3

Se desea estimar la diferencia en la productividad de los empleados de dos fábricas.


Para tal fin se toma dos muestras de 6 empleados de cada fábrica y se mide su
productividad así:

Muestra 1 Empresa (A): 20 18 19 15 14 13


Muestra 2 Empresa (B): 17 15 15 14 13 13

Muestra 1 Muestra 2
20 17
18 15
19 15
15 14
14 13
13 13
Promedios 16,5 14,5
Varianzas 6,92 1,92

n1S12  n2 S 22 n1  n2
SD   1,33
n1  n2  2 n1 * n2
D  X1  X 2  2

t(v=10, 0.95)= 1,81

= 2+/- 1,81*1,33
Límites  D  tS D
Límite inferior = -0.41
Límite superior = 4.41 P(0,41    4,41)  95%

Con una confiabilidad del 95% podemos concluir que la verdadera diferencia de
medias está comprendida entre –0,41 y 4,41. No existe diferencia significativa entre
los promedios de población.
54
CASO 2. MUESTRAS DEPENDIENTES

En este caso las muestras son del mismo tamaño y el procedimiento para encontrar
los límites de confianza sería el siguiente:

límites  D  tS D

Donde el error estándar de la diferencia de medias sería:

( D ) 2
 D2  n
n 1
SD 
n

Ejemplo

Si se toma 2 muestras dependientes de 7 datos, encontrar los límites del 98% d


confianza para la verdadera diferencia de medias.

No. X1 X2 D D2
1 70 68 2 4
2 75 73 2 4
3 83 80 3 9
4 83 84 -1 1
5 78 75 3 9
6 69 70 -1 1
7 78 72 6 36
TOTAL 14 64

El promedio D
 D  14  2 D 2

D 2


64
 9.14
n 7 n 7
Valor de t con n-1 grados de libertad y 98% d confiabilidad t(0.99; 6) = 3.14
( D ) 2 14 2
 D2  n
64 
7
n 1 6 6 2.45
SD  = SD     0.92
n 7 7 2.64

Límites  D  t D = 2±3.14*0.92 = 2±2.88

Límite inferior = 2 – 2.88 = -0.88


Límite superior = 2 + 2.88 = 4.88 P(0,88    4,88)  98%
55
Entonces La verdadera diferencia de medias con un 98% de confiabilidad se
encuentra entre estos valores.

8.3 PRUEBA DE HIPÓTESIS PARA LA MEDIA DE POBLACIÓN

En toda prueba se necesita plantear dos hipótesis, hipótesis nula e hipótesis


alternativa o de trabajo, teniendo en cuenta que el contraste puede ser unilateral
derecho, unilateral izquierdo o bilateral.

CASO 1. CONTRASTE UNILATERAL DERECHO

H0:µ = µ0
H1: µ0 >µ0

Si el nivel de significancia se fija en 5% en la tabla de la distribución t, debemos buscar


el punto crítico utilizando el valor de α y los grados de libertad.

Con los datos de la muestra obtenemos el promedio aritmético y la desviación


estándar, en seguida calculamos el estadígrafo de prueba t, utilizando la fórmula:

X 
t
s
n 1

Decisión: Si t calculado es mayor que t crítico, rechazo la hipótesis nula y en caso


contrario Acepto Ho.

56
9. DISTRIBUCION CHI CUADRADO, ( 2 )

La prueba chi- cuadrado puede ser empleada para:


a. Determinar de qué forma algunas distribuciones de frecuencia (obtenidas con
datos muestrales), se ajustan a distribuciones teóricas de probabilidad como la
binomial, poisson, normal etc.

Las Hipótesis en este caso serían:

Ho: Los datos observados se ajustan a cierta distribución


H1: Los datos no se ajustan a tal distribución

Ejemplo 9.1

La siguiente tabla muestra las frecuencias observadas y esperadas al lanzar un dado


120 veces. Comprobar la hipótesis de que el dado está perfectamente equilibrado al
nivel de significancia del 5%.

Ho: El dado está perfectamente equilibrado (los datos se ajustan a una distribusión
uniforme)
H1: El dado está cargado (los datos no se ajustan a una distribución Uniforme)

Cara 1 2 3 4 5 6
Frecuencia observada 25 17 15 23 24 16
Frecuencia esperada 20 20 20 20 20 20

Solución: El valor de Chi cuadrado calculado es:

( fo  fe) 2
2  
fe
(25  20) 2 (17  20) 2 (15  20) 2 (23  20) 2 (24  20) 2 (16  20) 2
2        50
.
20 20 20 20 20 20

Este valor se compara con el chi cuadrado crítico que se lo busca en la tabla, según
el nivel de significancia , en este caso 5%, y los grados de libertad v = (n-1)(k-1) es
decir número de columnas menos uno por número de filas menos uno. (6-1)(2-1) =5.
El valor crítico es 11.1. como 2 calculado < 2 crítico, se acepta la hipótesis nula, es
decir el dado está perfectamente equilibrado.

b. La prueba chi cuadrado sirve para determinar si dos variables categóricas se


relacionan entre si:
Ho: Las variables en filas y columnas son independientes
57
H1: Las variables en filas y columnas son dependientes

Cuando se presenta una tabla de 2x2, es necesario hacer la corrección de Yates.

Ejemplo 9.2

Dos grupos A y B formados cada uno por 100 individuos padecen una enfermedad .
Se administra el suero al grupo A pero no al grupo B (que se llama grupo control o
testigo) siendo en todo lo demás los dos grupos tratados idénticamente se encuentra
los siguientes resultados.

GRUPO Se recuperan No se recup. TOTAL


A (utiliza el suero) 75 25 100
B (no lo utiliza) 65 35 100
TOTAL 140 60 200

Para aplicar la prueba chi cuadrado, es necesario construir una tabla de frecuencias
esperadas, bajo la hipótesis de que la recuperación es independiente del suero así:

GRUPO Se recuperan No se recup. TOTAL


A (utiliza el suero) 70 30 100
B (no lo utiliza) 70 30 100
TOTAL 140 60 200

(140x100)/200 = 70
(60x100)/200 = 30

Conociendo la primera frecuencia se sabe las demás, por eso esta tabla tiene un solo
grado de libertad., el valor de 2 calculado sería:

(75  70) 2 (65  70) 2 (25  70) 2 (35  70) 2


 
2
    2 ,38
70 70 70 70

Pero, con la corrección de Yates para tablas 2x2

([75  70]  0,5) 2 ([65  70]  0,5) 2 ([25  70]  0,5) 2 ([35  70]  0,5) 2
2      1,93
70 70 70 70

El valor de 2 crítico con un 5% de significancia y 1 grado de libertad es 3,84

En ambos casos el 2 calculado es < 2 crítico, por lo tanto NO SE DEBE RECHAZAR


la hipótesis nula, es decir los resultados no son significativos o el suero no fue efectivo.

58
9.2.CONTRASTE DE INDEPENDENCIA

La prueba chi cuadrado, también se utiliza para comprobar si existe o no asociación


significante entre dos variables cualitativas, o dicho de otro manera si existe alguna
relación entre dos variables.

Se desea averiguar si hay alguna asociación significante entre la formación


académica y el rendimiento laboral para un grupo de 200 empleados. El nivel de
formación académica se clasifica en tres clases, primaria, secundaria y universitaria
y el rendimiento académico se clasifica en excelente, bueno y regular. Los resultados
de la investigación se presentan en la siguiente tabla

Ho: El rendimiento es independiente de la preparación académica

Tabla de frecuencias observadas:

PRIMARIA SECUNDARIA UNIVERSITARIA TOTAL


Excelente 10 40 10 60
Bueno 30 30 20 80
Regular 10 30 20 60
TOTAL 50 100 50 200

Tabla de frecuencias esperadas

PRIMARIA SECUNDARIA UNIVERSITARIA TOTAL


Excelente 15 30 15 60
Bueno 20 40 20 80
Regular 15 30 15 60
TOTAL 50 100 50 200

1.667 3.333 1.667


5.000 2.500 0.000
1.667 0.000 1.667
0.000 0.000 0.000
8.333 5.833 3.333  2  17,.5

59
(O  e) 2
Cálculo de Chi-cuadrado 2  
e

Los grados de libertad se encuentran multiplicando columnas menos uno, por filas
menos 1 asÍ: (3-1)(3-1) = 4. El chi cuadrado que separa el 1% superior con 4 grados
de libertad, según el anexo 3, es 13,3 Por lo tanto como chi cuadrado calculado es
mayor que chi cuadrado crítico. se rechaza la hipótesis nula, en consecuencia se
puede concluir que el rendimiento en el trabajo si depende de la formación
académica.

PRUEBA DE HIPOTESIS PARA COEFICIENTE DE REGRESION LINEAL

Ho :   0
H1 :   0
n=6

Nivel de significancia = 5%

Coeficiente de correlación r = 0,51

r n2 0,51 4
t t  1,38
1 r2 1  0,512

t(0,05, v=4)= 2,13

Como t calculado= 1,38 < t crítico= 2,13 Se ACEPTA Ho.


Por lo tanto el coeficiente de correlación es 0.

60
10. ANÁLISIS DE VARIANZA

10.1. ANÁLISIS DE VARIANZA DE UN SOLO FACTOR

Se utiliza para comparar 3 o mas grupos y verificar si existe diferencia


significativa entre ellos.
Ho : 1   2   3

Paso 1: sumar los datos de cada grupo, elevar al cuadrado y dividir por
el número de idividuos de cada grupo. Sumar los resultados  Ti2/ni

Paso 2: sumar totales, elevar el resultado al cuadrado y dividir por N T2/N


Paso 3: paso1 - paso2= SCE

Cuadro 1
Grupo 1 Grupo 2 Grupo 3 TOTAL
79 74 81 234
83 85 65 233
62 72 79 213
51 55 106
77 77
Ti 352 231 280 863 T
Ti2 123904 53361 78400 744769 T2
ni 5 3 4 12 N
Ti2/ni 24780,8 17787 19600 62167,8  Ti2/ni
62064,08 T 2/N
 Ti2/ni - T2/N = SCE = 103,72

4.- Encuentre Los cuadrados de todos los datos y súmelos. Xi2


5.- Reste T2/N y así obtiene SUMA DE CUADRADOS TOTAL ( SCT )

cuadro 2
Grupo 1 Grupo 2 Grupo 3 TOTAL
6241 5476 6561 18278
6889 7225 4225 18339
3844 5184 6241 15269
2601 0 3025 5626
5929 0 0 5929
25504 17885 20052 63441 Xi2
62064,08 T2/N
Xi2 2
- T /N = SCT = 1376,92

61
6. Como: SCT = SCE + SCD Entonces,

SCD = SCT – SCE


SCD = 1376,92 103,72 1273,2

Cuadro 3. Resultados

fuente de sumas de grados media cociente F p value


variación cuadrados de cuadràtica
libertad
SCE 103,72 2 51,8583333 0,37 0,05159
SCD 1273,20 9 141,47

SCT 1376,92

Grados de libertad
V1 = 2 (numero de grupos - 1)

V2 = 9 (N -número de grupos)

Conclusión

Nivel de significancia α= 0,05


F calculado 0,37
F crítico con v1, v2 g.del y significancia α = 4,26
Si Fcalculado < F crítico se Acepta la Hipótesis nula, de lo contrario se rechaza Ho.
Si α < que p value Acepto Ho.

Decisión: Acepto Ho

Conclusión: No existe diferencia significativa entre grupos

62
10.2. ANÁLISIS DE VARIANZA DE DOS FACTORES

Se trata de averiguar si existe alguna interacción entre Filas y columnas


y si existe diferencia significativa entre columnas y entre filas

En el ejemplo vamos a averiguar si existe interacción entre trabajadores y máquinas


y si existe diferencia en el rendimiento de los trabajadores, y entre la máquinas

Filas (J) 3 Máquinas


Columnas (k) 3 Trabajadores
TRABAJADORES N= 18

MAQUINAS C1 C2 C3
Tj T j2 n= 2
10 14 18 J= 3
R1 13 16 22 93 8649 J-1 2
13 19 14 K= 3
R2 16 27 18 107 11449 K-1 2
9 11 14
R3 14 17 17 82 6724

Tk 75 104 103 282 T 4418


2
T
2 
T k 5625 10816 10609
N
k
Tk2
T 2 937,50 1802,67 1768,17 4508,33
 nk
k 1 nk= 6
k
n * k

TJ2
J
T 2
J
4470,33

J 1 nj
n* J 1441,5 1908,17 1120,67 nj= 6

DATOS AL CUADRADO
100 196 324
169 256 484
169 361 196
256 729 324
81 121 196 n , j,k
196 289 289 4736 
i, j,k 1
X i2, j , k

63
n, j , k
T2
SCT =  X 2ijk 
i , j , k 1 N
318

j
T2 j T2
SCC =
 nk  N
j1
90,33

k
T 2k T 2
SCF =

k 1 nj

N
52,33

Suma de datos de cada grupo

23 30 40
29 46 32
23 28 31

264,5 450 800 n


420,5 1058 512 j, k (  X ijk ) 2
264,5 392 480,5 4642 
j, k 1
i 1

n, j, k j, k (  X ijk ) 2
Sce = 
i, j, k 1
X 2
ijk  
j, k 1
i 1

n 94

SCT= SCC+ SCF+SCe +SCI Despejando SCI


SCI =SCT - SCC - SCF - Sce

SCI = 81,33

FUENTE DE SUMA GRADOS MEDIA CUA- F


DE
VARIACIÓN CUADR. LIBERTAD DRATICA Cociente
Fila F 52,33 2 26,17 2,51
Columna C 90,33 2 45,17 4,32
Interacción I 81,33 4 20,33 1,95
Error E 94 9 10,44
TOTAL 318,0
64
Análisis DE INTERACCIÓN

nivel de significancia α= 0,05


Ho:No hay efecto de interacción entre obreros y máquinas
F calculado 1,95
Fcrítico(4,9) 3,63

Decisión: Si F calculado < que F crítico Acepto la hipótesis nula


Conclusión: Acepto Ho
Es decir: No hay interacción entre obreros y máquinas

Análisis POR FILAS

Ho: No hay diferencia en el rendimiento de las máquinas


F calculado 2,51
Fcrítico(2,9) 4,26

Decisión: Si F calculado < que F crítico, Acepto la Hipótesis nula


Conclusión: Acepto Ho
Es decir: No existe diferencia en el rendimiento de las máquinas

COLUMNAS
Ho: No hay Diferencia en el rendimiento de los trabajadores

F calculado 4,32
Fcrítico(2,9) 4,26
Decisión: Si F calculado > que F crítico Rechazo Ho
Conclusión: Rechazo la Hipótesis nula
Es decir: Si existe diferencia significativa en el rendimiento de los trabajadores

65
EJERCICIOS DE PROBABILIDADES

1.- De cuántas maneras puede escogerse un comité, compuesto de 3 hombres y 2


mujeres, de un grupo de 7 hombres y 5 mujeres?.

2.- Una delegación de 4 estudiantes de un colegio se selecciona todos los años para
asistir a la Asamblea Anual de la Asociación de Estudiantes.
a) De cuántas maneras puede escogerse la delegación si hay 12 estudiantes
elegibles?.
b) De cuántas maneras si dos de los estudiantes elegibles no asisten al mismo
tiempo?.

3.- Un estudiante tiene que contestar 8 de 10 preguntas en un examen.


a) Cuántas maneras de escoger tiene ?
b ) Cuántas manera si las 3 primeras preguntas son obligatorias ?.
c ) Cuántas si tiene que contestar 4 de las 5 primeras preguntas.

4.- El jefe de personal de una compañía desea contratar dos agentes de ventas de
un total de 4 solicitantes .Suponga que los solicitantes varían en cuanto a sus
capacidades y habilidades , denote por 1,2,3,4 a los solicitantes donde 1 es el mejor,
2 el que sigue y así sucesivamente.
a) Defina el experimento aleatorio.
b) Cuántos puntos tiene el experimento.
c) Cual es el espacio muestral.
d) Escriba los elementos del suceso A= seleccionar los dos mejores. B=
seleccionar al menos uno de los mejores.

5.- Cuatro socios elegidos al azar deben expresar su opinión favorable o contraria a
un proyecto determinado.
a) Cuántos puntos tiene el experimento?
b) Cuales son los resultados.
c) Represente los resultados en un diagrama de árbol.
d) Escriba los resultados del suceso A= todos están a favor, B= todos están en
contra, C= por lo menos uno está a favor.

6.- Un experimento consiste en seleccionar tres piezas de un proceso manufacturero


y observar si son defectuosos (D) o no defectuosos Dc .
a) Cuántos puntos tiene el espacio muestral.
b) Escriba todos los elementos del espacio.
c) Escriba los elementos del suceso A= el número de piezas defectuosas es
cero, B= hay exactamente dos defectuosas.

7.- Un administrador desea implantar un nuevo sistema para la selección de personal


en su empresa, el proyecto es presentado para su aprobación a la junta directiva
integrada por 5 miembros.

66
a) Cuántos puntos tiene el espacio muestral.
b) Cuál es el espacio.
c) Cuál es la probabilidad de que el proyecto sea aprobado.?

8.- Encuentre la probabilidad para cada uno de los sucesos de los problemas
anteriores.

10- Sean los eventos A y B con P(A) = 1/4, P(AUB) = 1/3. Hallar P(B) si:
a) Si A y B son mutuamente excluyente.
b) Hallar P(B) Si A y B son independientes

11.- Un ingeniero utiliza dos máquinas A y B, en la construcción de una obra. Las


probabilidades de que las máquinas operen correctamente son: P(A)= 1/2, P(B) =
2/3 y la probabilidad de que ambas funcionen correctamente es 1/4. Hallar la
probabilidad de que funcionen correctamente
a) Por lo menos una máquina
b) Ninguna
c) Solo una

12.- Sea S = { a, b, c, d, e, f } con P(a) = 1/16, P(b) = 1/16 P(c) = 1/8, P(d) =3/16
P(e) = 1/4, P(f) = 5/16. Sean los sucesos A = { a, c, e } , B = { c, d, e, f} . Hallar:
a) P(AB)
b) P(A / B)
c) P(A U B)
d) P(A - B)

13.- Una sociedad está conformada por 3 economistas, 4 abogados y 2 ingenieros.


Se desea elegir la junta directiva integrada por 3 miembros de la sociedad. Encontrar
la probabilidad de que :
a) Todos sus miembros sean de la misma profesión.
b) De que todas las profesiones estén representadas en la junta.

14.- Si no se permiten repeticiones.


a) Cuántos números de 3 dígitos se pueden formar con los seis dígitos 2, 3, 5,
6, 7 y 9 ?.
b) Cuántos de éstos son menores que 400?.
c) Cuántos son pares?.
d) Cuántos son impares?.
e) Cuántos son múltiplos de 5?.

15.- De cuántas maneras puede un profesor escoger 1 o más estudiantes de 6


elegibles.

16.- Simplificar a) (n+1)!/ n! b) n!/ (n-2)!

67
17.- Cuántas placas para automóvil pueden hacerse, si cada placa consta de 2 letras
diferentes seguidas de 3 dígitos diferentes?

18.- Resolver el problema si el primer dígito no puede ser CERO.

19.- Durante una semana dada, la probabilidad de que unas acciones ordinarias
aumenten de precio (A) es 0.30. La probabilidad de que permanezcan constantes (C)
es 0.20. La probabilidad de que disminuyan de precio (D) es 0.50.
a)Los sucesos A, C, D son excluyentes?. Por qué?.
b)Cuál es la probabilidad de que esas acciones aumenten de precio o permanezcan
sin cambio?.
c)Cuál es la probabilidad de que el precio cambie durante la semana?.

20.- Un aparato electrónico consta de dos partes A y B. A partir de una serie de pruebas
previas se presuponen las siguientes probabilidades. La probabilidad de que A falle
es de 0.20; la probabilidad de que B falle solo, es 0.15 y la probabilidad de que
ambas partes fallen es 0.15. Hallar las siguientes probabilidades:
a) De que A o B fallen
b) De que falle B.
c) De que falle solamente A.
d) De que falle A si se sabe que ha fallado B.

21.- Por estudios de tránsito en una vía, se sabe que el 25% de los vehículos que
transitan son de servicio público pesado, el 30% de servicios público liviano y el 45%
de servicio particular. También se conoce que la probabilidad de accidente en cada
clase de vehículos son 0.2; 0.3 y 0.15 respectivamente. Se desea conocer: La
probabilidad de accidente en dicha vía.

22.- El 80% de los obreros que ingresan a una planta electrónica asisten a un curso de
capacitación. El 86% de ellos cumplen con la cuota de producción. Además el 35%
de los obreros que no asistieron al curso cumplen la cuota de producción.
a) Qué probabilidad existe de que un obrero cumpla con la cuota?
b) Si cumple con la cuota cuál es la probabilidad de que haya asistido al curso?
c) Cuál es la probabilidad de que no cumpla con la cuota.
d) Si no cumple con la cuota cuál es la probabilidad de que no haya asistido?

23.- La siguiente tabla muestra los resultados de un experimento para analizar la


resistencia de un material en 200 pruebas

Tabla 1

68
Material Resiste ( C ) No Resiste (D ) TOTAL
TIPO (A) 70 50 120
TIPO (B) 40 40 80
TOTAL 110 90 200

Hallar: P(A) , P(B) , P(C), P(D) , P(A C), P(A D)


P(A/C), P(B/D), P(A U C), P(A c /D c), P(Bc / C ).

24.- Sí A, B y C son eventos mutuamente excluyentes y P(A) = 0.2, P(B) = 0.3 y P(C)
= 0.2 encuentre :
P (AUBUC), P[Ac ∩ (BUC)]

25.- Se lanza un par de dados. Encuentre la probabilidad de obtener.


a) Un total de 8;
b) Cuando más 5.

26.- Si se eligen al azar 3 libros de un estante que contiene 5 novelas, 3 libros de


poemas y un diccionario, ¿cuál es la probabilidad de que
a) Se seleccione el diccionario?
b) Se elijan 2 novelas y 1 libro de poemas?

27.- Suponga que en un grupo de 500 estudiantes universitarios de último año se


encuentra que 210 de ellos fuman, 258 ingieren bebidas alcohólicas, 216 comen entre
comidas, 122 fuman e ingieren bebidas alcohólicas, 83 comen entre comidas e
ingieren bebidas alcohólicas, 97 fuman y comen entre comidas y 52 participan en
estas 3 malas prácticas para la salud. Si se elige al azar un miembro de ese grupo,
encuentre la probabilidad de que el estudiante
a) Fume pero no ingiera bebidas alcohólicas;
b) Coma entre comidas e ingiera bebidas alcohólicas, pero no fume;
c) No fume ni coma entre comidas.

28.- A partir de experiencias previas, un corredor de acciones considera que, bajo las
condiciones económicas actuales, un cliente invertirá en bonos libres de impuestos
con una probabilidad de 0.6, en fondos Mutualistas con una probabilidad de 0.3 y
tanto en bonos libres de impuestos como en fondos Mutualistas con una probabilidad
de 0.15. Encuentre la probabilidad de que el cliente invierta.
a) En bonos libres de impuestos o en fondos mutualistas.
b) Que no inviertan en bonos libres de impuestos ni en fondos mutualistas.

29.- La probabilidad de que una estación de servicio sirva gasolina a 0, 1, 2, 3, 4, 5 o


más automóviles durante un periodo de 30 minutos, son de 0.03, 0.18, 0.24, 0.28,
0.10 y 0.17 respectivamente. Encuentre la probabilidad de que
a) Más de 2 automóviles reciban gasolina.
b) Máximo 4 reciban gasolina.
c) Por lo menos 4 reciban gasolina.
69
30.- Si R es el evento de que un convicto haya cometido un robo armado y D es el
evento de que este convicto haya vendido droga plantee en palabras que
probabilidades están expresadas por.

a) P(R/D)
b) P(Dc/R)
c) P(Rc/D)

31.- En la tabla que aparece en seguida se clasifica una muestra aleatoria de 200
adultos, de acuerdo al género y nivel de educación.

Tabla 2

Educación Masculino Femenino


Primaria 38 45
Secundaria 28 50
Universidad 22 17

Si se elige al azar una persona de este grupo, encuentre la probabilidad de que:


a) La persona sea hombre, dado que tiene educación secundaria.
b) Que la persona no tenga grado universitario si es mujer.

32.- En el último año de un grupo de 100 estudiantes de educación superior, 42


estudiaron matemáticas, 68 Psicología, 54 historia, 22 matemáticas e historia, 25
matemáticas y Psicología, 7 estudiaron historia pero no matemáticas ni Psicología,
10 estudiaron las 3 materias y 8 no estudiaron ninguna de las 3. Si se elige al azar un
estudiante determine la probabilidad de que:
a) La persona estudie Psicología, si no estudia matemáticas.
b) Que una persona estudie Psicología, si estudia historia y matemáticas.

33.- La probabilidad de que un doctor diagnostique en forma correcta una


determinada enfermedad es de 0.7. Dado que el doctor hace un diagnostico
incorrecto, la probabilidad de que un paciente presente una demanda es 0.9. Cuál es
la probabilidad de que el doctor haga un diagnóstico incorrecto y el paciente presente
la demanda.

34.- La policía planea hacer respetar los límites de velocidad utilizando radares en 4
ubicaciones diferentes dentro de los límites de la ciudad. Se operan radares en cada
una de las ubicaciones L1, L2, L3, L4 en 40%, 30%, 20% y 10% del tiempo, y si una
persona que rebasa los límites de velocidad en su camino al trabajo tiene
probabilidades de 0.2, 0.1, 0.5 y 0.2 respectivamente, de pasar estos lugares cual es
la probabilidad de que reciba una multa?
35.- A un sospechoso se le aplica un suero de la verdad que se sabe es confiable en
el 90% cuando la persona es culpable y en el 99% cuando es inocente. Si el
70
sospechoso se escogió de un grupo del cual solo 5% han cometido alguna vez un
crimen y el suero indica que la persona es culpable, cuál es la probabilidad de que la
persona sea inocente?

36.- Un empresario cuenta con la opción de invertir en 2 de 5 proyectos en el próximo


año, el empresario ignora que solo tres de esos 5 proyectos producirán ganancias. Si
elige los 2 proyectos al azar

a) Cuál es el experimento.
b) Cuántos puntos tiene el espacio muestral
c) Encontrar la probabilidad de que mínimo uno de los proyectos que producen
ganancia sea escogido.
d) Encontrar la probabilidad de que máximo dos de los proyectos que no producen
ganancia fue escogido.

37.- Una empresa de servicios evalúa el funcionamiento de una podadora para sus
clientes. si el cliente encuentra muchas posibilidades de escoger puesto que hay
podadoras fáciles de podar, de dificultad mediana y de difícil operación, las hay caras
o baratas, con reparación costosa, regular o barata.
Cual es la probabilidad de que:
a) un cliente solicite una podadora de fácil operación, barata y de reparación regular.
b) Solicite un podadora de dificultad mediana en la operación.
c) Solicite un podadora barata.

38.- Un fabricante del producto A, ha conservado registros sobre la calidad de su


producto y tiene la siguiente tabla sobre el número de defectuosos encontrados en
200 unidades del producto tomadas en 6 grupos así.

Tabla 3

No. de defectuosos No. de unidades del producto A


0 100
1 60
2 20
3 5
4 5
5 10
TOTAL 200

Construir una distribución de probabilidades y representarla gráficamente.


a) Calcular el valor esperado la varianza y la desviación estándar.
b) Encontrar la función acumulativa y calcular la probabilidad de que haya por lo
menos 2 defectuosos.
39.- Si A y B son independientes, PROBAR que A y B C son independientes y AC y
B son independientes.
71
40.-. Los compradores de volúmenes grandes de mercancía utilizan con frecuencia
esquemas de muestreo de inspección para controlar la calidad de las mercancías
que arriban. Los lotes de mercancías son rechazados o aceptados sobre la base de
los resultados obtenidos al inspeccionar algunos artículos seleccionados del lote.
Suponga que un inspector de una planta procesadora de alimentos, ha aceptado eL
98% de los lotes que son de BUENA CALIDAD . Además El inspector acepta el 94%
de TODOS los lotes. El 5% de los lotes son de mala calidad.

Que % de lotes son:


a) Rechazados si son de mala calidad
b) Rechazados o de mala calidad.
c) Rechazados y de mala calidad
d) Aceptados, si son de buena calidad. (Elabore un diagrama de árbol y el cuadro
correspondiente)

72
MODELOS DE PROBABILIDAD

41.- Debido a las altas tasas de interés, una firma informa que el 30% de sus cuentas
por cobrar están vencidas. Si un contador escoge aleatoriamente 5 de esas cuentas
encuentre la probabilidad de que:
a) Ninguna de las cuentas esté vencida.
b) Exactamente dos estén vencidas.
c) La mayoría de las cuentas de la muestra, estén vencidas.

42.- Se piensa elegir una junta directiva formada por un Presidente un Tesorero y un
Secretario.
a) Cuántas planchas diferentes se podrán postular si la asamblea está
compuesta por 20 miembros y todos tienen igualdad de derechos para
pertenecer a la junta ?
b) Si su candidato para presidente es la persona A, cuál es la probabilidad de
que él quede elegido en ese cargo ?

43.- Las calificaciones de una examen se distribuyen normalmente, con media 3,8 y
desviación estándar 0,3. .Qué porcentaje de estudiantes obtuvieron
calificaciones:
a) Por debajo de 4.
b) Por encima de 3,5.
c) Entre 3,5 y 4 ?

44.- La probabilidad de que un presunto cliente haga una compra es del 20%.
a)Cuál es la probabilidad de que un vendedor que visita a 10 presuntos clientes,
menos de 3 hagan una compra ?
b) Cuál sería el valor esperado y la varianza asociada a los 10 clientes ?

45.- Suponga que en una plantación de café, el 40% de las matas están infectados con
Broca. Para detectar la presencia del insecto se toma una muestra aleatoria de 100
Matas a.)Cuál sería la variable aleatoria para medir la infección. Que distribución de
probabilidad sería la adecuada. Encuentre la probabilidad de que más del 50% de
las matas examinadas tengan Broca

46.- El 10% de las semillas de cierta planta NO GERMINAN. Las semillas se empaquetan
en cajas de 10 unidades y se venden con la garantía de que por lo menos 9 de ellas
germinarán. Si un cliente compra una caja cuál es la probabilidad de que ésta cumpla
la garantía ?.

47.- Una compañía de seguros considera que solamente el 0.1% de la población le


ocurre cierto tipo de accidente cada año. Cuál debe ser el costo (X) de una póliza
de DIEZ MILLONES DE PESOS para que la compañía tenga una utilidad (Valor
Esperado) de $10.000 anuales por cada póliza vendida ? NOTA: llame X al

73
costo o valor que paga el cliente por adquirir la póliza, observe que si al cliente
no le ocurre accidente, este valor sería una utilidad para la Cía.

48.- En una empresa de correo distribuye la correspondencia de tarjetas de crédito,


así: Un 10% son de la zona norte, de ellos el 30% están vencidos, el resto son de la
zona sur y de ellos el 10% están vencidos .Si un recibo está vencido.
a) Cuál es la probabilidad de que sea de la zona norte ?
b) Cuál es la totalidad de recibos vencidos ?

49.- Suponga que los 4 motores de un avión comercial operan independientemente


y que la probabilidad de que un motor falle durante un vuelo es 0.01. El avión
puede llegar a su destino si por lo menos un motor está en buenas condiciones.
Cuál es la probabilidad de que el avión no llegue a su destino?

50.- Debido a las altas tasas de interés, una compañía informa que el 30% de sus
cuentas por cobrar están vencidas. Si un contador escoge aleatoriamente 5 de esas
cuentas.
e) Qué modelo de probabilidad utilizaría para encontrar las siguientes
probabilidades,.
f) Ninguna cuenta vencida.
g) Exactamente 2 vencidas.
h) La mayoría vencidas.
i) Cuál es la variable?

51.- Al sistema de contabilidad de su empresa ingresan diariamente, 15 registros


contables (N), de los cuales 5 se digitan con error. Se toma una muestra de 4
registros, cuál es la probabilidad de que:
a) En la muestra no haya registros con error.
b) De que por lo menos uno de los cuatro tenga error ?

52.- Un comerciante recibe un pedido de 20 televisores de los cuales 4 son


defectuosos. Si toma al azar una muestra de 3 aparatos. Cuál es la probabilidad.
a) De que no haya televisores defectuosos en la muestra.
b) De que exactamente uno sea defectuoso ?

53.- El 40% de los empleados de una compañía tienen seguro de vida. si se toma una
muestra aleatoria de 10 empleados.
a) Cuál es la función de probabilidad para las personas aseguradas ?
b) Qué indica la variable aleatoria.
c) Cuál es la probabilidad de que todas las personas estén aseguradas ?.
d) Cuál es la probabilidad de que por lo menos una persona esté asegurada?
e) Cuál es y como se interpreta el valor esperado, y la desviación estándar

54.- El Hemacitómetro es un aparato que se utiliza para medir la densidad de células


por cuadrícula .Según experimentos anteriores se conoce que el promedio de células

74
por cuadrícula es igual a 4. Encuentre la probabilidad de que en las próximas
mediciones se encuentre por lo menos 3 células por cuadrícula.

55.- El salario promedio de los trabajadores de una empresa es de $ 3.800 por hora
y desviación estándar de $ 250.
a) Qué % de empleados ganan menos de $ 4.000 la hora ?.
b) Si se toma una muestra de 25 empleados.
c) Cuál es la probabilidad de que el promedio sea superior a $ 3.600.

56- Al examinar la longitud del tronco madre del PEMPHIGUS POPULI


TRANSVERSUS se encontró que la variable se distribuía normalmente con media
4,4 mm. y desviación estándar 0, 12 mm. Qué porcentaje de troncos tendrán una
longitud.
a) Superior a 4,50 mm.
b) Entre 4,20 y 4,65 mm.

57.- Suponga que en una cosecha de tomate de la variedad Hamstead, solamente el


60% cumplen con las especificación de frutos de buena calidad. La mercancía
se empaca en cajas de 30 unidades y se despachan al mercado nacional. En el
departamento de compras un Ingeniero encargado de hacer el control de calidad
revisa aleatoriamente una caja de cada envío, si mas de la mitad de los frutos
cumplen con las medidas de buena calidad acepta el envío de lo contrario lo
rechaza.
a) Cual es la probabilidad de rechazar el envío ?
b) Cual es la probabilidad de aceptarlo ?
c) Encuentre el promedio aritmético, la varianza y la desviación estándar.

58.- El peso medio de las frutas de un gran cargamento es de 15 onzas y la


desviación estándar 1,62 onzas, si su peso está distribuido normalmente, que
porcentaje de frutas tendrán un peso entre 18 y 20 onzas ?.

59.- Los recaudos diarios del impuesto predial se distribuyen normalmente con un
promedio de 35 millones diarios y desviación estándar 5 millones de pesos,
Encuentre la probabilidad de que un día cualquiera se recaude.
a) Más de 48.
b) Menos de 40
c) Entre 30 y 40 millones.

60.- La distribución salarial de los empleados de una empresa es normal con media
$800.000 y desviación típica $60.000.
a) Que porcentaje de empleados gana menos de $900.000.
b) Más de $ 620.000

61.- La vida útil de cierta marca de baterías es normal, con media 30 meses y
desviación estándar 6 meses. Qué porcentaje de baterías tendrán una duración.

75
a) Menor de 24 meses.
b) Entre 24 y 40 meses.
c) Superior a 40 meses.

62.- Los agentes de aduanas de los E.E.U.U. chequean los documentos de las
mercancías que entran al país para ver si cada envío se encuentra debidamente
legalizado. Los registros del departamento muestran que el 50% de los envíos tienen
su documentación correcta. Si se toma un muestra aleatoria de 8 envíos. Utilizando
el modelo Binomial encuentre la probabilidad de que por lo menos uno tenga su
documentación debidamente legalizada.

63.- La probabilidad de que un cierto tipo de componente se comporte


adecuadamente bajo condiciones de alta temperatura es del 90% .Si el dispositivo
tiene 6 componentes cuál es la probabilidad.
a) De que todos los componente se comporten adecuadamente.
b) De que falle por lo menos uno de los componentes.

64.- El promedio de clientes que llegan a la ventanilla de un banco es 4 por minuto,


Cuál sería la función de probabilidad y la variable aleatoria para determinar la
probabilidad de que durante el próximo minuto.
a) No lleguen clientes.
b) Lleguen máximo 3.
c) Por lo menos 4.

65.- Hallar el área bajo la curva normal en cada uno de los siguientes casos:

a) P(0< Z< 1,2)


b) P(-0,68 < Z< 0)
c) P(-O,46 < Z < 2,21)
d) P(Z < -1,28)
e) P(Z > 2,33)

66.- Encuentre el valor de K en cada uno de los siguientes casos:

a) P(Z< K) = 0,05
b) P(Z> K) = 0,01
c) P(Z< K) = 0,95
d) P(K1<Z<K2) = 0,98
e) P(Z> K)= 0,90

67- La empresa de energía A empezará a promover la conservación de energía


ofreciendo tasas de descuento a los consumidores que mantengan su uso de energía
por debajo de ciertos estándares establecidos., un reporte reciente de la empresa

76
afirma que el 70% de los residentes en la ciudad donde está la empresa A, ha
reducido su uso de energía eléctrica lo suficiente para ser tenidos en cuenta en tarifas
de descuento. Supongamos que selecciona al azar 10 usuarios.
cual es la probabilidad de que:
a) Por lo menos 7 reciban descuentos.
b) Máximo 4 reciban descuentos.
c) Todos reciban descuentos

EJERCICIOS DE ESTADÍSTICA INFERENCIAL

1. Un estudiante gasta mensualmente un promedio de $ 25.000 en materiales, con


desviación estándar $ 4.000. Si elegimos al azar una muestra de 25 estudiantes.
Cuál es la probabilidad de que el promedio de la muestra sea inferior a $ 26.000?.

2. El contenido de nicotina de cierta marca de cigarrillos tiene distribución normal con


media desconocida y desviación estándar 1 miligramo. a) Construir un intervalo del
95% de confianza para la media en base a una muestra de 36 cigarrillos cuyo
contenido promedio de nicotina es de 30 miligramos. b) Cuál es le margen de error.
c) Cuál es el error estándar del promedio ?.

3. Los diámetros interiores de tubos de acero producidos por una fábrica tienen
distribución normal con media 10 pulgadas y desviación estándar 0.1 pulgada. Tubos
con diámetros superiores a 10,17 e inferiores a 9,83 pulgadas se consideran de mala
calidad. Que porcentaje de la producción cumple las especificaciones de Buena
Calidad ?.

4. La probabilidad de que un estudiante de Ingeniería de Sistemas apruebe la materia


es del 50%. Si en el curso hay 50 estudiantes, cuál es la probabilidad de que: a) mas
del 54% gane la materia ?.. b) menos del 48% gane la materia. C) entre el 48% y
el 54% ganen.

5. Cierto aparato electrónico tiene una duración media de 1500 horas y una desviación
estándar de 120 horas. Si se toma una muestra aleatoria de 36 aparatos, cuál es la
probabilidad de que el promedio a) Sea inferior a 1540 horas ? Esté entre 1480 y
1540 horas ?

6. Un fabricante de tubos fluorescentes afirma que la vida media de este material es


de 1600 horas y la desviación estándar 420 h. los consumidores creen que el
fabricante exagera. Para comprobarlo se toma una muestra de 64 tubos y se
encuentra que la vida media es de 1500 horas. Quién tendrá la razón a un nivel de
significancia del 1%.

77
7. La media y la desviación típica de la carga máxima soportada por 60 cables son
11.09 y 0.73 toneladas, respectivamente. Hallar los límites del 95% de confianza
para la media de todos los cables de este tipo.

8. Dos muestras aleatorias tomadas de poblaciones normales con varianzas idénticas


dan los siguientes resultados:
__ __
n1 = 30 , n2= 40, Media X1 = 10 X2 = 25 , . S1 = 34,6 S2 = 30

Contrastar la hipótesis de que la verdadera diferencia de las medias es -10 frente


a la alternativa de que es < -10 a un nivel de significancia del 5%.

9. Un fabricante de cierto shampú para el cabello distribuye el tamaño "profesional" en


100 salones de belleza de Bogotá. Se ha determinado que el consumo promedio de
su producto es de 2.800 cojines mensuales con desviación estándar de 280 cojines.
Si se toma una muestra probabilística de 36 salones, cuál es la probabilidad de que
el consumo promedio en una mes sea inferior a 2.900 ?

10. Se desea conocer la resistencia media a la ruptura de cierta clase de material, una
muestra de 40 cables elegidos al azar revela una tensión media de ruptura igual a
2400 lbs. y una desviación típica de 150 lbs. Hallar un intervalo del 95% de confianza
para la verdadera resistencia media a la ruptura de los cables.

11. Un fabricante afirma que al menos el 20% del público prefiere su producto. Se toma
una muestra aleatoria de 100 personas para verificar su afirmación, 16 de las cuales
expresaron su preferencia por el producto. Es esta suficiente evidencia para refutar
la afirmación del fabricante a un nivel de significancia del 5%.

12. Los salarios diarios en cierta industria están distribuidos normalmente con una
media de $ 1320. Si el 9% de las medias de los salarios diarios en una muestra de
36 obreros es inferior a $ 1250. Cuál es la desviación estándar de los salarios diarios
de esa industria ?.

13. De cada una de dos poblaciones normales e independientes con iguales medias y
desviaciones 6,40 y 7,20 respectivamente se extraen muestras de 64 elementos.
Encontrar la probabilidad de que la diferencia entre las medias muestrales sea
superior a 0,60.

14. Cuarenta y seis por ciento de los sindicatos del país están en contra de comerciar
con China Continental. Cuál es la probabilidad de que una muestra de 100 sindicatos
muestre que mas del 52% tengan la misma posición?

15. Sea X la vida útil de cierta aparato electrónico, con media desconocida y desviación
típica 4000 horas. Una muestra aleatoria de 100 observaciones dio como resultado

78
una media de 30.000 horas de duración. Construir un intervalo del 95% de confianza
para la verdadera media de duración.

16. A y B fabrican dos tipos de cables que tienen resistencia media a la rotura de 4500
y 4000 libras con desviaciones 200 y 300 libras respectivamente. Si se comprueban
50 cables de A y 100 de B. Cuál es la probabilidad de que la media de resistencia a
la rotura de A sea al menos 600 libras mas que B ?

17. Un fabricante de autos sostiene que sus autos consumen en promedio 5,5 galones
cada 100 kilómetros. Un vendedor de la compañía comprueba el consumo de
gasolina de 35 autos y encuentra que el consumo medio de este grupo es de 5.65
galones por cada 100 Kms. Si la desviación estándar del consumo es 0.35 galones
es cierta la afirmación del fabricante a un nivel de significancia del 1 % ?.

18. Una investigación en una universidad, conducida para determinar si el poseer un


automóvil es perjudicial al rendimiento académico, se basó en dos muestras
aleatorias de 100 estudiantes cada una. El promedio de aprovechamiento y la
varianza de los estudiantes sin automóvil fueron:
_
X1 = 2.70 , S12 = 0.36. Mientras que para los 100 estudiantes con automóvil los
resultados fueron
_
X2 = 2.54 ; S22 = 0.40. Presentan los datos suficiente evidencia que indiquen una
diferencia entre el rendimiento medio de los dos grupos a un nivel de significancia
del 5 %.

19. Las lámparas que fabrica cierta empresa tienen una vida media de 800 horas y una
desviación estándar de 60 h. Hallar la probabilidad de que en una muestra aleatoria
de 406 lámparas, la vida media a) esté entre 790 y 810 horas, b) sea superior a 820
horas

20. Una muestra de 200 artículos producidos por una máquina debe tener como
especificaciones un diámetro medio de 3.6 cms. Si la desviación estándar es de
0.21 cms. Plantear una regla de decisión del 5% de significancia para determinar
a partir de que valores la máquina no cumple con las especificaciones. Sugerencia
Ho:  = 3.6 cms.  cumple las especificaciones.

21. El número de horas de duración de una pila del tipo para transistores tiene
distribución normal, con media 100 horas y desviación 20 horas. Qué proporción
de pilas durarán entre 100 y 120 horas. Si se toma muestras de 36 pilas qué
porcentaje de muestras tendrán promedio entre 97 y 105 horas ?

22. Se sabe que cierta marca de Computadores tiene el 65% del mercado. Si se toma
dos muestras de 200 usuarios cada una. Cuál es la probabilidad de que la

79
diferencia entre la primera y la segunda muestra sea superior al 10% en las
preferencias de los usuarios de esa clase de computadores.

23. Se ha determinado que la capacidad de un puente es de 28 toneladas con


desviación estándar 5 toneladas. Una muestra de 30 camiones que transitan por
esa vía da promedio de 30.5 toneladas. Comprobar si se está sobrepasando la
capacidad del puente a un nivel de significancia del 5%.

24. Se selecciona una muestra aleatoria de 500 compradores de un centro comercial


para determinar la distancia promedio que recorren hasta allí. La muestra revela
que el promedio es 23.5 millas y la desviación estándar10.4 millas. Cuales serían
los límites del 95% de confianza para la verdadera media ?.

25. En el problema anterior, cuál sería el tamaño de muestra si se desea un error


máximo de 1.5 millas y una confiabilidad del 98% ?

26. Una compañía transnacional instituyó recientemente un programa de seguridad en


el trabajo para reducir el tiempo perdido debido a accidentes de trabajo. en los 48
meses siguientes a la implantación del programa el tiempo perdido a causa de
accidentes de trabajo promedió 91 horas por mes con una desviación estándar de
14 horas. En los 50 meses anteriores al programa de seguridad el tiempo perdido
era de 108 horas y desviación estándar 12 horas. Estime la diferencia del tiempo
perdido debido a accidentes de trabajo antes y después del programa de seguridad
usando un intervalo del 90% de confianza.

27. Contrastar la hipótesis de que la variabilidad de las compras anuales de los dos tipo
de clientes son iguales frente a la alternativa de que no son iguales a un nivel de
significancia del 5%.

28. Se ha determinado que el consumo promedio de gaseosas en la ciudad les de 5300


botellas diarias con desviación 250 botellas. Pero el gerente de la empresa Coca
Cola asegura que el consumo ha disminuido .Para ello se toma una muestra durante
los últimos 30 dias y se encuentra que el promedio es de 4.500 botellas. determinar
a un nivel de significancia del 1% si el consumo ha disminuido efectivamente.

29. Se toman dos muestras aleatorias de 25 empleados cada una, la primera de la


empresa A y otra de la empresa B. Se obtiene las siguientes resultados promedios
500 y 800 respectivamente y desviaciones S = 25, S2 = 10. Comprobar la
hipótesis de que las varianzas son iguales o diferentes con  = 5%.

30. La media de una población es 375 y la desviación estándar 48. Si la probabilidad


de que el promedio muestral este comprendido entre 370 y 380 es del 95% . Cuál
debe ser el tamaño de la muestra ?

80
31. La proporción de audiencia de TV que ve cierto programa el sábado en la noche fue
del 50% según se ha encontrado previamente, se cree que la proporción ha bajado,
para comprobarlo se tomó una muestra de 100 televidentes y se encontró que el 45
veían el programa. Si el nivel de significancia  del 1% es de concluir que la
proporción ha bajado efectivamente ?.

32. Se desea comprobar las hipótesis de que: la productividad media de los


empleados de la fábrica A es igual a la de la fábrica B, o es diferente a un nivel
de significancia de 5%. Para tal fin se toma muestras independientes de cada
fábrica de 6 empleados y se mide su productividad así:

Muestra1 (A): 20 18 19 15 14 13
Muestra 2 (B): 17 15 15 14 13 13

Encontrar: el promedio y la varianza en cada muestra.


El intervalo del 98% de confianza para la verdadera diferencia de medias

33. La siguiente tabla indica el número de artículos producidos por tres máquinas. El
jefe de control de calidad afirma que todas están funcionando correctamente si
el porcentaje de defectuosos esperado, es igual al 15% en cada una de las
máquinas. (Ho)

CALIDAD MAQUINA A1 MAQUINA A2 MAQUINA A3 TOTAL


BUENOS 50 47 56 153
DEFECTUOSOS 5 14 8 27
TOTAL 55 61 64 180

Calcular las frecuencias esperadas bajo la hipótesis del jefe, y comprobar con un
nivel de significancia del 5% si las máquinas están operando correctamente

34. La variable X representa el número de vehículos vendidos en cada día de la


semana pasada en un concesionario de la ciudad de Pasto.

DIA: lunes martes miércoles jueves viernes


X: 3 5 7 8 9

Encuentre el promedio aritmético y la desviación estándar de la s ventas.


un intervalo del 95 % de confianza para el verdadero promedio de ventas.

35. Una empresa de la construcción proporciona a sus empleados guantes para que
desarrollen adecuadamente sus funciones. En estas condiciones se recomienda
un nuevo tipo de guantes de mayor duración pero que evidentemente serán mas
caros. La empresa comprará los nuevos guantes si su vida media es
significativamente superior a 120 días de lo contrario seguirá usando los actuales.
La empresa toma una muestra de 36 pares de guantes encontrando un promedio
81
de 125 días si la desviación estándar de 18 días y el nivel de significancia del 1%
Cuál será la decisión de la empresa ? Ho: µ = 120 dias

36. El porcentaje de alumnos que aprueban la materia según se ha encontrado


previamente es del 80%, se cree que el rendimiento aumentará para el presente año
para comprobarlo se tomó una muestra de 30 alumnos y se encuentra que el 83%
gana la materia. Si el nivel de significancia es del 5% será de concluir que el
rendimiento académico ha mejorado?

37. Un administrador afirma que las utilidades de su empresa ascienden a la suma


de 50 millones de pesos en promedio, y que la desviación estándar es 6 millones.
Los empleados de la compañía creen que el monto de utilidades es inferior. Para
comprobarlo toman una muestra de 10 empresas similares y encuentran un
promedio de 46 millones de pesos. A) Quién tiene la razón a un nivel de
significancia del 1%. B) Encuentre los límites del 95% de confiabilidad para las
utilidades de la empresa.

38. Las siguientes son las cifras de ventas (X) que 12 vendedores reportaron a su
empresa:
X: 10 12 13 15 20 24 22 25 20 24 25 23

a) Probar la hipótesis de que el promedio de ventas en la población es diferente


de 24 a un nivel del 5%
b) Probar la hipótesis de que la varianza 2 es menor que 32 con  =1%
c) Encontrar los límites del 95% para la verdadera varianza y desviación estándar.

39. El director de una empresa quiere averiguar si existe alguna relación entre la
participación de los empleados en los programas de la empresa y el estrato según
el área residencial con  =5%

Participación Estrato Estrato Estrato total


Bajo Medio Alto
Nunca 20 32 40 92
Ocasional 15 28 44 87
Regular 10 18 23 51
TOTAL 45 78 107 230

40. La siguiente tabla muestra el número de horas perdidas por accidentes de


trabajo en 6 plantas de una fábrica, antes y después de ponerse en marcha un
programa de seguridad industrial. Proporcionan los datos suficiente evidencia
para concluir que el programa fue efectivo para reducir los accidentes que causan
pérdidas de tiempo a un  =1%

Planta A B C D E F

82
Antes del programa 40 64 42 70 58 30
Después del programa 37 58 40 65 52 29

41. La siguiente tabla muestra la relación existente entre las notas de estudiantes en
Matemáticas y Estadística. Contrastar la hipótesis de que los resultados son
independientes a un nivel de significancia  del 5%.

ESTADÍSTICA MATEMÁTICAS TOTAL


Alta Media Baja
Alta 56 71 12 139
Media 47 163 38 248
Baja 14 42 85 141
TOTAL 117 276 135 528

42. La media de una población es 375 y la desviación estándar 48. Si la probabilidad


de que el promedio muestral este comprendido entre 370 y 380 es del 95% . Cuál
debe ser el tamaño de la muestra ?

43. Suponga que se someten dos clases de estudiantes a idéntico examen. La


primera clase está formada por 18 estudiantes del colegio 1, con promedio 85 y
varianza 240 y la segunda por 12 estudiantes del colegio 2 con promedio 80 y
varianza 340. a) encuentre los límites de 98 % de confianza para la verdadera
diferencia de promedios.

44. Se toman dos muestras aleatorias de 25 empleados cada una, la primera de la


empresa A y otra de la empresa B. Se obtiene las siguientes resultados
promedios 500 y 800 respectivamente y S1 = 25, S2 = 10. Comprobar la
hipótesis de que las varianzas son iguales o diferentes con  = 2%.

45. El promedio y la varianza de las ventas de un supermercado en los últimos 15


días fueron $ 340.000 y $ 400.000 respectivamente. Encuentre un intervalo del
98% de confianza para la verdadera varianza y la desviación estándar.

46. Se desea estimar el salario promedio () de todos los empleados público del
municipio. Para tal fin se toma una muestra de 200 empleados y se encuentra
que el promedio es $ 280.000 y la desviación estándar $ 30.000. Encuentre un
intervalo de 95% de confiabilidad para el verdadero promedio. Cuál sería el
margen de error ?

47. A continuación se presenta el número de transistores que no satisfacen un


requisito de calidad de producción en 20 muestras de 10 transistores cada una.
83
Pruebe la hipótesis de que los datos se aproximan a la distribución Binomial con
n = 10 y p = 0,30 a un nivel de significancia del 5%.

Artículos defectuosos (X) 0 1 2 3 4 5 6 7 8 9 10


Cantidad de muestras (fo) 0 1 2 4 5 5 2 1 0 0 0

48. Probar la hipótesis Ho; El número de fallas mecánicas de una planta se aproxima
a la distribución de Poisson con media 2,5 ; n = 40 y nivel de significancia del
1%.

Número de fallas (X) 0 1 2 3 4 5 6 7 8 9 10 11 12 13


Frec. observada (fo) 1 6 8 10 7 4 3 1 0 0 0 0 0 0

49. La siguiente tabla muestra el número de accidentes en una muestra de 56


fábricas. Compruebe la Ho: la distribución de frecuencias se ajusta a una Normal,
Encuentre El promedio y la desviación estándar, Nivel de significancia 5 %.

Número de fo
accidentes
1,45 -- 1.75 6
1,75 -- 2,05 12
2,05 -- 2,35 14
2,35 – 2,65 9
2,65 – 2,95 8
2,95 -- 325 7
TOTAL 56

Anexo.
PRUEBA DE HIPOTESIS PARA µ

PLANTEAMIENTO DATOS

Hipótesis nula H0 :   3,6

Hipótesis alterna H1 :   3,6


Nivel de significancia α 0,01
84
Tamaño de muestra n 36

Promedio muestral x1 3,75


Desviación estándar de la población  0,5

PROCESO

Z critico 1 Z1 -2,58

Z critico 2 Z2 2,58

x 
Error estandar del promedio n 0,08
x
Z

Z calculado n 1,80

k1   0  Z1
Punto crítico 1 n 3,39

k 2  0  Z 2
Punto crítico 2 n 3,81

REGLA DE DECISIÓN CONCLUSIÓN

Si Z1< Zcalculado < Z2, acepto Ho Acepto Ho

Si k1  x1  k2 , acepto Ho Acepto Ho

85

También podría gustarte