Está en la página 1de 32

UNIDAD ACADÉMICA No. 03.

Nombre de la Unidad: Distribuciones de Probabilidad.

Introducción:
Uno de los objetivos de la estadística es la elaboración de un modelo como una
expresión que describa todos los resultados de una muestra aleatoria y de esta
manera poder predecir el comportamiento en futuras repeticiones de un
experimento.

Objetivo General de la Unidad: Que el estudiante se apropie y maneje las


principales distribuciones de probabilidad para variable discreta y variable
continua.

Objetivos Específicos del Unidad:

 Manejar las distribuciones: Binomial , Hipergeometrica y Poisson.


 Comprender y aplicar las distribución Normal , Uniforme y Exponencial
Negativa.

RESUMEN

En el presente capitulo se describirán modelos de probabilidad para variables


discretas y continuas además de su aplicación en ciencias e Ingenieria.

GLOSARIO
EXPERIMENTO: Cualquier proceso que genere resultados o datos bien
definidos.
MUESTRA ALEATORIA SIMPLE: Muestra tomada de tal manera que cada
muestra de tamaño n tiene la misma probabilidad de ser seleccionada.
FUNCION DE PROBABILIDAD : Se llama función de probabilidad de una
variable aleatoria discreta X a la aplicación que asocia a cada valor de xi de
la variable su probabilidad pi.
VARIABLE CONTINUA: Teóricamente toma cualquier valor en un
intervalo dado

Página 1 de 32
Desarrollo temático.
3.1 Distribución Binomial.
2.1 Axiomas de Probabilidad
2.3Técnicas de Conteo
2.4 Teorema de Bayes

3.1 Distribución Binomial.

Esta distribución de probabilidad para variable discreta ( valores enteros) tiene en


cuenta sucesos independientes y por ende el muestreo se realiza con reposición
esto hace que la probabilidad se mantenga constante durante todo el
experimento , se trabaja para “n” ensayos con una probabilidad de éxito “p”.

Modelo

n
b x, n, p     p x q n x
 x
Donde
x : 0,1,2,...........n Variable aleatoria
n : Numero de ensayos
p  Pr obabilidad de exito
q  1  p : Pr obabilidad de fracaso
Ejemplo:

La probabilidad de que una persona fallezca debido a que sufre una enfermedad
catastrófica es de 0,75 , si tenemos un grupo de 5 personas que sufren de dicha
enfermedad determinar:

a) La probabilidad de que ninguno de los 5 fallezca.


b) La probabilidad de que los 5 fallezcan.
c) La probabilidad de que por lo menos 2 fallezcan.
d) La probabilidad de que por lo menos 2 no fallezcan.
e) Determinar la esperanza matemática de que fallezcan y no fallezcan.
f) Calcular la desviación estándar.

El primer paso es definir los valores que toma la variable aleatoria ( asignación de
un real a cada elemento del espacio muestral), en este caso:

x= 0,1,2,3,4,5 donde 0 seria el suceso que ninguno muriera si p=0,75 y 5 seria el


evento que todos murieran.

Página 2 de 32
5
b0,5,0,75   0,75 0 0,2550
a)  0
b0,5,0,75  0,00097656  98 por cada 100.000

Es decir si tenemos 100.000 grupos de 5 personas que padezcan la


enfermedad únicamente en 98 de estos grupos ninguna de las cinco
personas morirán.

 5
b5,5,0,75   0,75 5 0,25 55
b)  5
b5,5,0,75  0,23730469  24 por cada 100

Es decir si tenemos 100 grupos de 5 personas que padezcan la


enfermedad en 24 de estos grupos las cinco personas morirán.

5
5 
b 2,5,0,75    0,75 x 0,25 5 x
x2  x 

c) b 2,5,0,75  0,08789063  0,26367188  0,39550781  0,23730469


b 2,5,0,75  0,984375  98%

5
5 
b 2,5,0,25    0,25 x 0,75 5 x
x2  x 

d) b 2,5,0,25  0,26367188  0,08789063  0,01464844  0,00097656


b 2,5,0,25  0,3671875  37%

Página 3 de 32
Mueran
n
E  X    xi * p i
i 0

E  X   0 * 0,00097656  1 * 0,01464844  2 * 0,08789063  3 * 0,26367188


4 * 0,39550781  5 * 0,23730469
E  X   3,75
e) Tambien en la Binomial
EX   n * p
E  X   5 * 0,25  3,75
Sobrevivan
EX   n * p
E  X   5 * 0,25  1,25

Mueran
La Varianza esta dada por :
n
V  X     xi  E  X  * pi
2

i 0

V  X   0  3,75 * 0,00097656  1  3,75 * 0,01464844  2  3,75 * 0,08789063 


2 2 2

3  3,752 * 0,26367188  4  3,752 * 0,39550781  5  3,752 * 0,23730469


f) V  X   0,9375   2
La raiz cuadrada de la var ianza es la desviacion es tan dart
  0,96824584
Tambien en la Binomial
V X   n * p * q
V  X   5 * 0,75 * 0,25  0,9375   2
  0,96824584

3.2 Distribución Hipergeometrica.

Esta distribución de probabilidad también para variable discreta ( valores enteros)


tiene en cuenta sucesos dependientes y por ende el muestreo se realiza sin
reposición (muestreo de aceptación),esto hace que la probabilidad cambie
durante el experimento.

Página 4 de 32
Tenemos

N= Tamaño de la Población

N-K= Fracaso en la Población

n= Tamaño de Muestra

n-x

x= Variable Aleatoria

K= Éxito en la Población

Modelo

 K  N  K 
  

h x, N , n, K     
x n x
N
 
n 
Ejemplo:

En un recipiente que contiene 10 pastillas de vitaminas un traficante camufla 4


pastillas de igual apariencia con cocaína si en un aeropuerto un policía de
aduanas revisa el recipiente y toma al azar 3 píldoras determinar:

a) La probabilidad de que no sea arrestado el traficante.


b) La probabilidad de que sea arrestado el traficante.
c) Determinar la esperanza matemática de que sea arrestado.
d) Calcular la desviación estándar.

Página 5 de 32
La grafica para este problema es:

N= 14 Pastillas

N-K= 10 vitaminas

n= 3 Tamaño de Muestra

3-x

x= 0,1,2,3

K= 4 Cocaína

 4 10 
  
h 0,14,3, 4    0  3   0,32967033  33%
a) 14 
 
3 

 4 10 
 
3  

 x  3  x 
h 1,14,3,4   
x 1 14 
 
3 
h 1,14,3,4   0,49450549  0,16483516  0,01098901
h 1,14,3,4   0,67032967  67%
b)

Tambien
h 1,14,3,4   1  h0,14,3,4 
h 1,14,3,4   1  0,32967033  0,67032967  67%

Página 6 de 32
c)
Sea arrestado
n
E  X    xi * pi
i 0

E  X   0 * 0,32967033  1 * 0,49450549  2 * 0,16483516  3 * 0,01098901


E  X   0,85714286
Tambien en la Hipergeometrica

EX   n *
K
N
E  X   3  0,85714286
4
14
d)
La Varianza esta dada por :
n
V  X     xi  E  X  * pi
2

i 0

V  X   0  0,85714286  * 0,32967033  1  0,85714286  * 0,49450549


2 2

 2  0,85714286  * 0,16483516  3  0,85714286  * 0,01098901


2 2

V  X   0,51805338   2
La raiz cuadrada de la var ianza es la desviacion es tan dart
  0,71975925
Tambien en la Hipergeometrica
N n K  K
V X   * n * * 1  
N 1 N  N
14  3 4  4
V X   * 3 * * 1     2
14  1 14  14 
 2  0,51805338
  0,71975925

3.3 Distribución Poisson

En esta distribución los experimentos que dan valores numéricos de una variable
aleatoria “x” , el numero de resultados que ocurren durante un intervalo dado o en
una región especifica se denomina experimentos de poisson . El intervalo puede
ser de cualquier longitud , minutos, días , semanas , años etc.

Página 7 de 32
Modelo

p  x, t  
 t  x e   t 
x!
Donde
x : 0,1,2,........... Variable aleatoria
 : Media
t  Periodo para la media  
e  Numero euler  2,71828183
Ejemplo:

Un cajero de banco atiende en promedio tres personas por minuto , si la atención


sigue un proceso de poisson determinar:

a) La probabilidad de que no atienda ninguna persona en un minuto.


b) La probabilidad de que atienda por lo menos 4 personas en un minuto.
c) La probabilidad de que atienda por lo menos 4 personas en dos minutos.

a)

p0,3 
3 *1 e  3*1
0
 0,04978707  5%
1!
Donde
x : 0 Variable aleatoria " ninguna persona"
 :3 personas, Media
t 1min uto, Periodo para la media  
e  Numero euler  2,71828183


p x  4,3  
3 *1x e 3*1
x4 x!

p x  4,3  1  
3
3 *1x e 3*1
b) x 0 x!
p x  4,3  1  0,04978707  0,14936121  0,22404181  0,22404181
p x  4,3  0,35276811  35%

Página 8 de 32
p x  4,   3, t  2  

3 * 2x e 3*2 
x 4 x!
3
p x  4,3  1  
3 * 2x e 3*2 
c) x 0 x!
p x  4,3  1  0,00247875  0,01487251  0,04461754  0,08923508
p x  4,3  0,84879612  85%

3.4 Distribución Normal

La distribución continua de probabilidad mas importante en estadística es la


distribución normal , describe muy bien en forma aproximada muchos fenómenos
que ocurren en la naturaleza , la industria y la investigación . En 1733 Abraham
DeMoivre desarrollo la función de la curva normal . La distribución normal se le
denomina a menudo distribución gaussiana, en honor de Karl Fiedrich Gauss
(1777-18885) . Quien también derivo su ecuación a partir de un estudio de errores
en mediciones repetidas de la misma cantidad.

Grafica

La función de distribución es:

Página 9 de 32
1  x  2
  
f x  
1 2  
e
2 *  *
Para hallar la probabilidad tendremos que determinar el área entre diferentes
valores de la variable aleatoria por medio de:

b 1  x 2
  
Pa  x  b   
1 2  
e dx
a 2 * *
El inconveniente es que esta integral no tiene una primitiva , motivo por el cual su
cálculo debe realizarse por métodos numéricos y además seria una tarea
dispendiosa establecer calculo para cada “µ” y “σ” según el problema , por lo cual
se transforman las observaciones de cualquier variable aleatoria normal “x” a un
nuevo conjunto de observaciones de una variable aleatoria normal “Z” con media
cero y varianza uno.

Transformación:

x
Z

Donde
Z  N de desviaciones es tan dart que esta" x" de la" "
x  Variable Aleatoria
  Media Poblaciona l
  Desviacion Es tan dart Poblaciona l

Página 10 de 32
Este valor de z es buscado en una tabla donde vienen áreas asociadas a este
valor, y haciendo uso de los valores tabulados, se determina la probabilidad
requerida. La tabla que es usada para calcular las probabilidades es la que nos dá
el área que se muestra a continuación:

Ejemplo

Un bombillo tiene una duración distribuida normalmente con un promedio de 850


horas y una desviación estándar de 70 horas , si tomamos un bombillo de la
producción al azar determinar:

a) La probabilidad de que la duración sea hasta 750 horas.


b) La probabilidad de que la duración sea mayor de 890 horas.
c) La probabilidad de que la duración sea entre 770 y 930 horas.
d) Con que duración saldrán el 25% inferior de la producción.
e) A partir de que duración saldrán el 75% de la producción.

Solución:

a) Px  750  ? , es importante graficar la situación:

Necesitamos calcular el área desde -∞ hasta 750, para lo cual realizamos la


transformación:
750  850
Z  1,43
70

Página 11 de 32
De lo que podemos afirmar que 750 está a -1,43 desviaciones estándar de 850 , si
graficamos , tendríamos:

Nos vamos a la tabla y buscamos el valor del área así:

Página 12 de 32
Es decir Px  750  PZ  1,43  0,0764  8% , de cada 100 bombillos producidos
8 duraran menos de 750 horas.

b) Px  890  ?

Estandarizando

890  850
Z  0,57
70
Nos vamos a la tabla y buscamos el valor del área así:

Página 13 de 32
Esta es el área de -∞ hasta 0,57 como el área solicitada es el complemento,
tendremos:

Es decir Px  890  PZ  0,57  1  0,0764  0,2813  28% , de cada 100 bombillos
producidos 28 duraran más de 890 horas.

c) P770  x  930  ?
Estandarizando
930  850
Z1   1,14
70
770  850
Z2   1,14
70

P770  x  930  P 1,14  Z  1,14  0,8729  0,1271  0,7458  75%


d) Este literal pregunta el valor de la variable aleatoria ( duración) dada una
probabilidad ( Normal inversa) tendremos:
x
Z

Despejando " x"
x  Z  
Por lo tanto buscamos el valor de “Z” para una probabilidad dada, gráficamente:

Página 14 de 32
x  0,67 * 70  850
x  803,1 horas

Introducción:
Como se mencionó en el capítulo uno las nociones de población y muestra son
parte fundamental en cualquier investigación , en este capitulo se estudiaran de
manera mas amplia, en particular en el contexto del concepto de variables
aleatorias, destacando la importancia de conocer la distribución muestral de un
estadígrafo ya que con esta se puede realizar el proceso de inferencia del
parámetro, dado que casi nunca es posible tomar todas las muestras de una
población , conociendo la distribución del estimador se puede hacer la inferencia
del mismo a partir de una sola muestra , de igual forma se puede estimar el error
para un tamaño de muestra dado.

Objetivo General de la Unidad: En los anteriores capítulos se estudiaron las


poblaciones y los parámetros que las describen. Estas poblaciones eran discretas
o continuas , y se uso la probabilidad como una herramienta para determinar que
tan probables podrían ser ciertos resultados muestrales . En este capitulo, el
enfoque cambia ya que estudiaremos muestras y estadísticos que los describen.

Objetivos Específicos del Unidad:

 Manejar el concepto del teorema del limite central.


 Comprender y aplicar las distribuciones muestrales de medias , varianzas y
proporciones.
 Realizar estimaciones por intervalos para la media , proporción y para la
varianza.

RESUMEN

En el presente capitulo se describirán las distribuciones muéstrales de medias


y varianzas en variables cuantitativas, la distribución muestral de proporciones
para variables cualitativas , con las anteriores bases realizar estimaciones por
intervalos y su aplicación en ciencias e Ingeniería.

GLOSARIO
MUESTRA ALEATORIA DE TAMAÑO n : Es un conjunto de n individuos
tomado de tal manera que cada subconjunto de tamaño n de la población
tenga la misma probabilidad de ser elegido como muestra; es decir, si la

Página 15 de 32
población tiene tamaño N, cada una de las combinaciones posibles de n
elementos debe ser equiprobable.
PARAMETROS: Se llama parámetros poblacionales a cantidades que se
obtienen a partir de las observaciones de la variable y sus probabilidades y
que determinan perfectamente la distribución de esta, así como las
características de la población, por ejemplo: La media, μ, la varianza σ2, la
proporción de determinados sucesos, P.

ESTADISTICO : Es una medida cuantitativa, derivada de un conjunto de


datos de una muestra, con el objetivo de estimar o inferir características de
una población o modelo estadístico.

Desarrollo temático.
4.1 Teorema del limite central.
4.2 Distribución muestral de medias
4.3 Distribución muestral de la varianza
4.4 Distribución muestral de las proporciones

4.1 Teorema del limite central.

4.1.1. Error Muestral

Cuando se calcula un estadístico a partir de una muestra llámese media,


desviación estandart o proporción para estimar parámetros poblacionales siempre
conlleva algún error , por ejemplo supongamos que en un grupo de estadística
tenemos 40 estudiantes (población) y promediamos su estatura obteniéndose
µ=1,68 m ( Parámetro poblacional) si elegimos una muestra aleatoria de 15
estudiantes y calculamos la media muestral de estaturas obteniéndose
x  1,72m (Estadístico) ,observamos que existe una diferencia entre el parámetro y
el estadístico que denominamos error muestral

e    x  1,68  1,72  0,04

Ejemplo:

Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de


cuatro profesores universitarios de matemáticas:

Página 16 de 32
Profesor de matemáticas Antigüedad
A 16
B 10
C 8
D 26

Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin


reemplazo. Calcule la antigüedad media para cada muestra, la media de la
distribución muestral y el error estándar, o la desviación estándar de la distribución
muestral.

1) Se pueden tener 4C2 =6 muestras posibles. La tabla lista todas las muestras
posibles de tamaño 2, con sus respectivas medias muestrales.

Muestras Antigüedad Media Muestral

A,B (16,10) 13

A,C (16,8) 12

A,D (16,26) 21

B,C (10,8) 9

B,D (10,26) 18

D,C (8,26) 17

2) La media poblacional esta dada por:

16  10  8  26
  15
4

3) La media de la distribución muestral es:

13  12  21  9  18  17
x   15
6

Página 17 de 32
Con lo cual podemos deducir que :

  x
La media poblacional es igual a la media de todas las medias muestrales.

4) La desviación estandart de la población esta dada por:

 x i  
2

 i 1

N
En este caso:


16  152  10  152  8  152  26  152 7
4
5) El error estándar o la desviación estándar de la distribución muestral es:

x 
13  152  12  152  21  152  9  152  18  152  17  152
6
 x  4,0414519

Si utilizamos la fórmula del error estándar sin el factor de corrección por población
finita tendríamos que:


x 
n
Donde " n" es el tamaño de la muestra

Evaluando:

7
x   4,9497475
2

Como se observa difiere de la desviación estandart de las medias muéstrales


calculada. Por lo anterior hay que aplicar el factor de corrección para población
finita así:

Página 18 de 32
 N n
x 
n N 1

Calculando

7 42
x   4,0414519
2 4 1
De lo cual concluimos que la desviacion estandart de las medias muestrales es
igual a la desviacion estandart poblacional sobre la raiz del tamaño de las
muestras por el factor de correccion, en caso de ser poblaciones finitas.

4.1.2. Teorema del limite central

Si se seleccionan muestras aleatorias de tamaño “n” de una población con media


“µ” y desviación estándar “σ” , entonces, si n es grande, la distribución muestral
de medias tendrá aproximadamente una distribución normal con una media igual a

“µ” y una desviación estándar de x  . La aproximación será cada vez
n
más exacta a medida de que n sea cada vez mayor.

4.2. Distribución Muestral de medias

Recordemos que en la distribución normal la variable estandarizada nos permitía


calcular la probabilidad de un evento dada una variable aleatoria mediante:

x
Z

Donde
Z  N de desviaciones es tan dart que esta" x" de la" "
x  Variable Aleatoria
  Media Poblaciona l
  Desviacion Es tan dart Poblaciona l

Página 19 de 32
Cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier tamaño
de una población normal, la distribución muestral de medias tiene un
comportamiento aproximadamente normal, por lo que se puede utilizar la formula

de la distribución normal con   x y x  , entonces la fórmula para
n
calcular la probabilidad del comportamiento del estadístico, en este caso la media
de la muestra , quedaría de la siguiente manera:
x
Z
x
Donde
Z  N de desviaciones es tan dart que esta" x" de la"  "
x  Media Muestral
  Media Poblaciona l

x   Desviacion Es tan dart de las medias muestrales
n
  Desviacion Es tan dart Poblaciona l
n  Tamaño de muestra

En general se utiliza:

x
Z

n
y para poblaciones finitas y muestro con reemplazo:

x N n
Z
 N 1
n
Ejemplo:

Una empresa eléctrica fabrica 1000 focos diarios, que tienen una duración que se
distribuye aproximadamente en forma normal, con media de 900 horas y
desviación estándar de 50 horas. Encuentre la probabilidad de que una muestra
aleatoria de 20 focos tenga una vida promedio de:

Página 20 de 32
a) Menos de 890 horas
b) Mas de 920 horas
c) Entre 850 y 950 horas

Solución:

a) Identificamos los elementos

N= 1000
µ=900
n= 20
σ= 50

P x  890  ?
Gráficamente:

Al estandarizar

890  900 1000  20


Z  0,89
50 1000  1
20
Por lo tanto
 
P x  890  PZ  0,89
Que en la tabla de la distribución normal:
PZ  0,89  0,1894  19%

Página 21 de 32
Con lo que podemos concluir que hay una probabilidad del 19% de que en muestras de
tamaño 20 el promedio de la muestra sea menor de 890 horas. En otras palabras si
tomamos 100 muestras de tamaño 20 en 19 de estas muestras el promedio será menor
de 890 horas.

b)
N= 1000
µ=900
n= 20
σ= 50
 
P x  920  ?

Estandarizando

920  900 1000  20


Z  1,77
50 1000  1
20
Por lo tanto
 
P x  920  PZ  1,77
Que en la tabla de la distribución normal:
PZ  1,77  1  0,9616  0,0384  4%

c)
N= 1000
µ=900
n= 20
σ= 50
 
P 850  x  950  ?

Estandarizando

Página 22 de 32
850  900 1000  20
Z  -4,43
50 1000  1
20
950  900 1000  20
Z  4,43
50 1000  1
20

Por lo tanto
 
P 850  x  950  P 4,43  Z  4,43
Que en la tabla de la distribución normal:
PZ  1,77  0,999995288  4,71165E - 06  0,999990577  100%

4.2.1. Distribución Muestral para la diferencia de promedios


En la anterior distribución el científico o ingeniero estaba interesado en apoyar una
conjetura de la media con una población , sin embargo en muchas ocasiones el
interés puede ser en dos o mas poblaciones y las diferencias entre ellas , situación
que podemos resumir asi : si se extraen al azar muestras independientes de
tamaños n1 y n2 de dos poblaciones discretas o continuas , con medias
poblacionales µ1 y µ2 y desviaciones estándar σ1 y σ2 respectivamente , entonces
la distribución muestral para la diferencia de medias estará dada por:

Z
x 1 
 x 2   1   2 
  12  22 
 
n n 
 1 2 

Ejemplo:
Dos tipos de pintura ofrecen un tiempo de secado promedio de 80 y 60 minutos
respectivamente con una desviación estándar de 15 y 13 minutos , si tomamos
muestras aleatorias de tamaños 25 y 36 respectivamente .Encontrar la
probabilidad de que la media muestral calculada de las 25 mediciones exceda la
media muestral de Las 36 mediciones en por lo menos 10 minutos .

Pintura 1
µ1=80
n1= 25

Página 23 de 32
σ1= 15
Pintura 2
µ2=60
n2= 36
σ2= 13
 
P x1  x2  10  ?
Z
10  80  60  2,7
 15 2 132 
  
 25 36 
  
P x1  x2  10  PZ  2,7

Gráficamente

Que en la tabla de la distribución normal:

PZ  2,7  1  0,0035  0,9965  99,7%

4.3. Distribución Muestral de la Varianza

Si se extrae una muestra aleatoria de tamaño n de una población normal con


media µ, y varianza σ2 ,y se calcula la varianza muestral , se obtiene el valor del
estadístico s2 que se utilizara para conocer la σ2, mediante una variable aleatoria
chi cuadrada con “n-1” grados de libertad . Formalizando con el siguiente teorema:
si s2 es la varianza de una muestra aleatoria de tamaño “n” que se toma de una
población normal que tiene varianza σ2 entonces el estadístico :

Página 24 de 32
2 
n  1s 2
2

Tiene una distribución chi cuadrado con v  n  1 , grados de libertad.

Ejemplo:

Un fabricante de baterías garantiza que su producto dura en promedio 2,5 años


con una desviación estandart de 0,8 años . Si se toma una muestra aleatoria de 8
baterías y resulto que x  2,8 y s  1,2 ¿Tiene razón el fabricante respecto a la
desviación estándar poblacional?
1) Calculamos el estadístico

 2

8  1 *1,2 2
 15,75
0,8 2

2) Si asumimos un 95% de probabilidad central es decir a la izquierda 0,025 y


a la derecha 0,975 , para la afirmación del fabricante , debemos remitirnos a
la distribución chi cuadrado con v=8-1 = 7 grados de libertad, los valores
críticos serán:

Página 25 de 32
Este será el valor critico (1,690) a la izquierda , y a la derecha ( 16,013)

Página 26 de 32
Como el estadígrafo esta dentro de estos valores podemos afirmar con un 95% de
confianza que el fabricante tiene la razón en su afirmación respecto a la varianza

Página 27 de 32
4.4. Distribución Muestral de las Proporciones

Cuando se requiere investigar la proporción de algún atributo en una muestra (


variables cualitativas). La distribución muestral de proporciones es la adecuada
para dar respuesta a estas situaciones. Esta distribución se genera de igual
manera que la distribución muestral de medias, a excepción de que al extraer las
muestras de la población se calcula el estadístico proporción (p=x/n en donde "x"
es el número de éxitos u observaciones de interés y "n" el tamaño de la muestra)
en lugar del estadístico promedio. La fórmula que se utilizará para el cálculo de
probabilidad en una distribución muestral de proporciones está basada en la
aproximación de la distribución normal a la binomial . Esta fórmula nos servirá
para calcular la probabilidad del comportamiento de la proporción en la muestra.


pP
Z
 
P* Q
n
Donde :
p : Pr oporcion Muestral

P : Pr oporcion Poblaciona l
 
Q 1 P
n : Tamaño de Muestra
Si es una población finita:


pP N n
Z
  N 1
P* Q
n

Ejemplo:

La proporción de hogares en cierta cuidad que usa gas natural es del 45% , si se
toma una muestra aleatoria de 250 hogares determinar la probabilidad de que La
proporción de la muestra de hogares con gas natural sea :
d) menor del 40%

Página 28 de 32
e) Mayor del 49%

a)

Solución:

Datos:

n=250 Hogares


P  0,45

P p  0,40  ?

Como se esta aproximando la binomial mediante la normal se debe restar el factor


de corrección
 0,5 
p  p   
 n 
Por lo tanto la formula seria

p  P
Z
 
P* Q
n
Evaluando:

  0,5  
 0,4      0,45
  250  
Z  1,65
0,45 * (1  0,45)
250

P p  0,40  PZ  1,65


PZ  1,65  0,0495  5%

Página 29 de 32
b)

Solución:

Datos:

n=250 Hogares


P  0,45

P p  0,49  ?

Como se esta aproximando la binomial mediante la normal se debe sumar el factor


de corrección
 0,5 
p  p   
 n 
Por lo tanto la formula seria

p  P
Z
 
P* Q
n
Evaluando:

  0,5  
 0,49      0,45
  250  
Z  1,33
0,45 * (1  0,45)
250

P p  0,49  PZ  1,33


PZ  1,33  1  0,9082  0,0918  9%

4.4.1. Distribución Muestral de Diferencia de Proporciones

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben


compararse utilizando proporciones o porcentajes.

Página 30 de 32
El calculo de probabilidad del estadístico de diferencia de proporciones es:

  
 p1  p2    P1  P 2 
Z  
p1 * q1 p2 * q2

n1 n2

Ejemplo

Una encuesta de 380 trabajadores de cierta compañía que fueron despedidos


entre 1990 y 1999, encontró que 25% habían estado sin trabajo durante por lo
menos tres años. Otra muestra aleatoria de 450 trabajadores de entre todos los
empleados despedidos entre 1990 y 1999 arrojo que el 20% habían estado sin
trabajo durante por lo menos tres años . ¿Cuál sería la probabilidad de que su
porcentaje muestral de trabajadores sin empleo durante por lo menos tres años,
difiera del porcentaje obtenido en la encuesta en 6% o más?

En este ejemplo solamente contamos con una población de la que se seleccionan


dos muestras por lo tanto:

 
P1  P 2

p1 = 0.25

p2 = 0.20

n1 = 380 trabajadores

n2 = 450 trabajadores

P p1  p2  0,06  ?

  
  
 0,06   0,5
   0
  380  450 
  
  2 
Z  2,1
0,25 * 0,75 0,2 * 0,8

380 450

Página 31 de 32
P p1  p2  0,06  PZ  2.10

PZ  2.10  1  0,9821  0,0179  2%

Página 32 de 32

También podría gustarte