Clase 7 - Distribuciones Muestrales - DPD

También podría gustarte

Está en la página 1de 52

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERU

FACULTAD DE INGENIERIA DE MINAS


UNIDAD DE POST GRADO

ASIGNATURA: ESTADISTICA E INVESTIGACION


DE OPERACIONES APLICADA
DISTRIBUCIONES MUESTRALES Y
DISTRIBUCIONES DE PROBABILIDAD DISCRETAS

Ing. Dr. Eli Teobaldo Caro Meza

HUANCAYO – 2021 - II
CONCEPTOS BASICOS
a. UNIDAD DE ANALISIS: Es el elemento que se observa y del que se
busca información de características o variables de interés.
b. POBLACION: Es la totalidad de elementos, ya sean empresas,
personas, etc., que presentan una o mas características
observables.
c. POBLACION OBJETIVO: Es la población completamente
caracterizada. Por ejemplo, en una encuesta sobre aceptación de
un nuevo producto de belleza de una empresa que produce
cosméticos, la población objetivo estará dada por todas las
mujeres que son usuarias de los productos de la empresa con
edades entre 20 y 39 años, pertenecientes al nivel socioeconómico
alto, a partir del cual se selecciona una muestra de mujeres para
la investigación.
d. MARCO MUESTRAL: Se define como el listado de elementos desde
los que se seleccionara la muestra.
e. UNIDAD DE MUESTREO: Es la selección de los conjuntos de
unidades de análisis que serán tomados en cuenta para conformar
la muestra final de investigación.
MUESTRA ALEATORIA
TIPOS DE MUESTREO
Se disponen de dos métodos para seleccionar las muestras de
poblaciones:
• Muestreo probabilístico
• Muestreo no probabilístico
A. MUESTREO PROBABILISTICO
• En este tipo de muestreo se cuenta con información de las
probabilidades de las unidades seleccionadas de la muestra.
• Existen varios tipos de muestreo probabilístico, los cuales se
mencionan a continuación:
1. MUESTREO ALEATORIO SIMPLE
• En este tipo de muestreo cada unidad de la población
tiene igual probabilidad de ser seleccionada, se
recomienda cuando la variable en estudio es
homogénea.
• Se facilita su aplicación mediante el uso de tablas de
números aleatorios, con MS Excel, con Minitab.
EJEMPLO 1:
• Se desea seleccionar una muestra aleatoria simple
de 20 personas de una población total de 100.
USANDO LA TABLA DE NUMEROS ALEATORIOS:
• Primero elegimos al azar un numero que será el
punto de partida, elegimos la primera columna y la
cuarta fila que corresponde al numero 18. A partir
de dicho numero y siguiendo un camino aleatorio,
desde arriba hasta el final de la columna se van
seleccionando los números de la muestra hasta
completar los 20 números asociados a cada
persona. La muestra de 20 personas será:
18 23 26 39 82 62 90 48 82 68
42 56 59 86 27 38 14 04 29 64
CON MS EXCEL:
• Se deben disponer en una columna los 100 números
asignados a cada persona, como se muestra a
continuación:
• En la barra de herramientas, elija la opción Herramientas /
Análisis de datos.
• Seleccione la opción: Muestra
• Pulse en el botón aceptar.
• Seleccione el marco muestral
Rango de entrada: $A$1:$A$101 (Incluye el rotulo)
• Marque la opción Rótulos. (desactivar en el caso de no
haber incluido el rotulo al momento de seleccionar el marco
muestral)
• Seleccione la opción Aleatorio.
• Indique el tamaño de la muestra. Numero de muestras: 20.
• Seleccione la opción de resultados. Seleccionar la opción
Rango de Salida e indicar la celda donde se desea que se
empiecen a grabar los resultados.
Rango de Salida: C2.
• Pulse el botón Aceptar.
Lo anterior expuesto se aprecia en la siguiente
figura:
Los resultados se almacenaron a partir de la celda
C2, etiquetamos la columna, por ejemplo Muestreo
Aleatorio Simple
• De acuerdo con el resultado la muestra estará
conformada por personas cuyos números asignados
son: 34, 53,83, 69, 37, 35, 8, 43, 71, 11, 9, 49, 56,
28, 84, 56, 84, 99, 91, 76.
• Cada vez que se realice el muestreo se obtendrán
resultados diferentes, ya que son resultados
aleatorios.
• En la mayoría de los casos se pueden presentar
valores repetidos, se debe a que el MS Excel realiza
un muestreo con reemplazo, en este caso se debe
seleccionar en forma aleatoria otro numero para
completar la muestra: En el ejemplo se repite 56 y
84 se puede reemplazar por 59 y 87.
• Finalmente los resultados obtenidos se ordenan en
forma ascendente con la opción para este caso.
CON MS EXCEL:
• Se deben disponer en una columna los 100 números
asignados a cada persona, como se muestra a
continuación:
• En la barra de herramientas, elija la opción Herramientas /
Análisis de datos.
• Seleccione la opción: Muestra
• Pulse en el botón aceptar.
• Seleccione el marco muestral
Rango de entrada: $A$1:$A$101 (Incluye el rotulo)
• Marque la opción Rótulos. (desactivar en el caso de no
haber incluido el rotulo al momento de seleccionar el marco
muestral)
• Seleccione la opción Periódico.
• Indique el tamaño del salto sistemático. Periodo: 5.
• Seleccione la opción de salida de resultados. Seleccionar la
opción Rango de Salida e indicar la celda donde se desea
que se empiecen a grabar los resultados.
Rango de Salida: E2.
• Pulse el botón Aceptar.
Lo anterior expuesto se aprecia en la siguiente
figura:
Los resultados se almacenaron a partir de la celda
E2, etiquetamos la columna, por ejemplo Muestreo
Sistemático
• De acuerdo con el resultado la muestra estará
conformada por personas cuyos números asignados
son: 5, 10,15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70,
75, 80, 85, 90, 95, 100.
• Para poder obtener un muestreo sistemático con un
determinado arranque aleatorio (A) diferente del salto
sistemático, se aplica formulas sencillas de acuerdo con
el arranque aleatorio deseado.
• Por Ejemplo, si se deseara una muestra sistemática con
A = 2; colocamos el cursor en F2, introducimos la
formula: =E2 – 3, ya que a 5 hay que restarle 3 para que
sea igual al arranque aleatorio (A = 2); copiamos la
formula para las demás celdas con datos hallados
anteriormente.
• Etiquetamos la nueva columna; por ejemplo: Muestreo
Sistemático (A = 2). La muestra obtenida será:
Ejemplo 3:
La prueba de producto es una forma de investigación
comercial que tiene como objetivo conocer las bondades del
producto en base a la opinión de una muestra de
consumidores.
IMA S.A. es una empresa de investigación comercial que
realizara una prueba de producto sobre un detergente de
ropa.
Para la investigación se seleccionara una muestra de hogares
de los 47 distritos de Lima y Callao.
a. Indique la población objetivo del estudio.
b. Para la información necesitada proponga un tipo de
muestreo probabilístico. Sustente.
c. Si se planea utilizar un muestreo estratificado, indique
como distribuiría el tamaño de muestra en los estratos.
Explique.
Solución:
a. La población objetivo esta constituida por todos los hogares de los
47 distritos de Lima y Callao.
b. Es adecuado utilizar el muestreo estratificado debido a que la
selección se realizara de acuerdo con el numero de viviendas que
tiene cada distrito, el cual es agrupado en estratos homogéneos
(distritos).
c. La distribución del tamaño de la muestra se realizara mediante la
asignación proporcional de acuerdo con el numero de viviendas de
cada uno de los 47 distritos de Lima y Callao.
Así por ejemplo:
 El numero total de viviendas en Lima y Callao lo constituyen las
viviendas de los 47 distritos.
 Dividiendo el numero de viviendas de cada uno de los distritos
entre el total se obtiene el porcentaje de viviendas para cada
distrito.
 De acuerdo con el porcentaje de viviendas por distrito se
distribuirá proporcionalmente la muestra en cada estrato.
B. MUESTREO NO PROBABILISTICO
Los métodos de muestreo no probabilístico, a diferencia de los
probabilísticos, no permiten determinar el error de muestreo; no es posible
determinar el nivel de confianza sobre la representatividad de la muestra;
además no permiten realizar inferencias sobre la población.
Existen varios tipos, los mas usados son:
1. MUESTREO POR CUOTAS:
Esta es una técnica de uso frecuente en la investigación de mercado,
sobre todo en las encuestas de opinión. Se basa en el conocimiento de
los estratos de una población y de los individuos mas representativos
para los fines de estudio.
2. MUESTREO POR CONVENIENCIA:
En este caso, como su nombre lo indica, las unidades reportantes en la
muestra se seleccionan de acuerdo con la conveniencia del encuestador.
La unidad de muestreo se selecciona sobre la base de su fácil
disponibilidad.
3. MESTREO DE JUICIO:
Este tipo de muestreo consiste en seleccionar las unidades reportantes a
juicio del investigador. El que considera quienes representan a la
población. Una importante diferencia radica en que la muestra no es
típica, sino que el investigador la considera como tal. La eficacia de la
muestra depende del investigador o experto que selecciona las
unidades por entrevistar.
ALGUNAS
DISTRIBUCIONES DE
PROBABILIDAD
IMPORTANTES
INTRODUCCION
• En muchas tareas o análisis de aplicación
estadística, se busca determinar una
distribución de probabilidad o modelo de
probabilidad que satisfaga un conjunto de
supuestos, para estudiar los resultados
observados de un experimento aleatorio
• Se puede definir muchas distribuciones de
probabilidad tanto de variables aleatoria
discreta como de variable aleatoria continua,
pero no todos son modelos importantes.
DISTRIBUCIONES IMPORTANTES DE
VARIABLE ALEATORIA DISCRETA
1) DISTRIBUCION DE PROBABILIDAD DE
BERNOULLI.
DEFINICION: Se denomina prueba o ensayo de
Bernoulli a todo experimento aleatorio que
consiste de solo dos resultados posibles
mutuamente excluyentes, generalmente
llamados: éxito (E) y fracaso (F).
El espacio muestral asociado al experimento
aleatorio de Bernoulli se puede escribir como el
conjunto:
Ω = {E, F}
DEFINICION: La variable aleatoria X definida en Ω
de manera que atribuye a E el valor 1 y a F el
valor 0, se denomina variable aleatoria de
Bernoulli.
DEFINICION: Si al éxito E se asigna la
probabilidad p = P[X = 1] donde 0<p<1,
entonces, el fracaso F tiene probabilidad
P[X=0]= 1 – p. Luego, la distribución de
probabilidad de Bernoulli de parámetro p esta
definida por:
X x=0 x=1
f(x) = P[X = x] 1–p p
• En forma resumida por la ecuación o
modelo (donde usamos por comodidad q
= 1 – p)
f(x) = P[X = x] = pxq1-x, donde: x = 0, 1
• La función de distribución acumulativa
de Bernoulli es definida en la siguiente
tabla:
X x<0 0≤x<1 x≥1

f(x) = P[X = x] 0 1–p 1


DISTRIBUCIÓN BINOMIAL
Definición
La v.a.d. X binomial es el número de éxitos en n pruebas
independientes con dos resultados posibles (éxito y fracaso) con
probabilidad constante π de éxitos y (1–π) de fracasos.

Función de probabilidad

 n x
f ( x)  f ( x; n,  )     (1   ) n x ; x  0, 1, 2, ..., n
 x
X es B(n, π)

Medidas de resumen:

Media:  = np

Varianza: 2 = np(1–p)
Aplicaciones de la distribución binomial

• Representación de variables discretas


con RX = {0, 1, 2, …, n}

• Pruebas de hipótesis sobre una proporción con muestras


pequeñas.

• Validez a través de juicio de expertos.

Propiedades de la distribución binomial

• Es simétrica cuando π = 0,5.

• Es asimétrica positiva cuando π < 0,5.

• Es asimétrica negativa cuando π > 0,5.


Ejemplo 1:

Distribución binomial B(10; 0,6) (n = 10 y π = 0,6)

Función de probabilidad

10  x 10 x
f ( x)  f ( x; 10; 0,6)    0,6 0,4 ; x  0, 1, 2, ..., 10
x 
X es B(10; 0,6)

Medidas de resumen:

 = 6; 2 = 2,4;  = 1,5492; CV = 25,82%


Funciones de probabilidad y de distribución
x f(x) Fa(x)
Función de probabilidad de la distribución B(10; 0,6)
0 0,0001 0,0001
0,2508
1 0,0016 0,0017 0,25

0,215
2 0,0106 0,0123 0,20
0,2007

3 0,0425 0,0548
0,15
4 0,1115 0,1662

f(x)
0,1209
0,1115
5 0,2007 0,3669 0,10

6 0,2508 0,6177
0,05 0,0425 0,0403
7 0,2150 0,8327
0,0106
8 0,1209 0,9536 0,0001 0,0016
0,00
0,006

0 1 2 3 4 5 6 7 8 9 10
9 0,0403 0,9940 x

10 0,0060 1,0000

Otras medidas de resumen


Me = 6; Mo = 6
Cálculo de probabilidades

1) P(X ≤ 5) = Fa(5) = 0,3669

2) P(2 < X ≤ 7) = Fa(7) – Fa(2) = 0,8204

3) P(3 ≤ X < 6) = Fa(5) – Fa(2) = 0,3546

4) P(X > 5) = 1 – Fa(5) = 0,6331

5) P(X ≤ 15) = 1

6) P(X  20) = 0
DISTRIBUCION DE
PROBABILIDAD DE POISSON
• Básicamente un experimento aleatorio de
POISSON es un proceso que consiste en
observar un numero X de veces que ocurre
un evento en una unidad de longitud dada.
• Por ejemplo, observar el numero de
llamadas xi que recibe un celular en
periodos de 1 hora como se muestra:
x1 x2 … etc. Tiempo
Definición
La v.a.d. X de Poisson es el número de eventos
independientes que ocurren en un intervalo de tiempo, en
una región plana o en un volumen (con un promedio dado).

Función de probabilidad

X es P()

Medidas de resumen:

Media:  = 

Varianza: 2 = 
Aplicaciones de la distribución de Poisson

Representación de variables discretas con RX = {0, 1, 2, …}

 Número de llamadas por minuto.

 Número de accidentes por día.

 Número de clientes por hora.

 Número de bacterias en un m2.

 Número de bacterias en un vaso de agua.

Propiedades de la distribución de Poisson

La media y la varianza son iguales.


Ejemplo 1:
Distribución de Poisson P(1) ( = 1)

Función de probabilidad

e11x
f ( x)  f ( x; 1)  ; x  0, 1, 2, ...
x!
X es P(1)

Medidas de resumen:
 = 1; 2 = 1;  = 1; CV = 100%
Funciones de probabilidad y de distribución

Función de probabilidad de la distribución P(1)

x f(x) Fa(x) 0,4


0,3679 0,3679
0 0,3679 0,3679
1 0,3679 0,7358 0,3

2 0,1839 0,9197

f(x)
3 0,0613 0,9810 0,2 0,1839

4 0,0153 0,9963
5 0,0031 0,9994 0,1
0,0613

6 0,0005 0,9991 0,0153


0,0031 0,0005 0,0001
0,0
7 0,0001 1,0000 0 1 2 3 4 5 6 7
x

Otras medidas de resumen


Me = 1; Mo = 0 y 1
Cálculo de probabilidades

1) P(X ≤ 4) = Fa(4) = 0,9963

2) P(1 < X ≤ 4) = Fa(4) – Fa(1) = 0,2605

3) P(2 ≤ X < 4) = Fa(3) – Fa(1) = 0,2452

4) P(X > 5) = 1 – Fa(5) = 0,0006

5) P(X ≤ 10) = 1

6) P(X  15) = 0
NOTA: (Extensión o reducción del
intervalo unitario)
• La probabilidad de que ocurra k eventos
de Poisson en un intervalo de tiempo (o
en una región de tamaño) t es:

Donde:
 : es el numero promedio de ocurrencias por
unidad de periodo o región
t: es el numero promedio de ocurrencias de
eventos en el periodo (o región) de tamaño t
PROBLEMAS
Ejemplo 1:
La probabilidad de que cualquier pieza producida
por una maquina pase con éxito una prueba de
control es 0,9. Si se controlan 10 de tales piezas y
si X denota el numero de piezas que no pasan la
prueba de control de los 10 escogidos al azar:
a) Defina el modelo de probabilidad de X. ¿Qué
numero de piezas es mas probable que no pase el
control?
b) Calcule el numero de piezas que se espera no
pasen el control. ¿Es cierto que la distribución
estándar de la distribución de X es menor que 0,9?
c) Determine la función de distribución acumulativa
F(x) de X y aplicando esta, calcule la probabilidad
de que mas de 7 piezas pero no mas de 9, no
pasen la prueba de control.
SOLUCION:
x (0.1)x (0.9)10-x f(x) Fa(x)
0 1 1 0.34867844 0.34867844
1 10 0.1 0.38742049 0.38742049
2 45 0.01 0.43046721 0.19371024
3 120 0.001 0.4782969 0.05739563
4 210 0.0001 0.531441 0.01116026
5 252 0.00001 0.59049 0.00148803
6 210 0.000001 0.6561 0.00013778
7 120 0.0000001 0.729 8.748E-06
8 45 0.00000001 0.81 3.645E-07
9 10 0.000000001 0.9 9E-09
10 1 1E-10 1 1E-10
0 Si x < 0

F(x) =

1
Ejemplo 2:
• En una tienda de alquiler de automóviles,
cada vez que un cliente alquile un automóvil
debe pagar como mínimo $4. Además, si
alquila un auto tipo A debe pagar $15 mas, y
si alquila un auto tipo no A debe pagar $5
mas. La probabilidad de que cualquier cliente
alquile un auto tipo A es constante e igual a
0,7. Si cada uno de 5 clientes alquila un auto
en esta tienda:
a) Determine la distribución de probabilidades del
numero de clientes que alquilen automóviles
tipo A
b) Defina la función utilidad y calcule la utilidad
que espera la tienda si cada vez alquila 5
automóviles.
Ejemplo 3:
Suponga que llegan en forma aleatoria
una serie de llamadas a una central
telefónica con un promedio de tres
llamadas en intervalos de un minuto.
a) Calcule la probabilidad de que en cualquier
periodo de un minuto:
i. No ocurra llamada alguna
ii. Ocurran al menos 4 llamadas
b) Si cada llamada cuesta S/.0,50 ¿Cuánto es
el costo esperado por llamada?
Ejemplo 4:
• La empresa “T&C” produce un tipo de tela en
rollos de 100 metros. El numero de defectos que
se puede encontrar al desenrollar la tela es una
variable aleatoria de Poisson con un promedio de
4 defectos por cada 20 metros de tela.
a) ¿Qué probabilidad hay de que al desenrollar un
rollo de tela cualquiera se encuentre menos de tres
defectos en los primeros 50 metros?
b) Calcule la probabilidad de que al desenrollar la tela
no se encuentre defectos en el primer segmento de
5 metros de tela.
c) Si se desenrollan 5 rollos de tela escogidos al azar,
¿Cuál es la probabilidad de que no se encuentre
defectos en el primer segmento de 5 metros de tela
en al menos dos de ellos?
Ing. Dr. ELI TEOBALDO CARO MEZA
eltecame@gmail.com

También podría gustarte