Está en la página 1de 54

UNJu – Facultad de Ingeniería

Probabilidad y Estadística

Muestreo y Distribuciones
Muestrales
MUESTREO PROBABILISTICO
PROBLEMA: Por razones de gobierno se desea
conocer el ingreso promedio de los habitantes de una
determinada provincia "en un momento dado",
entrevistando para tal propósito a las unidades
familiares que viven en la provincia
POBLACION (o UNIVERSO) de nuestro estudio:
¿conjunto de unidades familiares en la provincia en
estudio?
La población es el conjunto de ingresos totales ($) de
las citadas unidades familiares.
Nos interesan las mediciones de la variable "ingreso"
($) y no la entidad física "unidad familiar".
POBLACION es la totalidad de observaciones en las que
se está interesado.

Una MUESTRA es un subconjunto de la población

Métodos alternativos para reunir la información


necesaria:
(a) CENSAR: Esto es, entrevistar a todos los integrantes
de la población.
(b) MUESTREAR: Entrevistar solamente a un
subconjunto de la población.
MUESTREO
1) Casos en los que siempre debe muestrearse (debido a
características de la población, naturaleza del método de
estudio, etc.):
* Población infinita.
* Población de tamaño desconocido.
* Muestreo destructivo.

2) A menudo conviene muestrear por razones de:


Tiempo: oportunidad – cambios en la población - Costo -
Calidad
DESVENTAJAS DEL MUESTREO
1) La información de una muestra no es la de la
población. Se introduce un elemento más de
aproximación.
2) Cuando se quiere desagregar mucho a los datos
(clasificaciones cruzadas por varios atributos), la
cantidad de información juega un papel preponderante.
Aún los censos pueden resultar insuficientes para que
ciertas clasificaciones cruzadas tengan relevancia
estadística.
TIPOS DE MUESTRAS
Si las inferencias de la muestra para la población
han de ser válidas, es importante obtener muestras
representativas de la población.

a) Muestra seleccionada "por expertos" De


alguna manera especial se decide la muestra que se
tomará, basada en razonamientos o consideraciones de
algún tipo. Por ejemplo, si hay un experto de la población
bajo estudio, podría proponer una muestra “a juicio” que
garantice representatividad. Esta muestra no necesita ser
muy grande para proporcionar información de buena
calidad. Dado que esta muestra proviene del buen juicio de
un experto podría ser cuestionada, pero la experiencia es
garantía en muchas situaciones.
b) Muestra Probabilística : Es aquella en la que los
elementos de la muestra se seleccionan con base en
probabilidades conocidas.

b1) "Al azar o aleatorio": Las formas más sencillas de


este método consiste en poner a toda la población en
una urna, y extraer al azar, con reposición o sin ella, la
muestra del tamaño deseado. Es decir se pueden
utilizar dos métodos básicos para seleccionar la
muestra al azar: con reemplazo o sin reemplazo.
Con Reemplazamiento:
Todas las muestras tienen la misma probabilidad de ser
seleccionadas y
Todas las unidades de la población tiene la misma
probabilidad de ser seleccionadas para formar parte
de la muestra.
Coincide con el muestreo de poblaciones
infinitas.
Esquema de un muestreo aleatorio
simple
Población finita de tamaño N

8
N-6 N
5
2
6
... N-2
1
4 N-3 N-5
3
7 N-1
N-4

Selección aleatoria simple

2 5
1
...
Muestra aleatoria simple de
n
3
4 6 tamaño n
Sin Reemplazamiento:
Cada una de las Comb(N, n) muestras, tiene la misma
probabilidad de ser escogida.
N: tamaño de la Población y n: tamaño de la muestra.
Todas las unidades de la población tienen la misma
probabilidad de ser extraídas, pero si la población es
finita, la probabilidad de que salga un elemento
dependerá de los que fueron separados anteriormente
para formar parte de la muestra y dejaron, por lo tanto,
de pertenecer a los seleccionables.
También se llama a este método: muestreo irrestricto
aleatorio o muestreo aleatorio simple (muestreo al azar sin
reemplazamiento).
Ya sea que se realice el muestreo con reemplazo en
poblaciones finitas o sin reemplazo en poblaciones
infinitas (tal como algunos procesos continuos de
producción) las fórmulas que se utilizan son las
mismas.
b2) MUESTREO ESTRATIFICADO es aquel en que los
elementos de la población se dividen en clases o
estratos, y la muestra se toma asignando un número
determinado de miembros a cada estrato y escogiendo
por muestreo al azar dentro del estrato.
Existen dos criterios básicos para dividir el
tamaño total entre los estratos:
a) A cada estrato le corresponde igual número de
elementos muéstrales.
b) Proporcionalmente al tamaño relativo del
estrato en la población. La distribución se hace de
acuerdo con el peso (tamaño) de la población en
cada estrato.
Esquema de un muestreo aleatorio
estratificado
Población finita de tamaño
N1 + N2 + .. +NL=N
Estrato 1 Estrato 2 Estrato l
. . .
N1 N2 NL

2 2 1
1 1 2 3
4 5
4 3 4 5 6 6
...
3 7
6 7 8
5 N1 8
... ... N2 NL
7 9 ...
Muestra aleatoria Muestra aleatoria
Muestra aleatoria
simple simple
simple

1 1 2 1 2
2 3 ...
... ...
3 n1 3 nL
4 n2

Muestra aleatoria estratificada de tamaño

n = n1 + n2+ …+ nL
Ejemplo de muestreo Estratificado

Muestra

Población
b.3 Otro tipo de muestreo que se utiliza cuando los
elementos de la población están ordenados en listas es
el MUESTREO SISTEMATICO.
Si la población tiene tamaño N, se desea una muestra
de tamaño n.
Sea k = entero más próximo a N/n.
Se elige al azar un elemento entre los primeros k
elementos de la lista → n1 es el orden elegido.
Tomamos los elementos n1+k; n1+2k, etc., a
intervalos fijos de k hasta completar la muestra.
• Si el orden de los elementos en la lista es al azar, este
procedimiento es equivalente al muestreo al azar o
aleatorio.
• Si el orden de los elementos es tal que los individuos
próximos tienden a ser mas semejantes que los
alejados, el muestreo sistemático tiende a ser más
preciso que el muestreo al azar, al cubrir más
homogéneamente toda la población.
El muestreo sistemático puede utilizarse
conjuntamente con el estratificado, para seleccionar la
muestra dentro de cada estrato.
Ejemplo de muestreo Sistemático

Población

Muestra cada 3er elemento


b.4.1 MUESTERO ALEATORIO POR
CONGLOMERADOS
La unidad muestral ya no son los individuos, sino un
conjunto de individuos que bajo determinados aspectos, se
considera que forman una unidad.
Busca, al contrario que el estratificado, heterogeneidad
dentro de los estratos y homogeneidad entre estratos.
En pequeña escala, cada conglomerado es una
representación del universo.
b.4.2. MUESTREO POLIETÁPICO POR
CONGLOMERADOS
Es un submuestreo del conglomerado. Se utiliza cuando
el número de conglomerados es elevado. Selecciona los
individuos por etapas, configurando sucesivamente
grupos (estratos o conglomerados) y subgrupos
denominados Unidades de Muestreo primarias,
secundarias, terciarias, etc.
Para poblaciones muy heterogéneas se utiliza el
MUESTREO POLIETAPICO por Conglomerados: Por
ejemplo para seleccionar una muestra de personas de
Salta podemos seleccionar por muestreo aleatorio simple
barrios, después calles dentro de los barrios, luego
viviendas de la calle y finalmente, el piso dentro de la
vivienda, etc.
Ejemplo de muestreo por Conglomerados

Muestra (2
grupos)
Población
La regla general que se aplica a todos los
procedimientos de muestreo es que cualquier
información previa debe utilizarse para subdividir la
población y asegurar la mayor representatividad de
la muestra. Una vez que disponemos de
subpoblaciones homogéneas, la selección dentro de
ellas debe realizarse por muestreo al azar.

En todo lo que sigue SUPONDREMOS SIEMPRE que


la muestra proviene de un muestreo al azar.
MODELO PARA MUESTREO AL AZAR CON REPOSICION

Por algún procedimiento práctico adecuado, se va a seleccionar al


azar, con reposición a n familias y se va a preguntar a las
respectivas familias sus ingresos totales, por ejemplo en el último
año anterior al día del relevamiento.
Familia 1 Familia 2 Familia 3 … Familia n-ésima
Ingreso x1 Ingreso x2 Ingresox3 ... Ingreso xn

x1, x2, ... , xn será una muestra al azar con reposición de ingresos
($)
Si nuestro interés: El ingreso promedio de las n familias de la
provincia), podemos tomar el ingreso promedio de las n familias
entrevistadas
n

x
i 1
i
x
n
Si la selección hubiera recaído en otras n familias (lo que es
completamente factible, pues la selección fue hecha "al
azar"), ¿ 𝑿 podría haber tomado un valor distinto?
¿Podrían haberse presentado valores muy alejados del
que obtuvimos, de manera que por "pura casualidad"
tengamos un valor excepcionalmente alto o bajo?
Para analizar todas estas cuestiones, utilizamos el hecho
básico de que la selección fue hecha al azar y utilizaremos
algunas ideas de probabilidad y variables aleatorias.
MODELO: Usemos la v.a. X para designar a la variable
o característica que se quiere investigar.
n= 174.763 familias entrevistadas
En el ejemplo:
X es el “ingreso total de una unidad familiar”
X tiene una distribución de frecuencias relativas, que muestra las
proporciones de unidades familiares que tiene cada nivel de
ingreso total.
Si x es un valor de la v.a. X → x es el ingreso de una unidad
familiar.
Si hay k familias con ingreso x → k/ 174.763 es la proporción de
familias con ingreso x.
LA POBLACION ES UNA VARIABLE ALEATORIA X QUE
TIENE ALGUNA DISTRIBUCION DE FRECUENCIAS
RELATIVAS (que sumen 1).

Por cada valor de X distinto, se ponen en la urna tantas bolillas


como veces ese valor aparezca en la población y tendremos
una urna con bolillas en la misma proporción que la
distribución de frecuencias relativas.
Se extrae de esa población o urna, una muestra al azar de
tamaño n= 1.

Proposición Fundamental: Si designamos por X1 el valor


que resultará seleccionado, X1 es una variable aleatoria
cuya distribución de probabilidad es la distribución de
frecuencias relativas de X.
Si X2 registra el valor que resultará seleccionado en la segunda
unidad muestral, X2 es una variable aleatoria con la misma
distribución de X y es INDEPENDIENTE de X1.
Conclusión: Si X1, X2,...,Xn son las variables aleatorias del
muestreo al azar con reposición, entonces
FX i = FX para cada i = 1, 2, …, n. Esto es P( X i ≤ a ) = P( X ≤ a )

Si X1, X2,...,Xn son variables aleatorias INDEPENDIENTES


cada una con la distribución de probabilidad de X, definimos
X1, X2,...,Xn como una MUESTRA ALEATORIA de variables
aleatorias de la población X.
M U E S T R E O A L A Z A R SIN R E P O S I C I O N (SIMPLE)
Hasta X 1 es lo mismo que en el modelo anterior.

Proposición: Si X 1 , X 2 ,...,X n son las variables


aleatorias del muestreo sin reposición de una
población de tamaño N > n, y X es la variable
aleatoria de la población, entonces X 1 , X 2 ,...,X n
tienen marginalmente la misma distribución de X
pero no son independientes.

(Es así pues X 2 es el valor que resultará


seleccionado y hasta tanto no salga
seleccionado x 1 la distribución de X 2 será igual a
la Distribución de X).
Ejemplo: Sea una urna con 100 bolillas de las cuales 20 están
marcadas con el número uno, 30 con el dos y 50 con el tres.
Analice el experimento aleatorio consistente en extraer dos
bolillas al azar, con y sin reposición.

La distribución de probabilidad de v.a. poblacional X “la


puntuación de bolilla extraída” es:

x P(X = x)
1 0,20 =20/100
2 0,30 =30/100
3 0,50 = 50/100
Las posibles muestras de tamaño 2 y sus respectivas
probabilidades se presentan en la tabla siguiente:

Caso A: Extracciones con reposición

P(X1 = x1, X2 = x2 ) = P(X1 = x1)*P(X2 = x2 │ X1= x1) = P(X1 = x1)*P(X2 =x2 )


Caso B: Extracciones sin reposición

P(X1 = x1, X2 = x2 ) = P(X1 = x1) P(X2 = x2 │ X1 = x1)


P(X1 = 1, X2 = 1 ) = 20/100 * 19/99=380/9990
Como 198/990 = 0,20, 297/990 = 0,30 y 495/990 = 0,50, en este
caso resulta que marginalmente los acontecimientos “1”, “2” y “3”
tienen las misma probabilidades en ambos casos. Note sin embargo
que el cuerpo de las tablas es distinto y que en el caso sin reposición
no hay independencia.
DEFINICIONES
Concepto En Muestreo En términos de variables aleatorias
Población Conjunto de mediciones de una Variable aleatoria (X) y su distribución de
característica, para los individuos probabilidad.
de un grupo bien definido. (Nota: ver definición “alternativa” de v.a. en
A menudo también la población las notas – Claramente la variable poblacional
física (personas, ratones, etc.) X concuerda con esa definición, y es una v. a.)
Muestra Subconjunto de la población Muestra al azar
Muestreo al Selección de una muestra con Conjunto de observaciones muestrales (Xi ),
azar probabilidades conocidas cada una es una variable aleatoria.
Parámetro Cualquier característica Parámetro (o función paramétrica) de la
mensurable de la población distribución de la variable aleatoria (cuando la
v. a. tiene una distribución paramétrica).
Estadístico Característica mensurable de la Función de las variables aleatorias
muestra muestrales, y por lo tanto también una v. a.
Parte 2
Definición: Se llama ESTADISTICO a cualquier función de las
variables aleatorias del muestreo y solo de ellas, y por lo tanto
también es una variable aleatoria-
U es un estadístico ↔ U = U (X1, X2, ..., Xn)

Una primera observación es que estos estadísticos son


también variables aleatorias, pues son transformaciones
(simples o complicadas) de las variables aleatorias X1, X2, ...,
Xn. Como además sabemos algo de la distribución de las Xi,
podemos aspirar a analizar a los estadísticos (tomados como
variables aleatorias) con mucho detalle.
Por ser un estadístico una variable aleatoria tiene una distribución
de probabilidad que se llama “Distribución muestral del
estadístico”.
Definición: Llamamos distribución muestral de un estadístico a su
distribución de probabilidad cuando se lo considera una variable
aleatoria.
Ejemplos:
Si x1, x2, ... , xn son los números obtenidos en el muestreo, todas
las operaciones con esos números nos permiten definir estadísticos.
x1+ x2+ … + xn= t → será un valor del estadístico T=X1+X2 +...+ Xn

x1 +x2 + … + xn X1 +X2 + … + Xn
=x → será un valor del estadístico x =
n n

T y x son variables aleatorias cuyas distribuciones de probabilidad


se llaman “Distribución Muestral de T” y “Distribución Muestral de x”.
OTROS ESTADÍSTICOS IMPORTANTES
Si X1, X2, ..., Xn es una muestra aleatoria de v. a. (iid) son de interés,
entre otros, los siguientes estadísticos ya estudiados en estadística
descriptiva que miden donde se concentra la distribución muestral,
su variabilidad, como así también posiciones no centrales de dicha
distribución.
X +X + … + Xn
x = 1 2 Media o promedio muestral
n
x Mediana Muestral
n
i=1 Xi − X 2
S2 = Varianza muestral
n−1
S = 𝑆2 Desviación estándar muestral
K = Mín (X1, X2, ..., Xn) Mínimo de la muestra
M = Máx (X1, X2, ..., Xn) Máximo de la muestra
R=M–K Rango muestral
𝑛
Estadísticos de orden: 𝑋(𝑗) j-ésima observación de la muestra
ordenada (en orden creciente) j = 1, 2, …, n
𝑛 𝑛 𝑛 𝑛 𝑛 𝑛
𝑋(1) ≤ 𝑋(2) ≤ 𝑋(3) ≤ … ≤ 𝑋(𝑛) con 𝑋(1) = 𝐾 ,𝑋(𝑛) =𝑀
EJEMPLO de la CONSTRUCCION DE LA DISTRIBUCION
MUESTRAL DE UN ESTADISTICO
1.- De una población finita de tamaño N, se extraen al azar
todas las muestras posibles de tamaño n.
2.-Se calcula el estadístico de interés para cada muestra.
3.-Se listan en una columna los distintos valores
observados del estadístico, y en otra columna las
frecuencias relativas correspondientes de cada valor
observado.
Problema: Sea una urna con 100 bolillas de las cuales 20 está
marcadas con el número uno, 30 con el dos y 50 con el tres. S
extraen dos bolillas al azar con reposición. Determine:
a)Distribución de probabilidad, esperanza y varianza de la
población.
b)Distribución de probabilidad de la muestra.
a) Distribución de probabilidad, esperanza y varianza de la
media muestral y de la varianza muestral.
Solución: a) Denominando X a la puntuación de la bolilla
extraída, la distribución de probabilidad de X es
x pX(x)
1 0,2
2 0,3
3 0,5
Calculamos su esperanza y varianza. E(X) =  = 2,3 V(X) = 2 = 0,61
a) La Tabla de Probabilidades Conjuntas de X 1 , X 2 )

b) Veamos a continuación el valor de la media y la varianza


para cada posible muestra:
Muestra s2 P(X 1 = x 1 ,
x
(x 1 , x 2 ) X 2 = x2)
(1,1) 1 0 0,04
(1,2) 1,5 0,5 0,06
(1,3) 2 2 0,10
(2,1) 1,5 0,5 0,06
(2,2) 2 0 0,09
(2,3) 2,5 0,5 0,15
(3,1) 2 2 0,10
(3,2) 2,5 0,5 0,15
(3,3) 3 0 0,25
Por lo tanto las distribuciones de probabilidad de la media
muestral y de la varianza muestral son:
x P( X = x)
1 P{(1,1)} = 0,04
1,5 P{(1,2), (2,1)}= 0,06 + 0,06 = 0,12

2 P{(1,3), (2,2), (3,1)} = 0,10 + 0,09 + 0,10 = 0,29

2,5 P{(2,3), (3,2)}= 0,15 + 0,15 =0,30

3 P{(3,3)} = 0,25
x
E( ) = 1∙ 0,04 + 1,5 ∙ 0,12 + 2∙ 0,29 +2,5 ∙ 0,30 + 3 ∙ 0,25 = 2,3
= E(X)
E(x2 ) = 12∙ 0,04 + 1,52 ∙ 0,12 + 22∙ 0,29 +2,52 ∙ 0,30 + 32 ∙ 0,25 =
5,59
σ2 0,61
V(X) = 5,59 – 2,32 = 0,305 = =
n 2
s2 P(S2 = s2)
P{(1,1), (2,2), (3,3)}=
0 0,04+0,09+0,25 = 0,38
P{(1,2), (2,1), (2,3), (3,2)}= 0,06 +
0,5 0,06 + 0,15 + 0,15 = 0,42
2 P{(1,3), (3,1)}= 0,10 + 0,10 = 0,20

E(S2) = 0∙ 0,38 + 0,5 ∙ 0,42 + 2∙ 0,20 = 0,61 = V(X)


E(S2 ) = 02∙ 0,38 + 0,52 ∙ 0,42 + 22∙ 0,20 = 0,905
V(S2) = 0,905 – 0,612 = 0,5329

El problema central de la estadística inferencial consiste en utilizar


la información disponible sobre distribuciones como las de X y S2
del ejemplo, para emitir juicios respecto a (la distribución) de la
población.
Nótese que la distribución muestral de un estadístico depende
de la distribución de la población, por supuesto de la fórmula
definitoria del estadístico y del proceso de muestreo incluso
el tamaño muestral. Si el muestreo hubiera sido sin
reposición, las distribuciones podrían haber sido diferentes,
por ejemplo. Estas consideraciones son válidas para la
mayoría de las distribuciones muestrales.
Normalmente, para una distribución muestral, se tiene interés en
conocer tres cosas: media, varianza y forma funcional.
Es bien conocida la dificultad que existe para elaborar una
distribución muestral de acuerdo al procedimiento anterior cuando
la población es muy grande. También constituye un problema
cuando la población es infinita. En este caso lo mejor que se
puede hacer es aproximar la distribución del muestreo para el
estadístico.
Ambos problemas pueden evitarse por medio de la matemática
1 Para el Caso de Muestreo al Azar Con Reposición de una
población X con E(X)= , Var(X) = 2

1°) E(X ) = E(X) = 


Demostración:
𝑋1 + 𝑋2 + … + 𝑋𝑛 1
E(𝑋) = 𝐸 = 𝐸 𝑋1 + 𝑋2 + … + 𝑋𝑛
𝑛 𝑛
1 1
= 𝐸 𝑋1 ) + 𝐸(𝑋2 ) + … + 𝐸( 𝑋𝑛 = 𝑛 = 𝐸(𝑋)
𝑛 𝑛
Notas: (1) La reposición o falta de ella no afecta este resultado,
pues la clave está en la “linealidad de la esperanza matemática”.
V(X) σ2
2°) V(X) = = pues las variables son X1, X2, … , Xn son
n n
independientes por ser el muestreo con reposición.
Demostración:
𝑛 2 𝑛 2
𝑖=1 𝑋𝑖 𝑖=1 𝑋𝑖 𝑛𝜇
V(𝑋) = E [𝑋 - E(𝑋)]2 = E [𝑋 –  ]2 =E − 𝜇 =E −
𝑛 𝑛 𝑛
𝑛 𝑛 2
𝑖=1 𝑋𝑖 𝑖=1 𝜇 1 𝑛 2
= E − = E 𝑖=1(𝑋𝑖 − 𝜇)
𝑛 𝑛 𝑛2
1 𝑛 𝑛
= 2 E( 𝑖=1(𝑋𝑖 − 𝜇) 𝑗=1(𝑋𝑗 − 𝜇)
𝑛
1 𝑛 𝑛
= 2E
𝑛 𝑖=1 𝑗=1(𝑋𝑖 − 𝜇) (𝑋𝑗 − 𝜇)
1 𝑛 𝑛
= 2
𝑛 𝑖=1 𝑗=1 𝐸 𝑋𝑖 − 𝜇 𝑋𝑗 − 𝜇
1 𝑛 2 𝑛 𝑛
= 2
𝑛 𝑖=1 (𝑋𝑖 −𝜇) + 𝑖=1 𝑗=1 𝐸 𝑋𝑖 − 𝜇 𝑋𝑗 − 𝜇
iǂj
1
= 2 𝑛𝑖=1 𝑉 𝑋𝑖 + 𝑛𝑖=1 𝑛
𝑗=1 𝐶𝑜𝑣 (𝑋𝑖 , 𝑋𝑗 ) 𝐶𝑜𝑣 𝑋𝑖 , 𝑋𝑗 = 0 por ser
𝑛
las Xi independientes iǂj
1 2 𝜎2
= 𝑛𝜎 =
𝑛2 𝑛
DISTRIBUCION MUESTRAL DE ALGUNOS ESTADISTICOS

1. DISTRIBUCION MUESTRAL DE LA MEDIA MUESTRAL


𝑋 +𝑋 + … + 𝑋𝑛
𝑋= 1 2 y/o del Total T= 𝑋1 + 𝑋2 + … + 𝑋𝑛
𝑛

1.1 Muestreo de poblaciones normales


Sea X1, X2, … , Xn una muestra aleatoria de una población X
con distribución normal con media  y varianza 2, entonces con
cualquier tamaño de muestra n, 𝑋 está normalmente distribuida
(con media  y varianza 2/n), al igual que el total T (con media
n  y varianza n 2). Esto es
𝜎2
𝑋 ~ N 𝜇𝑋 = 𝜇 , 𝜎𝑋2 =
𝑛
T ~ N 𝜇 𝑇 = 𝑛 𝜇 , 𝜎𝑇2 = 𝑛 𝜎 2
Ejemplo 𝑋: La duración de cierto tipo de baterías está normalmente
distribuida con media de 8 horas y desviación estándar de 1 hora.
a) Si se escoge aleatoriamente una batería, ¿cuál es la probabilidad
de que dure por lo menos 8,5 horas?
X tiene una distr. N (𝜇 = 8 ,  = 1)
P(X> 8,5)= 1- P(X ≤ 8,5)
8,5 −8
estandarizo P(Z ≤ ) = 1-0,6915=0,3085
1
El 30,85% de las baterías dura por lo menos 8,5 hs.
b)Si las baterías se venden en paquetes de 4 baterías. ¿Cuál es la
probabilidad de que la duración promedio de las 4 baterías, de un
paquete seleccionado, sea por lo menos de 8,5 horas?
𝜎2 1
𝑋 ~ N 𝜇𝑋 = 𝜇 = 8, 𝜎𝑋 = = Si n=4
𝑛 4
8,5 −8
P(𝑋 > 8,5) = 1 − 𝑃 𝑍 < = 1 − 𝑃 𝑍 < 1 = 0,1587
1
4
El 15,87% de paquetes de 4 las baterías, tendrá una duración
promedio de 8,5 hs o más
Ejemplo T: Un elevador de carga grande puede transportar un
máximo de 10.000 libras (5 toneladas). Suponga que una carga
que contiene 45 cajas se debe transportar mediante el elevador.
La experiencia ha demostrado que el peso X de una caja de este
tipo de carga se ajusta a una distribución de probabilidad con una
media de µ = 200 libras y una desviación estándar de  = 55
libras. ¿Qué probabilidad hay de que las 45 cajas se puedan
cargar en el elevador de carga y transportarse simultáneamente?
T peso total de las 45 cajas
Sabemos que T tiene distr. Normal (µ = 200 *45,  = 552 ∗ 45)
n=45 µ = 9000,  = 368,45
10000−9000
P(T ≤ 10000) = P(𝑍 ≤ ) = 𝑃(𝑍 ≤ 2,71) = 0,9966
368,95)
1.2 Muestreo de una población Bernoullí
Sea X1, X2, … , Xn una muestra aleatoria de una población X con
distribución Bernoullí entonces
Distribución muestral del total de éxitos de la muestra
T= 𝑋1 + 𝑋2 + … + 𝑋𝑛 ; T tiene distribución binomial con
parámetros n y p,
T representa el número de éxitos en la muestra de tamaño n

Distribución Muestral de la Proporción Muestral PS


𝑇 𝑋1 +𝑋2 + … + 𝑋𝑛
𝑋= = (= PS) tiene distribución binomial de
𝑛 𝑛
proporciones
PS representa la proporción de éxitos en la muestra
Ejemplo: Se toma una muestra de 250 casas de una población
para estimar la proporción de casas antiguas. Supongamos que
el 30% de todas las casas son antiguas. Hallar la probabilidad
de que la proporción de casas antiguas esté entre 0.25 y 0.35.
n*p y n*q ambos ≥5
E(PS)= p
𝑝 ∗𝑞
VAR(PS)=
𝑛

Factor de corrección por continuidad


1 𝑃 1
𝑃 (𝑎 − ≤ ≤ 𝑏+ )
2∗𝑛 2∗𝑛
P: proporción de casas antiguas
p = 0,30 q = 0,70 n = 250
1 2 3 250
Recorrido de P = {0, , , ,…, }
250 250 250 250
E(P)= 0,30 = p
Var(P) = 0,30∗
250
0,70
= 0,00084

Var(P)=0,029
a) 𝑷 𝟎, 𝟐𝟓 ≤ 𝒑 ≤ 𝟎, 𝟑𝟓 =aplico corrección por continuidad
1 1
𝑃 0,25 − ≤ 𝑝 ≤ 0,35 + = 𝑃 0,248 ≤ 𝑝 ≤ 0,352
2∗250 2∗250
Estandarizo
0,352−0,30 0,248−0,30
P(𝑍 ≤ ) - P(𝑍 ≤ )=
0,029 0,029
P(𝑍 ≤1,79) - P(𝑍 ≤-1,79) = 0,9633 – 0,0367 = 0,9266
1.3 Muestreo de una población X de cualquier forma
funcional (Teorema Central del Límite)
Dada una población X de cualquier forma funcional con una
media  y varianza 2 finita y sea X1, X2, … , Xn una muestra
aleatoria de esa población.
Si n es suficientemente grande el estadístico tiene
aproximadamente distribución Normal.
Esto es por ejemplo
𝜎2
Si n es grande, 𝑋 ~ N 𝜇𝑋 = 𝜇 , 𝜎𝑋2 =
𝑛
¿Qué tan grande debe ser la muestra para que el TCL sea
aplicable?
Regla empírica: En la mayoría de las aplicaciones prácticas
una muestra de tamaño 30 es suficiente.
En general, la aproximación a la normalidad del estadístico
mejora a medida que crece el tamaño de la muestra.
Distribución Muestral de la Varianza muestral S2
Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma
de una población normal que tiene varianza 2, entonces el estadístico
𝑛−1 𝑆 2 Xi − X 2
2 = = 𝑛
𝑖=1 𝑛−1
𝜎2

Tiene una distribución chi- cuadrado con = n – 1 grados de libertad.


Los valores de la variable aleatoria 2 se calculan con la fórmula
𝑛−1 𝑆 2
2 =
𝜎2

La probabilidad de que una muestra aleatoria produzca un valor 2 mayor


que algún valor especifico, es igual al área bajo la curva a la derecha de
este valor. El valor 2 por arriba del cual se encuentra un área de α por lo
general se representa como 2α
Ejemplo:
El tiempo que ocupan los estudiantes
mirando televisión en las semanas
anteriores a los exámenes finales (en
horas) tiene una distribución normal con
desvió estándar de 4,5 hs. Se tomó una
muestra de 30 estudiantes:
Indique si la probabilidad de que el
desvío estándar muestral supere las 3,5
hs es mayor a 0,95.
Si 𝑋 ~ 𝑁(𝜇, 𝜎 2 = 4,52) , Estadístico
𝑆 2 𝑛−1
que utilizamos tiene una distr.
𝜎2
𝜒 2 , con 𝝊 = 29 grados de libertad

3,52 ∗29
P(𝑆 2 > 3,52) = P(𝜒 2 > )
4,52
=P(( 𝜒 2 > 17,54 )=0,95311, concluimos
que si es mayor la probabilidad
BIBLIOGRAFÍA:
• Elementos de la Teoría del Muestreo - Dr. Raúl Pedro
MENTZ- Instituto de Investigaciones Estadísticas (INIE) -
Universidad Nacional de Tucumán
• Probabilidad y estadística para ingeniería y ciencias, Ronald
E. Walpole, Raymond H. Myers, Sharon l. Myers y Keying Ye.
(2012). Probabilidad y estadística para ingeniería y ciencias, 9ª
Edición. Ed. Pearson educación
• Estadística para Administración. Berenson – Levine –
Krehbiel. 4ta. Edición Ed. Pearson.
• Probabilidad y estadística para Ingeniería y Ciencias. Jay L-
Devore. 6ta. Edición (2005). Ed. Thompson
• Estadística para administración y economía, 10a. Edición
Anderson, David R.,Dennis J. Sweeney y Thomas A. Williams -
Cengage Learning
• Probabilidad y aplicaciones estadística, Meyer, Campos,
Cuellar, Esparza – Edición Revisada – Ed. Addison Whesley

También podría gustarte