Está en la página 1de 22

POBLACIÓN

Y
Docente:

Ali Guerra
MUESTREO Bachilleres:
José Alcántara C.I: 28.183.534
César Fernández C.I: 28.229.104
María Yánez C.I.: 28.684.172
IF-02
El Tigre, mayo de 2021
Distribuciones en el muestreo
Dond   = Desviación típica
para conocer tendencias o datos de una e
población, como por ejemplo puede ser un país,
  𝜎
como no es posible encuestar a todo el país, lo N= N° de individuos de la muestra
que se hace es encuestar un conjunto de √𝑁
individuos que pertenezca a esa población o lo
que es lo mismo, una muestra de la población.

Por tanto, si la La distribución normal de


población sigue una las medias muestrales,
𝑁 (𝜇 , 𝜎 )   𝜎
distribución normal de
media μ y desviación
típica σ
  tendrá la misma media
que la población, pero la
desviación típica estará
𝑁 𝜇,(√𝑁 )
dividida entre raíz de N
La duración media de las bombillas de una determinada marca sigue una distribución

Ejemplo
normal N (1500,160).
a) Si escogemos una bombilla al azar, ¿cuál es la probabilidad de que funcione más de
1524 horas?
b) Si escogemos una muestra de 100 bombillas y calculamos su duración media, ¿cuál
es la probabilidad de que sea superior a 1524 horas?

Si escogemos sólo una bombilla, estamos teniendo en cuenta toda la población que sigue una distribución normal de media μ y
desviación típica σ N (μ, σ), que en este caso es:
𝑁
  (1500 ,160)

Nos
  preguntan la probabilidad de que una bombilla funcione más de 1524 horas, es decir:

Por lo tanto:

La probabilidad de durar más de 1524 horas es igual a la probabilidad de que z sea mayor que 0,15 y para poder utilizar la tabla de
distribución normal, eso es igual a 1 menos la probabilidad de que z sea menor o igual a 0,15:

𝑃
  ( 𝑥>1524 )=𝑃 ( 𝑧 >0.15 )=1 − 𝑃(𝑧 ≤ 0.15)

La probabilidad de que z sea menor o igual a 0,15 la obtengo directamente de la tabla:


ejemplo
a) Si escogemos una bombilla al azar, ¿cuál es la
probabilidad de que funcione más de 1524 horas?

 Por ende:

Por lo que:

Por tanto, la probabilidad de que una


bombilla funcione más de 1524 horas es de
44,04% o lo que es lo mismo el 44,04%
podría durar más de 1524 horas.
ejemplo
b) Si escogemos una muestra de 100 bombillas y calculamos su
duración media, ¿cuál es la probabilidad de que sea superior a
1524 horas?

Entonce 𝜎 160
𝑁  𝜇 ,
s ( √𝑁 ) (
=𝑁 1500 ,
√ 100 )
= 𝑁 (1500,16)

Piden cuál es la probabilidad a que la duración media de esa muestra sea superior a 1524 horas:
 

Tipificamos la media, pero teniendo en cuenta la nueva desviación típica:

La probabilidad de la media sea superior 1524 horas es igual a la probabilidad de que z sea mayor que 1,5 y para poder utilizar la tabla de
distribución normal, eso es igual a 1 menos la probabilidad de que z sea menor o igual a 1,5:

𝑃
  ( ´𝑥 >1524 )=𝑃 ( 𝑧 >1,5 )=1 − 𝑃(𝑧 ≤1,5)
ejemplo b) Si escogemos una muestra de 100 bombillas y calculamos su
duración media, ¿cuál es la probabilidad de que sea superior a
1524 horas?

Obtengo la probabilidad de que z sea menor o igual a 0,15 directamente de la tabla:

𝑃  ( 𝑧≤ 1,5 )=0,9332
Por lo que:

𝑃  ( 𝑥>1524 )=𝑃 ( 𝑧>1,5 )=1 −0,9332=0,0668


Hay un 6,68% de probabilidad de que, si tomo una muestra de 100 bombillas, la media de su
duración sea superior a 1524 horas.
Distribución T
Es una distribución de probabilidad que surge del
problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la
muestra es pequeño y la desviación estándar

de Student poblacional es desconocida.

 
Sean X1, X2, . . . , Xn variables aleatorias
Propiedades de las distribuciones T independientes que son todas normales con media
1)
  Cada curva t tiene forma de campana con centro en 0. µ y desviación estándar . Entonces la variable
2) Cada curva t, está más dispersa que la curva normal estándar z. aleatoria tiene una distribución t con V= n-1
3) A medida que V aumenta, la dispersión de la curva T correspondiente grados de libertad.
disminuye.
4) A medida que , la secuencia de curvas T se aproxima a la curva normal
estándar, por lo que la curva z recibe a veces el nombre de curva T con gl = 

La distribución de la variable aleatoria t está dada por: La distribución t difiere de la de Z en que la


varianza de t depende del tamaño de la muestra y
siempre es mayor a uno. Únicamente cuando el
−(𝑣+1 ) tamaño de la muestra tiende a infinito las dos
  Γ [(𝑉 +1)/2] 𝑡2
h (𝑡)=
Γ (𝑉 /2) √ 𝜋𝜐
1+
𝑉 ( ) 2
, −∞ <𝑡< ∞ distribuciones serán las mismas.

Esta se conoce como la distribución t con V grados de libertad.


ejemplo Encuentre la probabilidad de –
t0.025 < t < t0.05.

𝛼  =0.025 𝛼  =0.05

  Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda, encontramos un área
total de

𝑃
  ( − 𝑡 0.025 < 𝑡 <𝑡 0.05 ) =0.925
es una distribución probabilística continua que se apoya en un

Ji Cuadrado
parámetro que representa a los grados de libertad, la utilidad de
este tipo de distribución es permitir determinar la relación entre
dos variables, es decir, si existe o no dependencia estadística
entre ellas.

 
Ejemplo:

La siguiente tabla refleja la cantidad de estudiantes, según


calificación obtenida en idioma de dos universidades:

  DEFICIEN REGULA BUENO TOT


TE R AL  Grado de libertad: V = (N° Filas - 1) X (N° Columnas – 1)
UPTJA 7 20 14 41 V = (2 – 1) X (3 – 1) = 1 X 2 = 2
A
UNEFA 11 17 9 37
TOTAL 18 37 23 78
¿Influye
  el tipo de universidad en la calificación obtenida?
Margen de error: 0,01
: No influye el tipo de universidad
: si influye el tipo de universidad
Ji Cuadrado

 
 

10,5965 > 2.0258


=
Es la que se usa para comparar las varianzas de dos poblaciones
diferentes o independientes, cada una de las cuales sigue una

F de Fisher
distribución normal.
La distribución que sigue la varianza de un conjunto de muestras
de una sola población normal es la distribución ji-cuadrada (Χ2)
de grado n-1, si cada una de las muestras del conjunto tiene n
elementos.

Por lo tanto, el estadístico F sigue una


La variable aleatoria F o estadístico F propuesto por Ronald Fisher distribución teórica dada por la siguiente
(1890 – 1962) es el que se usa más frecuentemente para comparar las fórmula:
varianzas de dos poblaciones y se define de la siguiente manera:
𝑈
  𝑑1
𝐹=
𝑆2 𝑉
  1
2 𝑑2
𝜎1
𝐹= 2
𝑆2
2
𝜎2
Siendo U la distribución ji-cuadrada con d1 = n1 – 1 grados
Siendo s  la varianza muestral y σ  la varianza poblacional. Para de libertad para la población 1 y V la distribución ji-cuadrada
2 2

distinguir cada uno de los dos grupos poblacionales, se utilizan los con d2 = n2 – 1 grados de libertad para la población 2.
subíndices 1 y 2 respectivamente.
El cociente definido de esta forma es una nueva distribución
Se sabe que la distribución ji-cuadrada con (n-1) grados de libertad es
la que sigue la variable auxiliar (o estadístico):
de probabilidad, conocida como distribución F con d1 grados
de libertad en el numerador y d2 grados de libertad en el
denominador.
2 2 2
 𝑥 =( 𝑛 − 1 ) 𝑠 / 𝜎
Se puede definir que cierta muestra dada de un
tamaño muestral específico tiene la misma
oportunidad de ser seleccionada de cualquier otra

Muestreo simple aleatorio muestra del mismo tamaño. A su vez, el tamaño


muestral indica el numero de elementos que posee
dicha nuestra muestra.

Formula
n: Muestra Nivel de confianza
E: Error
99.7% ----- Z = 3,00
N: Población
99% ------- Z = 2,58
Cuando no se 98% ------- Z = 2,33
conoce el   𝑍 2 × 𝑃× 𝑄
𝑛= 96% ------- Z = 2,05
tamaño de la 𝐸2
población 95.45% --- Z = 2,00
95% ------- Z = 1,96
90% ------- Z = 1,645
Cuando se
conoce el   𝑍 2 × 𝑃 ×𝑄 × 𝑁 80% ------- Z = 1,28
𝑛=
tamaño de la 2 2
𝑁 × 𝐸 +𝑍 × 𝑃 ×𝑄 66.27% --- Z = 1,00
población
50% ------- Z = 0,6754
Se requiere estudiar la preferencia de un nuevo producto en una

ejemplo
población, de la cual no se ha realizado ningún estudio. Se acepta un
margen de error máximo del 4%. Se debe determinar el tamaño de la
muestra con un nivel de confianza de 96%

no se conoce el tamaño de la población

𝑍 2 × 𝑃× 𝑄  
2
2,05 ×0,5 ×0,5 1,0506
 
𝑛= 2
𝐸

𝑛= 2 = =656,625
P = 0,5 (Debido a que no se
ha realizado ningún estudio 0,04 0,0016
en la población)
Q = 1 - P = 1 - 0,5 = 0,5
Z = 2,05 𝑛=656
 

E = 4% = 0,04
Este proceso consiste en seleccionar uno o

Muestreo sin reposición mas elementos de una población, sin


regresarlo y sin considerar su elección, lo
que significa que no puede ser escogido
nuevamente.

Ejemplo:
En una tienda de ropa, un grupo de camisa se estima en 80,
de los cuales 10 son unicolor. Si se toman aleatoriamente 3
camisas de montón. Calcule la probabilidad de encontrar
camisa unicolor.  

  La probabilidad de encontrar una camisa unicolor


es de:
P (2 unicolor) = 10 (0,0992) = 0,992 = 99,2%

  La probabilidad de encontrar una camisa con


estampado:
También conocido como ensayo de Bernoulli, es un
experimento aleatorio con el cual solo se pueden tener 2

Muestreo con reposición posibles resultados. Normalmente es etiquetado como éxito y


fracaso
Probabilidad de éxito = P
Probabilidad de fracaso = Q = 1 – P

 
Ejercicio:
Se lanza un dado ordinario cuatro veces en sucesión. Determine la probabilidad de que en los cuatro lanzamientos se
obtenga exactamente dos veces el seis.
Denotemos por S el evento: “sale seis” y por N: “no sale seis”, y los cuatro lanzamientos del dado por (X1, X2, X3,
X4) donde cada una de las x; puede ser S o N.
Un resultado posible es (S, S, N, N) cuya probabilidad de que ocurra es (por ser eventos independientes:

Pero este es un caso específico. El número total de formas en que pueden obtenerse dos 6 y dos de cualquier otro
número es:

De modo que la probabilidad de obtener 2 veces el seis en 4 lanzamientos de un dado es:


Dos eventos son independientes cuando los

Eventos independientes resultados del primer evento no afectan los


resultados del segundo evento.

Ejercicio:
¿Cuál es la probabilidad de que al lanzar un dado y una moneda me salga el número 4 y cruz?

Cruz, 1 Cara, 1
Cruz, 2 Cara, 2
Cruz, 3 Cara, 3
Cruz, 4 Cara, 4
Cruz, 5 Cara, 5
Cruz, 6 Cara, 6

  1 1 1
× = =0,0833=8.33 %
6 2 12
Dos eventos son dependientes cuando los

Eventos dependientes resultados del primer evento afectan al


resultado del segundo evento.

Ejercicio
En una caja tengo 10 jabones, de los cuales cuatros tiene olor a nueces. ¿Cuál es la probabilidad de que
saque dos jabones con olor a nueces sin devolución?

  4 3 12 6 2
× = = = =0,1333=13.33 %
10 9 90 45 15
Estas tablas se caracterizan por tener una serie de

Tabla de números desordenados del 0 al 9 que ocasionalmente


están ordenados a manera de bloques para facilitar su
lectura, pero no sigue ningún patrón y se pueden leer en

números cualquier sentido.

aleatorios
La siguiente cadena de dígitos sería una muestra de una parte de una tabla de dígitos aleatorios:
10480, 15011, 01536

Los pasos más importantes a seguir para utilizar la tabla es


identificar los elementos dividiéndolos en dígitos del tamaño
de la población y utilizar las guías de la tabla, leyendo de
derecha a izquierda, para ubicar una fila acorde a la muestra.

Un ejemplo para entenderlo vendría a ser que en un hospital


fueron vacunadas 150 personas contra el covid-19 y se pide
una muestra de 10 personas escogidas al azar de la tabla.
Empezamos leyendo la tabla de izquierda a derecha y de arriba
abajo, buscamos los primeros 10 números comprendidos entre
0 y 150 (resaltados en la tabla anterior con color rojo). Estos
números son 104, 94, 103, 71, 23, 10, 70, 24, 7, 53.
Se
  llama variaciones ordinarias de m elementos tomados de n en n a los

Variaciones
distintos grupos formados por n elementos de forma que:
a) No entran todos los elementos.
b) Sí importa el orden.
c) No se repiten los elementos.

Formula:
Variaciones con repetición:
𝑚
𝑉
  𝑛 =𝑚 ( 𝑚 − 1 ) ( 𝑚 − 2 ) ( 𝑚 − 3 ) …(𝑚 − 𝑛+1) Se llama variaciones con
repetición de m elementos
tomados de n en n a los distintos
También podemos calcular las variaciones mediante factoriales:
grupos formados por n elementos
de manera que:
  𝑚 𝑚!
𝑉 𝑛=
( 𝑚 −𝑛 ) !
  No entran todos los elementos si . Sí importa el orden.
Sí pueden entrar todos los elementos si . Sí se repiten los elementos.
Las variaciones se denotan por:

𝑚 𝑚 𝑛
𝑉
  𝑛 𝑜 𝑉 𝑚, 𝑛  𝑉𝑅 𝑛 =𝑚
  Sí entran todos los elementos.
a)

Permutaciones
b) Sí importa el orden.
c) No se repiten elementos.

Permutaciones circulares Permutaciones con repetición

 Permutaciones con repetición de n


Se utilizan cuando los elementos se han
elementos donde el primer elemento se
de ordenar "en círculo", (por ejemplo,
repite a veces , el segundo b veces , el
los comensales en una mesa), de modo
tercero c veces,... de tal modo que
que el primer elemento que "se sitúe" en
son los distintos grupos que pueden
la muestra determina el principio y el
formarse con esos n elementos de forma
final de muestra.
que :
a) Sí entran todos los elementos
b) Sí importa el orden
c) Sí se repiten los elementos
𝑃𝐶
  𝑛 = 𝑃𝐶 𝑛 − 1=(𝑛− 1) !

  𝑎𝑛 , 𝑏 ,𝑐 , … = 𝑃𝑛
𝑃𝑅
𝑎 ! ∙ 𝑏! ∙ 𝑐 ! ∙ …
Distribución
En
  numerosas ocasiones se plantea estimar una proporción o porcentaje.
En estos casos la variable aleatoria toma solamente dos valores diferentes
(éxito o fracaso), es decir sigue una distribución binomial y cuando la
extensión de la población es grande la distribución binomial B(n,p) se

de
aproxima a la normal .

proporciones
Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una distribución normal

 
𝑝𝑞
𝑁(𝑝,
𝑛
)

donde p es la proporción de uno de los valores que presenta la variable estadística en la población y q=1-p.
Si tiramos una moneda no trucada 100

ejemplo veces, ¿cuál es la probabilidad de que


obtengamos más de 55 caras?

En una moneda no trucada la proporción de caras es 0,5, con lo que


 p=0,5  q=0,5  n=100
La distribución muestral de proporciones se distribuye:
N(0,5 , 0,05)

Si llamamos p' a la proporción en la muestra hemos de calcular la probabilidad

P(p'>0,55) = P(z>1) =
= 1 - P(z £ 1) = 1 - 0,8413 = 0,1587