Está en la página 1de 34

Probabilidad y

Estadística
Lección 1: Distribuciones muestrales y
Estimaciones
M.I. Yazmin Ruiz Bonilla ©
Ing. Sistemas
Computacionales
Febrero-Julio 2023
Muestreo aleatorio simple
El muestreo aleatorio simple selecciona muestras mediante
métodos que permiten que cada posible muestra tenga una igual
probabilidad de ser seleccionada y que cada elemento de la
población total tenga una oportunidad igual de ser incluido en la
muestra.
Muestreo aleatorio simple - conceptos
• Población Finita
• La población tiene un tamaño establecido o limitado, es decir, existe un número
entero (N) que indica cuántos elementos hay en la población.
• Población infinita
• Es aquella en la que es teóricamente imposible observar todos los elementos o
cuando hablemos de una población que no podría enumerarse en un periodo
razonable de tiempo.
• Muestreo con reemplazo
• El mismo elemento puede aparecer dos veces en la muestra.
• Muestreo sin reemplazo
• No se pueden repetir los elementos de la población en la generación de las
muestras.
Distribuciones muestrales
Distribución muestral
Si el proceso de seleccionar una muestra aleatoria simple se considera
como un experimento, la media muestral es el valor numérico del
resultado de ese experimento.
Por tanto, la media muestral es una variable aleatoria. Entonces, como
ocurre con otras variables aleatorias, 𝒙ഥ tiene una media o valor esperado,
una desviación estándar y una distribución de probabilidad.
Como los distintos valores que toma son resultado de distintas muestras
aleatorias simples, a la distribución de probabilidad de se le conoce como
distribución muestral de 𝒙 ഥ. Conocer esta distribución muestral y sus
propiedades permitirá hacer declaraciones de probabilidad de qué tan
cerca está la media muestral de la media poblacional μ.
Distribución muestral
La media de la variable aleatoria 𝒙
ഥ es el valor esperado
de 𝒙
ഥ . Sea E(ഥ
𝒙) el valor esperado de 𝒙ഥ y μ la media de la
población de la que se selecciona una muestra aleatoria
simple. Se puede demostrar que cuando se emplea el
muestreo aleatorio simple, E(ഥ𝒙) y μ son iguales.
Cuando el valor esperado de un estimador puntual es igual
al parámetro poblacional, se dice que el estimador puntual
es insesgado. Por tanto, la ecuación (7.1) muestra que es un
estimador insesgado de la media poblacional μ.
Características de la Distribución muestral
Los resultados anteriores respecto al valor esperado y a la desviación
estándar en la distribución muestral de 𝒙 ഥ son aplicables a cualquier
población. El paso final en la identificación de las características de la
distribución muestral de 𝒙
ഥ es determinar la forma de la distribución
muestral. Se considerarán dos casos:
En la figura 7.3 se muestra cómo funciona el teorema del límite
central en tres poblaciones diferentes; cada columna se refiere a
una de las poblaciones. En el primer renglón de la figura se muestra
que ninguna de las tres poblaciones está distribuida normalmente.
La población I tiene una distribución uniforme. A la población II se
le conoce como distribución en forma de orejas de conejo. Esta
distribución es simétrica, pero los valores más probables se
encuentran en las colas de la distribución. La forma de la población
III se parece a una distribución exponencial; es sesgada a la
derecha.
Relación entre el tamaño de la muestra y
la distribución muestral de x
La media de todos los valores posibles de 𝒙 ഥ es igual a la
media poblacional μ independientemente del tamaño n de
la muestra. Pero, el error estándar de la media, σ𝒙ҧ, está
relacionado con la raíz cuadrada del tamaño de la muestra.
Siempre que el tamaño de la muestra aumente, el error
estándar de la media disminuirá.
Ejercicio formativo: (Estimaciones puntuales)

1. Suponga que la desviación estándar poblacional es σ=25.


Calcule el error estándar de la media, σx, con muestras de tamaño
50, 100, 150 y 200.
Teorema del límite central
El teorema del límite central es, tal vez, el más importante de toda
la inferencia estadística, pues asegura que la distribución de
muestreo de la media se aproxima a la normal al incrementarse el
tamaño de la muestra.
La importancia del teorema del límite central es que nos permite
usar estadísticas de muestra para hacer inferencias con respecto a
los parámetros de población, sin saber sobre la forma de la
distribución de frecuencia de esa población más que lo que
podamos obtener de la muestra.
Estimación
Los administradores utilizan estimaciones porque, hasta en los
asuntos más triviales, deben tomar decisiones racionales sin contar
con la información pertinente completa y con una cuota de
incertidumbre de lo que el futuro pueda deparar.

Inferencia estadística
Rama de la estadística que se ocupa del uso de los conceptos de
probabilidad para manejar la incertidumbre en la toma de decisiones. La
inferencia estadística está basada en la estimación y en las pruebas de
hipótesis. Tanto en la estimación como en las pruebas de hipótesis,
haremos inferencias acerca de las características de las poblaciones a
partir de la información proporcionada por las muestras.
Tipos de estimaciones
Estimación
puntual Es un solo número que se utiliza
para estimar un parámetro de
población desconocido.
Estimación
de Es un conjunto de valores que se
intervalo utiliza para estimar un parámetro
de la población.
Fórmulas: cuando no se conoce la
desviación estándar de la población
Fórmula: cálculo de niveles de confianza
Niveles de confianza
Nivel de confianza valores aproximados de z

68.3% 𝑥±1σ
ҧ 𝑥ҧ

90% 𝑥±1.64σ
ҧ 𝑥ҧ

95% 𝑥±1.96σ
ҧ 𝑥ҧ

95.5% 𝑥±2σ
ҧ 𝑥ҧ

99% 𝑥±2.58σ
ҧ 𝑥ҧ

99.7% 𝑥±3σ
ҧ 𝑥ҧ
Prácticas asíncronas (bloque 1)
1

2
Ejercicios formativos
Estimaciones de intervalo de la
proporción a partir de muestras grandes
Los especialistas en estadística, a menudo, utilizan una
muestra para estimar la proporción de ocurrencias de un
evento en una población. Por ejemplo, el gobierno estima,
mediante un procedimiento de muestreo, el índice de
desempleo o la proporción de personas sin trabajo de la
fuerza laboral del país.
Teóricamente, la distribución binomial es la distribución
correcta a utilizar en la construcción de intervalos de confianza
para estimar una proporción de población.
Ejemplo
Para una organización muy grande, hacemos la estimación
de qué proporción de sus empleados prefieren planificar su
propios beneficios de retiro en lugar de seguir un plan
patrocinado por la compañía. Primero, tomamos una
pequeña muestra aleatoria de 75 empleados y
encontramos que el 0.4 de ellos están interesados en
seguir sus propios planes de retiro.
Fórmulas: Cálculo de estimaciones de intervalo
de la proporción a partir de muestras grandes
Estimación

A continuación, la administración solicita que utilicemos esta


muestra para encontrar un intervalo en el que puedan tener 99%
de confianza de que contiene a la proporción verdadera de la
población.
Un nivel de confianza del 99% incluiría 49.5% del área que se encuentra
a cualquier lado de la media de la distribución de muestreo.
El cuerpo de la tabla 1 del apéndice nos dice que 0.495 del área bajo la
curva normal está localizada entre la media y un punto que se
encuentra a 2.58 errores estándar de la media. En consecuencia, 99%
del área está contenida entre más y menos 2.58 errores estándar de la
media. Nuestros límites de confianza entonces son:
Entonces, estimamos a partir de nuestra muestra de 75 empleados
que, con 99% de confianza, creemos que la proporción de la
población total de empleados que desean establecer sus propios
planes de retiro está entre 0.253 y 0.547.
Prácticas asíncronas (bloque 1)
3

4
Fuentes de referencia bibliográfica

También podría gustarte