Está en la página 1de 28

Bienvenido a la sesión uno de la materia “Estadística Aplicada” de la Licenciatura en

Administración de Empresas.

1
A continuación se listan las sesiones que se desarrollarán durante este curso:

1. Introducción al muestreo.
2. Distribuciones muéstrales.
3. Estimación de parámetros.
4. Pruebas e hipótesis.
5. Pruebas de hipótesis con la distribución ji cuadrada.
6. Análisis de regresión lineal simple.
7. Análisis de series de tiempo.
8. Pruebas estadísticas no paramétricas.

2
En esta sesión abordaremos el tema de Distribuciones muéstrales.

3
El objetivo general de esta sesión consiste en explicar las razones fundamentales de la
obtención de muestras identificando teoremas que fundamentan la utilización de una
muestra para inferir las características de una población.

4
Esta es la agenda para esta sesión:

Subtema 1. La distribución muestral de la media.


Subtema 2. El teorema central del límite.
Subtema 3. La distribución muestral de la población.
Subtema 4. La distribución muestral de la varianza.

5
Los objetivos específicos de esta sesión son los siguientes.

Objetivo cognitivo: interpretar los diferentes tipos de distribución muestral


evaluando los distintos métodos, para obtener evidencia en la toma de decisiones.
Objetivo procedimental: analizar una distribución muestral utilizando el método
más adecuado para el estudio estadístico de toma de muestras.
Objetivo actitudinal: valorar el teorema del límite central a través de un análisis
estadístico para determinar el tamaño óptimo de una muestra.

6
Hemos visto en la sesión 1 las razones por la cuales, el análisis estadístico se tiene que
realizar por medio de una muestra. También definimos los distintos tipo de muestreo.
Ahora veremos en que consiste una distribución de muestreo.

Según (Levin, 2004) “Una distribución de probabilidad de todas las medias posibles de las
muestras es una distribución de las medias de las muestras. Los especialistas en estadística
la conocen como distribución de muestreo de la media” (p.248).

7
El valor futuro o valor nominal como también se le conoce, es el producto de la suma del
capital más los intereses generados en el periodo, representa el monto de una cantidad
presente en algún momento del futuro valuados en función del tiempo y tasa de interés.

8
Para calcular la media de la población sumamos todos los valores y los dividimos entre el
número de datos, por lo tanto. Tenemos que sumar 1+2+3 = 6, después los dividimos entre
3 , y la media de la población es igual a 2.

9
Para obtener la distribución muestral de la media se seleccionó, sin reemplazos de la
población, todas las muestras posibles de tamaño 2 y se calcularon las medias de cada
muestra.
Para ello, se emplea la fórmula de las combinaciones.
𝑁!
N𝑐𝑛 = 𝑛! 𝑁−𝑛 !
Para aplicar la fórmula debemos aclarar que 3! (tres factorial) significa 3*2*1 =6 y 0! (cero
factorial) es igual a 1.

10
Sustituyendo en la formula de las combinaciones nos quedaría en el numerador 3! (tres
factorial que sería igual a 3*2*1 igual a 6 ; en denominador es 2! (dos factorial)* (3-2)! (tres
factorial menos dos factorial) = dos factorial * uno factorial que es igual a dos; por lo tanto,
nos queda (6/2) igual a 3. las muestras correspondientes son: 1,2 ; 1.3 y 2,3.

11
Vamos a describir la gráfica.
1. Tenemos tres muestra
2. Las tres muestras están formadas por 1,2 ; 1,3 y 2,3
3. La suma se obtiene 1+2 = 3 ; 1+3 =4 y 2+3=5
4. La media se calcula de la siguiente forma (3/2)=1.5 ; (4/2) = 2 , finalmente (5/2) = 2.5

12
La media de la distribución muestral de la media se obtiene al sumar las medias muestrales
y dividir la suma entre el número de muestras.
Suma de todas las medias muestrales
𝜇=
Total de muestras
1.5 +2 +2.5 6
𝜇= =3=2
3

13
Podemos concluir:
1. La media de las medias de las muestras es exactamente igual a la media de la población.
2. La dispersión de la distribución muestral de la media es más estrecha que la distribución
poblacional.
3. La distribución muestral de la media suele tener forma de campana y se aproxima a la
distribución de probabilidad normal (Lind, D. A., & Marchal, W. G. 2012, p.277).

14
En un proceso de muestreo, el teorema central del limite es muy importante en una
distribución muestral de medias, ya que nos permite utilizar una distribución normal para
realizar pruebas de hipótesis e intervalos de confianza.

15
Teorema central del límite

Si todas las muestras de un tamaño en particular se seleccionan de cualquier población, la


distribución muestral de la media se aproxima a una distribución normal. Esta
aproximación mejora con muestras más grandes. (Lind, D. A., & Marchal, W. G. 2012,
p.279).

16
Analizando la gráfica tomada de (Lind, D. A., & Marchal, W. G. 2012, p.280) podemos
observan que en la medida que las muestra crecen pasando de n= 2 ; n = 6 y n=30 el
teorema nos muestra que con un muestra de 30 o más la distribución que resulta es una
distribución en forma de campana, es decir, una distribución normal, donde podemos ya
aplicar pruebas de hipótesis e intervalos de confianza.

17
En un análisis estadístico de la población por medio de muestreo, una distribución muestral
de la población, es cuando extraemos todas las muestras posibles.
Una vez obtenidas las muestras tenemos que calcular sus probabilidades asociadas a cada
una de ellas.

18
Considere la siguiente población:
A,B y C
Para obtener el número de muestras que debemos realizar, nos apoyamos de la fórmula de
las combinaciones:
𝑁!
N𝑐𝑛 = 𝑛! 𝑁−𝑛 !
3! 3∗2∗1 6
3𝑐2 = 2! 3−2 !
= 2!∗1!
=2 = 3
El número de muestras son tres:
La muestras son las siguientes: AB,AC y BC
Note que esta AB, por lo que BA ya no se considera.

19
La distribución de las muestras queda de la siguiente forma:
Muestra Probabilidad
AB 1/3
AC 1/3
BC 1/3
Total 3/3
Observe que la distribución de probabilidad asociada a cada muestra, es de un tercio.
Esto indica que cualquier muestra tienen la misma probabilidad de ser seleccionada.

20
Primero debemos entender que la varianza, es una medida de dispersión que calcula la
variación que tienen los datos entre si.
De acuerdo con (Triola, M. F., 2004, p.78) “varianza (de un conjunto de valores): medida de
variación igual al cuadrado de la desviación estándar”.

21
La fórmula para calcular la varianza de la muestra es:

∑(𝑥 − )2
𝑠2 =
𝑛−1
donde:
s2 es la varianza muestral.
X es el valor de cada observación de la muestra.
es la media de la muestra.
n es el número de observaciones realizadas.

22
Para calcular la varianza muestral procedemos de la siguiente forma:
Primero, calculamos la media que es la suma de (1+2+3)/3 igual a 2
Segundo, restamos a cada valor la media, por ejemplo (1-2) igual a -1 ; (2-2) igual a cero ;
finalmente (3-2) igual a 1
Tercero, elevamos al cuadrado cada uno de los valores ejemplo (-1)*(-1) = igual a 1 así
sucesivamente
2
Finalmente sumamos y dividimos quedando de la siguiente forma 𝑠2 = 3−1 =1
La varianza muestral es igual a 1.

23
Vamos a retomar el ejercicio de la diapositiva 10.

Para realizar un distribución muestral de varianzas , tenemos que calcular la varianza de las
tres muestras que están formadas por :
1,2
1,3
2,3

24
Calculamos la varianza conforme al procedimiento de la diapositiva 22 quedando de la
siguiente forma:
Varianza de la primera muestra (1,2) = 0.5
Varianza de la segunda muestra (1,3) = 2
Varianza de la tercera muestra (2,3) = 0.5
La distribución muestra de varianzas consiste en extraer de una muestra de la población,
todas su varianzas, para poder compararlas con la varianza de la población y, determinar su
variabilidad.

25
El muestreo se realiza por tres razones muy importantes.
Estudiar a toda la población, requiere de mucho tiempo.
Los recursos financieros y materiales resultan en varias ocasiones muy elevados para
estudiar todo un universo.
Muchas veces analizar a toda la población es prácticamente imposible.
Algunas muestras se tienen que remplazar, porque ya no se encuentran disponibles.

26
En un proceso de muestreo, tenemos que realizar un distribución muestral de las medias
así como, de sus respectivas varianzas para determinar su variabilidad con respecto a la
población.
Finalmente el teorema del límite central, nos permite concluir que con un muestra
aleatoria con remplazo de 30 o más nuestro muestreo tendrá un comportamiento normal y
con ello podemos realizar pruebas de hipótesis e intervalos de confianza.

27
Para profundizar en los temas de esta sesión te sugerimos la siguiente bibliografía.

28

También podría gustarte