Está en la página 1de 32

DISTRIBUCIONES

MUESTRALES
Mg: Rodas Cobos Jose Luis

Docente: Rodas Cobos Jose Luis


INTRODUCCION
● En este capítulo, dedicaremos gran parte de nuestra atención a
analizar problemas con el objeto de estudiar las diversas
distribuciones que, a su vez, nos permitan averiguar características de
una población a partir de la información proporcionada por una
muestra de dicha población. Este es el objetivo de la estadística
inferencial. La razón principal para observar una muestra en lugar de
la población completa consiste en que la recogida de toda la
información resulta exageradamente costosa en la mayoría de las
ocasiones.
A continuación enunciaremos los usos
del muestreo en diversos campos:

Docente: Rodas Cobos Jose Luis


Política. Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinión publica y el apoyo en las elecciones.

Sociología. El sociólogo que desea conocer las actitudes de los adolescentes frente al
aborto, no emprende la tarea de entrevistar a todos los adolescentes que hay en el país,
más bien elige una muestra de ellos y los entrevista.

Educación. Las muestras de las calificaciones de los exámenes de estudiantes se usan para
determinar la eficiencia de una técnica o programa de enseñanza.

Industria. Muestras de los productos de una línea de ensamblaje sirven para el propósito de controlar
la calidad.

Medicina. Un fabricante de drogas que desea saber los resultados de algún medicamento para bajar la
tensión en la sangre y compararlo con una droga de la competencia, no lleva a cabo un experimento
con todos los pacientes conocidos que sufran de hipertensión.

Agricultura. Las muestras del maíz cosechado en una parcela proyectan en la producción
los efectos de un fertilizante nuevo.

Docente: Rodas Cobos Jose Luis


1.1 Errores y técnicas de muestreo
1.1.1 Errores Muestrales y no muestrales
Cuando se usan valores muestrales (o estadísticos), para estimar valores poblacionales (o
parámetros), pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral
(o sistemático).
Errores Muestrales Errores no Muestrales

Docente: Rodas Cobos Jose Luis


Errores muestrales
Es improbable, por ejemplo, que la media de la muestra fuera idéntica a la media
de la población. Asimismo, tal vez la desviación estándar u otra medición que se
calcule con base en la muestra no sea exactamente igual al valor
correspondiente de la población. Así, es posible que existan ciertas diferencias
entre las estadísticas de la muestra, como la media o la desviación estándar, y
los parámetros de la población correspondientes.

Definición 1.1.1 El error muestral es la diferencia entre un


estadístico de la muestra y el parámetro correspondiente de la
población.
En general, el error muestral se refiere a la variación natural
existente, entre muestras tomadas de la misma población,
cuando una de ellas no es copia exacta de la población.

Docente: Rodas Cobos Jose Luis


Ejemplo 1.1.2
Se toman muestras de tamaño 2 de una población consistente en tres valores: 2, 4 y 6. Supongamos
que el muestreo se hace con reemplazo (es decir, el número elegido se reemplaza antes de escoger
el siguiente) y que se seleccionan muestras ordenadas. Hállese la media poblacional, todas las
muestras, la media de cada muestra y los errores muestrales.

SOLUCIÓN
La media poblacional equivale a

Docente: Rodas Cobos Jose Luis


1.1 Errores y técnicas de muestreo
1.1.1 Errores Muestrales y no muestrales
Cuando se usan valores muestrales (o estadísticos), para estimar valores poblacionales (o
parámetros), pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral
(o sistemático).
Errores Muestrales Errores no Muestrales

Docente: Rodas Cobos Jose Luis


Errores no muestrales o sistemáticos
En los análisis prácticos, existe la posibilidad de que aparezca un error que no
este relacionado con el procedimiento de muestreo usado. Estos errores
aparecerían también si se tomara un censo de la población completo. Se
conocen como errores no muestrales o sistemáticos. En un estudio particular,
existen potenciales errores no muestrales por varias causas.

Definición 1.1.5 El sesgo muestral es la tendencia sistemática a


favorecer la selección de ciertos elementos de una muestra en lugar
de otros.

Docente: Rodas Cobos Jose Luis


1.2 Estadísticos y distribuciones muestrales
A partir de esta sección, nos centraremos en métodos para analizar los
resultados muestrales con el fin de obtener información acerca de la
población. Por el momento, nos limitaremos a muestras que hayan sido
seleccionadas mediante esquemas de muestreo aleatorio simple
El principio de aleatorización en la selección de los miembros de la muestra
proporciona cierta protección contra la presencia de individuos no
representativos de la población, en el sentido de que, en media, si se
extraen repetidas muestras según este mecanismo, ningún subgrupo
particular debería estar más representado que otro. Además, el concepto
de distribución muestral nos permite prever la probabilidad de que la
muestra particular obtenida no sea representativa en un determinado grado.

Docente: Rodas Cobos Jose Luis


Estadístico y su distribución
Definición 1.2.2 Supongamos que se ha extraído una muestra aleatoria de una
población y que se desea hacer inferencia sobre ciertas características de la distribución
de la población. Esta inferencia se basara en algún estadístico muestrales decir, en
alguna función particular de la información muestral.

Definición 1.2.3 La distribución de un estadístico muestral recibe el nombre de


distribución en el muestreo y se define como la distribución muestral o distribución de
probabilidades de los valores que puede tomar el estadístico a lo largo de todas las
posibles muestras con el mismo número de observaciones que pueden ser extraídas de
la población.

Docente: Rodas Cobos Jose Luis


Ejemplo 1.2.4
Supongamos que un supervisor tiene a su cargo a seis empleados, cuyas
experiencias (medidas en años de trabajo) son 2, 4, 6, 6, 7 y 8. Se eligen al
azar cuatro de estos empleados y se les asigna una nueva tarea. Fácilmente,
se puede determinar que el número medio de años de experiencias para los
seis empleados es 5,5. Estamos interesados, de todos modos, en el número
medio de años de experiencia para los cuatros empleados concretos a los que
se les ha asignado el cambio de tarea. De modo que podemos pensar en este
ejemplo como en una muestra aleatoria simple de cuatro valores extraídos de
una población de seis. Así, el número de muestras 6 diferentes que pueden ser
seleccionadas es 𝑐46 =15.

Tabla 1.5

Docente: Rodas Cobos Jose Luis


Tabla 1.5: Posibles muestras de cuatro observaciones con sus
correspondientes medias muestra les para la población 2, 4, 6, 6, 7 y 8

Docente: Rodas Cobos Jose Luis


Tabla 1.6: Distribución de frecuencias para las medias muestrales de la
tabla 1.5

Tabla 1.7: Distribución de probabilidades para la media muestral

Docente: Rodas Cobos Jose Luis


El grafico de esta función de probabilidad aparece en la
figura 1.1:

Docente: Rodas Cobos Jose Luis


1.3 Distribución muestral de la media
Teorema 1.3.1 Supongamos que la población en donde se hace el muestreo es finita de tamaño N.

(a) Cuando el muestreo se hace con reemplazo, entonces,


• La media 𝝁ഥ 𝒙 de la distribución muestral de ഥ es igual a la media de la población en que se toma
𝒙
la muestra, es decir, 𝝁ഥ𝒙 = μ.

• La varianza 𝝈𝟐ഥ𝒙 de la distribución muestral es igual a la varianza de la población dividida por el


𝝈𝟐
tamaño de la muestra, es decir, 𝝈𝟐ഥ𝒙 =
𝒏

(b) Cuando el muestreo se hace sin reemplazo, entonces,

• La media 𝝁ഥ𝒙 de la distribución muestral de ഥ


𝒙 es igual a la media de la población en que se toma
la muestra, es decir, 𝝁ഥ𝒙 = μ.

𝝈𝟐 𝑵−𝒏
• La varianza 𝝈𝟐ഥ𝒙 de la distribución muestral es igual a
𝒏 𝑵−𝟏

Docente: Rodas Cobos Jose Luis


Ejercicio 01
Supongamos que en una población de tamaño 3 con valores 0, 2
y 4, se eligen muestras de tamaño 2.

(a) Si el muestreo se hace con reemplazo, entonces, verifique el


teorema 1.3.1a.

(b) Si el muestreo se hace sin reemplazo, entonces, verifique el


teorema 1.3.1b.

Docente: Rodas Cobos Jose Luis


Teorema 1.3.3 Cuando el muestreo se hace en una población
infinita, entonces, sin importar si el muestreo es con o sin
reemplazo, se tiene que

• La media 𝝁ഥ𝒙 de la distribución muestral de ഥ


𝒙 es igual a la media de la población
en que se toma la muestra, es decir, 𝝁ഥ𝒙 = μ.

• La varianza 𝝈𝟐ഥ𝒙 de la distribución muestral es igual a la varianza de la población


𝝈𝟐
• dividida por el tamaño de la muestra, es decir, 𝝈𝟐ഥ𝒙 =
𝒏

• Si la población es finita de tamaño N, si el muestreo se hace sin reemplazo y si


𝒏
≤ 0, 05,entonces, N también se puede aplicar el teorema 1.3.3.
𝑵

Docente: Rodas Cobos Jose Luis


Ejercicio 02
Suponga que μ =32 y que σ =5;tambi´en que la población
tiene 1.000 elementos y que se usa una muestra aleatoria
simple de 30 elementos (seleccionada de dicha población sin
reemplazo) para obtener información sobre esta población.
ഥ?
¿Cual es la media y el error estándar de 𝒙

Docente: Rodas Cobos Jose Luis


Ejercicio 03
Suponga que una población finita X consiste de los valores:
3, 4, 7, 9, 12.
a) Calcular la media y la varianza de la población.
b) Determinar la distribución muestral de la media de las muestras
de tamaño dos
escogidas con reposición.
c) Determinar la distribución muestral de la media de las muestras
de tamaño dos
escogidas sin reposición.

Docente: Rodas Cobos Jose Luis


1.3.1 El caso para muestras grandes

En este caso, determinaremos la forma de distribución muestral


de la media muestral suponiendo que se cumple alguna de tres
condiciones:

• La población es normal con varianza conocida.

• La población es normal con varianza desconocida y el tamaño de la


muestra es grande.

• La forma de la población es desconocida (o no normal), su varianza


es conocida o desconocida y el tamaño de la muestra es grande.

Docente: Rodas Cobos Jose Luis


Teorema 1.3.5 Sea 𝑥ҧ la media de una muestra aleatoria de tamaño n tomada de una población
con media μ y varianza σ2 > 0. Supongamos que se cumple alguna de las siguientes
condiciones:

A. La población es normal y σ2 es conocida (no importa el tamaño de n)

B. La población es normal, σ2 es desconocida y n ≥ 30;

C. La forma de la población es desconocida (o no normal), σ2 es conocida o


desconocida y n ≥ 30.
ഥ es normal con media 𝛍 𝐱ത y varianza
Entonces, la distribución muestral de la media muestral 𝒙
𝟐
𝝈𝒙ഥ , calculadas de acuerdo a los casos mostrados en los teoremas 1.3.1 y 1.3.3.

ഥ−𝝁𝒙ഥ
𝒙
Como consecuencia de este teorema, se puede concluir que la variable aleatoria 𝒛 =
𝝈𝒙ഥ
esta distribuida normalmente con media 0 y varianza 1. Además, en los casos en que la varianza
sea desconocida y n ≥ 30, reemplazamos la desviación poblacional σ por la desviación muestral s.

Docente: Rodas Cobos Jose Luis


Ejercicio 04
Supongamos que el incremento porcentual de los salarios de los
funcionarios de todas las corporaciones medianas se distribuye siguiendo
una normal con media 12, 2% y desviación típica 3, 6%. Si se toma una
muestra aleatoria de nueve observaciones de esta población según los
incrementos porcentuales de salario, ¿cual es la probabilidad de que la
media muestral sea mayor del 10%?

Docente: Rodas Cobos Jose Luis


Ejercicio 05
Un fabricante declara que la duración de las bujías que el fabrica sigue
una distribución normal con una media de 36.000 kilómetros y una
desviación estándar de 4.000 kilómetros. Para una muestra aleatoria de
dieciséis bujías, se obtuvo una duración media de 34.500 kilómetros. Si
la afirmación del fabricante es correcta, ¿cual es la probabilidad de
obtener una media muestral tan pequeña como ´esta o menor?

Docente: Rodas Cobos Jose Luis


Ejercicio 06
Los tiempos requeridos para que unos trabajadores terminen cierta labor,
se distribuyen normalmente con media de 30 minutos y una desviación
estándar de 9 minutos. Si de la planta de trabajadores se toma una
muestra aleatoria de 25, encuentre la probabilidad de que la media del
tiempo requerido para concluir la tarea en la muestra, este entre 28 y 33
minutos.

Docente: Rodas Cobos Jose Luis


Ejercicio 07
Un estudio de tránsito revela que el número promedio de ocupantes de un
auto es 1,75. En una muestra de 50 autos con desviación estándar 0,65,
seleccionada de una población normal, encuentre la probabilidad de que
el número promedio de ocupantes sea mayor que 2.

Ejercicio 08
Una empresa emplea 1.500 personas. La cantidad promedio gastada,
durante un año determinado, en servicios médicos personales por
empleado fue de 2.575 dólares y la desviación típica de 525 dólares.
¿Cual es la probabilidad de que una muestra aleatoria de 100 empleados
(seleccionados sin reemplazo) arroje una media comprendida entre
2.500 y 2.700 dólares?

Docente: Rodas Cobos Jose Luis


1.3.2 El caso para muestras pequeñas
Ahora, cuando la población es normal con varianza poblacional desconocida y las
muestras pequeñas (n< 30), entonces, la distribución muestral de la media muestral
no es la normal. En este caso, juega un rol muy importante una distribución continua
llamada distribución t de Student.
Tabla 1.9: μxത y 𝜎𝑥2ҧ cuando s se usa como estimación de σ2
desconocida

Docente: Rodas Cobos Jose Luis


Distribución muestral de la media muestral para
muestras pequeñas
ഥ será
Si la población tiene distribución normal, la distribución muestral de 𝒙
normal, independiente del tamaño de la muestra, pero bajo la condición de
que la varianza poblacional se conozca. Si, en cambio, la varianza es
desconocida y el tamaño de las muestras seleccionadas es pequeña (en la
práctica, se considera que el tamaño de la muestra debe ser menor que
.
30), aplicamos el siguiente teorema.

Docente: Rodas Cobos Jose Luis


Teorema 1.3.12 Si el muestreo se hace en una población normal con varianza
desconocida y si las muestras seleccionadas son de tamaño n< 30, entonces, la
ഥ es la t de Student con n − 1 grados de
distribución muestral de la media muestral 𝒙
libertad

ഥ−𝝁ഥ𝒙
𝒙
Este teorema implica que la variable aleatoria 𝒕=
𝝈ഥ𝒙
tiene distribución t con n − 1 grados de libertad. Aquí, 𝝁𝒙ഥ y
𝟐
varianza 𝝈ഥ 𝒙 se calculan de acuerdo con las situaciones
presentadas en la tabla 1.9.

Docente: Rodas Cobos Jose Luis


Ejercicio 09
Suponga que de una población normal con media 20 se toma una muestra
de tamaño 16. Si la desviación estándar muestral es 4, encuentre la
probabilidad de que la media muestral sea estrictamente mayor que
21,753.

Ejercicio 10
Una muestra aleatoria de seis autos de un determinado modelo
evidencia que cada uno de ellos consume las siguientes cantidades en
kilómetros por litro:

18,6 18,4 19,2 20,8 19,4 20, 5.

Determine la probabilidad de que el consumo de gasolina medio


muestral de automóviles sea menor que 17,6 kilómetros por litro,
suponiendo que la distribución de la población es normal con media 17.

Docente: Rodas Cobos Jose Luis


1.3.3 El teorema central del límite
Ya hemos dicho, en la sección 1.3.1, que cuando se cumple la
condición (c), el teorema 1.3.5 se conoce en la literatura como teorema
central del límite. Esto se resume formalmente así:

Teorema 1.3.15 (Teorema central del límite)

Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, tomada de una
población con media μ y varianza σ2. Entonces, si n es lo suficientemente
grande (n→∞), 𝐱ത tiene una distribución normal aproximada con media 𝝁ഥ𝒙 = μ y
varianza 𝝈𝟐ഥ𝒙 = σ2/n.

Docente: Rodas Cobos Jose Luis


Figura 1.5: Distribuciones de números promedio obtenidos al
lanzar 1, 2, 3 o 10 dado

Docente: Rodas Cobos Jose Luis


“Las cifras no mienten, pero los
mentirosos también usan cifras. “

Docente: Rodas Cobos Jose Luis

También podría gustarte