Está en la página 1de 42

UNIVERSIDAD MARIANO GÁLVEZ DE GUATEMALA CENTRO

UNIVERSITARIO, CUILAPA, SANTA ROSA INGENIERIA EN SISTEMAS

CURSO: ESTADISTICA
CATEDRATICO: Mauricio Osorio

TEMAS:
TEORIA LIMITE CENTRAL
DISTRIBUCIÓN MUESTRAL S2
DISTRIBUCIÓN T

INTEGRANTES:
● 1590-10-2203 Marlon Isai Verela Marroquin
● 1590-20-15444 Eleazar David Esteban Tecún
● 1590-21-13800 Fabio Manuel Flores Casasola
● 1590-15-10299 Wilmer Antonio Sinay
● 1590-21-18758 Ludwing Danilo Morales De paz
● 1590-19-25471 Noel Fauricio Guzmán Aroche
● 1590-21-17411 Erick Randolfo Ruano Revolorio

1
INDICE
Introducción ......................................................................................................... 3

MARCO TEÓRICO ................................................................................................ 4

TEORÍA DEL LÍMITE CENTRAL .......................................................................... 5

Historia del teorema de límite central ................................................................. 7

EJERCICIOS DEL TEOREMA CENTRAL DEL LÍMITE ................................... 11

Distribución de muestral de s2 ......................................................................... 18

Distribución chi cuadrado .................................................................................. 26

Grados de libertad como medición de la .......................................................... 27

información muestral ........................................................................................ 27

EJERCICIOS Distribución muestral de S2 ....................................................... 27

DISTRIBUCION T ................................................................................................ 30

EJERCICIOS DISTRIBUCION T ...................................................................... 35

Conclusiones ..................................................................................................... 41

E-grafía ............................................................................................................... 42

2
Introducción

 La distribución de frecuencias es uno de los primeros pasos que debemos


realizar al inicio del análisis estadístico, conjuntamente con la aplicación de
las medidas descriptivas, y refleja cómo se reparten los individuos de una
muestra según los valores de una variable. Cuando se trata de poblaciones,
las probabilidades de observar los diferentes valores de una variable
aleatoria pueden expresarse como una función de probabilidad. La mayoría
de los fenómenos de interés en investigación científica, como pueden ser la
talla y la presión arterial, siguen unas leyes o distribuciones de probabilidad
teóricas, especificadas matemáticamente en las que se basan la mayoría
de los métodos estadísticos. La distribución más conocida es la distribución
Normal o de Gauss. Muchos de los procedimientos estadísticos
habitualmente utilizados asumen la normalidad de los datos observados.
Aunque muchas de estas técnicas no son demasiado sensibles a
desviaciones de la distribución normal, y en general esta hipótesis puede
obviarse cuando se dispone de un número suficiente de datos (teorema
central del límite), resulta recomendable contrastar si se puede asumir o no
una distribución Normal. Para decidir si nuestra muestra procede o no de
una distribución normal existen gráficos (gráficos P-P y Q-Q) y contrastes
de hipótesis (test de Kolmogorov-Smirnov) que pueden ayudarnos. Cuando
los datos no son normales pueden transformarse o emplearse otros
métodos estadísticos que no exijan este tipo de restricciones, llamados los
métodos no paramétricos.

 Las muestras aleatorias obtenidas de una población son, por naturaleza


propia, impredecibles. No se esperaría que dos muestras aleatorias del
mismo tamaño tomadas de la misma población tengan la misma media
muestra o que sean completamente parecidas; puede esperarse que
cualquier estadístico, como la media muestra, calculado a partir de las
medias en una muestra aleatoria, cambie su valor de una muestra a otra,
por ello, se quiere estudiar la distribución de todos los valores posibles de
un estadístico. Tales distribuciones serán muy importantes en el estudio de
la estadística inferencial, porque las inferencias sobre las poblaciones se
harán usando estadísticas muéstrales. Como el análisis de las
distribuciones asociadas con los estadísticos muéstrales, podremos juzgar
la confiabilidad de un estadístico muestra como un instrumento para hacer
inferencias sobre un parámetro poblacional desconocido.

 La distribución t describe las distancias estandarizadas de las medias de la


muestra hasta la media de la población cuando la desviación estándar de
la población no se conoce, y las observaciones vienen de una población
con una distribución normal

3
MARCO TEÓRICO
1.1 Teoría del Límite Central
1.1.1 Definición:
El teorema central del límite (TCL) es una teoría estadística que establece que,
dada una muestra aleatoria suficientemente grande de la población, la
distribución de las medias muestrales seguirá una distribución normal.
1.1.2 Funciones y Aplicaciones:
El TCL afirma que a medida que el tamaño de la muestra se incrementa,
la media muestral se acercará a la media de la población. Por tanto, mediante el
TCL podemos definir la distribución de la media muestral de una determinada
población con una varianza conocida. De manera que la distribución seguirá una
distribución normal si el tamaño de la muestra es lo suficientemente grande.

1.2 Distribución Muestral de S2


1.2.1 Definición:
A la distribución muestral (s2) se le conoce también como distribución Chi-
cuadrada (x2). Es decir, que, si se extraen todas las muestras posibles de una
población normal y a cada muestra se le calcula su varianza, se obtendrá la
distribución muestral de las varianzas.
1.2.2 Funciones y Aplicaciones:
El cálculo de probabilidad en una distribución muestral de varianzas nos sirve
para saber cómo se va a comportar la varianza o desviación estándar en una
muestra que proviene de una distribución normal. También es utilizada para
obtener una estimación por intervalos y realizar pruebas de hipótesis para una
varianza poblacional.

1.3 Distribución T
1.3.1 Definición:
La distribución t de Student o distribución t es un modelo teórico utilizado para
aproximar el momento de primer orden de una población normalmente distribuida
cuando el tamaño de la muestra es pequeño y se desconoce la desviación típica.
La distribución t es una distribución de probabilidad que estima el valor de la
media de una muestra pequeña extraída de una población que sigue
una distribución normal y de la cual no conocemos su desviación típica.
1.3.2 Funciones y Aplicaciones:
La distribución t se utiliza cuando:

4
 Queremos estimar la media de una población normalmente distribuida a partir de
una muestra pequeña.

 Tamaño de la muestra es inferior a 30 elementos, es decir, n < 30.

A partir de 30 observaciones, la distribución t se parece mucho a la distribución


normal y, por tanto, utilizaremos la distribución normal.

 No se conoce la desviación típica o estándar de una población y tiene que ser


estimada a partir de las observaciones de la muestra.

TEORÍA DEL LÍMITE CENTRAL


Definición técnica
El teorema central del límite (TCL) es una teoría estadística que establece que,
dada una muestra aleatoria suficientemente grande de la población, la distribución
de las medias muestrales seguirá una distribución normal.
Además, el TCL afirma que a medida que el tamaño de la muestra se incrementa,
la media muestral se acercará a la media de la población. Por tanto, mediante el
TCL podemos definir la distribución de la media muestral de una determinada
población con una varianza conocida. De manera que la distribución seguirá una
distribución normal si el tamaño de la muestra es lo suficientemente grande.
¿Quién inventó el teorema del límite central?
Fue Cauchy, mediante la función característica, quien dio una demostración
del teorema siguiendo la demostración de Poisson y estableció una cota superior
para la diferencia entre el valor exacto y la aproximación.
¿Cómo calcular el teorema de límite central?
La media y varianza de cada variable individual es:
m = (4 + 10 ) / 2 = 7.
s 2 = (10 - 4)^2 / 12 = 3.
Por tanto, la suma de las 100 variables se distribuye según una normal cuya media
y varianza son:
Media: n * m = 100 * 7 = 700.
Varianza: n * s2 = 100 * 3 = 300.
¿Cuáles son las características del teorema del límite central?
5
El Teorema Central del Límite indica que, en condiciones muy generales, la
distribución de la suma de variables aleatorias tiende a una distribución normal
cuando la cantidad de variables es muy grande. Es decir, garantiza una distribución
normal cuando n es suficientemente grande.

¿Cuándo se aplica el teorema del límite central?


El teorema central del límite es uno de los resultados fundamentales de la
estadística. Este teorema nos dice que si una muestra es lo bastante grande
(generalmente cuando el tamaño muestra (n) supera los 30), sea cual sea la
distribución de la media muestra, seguirá aproximadamente una distribución
normal.

¿Qué es el teorema del límite central y su importancia?


El teorema central del límite es uno de los resultados fundamentales de la
estadística. Este teorema nos dice que si una muestra es lo bastante grande
(generalmente cuando el tamaño muestra (n) supera los 30), sea cual sea la
distribución de la media muestra, seguirá aproximadamente una distribución
normal.

¿Dónde se usa el teorema de límite central?


¿Para qué sirve el teorema central del límite? 1 Permite averiguar la probabilidad
de que la media de una muestra concreta esté en un cierto intervalo. 2 Permite
calcular la probabilidad de que la suma de los elementos de una muestra esté, a
priori, en un cierto intervalo.
¿Cuál es el teorema del límite central?
El teorema del límite central: las medias de muestras grandes y aleatorias son
aproximadamente normales. ... Cuando el tamaño de la muestra es lo
suficientemente grande, la distribución de las medias sigue aproximadamente una
distribución normal.
¿Que explica el teorema de límite central?
El teorema del límite central es un teorema fundamental de probabilidad y
estadística. El teorema describe la distribución de la media de una muestra
aleatoria proveniente de una población con varianza finita. ... El teorema se aplica
independientemente de la forma de la distribución de la población.
¿Qué es y para qué sirve el teorema de límite central?

6
El teorema central del límite, uno de los fundamentales en estadística, estudia el
comportamiento de la suma de variables aleatorias, cuando crece el número de
sumandos, asegurando su convergencia hacia una distribución normal en
condiciones muy generales.

¿Qué es el teorema de límite central?


El teorema de límite central declara que sin importar la distribución, la suma de
todas las variables aleatorias generadas va a tender a una distribución normal o
gaussiana. También se dice que las variables estudiadas no necesitan ser
obligatoriamente normales, pudiendo trabajar con cualquier tipo, y obteniendo un
resultado con esta misma distribución.
Otras de las declaraciones en torno a este teorema, afirma que es necesario que
el tamaño de la muestra sea grande, utilizando un número grande de variables. Al
realizar la suma de todas estas, se asegura que el teorema se cumple, si y solo si
es igual a una distribución de Gauss. Si durante el estudio, se trabaja con la media,
es válida la aplicación del teorema de límite central, ya que se realiza la suma de
todos los datos, y se divide entre una constante.
En la definición de esta teoría, se habla de número de variables grandes. Esto se
debe a que en su definición, se dice que n tiende a infinito. De esta manera, se
establece la siguiente fórmula:
Zn=X-μσ/n
Donde n tiende a infinito.

Hay que terne en cuenta que el nombre de este teorema viene dado por la
aproximación que existe entre dos distribuciones, siendo esta mayor en el centro,
que en sus extremos. Así mismo, es aplicable dentro de distintos campos,
destacándose dentro de la inferencia estadística y en la teoría de renovación.

Historia del teorema de límite central


El primer matemático que dio inicio al teorema de límite central fue Abraham de
Moivre. Tras huir de Francia por la derogación del decreto de Nantes, termina en
7
Londres, donde busca relacionarse con científicos de alto reconocimiento como
Isaac Newton, dar a conocer sus conocimientos, más no logra nunca una cita
académica que lo permita. Sin embargo, continuó con sus investigaciones dentro
del campo de la estadística y el estudio probabilístico, enfocándose en el estudio
de los límites en la distribución binominal. Durante los experimentos detalló que el
número de ensayos aumenta sin límites, dando a lugar a un aumento dentro del
exponencial de la función –X2/2. Estableció así la fórmula: 2/(B√n)(1/2n), en caso
de que n posea valores grandes, donde Log(B)= 1-1/12+1/360-1/1260+1/1680.
James Stirling declaró que en el caso de B, este era igual a √2π, y estableció una
fórmula para el cálculo de la distribución binominal, afirmando a su vez que la
probabilidad del m=n/2 éxitos en ensayos de n=2m es igual a
((m!)(m!)/(2m)!)(1/22m), comprobando con esto la teoría de Moivre a través del
factorial.
Pero quien dio inicio al postulado de la distribución normal, siendo el tipo de
distribución que se obtiene tras la suma de distintas variables dentro del teorema
de límite central, fue Thomas Simpson, quien encontró ciertos inconvenientes
dentro de la distribución aplicada en la observación astronómica. Pero Carl Gauss
profundizó en estas investigaciones, aunque a su vez, Pierre Simon de Laplace y
Adrien-Marie Legendre, matemáticos franceses, se encontraban trabajando en sus
propias ideas en torno a la distribución normal. Debida a que muchos expertos se
encontraban realizando aportes en el tema, adquirió diferentes nombres. Según
Gauss, siempre afirmó que él fue el primero en utilizar este procedimiento
estadístico, asegurando que en el año 1794 fue que aplicó esta distribución por
primera vez.
Sn embargo, Laplace añadió a su investigación las primeras ideas acerca del
teorema. Su postulado fue tomado por el ruso P.L. Chebyshev, quien en compañía
de sus estudiantes, empezó a realizar ensayos para comprobar su validez y
desarrollar completamente para su correcta aplicación.
Propiedades del teorema de límite central
Para que la aplicación del teorema de límite central sea correcta, se debe cumplir
una serie de condiciones o propiedades que aseguran su validez:
Al trabajar con muestras de tamaño grande, esto asegura que la suma de las
medias muestrales sea igual a una distribución normal. Según el teorema de límite
central, se considera que una muestra es grande cuando supera un número mayor
a 30. Con esto, se afirma que al tener una muestra superior a 30, la distribución de
la media muestral tendrá tendencia a una distribución gaussiana. Este enunciado
es válido para cualquier tipo de distribución con la que se trabaje.
La media muestral y la media poblacional siempre serán iguales, definiéndose de
la siguiente manera: la media de la distribución de la media muestral será igual a
la media de la población total estudiada.
La varianza de la distribución de la media muéstrale está definida bajo la siguiente
fórmula: σ²/n, donde σ² es la varianza de la población, y n es el tamaño de la
muestra estudiada.
8
Existen distintas manera de aplicar el teorema de límite central, y esto es posible
dependiendo de los factores que aseguran la convergencia. De esta manera, se
declara que las variables inmersas en el estudio, deben cumplir con ciertas
condiciones: deben ser independientes, estar distribuidas de manera similar,
contar con una media y varianza finita.

Tipos de muestras dentro del teorema de límite central


Se sabe que dentro del teorema de límite central se puede trabajar con distintas
distribuciones, tendiendo el resultado final a una distribución normal. Así mismo,
puede aplicarse en distintas muestras, destacándose:
Muestra de una población uniforme: una de las características propias de este tipo
de muestra, es que posee una distribución uniforme, convirtiéndola en una
población simétrica. Según el teorema de límite central, se considera
aproximadamente normal a la distribución de las medias comprendida por 1000
muestras de tamaño 5.
Muestra de una población exponencial: las características que identifican a una
población exponencial es que son asimétricas y no normal. Pero en este caso, el
teorema de límite central asegura que es aproximadamente normal la distribución
de las medias comprendida por una muestra de 1000 de tamaño 50.
Ejemplo teórico del teorema de límite central
A través de un ejemplo, se puede demostrar el proceso de aplicación del teorema
de límite central. Tomemos como caso de estudio a S&P 500, la cual es una
compañía que posee más de 500 sucursales. Se busca analizar las rentabilidades
medias, pero se tiene en cuenta que no es posible realizar un estudio de cada una
al poseer poca información. De esta manera se toma la media poblacional.

9
Al decidirse a aplicar el teorema de límite central, se puede escoger una muestra
para el análisis que comprenda un total de 500 sucursales de S&P 500. Como se
sabe, para que sea válida su aplicación, es necesario que se cuente con una
muestra mayor a 30, por lo que se cumple una de las condiciones. Finalmente, se
determina un total de 50 empresas para iniciar, seleccionadas de manera aleatoria,
y en cada una se aplica el mismo proceso de estudio. Según el enunciado del
teorema, los pasos serías:
Se establece una muestra de 50 empresas de S&P 500, y se obtiene la rentabilidad
media del total de la muestra.
Se vuelven a seleccionar continuamente otras 50 sucursales, y se realiza el mismo
procedimiento.
Al realizar la suma de todas las rentabilidades medias del total de las muestras que
se escogieron para el análisis, esta debe ser aproximada a una distribución normal.
Finalmente, las rentabilidades medias del total de muestras escogidas se
aproximará a la rentabilidad media de la población total.

Principales propiedades del teorema central del límite


El teorema central del límite tiene una serie de propiedades de gran utilidad en el
ámbito estadístico y probabilístico. Las principales son:
Si el tamaño de la muestra es suficientemente grande, la distribución de las medias
muéstrales seguirá aproximadamente una distribución normal. El TCL considera
una muestra como grande cuando el tamaño de la misma es superior a 30. Por
tanto, si la muestra es superior a 30, la media muestral tendrá una función de
distribución próxima a una normal. Y esto se cumple independientemente de la
forma de la distribución con la que estamos trabajando.

10
La media poblacional y la media muestral serán iguales. Es decir, la media de la
distribución de todas las medias muestrales será igual a la media del total de la
población.
La varianza de la distribución de las medias muéstrales será σ²/n. Que es la
varianza de la población dividido entre el tamaño de la muestra.
Que la distribución de las medias muéstrales se parezca a una normal es
tremendamente útil. Porque la distribución normal es muy fácil de aplicar para
realizar contrastes de hipótesis y construcción de intervalos de confianza. En
estadística que una distribución sea normal es bastante importante, dado que
muchos estadísticos requieren este tipo de distribución. Además, el TCL nos
permitirá hacer inferencia sobre la media poblacional a través de la media muestral.
Y esto es de gran utilidad cuando por falta de medios no podemos recolectar datos
de toda una población.
EJERCICIOS DEL TEOREMA CENTRAL DEL LÍMITE
1.- La edad de los miembros de una determinada asociación sigue una
distribución N ( , ). Sabemos que la distribución de las medias de las edades en
muestras de tamaño 36 tiene como media 52 años y como desviación típica 0,5.
a) Halla la media y la desviación típica de la edad de los miembros de la
asociación.
b) ¿Cuál es la probabilidad de que un miembro de la asociación, elegido al
azar, sea mayor de 60 años?

Solución:

a) Por el teorema central del límite, sabemos que las medias muestrales se

Como tenemos que:

Por tanto, la edad de los miembros de la asociación tiene una media de 52


años y una desviación típica de 3 años, es decir, se distribuye N (52, 3).
b) Por lo obtenido en el apartado anterior, tenemos que, si z es N (0, 1):

La probabilidad pedida es de 0,0038.

2.- En un test de matemáticas que se pasó a 1 000 alumnos de 2 o de Bachillerato,


se observó que las puntuaciones obtenidas seguían una distribución N (67,
20).Si consideramos muestras de 15 alumnos de los que hicieron el test, halla
un intervalo en el que se encuentren el 99,73% de las puntuaciones medias de
los alumnos de cada muestra.
11
Solución:

Por el teorema central del límite, sabemos que las medias muestrales se
distribuyen
El intervalo característico es de la forma:

Para el 99,73%, tenemos que:

→ zα/2 = 3
Así, el intervalo será:

(51,51; 82,49)
Por tanto, en el 99,73% de las muestras, las medias están comprendidas entre
51,51 y 82,49 puntos.

12
3.- La duración de un determinado tipo de pilas sigue una distribución normal
con una media de 50 horas y una desviación típica de 5 horas. Empaquetamos
las pilas en cajas de 16:

a) ¿Cuál es la probabilidad de que la duración media de las pilas de una de las


cajas sea inferior a 48 horas?

b) ¿Cuál es la distribución de la duración media de las pilas de las cajas?

Solución:

a) Por el teorema central del límite, sabemos que las medias muestrales siguen

una

=1,25.

Es decir, se distribuyen N (50; 1,25). Por tanto, si z es N (0, 1), tenemos

que:

La probabilidad pedida es de 0,0548.

b) Ya hemos averiguado en el apartado anterior que se distribuyen N (50; 1,25).

4.- El peso de las truchas de una piscifactoría se distribuye según una normal de
media 150 gramos y varianza 1 225.Halla un intervalo en el que se encuentren
el 95% de las medias de pesos de las muestras de tamaño 50.

Solución:

Por el teorema central del límite, sabemos que las medias muestrales se
distribuyen

El intervalo característico es de la forma:

Para el 95%, sabemos que zα/2 =1,96. Así, el intervalo será:

13
(140,298; 159,702)

Por tanto, en el 95% de las muestras, las media de los pesos estarán
comprendidas entre 140,298 y 159,702 gramos

5.- En una determinada población, los pesos se distribuyen según una normal
de media μ = 65 kg y varianza 49. Si extraemos muestras de tamaño 64:

b) ¿Cuál es la probabilidad de que la media de los pesos en una de esas muestras


sea mayor de 66,5 kg?

Solución:

distribuyen según

una normal de media μ = 65 y de


desviación típica

si z es N (0,

1):
La probabilidad
pedida es de 0,0436.

6.- La edad de los alumnos de 2o de Bachillerato de cierto instituto sigue una


distribuciónN (17,6; 0,5). Los agrupamos al azar de 10 en 10 para una
competición.Halla el intervalo característico del 95% correspondiente a las
edades medias de los grupos.

Solución:

Como la población de partida es normal, las medias muestrales también se


distribuyen según una normal, para cualquier valor de n.

14
El intervalo característico es de la forma:

Para el 95%, tenemos que zα/2 = 1,96. Por tanto, el intervalo será:

(17,29; 17,91)

Por tanto, las edades medias en el 95% de los grupos están entre 17,29 y
17,91 años.

7.- La media de edad de los lectores de una determinada revista es de 17,2 años,
y la desviación típica, 2,3 años. Si elegimos muestras de 100 lectores:

a) ¿Cuál es la probabilidad de que la media de la edad de la muestra está


comprendida entre 16,7 y 17,5 años?

b) ¿Cuál es la distribución de las medias muestrales?

Solución:

a) Como el tamaño de la muestra es n = 100 (n ≥ 30), por el teorema central


del límite,

= 0,9032 − (1 − 0,9850) = 0,8882

La probabilidad pedida es de 0,8882.

distribuyen N (17,2; 0,23).

15
8.- La duración de cierto tipo de batería sigue una distribución normal de media
3 años y desviación típica de 0,5 años. Si se toman muestras de tamaño 9, halla
un intervalo en el que estén comprendidos el 99% de las duraciones medias de
las baterías de cada muestra.

Solución:

Por el teorema central del límite, como la población de partida es normal,

sabemos que

El intervalo característico es de la forma:

Para el 99%, sabemos que zα/2 = 2,575. Por tanto, el intervalo

será:

(2,57; 3,43) Por tanto, las duraciones medias de las baterías en el 99% de las
muestras estarán
comprendidas entre 2,57 y 3,43 años.

9.- En una distribución N (35, 6), tomamos muestras de tamaño 49.


a) ¿Cuál es la distribución de las medias de las muestras?
b) ¿Cuál es la probabilidad de extraer una muestra cuya media esté
comprendida entre 33 y 36?

Solución:

a) Por el teorema central del límite, sabemos que las medias muestrales

siguen una

b) Como ya conocemos la distribución de las medias muestrales, entonces,


si z es N (0, 1), tenemos
que:
= 0,8790 − (1 −0,9901) = 0,8691. La probabilidad pedida es de 0,8691.

10.- En un examen de oposición al que se presentaban 5 000 personas, la nota


media ha sido de 4,2 puntos, con una desviación típica de 2,1. Si se toman
muestras de 60 opositores, halla el intervalo característico del 90% para las
notas medias de las muestras.
16
Solución:

Por el teorema central del límite, sabemos que las medias muestrales se
distribuyen

El intervalo característico es de la forma:

Para el 90%, sabemos que zα/2 =1,645. Así, el intervalo será:

(3,75; 4,65)

Por tanto, en el 90% de las muestras, las notas medias estarán comprendidas entre
3,75 y 4,65 puntos.

17
Distribución de muestral de s2

Distribución Muestra
La inferencia estadística trata básicamente con generalizaciones y predicciones.
Por ejemplo, podemos afirmar, con base a opiniones de varias personas
entrevistadas en Copiapó, que en las próximas elecciones municipales el 52% de
los electores votará por el candidato A. En este caso tratamos con una muestra
aleatoria de opiniones de una población finita muy grande.
Podemos afirmar que el costo promedio para construir una piscina está entre 4 y
4.5 millones de pesos, con base en las estimaciones de tres contratistas
seleccionados al azar de 30 que construyen piscinas residenciales actualmente.
La población que será muestreada aquí es finita pero muy pequeña.
Por otro lado, un funcionario de cierta compañía calcula la media de 40 bebidas y
obtiene 236 c.c., y con base en este valor decide que la máquina aún sirve
bebidas con un contenido promedio de

población infinita de posibles bebidas que esta máquina servirá.


En cada uno de estos ejemplos calculamos una estadística a partir de una
muestra seleccionada de la población, y de estas estadísticas hacemos varias
afirmaciones con respecto a los valores de los parámetros de la población que
pueden ser ciertos o no.
El funcionario de la compañía toma la decisión de que la máquina
despachadora sirve bebidas con un contenido promedio de 240
c.c. aunque la media de la muestra fue 236 c.c., porque sabe de la teoría de
muestreo que es probable que ocurra tal valor de la muestra. De hecho, si realiza
pruebas similares, digamos cada una hora, esperaría que los valores del

promedio es considerablemente distinto de 240 c.c. el funcionario de la compañía


iniciaría una acción para ajustar la máquina.

Recordemos algunas estadísticas:

Si X , X2, …, Xn representa una muestra aleatoria (m.a.) de tamaño n, entonces la


1
media de la muestra se define mediante la estadística

18
n la práctica al valor de una estadística por lo general se le da el mismo nombre
de la estadística. Por ejemplo, el término medio de la muestra se aplica tanto a la
estadística
como a su valor calculado .

La desviación estándar de la muestra, que se denota por S, es la raíz cuadrada


positiva de la varianza de la muestra.
La distribución muestral de una estadística depende del tamaño de la población,
el tamaño de las muestras y el método de elección de las muestras.

Se deben estudiar las distribuciones muestrales de las estadísticas

como el mecanismo a partir del cual haremos finalmente


2
inferencias de los parámetros µ y σ .
La distribución muestral de la estadística con tamaño muestral n es la
distribución que resulta cuando un experimento se lleva a cabo una y otra vez
(siempre con tamaño muestral n) y resultan los diversos valores de . Esta
distribución muestral, entonces, describe la variabilidad de los promedios
muestrales alrededor de la media poblacional µ.
2
Se aplica el mismo principio en el caso de la distribución de S . La distribución
2
muestral produce información acerca de la variabilidad de los valores de s
alrededor de σ2 en experimentos
19
que se repiten.

La primera distribución muestral importante a considerar es la de la media


muestral . Supongamos que una m.a. de n observaciones se toma de una
estándar σ. Cada observación
de la m.a. tendrá entonces la misma distribución normal que la población que se
muestrea.

La aproximación normal para por lo general será buena si n>=30 sin


importar la forma de la población. Si n<30, la aproxi-
…mación es buena solamente si la población no es muy diferente de una distribución
normal y si se sabe que la población es normal, la distribución muestral de seguirá
una distribución normal exacta, no importa que tan pequeño sea el tamaño de las
muestras.
Ejemplo 1: Una empresa eléctrica fabrica lámparas que tienen una duración que se
distribuye aproximadamente en forma normal, con media de 800 horas y desviación
estándar de 40 horas. Calcular la probabilidad de que una m.a. de 16 lámparas tenga
una vida media de menos de 775 horas.
La distribución muestral de será aproximadamente normal con media 800 y desviación
estándar . La probabilidad que se desea está dada por

Inferencias sobre la media poblacional


Una aplicación muy importante del Teorema del Límite Central (TLC) es la
determinación
prueba de hipótesis, estimación, control de calidad y otros hacen uso del TLC.

Ejemplo 2: Un importante proceso de fabricación produce partes de


20
componentes cilíndricos para la industria automotriz. Es importante que el
proceso produzca partes que tengan una media de 5 milímetros. El ingeniero
involucrado hace la conjetura de que la media de la población es de 5.0
milímetros. Se lleva a cabo un experimento en el que 100 partes elaboradas por
el proceso se seleccionan al azar y se mide el diámetro de cada una de ellas. Se
sabe que la desviación estándar de la población es de σ=0.1 milímetros. El
experimento indica un diámetro promedio de la muestra
milímetros. ¿Esta información de la muestra parece apoyar o no la conjetura del
ingeniero?

Si los datos apoyan o no la conjetura depende de la probabilidad de que datos


similares a los que se obtuvieron en el experimento pueden ocurrir con facilidad
cuando de hecho µ=5.0. En otras palabras, ¿qué tan probable es que se pueda
obtener con n=100 si la media de la población es µ=5.0?
Si esta probabilidad sugiere que no es poco razonable, la conjetura
no se rechaza. Si la probabilidad es bastante baja, se puede argumentar con
certidumbre que los datos no apoyan la conjetura de que µ=5.0. La probabilidad
que elijamos calcular está dada por

En otras palabras, si la media µ=5.0, ¿cuál es la probabilidad de que se


desvíe a lo más en 0.027 milímetros?

De esta manera se experimentaría por casualidad una que está a 0.027


milímetros de la media en sólo siete de 1000 experimentos. Como resultado,
este experimento con ciertamente no proporciona evidencia
que apoye la conjetura de que µ=5.0.

21
Distribución muestral de la diferencia entre dos
promedios
El Ejemplo 2 trata de nociones de inferencia estadística sobre una sola media µ.
El ingeniero estaba interesado en apoyar una conjetura con respecto a una sola
media de la población. Una aplicación más importante incluye dos poblaciones.
Un científico o ingeniero se interesa en un experimento comparativo el se cotejan
dos métodos de producción, 1 y 2. La base para esta comparación es µ -µ , la
1 2
diferencia de las medias de la población. Supongamos
que t e n e m o s d o s p o b l a c i o n e s , l a p r i m e r a c o n m e d i a µ
1 y
desviación estándar σ , y la segunda con media µ y desviación estándar σ .
1 2 2
Representamos la media de una muestra aleatoria de tamaño n
1
seleccionada de la primera población y la estadística media de una muestra
aleatoria de tamaño n seleccionada d e l a s e g u n d a p o b l a c i ó n ,
2
independiente de la
muestra aleatoria de la primera población.
¿Qué podemos decir acerca de la distribución de muestreo de la…

 diferencia - para muestras repetidas de tamaños n1 y n2?

 Teorema 2: Si se extraen al azar muestras independientes de


tamaños n y n de dos poblaciones, discretas o continuas, con
1 2
2 2
 medias µ y µ y varianzas σ y σ , respectivamente, entonces la
1 2
 distribución muestral de las diferencias de las medias --

 está distribuida aproximadamente de forma normal con media y


varianzas dadas por

22
es aproximadamente una variable normal estándar

 Si n1 y n2 son mayores o iguales a 30, la aproximación normal para la


diferencia de es muy buena sin importar las formas de
las dos poblaciones. Sin embargo, aun cuando n1 y n2 sean menores que
30, la aproximación normal es razonablemente buena excepto cuando las
dos poblaciones no son definitivamente normales
.
 Por supuesto, si ambas poblaciones son normales, entonces la diferencia
tiene una distribución normal sin importar los tamaños de las
muestras.

 Ejemplo 3: Se llevan a cabo dos experimentos independientes en los que


se comparan dos tipos de pintura. Se pintan 18m de especímenes con el
tipo A y en cada uno se registra el tiempo de secado en horas. Lo mismo
se hace con el tipo B. Se sabe que las desviaciones estándar de la
población son ambas 1.0. Supongamos que el tiempo medio de secado es
igual para los …

• …dos tipos de pintura. Calcular donde y


son los tiempos promedios de secado para muestras de tamaño
n =n =18.
A B
De la distribución de muestreo de , sabemos que la
distribución es normal con media y varianza

Por lo tanto,

23
• ¿Qué podemos aprender del resultado anterior? La maquinaria de cálculo
se basa en la suposición de que µ =µ .
A B
• Supongamos, sin embargo, que el experimento realmente se lleva
a cabo con el propósito de realizar una inferencia con respecto a la igualdad
de µ y µ , los tiempos medios se secado de las dos poblaciones. Si los
A B
dos promedios difieren por una hora (o más),
esto claramente es una evidencia que nos conducirá a concluir que el
tiempo medio de secado de la población no es igual para los dos tipos de
pintura.
• Por otro lado, supongamos que la diferencia en los dos promedios
muestrales es más pequeña que, digamos, 15 minutos. Si µ =µ ,
A B

• Como esta probabilidad no es excesivamente baja, concluimos que una


diferencia de 15 minutos en la media muestral puede ocurrir por
casualidad (es decir, sucede con frecuencia aunque µ =µ ). Como
A B
resultado, este tipo de diferencias en el tiempo promedio de
secado ciertamente no es una señal clara de que
µ µ .
A≠ B
• Ejemplo 4: Los cinescopios para la televisión del fabricante A tiene una
duración media de 6.5 años y una desviación estándar de 0.9 años,
mientras que los del fabricante B tienen una duración media de 6.0 años
y una desviación estándar de 0.8 años. ¿Cuál es la probabilidad de que
una muestra aleatoria de 36 cinescopios del fabricante A tenga una
duración media que sea al menos de un año más que la duración media
de una muestra de 49 cinescopios del fabricante B?

• Nos dan la siguiente información

Población 1 Población 2
 
1=6.5 2=6.0
σ =0.9 σ =0.8
1 2
n =36 n =49
1 2
24
Si utilizamos lo anterior, la distribución muestral de será
aproximadamente normal y tendrá una media y una desviación estándar
de

Distribución muestral de S2
En lo anterior aprendimos acerca de la distribución de muestreo de la media
muestral. El TLC nos permitió hacer uso del hecho de que

tiende a N(0,1) conforme crece el tamaño de la muestra. Los Ejemplos 3 y 4 ilustran


la aplicación del TLC, que nos permite extraer conclusiones acerca de la media de
la población o la diferencia en dos medias de población.
Las distribuciones muestrales de estadísticas importantes nos permiten conocer
información sobre los parámetros. Si un ingeniero se interesa en la resistencia
media de la población de cierto tipo de resistor, se explorará la distribución muestral
de una vez que se reúna la información de la muestra. Por otro lado, si se
estudia la variabilidad en el resistor, claramente se utilizará la distribución muestral
de S2 para conocer la contraparte.

paramétrica, la varianza de la población σ2.


2
Teorema 3: Si S es la varianza de una muestra aleatoria de tamaño n que se
toma de una población normal que tiene desviación estándar σ, entonces la
estadística

25
tiene una distribución chi cuadrado con v=n-1 grados de libertad
Ejemplo 5: Un fabricante de baterías para autos garantiza que sus baterías durarán,
en promedio, tres años con una desviación estándar de un año. Si cinco de estas
baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años, ¿el fabricante aún está
convencido de que sus baterías tienen una desviación estándar de un año?
Supongamos que la duración de las baterías sigue una distribución normal.
Primero calculamos la varianza muestral

Entonces

es un valor de una distribución chi cuadrado con 4 grados de libertad. Como 95%
de los valores X^2 con 4 grados de libertad caen entre 0.484 y 11.143 (ver Tabla
de la distribución chi cuadrado), el valor calculado con σ2=1 es razonable y por lo
tanto el fabricante no tiene razón para sospechar que la desviación estándar es
diferente a un año.

La siguiente Figura muestra la distribución chi cuadrado con


2,3,4,5 y 8 grados de libertad, respectivamente.
Distribución chi cuadrado

26
Grados de libertad como medición de la
información muestral
• Daremos algunos resultados sin demostraciones que debemos
tener en cuenta:

Una muestra aleatoria que se toma de una distribución normal, la

variable aleatoria

tiene distribución normal estándar.


• Si esta v.a. se eleva al cuadrado se obtiene otra variable aleatoria que
sigue una distribución chi cuadrado. Es decir,

tiene distribución chi cuadrado con 1 grado de libertad.

• Ahora si sumamos n variables de este tipo, se obtiene otra v.a. que


tiene distribución chi cuadrado con n grados de libertad

Cuando los datos (los valores en la muestra) se utilizan para calcular la media,
hay 1 grado de libertad menos en la información que se utiliza para estimar la
varianza poblacional σ2.
El uso del TLC y la distribución normal es ciertamente útil en aplicaciones que
giran alrededor de las inferencias sobre la media de la población o la diferencia
entre dos medias de población. Sin embargo se supuso que la desviación
estándar de la población se conoce. Esta suposición puede ser racional en
situaciones donde el ingeniero está bastante familiarizado con el sistema o
proceso.
Sin embargo, en muchos escenarios experimentales el conocimiento de σ no es
más razonable que el conocimiento de la media µ de la población.
Frecuentemente, de hecho, una estimación de σ la debe proporcionar la misma
información muestral que produce la media muestral. Como consecuencia, una
estadística natural a considerar para tratar con las inferencias

EJERCICIOS Distribución muestral de S2


27
1.- La duración promedio de cierta reacción entre dos sustancias es de 48
segundos con una desviación estándar de 4 segundos. Suponiendo que las
duraciones de estas reacciones químicas siguen aproximadamente una
distribución normal, encuentre: 𝜇 = 48 𝑠, 𝜎 = 4 �

28
29
DISTRIBUCION T

• sobre µ es

puesto que S es el análogo de la muestra para σ. Si el tamaño de la


2
muestra es pequeño, los valores de S fluctúan de forma considerable
de una muestra a otra y la distribución de T se desvía
de forma apreciable de la de una distribución normal estándar.
• Si el tamaño de la muestra es suficientemente grande, digamos n>=30,
la distribución de T no difiere de manera considerable de la normal
estándar. Sin embargo, para n<30, es útil tratar con la distribución
exacta de T.
• Para desarrollar la distribución muestral de T supondremos que la
muestra aleatoria se selecciona de una población normal.

30
Podemos escribir entonces:

donde

tiene distribución normal estándar y

tiene distribución chi cuadrado con V=n-1 grados de libertad. Al muestrear de


poblaciones normales, se puede demostrar que y S2 son independientes, y en
consecuencia también Z y V lo son.

31
• La distribución de probabilidad de T se publicó por primera vez en 1908
en un artículo de William Sealy Gosset. En esa época, Gosset era
empleado de una cervecería irlandesa que prohibía la publicación de
investigaciones de sus empleados. Para eludir esta prohibición, publicó
su trabajo en secreto bajo el seudónimo de Student. En consecuencia,
la distribución de T usualmente se llama distribución t de Student o
simplemente distribución t.
• Gosset supone que las muestras se seleccionan de una población
normal. Aunque esto parece una suposición fuerte, se puede demostrar
que las poblaciones no normales que poseen distribuciones en forma
casi de campana aún proporcionan valores de T que se aproximan muy
cerca a la distribución t.
La distribución de T es similar a la distribución de Z, pues ambas son
simétricas alrededor de una media de cero. Ambas distribuciones tiene
forma de campana, pero la distribución t es

32
• más variable, debido al hecho de que los valores de T dependen de las
2
fluctuaciones de dos cantidades, y S , mientras que los valores Z
dependen solamente de los cambios de entre una
muestra y otra.
• La distribución de T difiere de la distribución de Z en que la varianza de
T depende del tamaño de la muestra n y siempre es mayor que 1.

distribuciones serán la misma.


• En la Figura siguiente se muestra la relación entre una distribución
normal (V =INFINITO) y las distribuciones t con 2,3, 4 y 5 grados de
libertad.
• Se acostumbra representar con t el valor t por arriba del cual
α
encontramos un área igual a α. De aquí, el valor t con 10 grados de
libertad que deja un área de 0.025 a la derecha es t=2.228 (ver
Tabla de la distribución t).

• Ejemplo 6: Calcular el valor t con 14 grados de libertad que deja un área


de 0.025 a la izquierda, y por tanto un área de 0.975 a la derecha.
t0.975= − t0.025= − 2.145

• Como la distribución t es simétrica alrededor de una media de cero,

33
tenemos que t1-α=−tα, es decir, el valor t que deja un área de 1-α a la
derecha y por tanto un área α a la izquierda, es igual al valor t negativo
que deja un área de α en la cola derecha de la

distribución. Por ejemplo, t0.95= −t0.05, t0.99= −t0.01, etc.

• Ejemplo 7: Calcular
• Ejemplo 8: Calcular el valor de k tal que
para una muestra aleatoria de tamaño 15 que se selecciona de una
población normal.

• Ejemplo 9: Un ingeniero químico afirma que el rendimiento medio de la


población de cierto proceso en lotes es 500 gramos por milímetro de
materia prima. Para verificar esta afirmación muestrea 25 lotes cada
mes. Si el valor t calculado cae entre − t0.05 y t0.05 queda satisfecho
con su afirmación. ¿Qué conclusión extraería de una muestra que tiene
una media de 518 gramos por milímetro y una desviación estándar de
40 gramos?. Supongamos que la distribución de rendimientos es
aproximadamente normal.
De la Tabla de la distribución t encontramos que t0.05 =1.711 para 24
grados de libertad. Por lo tanto, el fabricante queda satisfecho con esta
afirmación si una muestra de 25 lotes rinde un valor t entre −1.711 y

un valor muy por arriba de 1.711.

• La probabilidad de obtener un valor t, con 24 grados de libertad, igual o

la muestra sería más razonable. De aquí que es probable que el fabricante


concluya que el proceso produce un mejor producto del que piensa.
• Debemos tener en cuenta que el uso de la distribución t para la

estadística

requiere que la muestra X ,X2,…,Xn sea normal. El uso de la distribución t y la


1
consideración del tamaño de la muestra no se relacionan con el TLC. El uso de la

distribución normal estándar en lugar de t para n>=30 solamente implica que S

es un estimador suficientemente bueno para σ en este caso.


34
EJERCICIOS DISTRIBUCION T

35
36
37
38
39
40
Conclusiones

 En conclusión El teorema central del límite es uno de los resultados


fundamentales de la estadística. Este teorema nos dice que si una muestra
es lo bastante grande (generalmente cuando el tamaño muestral (n) supera
los 30), sea cual sea la distribución de la media muestral, seguirá
aproximadamente una distribución normal.

 Y En cada una de las distintas muestras que pueden ser extraídas de una
población se pueden calcular estadísticos como la media aritmética o la
proporción de elementos que presentan cierta característica; por ejemplo, la
media de estaturas o la proporción de licenciados universitarios. Cuando los
elementos son escogidos de manera aleatoria, los estadísticos pueden
tomar distintos valores en cada una de las muestras, cada uno de ellos con
distinta probabilidad. En los ejemplos del inicio de esta sección ya vimos
que los valores de la media en diferentes muestras aleatorias se
encontraban con mayor probabilidad cerca del valor de la media
poblacional, y que era menos probable que se encontrasen muy alejados de
ella.

 Distribución t-Student o distribución “T”


En probabilidad y estadística, la distribución t (de Student) es
una distribución de probabilidad que surge del problema
de estimar la media de una población normalmente distribuida cuando
el tamaño de la muestra es pequeño. Aparece de manera natural al realizar
la prueba t de Student para la determinación de las diferencias entre dos
medias muéstrales y para la construcción del intervalo de confianza para la
diferencia entre las medias de dos poblaciones

41
E-grafía

https://economipedia.com/definiciones/teorema-central-del-limite.h
file:///C:/Users/otto_/Downloads/tabla-t-de-student-ejercicios.pdf
file:///C:/Users/otto_/Downloads/ejercicios-de-distribucion-muestral.pdf
https://es.wikipedia.org/wiki/Distribución_t_de_Student
https://economipedia.com/definiciones/teorema-central-del-limite.html
https://economipedia.com/definiciones/varianza.

42

También podría gustarte