Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CURSO: ESTADISTICA
CATEDRATICO: Mauricio Osorio
TEMAS:
TEORIA LIMITE CENTRAL
DISTRIBUCIÓN MUESTRAL S2
DISTRIBUCIÓN T
INTEGRANTES:
● 1590-10-2203 Marlon Isai Verela Marroquin
● 1590-20-15444 Eleazar David Esteban Tecún
● 1590-21-13800 Fabio Manuel Flores Casasola
● 1590-15-10299 Wilmer Antonio Sinay
● 1590-21-18758 Ludwing Danilo Morales De paz
● 1590-19-25471 Noel Fauricio Guzmán Aroche
● 1590-21-17411 Erick Randolfo Ruano Revolorio
1
INDICE
Introducción ......................................................................................................... 3
DISTRIBUCION T ................................................................................................ 30
Conclusiones ..................................................................................................... 41
E-grafía ............................................................................................................... 42
2
Introducción
3
MARCO TEÓRICO
1.1 Teoría del Límite Central
1.1.1 Definición:
El teorema central del límite (TCL) es una teoría estadística que establece que,
dada una muestra aleatoria suficientemente grande de la población, la
distribución de las medias muestrales seguirá una distribución normal.
1.1.2 Funciones y Aplicaciones:
El TCL afirma que a medida que el tamaño de la muestra se incrementa,
la media muestral se acercará a la media de la población. Por tanto, mediante el
TCL podemos definir la distribución de la media muestral de una determinada
población con una varianza conocida. De manera que la distribución seguirá una
distribución normal si el tamaño de la muestra es lo suficientemente grande.
1.3 Distribución T
1.3.1 Definición:
La distribución t de Student o distribución t es un modelo teórico utilizado para
aproximar el momento de primer orden de una población normalmente distribuida
cuando el tamaño de la muestra es pequeño y se desconoce la desviación típica.
La distribución t es una distribución de probabilidad que estima el valor de la
media de una muestra pequeña extraída de una población que sigue
una distribución normal y de la cual no conocemos su desviación típica.
1.3.2 Funciones y Aplicaciones:
La distribución t se utiliza cuando:
4
Queremos estimar la media de una población normalmente distribuida a partir de
una muestra pequeña.
6
El teorema central del límite, uno de los fundamentales en estadística, estudia el
comportamiento de la suma de variables aleatorias, cuando crece el número de
sumandos, asegurando su convergencia hacia una distribución normal en
condiciones muy generales.
Hay que terne en cuenta que el nombre de este teorema viene dado por la
aproximación que existe entre dos distribuciones, siendo esta mayor en el centro,
que en sus extremos. Así mismo, es aplicable dentro de distintos campos,
destacándose dentro de la inferencia estadística y en la teoría de renovación.
9
Al decidirse a aplicar el teorema de límite central, se puede escoger una muestra
para el análisis que comprenda un total de 500 sucursales de S&P 500. Como se
sabe, para que sea válida su aplicación, es necesario que se cuente con una
muestra mayor a 30, por lo que se cumple una de las condiciones. Finalmente, se
determina un total de 50 empresas para iniciar, seleccionadas de manera aleatoria,
y en cada una se aplica el mismo proceso de estudio. Según el enunciado del
teorema, los pasos serías:
Se establece una muestra de 50 empresas de S&P 500, y se obtiene la rentabilidad
media del total de la muestra.
Se vuelven a seleccionar continuamente otras 50 sucursales, y se realiza el mismo
procedimiento.
Al realizar la suma de todas las rentabilidades medias del total de las muestras que
se escogieron para el análisis, esta debe ser aproximada a una distribución normal.
Finalmente, las rentabilidades medias del total de muestras escogidas se
aproximará a la rentabilidad media de la población total.
10
La media poblacional y la media muestral serán iguales. Es decir, la media de la
distribución de todas las medias muestrales será igual a la media del total de la
población.
La varianza de la distribución de las medias muéstrales será σ²/n. Que es la
varianza de la población dividido entre el tamaño de la muestra.
Que la distribución de las medias muéstrales se parezca a una normal es
tremendamente útil. Porque la distribución normal es muy fácil de aplicar para
realizar contrastes de hipótesis y construcción de intervalos de confianza. En
estadística que una distribución sea normal es bastante importante, dado que
muchos estadísticos requieren este tipo de distribución. Además, el TCL nos
permitirá hacer inferencia sobre la media poblacional a través de la media muestral.
Y esto es de gran utilidad cuando por falta de medios no podemos recolectar datos
de toda una población.
EJERCICIOS DEL TEOREMA CENTRAL DEL LÍMITE
1.- La edad de los miembros de una determinada asociación sigue una
distribución N ( , ). Sabemos que la distribución de las medias de las edades en
muestras de tamaño 36 tiene como media 52 años y como desviación típica 0,5.
a) Halla la media y la desviación típica de la edad de los miembros de la
asociación.
b) ¿Cuál es la probabilidad de que un miembro de la asociación, elegido al
azar, sea mayor de 60 años?
Solución:
a) Por el teorema central del límite, sabemos que las medias muestrales se
Por el teorema central del límite, sabemos que las medias muestrales se
distribuyen
El intervalo característico es de la forma:
→ zα/2 = 3
Así, el intervalo será:
(51,51; 82,49)
Por tanto, en el 99,73% de las muestras, las medias están comprendidas entre
51,51 y 82,49 puntos.
12
3.- La duración de un determinado tipo de pilas sigue una distribución normal
con una media de 50 horas y una desviación típica de 5 horas. Empaquetamos
las pilas en cajas de 16:
Solución:
a) Por el teorema central del límite, sabemos que las medias muestrales siguen
una
=1,25.
que:
4.- El peso de las truchas de una piscifactoría se distribuye según una normal de
media 150 gramos y varianza 1 225.Halla un intervalo en el que se encuentren
el 95% de las medias de pesos de las muestras de tamaño 50.
Solución:
Por el teorema central del límite, sabemos que las medias muestrales se
distribuyen
13
(140,298; 159,702)
Por tanto, en el 95% de las muestras, las media de los pesos estarán
comprendidas entre 140,298 y 159,702 gramos
5.- En una determinada población, los pesos se distribuyen según una normal
de media μ = 65 kg y varianza 49. Si extraemos muestras de tamaño 64:
Solución:
distribuyen según
si z es N (0,
1):
La probabilidad
pedida es de 0,0436.
Solución:
14
El intervalo característico es de la forma:
Para el 95%, tenemos que zα/2 = 1,96. Por tanto, el intervalo será:
(17,29; 17,91)
Por tanto, las edades medias en el 95% de los grupos están entre 17,29 y
17,91 años.
7.- La media de edad de los lectores de una determinada revista es de 17,2 años,
y la desviación típica, 2,3 años. Si elegimos muestras de 100 lectores:
Solución:
15
8.- La duración de cierto tipo de batería sigue una distribución normal de media
3 años y desviación típica de 0,5 años. Si se toman muestras de tamaño 9, halla
un intervalo en el que estén comprendidos el 99% de las duraciones medias de
las baterías de cada muestra.
Solución:
sabemos que
será:
(2,57; 3,43) Por tanto, las duraciones medias de las baterías en el 99% de las
muestras estarán
comprendidas entre 2,57 y 3,43 años.
Solución:
a) Por el teorema central del límite, sabemos que las medias muestrales
siguen una
Por el teorema central del límite, sabemos que las medias muestrales se
distribuyen
(3,75; 4,65)
Por tanto, en el 90% de las muestras, las notas medias estarán comprendidas entre
3,75 y 4,65 puntos.
17
Distribución de muestral de s2
Distribución Muestra
La inferencia estadística trata básicamente con generalizaciones y predicciones.
Por ejemplo, podemos afirmar, con base a opiniones de varias personas
entrevistadas en Copiapó, que en las próximas elecciones municipales el 52% de
los electores votará por el candidato A. En este caso tratamos con una muestra
aleatoria de opiniones de una población finita muy grande.
Podemos afirmar que el costo promedio para construir una piscina está entre 4 y
4.5 millones de pesos, con base en las estimaciones de tres contratistas
seleccionados al azar de 30 que construyen piscinas residenciales actualmente.
La población que será muestreada aquí es finita pero muy pequeña.
Por otro lado, un funcionario de cierta compañía calcula la media de 40 bebidas y
obtiene 236 c.c., y con base en este valor decide que la máquina aún sirve
bebidas con un contenido promedio de
18
n la práctica al valor de una estadística por lo general se le da el mismo nombre
de la estadística. Por ejemplo, el término medio de la muestra se aplica tanto a la
estadística
como a su valor calculado .
21
Distribución muestral de la diferencia entre dos
promedios
El Ejemplo 2 trata de nociones de inferencia estadística sobre una sola media µ.
El ingeniero estaba interesado en apoyar una conjetura con respecto a una sola
media de la población. Una aplicación más importante incluye dos poblaciones.
Un científico o ingeniero se interesa en un experimento comparativo el se cotejan
dos métodos de producción, 1 y 2. La base para esta comparación es µ -µ , la
1 2
diferencia de las medias de la población. Supongamos
que t e n e m o s d o s p o b l a c i o n e s , l a p r i m e r a c o n m e d i a µ
1 y
desviación estándar σ , y la segunda con media µ y desviación estándar σ .
1 2 2
Representamos la media de una muestra aleatoria de tamaño n
1
seleccionada de la primera población y la estadística media de una muestra
aleatoria de tamaño n seleccionada d e l a s e g u n d a p o b l a c i ó n ,
2
independiente de la
muestra aleatoria de la primera población.
¿Qué podemos decir acerca de la distribución de muestreo de la…
22
es aproximadamente una variable normal estándar
Por lo tanto,
23
• ¿Qué podemos aprender del resultado anterior? La maquinaria de cálculo
se basa en la suposición de que µ =µ .
A B
• Supongamos, sin embargo, que el experimento realmente se lleva
a cabo con el propósito de realizar una inferencia con respecto a la igualdad
de µ y µ , los tiempos medios se secado de las dos poblaciones. Si los
A B
dos promedios difieren por una hora (o más),
esto claramente es una evidencia que nos conducirá a concluir que el
tiempo medio de secado de la población no es igual para los dos tipos de
pintura.
• Por otro lado, supongamos que la diferencia en los dos promedios
muestrales es más pequeña que, digamos, 15 minutos. Si µ =µ ,
A B
Población 1 Población 2
1=6.5 2=6.0
σ =0.9 σ =0.8
1 2
n =36 n =49
1 2
24
Si utilizamos lo anterior, la distribución muestral de será
aproximadamente normal y tendrá una media y una desviación estándar
de
Distribución muestral de S2
En lo anterior aprendimos acerca de la distribución de muestreo de la media
muestral. El TLC nos permitió hacer uso del hecho de que
25
tiene una distribución chi cuadrado con v=n-1 grados de libertad
Ejemplo 5: Un fabricante de baterías para autos garantiza que sus baterías durarán,
en promedio, tres años con una desviación estándar de un año. Si cinco de estas
baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años, ¿el fabricante aún está
convencido de que sus baterías tienen una desviación estándar de un año?
Supongamos que la duración de las baterías sigue una distribución normal.
Primero calculamos la varianza muestral
Entonces
es un valor de una distribución chi cuadrado con 4 grados de libertad. Como 95%
de los valores X^2 con 4 grados de libertad caen entre 0.484 y 11.143 (ver Tabla
de la distribución chi cuadrado), el valor calculado con σ2=1 es razonable y por lo
tanto el fabricante no tiene razón para sospechar que la desviación estándar es
diferente a un año.
26
Grados de libertad como medición de la
información muestral
• Daremos algunos resultados sin demostraciones que debemos
tener en cuenta:
variable aleatoria
Cuando los datos (los valores en la muestra) se utilizan para calcular la media,
hay 1 grado de libertad menos en la información que se utiliza para estimar la
varianza poblacional σ2.
El uso del TLC y la distribución normal es ciertamente útil en aplicaciones que
giran alrededor de las inferencias sobre la media de la población o la diferencia
entre dos medias de población. Sin embargo se supuso que la desviación
estándar de la población se conoce. Esta suposición puede ser racional en
situaciones donde el ingeniero está bastante familiarizado con el sistema o
proceso.
Sin embargo, en muchos escenarios experimentales el conocimiento de σ no es
más razonable que el conocimiento de la media µ de la población.
Frecuentemente, de hecho, una estimación de σ la debe proporcionar la misma
información muestral que produce la media muestral. Como consecuencia, una
estadística natural a considerar para tratar con las inferencias
28
29
DISTRIBUCION T
• sobre µ es
30
Podemos escribir entonces:
donde
31
• La distribución de probabilidad de T se publicó por primera vez en 1908
en un artículo de William Sealy Gosset. En esa época, Gosset era
empleado de una cervecería irlandesa que prohibía la publicación de
investigaciones de sus empleados. Para eludir esta prohibición, publicó
su trabajo en secreto bajo el seudónimo de Student. En consecuencia,
la distribución de T usualmente se llama distribución t de Student o
simplemente distribución t.
• Gosset supone que las muestras se seleccionan de una población
normal. Aunque esto parece una suposición fuerte, se puede demostrar
que las poblaciones no normales que poseen distribuciones en forma
casi de campana aún proporcionan valores de T que se aproximan muy
cerca a la distribución t.
La distribución de T es similar a la distribución de Z, pues ambas son
simétricas alrededor de una media de cero. Ambas distribuciones tiene
forma de campana, pero la distribución t es
32
• más variable, debido al hecho de que los valores de T dependen de las
2
fluctuaciones de dos cantidades, y S , mientras que los valores Z
dependen solamente de los cambios de entre una
muestra y otra.
• La distribución de T difiere de la distribución de Z en que la varianza de
T depende del tamaño de la muestra n y siempre es mayor que 1.
33
tenemos que t1-α=−tα, es decir, el valor t que deja un área de 1-α a la
derecha y por tanto un área α a la izquierda, es igual al valor t negativo
que deja un área de α en la cola derecha de la
• Ejemplo 7: Calcular
• Ejemplo 8: Calcular el valor de k tal que
para una muestra aleatoria de tamaño 15 que se selecciona de una
población normal.
estadística
35
36
37
38
39
40
Conclusiones
Y En cada una de las distintas muestras que pueden ser extraídas de una
población se pueden calcular estadísticos como la media aritmética o la
proporción de elementos que presentan cierta característica; por ejemplo, la
media de estaturas o la proporción de licenciados universitarios. Cuando los
elementos son escogidos de manera aleatoria, los estadísticos pueden
tomar distintos valores en cada una de las muestras, cada uno de ellos con
distinta probabilidad. En los ejemplos del inicio de esta sección ya vimos
que los valores de la media en diferentes muestras aleatorias se
encontraban con mayor probabilidad cerca del valor de la media
poblacional, y que era menos probable que se encontrasen muy alejados de
ella.
41
E-grafía
https://economipedia.com/definiciones/teorema-central-del-limite.h
file:///C:/Users/otto_/Downloads/tabla-t-de-student-ejercicios.pdf
file:///C:/Users/otto_/Downloads/ejercicios-de-distribucion-muestral.pdf
https://es.wikipedia.org/wiki/Distribución_t_de_Student
https://economipedia.com/definiciones/teorema-central-del-limite.html
https://economipedia.com/definiciones/varianza.
42