Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Facultad de Ingeniería
Distribución Normal, Teorema del Limite
Central y Otras Distribuciones
Errores en el Muestreo
Cuando se utilizan valores muestrales, o estadísticos para estimar
valores poblacionales, o parámetros, pueden ocurrir dos tipos generales
de errores: el error muestral y el error no muestral.
Error Muestral
Cualquier medida conlleva algún error. Si se usa la media para medir,
estimar, la media poblacional m, entonces la media muestral, como
medida, conlleva algún error. Por ejemplo, supongamos que se ha
obtenido una muestra aleatoria de tamaño 25 de una población con
media m = 15: si la media de la muestra es x=12, entonces a la
diferencia observada x-m = -3 se le denomina el error muestral. Una
media muestral x puede pensarse como la suma de dos
cantidades, la media poblacional m y el error muestral; si e denota el
error muestral, entonces:
X=µ+e
Error estándar de la media
Ejemplo
Para la distribución
muestral de medias del
ejercicio pasado,
encuentre:
a) El error muestral de
cada media
b) La media de los errores
muestrales
c) La desviación estándar
de los errores muestrales.
Error estándar de la media
Ejemplo
Para la distribución muestral de medias del ejercicio pasado, encuentre:
Solución:
a) En la tabla siguiente se ven las muestras, las medias de las muestras
y los errores muestrales:
En general se tiene: σx = σe
Cuando las muestras se toman de una población pequeña y sin
reemplazo, se puede usar la formula siguiente para encontrar sx .
El factor N n
N 1
n
0.05
N
Distribución de muestreo de la Media:
Teorema central del Límite
Ejemplo:
Suponga que la tabla siguiente muestra la antigüedad en años en el
trabajo de tres maestros universitarios de matemáticas:
Maestro de matemáticas Antigüedad
A 6
B 4
C 2
Solución:
Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las
muestras posibles de tamaño 2, con sus respectivas medias
muestrales.
µx = µ y σ = σx
Distribución de muestreo de la Media:
Solución:
Ejemplo:
Las estaturas de 1000 estudiantes están distribuidas aproximadamente
en forma normal con una media de 174.5 centímetros y una desviación
estándar de 6.9 centímetros. Si se extraen 200 muestras aleatorias de
tamaño 25 sin reemplazo de esta población, determine:
a) El número de las medias muestrales que caen entre 172.5 y 175.8
centímetros.
b) El número de medias muestrales que caen por debajo de 172
centímetros.
Solución:
Como se puede observar en este ejercicio se cuenta con una población
finita y un muestreo sin reemplazo, por lo que se tendrá que agregar el
factor de corrección. Se procederá a calcular el denominador de Z para
sólo sustituirlo en
cada inciso.
Distribución de muestreo de la Media
Distribución de muestreo de la Media
Estimación Puntual
Un estimador de un parámetro poblacional es una función de
los datos muestrales. En pocas palabras, es una fórmula que
depende de los valores obtenidos de una muestra,
muestra para
realizar estimaciones.
x i
x1 x2 ......... xn
x 1
n n
Estimación Puntual
Estimación puntual
Consiste en la estimación del valor del parámetro mediante un sólo
valor, obtenido de una fórmula determinada. Por ejemplo, si se
pretende estimar la talla media de un determinado grupo de individuos,
puede extraerse una muestra y ofrecer como estimación puntual la
talla media de los individuos de la muestra. necesito los ejemplos
x i
x1 x2 ......... xn
x 1
n n
Cuando inferimos no tenemos garantía de que la conclusión que
obtenemos sea exactamente correcta. Sin embargo, la estadística
permite cuantificar el error asociado a la estimación.
x i
X i 1
n
i
( x x ) 2
S2 i 1
n 1
La cuasivarianza muestral es un estimador insesgado de la varianza
poblacional.
Estimación Puntual
La inferencia estadística está casi siempre concentrada en obtener algún tipo de conclusión
acerca de uno o más parámetros (características poblacionales). Para hacerlo, se requiere
que un investigador obtenga datos muestrales de cada una de las poblaciones en estudio.
Entonces, las conclusiones pueden estar basadas en los valores calculados de varias
cantidades muestrales. Por ejemplo, representamos con μ (parámetro) el verdadero
promedio de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de
semiconductores. Podría tomarse una muestra aleatoria de 10 conexiones para
determinar la resistencia a la ruptura de cada una, y la media muestral de la resistencia
a la ruptura se podía emplear para sacar una conclusión acerca del valor de μ.
p̂
Proporción poblacional Proporción muestral
pˆ p
Z
Para estandarizar proporciones p (1 p )
n
Recordamos la variable aleatoria Binomial
Parámetros de la función
• n: número de pruebas independientes y repetidas
• p: probabilidad de que ocurra un éxito en una prueba
Dominio de la variable
0≤x≤n
Valor esperado μ = E(x) = np
Varianza σ2 V(x) = np(1-p)
pˆ p
Z
Para estandarizar proporciones p (1 p)
n
Estimación por Proporciones
Se sabe que la proporción de artículos defectuosos en un proceso de
manufactura es del 0.10. El proceso se vigila periódicamente al tomar
muestras aleatorias de tamaño 100 e inspeccionar las unidades.
Valor Valor
Crítico Crítico
2 2
8 de diciembre de 2021 36
α y Nivel de Confianza y Significación Estadística
Para
Para ser
ser clasificada
clasificada como
como Significante,
Significante el
Significante
Significante, el valor
valor real
real medido
medido debe
debe
exceder
exceder al
al valor
valor Crítico.
Crítico.
Éste
Éste es
es el
el valor
valor tabular
tabular determinado
determinado por
por la
la distribución
distribución de
de
probabilidad
probabilidad yy el
el riesgo
riesgo de
de error.
error.
Este
Este riesgo
riesgo de
de error
error se
se llama Riesgo ee indica
llama Riesgo indica la
la probabilidad
probabilidad que
que
este
este valor
valor ocurra
ocurra naturalmente.
naturalmente. Así,
Así, un riesgo de
un riesgo de .05
.05 (5%)
(5%) significa
significa
que
que este
este valor
valor crítico
crítico será
será excedido
excedido por
por una
una ocurrencia
ocurrencia aleatoria
aleatoria << 5%
5%
de
de veces.
veces.
Valor Valor
Crítico Crítico
2.5% 2.5%
2 Ocurrencia Ocurrencia Ocurrencia 2
Rara Común Rara
8 de diciembre de 2021 37
Intervalos de Estimación
X
P Z n Z1 1
2 0 2
X
P 1.96 n 1.96 0,95
0
Puntos e Intervalos de Estimación
X
P 1,96 n 1,96 0,95
0 95%
2,5%
Z=-1,96 Z=1,96
Estimación por Intervalos de confianza
Un estimado puntual, por ser un sólo número, no proporciona por sí
mismo información alguna sobre la precisión y confiabilidad de la
estimación.
Una alternativa para reportar un solo valor del parámetro que se esté
estimando es calcular e informar todo un intervalo de valores factibles, un
estimado de intervalo o intervalo de confianza (IC).
Puntos e Intervalos de Estimación
X
P 1,96 n 1,96 0,95
0
0 0 0 0
P 1,96 X 1,96 0,95 P X 1,96 X 1,96 0,95
n n n n
0 0
X 1,96 , X 1,96
n n
S S
X t n 1, / 2 , X t n 1, / 2
n n
Calculo de Intervalos de Confianza con EXCEL
Estimar µ cuando σ es
desconocido
S S
X t n 1, / 2 , X t n 1, / 2
n n
N Z 2 2
n 2
d ( N 1) Z 2 2
Tamaño de la Muestra para estimar Medias
Para hacer un planeamiento económico de cierta zona del país es
necesario estimar entre 10.000 establos lecheros el número de vacas
lecheras por establo con un error de estimación de 4 y un nivel de confianza
de 95%. Si se sabe que σ2 = 1.000.
¿Cuántos establos deben visitarse para satisfacer estos requerimientos?
N 10.000
Z 1.96
2 1.000
d 4
10.000 (1.96) 2 1.000
n 234.5 n 235
16 9.999 (1.96) 1000
2
Tamaño de la Muestra para estimar Medias
Para hacer un planeamiento económico de cierta zona del país es
necesario estimar entre 10.000 establos lecheros el número de vacas
lecheras por establo con un error de estimación de 4 y un nivel de confianza
de 95%. Si se sabe que σ2 = 1.000.
¿Cuántos establos deben visitarse para satisfacer estos requerimientos?
N 10.000
Z 1.96
2 1.000
d 4
(1.96) 2 1.000
n 240
16
Tamaño de la Muestra para estimar Medias
Población Infinita Población Finita
2
i
( x x ) 2
2
( n 1) s 2
2
2
La DISTRIBUCION CHI CUADRADA
Estudiamos ahora la distribución de la varianza de muestras aleatorias de
poblaciones normales.
Como S2 no puede ser negativa, deberíamos sospechar que esta distribución
de muestreo no es una curva normal.
A este tipo de distribución se la llama “Distribución Chi cuadrada”
2
i
( x x ) 2
2
( n 1) s 2
2
2
es la variable aleatoria con la
. distribución Chi-cuadrada, con
(n -1) grados de libertad.
La DISTRIBUCION CHI CUADRADA
FUNCIÓN DE DENSIDAD
La Distribución chi-cuadrado, tiene por función de densidad
x
k
2
1
.e
x
2
( x)
2
2
k k
2 k
2
2 i
( x x ) 2
2
( n 1) s 2
2 2
Calcula-
mos la
X2 con la Respuesta.
fórmula Hay un
3,51% De
probabilidad
que la
varianza
supere los
50
Ejemplo de aplicación de la Distribución CHI-
Cuadrada inversa con EXCEL
Encontramos de esta
forma el valor de Chi
Cuadrado para la
Probabilidad 0.01 con
9 gl.
Ahora despejamos de
la fórmula el valor de
la varianza
(10 1).s 2
21.665
25
21.66 25
s2 60.183
9
Respuesta: El valor de la varianza muestral pedido es de 60.2
Excel permite calcular el Valor Critico para obtener una determinada
Probabilidad, para la situación dada, usando la función χ2 inversa
Ejemplo de aplicación de la Distribución CHI-
Cuadrada inversa con EXCEL
Respuesta:
Respuesta El valor
de la varianza que
ocurrirá 1 de 100
veces es 21.66
Recibió este nombre en honor a Sir Ronald Fisher, uno de los fundadores
de la estadística moderna. Esta distribución de probabilidad se usa como
estadística prueba en varias situaciones. Se emplea para probar si dos
muestras provienen de poblaciones que poseen varianzas iguales. Esta
prueba es útil para determinar si una población normal tiene una mayor
variación que la otra y también se aplica cuando se trata de comparar
simultáneamente varias medias poblacionales. La comparación
simultánea de varias medias poblacionales se conoce como análisis de
varianza (ANOVA). En ambas situaciones, las poblaciones deben ser
normales y los datos tener al menos la escala de intervalos.
La Distribución F
Características de la distribución F
1.Existe una "familia" de distribuciones F. Un miembro específico de la
familia se determina por dos parámetros: los grados de libertad en el
numerador y en el denominador . Existe una distribución F para la
combinación de 29 grados de libertad en el numerador y 28 grados en el
denominador. Existe otra distribución F para 19 grados en el numerador y 6
en el denominador.
5.A medida que aumentan los valores, la curva se aproxima al eje x, pero
nunca lo toca
6.
La Distribución F
s12
La distribución F esta relacionada con el cociente de varianzas .En
2 2 s22
s
donde
1 y s 2 son las varianzas muestrales tienen una distribución
2
con (n - 1) grados de libertad.
Entonces podemos decir que:
1 2
S 2
( n 1)
v 2
F 12 en donde 2 despejando convenientemente:
2
v2
S12
Función Densidad
F 2
S2
La Distribución F
s12
F=
s22
9 Muestras Tomadas por c/u de los laboratorios Loys y Bayes Siempre se arma la
60 fórmula con la
varianza mas grande
55
53,0909
en el numerador, por
50
52
convención con el uso
de las tablas
TEST
45
s B2
40
F 2 1
35
sL
BAYES LOYD
Laboratorio
La Distribución F
Test for Equal Variances for ANTES (seg)
F-Test
Test Statistic 2,31
A P-Value 0,076
Lev ene's Test
TURNO
20 30 40 50 60
F asume
95% Bonferroni Confidence Intervals for StDevs
normalidad y
Levene no asume
normalidad de la
muestra
A
TURNO