Está en la página 1de 17

Facultad Administración y Negocios

Ingeniería Comercial

Teoría de las muestras pequeñas


Facultad Administración y Negocios
Ingeniería Comercial

Objetivo
• Con frecuencia se utilizó el hecho de que si el tamaño de las muestras es grande, N > 30, lo
que se conoce como muestras grandes, las distribuciones muestrales de muchos de los
estadísticos son aproximadamente normales.
• Si el tamaño de las muestras es N < 30, lo que se conoce como muestras pequeñas, esta
aproximación a la normal no es buena y empeora a medida que N disminuye, de manera
que es necesario hacer algunas modificaciones.

• Al estudio de las distribuciones muestrales de los estadísticos, cuando las muestras son
pequeñas, se le llama teoría de las muestras pequeñas.
• Un nombre más adecuado sería teoría del muestreo exacto, ya que los resultados obtenidos
son válidos tanto para muestras grandes como para muestras pequeñas.
• En este capítulo se estudian tres distribuciones importantes:
1. La distribución t de Student,
2. La distribución ji cuadrada y
3. La distribución F
Facultad Administración y Negocios
Ingeniería Comercial

Distribución t de Student
• Se define el estadístico t:

• t es análogo al estadístico z:

• Se consideran muestras de tamaño N extraídas de una población normal cuya media es µ


• Para cada muestra se calcula t, usando la media muestral x y la desviación estándar
muestral s, se obtiene la distribución muestral de t.
• Esta distribución está dada por
Facultad Administración y Negocios
Ingeniería Comercial

Distribución t de Student
• donde Y0 es una constante que depende de N, tal que el área total bajo la curva sea 1, y
donde a la constante ν = (N - 1) se le conoce como el número de grados de libertad.
• A la distribución se le llama distribución t de Student en honor a su descubridor, quien en la
primera mitad del siglo xx publicó sus trabajos bajo el seudónimo “Student”.
• Si los valores de ν o de N son grandes (N ≥ 30), la curva se aproxima a la curva normal
estándar
Facultad Administración y Negocios
Ingeniería Comercial

Intervalo de confianza con t Student


• Se pueden definir intervalos de confianza de 95%, 99% u otros intervalos usando la tabla
de la distribución t que aparece en el apéndice III. De esta manera puede estimarse la
media poblacional µ dentro de determinados límites de confianza
• Por ejemplo, si -t.975 y t.975 son los valores de t para los cuales 2.5% del área se encuentra
repartida en cada una de las colas de la distribución t, entonces el intervalo de confianza
para t de 95% es

• a partir de lo cual se puede estimar que µ se encuentra en el intervalo con una confianza
de 95%.

• En general, los límites de confianza para la media poblacional se representan mediante


Facultad Administración y Negocios
Ingeniería Comercial

Pruebas de hipótesis y de significancia con t Student


• Las pruebas de hipótesis o reglas de decisión pueden extenderse fácilmente a problemas
con muestras pequeñas; la única diferencia es que la puntuación z, o estadístico z, se
sustituye por la puntuación t o estadístico t apropiado.
1. Media. Para probar la hipótesis H0 de que una población normal tiene una media µ, se
usa la puntuación t (o estadístico t) que es análogo a usar la puntuación z.

2. Diferencias entre medias. Supóngase que de poblaciones normales cuya desviaciones


estándar son iguales (σ1 = σ2) se toman dos muestras aleatorias de tamaños N1 y N2.
Supóngase, además, que las medias de estas dos muestras son X1 y X2 y que sus
desviaciones estándar son s1 y s2, respectivamente. Para probar la hipótesis H0 de que
las muestras provienen de una misma población (es decir que µ1 = µ2 y también σ1 = σ2)
se usa la puntuación t dada por

• estimación de σ2 la media ponderada


Facultad Administración y Negocios
Ingeniería Comercial

Pruebas de hipótesis y de significancia con t Student


• 11.6 El espesor de las golillas producidas con una máquina es 0.050 pulgadas (in). Para determinar si
la máquina está trabajando de manera adecuada se toma una muestra de 10 golillas en las cuales el
espesor medio es 0.053 in y la desviación estándar es 0.003 in.
• Probar la hipótesis de que la máquina está trabajando en forma adecuada usando los niveles de
significancia de 0.05
• La prueba de hipótesis es:
• Ho: µ=0,050, la máquina trabaja correctamente
• H1: µ ≠0,050, la máquina No trabaja correctamente
• Por lo tanto, se requiere una prueba de dos colas.
• De acuerdo con la hipótesis H0 se tiene

• Para una prueba de dos colas a nivel de significancia 0.05, se adopta la siguiente regla de decisión:
• Aceptar H0 si t se encuentra dentro del intervalo -t.975 a t.975, el cual para 10 - 1 = 9 grados de
libertad es el intervalo -2.26 a 2.26. (Apéndice III)
• Rechazar H0 si no es así.
• Como t = 3.00, se rechaza H0 al nivel 0.05
Facultad Administración y Negocios
Ingeniería Comercial

Pruebas de hipótesis y de significancia con t Student


11.30 Las especificaciones en la producción de cierta aleación exigen 23.2% de cobre. En una muestra
consistente en 10 análisis del producto, el contenido medio de cobre fue 23.5% y la desviación estándar
0.24%. A los niveles de significancia de 0.05 ¿puede concluirse que el producto satisface las
especificaciones?
• Probar la hipótesis de que el producto satisface las especificaciones de cobre usando los niveles de
significancia de 0.05. La prueba de hipótesis es:
• Ho: µ=0,232, el producto satisface las especificaciones de cobre
• H1: µ ≠0,232, el producto No satisface las especificaciones de cobre
• Por lo tanto, se requiere una prueba de dos colas.
• De acuerdo con la hipótesis H0 se tiene t=(23,5-23,2)/0,24 x raíz(10-1)=3,750 (nota: da mismo
resultado con tanto por 1)

• Para una prueba de dos colas a nivel de significancia 0.05, se adopta la siguiente regla de decisión:
• Aceptar H0 si t se encuentra dentro del intervalo -t.975 a t.975, el cual para 10 - 1 = 9 grados de
libertad es el intervalo -2.26 a 2.26. (Apéndice III)
• Rechazar H0 si no es así.
• Como t = 3.75, se rechaza H0 al nivel 0.05
Facultad Administración y Negocios
Ingeniería Comercial

Pruebas de hipótesis y de significancia con t Student


11.35 En un examen de psicología, la media de las calificaciones de los 12 estudiantes de un grupo es 78
y la desviación estándar es 6; la media de las calificaciones de los 15 estudiantes de otro grupo es 74 y la
desviación estándar es 8. Empleando el nivel de significancia 0.05, determinar si el primer grupo es
mejor que el segundo grupo.
Si µ1 y µ2, respectivamente, denotan las medias poblacionales de calificaciones de los estudiantes de
estas dos regiones, hay que decidir entre las hipótesis:
• Ho: µ1=µ2, No hay diferencia en las calificaciones entre los dos grupos
• H1: µ ≠ µ2 , SI hay una diferencia significativa en las calificaciones de los dos grupos
• De acuerdo con la hipótesis H0,

• σ= raíz((12x62 + 15x82)/(12+15-2))=7,462
• t=(78-74)/ 7,462xraiz(1/12 + 1/15))= 1,385
• Empleando una prueba de dos colas al nivel de significancia 0.05, H0 se rechaza si t queda fuera del
intervalo -t.975 a t .975
• Para 25 grados de libertad (N1 + N1 - 2 = 12+15-2=25) es el intervalo( -2.06 a 2.06) Apéndice III
• Como el estadístico t=1,385 esta dentro del intervalo (α=0.05) no se puede rechazar H0.
• Se concluye que no hay una diferencia significativa entre las medias de calificaciones de los dos
grupos.
Facultad Administración y Negocios
Ingeniería Comercial

Pruebas de hipótesis y de significancia con t Student


• 11.8 El cociente intelectual (CI) de 16 estudiantes de una región resultó con una media de 107 y una
desviación estándar de 10, el CI de 14 estudiantes de otra región resultó de 112 y la desviación
estándar de 8. Al nivel de significancia de 0.05, ¿hay diferencia entre los CI de estos dos grupos?
• Si µ1 y µ2, respectivamente, denotan las medias poblacionales de los CI de los estudiantes de estas
dos regiones, hay que decidir entre las hipótesis:
• Ho: µ1=µ2, No hay diferencia en CI entre los dos grupos
• H1: µ ≠ µ2 , SI hay una diferencia significativa en CI entre los dos grupos
• De acuerdo con la hipótesis H0,

• Empleando una prueba de dos colas al nivel de significancia 0.05, H0 se rechaza si t queda fuera del
intervalo -t.975 a t .975
• Para 28 grados de libertad (N1 + N1 - 2 = 16+14-2=28) es el intervalo( -2.05 a 2.05)
• Como el estadístico t=1,45 esta dentro del intervalo (α=0.05) no se puede rechazar H0.
• Se concluye que no hay una diferencia significativa entre los CI de los dos grupos.
Facultad Administración y Negocios
Ingeniería Comercial

Distribución Ji cuadrada
• Se define el estadístico X2
• Si se consideran muestras de tamaño N obtenidas de una población normal cuya
desviación estándar es σ, y si para cada muestra se calcula χ2, se obtiene una distribución
muestral de χ2. Esta distribución, llamada distribución ji cuadrada, está dada por

• donde ν = N - 1 es el número de grados de libertad y Y0 es una constante que depende de ν,


de manera que el área bajo la curva sea 1. En la figura 11-2 se presentan distribuciones ji
cuadrada correspondientes a diversos valores de ν. El valor máximo de Y se obtiene
cuando χ2 = ν - 2 para ν ≥ 2.
Facultad Administración y Negocios
Ingeniería Comercial

Distribución Ji cuadrada
Facultad Administración y Negocios
Ingeniería Comercial

Intervalos de confianza para distribución Ji cuadrada


• Como se hizo con la distribución normal y con la distribución t, pueden definirse límites de
confianza de 95%, 99%, empleando la tabla de distribución χ2 que se presenta en el
apéndice IV.
• De esta manera puede estimarse la desviación estándar poblacional σ en términos de la
desviación estándar muestral dentro de determinados límites de confianza.

• Por ejemplo, si 2 :025 y X:2975 son los valores de χ2 (llamados valores críticos), tales que
2.5% del área se encuentra repartida en ambas colas de la distribución, entonces el
intervalo de confianza de 95% es

• de donde se ve que puede estimarse que σ se encuentra en el intervalo


Facultad Administración y Negocios
Ingeniería Comercial

Grados de libertad
• Para calcular un estadístico, es necesario emplear observaciones obtenidas de una
muestra y también ciertos parámetros poblacionales. Si estos parámetros no se conocen,
es necesario estimarlos a partir de la muestra

• El número de grados de libertad de un estadístico, que por lo general se denota ν, se define


como la cantidad N de observaciones en la muestra (es decir, el tamaño de la muestra)
menos la cantidad k de parámetros poblacionales que tengan que estimarse a partir de las
observaciones muestrales. En símbolos, ν = N - k.

• En el caso del estadístico (1), la cantidad de observaciones independientes en la muestra es


N, y a partir de ellas se calculan X y s. Sin embargo, como se necesita estimar µ, k = 1 y por
lo tanto ν = N - 1.
• En el caso del estadístico (8), la cantidad de observaciones independientes en la muestra
es N, a partir de las cuales se calcula s. Sin embargo, como se tiene que estimar σ, k = 1 y
por lo tanto ν = N - 1.
Facultad Administración y Negocios
Ingeniería Comercial

Intervalo de confianza para desviación estándar con χ2


• 11.13 La desviación estándar de las estaturas de 16 estudiantes elegidos en forma
aleatoria en una escuela de 1.000 estudiantes es 2.40 in. Encontrar los límites de confianza
de: a) 95% para la desviación estándar de las estaturas de todos los estudiantes de esta
escuela.
• SOLUCIÓN
• a) Los límites de confianza de 95% son

• Para ν = 16 - 1 = 15 grados de libertad, de la tabla IV, X20.975 = 27.5 (o bien χ0.975 = 5.24) y 2
X20.025= 6.26 (o bien χ0.025 = 2.50).

• Los límites de confianza de 95% son 2,40xraiz(16)/5,24 = 1,83” y 2,40xraiz(16)/2,50 = 3,83”


• Por lo tanto, se puede tener una confianza de 95% de que la desviación estándar
poblacional se encuentra entre 1.83 y 3.84 in.
Facultad Administración y Negocios
Ingeniería Comercial

Grados de libertad
• 11.17 La desviación estándar en los pesos de paquetes de 40.0 onzas (oz), llenados con una
máquina, ha sido 0.25 oz. En una muestra de 20 paquetes se observa una desviación
estándar de 0.32 oz. ¿Este aparente incremento en la variabilidad es significativo a los
niveles: a) 0.05
• Decidir entre las hipótesis:
• Ho: σ = 0,25 oz, el resultado observado es casualidad
• H1: σ > 0,25 oz, la variabilidad ha aumentado
2 2
𝑁𝑠 20(0,32)
• El valor de χ2 para la muestra es χ2 = χ2 = =32,77
σ2 (0,25)2

• a) Empleando una prueba de una cola, y la tabla IV, al nivel de significancia 0.05, se rechaza
H0 si los valores muestrales de χ2 son mayores a 2 :95, lo que es igual a 30.1
• Para ν = 20 - 1 = 19 grados de libertad y χ20,95 =30,1
• Como el valor calculado de χ20,95=32,77> 30,1, se rechaza H0 al nivel de significancia 0.05
• La variabilidad en el peso de paquetes ha aumentado
Facultad Administración y Negocios
Ingeniería Comercial

Prueba de hipótesis con χ2 con una y dos colas

También podría gustarte