Está en la página 1de 44

DISTRIBUCION

“F”
Integrantes: 6MM2

- Arellano Vidaurry Kevin Isaac


- Ayala Mendoza Samuel
- Callejas Corona José Manuel
- Mejía Caballero Luis Arturo
- Suarez Melendez David
DISTRIBUCION
F
La distribución F es un modelo estadístico que se utiliza para
estudiar las varianzas de dos poblaciones independientes. También
se usa, principalmente, en el análisis de varianza, una técnica
estadística desarrollada por estadístico inglés Fisher. Al igual que
otras distribuciones, la distribución F presenta características y
propiedades específicas.
¿QUÉ ES LA
DISTRIBUCION F?

La distribución F también se conoce como distribución de Fisher-


Snedecor, sirve para demostrar las variaciones de una población. Más
específicamente, se usa una distribución F cuando se busca estudiar la
razón de las varianzas de dos poblaciones distribuidas normalmente.
Asimismo, este tipo de distribución también se utiliza en un análisis de
varianza de un factor (ANOVA).
El análisis de varianza
se encarga de comparar
la variación entre varios
grupos o poblaciones y
la variación que hay
dentro de cada una de
ellas. Para lograrlo, se
usa una proporción de
variaciones. La
distribución F permite
analizar la relación entre
las varianzas.
Características de la distribución
F
La distribución F presenta características definidas que la diferencian de
otras distribuciones. Algunas de ellas son:

-Las distribuciones F incluyen varios métodos estadísticos.

-La distribución F particular que se utiliza depende del número de grado de


libertad que tiene la muestra. Esta característica de la distribución F también
está presente en otras distribuciones, como la distribución T y la distribución
chi-cuadrado.
- El valor de la distribución F es nulo, es
decir, cero o positivo. No tiene valores
negativos.

- La distribución F posee una leve


inclinación hacia la derecha. Por lo tanto, se
trata de una distribución de probabilidad
que no es simétrica.
Propiedades de
las distribuciones
Las F
distribuciones F
tienen grados de libertad. Esta
es una característica que
también poseen las
distribuciones T y chi-
cuadrado. En el caso de una
distribución T, el número de
grados de libertad es uno
menos que el tamaño de
muestra.
La distribución F deriva de F deriva de una relación entre dos
poblaciones. Generalmente, se toma una muestra de ambas
poblaciones, por lo tanto hay dos grados de libertad. Para determinar
los dos números de grados de libertad, debemos restarle uno a ambos
tamaños de muestra. Después, las estadísticas de estas poblaciones se
combinan en una fracción.
Tanto el numerador como el denominador tienen grados de libertad. En
lugar de combinar estos dos números en otro número, se conservan
ambos. Por lo tanto, el uso de una tabla de distribución F requiere que
haya dos grados de libertad diferentes.
La variable aleatoria F o estadístico F propuesto por Ronald Fisher es el que
se usa más frecuentemente para comparar las varianzas de dos poblaciones y
se define de la siguiente manera:

Siendo s2 la varianza muestral y σ2 la varianza


poblacional. Para distinguir cada uno de los dos grupos
poblacionales, se utilizan los subíndices 1 y 2
respectivamente.
Se sabe que la distribución ji-cuadrada con (n-1) grados de libertad
es la que sigue la variable auxiliar (o estadístico) que se define a
continuación:

X2 = (n-1) s2 / σ2.


Por lo tanto, el estadístico F sigue una distribución teórica dada por la
siguiente fórmula:
Siendo U la distribución ji-cuadrada con d1 = n1 – 1 grados
de libertad para la población 1 y V la distribución ji-
cuadrada con d2 = n2 – 1 grados de libertad para la
población 2.
Media μ = d2 / (d2 – 2) con d2 > 2

Moda

Varianza
Ejemplo 1
De poblaciones distribuidas en forma normal se obtienen dos muestras de tamaño 16 y
14 cuyas varianzas muestrales son de 10 y 8.
Si las varianzas son de 9 y 16 respectivamente, determinar si la primera muestra tiene
una varianza bastante mayor que la segunda muestra al nivel de significancia a) 0.95 y
b) 0.99
Solución:

Datos

Sustituimos valores
= 2.20
* Obtenemos los grados de libertad
Numerador = = 15
Denominador: = 14 - 1= 13
Buscamos en la tabla 0.95
Buscamos en tabla 0.99
a) Fc < Ft 2.20 < 2.53 b) Fc < Ft 2.20 < 3.81
Se acepta Ho Se acepta Ho

Fc=2.20 Fc=2.20

F(0.95, 15, 13)=2.53 F(0.99, 15, 13)=3.81


Ejemplo 2
+ Un profesor del IPN requieres saber la diferencia entre
calificaciones de hombres y mujeres en el grupo 6MM2 considere la
Alumnos
siguiente tabla. Tamaño de muestra
calificaciones
(N)
Hombres 12 7
Mujeres 5 8

Se utiliza significancia de 0.10. ¿ existe una diferencia de


calificaciones entre hombres y mujeres?
-Hipótesis: -Dividimos la significancia entre 2
debido a que buscamos diferencia

-Obtenemos grados de libertad:


Numerador = = 6
Denominador: = 8 - 1= 7
Ft= 3.866 Fc=
Por lo tanto aceptamos ya que no hay diferencia
Ejemplo 3
Se hizo una encuesta a 21 estudiantes de Contabilidad y a 16
estudiantes de Administración , sobre los minutos que dedicaban a
la lectura , se encontró que los estudiantes de Contabilidad
dedican en promedio 82 minutos a la lectura por día , con una
desviación estándar de σ =9.2 y que los estudiantes de
Administración leen en promedio 74 minutos con una desviación
estándar de 12.4.

Calcular F y determina si las varianzas son iguales


estadísticamente.
Solución
Organizamos los datos : 𝑔𝑙 1=15 𝑔𝑙 2=20
Administración

𝑛1=16 𝑇𝑎𝑚𝑎 ñ 𝑜 𝑑𝑒 𝑙𝑎𝑚𝑢𝑒𝑠𝑡𝑟𝑎


𝑛2=21𝑇𝑎𝑚𝑎 ñ 𝑜 𝑑𝑒𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝜎 1 =¿ 12.4 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 ¿
𝑥1=74 𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝜎 2=¿9.2 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 ¿
𝑥2 =82 𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Calculamos F

F=1.81
Una vez que ubicamos

Y F calculada F= 1.81
Se puede decir que los
tiempos de lectura son
iguales
Ejemplo 4
Una empresa de transporte ofrece servicios desde una escuela hasta la
terminal de autobuses , el dueño de la empresa esta considerando dos
rutas , una por Avenida Juárez y la otra Avenida Álvaro Obregón.
Desea estudiar el tiempo necesario para llegar a la terminal por cada
uno de estos caminos y después comparar los resultados .Obtuvo los
siguientes datos de muestra (en minutos).Utiliza el nivel de
significancia de 0.01 ¿Existe alguna diferencia en la variación de los
tiempos de recorrido por ambas rutas ?
# Datos Avenida Juárez Avenida Álvaro Obregón

1 52 59

2 67 60

3 56 61

4 45 51

5 70 56

6 54 63

7 64 57

8 65
𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 Grados de Libertad
𝐻 0 =𝜎 12=𝜎 22
𝐻 1= 𝜎 21 ≠ 𝜎 22
𝑁𝑢𝑚𝑒𝑟𝑎𝑑𝑜𝑟 𝑛1 − 1=7 − 1=6
𝐷𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑜𝑟 𝑛2 −1=8 −1=7

F
# Datos Avenida Juárez Avenida Álvaro Obregón

1 52 59
2 67 60
3 56 61
4 45 51
5 70 56
6 54 63
7 64 57
8 65

𝑠=
√ ∑ ( 𝑥 − 𝑥 )2
𝑛− 1
= 58.2857 = 59

𝑆1 =

(52 −58.2857 )2 + ( 67 −58.2857 )2+ (56 −58.2857 ) 2+ ( 45 −58.2857 )2+ ( 70 − 58.2857 )2 + ( 54 −58.2857 )2 + ( 64 −58.2857 )2
7 −1

𝑆 2=

( 59− 62.75 )2 + ( 60 −62.75 )2 + ( 61− 62.75 )2 + ( 51 −62.75 ) 2+ ( 56 − 62.75 )2 + ( 63 −62.75 )2+ ( 57 −62.75 )2+ ( 95 −62.75 ) 2
8−1
Prueba F =8.9947


)=4.3753
𝑠=
∑ ( 𝑥 − 𝑥) 2

𝑛− 1
(𝑆 ¿ ¿ 12 )( 8.9947 ) 2
𝐹= 2¿
¿
(𝑆 ¿ ¿ 2 ) ¿ 2
= 4.23
4.3753

¿Variación en los tiempos?


No ,al 1% de nivel de
significancia
Ejemplo 5
La variabilidad en la cantidad de impurezas, presente en un lote de un producto químico empleado para un
proceso particular, depende del tiempo en que el proceso está en operación. Un Fabricante que utiliza dos
líneas de producción, 1 y 2, ha hecho un ligero ajuste a la línea 2, Esperando con ello reducir la variabilidad
así como el promedio de la cantidad de impurezas en el producto químico. Muestras de n1 25 y n 25
mediciones de los dos lotes dan estas medias y varianzas:

Solución
El experimentador piensa que el promedio de los niveles de impurezas son los mismos para las dos
líneas de producción pero que su ajuste puede haber disminuido la variabilidad de los niveles para la línea 2.
Este ajuste sería bueno para la compañía porque disminuiría la probabilidad de hacer envíos del producto
químico con niveles de impureza inaceptablemente altos. Para determinar la disminución en variabilidad, la
prueba de hipótesis es:

y el valor observado para este estadístico de prueba es:


Usando el método del valor p, se puede limitar el valor p de una cola usando la tabla con
24. El valor observado de cae entre 1.98 y , de modo que .025 < valor p < 05 ; Los
resultados son juzgados como significativos al nivel del 5%, y es rechazada. Se concluye
que la variabilidad de la línea 2 es menor que la de la línea 1.
Gráfica de distribución
F, df1=24, df2=24
1.2

1.0

0.8
Densidad

Gráfica de distribución
0.6
F, df1=24, df2=24
1.2
0.4

0.2 1.0
0.02551

0.0
0 1.98 2.27 0.8
X

Densidad
0.6

0.4

0.2

0.04357
0.0
0 2.04
X
Ejemplo 6
1.- Un experimentador está preocupado porque la variabilidad de respuestas que usan dos procedimientos
experimentales diferentes puede no ser igual. Antes de realizar su investigación, lleva a cabo un estudio
previo con muestras aleatorias de 10 y 8 respuestas y obtiene y , respectivamente. ¿Las varianzas
muestrales presentan suficiente evidencia para indicar que las varianzas poblacionales son desiguales?
Se desea probar estas hipótesis:
contra

Para un se puede rechazar el cuando F>4.82; con


Calculando:

Debido a que el estadístico de prueba no cae en la región de rechazo, no se puede rechazar . Por tanto, hay
insuficientes evidencia para indicar una diferencia en las varianzas poblacionales.
Gráfica de distribución
F, df1=9, df2=7

0.7

0.6

0.5
Densidad

0.4

Gráfica de distribución
0.3 F, df1=9, df2=7

0.2 0.7

0.1 0.6

0.025
0.0 0.5
0 4.823
X

Densidad
0.4

0.3

0.2

0.1
0.1528
0.0
0 2.22
X

También podría gustarte