Está en la página 1de 17

FACULTAD DE INGENIERÍA CIVIL Y AMBIENTAL

CURSO :Métodos Estadísticos

TEMA : Prueba F y t

ESTUDIANTES : Acosta Acosta Waldir Miguel


Gavidia Vasquez, Jeysy
Human López Amancio
Ligue Tocas Jhonatan
Ordoñez Llanca Wilmer
Vásquez Vargas Rosa Katerine

DOCENTE : Biol. Danilo Edson Bustamante Mostajo


MUESTRAS RELACIONADAS MUESTRAS INDEPENDIENTES
Si los valores de una muestra Si los valores de una muestra no revelan
afectan los valores de la otra información sobre los valores de la otra
muestra, entonces las muestras son muestra, entonces las muestras son
dependientes. independientes.

Ejemplo de recolección de muestras dependientes y muestras independientes

a) Tomando muestras de la presión arterial de las mismas personas antes y después


de administrarles una dosis. Las dos muestras son dependientes, porque se
toman de las mismas personas. Es probable que las personas con la presión
arterial más alta en la primera muestra también tengan la presión arterial más
alta en la segunda muestra.
b) Dando a un grupo de personas un medicamento activo y dando a otro grupo de
personas un placebo inactivo, para luego comparar los valores de presión
arterial entre los grupos. Es muy probable que estas dos muestras sean
independientes, porque las mediciones corresponden a personas diferentes.
Saber algo sobre la distribución de los valores de la primera muestra no le
indica nada con respecto a la distribución de los valores de la segunda.
TEST O PRUEBA F

La distribución F, desarrollada por Sir Ronald


Fisher, es una medida muy diferente a las otras

CARACTERÍSTICAS
1. No es asimétrica.
2. Su forma depende del numero de grados de
libertad asociados con las varianzas.
3. No puede ser negativo.

REQUISITOS
1. La muestra debe ser aleatorias
independientes.
2. Las poblaciones deben ser normales.
FÓRMULA
El estadístico F se define como el cociente de dos variables
aleatorias chi cuadrada independientes, dividida cada una entre
su número de grados de libertad.

PASOS PARA CALCULAR F


 Se plantean las hipótesis y .
Donde : 𝑆2
1 hipótesis nula
: varianza muestral 1 𝐹= 2
𝑆  Luego el nivel de significación
: varianza muestral 2 2
 Se determina el valor de F en la
variante estadística.
 Se toma una decisión de aceptar o
Grados de libertad: rechazar las varianzas poblacionales.
 Una vez calculado F a partir de los
grados de libertad buscamos y
ubicamos el valor crítico en la curva.
.
Si F es mayor que se diría que las
varianzas son diferentes, y si F es menor
que se dirá que las varianzas son
iguales.

¿PARA QUE SE UTILIZA LA PRUEBA F?

 La distribución F se usa en situaciones de


dos muestras para hacer inferencias acerca
de las varianzas de población.
 la distribución F también se puede aplicar
a muchos otros tipos de problemas que
involucren varianzas muestrales.
 La distribución F de Fisher se utiliza para
comprobar las varianzas.
Ejercicio :
PRUEBA F PARA MUESTRAS INDEPENDIENTES

Se desea saber si existe una diferencias reales


entre las dos muestras sobre los pesos de los
alumnos del primer ciclo de ingeniería tanto de
Varones con el de mujeres su objetivo es
comparar los resultados; recopilo los siguientes
datos muestrales reportados en kilogramos.
Usando el nivel de significancia del 5 %, ¿hay
alguna diferencia entre las variaciones de los
pesos de los alumnos ?
76.333
𝑆 22=9 . 0656

69.667
33.867
PASO 1: Plantear hipótesis

𝑯 𝟎 : 𝝈𝟐
𝟏 = 𝝈 𝟐
𝟐

𝑯 𝒂 : 𝝈𝟐𝟏 ≠ 𝝈 𝟐𝟐
PASO 2: Selecciona el nivel de significancia

𝜶=𝟎.𝟎𝟓
PASO 3: Obtenemos el valor crítico (

𝒗 𝟏 𝒏𝟏 − 𝟏   𝟔 − 𝟏 𝟓
= = =
𝒗 𝟐 𝒏𝟐 − 𝟏   𝟔 − 𝟏 𝟓

𝒇 𝟎. 𝟎𝟓 ( 𝒗 𝟏 , 𝒗 𝟐)

𝒇 𝟎. 𝟎𝟓 (𝟓 , 𝟓)

5.05
PASO 4: Regla de decisión

𝑆2
1
𝐹= 2
𝑆2

33 . 867
𝐹=
9 . 0656

3.736

Fc = 5.05

DECISIÓN : Se rechaza la hipótesis alternativa, debido a que F es menor que el valor de F crítico()

CONCLUSIÓN : No hay diferencia entre las variaciones de pesos de los alumnos del 1er ciclo de ingeniería.
Ejercicios 2: Apéndice V
1. Se obtienen dos muestras de tamaños 9 y 12 de
poblaciones normalmente distribuidas con
varianzas 16 y 25, respectivamente. Si las varianzas
muestrales son 20 y 8, determine si la primera
muestra tiene una varianza significativamente
mayor que la segunda muestra a niveles de
significancia de a) 0.05 y b) 0.01.

Solución:
Para las dos muestras, 1 y 2, se tiene , ,

^ 𝟐
𝑺 𝑵 𝟏 𝑺𝟏
𝟐
𝟏 ( 9 ) ( 20 )
𝟐 𝟐
𝝈𝟏 ( 𝑵 𝟏 − 𝟏) 𝝈 𝟏 ( 9 − 1 ) ( 16 )
𝑭= = = = 4 . 03
^ 𝟐
𝑺 𝑵 𝑺
𝟐
( 12 ) ( 8 )
𝟐 𝟐 𝟐

𝝈𝟐
𝟐
( 𝑵 𝟐 − 𝟏 ) 𝝈 𝟐𝟐 ( 12 − 1 ) ( 25 ) Dado que calculada es mayor que 2.95, se
concluye que la varianza de la muestra 1 es
a) Los grados de libertad de numerador y el significativamente mayor que la muestra 2 a nivel
denominador de F son: y de significancia de 0.05.
b) Para y , en el apéndice VI se encuentra .

CONCLUSIÓN:
En este caso, la F calculada es 4.03 es menor que
4.74. Por lo tanto, no se puede concluir que la
varianza de la muestra 1 sea mayor que la varianza
de la muestra 2 a nivel de significancia 0.01.
Una prueba t es una prueba de hipótesis de la media
TEST O PRUEBA t
de una o dos poblaciones distribuidas normalmente.

PRUEBA t PARA MUESTRAS RELACIONADAS Se desea conocer si el tratamiento reduce el número de


bacterias. Formule y pruebe las hipótesis de interés
𝑥1− 𝑥2
𝑡= usando α=0.05
𝑠/√𝑛
SOLUCION
Los datos siguientes son logaritmos de recuentos de bacterias
en siete botellas de leche (escogidas aleatoriamente), tomados Hipótesis: 𝐻 0 : 𝑃𝑜𝑏𝑙𝑎𝑛𝑡𝑒𝑠 =𝑃𝑜𝑏𝑙𝑑𝑒𝑠𝑝𝑢 é 𝑠
antes y después de un tratamiento térmico. 𝐻 1 : 𝑃𝑜𝑏𝑙𝑑𝑒𝑠𝑝𝑢é 𝑠 < 𝑃𝑜𝑏𝑙𝑎𝑛𝑡𝑒𝑠
ANTES DESPUES Δ

Botella 1 6,98 Botella 2 6,95 -0,03 𝑥1 − 𝑥 2=− 0 , 217


Botella 3 7,08 Botella 4 6,94 -0,14

Botella 5

Botella 7
8,34

5,30
Botella 6

Botella 8
7,17

5,15
-1,17

-0,15
𝑠=
𝑑
∑ (𝑥𝑖 − 𝑥)2 =
𝑛− 1
− 0 , 217
√ 1 , 09
6
=0 , 427

𝑡= = =− 1, 347
Botella 9 6,26 Botella 10 6,28 0,02 𝑠 / √ 𝑛 0 , 427 / √ 7 𝑡 𝑡𝑎𝑏=− 1 , 943 𝛼=0 , 05
Botella 11 6,77 Botella 12 6,81 0,04

Botella 13 5,45 Botella 14 5,36 -0,09 Conclusión:


El tratamiento térmico no reduce significativamente el
número de bacterias.
Prueba t: Muestras independientes de varianzas homogéneas

Varianza agrupada: 𝑠 2𝑐 =0 , 19
𝑥1 − 𝑥 2
𝑡= ( 𝑛1 − 1 ) 𝑠 21 + ( 𝑛2 − 1 ) 𝑠 22


2
;𝑠 =
2
𝑠𝑐 𝑠𝑐
2 𝑐
𝑛1 +𝑛2 − 2 Intervalo de confianza: 𝛼=5 %
+
𝑛1 𝑛2 ; Grados de libertad: 𝜈 =𝑛1+𝑛 2 − 2=12 − 2 =10

Se realizó un estudio sobre la contaminación que se da


por persona entre dos ciudades diferentes, obteniendo
los siguientes datos.

𝑡 𝑡𝑎𝑏=2 ,228

Estadístico t: 𝑥1 − 𝑥 2 0 ,65
Determinar si la contaminación promedio de las 𝑡= = =2 , 57

√ √ 0 ,19 0 ,19
2 2
dos ciudades es diferente 𝑠𝑐 𝑠𝑐 +
+ 6 6
𝑛1 𝑛2
SOLUCION
Conclusión:
Hipótesis: 𝐻 0 : 𝜇1 =𝜇2
Se determina que la contaminación promedio de
𝐻 1 : 𝜇1 ≠ 𝜇 2 ambas ciudades son diferentes.
Prueba t: Muestras independientes de varianzas
heterogéneas Tabla 1. Comparación de las coberturas vegetales de acuerdo a su

( )
2 2
𝑥1 − 𝑥 2
2
𝑠 𝑠
1 2 densidad y vigor vegetal con los valores promedio de los 3 índices
+
𝑡= 𝑛1 𝑛2 derivados de la imagen ASTER.


2 2 ; 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 ≈
𝑠 𝑠
( ) ( )
2 2 2 2
1
+
2 𝑠1 𝑠1
𝑛1 𝑛2 𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1

Considerando que la escala original de valor de los índices de


vegetación es de 1 a -1 se procedió a calcular los índices de
vegetación de las imágenes reescalando a 8 bits, con el propósito
de obtener valores de 0 a 255 (manteniendo la misma
proporcionalidad de la escala original) para evitar valores
negativos y decimales en las pruebas estadísticas.

Tabla 2. Comparación de las coberturas vegetales de acuerdo a su


densidad y vigor vegetal con los valores promedio de los 3 índices
derivados de la imagen Landsat 7 ETM +.

Evaluar los 3 índices de vegetación en imágenes ASTER y Landsat


7 ETM+ para diferenciar los tipos de vegetación, utilizando como
referencia un mapa de cobertura y uso de suelo.
En la tabla se observa que en todos los
casos el valor de p es menor a 0.05,
por lo tanto rechazamos la hipótesis
nula Ho y aceptamos la alterna H1, y
se concluye que existen diferencias
significativas entre los valores medios
de los tres índices de vegetación en las
diferentes coberturas vegetales
analizadas.
Conclusión:
Los tres índices de vegetación permitieron discriminar los
diferentes tipos de cobertura vegetal analizadas.
Al analizar los índices para encontrar diferencias en función del
tipo de imagen utilizada, se observa que las desviaciones
estándar de los índices para cada coberturas son menores en
todos los casos en ASTER; por lo tanto se deduce que esta
imagen consigue mejor homogeneidad cuando extraemos
muestras de coberturas a partir de polígonos de mapas de uso
de suelo, resultado que era esperado debido a las diferencias
de resolución espacial entre la ASTER y Landsat 7 ETM+
REFERENCIAS BIBLIOGRÁFICAS

Walpole, R. & Myers, R. (1992). Probabilidad y estadística. Mexico: McGraw-Hill.

Martinez, B. (2002). Estadística y muestreo. Bogotá: ECOE Ediciones

Visauta, V. (2007) Análisis estadístico con SPSS 14: Estadística básica (3a ed.). Madrid: McGraw-
Hilll Interamericana.

Juárez, F; Villatoro, A & López, E. (2002). Apuntes de Estadística Inferencial. México, D. F.:
Instituto Nacional de Psiquiatría Ramón de la Fuente.

También podría gustarte