Está en la página 1de 34

 Procedimiento

 Pruebas para medias y proporciones

 Pruebas para una varianza

 Pruebas para más de una varianza

 Prueba para determinar la normalidad de


una distribución muestral
 Pruebas para análisis de correlación
Karl Pearson
(27 mar. 1857 - 27 abr. 1936).
Científico, matemático y pensador
británico. Fundó la Estadística
Matemática. En 1900 presentó la
distribución x2.

Ronald Aylmer Fisher


George Waddel Snedecor
(17 feb. 1890 - 29 jul. 1962).
(20 oct. 1881 - 15 feb. 1974).
Científico, matemático,
Matemático y estadístico
estadístico, biólogo evolutivo y
estadounidense.
genetista inglés. Creó la Inferencia
Estadística y desarrolló la
distribución F en 1920.
Prueba de hipótesis para: Estadístico de prueba
t (muestra pequeña)
Una media poblacional
Z (muestra grande)
La diferencia entre 2 medias t (muestra pequeña)
independientes Z (muestra grande)
La diferencia entre 2 medias t (muestra pequeña)
dependientes (pareadas) Z (muestra grande)
Una proporción poblacional Z
Comparar 2 proporciones Z
La varianza de una población Χ2 (Chi Cuadrada)
Comparar 2 o más varianzas F de Fisher - Snedecor
Es la distribución muestral de la varianza (S2):
si se extraen todas las muestras posibles de una
población normal y a cada muestra se le calcula su
varianza, se obtendrá la distribución muestral de
varianzas.

Fórmulas:

𝑓𝑜 −𝑓𝑒 2 (𝑛−1)𝑆 2
𝑋2 = σ 𝑋2 =
𝑓𝑒 𝜎2
1. Los valores de X2 son mayores o iguales que 0.
2. La forma de una distribución X2 depende de gl=k-1. En
consecuencia, hay un número infinito de distribuciones X2.
3. El área bajo una curva Chi cuadrada y sobre el eje horizontal
es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas
estrechas que se extienden a la derecha; esto es, están
sesgadas a la derecha.
5. Si k=n, cuando n>2, la media de una distribución X2 es n-1 y
la varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).
(Karl Pearson)
Distribución de
probabilidad continua
con un parámetro k
que representa los
grados de libertad de
la variable aleatoria.
Es muy aplicada en
inferencia estadística.

7
8
La prueba χ² se emplea como:
Inferencia de varianza
Prueba de Independencia (tablas de
contingencia)
Prueba de bondad de ajuste
Estimación de varianzas
Estimación de la media de una población
normalmente distribuida
Estimación de la pendiente de una recta de
regresión lineal (relacionada con la
distribución “t”)
9
También se emplea para el “Análisis de
varianza (ANOVA)” por su relación con la
distribución F de Fisher – Snedecor
(distribución del cociente de dos variables
aleatorias independientes con distribución
χ²)

10
Ejemplo 1. Varianza esperada (inferencia de varianza):

Calificaciones
Antes del Después del
entrenamiento entrenamiento
9 7
5 6
7 7
8 5
7 6
8 4

¿Se logró reducir el nivel de dispersión luego del


entrenamiento? Nivel de significación 2%.
11
Ho: La dispersión fue la misma, antes y después del
entrenamiento (X2 = 0) (S2 = 1.86667)
H1: La dispersión disminuyó después del entrenamiento (X2 > 0)
(S2 < 1.86667)
Nivel de significación: 2%

Límite crítico: (gl = 6 -1 = 5, 0.02) = 13.388

=INV.CHICUAD.CD(0.02,5)

Estadístico de prueba: 3.66 (5x1.36667 / 1.86667)


12
Chi-square Variance Test

1.8666700 hypothesized variance


1.3666667 observed variance of Después del entrenamiento
6 n
5 df
3.66 chi-square

.4008 p-value (one-tailed, lower)

13
Decisión mediante el estadístico de prueba:
No puede rechazarse la Ho con 2% de significación
(el estadístico de prueba no está en la región de
rechazo)
El entrenamiento no contribuyó a reducir el grado de
dispersión

Decisión mediante el Valor P:


Nivel de significación 2%
Valor P 40.08% (igual decisión)
14
Ejemplo 2. Frecuencia conjunta: ocurrencia conjunta de las
categorías de dos variables.

Tabla de contingencia o prueba de independencia:

Mujeres Hombres Total


Asistieron 66 94 160
No asistieron 134 146 280
Total 200 240 440

¿La cantidad de asistentes estuvo relacionada con el sexo


de las personas? Nivel de significación 5%.
15
Ho: La cantidad de asistentes no estuvo relacionada con el sexo
de las personas (X2 = 0)
H1: La cantidad de asistentes sí estuvo relacionada con el sexo
de las personas (X2 > 0)
Nivel de significación: 5%

Límite crítico: (gl = 2-1 x 2-1 = 1, 0.05) = 3.84

=INV.CHICUAD.CD(0.05,1)

Estadístico de prueba: 1.79

16
Chi-square Contingency Table Test for Independence

Mujeres Hombres Total


Asistieron 66 94 160
No asistieron 134 146 280
Total 200 240 440

1.79 chi-square
1 df
.1806 p-value

17
Decisión mediante el estadístico de prueba:
No puede rechazarse la Ho con alfa 5% (el
estadístico de prueba no está en la región crítica o
de rechazo)
La cantidad de asistentes no estuvo relacionada con
el sexo de las personas

Decisión mediante el Valor P:


Nivel de significación 5%
Valor P 18.06% (igual decisión)
18
Medición del ajuste logrado cuando se aplica algún
criterio o una distribución de probabilidad.
Ejemplo 3.
Ventas en 5 tiendas
Ventas
Tienda (miles de
quetzales)
1 805.5
2 779.8
3 825.2
4 768.1
5 795.0
Total 3973.6

¿Fue similar el nivel de ventas logrado en cada una de


las cinco tiendas de la empresa? Alfa 10%. 19
Ho: El nivel de ventas fue el mismo en las cinco tiendas
H1: El nivel de ventas no fue el mismo en las cinco tiendas
Nivel de significación: 10%

(Al no haber criterio de diferenciación se asume Xi = Xj)


Ventas en 5 tiendas
Ventas
observadas Ventas
Tienda
(miles de esperadas
quetzales)
1 805.5 794.7
2 779.8 794.7
3 825.2 794.7
4 768.1 794.7
5 795.0 794.7
Total 3973.6 3973.6 20
Goodness of Fit Test

observed expected O-E (O - E)² / E % of chisq


805.5 794.720 10.780 0.146 5.88
779.8 794.720 -14.920 0.280 11.26
825.2 794.720 30.480 1.169 47.00
768.1 794.720 -26.620 0.892 35.85
795 794.720 0.280 0.000 0.00
3973.6 3973.600 0.000 2.487 100.00

2.49 chi-square
4 df
.6469 p-value

21
Decisión mediante el estadístico de prueba:
No puede rechazarse la Ho con alfa 10%, el
estadístico de prueba (2.49) no está en la región
crítica o de rechazo (7.78)
El nivel de ventas fue similar en cada una de las
cinco tiendas de la empresa.

Decisión mediante el Valor P:


Nivel de significación 10%
Valor P 64.69% (igual decisión)
22
Medición del ajuste logrado cuando se aplica algún
criterio o una distribución de probabilidad.
Ejemplo 4.
Número de Distribución
Muestra
hijos anterior
0 0.10 14
1 0.23 48
2 0.37 87
3 0.21 41
4 0.07 9
5 0.02 1
Total 1.00 200

¿La distribución de hijos por familia fue similar a la


registrada anteriormente? Alfa 5%. 23
Ho: La distribución de hijos por familia no ha cambiado
H1: La distribución de hijos por familia ha cambiado
Nivel de significación: 5%

(Se asume que la distribución relativa se mantiene)


Número de Distribución
Muestra (fo) fe
hijos anterior
0 0.10 14 20
1 0.23 48 46
2 0.37 87 74
3 0.21 41 42
4 0.07 9 14
5 0.02 1 4
Total 1.00 200 200
24
Goodness of Fit Test

observed expected O-E (O - E)² / E % of chisq


14 20.000 -6.000 1.800 21.87
48 46.000 2.000 0.087 1.06
87 74.000 13.000 2.284 27.75
41 42.000 -1.000 0.024 0.29
9 14.000 -5.000 1.786 21.70
1 4.000 -3.000 2.250 27.34
200 200.000 0.000 8.230 100.00

8.23 chi-square
5 df
.1440 p-value

25
Decisión mediante el estadístico de prueba:
No puede rechazarse la Ho con alfa 5%, el
estadístico de prueba (8.23) no está en la región
crítica o de rechazo (11.07)
La distribución de hijos por familia no ha cambiado

Decisión mediante el Valor P:


Nivel de significación 5%
Valor P 14.4% (igual decisión)

26
Medición del ajuste logrado cuando se aplica algún
criterio o una distribución de probabilidad.

Ejemplo 5.
Louis Armstrong, vendedor de la compañía Dillard Paper,
tiene que visitar seis clientes por día. Se sugiere que la
variable medida por el Sr. Armstrong puede ser descrita
mediante una distribución binomial. De cada 50 clientes
visitados logra 20 ventas. Dada la siguiente distribución
de frecuencias del número de ventas por día realizadas
por el Sr. Armstrong, ¿se puede concluir que los datos, de
hecho, siguen la distribución sugerida? Utilice un nivel de
7% de significancia.
27
Número de
Ventas diarias
ventas
0 10
1 41
2 60
3 20
4 6
5 3
6 1
Total 141

De rechazarse la hipótesis nula analice las discrepancias


más importantes.
28
Medición del ajuste logrado cuando se aplica algún
criterio o una distribución de probabilidad.

Ejemplo 6.
Un fármaco es efectivo en un margen máximo de 4 horas y
con 80% de probabilidad, según sus fabricantes. Se toma
una muestra para determinar la efectividad del fármaco
obteniendo los datos que aparecen en el cuadro siguiente:

29
Efectividad en Número de
horas pacientes
0 2
1 10
2 38
3 51
4 99
Total 200

De existir discrepancia entre la efectividad especificada


por los fabricantes y los datos observados determine en
dónde es mayor el cuestionamiento. Realice la prueba de
hipótesis con 4% de significación.
30
Prueba Kolmogorov-Smirnov para Distribución de Probabilidad Normal
1. Con base en la Distribución D (K-S) se determina el valor crítico para la
prueba.
2. Se ordenan los datos (Xi) en forma ascendente.
3. Se calcula la frecuencia relativa acumulada (S(X)).
4. Se calcula la función de Distribución Normal (F(X)) para la media y
desviación estándar especificada o la obtenida de la muestra.
5. Se determina el valor absoluta de la diferencia entre F(X) y S(X)
6. Se determina el valor absoluto de la diferencia entre F(X) y el
correspondiente anterior S(X)
7. Se determina el valor D (valor máximo de las últimas dos columnas
anteriores), el cual es el estadístico de prueba.
31
Prueba Kolmogorov-Smirnov para Distribución de Probabilidad Normal

Ejemplo 7.
Las puntuaciones obtenidas por una muestra de sujetos en una prueba
de habilidad han sido las siguientes: 48.1, 47.8, 45.1, 46.3, 45.4, 47.2,
46.6, 46. Sabiendo que la media de dicha prueba es 46.6 y su desviación
estándar es 1.08 ¿puede afirmarse que la distribución de las
puntuaciones sigue una Distribución Normal con alfa 0.01?

Ho: Las puntuaciones se ajustan a una Distribución de


Probabilidad Normal
H1: Las puntuaciones no se ajustan a una Distribución de
Probabilidad Normal
Alfa: 1%, valor crítico = 0.543 (ver tabla diapositiva siguiente)
32
33
D = Max | Ft(x) - Sn(x) |
Frecuencia
relativa
Puntuaciones F(X) F(X)-S(X) F(X)-Si-1(X)
acumulada
S(X)
45.1 0.125 0.082 0.043 0.082
45.4 0.250 0.133 0.117 0.008
46.0 0.375 0.289 0.086 0.039
46.3 0.500 0.391 0.109 0.016
46.6 0.625 0.500 0.125 0.000
47.2 0.750 0.711 0.039 0.086
47.8 0.875 0.867 0.008 0.117
48.1 1.000 0.918 0.082 0.043

D= 0.125

Para F(X)1 “=DISTR.NORM.N(45.1;46.6;1.08;VERDADERO)” 34

También podría gustarte