Corre Laci On

CHI- CUADRADO
Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hiptesis nula de la
prueba Chi-cuadrado postula una distribucin de probabilidad totalmente especificada como el modelo
matemtico de la poblacin que ha generado la muestra.
Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor o
intervalo de valores se indica la frecuencia absoluta observada o emprica (Oi). A continuacin, y
suponiendo que la hiptesis nula es cierta, se calculan para cada valor o intervalo de valores la
frecuencia absoluta que cabra esperar o frecuencia esperada (Ei=npi , donde n es el tamao de la
muestra y pi la probabilidad del i-simo valor o intervalo de valores segn la hiptesis nula). El
estadstico de prueba se basa en las diferencias entre la Oi y Ei y se define como:
Este estadstico tiene una distribucin Chi-cuadrado con k-1 grados de libertad si n es suficientemente
grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la prctica se tolera un
mximo del 20% de frecuencias inferiores a 5.
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadstico tomar un
valor igual a 0; por el contrario, si existe una gran discrepancias entre estas frecuencias el estadstico
tomar un valor grande y, en consecuencia, se rechazar la hiptesis nula. As pues, la regin crtica
estar situada en el extremo superior de la distribucin Chi-cuadrado con k-1 grados de libertad.
Para realizar un contraste Chi-cuadrado la secuencia es:
Analizar
Pruebas no paramtricas
Chi-cuadrado
En el cuadro de dilogo Prueba chi-cuadrado se indica la variable a analizar en Contrastar variables.
En Valores esperados se debe especificar la distribucin terica activando una de las dos alternativas.
Por defecto est activada Todas la categoras iguales que recoge la hiptesis de que la distribucin de la
poblacin es uniforme discreta. La opcin Valores requiere especificar uno a uno los valores esperados
de las frecuencias relativas o absolutas correspondientes a cada categora, introducindolos en el mismo
orden en el que se han definido las categoras.
El recuadro Rango esperado presenta dos opciones: por defecto est activada Obtener de los datos que
realiza el anlisis para todas las categoras o valores de la variable; la otra alternativa, Usar rango
especificado, realiza el anlisis slo para un deteminado rango de valores cuyos
lmites Inferior y Superior se deben especificar en los recuadros de texto correspondientes.
El cuadro de dilogo al que se accede con el botn Opciones ofrece la posibilidad de calcular
los Estadsticos Descriptivos y/o los Cuartiles, as como seleccionar la forma en que se desea tratar los
valores perdidos.
CORRELACIN.
La correlacin es la forma numrica en la que la estadstica ha podido evaluar la relacin de
dos o ms variables, es decir, mide la dependencia de una variable con respecto de otra
variable independiente.
Para poder entender esta relacin tendremos que analizarlo en forma grfica:
edad peso Si tenemos los datos que se presentan en la tabla y

15 60 consideramos que la edad determina el peso de las
30 75 personas entonces podremos observar la siguiente grfica:
18 67
Donde los puntos representan cada uno de los pares
42 80
ordenados y la lnea podra ser una recta que represente la
28 60 tendencia de los datos, que en otras palabras podra decirse
19 65 que se observa que a mayor edad mayor peso.
31 92
n n n
n x y x * y
i 1 i i i 1 i i 1 i 7 * 13483 (183 * 499)

r 0.65638606
n 2 2 7 * 5319
100
(183 )2 7 * 36403 ( 499)2
n n n
n x 2 x n y 2 y 80
i 1 i i 1 i i 1 i i 1 i

60
se puede explicar
pesos
La correlacin con la pendiente de 40
esa recta estimada y de esta forma nos podemos dar
20
cuenta que tambin existe el caso en el que al crecer la
variable independiente decrezca la variable 0
dependiente. En aquellas rectas estimadas cuya 0 20 40 60
pendiente sea cero entonces podremos decir que no edades
existe correlacin.
As en estadstica podremos calcular la correlacin para datos no agrupados con la siguiente

formula.
n n n En donde:
n xi y i xi * y i R = coeficiente de correlacin
N = nmero de pares
r i 1 i 1 i 1
ordenados
n
n 2
n 2 n

2
X = variable independiente
n x xi n y i y
2
i i Y = variable independiente
i 1 i 1 i 1 i 1
Ejemplo:
Edad (x) Peso (y) X2 Y2 X* Y

15 60 225 3600 900
30 75 900 5625 2250
18 67 324 4489 1206
42 80 1764 6400 3360
28 60 784 3600 1680
19 65 361 4225 1235
31 92 961 8464 2852
183 499 5319 36403 13483
Supngase que deseamos obtener la correlacin de los datos de la tabla anterior:

Ahora podemos observar que:
Se debe aclarar que el coeficiente de correlacin slo puede variar de la siguiente manera:
1 r 1 y que para entenderlo mejor se debe obtener el coeficiente de determinacin que
se obtiene con r cuadrada, ya que este representa el porcentaje que se explica y
mediante los datos de x .
En nuestro ejemplo decimos que la correlacin es casi perfecta, ya que, esta muy cerca de 1 y
que el porcentaje de datos que explican a y es (0.65638606) 2= 0.430842 o sea el 43.08 %
En el caso de que fueran datos agrupados tendremos lo siguiente:
Primero tendremos que pensar que se genera una matriz, ya que, ahora estamos juntando dos
tablas de distribucin de frecuencias y por ello nuestros clculos sern ms laboriosos, por lo
que les recomiendo el uso de una hoja de calculo o al menos una calculadora con regresin
para datos agrupados.
De cualquier forma aqu tambien estamos evaluando numricamente si existe relacin entre
dos variables y lo haremos con la siguiente ecuacin.
k l l k
n f x i y i fx x i * fy y i
j 1 i 1 i 1 i 1
r

2
k 2

f y y i
l l k
n f x 2

x i x i n fy y i
f x 2
i 1 i 1 i 1 i 1
En donde podemos encontrar k como el nmero de clases para la variable "y" y l para el
nmero de clases de "x".
Tambin podemos observar que hay varios tipos de "f" es decir, la que se encuentra sola (sin
subndice) que nos habla de las frecuencias celdares (cada una de las frecuencias que se
encuentran en la interseccin entre una columna y un rengln) y las "f" con subndices que
representan las frecuencias de cada una de las variables.
Para entender el uso de esta formula usaremos un ejemplo:

Los resultados que se presentan en la siguiente tabla representan los pesos y las estaturas de
48 alumnos entrevistados el "da anhuac"
Marcas de clase de "x"

1.445 1.545 1.645 1.745 1.845 1.945 fy fx y fx y^2
44.5 3 1 4 178 7921
marcas 54.5 5 9
5 19 1035.5 56434.75
de clase 64.5 1 2
4 1 1 9 580.5 37442.25
de "Y" 74.5 5 1 1 7 521.5 38851.75
84.5 2 2 1 5 422.5 35701.25
94.5 1 3 4 378 35721
fx 0 9 12 17 7 3 48 3116 212072
fx x 0 13.90 19.74 29.665 12.915 5.835 82.06
5
fx x^2 0 21.48 32.47 51.765 23.8281 11.34 140.8982
3225 23 425 75 9075
f x y 5380.77
Correlacin= 0.695
La sustitucin de la frmula es la siguiente:
k l l k
n f x i y i f x x i * fy y i
j 1 i 1 i 1 i 1 48 * 5380.77 - (82.06 * 3116)
r
l
l

2
k 2 k
2
((48 * 140.8982) - 82.06 2 ) * (( 48 * 212072) - 3116
n f x f x x i n fy y i f y y i
2
x i
Al i 1 nuestro i resultado
interpretar 1 podemos
i 1 i 1 que
concluir si existe relacin entre el peso y la
estatura, es decir, que a mayor estatura mayor peso.
En muchas ocasiones el resultado de la correlacin es negativo y lo que debemos pensar es

que la relacin de las variables involucradas en el calculo es inverso es decir que en la medida
demandala variable dependiente decrece:
que crece la variable independiente
150
1698 47
100 2045 15
1348 100
50
1268 120
0
1000 1500 2000

Corre Laci On

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Corre Laci On

Cargado por

Copyright:

Formatos disponibles

CHI- CUADRADO

matemtico de la poblacin que ha generado la muestra.

intervalo de valores se indica la frecuencia absoluta observada o emprica (Oi). A continuacin, y

estadstico de prueba se basa en las diferencias entre la Oi y Ei y se define como:

mximo del 20% de frecuencias inferiores a 5.

Para realizar un contraste Chi-cuadrado la secuencia es:

de las frecuencias relativas o absolutas correspondientes a cada categora, introducindolos en el mismo

orden en el que se han definido las categoras.

especificado, realiza el anlisis slo para un deteminado rango de valores cuyos

lmites Inferior y Superior se deben especificar en los recuadros de texto correspondientes.

edad peso Si tenemos los datos que se presentan en la tabla y

As en estadstica podremos calcular la correlacin para datos no agrupados con la siguiente

Edad (x) Peso (y) X2 Y2 X* Y

Supngase que deseamos obtener la correlacin de los datos de la tabla anterior:

En el caso de que fueran datos agrupados tendremos lo siguiente:

Para entender el uso de esta formula usaremos un ejemplo:

Marcas de clase de "x"

La sustitucin de la frmula es la siguiente:

En muchas ocasiones el resultado de la correlacin es negativo y lo que debemos pensar es

También podría gustarte