Está en la página 1de 15

CURSO: HIDROLOGA GENERAL

INDICE

INTRODUCCION................................................................................................................ 2

GENERALIDADES.............................................................................................................. 1

CONCEPTOS FUNDAMENTALES..................................................................................2

I. JI- CUADRADO COMO PRUEBA DE ASOCIACIN................................................3

1. En primer lugar se debe plantear las hiptesis que someteremos a prueba.........3

2. En segundo lugar, obtener (calcular) las frecuencias esperadas..........................4

3. En tercer lugar se debe calcular el estadstico de prueba.....................................5

II. JI-CUADRADO COMO PRUEBA DE BONDAD DE AJUSTE...................................8

1. Las hiptesis del problema son:............................................................................9

2. Siguiendo el esquema general de solucin propuesto para las pruebas de


hiptesis, ahora corresponde elegir un nivel de significacin.......................................9

3. Se calcula el estadstico de prueba con los datos del ejemplo............................11

4. Se compara este valor con el valor de ji-cuadrado de la tabla.............................11

5. Conclusin.......................................................................................................... 11

6. Grfico................................................................................................................. 11

PRUEBA CHI CUADRADO EN HIDROLOGIA..............................................................13

1
CURSO: HIDROLOGA GENERAL

INTRODUCCION

El estadstico ji-cuadrado (o chi cuadrado), que tiene distribucin de probabilidad


del mismo nombre, sirve para someter a prueba hiptesis referidas a
distribuciones de frecuencias. En trminos generales, esta prueba contrasta
frecuencias observadas con las frecuencias esperadas de acuerdo con la hiptesis
nula. En este artculo se describe el uso del estadstico ji-cuadrado para probar la
asociacin entre dos variables utilizando una situacin hipottica y datos
simulados. Luego se describe su uso para evaluar cun buena puede resultar una
distribucin terica, cuando pretende representar la distribucin real de los datos
de una muestra determinada. A esto se le llama evaluar la bondad de un ajuste.
Probar la bondad de un ajuste es ver en qu medida se ajustan los datos
observados a una distribucin terica o esperada. Para esto, se utiliza una
segunda situacin hipottica y datos simulados.

2
CURSO: HIDROLOGA GENERAL

PRUEBA CHI CUADRADO

GENERALIDADES

Una prueba de chi-cuadrado es una prueba de hiptesis que compara la distribucin


observada de los datos con una distribucin esperada de los datos.

Existen varios tipos de pruebas de chi-cuadrado:


Prueba de chi-cuadrado de bondad de ajuste

Utilice este anlisis para probar qu tan bien una muestra de datos categricos se
ajusta a una distribucin terica.

Por ejemplo, usted puede comprobar si un dado es justo, lanzando el dado


muchas veces y utilizando una prueba de chi-cuadrado de bondad de ajuste para
determinar si los resultados siguen una distribucin uniforme. En este caso, el
estadstico chi-cuadrado cuantifica qu tanto vara la distribucin observada de
conteos con respecto a la distribucin hipottica.

Pruebas de chi-cuadrado de asociacin e independencia

Los clculos para estas pruebas son iguales, pero la pregunta que se est
tratando de contestar puede ser diferente.

Prueba de asociacin: utilice una prueba de asociacin para determinar si una


variable est asociada a otra variable. Por ejemplo, determine si las ventas de
diferentes colores de automviles dependen de la ciudad donde se venden.

Prueba de independencia: utilice una prueba de independencia para determinar si


el valor observado de una variable depende del valor observado de otra variable.
Por ejemplo, determine si el hecho de que una persona vote por un candidato no
depende del sexo del elector.

1
CURSO: HIDROLOGA GENERAL

CONCEPTOS FUNDAMENTALES

MUESTRA: Parte de una poblacin que se toma cuando es imposible acceder a


toda ella. La eleccin de la muestra se hace con la intencin de, a partir de la
informacin que ella proporciona, extender sus resultados a toda la poblacin a la
que representa.
MUESTRA ALEATORIA: (Muestra elegida al azar) Aquella muestra tomada de la
poblacin en la que todo individuo tiene la misma probabilidad de resultar elegido
para ella, y esto con independencia entre individuos.
FUNCIN DE DISTRIBUCIN: Funcin que hace corresponder a cada uno de los
valores de una variable aleatoria la probabilidad de que tal variable aleatoria tome
un valor igual o inferior al dado.
FUNCIN DE PROBABILIDAD: Funcin que hace corresponder a cada uno de
los valores de la variable aleatoria discreta su probabilidad.
CONTRASTE DE HIPTESIS: Conjunto de reglas tendentes a decidir cul de dos
hiptesis la nula la alternativa- debe aceptarse en base al resultado obtenido en
una muestra. Es de dos colas cuando la alternativa es la negacin de la nula. De
una cola en caso contrario.
VARIABLE ALEATORIA: Toda funcin que toma diversos valores numricos,
dependiente de los resultados de un fenmeno aleatorio, con distintas
probabilidades.
VARIABLE ALEATORIA DISCRETA: Las variables aleatorias discretas son
aquellas que presentan un nmero finito de valores, constituyen una sucesin
numerable.
VARIABLE ALEATORIA CONTINA: Las variables aleatorias continuas pueden
tomar un nmero infinito de valores en un intervalo determinado.
VARIABLE CATEGRICA: Una variable categrica es una variable que clasifica
cada individuo de una poblacin en una de las varias clases mutuamente
excluyentes en que sta se divide.
VARIABLE NUMRICA: Corresponde a los datos expresados en una escala
continua numrica.

2
CURSO: HIDROLOGA GENERAL

I. JI- CUADRADO COMO PRUEBA DE ASOCIACIN


Supongamos que un investigador est interesado en evaluar la asociacin entre uso de
cinturn de seguridad en vehculos particulares y el nivel socioeconmico del conductor
del vehculo. Con este objeto se toma una muestra de conductores a quienes se clasifica
en una tabla de asociacin, encontrando los siguientes resultados:

Uso de Nivel Nivel Nivel TOTA


cintur socioeconmic socioeconmic socioeconmic L
n o bajo o medio o alto

SI 8 15 28 51

NO 13 16 14 43

TOTAL 21 31 42 94

Tabla I. Tabla de asociacin, valores observados.

Permiten estos datos afirmar que el uso del cinturn de seguridad depende del nivel
socioeconmico? Usaremos un nivel de significacin alfa=0,05.

Los pasos del anlisis estadstico en este caso son los siguientes:

1. En primer lugar se debe plantear las hiptesis que someteremos a prueba


H0: El uso de cinturn de seguridad es independiente del nivel socioeconmico.
H1: El uso de cinturn de seguridad depende del nivel socioeconmico.

En esta prueba estadstica siempre la hiptesis nula plantea que las variables analizadas
son independientes.

2. En segundo lugar, obtener (calcular) las frecuencias esperadas


Estas son las frecuencias que debieran darse si las variables fueran independientes, es
decir, si fuera cierta la hiptesis nula.

Las frecuencias esperadas se obtendrn de la distribucin de frecuencias del total de los


casos, 51 personas de un total de 94 usan el cinturn y 43 de 94 no lo usan. Esa misma
proporcin se debera dar al interior de los tres grupos de nivel socioeconmico, de

3
CURSO: HIDROLOGA GENERAL

manera que el clculo responde al siguiente razonamiento: si de 94 personas 51 usan


cinturn; de 21 personas, cuntas debieran usarlo?

La respuesta a esta pregunta se obtiene aplicando la regla de tres y es 11,4. Este


procedimiento debe repetirse con todas las frecuencias del interior de la tabla.

El detalle de los clculos es el siguiente:

Nivel bajo: (21x51/94)=11,4-(21x43/94)=9,6


Nivel medio: (31x51/94)=16,8-(31x43/94)=14,2
Nivel alto: (42x51/94)=22,8-(42x43/94)=19,2

Estas son las frecuencias que debieran presentarse si la hiptesis nula fuera verdadera y,
por consiguiente, las variables fueran independientes.

Estos valores los anotamos en una tabla con las mismas celdas que la anterior; as
tendremos una tabla con los valores observados y una tabla con los valores esperados,
que anotaremos en cursiva, para identificarlos bien.

Uso de cinturn Nivel bajo Nivel medio Nivel alto TOTAL

SI 11,4 16,8 22,8 51

NO 9,6 14,2 19,2 43

TOTAL 21 31 42 94

Tabla II. Tabla de asociacin, valores esperados.

3. En tercer lugar se debe calcular el estadstico de prueba


En este caso, el estadstico de prueba es Ji-cuadrado que, como dijimos al comienzo,
compara las frecuencias que entregan los datos de la muestra (frecuencias observadas)
con las frecuencias esperadas, y tiene la siguiente frmula clculo:

Donde oi representa a cada frecuencia observada y ei representa a cada frecuencia


esperada.

4
CURSO: HIDROLOGA GENERAL

De este modo el valor del estadstico de prueba para este problema ser:

Entonces Este es el valor de nuestro estadstico de prueba que ahora, siguiendo


el procedimiento de problemas anteriores (paso 4), debemos comparar con un valor de la
tabla de probabilidades para ji-cuadrado (x2). Esta tabla es muy parecida a la tabla t de
student, pero tiene slo valores positivos porque ji-cuadrado slo da resultados positivos.
Vase grfico 1, que muestra la forma de la curva, con valores desde 0 hasta infinito.

Grfico 1.

Dado que el estadstico ji cuadrado slo toma valores positivos, la zona de rechazo de la
hiptesis nula siempre estar del lado derecho de la curva.

Uso de tabla ji-cuadrado

La tabla de ji-cuadrado tiene en la primera columna los grados de libertad y en la primera


fila la probabilidad asociada a valores mayores a un determinado valor del estadstico
(vase grfico de la tabla III).
Los grados de libertad dependen del nmero de celdas que tiene la tabla de asociacin
donde estn los datos del problema y su frmula de clculo es muy sencilla:

5
CURSO: HIDROLOGA GENERAL

Grados de libertad (gl)=(n de filas1)x(n de columnas1)

As, en nuestro ejemplo, en que hay 2 filas y 3 columnas, los grados de libertad sern:

gl=(2-1)x(3-1)=2

Ntese que no se consideran la fila ni la columna de los totales.

6
CURSO: HIDROLOGA GENERAL

Tabla III. Tabla de ji-cuadrado.

7
CURSO: HIDROLOGA GENERAL

Al comienzo elegimos un nivel de significacin alfa=0,05. Entonces un valor de tabla


para x2 asociado a 2 grados de libertad y alfa 0,05 es 5,99.

Por lo tanto, como en el grfico 2 vemos que 5,23 se encuentra a la izquierda de 5,99, la
probabilidad asociada a valores superiores a 5,23 es mayor que alfa (0,05).

Grfico 2.

Segn esto, debemos aceptar la hiptesis nula que plantea que las variables uso de
cinturn de seguridad y nivel socioeconmico son independientes. Limitacin: como
norma general, se exige que el 80% de las celdas en una tabla de asociacin tengan
valores esperados mayores de 5.

II. JI-CUADRADO COMO PRUEBA DE BONDAD DE AJUSTE


Tambin se puede usar el estadstico ji-cuadrado para evaluar cun buena puede resultar
una distribucin terica, cuando pretende representar la distribucin real de los datos de
una muestra determinada. A esto se le llama evaluar la bondad de un ajuste. Probar la
bondad de un ajuste es ver en qu medida se ajustan los datos observados a una
distribucin terica o esperada.

Tomemos como ejemplo la distribucin esperada para los individuos de una poblacin que
son clasificados segn grupo sanguneo. Segn estudios realizados en poblacin, se
espera que dicha distribucin, en porcentajes, sea la siguiente:

Grupo Frecuencia esperada

8
CURSO: HIDROLOGA GENERAL

AB 2,0%

A 30,5%

B 9,3%

0 58,2%

Tabla IV. Ejemplo de distribucin esperada.

En una muestra de 150 dadores de sangre se encontr la siguiente distribucin:

Grupo Frecuencia observada

AB 4

A 48

B 15

0 83

Tabla V. Ejemplo de distribucin observada.

1. Las hiptesis del problema son:


H0: los datos se ajustan a la distribucin terica.
H1: los datos no se ajustan a la distribucin terica.

2. Siguiendo el esquema general de solucin propuesto para las pruebas de


hiptesis, ahora corresponde elegir un nivel de significacin
Elegimos entonces alfa=0,01. El estadstico de prueba ser ji-cuadrado, cuya frmula es:

Debemos calcular las frecuencias esperadas en nuestro grupo. Si aplicamos los


porcentajes esperados a la muestra de 150 casos podemos obtener las siguientes
frecuencias esperadas (ei):

Grupo Frec. oi Frec. ei

AB 4 3,00

9
CURSO: HIDROLOGA GENERAL

A 48 45,75

B 15 13,95

0 83 87,30

Total 150 150,00

Tabla VI. Ejemplo de frecuencias esperadas.

Los grados de libertad de esta tabla se obtienen restando 1 al nmero de filas, en este
caso: gl=4-1=3
Recordemos que la fila del total no se considera para los grados de libertad.

Si ya tenemos las frecuencias observadas y esperadas, podemos proceder a evaluar la


diferencia entre ellas utilizando el estadstico ji-cuadrado. Si la diferencia entre frecuencias
observadas y esperadas es grande, significar que la hiptesis nula es falsa, o sea, esta
distribucin no se ajusta a la distribucin terica y si, en cambio, resulta que la diferencia
entre frecuencias observadas y esperadas no es muy grande, significar que la hiptesis
nula es verdadera; por lo tanto, la distribucin en la muestra se ajusta a la distribucin
terica y diremos que no hay significacin estadstica.

El valor del estadstico de prueba (x2) es una medida de la diferencia entre frecuencias
observadas y esperadas; por lo tanto, mientras mayor resulte, ms fcil ser rechazar la
hiptesis nula.

3. Se calcula el estadstico de prueba con los datos del ejemplo

4. Se compara este valor con el valor de ji-cuadrado de la tabla


El valor de ji-cuadrado lo buscaremos con alfa=0,01 y 3 grados de libertad. Segn tabla,
ese valor es 11,34.
Al comparar el valor del estadstico de prueba (0,73) con el valor de tabla (11,34), vemos
que 0,73 se encuentra a la izquierda de 11,34 desplazado hacia el centro de la curva y

10
CURSO: HIDROLOGA GENERAL

que, por lo tanto, la probabilidad de valores mayores a l es muy superior al nivel de


significacin alfa=0,01.

5. Conclusin
Dado que la probabilidad de es mayor que alfa, se acepta la hiptesis nula.
Esto significa que los datos observados se ajustan a la distribucin terica, por lo tanto las
diferencias observadas no son estadsticamente significativas.

6. Grfico

Grfico 3. Prueba de bondad de ajuste.

11
CURSO: HIDROLOGA GENERAL

PRUEBA CHI CUADRADO EN HIDROLOGIA


La prueba de chi cuadrado trata de comparar las frecuencias observadas con las
frecuencias esperadas. Como las variables hidrolgicas son de tipo continuo es necesario
hallar los lmites de clase de cada intervalo de clase.
Existen dos maneras de hacer la prueba de chi cuadrado.
- Escribiendo intervalos de clase de igual tamao, en este caso las frecuencias
esperadas de cada intervalo de clase sern diferentes.
- Estableciendo que cada intervalo de clase tenga la misma frecuencia esperada, en
este caso los intervalos de clase tendrn tamaos diferentes.
Para evitar que se presenten valores ceros en un intervalo de clase, se prefiere la
segunda opcin, es decir los intervalos de clase que tengan la misma prueba de
bondad de ajuste de chi cuadrado.
1. Dividir la serie de datos en K intervalos de clase donde:
K 5
2. Calcular la probabilidad de cada intervalo de clase mediante la ecuacin.
3. Calcular la probabilidad acumulada de cada intervalo de clase sumando las
probabilidades de los intervalos de clase:
k
P ( x < ^x )= Pi
i=1

4. Calcular el valor de la variable aleatoria ^x , segn el modelo de probabilidades

que se ha seleccionado a priori para la prueba de chi cuadrado, mediante la


siguiente ecuacin:
^x

P ( x < ^x )= f ( x ) dx

DONDE:
F(x): funcin de densidad de probabilidades del modelo seleccionado a priori.

Por ejemplo si se selecciona k=5, los valores de las probabilidades son:

P ( x< x0.2 ) =0.2

P ( x< x0. 4 )=0.4

P ( x< x0.6 ) =0.6

12
CURSO: HIDROLOGA GENERAL

P ( x< x0.8 ) =0.8

P ( x< x 0.999
)=0.999

Los valores de ^x son los lmites de clase.

oi ).
5. Calcular la frecuencia observada (
La frecuencia observada se obtiene por conteo de los datos comprendidos entre
los lmites de clase.
6. Calcular a frecuencia esperada de cada intervalo de clase mediante la ecuacin.
7. Calcular el chi cuadrado X 2c .
2
8. Hallar el valor de chi cuadrado Xc con:

o =0.05 que es el nivel de significacin que se usa comnmente en

hidrologa.
o Grados de libertad definida por la ecuacin siguiente:
v =Kh1
DONDE:
V= grados de libertad
K= nmero de intervalos de clase
H= nmero de parmetros del modelo que se esta probando el ajuste. Por
ejemplo para la distribucin exponencial h=1.
2
Los valores de ( X c se hallan de tablas estadsticas.
9. Criterio de decisin:
Para decidir si el modelo es adecuado para un conjunto de datos se compara el

2 2
chi cuadrado ( X c con el chi cuadrado tabular ( X t de la siguiente manera:
2 2
o Si X c < X t , se afirma que el modelado probabilstico en prueba es

adecuado para el conjunto de datos, al nivel de significacin asumido.


o Si X 2c > X 2t , se afirma que el modelado probabilstico en prueba no es

adecuado para el conjunto de datos, en este caso se deber probar el


ajuste con otros modelos.

13

También podría gustarte