Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribucion Chi-Cuadradob
Distribucion Chi-Cuadradob
1. BONDAD DE AJUSTE
Las pruebas de bondad de ajuste tienen por objetivo determinar si los
datos se ajustan a una determinada distribucin, esta distribucin puede estar
completamente especificada (hiptesis simple) o perteneciente a una clase
paramtrica (hiptesis compuesta).
Con mucha frecuencia no se conoce la distribucin de probabilidad de la
variable aleatoria en estudio, digamos X, y se desea probar la hiptesis de que
X sigue una distribucin de probabilidad particular. Por ejemplo, podra ser de
inters probar la hiptesis de que X sigue una
exponencial, etc.
Existen dos procedimientos para realizar pruebas de bondad de ajuste
que son los ms conocidos. El primero se basa en una tcnica grfica muy til
llamada grfica de probabilidad y el segundo procedimiento se basa en la
distribucin Chi-cuadrada.
2. INTRODUCCIN A LA CHI-CUADRADO
La prueba de Chi- cuadrado (X2), permite calcular la probabilidad de
obtener resultados que nicamente por efecto del azar se desven de las
expectativas en la magnitud observada si el modelo es correcto.
Para realizar una prueba de Chi-cuadrado, el primer paso es comparar el
nmero de individuos observado en cada categora con los nmeros esperados
considerando el tamao de la muestra y el modelo propuesto. Las desviaciones
son elevadas al cuadrado y divididas por los valores esperados, lo cual
proporciona un valor de Chi-cuadrado. Se utiliza el nmero de individuos y no
las proporciones, X2 toma en consideracin el tamao de la muestra.
(resultados observados
i
resultados esperados
resultados esperados
Grados de libertad
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
0,1
2,71
4,61
6,25
7,78
9,24
10,64
12,02
13,36
14,68
15,99
17,28
18,55
19,81
21,06
22,31
23,54
24,77
25,99
27,20
28,41
29,62
30,81
32,01
33,20
34,38
35,56
36,74
37,92
39,09
40,26
51,81
63,17
74,40
85,53
96,58
107,57
118,50
0,005
7,88
10,60
12,84
14,86
16,75
18,55
20,28
21,95
23,59
25,19
26,76
28,30
29,82
31,32
32,80
34,27
35,72
37,16
38,58
40,00
41,40
42,80
44,18
45,56
46,93
48,29
49,65
50,99
52,34
53,67
66,77
79,49
91,95
104,21
116,32
128,30
140,17
3. TABLAS DE CONTINGENCIA
En estadstica las tablas de contingencia se emplean para registrar y
analizar la relacin entre dos o ms variables, habitualmente de naturaleza
cualitativa, nominales u ordinales.
Las tablas de contingencia tienen dos objetivos fundamentales:
1) Organizar la informacin contenida en un experimento cuando sta es de
carcter bidimensional, es decir, cuando est referida a dos factores (variables
cualitativas).
2) A partir de la tabla de contingencia se puede adems analizar si existe
alguna relacin de dependencia o independencia entre los niveles de las
variables cualitativas objeto de estudio. El hecho de que dos variables sean
independientes significa que los valores de una de ellas no estn influidos por
la modalidad o nivel que adopte la otra.
Supngase que se dispone de dos variables, la primera el sexo (hombre
o mujer) y la segunda que recoge si consume o no alimentos ecolgicos. Se ha
observado esta pareja de variables en una muestra aleatoria de 100 individuos.
Se puede emplear una tabla de contingencia para expresar la relacin entre
estas dos variables, del siguiente modo:
CONSUME
NO
TOTAL
CONSUME
HOMBRE
43
52
MUJER
44
46
TOTAL
87
13
100
(Chi-cuadrado),
f 1 =
1
n
n
f 2 =
1
11
1
n
n
= f 1 =
2
21
2
=
= f i
n
n
= f 2
=
2
12
1
n
n
22
2
=
= f 2
=
f i
n
n
=
f j
ij
n
n
ij
ij
n
n
ji
1j
1
n
n
2j
2
( ) = n = n x n
i
ij
ij
ij
ij
ij
n xn
i
ij =
n xn
i
(nij ij )
h
i =1 j =1
ij
x(
n 1)( k 1)
, significar que
Resumiendo:
x x(
2
2
n 1)( k 1)
x x(
2
2
n 1)( k 1)
ALIMENTOECOLGICO
CONSUME
NOCONSUME
MARGINAL
SEXO
HOMBRE MUJER
65
58
43
67
108
125
MARGINAL
123
110
233
Valor de la Chi-cuadrado:
(nij ij )
h
i =1 j =1
ij
57
66
51
59
EJEMPLO:
Disponemos de una hoja de clculo con las horas trabajadas durante una
semana por los trabajadores de una planta de procesado de fruta de una
empresa segn los diferentes cargos que ocupa.
Queremos crear una tabla dinmica que muestre, para cada empleado
de la empresa, en pginas individuales, el total de horas trabajadas en cada
uno de las funciones durante la ltima semana.
1. Sitate en una de las celdas que contienen los datos y ve a Datos (Men
principal), Asistente para tablas dinmicas. Se iniciar el Asistente, que
consta de cuatro cuadros de dilogo consecutivos.
2. En el primer cuadro de dilogo (paso 1 de 4) se solicita el origen de los
datos a organizar en forma de tabla dinmica. En este caso, dejamos la
opcin preseleccionada (Lista o base de datos de Microsoft Excel) y
pulsamos Siguiente.
3. El siguiente cuadro de dilogo (paso 2 de 4) permite seleccionar el rango
de celdas en el que estn situados los datos a organizar.
Notas:
a)
La forma elegida aqu para organizar los datos slo es una de entre
todas las posibles. Cabe organizar los datos de otra manera; no obstante,
hemos de procurar que la forma elegida sea la ms clara y fcil de
interpretar.
b)
Aunque los datos de una tabla dinmica tienen el mismo aspecto que
c)
cuando los datos de origen cambian, sino que, cambiados los datos
fuente es necesario seleccionar con el botn derecho del ratn una celda
cualquiera de la tabla y elegir la opcin Actualizar datos del men
contextual correspondiente.
d) Una vez creada la tabla dinmica, se puede cambiar fcilmente su
diseo arrastrando los botones sombreados con los nombres de los
campos a otras posiciones de la tabla (por esta razn se llaman
dinmicas, precisamente)
DISTR.CHI
Devuelve la probabilidad de una variable aleatoria continua siguiendo
una distribucin chi cuadrado de una sola cola. La distribucin 2 est asociada
a una prueba 2. Utilice la prueba 2 para comparar los valores observados
con los esperados. Por ejemplo, un experimento gentico podra estar basado
en la hiptesis de que la prxima generacin de plantas presentar un conjunto
determinado de colores. Al comparar los resultados observados con los
resultados esperados, puede decidir si su hiptesis original es vlida.
Sintaxis
DISTR.CHI(x;grados_de_libertad)
X es el valor al que desea evaluar la distribucin.
PRUEBA.CHI
Devuelve la prueba de independencia. PRUEBA.CHI devuelve el valor
de la distribucin chi cuadrado (2) para la estadstica y los grados de libertad
apropiados. Las pruebas 2 pueden utilizarse para determinar si un
experimento se ajusta a los resultados tericos.
Sintaxis
PRUEBA.CHI(rango_actual;rango_esperado)
Rango_actual es el rango de datos que contiene observaciones para
probar frente a valores esperados.
Rango_esperado es el rango de datos que contiene la relacin del
producto de los totales de filas y columnas con el total global.
Observaciones
PRUEBA.CHI.INV
Devuelve para una probabilidad dada, de una sola cola, el valor de la
variable aleatoria siguiendo una distribucin chi cuadrado. Si el argumento
probabilidad = DISTR.CHI(x;...), entonces PRUEBA.CHI.INV(probabilidad,...) =
x. Utilice esta funcin para comparar los resultados observados con los
resultados esperados, a fin de decidir si la hiptesis original es vlida.
Sintaxis
PRUEBA.CHI.INV(probabilidad;grados_de_libertad)
Probabilidad es una probabilidad asociada con la distribucin chi cuadrado.
Grados_de_libertad es el nmero de grados de libertad.
Observaciones
6. BIBLIOGRAFA
I. http://64.233.183.104/search?q=cache:ieq5iAYRk9EJ:ininweb.uprm.edu/
cc/PRUEBA%2520DE%2520BONDAD%2520Y%2520AJUSTE%2520.d
oc+bondad+de+ajuste&hl=es&ct=clnk&cd=7&gl=es
II. http://cete.iespana.es/genetica/pragen10.pdf
III. http://www.wiphala.net/research/manual/statistic/chi_cuadrado.html
IV. http://www.uam.es/personal_pdi/economicas/eva/pdf/tab_conting.pdf
V. http://es.wikipedia.org/wiki/Tablas_de_contingencia
VI. http://www.uam.es/personal_pdi/economicas/eva/pdf/tab_conting.pdf
VII. http://iteso.mx/~luisfnc/practica%207.htm