Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONCEPTOS GENERALES
UNIDAD: IV
En lugar de preocuparse por las diferencias entre dos poblaciones en términos de una
variable cuantitativa, el interés podría ser las diferencias en alguna característica
cualitativa.
La prueba de la diferencia entre dos proporciones basadas en muestras independientes,
se puede efectuar con el uso de dos métodos diferentes, pero los resultados serán
equivalente, aquí sólo observaremos uno de ellos. El primer método de prueba de la
diferencia entre dos proporciones implica el uso de la distribución normal.
Esta prueba está basada en la diferecia entre las dos proporciones de la muestra a las
cuales se puede aproximar con una distribución normal para muestras de tamaño grande.
Para las dos poblaciones implicadas, interesa determinar si hay o no alguna diferencia en
la proporción de éxitos en los dos grupos (prueba de dos colas) o si un grupo tuvo una
proporción mayor de éxitos que el otro grupo (prueba de una cola).
Del mismo modo que los estadísticos “z”, con su distribución normal y “t”, con su distribución t de
Student, nos han servido para someter a prueba hipótesis que involucran a promedios y
porcentajes, el estadístico ji-cuadrado (o chi cuadrado), que tiene distribución de probabilidad del
mismo nombre, nos servirá para someter a prueba hipótesis referidas a distribuciones de
frecuencias.
En primer lugar usaremos el estadístico ji-cuadrado para probar la asociación entre dos variables, y
luego lo usaremos para evaluar en qué medida se ajusta la distribución de frecuencias obtenida
con los datos de una muestra, a una distribución teórica o esperada.
En términos generales, esta prueba contrasta frecuencias observadas con las frecuencias
esperadas de acuerdo con la hipótesis nula. Al igual que en el caso de las pruebas anteriormente
presentadas, ilustraremos con ejemplos.
y
y
de individuos
Si las observaciones son independientes y cada individuo tiene la misma probabilidad de ser
seleccionado en la muestra, el estadístico Xp2 sigue asintóticamente una distribución ji–cuadrada
con k–1 grados de libertad.
Rao y Scott (1981) determinaron que el estadístico Xp2 se distribuye asintóticamente como una
suma ponderada δ1W1 + δ2W2+......+ δk_1Wk_1 de variables aleatorias ji–cuadradas Wj , cada una
con un grado de libertad. Los pesos δj son los valores propios de la matriz de los efectos del diseño
generalizados; esta matriz se define como D = Po–1 V, donde Po = diag (po) – pop'o, poes el vector
de proporciones teóricas y V/n es la matriz de covarianzas del vector de proporciones
estimadas . Si se utiliza un muestro aleatorio simple, los valores propios d: de la matriz de los
efectos del diseño generalizados son iguales a uno. Así, la suma ponderada se reduce a
una suma de k–1 variables aleatorias ji–cuadradas independientes con un grado de libertad, cuya
distribución es X2(k–1). Si el diseño muestral es más complejo, los efectos del diseño
generalizados δj no son iguales a 1; por tanto, la distribución asintótica de la variable
Basados en este hecho, Rao y Scott (1981) proponen dos correcciones al estadístico ji–cuadrado
de Pearson. La corrección de primer orden ajusta la esperanza, y la de segundo orden la
esperanza y la varianza asintótica. En este estudio se emplea la corrección de segundo orden,
también llamada corrección de Satterthwaite. La prueba de Rao–Scott con corrección de segundo
orden usa el estadístico:
donde, Xp2 es el estadístico ji–cuadrado de Pearson; es un estimador de la media de los
valores propios δj de la matriz de los efectos del diseño generalizados; â es un estimador del
coeficiente de variación de los valores propios δj .
Recolección de datos
En este trabajo se utilizaron datos de una plantación de gmelina ubicada en la finca El Hierro,
Estado Portuguesa, propiedad de la empresa SMURFIT Cartón de Venezuela. En la plantación se
hizo un censo de un área de 4.8 ha, con 4841 árboles. Cada árbol se ubicó en un eje cartesiano
(x,y), y se midió el diámetro a la altura de pecho (DAP). Se establecieron tres variables categóricas
del diámetro usando 5, 10 y 15 categorías, usadas en las pruebas de bondad de ajuste. Así, por
ejemplo, para establecer una variable con 5 categorías diamétricas se dividió el rango de valores
de DAP en 5 intervalos, y a cada árbol se le asignó un número del 1 al 5 dependiendo del intervalo
donde se ubica su DAP. De manera similar se procedió en el caso de 10 y 15 categorías.
CONCLUSION
Para mi conclusión es que las pruebas de bondad de ajuste ji-cuadrada son muy
útiles ya que te pueden ayudar a comprobar la independencia de de dos variables
entre si, la cual se lleva a cabo mediante la presentación de los datos en tablas.
Para la que se me hizo un poco mas interesante es la prueba de bondad de
ajuste Kolmogorov-Smirnov ya que esta es recomendable para distribuciones
continuas, muestras de cualquier tamaño y es bastante potente con muestras
grandes. No requiere de hacer uso de datos agrupados.
El nivel de medición de la variable y su distribución son elementos que intervienen en
la selección
Si la variable es continua con distribución normal, se podrán aplicar técnicas
paramétricas, Si es una variable discreta o continua no normal, solo son aplicables
técnicas no paramétricas y por lo cual nos podría arrojar resultados sin validez.
FUENTES
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S1405-31952008000300004
https://groodch14.wixsite.com/literature-blog-1/single-post/2016/04/06/Pruebas-de-la-
bondad-de-ajuste
https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5266