Está en la página 1de 11

INSTITUTO TECNOLÓ GICO

SUPERIOR DE PÁ NUCO VERACRUZ

ING. GESTIÓN EMPRESARIAL

CONCEPTOS GENERALES

DOCENTE: AMERICO RIOS MORALES

ALUMNA: LITZY AMAIRANI ARTEAGA GUZMAN

UNIDAD: IV

¿QUE SIGNIFICA UNA PRUEBA “Z” ENTRE DOS PORCIONES?

Las pruebas de proporciones son adecuadas cuando los datos que se están


analizando constan de cuentas o frecuencias de elementos de dos o más clases.
El objetivo de estas pruebas es evaluar las afirmaciones con respecto a una
proporción (o Porcentaje) de población. Las pruebas se basan en la premisa de
que una proporción muestral (es decir, x ocurrencias en n observaciones, o x/n)
será igual a la proporción verdadera de la población si se toman márgenes o
tolerancias para la variabilidad muestral. Las pruebas suelen enfocarse en la
diferencia entre un número esperado de ocurrencias, suponiendo que una
afirmación es verdadera, y el número observado realmente. La diferencia se
compara con la variabilidad prescrita mediante una distribución de muestreo que

tiene como base el supuesto de que   es realmente verdadera.

En muchos aspectos, las pruebas de proporciones se parecen a las pruebas de


medias, excepto que, en el caso de las primeras, los datos muestrales se
consideran como cuentas en lugar de como mediciones. Por ejemplo, las pruebas
para medias y proporciones se pueden utilizar para evaluar afirmaciones con
respecto a:

1) Un parámetro de población único (prueba de una muestra)

2) La igualdad de parámetros de dos poblaciones (prueba de dos muestras), y

3) La igualdad de parámetros de más de dos poblaciones (prueba de k muestras).


Además, para tamaños grandes de muestras, la distribución de muestreo
adecuada para pruebas de proporciones de una y dos muestras es
aproximadamente normal, justo como sucede en el caso de pruebas de medias de
una y dos muestras

¿Qué significa una Prueba para la diferencia en n proporciones Z?

En lugar de preocuparse por las diferencias entre dos poblaciones en términos de una
variable cuantitativa, el interés podría ser las diferencias en alguna característica
cualitativa.
La prueba de la diferencia entre dos proporciones basadas en muestras independientes,
se puede efectuar con el uso de dos métodos diferentes, pero los resultados serán
equivalente, aquí sólo observaremos uno de ellos. El primer método de prueba de la
diferencia entre dos proporciones implica el uso de la distribución normal.

Esta prueba está basada en la diferecia entre las dos proporciones de la muestra a las
cuales se puede aproximar con una distribución normal para muestras de tamaño grande.
Para las dos poblaciones implicadas, interesa determinar si hay o no alguna diferencia en
la proporción de éxitos en los dos grupos (prueba de dos colas) o si un grupo tuvo una
proporción mayor de éxitos que el otro grupo (prueba de una cola).

El estadísitico de la prueba sería con en donde ps1 = proporción muestral en la población


1. ps2 = proporción muestral en la población 2. X1 = número de éxios en la muestra 1. X2
= número de éxios en la muestra 2. n1 = tamaño de la muestra para la población 1. n2 =
tamaño de la muestra para la población 2. = estimación combinada para la proporción de
la población. La estimación de la proporción de la población que se utilizará, está basada
en la hipótesis nula, Con la hipótesis nula, se supone que las dos proporciones de la
población son iguales. Por tanto, se puede obtener una estimación total de la proporción
de la población al combinar las dos proporciones de la muestra. La estimación es
simplemente el número de éxitos en las dos muestras combinadas (X1 + X2) dividido
entre el tamaño total de la muestra (n1 + 2)

¿Qué significa una Prueba de independencia (ji-


cuadrada)?
El estadístico ji-cuadrado (o chi cuadrado), que tiene distribución de probabilidad del mismo
nombre, sirve para someter a prueba hipótesis referidas a distribuciones de frecuencias. En
términos generales, esta prueba contrasta frecuencias observadas con las frecuencias esperadas
de acuerdo con la hipótesis nula. En este artículo se describe el uso del estadístico ji-cuadrado
para probar la asociación entre dos variables utilizando una situación hipotética y datos simulados.
Luego se describe su uso para evaluar cuán buena puede resultar una distribución teórica, cuando
pretende representar la distribución real de los datos de una muestra determinada. A esto se le
llama evaluar la bondad de un ajuste. Probar la bondad de un ajuste es ver en qué medida se
ajustan los datos observados a una distribución teórica o esperada. Para esto, se utiliza una
segunda situación hipotética y datos simulados.

Del mismo modo que los estadísticos “z”, con su distribución normal y “t”, con su distribución t de
Student, nos han servido para someter a prueba hipótesis que involucran a promedios y
porcentajes, el estadístico ji-cuadrado (o chi cuadrado), que tiene distribución de probabilidad del
mismo nombre, nos servirá para someter a prueba hipótesis referidas a distribuciones de
frecuencias.

En primer lugar usaremos el estadístico ji-cuadrado para probar la asociación entre dos variables, y
luego lo usaremos para evaluar en qué medida se ajusta la distribución de frecuencias obtenida
con los datos de una muestra, a una distribución teórica o esperada.

En términos generales, esta prueba contrasta frecuencias observadas con las frecuencias
esperadas de acuerdo con la hipótesis nula. Al igual que en el caso de las pruebas anteriormente
presentadas, ilustraremos con ejemplos.

¿Qué significa una Prueba de contingencia (ji-


cuadrada)?
Un caso particular del test de chi-cuadrado, que permite hacer un
test sobre la independencia de dos carácteres estadísticos, lleva el
nombre de test de chi-cuadrado de contingencia. Los dos
carácteres, observados en una misma población, son   e  , el
tamaño de la muestra es  . Las modalidades o clases de   se

denotan  , las de   por  . También vamos a


denotar :

 el efectivo conjunto de   y   : es el número de

individuos para los cuales   toma el valor   e   el valor  ,

 el efectivo marginal de   : es el número de


individuos para los cuales   toma el valor  ,

 el efectivo marginal de   : es el número de

individuos para los cuales   toma el valor  .

Estos valores se representan en una tabla de doble entrada


conocida como tabla de contingencia.

Cada fila y cada columna corresponden a una submuestra


particular. La fila de índice   es la distribución en las

clases   de los individuos para los cuales el carácter   


toma el valor  . La columna de índice   es la distribución en las
clases   de los individuos para los cuales el carácter   

toma el valor  . Dividiendo las filas y las columnas por su suma, se


obtienen frecuencias condicionales para cada una de las

distribuciones empíricas. Para   y  , las


denotaremos por:

   y

Estas distribuciones empíricas condicionales se llaman los perfiles


fila y los perfiles columna. Para el modelo probabilista, las
observaciones provienen de una muestra

 de una ley bidimensional. La hipótesis a


comprobar es que los dos marginales de esta ley son
independientes. Si este es el caso, los perfiles fila diferirán poco de
la distribución empírica de   y los perfiles columna de la de  :

   y

¿Para qué nos sirven las Pruebas de bondad de ajuste?


PRUEBAS DE LA BONDAD DE AJUSTE 
 
Estas pruebas permiten verificar si una distribución de probabilidades supuesta es 
congruente con un conjunto de datos dado. Para esto se utilizan pruebas de bondad
de ajuste tales como la prueba JI–cuadrado.
 
Sea X1, . . . , Xn los resultados obtenidos a partir de una muestra aleatoria de la cual
se ha asumido que su distribución de probabilidades esta determinada por la función
de probabilidad ´ Po(X) o la función de densidad de probabilidad ´ Fo(X), se plantea la
hipótesis nula ´ Ho : F(X) = Fo(X), especificada de manera completa con respecto a
todos los parámetros.
 
En la construcción del modelo de simulación es importante decidir si un conjunto de
datos se ajusta apropiadamente a una distribución específica de probabilidad. Al
probar la bondad del ajuste de un conjunto de datos, se comparan las frecuencias
observadas FO realmente en cada categoría o intervalo de clase con las frecuencias
esperadas teóricamente FE.

¿Cual es la distribución de muestreo que se aplica en las pruebas


de bondad de ajuste y defina sus características?
Para aplicar la prueba de bondad de ajuste ji–cuadrada de Pearson las observaciones son
clasificadas en k categorías o clases, y se supone que son independientes e idénticamente
distribuidas. La hipótesis nula es Ho: pi  = pio para i = 1, 2,...,k; donde pies la proporción de
individuos que pertenecen a la categoría i, pio es la proporción teórica de la categoría i, y k  es el
número de categorías.

El estadístico de prueba es:

donde   se obtiene dividiendo el número de individuos de la categoría i observados entre el total

de individuos 

Si las observaciones son independientes y cada individuo tiene la misma probabilidad de ser
seleccionado en la muestra, el estadístico Xp2 sigue asintóticamente una distribución ji–cuadrada
con k–1 grados de libertad.

Cuando se utiliza un diseño muestral complejo, el estadístico Xp2 no se distribuye X2(k–1)pero tiene


una distribución simétrica, y un múltiplo de Xp2 podría seguir aproximadamente una
distribución x2  (Lohr, 2000).

Rao y Scott (1981) determinaron que el estadístico Xp2 se distribuye asintóticamente como una
suma ponderada δ1W1 + δ2W2+......+ δk_1Wk_1  de variables aleatorias ji–cuadradas Wj  , cada una
con un grado de libertad. Los pesos δj son los valores propios de la matriz de los efectos del diseño
generalizados; esta matriz se define como D = Po–1 V, donde Po = diag  (po) – pop'o, poes el vector
de proporciones teóricas y V/n es la matriz de covarianzas del vector de proporciones
estimadas   . Si se utiliza un muestro aleatorio simple, los valores propios d: de la matriz de los

efectos del diseño generalizados son iguales a uno. Así, la suma ponderada  se reduce a
una suma de k–1 variables aleatorias ji–cuadradas independientes con un grado de libertad, cuya
distribución es X2(k–1). Si el diseño muestral es más complejo, los efectos del diseño
generalizados δj no son iguales a 1; por tanto, la distribución asintótica de la variable

aleatoria   no es (k–1)(Lehtonen y Pahkinen, 2004).

Basados en este hecho, Rao y Scott (1981) proponen dos correcciones al estadístico ji–cuadrado
de Pearson. La corrección de primer orden ajusta la esperanza, y la de segundo orden la
esperanza y la varianza asintótica. En este estudio se emplea la corrección de segundo orden,
también llamada corrección de Satterthwaite. La prueba de Rao–Scott con corrección de segundo
orden usa el estadístico:
donde, Xp2 es el estadístico ji–cuadrado de Pearson;   es un estimador de la media   de los
valores propios δj de la matriz de los efectos del diseño generalizados; â es un estimador del
coeficiente de variación de los valores propios δj  .

Si el diseño muestral tiene probabilidades de inclusión desiguales, se calcula el


estadístico Xp2  utilizando estimadores de proporciones δj  ponderados por las probabilidades de
inclusión:

donde,   es la probabilidad de que el individuo j  sea seleccionado en la muestra (probabilidad de


inclusión del individuo j), y Yij  es una variable indicadora con valor 1 si el individuo j pertenece a la
categoría i y 0 en otro caso.

Las ecuaciones para calcular  y â2 son:

siendo  la varianza del estimador de la proporción de la categoría i,

se calcula de la siguiente manera:

donde,  es el elemento i, j  de la matriz de covarianza de los estimadores de


proporciones; poi  y poj  corresponden a las proporciones teóricas para las categorías i y j. Los
valores de  se pueden estimar utilizando una técnica de re–muestreo como la técnica de
replicación balanceada, bootstrap o Jackknife. En esta investigación se utilizó la técnica de
Jackknife.

El estadístico  se distribuye aproximadamente como una ji–cuadrada con   grados de


libertad. En la mayoría de los casos los grados de libertad son un número decimal, por lo que se
redondean al entero inferior más próximo. Los fundamentos teóricos de esta prueba pueden verse
en Rao y Scott (1979, 1981, 1984), Sarndal et al.  (2003) y Lehtonen y Pahkinen (2004).

Recolección de datos

En este trabajo se utilizaron datos de una plantación de gmelina ubicada en la finca El Hierro,
Estado Portuguesa, propiedad de la empresa SMURFIT Cartón de Venezuela. En la plantación se
hizo un censo de un área de 4.8 ha, con 4841 árboles. Cada árbol se ubicó en un eje cartesiano
(x,y), y se midió el diámetro a la altura de pecho (DAP). Se establecieron tres variables categóricas
del diámetro usando 5, 10 y 15 categorías, usadas en las pruebas de bondad de ajuste. Así, por
ejemplo, para establecer una variable con 5 categorías diamétricas se dividió el rango de valores
de DAP en 5 intervalos, y a cada árbol se le asignó un número del 1 al 5 dependiendo del intervalo
donde se ubica su DAP. De manera similar se procedió en el caso de 10 y 15 categorías.
CONCLUSION

Para mi conclusión es que las pruebas de bondad de ajuste ji-cuadrada  son muy
útiles ya que te pueden ayudar a comprobar la independencia de de dos variables
entre si, la cual se lleva a cabo mediante la presentación de los datos en  tablas.
 
Para la que se me hizo un poco mas interesante es la prueba de bondad de
ajuste Kolmogorov-Smirnov ya que esta es recomendable  para distribuciones
continuas, muestras de cualquier tamaño y es bastante potente con muestras
grandes. No requiere de hacer uso de datos agrupados.
El nivel de medición de la variable y su distribución son elementos que intervienen en
la selección
Si la variable es continua con distribución normal, se podrán aplicar técnicas
paramétricas, Si es una variable discreta o continua no normal, solo son aplicables
técnicas no paramétricas y por lo cual nos podría arrojar resultados sin validez.

FUENTES
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S1405-31952008000300004

https://groodch14.wixsite.com/literature-blog-1/single-post/2016/04/06/Pruebas-de-la-
bondad-de-ajuste

https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5266

También podría gustarte