Está en la página 1de 15

qwertyuiopasdfghjklzxcvbnmqwertyui

opasdfghjklzxcvbnmqwertyuiopasdfgh
jklzxcvbnmqwertyuiopasdfghjklzxcvb
nmqwertyuiopasdfghjklzxcvbnmqwer
tyuiopasdfghjklzxcvbnmqwertyuiopas
dfghjklzxcvbnmqwertyuiopasdfghjklzx
cvbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyuio
pasdfghjklzxcvbnmqwertyuiopasdfghj
klzxcvbnmqwertyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmqwerty
uiopasdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmrty
uiopasdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghjklzxc
(QUE ES LA (JI CUADRADA O X2))

Definición:
En realidad la distribución ji-cuadrada es la distribución muestral de s2. O sea que si se
extraen todas las muestras posibles de una población normal y a cada muestra se le
calcula su varianza, se obtendrá la distribución muestral de varianzas.

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el


estadístico X2. Si se elige una muestra de tamaño n de una población normal con varianza

, el estadístico:

tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1 grados de
libertad y se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada
esta dado por:

donde n es el tamaño de la muestra, s2 la varianza muestral y la varianza de la


población de donde se extrajo la muestra. El estadístico ji-cuadrada también se puede dar
con la siguiente expresión:

Propiedades de las distribuciones ji-cuadrada

1. Los valores de X2 son mayores o iguales que 0.


2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un número
infinito de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la
derecha; esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).

La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el
valor (n-3) = (gl-2).

La función de densidad de la distribución X2 esta dada por:

para x>0

La tabla que se utilizará para estos apuntes es la del libro de probabilidad y estadística de
Walpole, la cual da valores críticos (gl) para veinte valores especiales de . Para
2
denotar el valor crítico de una distribución X con gl grados de libertad se usa el símbolo
(gl); este valor crítico determina a su derecha un área de bajo la curva X2 y sobre
el eje horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en el lado
izquierdo y a o largo del lado superior de la misma tabla.
Estimación de la Varianza

Para poder estimar la varianza de una población normal se utilizará la distribución ji-
cuadrada.

Al despejar esta fórmula la varianza poblacional nos queda:

Los valores de X2 dependerán de nivel de confianza que se quiera al cual le llamamos


. Si nos ubicamos en la gráfica se tiene:

Su simbología:

En la práctica, las frecuencias esperadas se calculan de acuerdo con la hipótesis Ho. Si


bajo esta hipótesis el valor calculado de X2 dado es mayor que algún valor crítico, se
deduce que las frecuencias observadas difieren significativamente de las esperadas y se
rechaza Ho al nivel de significación correspondiente. En caso contrario, no se rechazará.
Este procedimiento se llama ensayo o prueba de chi-cuadrado de la hipótesis.

Debe advertirse que en aquellas circunstancias en que X2 esté muy próxima a cero debe
mirarse con cierto recelo, puesto que es raro que las frecuencias observadas concuerden
demasiado bien con las esperadas. Para examinar tales situaciones, se puede determinar si
el valor calculado de X2 es menor que las X2 críticas o de tabla (ensayo unilateral
izquierdo), en cuyos casos se decide que la concordancia es bastante buena.

Ejemplos:
Frecuencias esperadas10 50 100 100 5010

Grados de libertad: k-1-m = 6-1-0 = 5

Regla de decisión:Si X2R 11.1 no se rechaza Ho. Si X2R >11.1 se rechaza Ho. Cálculos:

Justificación y decisión:Como el 12
es mayor a 11.1, se rechaza H0 y se concluye con un = 0.05 que el nacimiento de
hombres y mujeres no es igualmente probable.

1. Una urna contiene 6 bolas rojas y 3 blancas. Se extraen al azar dos bolas de la urna, se
anota su color y se vuelven a la urna. Este proceso se repite un total de 120 veces y los
resultados obtenidos se muestran en la siguiente tabla. Determinar al nivel de
significación del 0.05 si los resultados obtenidos son consistentes con los esperados.

1 2
0

Bolas blancas 2 1 0

Número de extracciones
6 53 61

Solución:Este experimento tiene las características de una distribución hipergeométrica,


por lo cual se calcularán los valores esperados con el razonamiento de esta distribución.
Se llamara "x" a la variable aleatoria de interés que en este caso serán las bolas rojas. Por
lo tanto "x" puede tomar valores desde 0 hasta 2.

La fórmula de la distribución hipergeométrica es:


Se tiene:

Probabilidad de extraer 0 rojas y 2 blancas:

Probabilidad de extraer 1 roja y 1 blanca:

Probabilidad de extraer 2 rojas y 0 blancas:

Con las probabilidades anteriores se obtendrán los valores esperados multiplicando por
120.

1 2
0
Bolas blancas 2 1 0
Número de extracciones
6 53 61
Frecuencias esperadas10 60 50

Grados de libertad: k-1-m = 3-1-0 = 2


Regla de decisión:Si X2R 5.991 no se rechaza Ho.
Si X2R >5.991 se rechaza Ho.

Cálculos:

Hipótesis a probar en las variables:


En la mayoría de los casos se tiene el problema de desconocer la varianza o desviación
estándar de la población, en donde las distribuciones son normales. Si se desea probar una
hipótesis acerca de la varianza se puede hacer utilizando las medidas estadísticas con las

que se construyó el intervalo de confianza , esto es con la distribución Ji- cuadrada.

Ejemplos:

1. Una compañía que produce una parte maquinada para un motor, afirma que tiene una
varianza de diámetro no mayor a 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas
partes dio una varianza de muestra s2 = 0.0003. Si se supone que las medidas del diámetro
se distribuyen en forma normal, ¿hay evidencia para refutar lo que afirma el proveedor?
Use = 0.05.

Solución:

Como en todos los ensayos de hipótesis que se han realizado anteriormente el


procedimiento es el mismo. Después de que se identifican los datos, se plantea la hipótesis
para determinar el tipo de ensayo.
Datos:

= 0.0002

n = 10

s2 = 0.0003

= 0.05

Ensayo de hipótesis:

Ho; = 0.0002

H 1; > 0.0002

Regla de decisión:

Si X2R 16.919 no se rechaza Ho.

Si X2R>16.919 se rechaza Ho.

Cálculos:

Justificación y decisión:

Como 13.5 no es mayor que 16.919 por lo tanto no se rechaza Ho y se concluye con un nivel
de significancia de 0.05 que no se puede refutar la afirmación del proveedor.
Este ejercicio se puede aprovechar para calcular el valor de P. En la tabla se busca el
valor de 13.5 en el renglón de 9 grados de libertad. Interpolando entre 0.10 y 0.20 se
obtiene un valor de P de 0.1484.

Nivel de medición de las variables:

Al realizar pruebas de medición, se parte de un valor supuesto (hipotético) en parámetro


poblacional. Después de recolectar una muestra aleatoria, se compara la estadística
muestral, así como la media (x), con el parámetro hipotético, se compara con una supuesta
media poblacional (). Después se acepta o se rechaza el valor hipotético, según proceda.
Se rechaza el valor hipotético sólo si el resultado muestral resulta muy poco probable
cuando la hipótesis es cierta.

Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es el
valor hipotético del parámetro que se compra con el resultado muestral resulta muy poco
probable cuando la hipótesis es cierta.

Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia


del 5%, entonces se rechaza la hipótesis nula solamente si el resultado muestral es tan
diferente del valor hipotético que una diferencia de esa magnitud o mayor, pudiera
ocurrir aleatoriamente con una probabilidad de 1.05 o menos.

Etapa 3.- Elegir la estadística de prueba. La estadística de prueba puede ser la


estadística muestral (el estimador no segado del parámetro que se prueba) o una versión
transformada de esa estadística muestral. Por ejemplo, para probar el valor hipotético de
una media poblacional, se toma la media de una muestra aleatoria de esa distribución
normal, entonces es común que se transforme la media en un valor z el cual, a su vez, sirve
como estadística de prueba.
Tabla 10.1. Consecuencias de las Decisiones en Pruebas de Hipótesis.

Situaciones Posibles
La
Decisiones Posibles hipótesis
La hipótesis nula es verdadera
nula es
falsa
Aceptar la Hipótesis Nula Se acepta correctamente Error tipo II
Rechazar la Hipótesis Nula Error tipo I Se rechaza correctamente

Etapa 4.- Establecer el valor o valores críticos de la estadística de prueba. Habiendo


especificado la hipótesis nula, el nivel de significancia y la estadística de prueba que se
van a utilizar, se produce a establecer el o los valores críticos de estadística de prueba.
Puede haber uno o más de esos valores, dependiendo de si se va a realizar una prueba de
uno o dos extremos.

Etapa 5.- Determinar el valor real de la estadística de prueba. Por ejemplo, al probar un
valor hipotético de la media poblacional, se toma una muestra aleatoria y se determina el
valor de la media muestral. Si el valor crítico que se establece es un valor de z, entonces
se transforma la media muestral en un valor de z.

Etapa 6.- Tomar la decisión. Se compara el valor observado de la estadística muestral con
el valor (o valores) críticos de la estadística de prueba. Después se acepta o se rechaza la
hipótesis nula. Si se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá
efecto sobre otras decisiones de los administradores operativos, como por ejemplo,
mantener o no un estándar de desempeño o cuál de dos estrategias de mercadotecnia
utilizar.

Contraste de hipótesis referentes a la diferencia entre:

Una media muestra y una media población; utilizando la distribución (z)

El uso de la distribución normal z se busca en las mismas condiciones que en el caso de una
muestra excepto que ahora se tienen dos muestras independientes. La formula general
para determinar el valor de z para probar la diferencia entre dos medidas, dependiendo
de sí se conocen los valores para las dos poblaciones, es:
Donde puede procederse a probar cualquier diferencia supuesta (1 - 2)0. Sin embargo la
hipótesis nula que generalmente se prueba consiste en que las dos muestras se obtienen
de poblaciones con medias iguales. En este caso (1 - 2)0 = 0, y las formulas anteriores se
vuelven más simples:

Una media Muestral y una Media Poblacional.

Una distribución poblacional representa la distribución de valores de una población y una


distribución muestral representa la distribución de los valores de una muestra. En
contraste con las distribuciones de mediciones individuales, una distribución muestral es
una distribución de probabilidad que se aplica a los valores posibles de una estadística
muestral. Así, la distribución muestral de la media es la distribución de probabilidad de
los valores posibles de la media muestral con base en un determinado tamaño de muestra.

Para cualquier tamaño de muestra dado n, tomado de una población con media , los valores
de la media muestral varían de una muestra a otra. Esta variabilidad sirve de base para la
distribución muestral. La distribución muestral de la media se describe determinando el
valor esperado E () o media, de la distribución y la desviación estándar de la distribución
de las medias, . Como esta desviación estándar indica la precisión de la media muestral
como estimador puntual, por lo general se le denomina error estándar de la media. En
general, se define el valor esperado de la media y el error estándar de la media de la
siguiente manera:

Procedimiento:
Una media de la discrepancia existente entre las frecuentes observadas y esperadas
viene proporcionada por el estadístico X2 dado por:

Donde si la frecuencia total es N,

Una expresión equivalente a la formula (1) :

Si X2 = 0 Las frecuencias observadas y teóricas coinciden completamente, mientras que si


X2 > 0, no coinciden exactamente a valores más grandes de X2, mayor discrepancia entre
las frecuencias observadas y esperadas.
La distribución muestral de X2 se aproxima muy bien por la distribución Chi - Cuadrada.

Distribución Chi - Cuadrado para la Bondad de Ajustes:

El Test Chi - Cuadrado puede utilizarse para determinar la calidad del ajuste mediante
distribuciones teóricas (como la distribución normal o la binomial) de distribución
empíricas (o sea las obtenidas de los datos de la muestra).

Distribución Chi - Cuadrado y Tablas de Contingencia.

Suceso E1 E2 E3 ... Ek
Frecuencia Observada01 02 03 ... 0k
Frecuencia Esperada e1 e2 e3 ... ek

En esta tabla las frecuencias observadas ocupan una sola fila y la llamamos tabla de
calcificación de entrada única como el número de columnas es K también se llama una
tablas 1 x K (Leido 1<<1 por k>>).

Extendiendo estas ideas, podemos llegar a tablas de doble entrada ó tablas h x k, en las
que las frecuencias observadas ocupan h filas y k columnas tales tablas se suelen llamar
tablas de contingencia.

Correspondiendo a cada frecuencia observada en una tabla de contingencia h x k, hay una


frecuencia esperada o teórica que se calcula sujeta a ciertas hipótesis de acuerdo con las
leyes de las probabilidades. Estas frecuencias que ocupan las celdas de una tabla de
contingencia, se llaman frecuencias de celdas. La frecuencia total de cada fila o en cada
columna se llama frecuencia marginal.

Para investigar el acuerdo entre las frecuencias observadas y las frecuencias esperadas,
calculamos el estadístico.

Donde la suma de toma sobre todas las celdas de una tabla de contingencia y donde los
símbolos Oj y ej representan respectivamente las frecuencias observadas y esperada de
la j - ésima celda.

La suma de todas las frecuencias observadas se denota por N y es igual a la suma de todas
las frecuencias observadas se denota por N y es igual a la suma de todas las frecuencias
esperadas.
Como antes el estadístico (5) tiene una distinción muestral dada muy aproximadamente
por (4), supuesto que las frecuencias esperadas no sean demasiado pequeñas. El número de
grado de libertad, v de esta distribución chi - cuadrado viene dado por h > 1 y k >1 por:

1.- v = (h - 1) (k - 1) si las frecuencias esperadas se pueden calcular sin recurrir a


estimaciones muéstrales de los parámetros de la población.

2.- v = (h -1) (k - 1) - m. Si las frecuencias esperadas solo se pueden calcular mediante


estimación de m parámetros de la población a partir de estadísticas de la muestra.

Los contrastes de significación para las tablas h x k son similares a los de las tablas 1 x k.
Las frecuencias esperadas se hallan sujetas a una hipótesis particular h0.

Las tablas de contingencia se pueden generalizar a más dimensiones. Así, por ejemplo,
podemos tener tablas h x k x 1, donde están presentes tres clasificaciones.

Muestras.

Es un subconjunto de la población que contiene las mediciones obtenidas mediante un


experimento.

Dos varianzas Utilizando la razón de varianzas (f de fisher).

Como hemos visto es importante conocer la distribución de muestreo de la diferencia en


medias de dos muestras. De la misma manera, podemos necesitar la distribución de
muestreo de la diferencia en varianzas (s21 - s22). Resulta sin embargo, que esta
distribución es complicada, por lo que en lugar de eso, consideramos el estadístico s21 /
s22, ya que en un cociente grande o pequeño indicará una gran diferencia, mientras un
cociente cercano a 1 indica una pequeña diferencia. Su distribución de muestra se llama
distribución f, en honor a R. A. Fisher.

Mas correctamente, sean dos muestras 1 y 2 de tamaños N1 Y N2, respectivamente,


tomadas de dos poblaciones normales (o casi) con varianzas 21 y 22, Definamos el
estadístico.

Donde
Entonces la distribución de muestreo de F se llama distribución de F de Fisher o en breve,
distribución F, con v1 = N1 - 1 y v2 = N2 - 1 grados de libertad. Esta distribución viene
dada por:

Donde C es una constante que depende de v1 y v2 tal que el área total bajo la curva es 1.

La forma de esta curva puede variar considerablemente según los valores de v1 y v2.

Puede probarse que la distribución F es el modelo de probabilidad por el cociente de las


varianzas de muestras tomadas en forma independiente de la misma población con
distribución normal y que existe una distribución F diferente para cada combinación de
grados de libertad (g1) correspondiente al numero de muestra. Para todas las muestras,
g1 = n - 1 por ello, la estadística que se utiliza para probar la hipótesis nula con respecto a
la diferencia entre dos varianzas es:

F=

Aun cuando esta hipótesis nula sea cierta, no es probable que las varianzas muestras de
cualquier par de muestras sean idénticas.

Para datos Apareados y no Apareados.

-. Distribución T Student.

Definamos el estadístico:

Que es análogo al estadístico Z dado por:

Si consideramos muestras de tamaño N tomadas de una población normal (o casi normal)


con media y si para cada una calculamos t, usando la media muestral x y la desviación
típica muestral S ó ^s, puede obtenerse la distribución de muestreo para t.

Esta distribución viene dada por:

Donde yo es una constante que depende de N tal que al área total bajo la curva es 1, y
donde la constante V = (n - 1) se llama el número de grados de libertad (v es la letra
griega nu).

La distribución (2) se llama distribución t de Student en honor de su descubridor, W.S


Gosset; para grandes valores de v o de N (ciertamente N " 30), las curvas (2) se ajustan
mucho a las curva normal canónica.

También podría gustarte