Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Hasta ahora habíamos buscado RELACIONES entre variables, pero ahora vamos a buscar
DIFERENCIAS entre grupos.
Queremos conocer si existen diferencias entre grupos respecto de la variable A, B, etc.
estudio cómo se comporta una variable en distintos grupos y lo comparo.
Cada sujeto va a tener una diferencia diferente, por lo tanto, debo obtener una media de cada
diferencia (diferencia promedio).
EJEMPLO:
o Media de X: 6,7
o Error estándar: 26,3
o Desvió estándar: 1,75
o N: 225
o Mínimo: -67
o Máximo: 78
Ahora tengo que ver si esta media de 6,7 es distinta o igual a lo que ocurre en la población
general necesito saber la relación que hay entre lo que encontré y la vida real. Esto lo
puedo hacer de una manera: hay que imaginar que la H0 es verdadera, por lo tanto, la Mu es
0, y la Mx es 6,7
ESTADISTICO Z:
La media que yo encontré (6,7) – la media poblacional (0) / el desvío estándar (1,75) = 3,82 –>
Z.
Z es un estadístico con distribución normal, es decir, todos los puntos de Z se distribuyen bajo
la curva. El puntaje Z tiene media 0 y desvío estándar 1.
Si tengo una muestra grande (+30), por teorema central de limite puedo asumir la distribución
normal y puedo usar el TEST Z.
El numero que me da el estadístico de Z lo comparo con la curva que tiene distribución normal
y lo estandarizo y lo llevo a la curva tabulada (con media 0 y desvío estándar 1) así calculo
cual es la probabilidad de encontrar lo que encontré.
Por lo tanto, en el SPSS cuando pido el Test Z se me estandariza todo y obtengo el p-valor.
ELEMENTOS BASICOS DE UN TEST DE HIPOTESIS:
Son: test para muestras grandes (test Z), test T de student, métodos para evaluar la
normalidad.
TEST Z:
Test para muestras grandes.
1) Supuestos:
El tamaño de muestra debe ser lo suficientemente grande (N mayor que 30).
La muestra debe haber sido seleccionada en forma aleatoria, por lo que las
observaciones son independientes y con idéntica distribución. Es decir, el método
de muestreo debe ser siempre aleatorio.
2) Hipótesis:
La hipótesis nula tiene la forma H0: μ = μ0 (donde μ0 es algún valor propuesto por
el investigador).
La hipótesis alternativa puede ser cualquiera de las siguientes:
a) H1 = μ < μ
b) H1 = μ > μ
c) H1 = μ ≠ μ
3) Estadístico del Test: compara el valor de la estimación muestral del parámetro con el
valor propuesto por H0. Debe tener distribución exacta o aproximada.
4) Cálculo del p-valor: es el peso de la evidencia acerca de H0. Menos valor de p, mayor
evidencia en contra de H0.
H1 = μ < μ; p = P (Z ≤ Zobs)
H1 = μ > μ; p = P (Z ³ Z obs )
H1 = μ ≠ μ; p = P (Z ³ |Z obs|)
Tanto el intervalo de confianza como el Test Z son válidos cuando la muestra es grande y
asegura que:
Son muchas las investigaciones en los que el número de observaciones es pequeño. Esto
ocurre debido al costo o al tiempo necesarios para obtener los datos Gosset propuso una
distribución para muestras pequeñas (menos de 30 casos) que se llamó Distribución t de
Student.
Cuando tengo menos caso, se me agrupan muy cerca de lo que s promedio, entonces todos los
matices que hacen gordita a la curva no están, por lo que la curva se transforma a distribución
t: acampanada, simetría, pero mas alta, ya que agrupa más cosas entorno a la media y tiene
mas error (acumula mas casos en las colas, la cola de normalidad solo acumula 5%).
1) Supuestos:
La variable tiene distribución normal, media µ y varianza o^2
Debe ser una muestra aleatoria de n observaciones.
2) Hipótesis:
La hipótesis nula tiene la forma H0: μ = μ0 (donde μ0 es algún valor propuesto
por el investigador) es decir, va a decir que no hay diferencia entre las
medias, que son iguales (a=b) y no hay efectos.
La hipótesis alternativa puede ser cualquiera de las siguientes: es igual al test
Z, va a decir que las medias son distintas, mayores, o menores.
a) H1 = μ < μ
b) H1 = μ > μ
c) H1 = μ ≠ μ
El cálculo del estadístico es idéntico al del test para muestras grandes debido a que estamos
suponiendo que es una variable con distribución normal. Pero tienen diferente distribución
porque considera a los grados de libertad en su distribución debido a que la cantidad de
observaciones no permite inferir que la media muestral se distribuye normalmente. Vale decir
entonces, que cualquiera sea el tamaño de la muestra, es estadístico tiene distribución t de
Student.
Métodos gráficos: Box plot e Histograma. También existe otro tipo de gráficos como el
de tallo-hojas y el Q-Q plot que es el gráfico de probabilidad normal.
Métodos analíticos: Son tests de hipótesis cuya hipótesis nula es, justamente, la
normalidad de los datos. Por eso, interesa un p-valor grande ya que si rechazamos la
hipótesis nula no podemos estar seguros de que la distribución de la variable sea
normal. Tenemos el Test de Shapiro-Wilk y Kolmogorov-Smirnov, entre otros.
Test de Shapiro-Wilk: es un test de hipótesis particular, porque la H0 dice que la
distribución de los datos es normal, mientras que la H1 dice que la distribución no
es normal. Me interesa encontrar un p-valor grande, porque no quiero rechazar la
H0, sino aceptarla
Solo debo testear la normalidad cuando tengo 30 sujetos, si tengo mas de 30 no necesito
chequear la normalidad debido al Teorema Central del Límite.
MUESTRA APAREADA
En la muestra tengo un sujeto, y en otra muestra tengo a un sujeto totalmente análogo (por
ej., misma altura, misma edad, mismo sexo). Hay dos grupos con características iguales.
MUESTRAS INDEPENDIENTES
Muestras aleatorias, que se seleccionan independientemente de cualquier tipo de
característica. Se seleccionan a partir de una población seleccionada como objetivo, pero la
elección es totalmente aleatoria, no están filtradas por características.
MEDIDAS CENTRALES:
Media, moda, mediana.
__
Mediante estos tests podremos decidir si la diferencia observada en las medias muestrales es
suficientemente grande como para ser atribuida al azar. Un test de hipótesis para dos
muestras es similar en muchos aspectos al test para una muestra.
Especificamos la hipótesis nula que propone que las medias de las dos poblaciones
son iguales y establecemos si estamos interesados en la hipótesis alternativa uni o
bilateral.
Ej.: H0 no hay diferencia entre mujeres y hombres en cuando al trato medico // H1
hay una diferencia entre la cantidad de analgésicos entregados a hombres y
mujeres.
Especificamos un nivel de significación a (alfa), es decir, especificamos el nivel de
significación del test. Por ejemplo, si yo quiero trabajar con el 95% de confianza, tengo
que trabajar con el 0,05 de significación.
Calculamos p-valor. Me va a decir hasta que punto la diferencia que yo encuentro es
debida al azar o a la intervención.
En cuanto a la conclusión, si el p-valor es chico rechazamos H0 y concluimos que las
medias de las dos poblaciones son diferentes. Si p-valor es mayor no rechazamos la H0
y no pude juntar evidencia a favor de mi hipótesis.
Si tenemos muestras grandes (más de 30) tenemos la ventaja del Teorema Central del Limite
ahora el TCL va a decir que la distribución de la diferencia de las medias muestrales es
normal.
El desvío estándar va a ser en este caso la diferencia entre el desvío de A y el desvío de B (A=5
y B=3 desvío = 2).
>> Puntaje Z:
Cuando n1 y n2 son lo suficientemente grandes, podemos basarnos en el estadístico Z.