Está en la página 1de 7

Resumen SEGUNDO PARCIAL Metodología de análisis de datos cuantitativos

Metodología de analisis de datos


cuantitativos
Hipótesis
La lógica que subyace a las pruebas de hipótesis consiste en plantear una hipótesis sobre
los valores de una población (parámetros), y a partir de allí, determinar qué tan probable
sería encontrar el valor que observamos en la muestra asumiendo que el parámetro es
cierto.

El razonamiento de las pruebas de hipótesis está en el “corazón” de la estadística


inferencial.

Pruebas de hipótesis vs estimación de parámetros


Estimación de parámetros

Usamos los valores de la muestra (estadísticos) para hacer estimaciones sobre los valores
(parámetros) de la población

Muestra  Población

Pruebas de hipótesis

Partimos de hipótesis sobre los valores de la población (parámetros) y decimos que tan
probable serían los resultados (valores) de la muestra asumiendo que el parámetro es
cierto

Población Muestra

Pasos para efectuar un razonamiento basado en prueba de


hipótesis (Aron y Aron, 2001):
1º Paso: Planteo de la hipótesis nula e hipótesis alternativa (hipótesis de investigación)

• Hipótesis nula: plantea la ausencia de diferencia o ausencia de efecto. Se expresa como


H0

• Hipótesis alternativa: plantea presencia de diferencias o efecto. Es aquella a la que se


suma evidencia cuando se rechaza H0 .

Generalmente coincide con la hipótesis de investigación. Se expresa como H1 H0

Copertari, Franco Página 1


Resumen SEGUNDO PARCIAL Metodología de análisis de datos cuantitativos

Hipótesis nula - Hipótesis alternativa


• Hipótesis nula (H0): afirmación sobre un parámetro que indica la ausencia de diferencia
• Hipótesis alternativa (H1 ): es aquella hacia la que se suma evidencia cuando se rechaza
H0 . Indica la presencia de diferencia

• La hipótesis alternativa coincide generalmente con la hipótesis de investigación H0 H1


Ejemplo relaciones internacionales? “La intervención X no tiene ningún efecto en el nivel
de satisfacción de los empleados”? “El método A para enseñar métodos cuantitativos
produce iguales resultados que el método B”?

2º Paso: Analizar qué resultados (valores muestrales) esperaríamos encontrar


“asumiendo que H0 es cierta”

• La pregunta que debemos plantear aquí es: dado un resultado como el que observamos
en la muestra, ¿Qué probabilidad teníamos de obtener ese resultado si la hipótesis nula
fuera verdadera?

Si sabemos que la distribución de la población de la que proviene la muestra es una


distribución normal, simplemente calculamos la probabilidad de obtener un valor como el
que observamos en la muestra utilizando las probabilidades debajo de la curva normal.

Para calcular probabilidades asociadas a los valores de una variable aleatoria continua
debemos convertir el valor en puntaje z Luego comparamos el valor observado en la
muestra con la distribución

3ª Paso: Determinar los puntos de corte (niveles de significación) para rechazar H0 Los
valores muestrales que superen ±1,96 son valores muy extremos, es decir, valores “poco
probables” de encontrar si H0 fuera cierta. Por lo tanto, rechazaremos H0

Los valores muestrales inferiores a o comprendidos entre -1,96 y 1,96 son valores poco
extremos, es decir, valores “muy probables” de encontrar si H0 fuera cierta.

Por lo tanto aceptaremos H0. Los valores z -1,96 y 1,96 se denominan “valores críticos”,
ya que son los criterios que utilizaremos para la decisión de aceptar o rechazar H0. La
probabilidad 0,05 (valores superiores a ±1,96 ) se nominan niveles de significación (se
indica con la letra α), y dependen de la elección del investigador.

Se expresa como p<0,05.

Otro nivel de significación utilizado convencionalmente es el 0,01

Copertari, Franco Página 2


Resumen SEGUNDO PARCIAL Metodología de análisis de datos cuantitativos

Tipos de error en las pruebas de hipótesis


•Error tipo I: Consiste en rechazar la hipótesis nula siendo verdadera. Intuitivamente
puede compararse con los “falsos positivos”.

•Se fija de antemano y corresponde al nivel de significación de la prueba

•Error tipo II: Consiste en aceptar la hipótesis nula cuando ésta es falsa. Intuitivamente
puede equipararse a los “falsos negativos”.

Prueba de hipótesis de dos poblaciones


•Ponen a prueba la eventual diferencia entre dos poblaciones

•La prueba de hipótesis sobre dos poblaciones permiten analizar si dos poblaciones son
iguales o no respecto del parámetro bajo análisis

•No se introducen cambios conceptuales en la hipótesis nula y la hipótesis alternativa

•Los procedimientos que comparan grupos tienen una gran difusión en la investigación

Prueba de hipótesis sobre las medias de dos poblaciones:


Ejemplo
•El procedimiento para comparar los parámetros de dos poblaciones consiste en extraer
una muestra de cada población, y a partir de ella, calcular los estimadores
correspondientes.

•Para calcular las diferencias se utiliza la distribución normal z

•La decisión de rechazar o aceptar la hipótesis nula se basa en la probabilidad de z


correspondiente a las diferencias de medias muestrales.

Prueba de hipótesis para muestras apareadas/relacionadas


• Procedimiento útil cuando se quieren comparar diferencias en los mismos sujetos

• El interés en estas pruebas está en analizar cambios en los mismos sujetos y no en la


diferencia entre sujetos distintos

• No se introducen cambios conceptuales en la hipótesis nula y en la hipótesis alternativa

Copertari, Franco Página 3


Resumen SEGUNDO PARCIAL Metodología de análisis de datos cuantitativos

Tipos de error en las pruebas de hipótesis


• Error tipo I: Consiste en rechazar la hipótesis nula siendo verdadera. Intuitivamente
puede compararse con los “falsos positivos”

• Se fija de antemano y corresponde al nivel de significación de la prueba

• Error tipo II: Consiste en aceptar la hipótesis nula cuando ésta es falsa. Intuitivamente
puede equipararse a los “falsos negativos”.

Diferencias prueba t y ANOVA


• Las pruebas de hipótesis de dos poblaciones consistían en poner a prueba la hipótesis
nula de igualdad de medias de dos poblaciones, a partir de la comparación entre dos
grupos

• El ANOVA constituye un procedimiento que permite comparar varios grupos (tres o más)
en los valores promedios de una variable cuantitativa

ANOVA: ejemplo
Se pretende comparar si existen diferencias en la felicidad laboral entre trabajadores del
sector público, privado, y ONGs.

• La variable independiente se denomina factor. La variable sobre la cual se buscan


analizar diferencias se denomina variable dependiente (VD)

• La lógica que subyace al ANOVA reside en considerar que las diferencias observadas
estarán dadas parcialmente por los diferentes grupos (niveles del factor) y parcialmente
por otros factores (características individuales, por ejemplo)

El vocabulario de ANOVA
• El análisis de varianza mide la distancia que hay entre un sujeto y el promedio general.

• Esta diferencia se descompone en:

– La distancia que hay entre cada grupo y la media general


– La distancia que hay entre el individuo y la media de su propio grupo

Prueba de hipótesis sobre las medias de grupos


• No se introducen cambios conceptuales en la hipótesis nula y la hipótesis alternativa

Copertari, Franco Página 4


Resumen SEGUNDO PARCIAL Metodología de análisis de datos cuantitativos

• Se rechazará H0 cuando las diferencias debidas a los grupos (varianza explicada) sea
significativamente mayor a las diferencias debidas a otros factores (varianza residual).
Para compararlas debemos calcular el cociente entre ambas.

• Para rechazar H0 el cociente de varianza debe ser significativamente distinto de (mayor


que 1)

Pruebas de hipótesis sobre las medias de grupos


• Para aceptar o rechazar la hipótesis nula debemos calcular la probabilidad de hallar una
diferencia como la observada si la hipótesis nula fuera cierta

• Nuevamente, se utiliza como valor crítico para el rechazo de H0 p<.05

Resumen
• El análisis de varianza permite comparar tres o más grupos en los valores promedios de
una variable cuantitativa

• Contrasta la hipótesis nula que las medias de las poblaciones son iguales

• La decisión de Rechazar H0 se basa en determinar si las diferencias atribuibles a los


grupos (varianza explicada) son significativamente más grandes que las producidas por
azar/otros factores (varianza residual)

Relación entre variables


• Consiste en describir de manera conjunta el comportamiento de dos (o más)
variables.

• Desentrañar relaciones constituye un aspecto fundamental en la


investigación científica

• Existe una gran cantidad de coeficientes que permiten medir la relación


entre variables, que dependen del nivel de medición de las variables y el
modo en que se interpretan, entre otras cosas.

¿Cuándo dos variables están relacionadas?


• Existe una relación entre dos variables cuando se observa que un cambio en una variable
va acompañado por un cambio en la otra variable

Copertari, Franco Página 5


Resumen SEGUNDO PARCIAL Metodología de análisis de datos cuantitativos

• Tipos de relaciones entre variables:

– Simétricas o asimétricas: según se puedan diferenciar o no la variable antecedente


y la consecuente
– Lineales o no lineales: según la tendencia que asumen los cambios en las variables

Medidas de asociación para variables nominales: el chi -


cuadrado
• Permite analizar si dos variables cualitativas están asociadas o son independientes. • Es
una medida de la distancia entre F0 y Fe

• Asume valores de 0 a potencialmente infinito, ya que depende del tamaño muestral.

• Para medir la intensidad de la relación entre variables cualitativas, se apela a otros


coeficientes:

– Coefic. Contingencia C de Pearson


– Coefic. Contingencia V de Cramer
– Estos coeficientes asumen valores entre 0-1. No se pueden hacer afirmaciones
acerca de la dirección de la relación.

Relaciones lineales y no lineales


• Lineales

– Se espera que la dirección de una relación sea la misma para todo el rango de las
variables

• No Monótonas (o no Lineales):

– Se esperan variaciones en la dirección

Medidas de asociación entre variables ordinales: Coeficiente


de correlación por rangos de Spearman (Rho)

• Mide la relación lineal entre variables ordinales.

• El coeficiente rs asume valores que oscilan entre -1 y 1.

• Proporcionan información acerca de la intensidad y la dirección de la relación entre las


variables.

Copertari, Franco Página 6


Resumen SEGUNDO PARCIAL Metodología de análisis de datos cuantitativos

Medidas de asociación entre variables continuas: Coeficiente


de correlación de Pearson (r)
• Mide la relación lineal entre dos variables numéricas

• Asume valores entre -1 y 1.

• Proporciona información sobre la intensidad y la dirección de la relación entre dos


variables. Su interpretación es similar a la del coeficiente de correlación de Spearman.

Resumen
Nivel de medición Coeficiente Rango de valoración Lectura
Nominal Chi-cuadrado [0, ∞] Dificultades para
interpretar la
intensidad de la
relación.
Nominal C de Pearson [0 ,1] Más intensa si es
V de Cramer próximo a 1
Ordinal R de Spearman Desde [–1, 1] El signo indica la
Intervalar y R de Pearson Desde [–1,1] dirección, positivo
proporcional es directa, negativo
(continuas) es inversa. Fuerte si
es cercano a -1 o 1,
débil si está cerca
de 0

Copertari, Franco Página 7

También podría gustarte