Está en la página 1de 74

ANALISIS

BIVARIADO
2 variables
LA HIPÓTESIS ESTADÍSTICA
HIPÓTESIS

• Es la guía para realizar una investigación o estudio.


• Es la explicación tentativa del fenómeno investigado que se formulan como
proposiciones
• Ante inferencias estadísticas, se emplea el modelo de decisión, que consta de 4
elementos:
Hipótesis a probarse o nula Ho
Hipótesis alterna Hi
Nivel de significancia
Regla de decisión
HIPÓTESIS SE PARTE DE LA
FORMULACIÓN DE
• H0 : X1 = Y2 UNA PREGUNTA
• Hi : X1 ≠ Y2 La Hi no se acepta
=>< ni se rechaza,
medias, medianas, es la Ho la que se
porcentajes somete a prueba
• H0: X - Y = 0 asociaciones o correlaciones
estimaciones
• Hi : X - Y ≠ 0 …

• H0: r = 0 Igualdad  Dos colas, se desconoce


la dirección que tomará
• Hi : r ≠ 0
Comparación  Un cola o extremo
ASPECTOS IMPORTANTES SOBRE H0 y Hi

•H0 y Hi son mutuamente exclusivas y colectivamente exhaustivas, es decir;


son complementarias.
•H0 siempre se presume ser cierta y es la que debe ser comprobada.
•Hi es la conclusión a la que se desea o espera llegar como resultado.
En consecuencia, el complemento de la conclusión se convierte en el enunciado de
la H0.
•Se utiliza una muestra aleatoria (n) para “rechazar H0”.
•Siempre, la igualdad es parte de H0 (“=”, “≥”, “≤”).
•Mientras que “≠” “<” y “>” siempre es parte de H1.
PROBABILIDAD

• Es una herramienta matemáticas que hace uso de diversas técnicas para asignar un
número a la posibilidad de que un evento ocurra.
• Nos ayuda a predecir eventos futuros de los cuales no se tiene una garantía
completa de que ocurran. 
PROBABILIDA
D p=
ESTADÍSTICA
PORCENTAJE
expresa la probabilidad (p)
de que un evento ocurra entre 0 y 1;
0 = imposibilidad de ocurrencia
1= 100% = certeza de que ocurre el fenómeno
SIGNIFICANCIA EN ESTADÍSTICA

• Probabilidad oscila entre 0 y 1 = p

• Área esperada entre dos puntos en la curva normal = 95% ó 0.95


 nivel o grado de confianza + común es 95% 99% ó 90%
p= 0.95 p= 0.99 ó p= 0.9

• Área de rechazo = toda aquella área fuera del nivel de confianza, complementa a 1
 nivel de significancia α quedaría 5% 1% ó 10%
p= 0.05, p= 0.01 ó p= 0.1

NIVEL DE SIGNIFICANCIA  p =α NIVEL DE CONFIANZA  p = (1- α)


NIVEL DE SIGNIFICANCIA

Designa el área bajo la curva de la distribución de la de prueba que está por encima de
los valores, sobre el eje horizontal; que constituyen la región de rechazo.
Todo valor calculado que cae dentro de la región de rechazo se dice que es significativo.
NIVEL DE SIGNIFICANCIA REGLA DE DECISIÓN

Si tuviéramos un nivel o grado de confianza del 95% (p= 0.95)


entonces el nivel de significancia sería del 5% (α= 0.05) donde:

p= .95

α= .025 α= .025
CONTRASTE
DE HIPÓTESIS
H0 : x < y
UNILATERAL
H1 : x > y

H0 : x > y

H1 : x < y

VALOR CRÍTICO:
Punto de corte
CONTRASTE DE HIPÓTESIS
BILATERAL

H0 : x = y

H1 : x  y
DECISIÓN ESTADÍSTICA
es una decisión probabilística

Se compara el valor de p con el nivel de significancia α.

Si el valor de p < α es significativo = H0 se rechaza

de otro modo H0 no se rechaza.

p = 0.10, tenemos alguna evidencia que H0 no es verdadera.

p = 0.05, tenemos fuerte evidencia que H0 no es verdadera.

p = 0.01, tenemos muy fuerte evidencia que H0 no es verdadera.

p = 0.001, tenemos una extremadamente fuerte evidencia que H0 no es verdadera.


DECISIÓN ESTADÍSTICA ZONAS DE ERROR
es una decisión probabilística

p < α = es significativo
H0 se rechaza
ERROR EN DECISIÓN ESTADÍTICA
Error tipo II  β beta Error tipo 1  α alfa
se concluye que no hay diferencias se observan diferencias
cuando en realidad sí las hay cuando en realidad no existen

•Los resultados NO son •Se detecta


significativos (p>0.05) y significancia
se concluye que no hay estadística p< 0.05 y
diferencias, cuando se rechaza la H0
realmente SI las hay y se cuando en realidad es
acepta la H0 cuando en verdadera.
realidad es falsa.
RECOMENDACIONES PARA DISMINUIR EL ERROR TIPO I, α

• Disponer de una teoría que guíe la investigación, evitando el “salir de pesca” con la
computadora buscando asociaciones entre variables.
• Disminuir el número de pruebas estadísticas llevados a cabo en el estudio.
• Depurar la base de datos para evitar errores de valores extremos que puedan
producir hallazgos significativos.
• Utilizar valores de alfa más reducidos (0.01 o 0.001).
• Reproducir el estudio. Si al reproducir el estudio se obtienen resultados similares,
estaremos más seguros de no estar cometiendo el error de tipo I.
RECOMENDACIONES PARA DISMINUIR EL ERROR TIPO II, β

• Incrementar el tamaño de la muestra.


• Estimar el poder estadístico del estudio (1 – β).
• Incrementar el tamaño del efecto a detectar.
• Incrementar el valor de alfa.
• Utilizar pruebas paramétricas (más potentes) en lugar de pruebas no paramétricas
en la medida de lo posible.
Pasos para contraste de hipótesis
https://youtu.be/GMKllNkCJCo
https://blogs.ugto.mx/enfermeriaenlinea/unidad-didactica-3-las-
pruebas-de-hipotesis/

TE
EL AN
A S AD
A R ÁM
VI S
R E
SE
CORRELACIÓN
LINEAL
RELACIÓN O ASOCIACIÓN
ENTRE 2 VARIABLES
TIPOS

ANALIZAR:

• Forma (lineal,
no lineal)

• Dirección (+, -)

• Fuerza (débil,
moderada, fuerte)
CARACTERÍSTICAS COEFICIENTE DE CORRELACIÓN (CC)
a.El valor del CC es independiente de cualquier unidad usada para medir las variables.
b.El valor del CC se altera de forma importante ante la presencia de un valor extremo, como sucede con la
desviación típica. Ante estas situaciones conviene realizar una transformación de datos que cambia la
escala de medición y modera el efecto de valores extremos (como la transformación logarítmica o
pruebas Post Hoc).
c.El CC mide solo la relación con una línea recta. Dos variables pueden tener una relación curvilínea
fuerte, a pesar de que su correlación sea pequeña. Por tanto cuando analicemos las relaciones entre dos
variables debemos representarlas gráficamente y posteriormente calcular el coeficiente de correlación.
d.El CC no se debe extrapolar más allá del rango de valores observado de las variables a estudio ya que la
relación existente entre X e Y puede cambiar fuera de dicho rango.
e.La correlación no implica causalidad. La causalidad es un juicio de valor que requiere más información
que un simple valor cuantitativo de un CC.
Correlación Coeficiente de correlación
indica la fuerza y la dirección de de Pearson o Spearman
una relación lineal y es un índice que puede utilizarse para medir
proporcionalidad entre dos el grado de relación de dos variables
variables estadísticas siempre y cuando ambas sean cuantitativas
y continuas.
¿QUÉ SE PREGUNTA?

¿Qué relación existe entre el puntaje de una variable x y el de una variable y?

• H0: EXISTE relación lineal entre


el puntaje de la variable x y el de la variable y

• Hi: No hay relación lineal entre


el puntaje de la variable x y el de la variable y

• H0: hipótesis de nula Hi: hipótesis alterna


¿QUÉ PE AR
r
SON

COEFICIENTE DE
CORRELACIÓN E
V D ER
M
USAR? CRA hi
p

SPE
ARM
AN
rho
COEFICIENTE
DE CORRELACIÓN
PEARSON - SPEARMAN
EXPLICACIÓN DE LA RELACIÓN O ASOCIACIÓN
ENTRE 2 VARIABLES
EL COEFICIENTE DE CORRELACIÓN DE PEARSON (r)

• Puede calcularse en cualquier grupo de datos VD, VI, sin determinación


• El nivel de medición de la variable debe ser escalar
• Para que tenga validez debe cumplir:
a) que las dos variables procedan de una muestra aleatoria de individuos.
b) ambas variables deben tener una distribución normal

Si los datos no tienen una distribución normal, una o ambas variables se pueden
transformar [transformación logarítmica= log10(x)] o si no se calcularía un
coeficiente de correlación no paramétrico (coeficiente de correlación de Spearman)
EL COEFICIENTE DE DETERMINACIÓN DE SPEARMAN (rho)

• Es exactamente el mismo que el coeficiente de correlación de Pearson calculado


sobre el rango de observaciones
• El nivel de medición de una de la variable debe ser ordinal

• Es recomendable utilizarlo cuando los datos presentan:


a) valores externos ya que dichos valores afectan mucho el coeficiente de
correlación de Pearson
b) distribuciones no normales
COEFICIENTE DE CORRELACIÓN LINEAL Variable continua / continua
Distribución normal
DE PEARSON

covarianza

+ó- tamaño de efecto

= -1 a 1

+ : relación directa o proporcional


- : relación inversamente proporcional
COEFICIENTE DE DETERMINACIÓN Variable categórica / categórica
Distribución NO normal
DE SPEARMAN

ρ = Rho
= -1 a 1
+ó- tamaño de efecto

+ : relación directa proporcional


- : relación inversamente proporcional Se interpreta igual que Pearson
PASOS
ANÁLISIS DE CORRELACIÓN
PASOS: ANALISIS DE CORRELACIÓN

¿El comportamiento de las dos variable son independientes?


H0: El comportamiento de las dos variable es independiente por lo que
1. Redactar hipótesis NO existe una asociación lineal, si r = 0
Hi: El comportamiento de las dos variable no son independiente, por lo que
existe asociación lineal entre las dos variable, si r  0

Distribución H0 Grado de confiabilidad Nivel de significancia


2. Contraste de hipótesis
2 colas 99%, 95% o 90% α = 1%, 5% o 10%

3. Escala de cada variable Nominal Ordinal Intervalar o razón

Paramétrico No paramétrico
4. Tipo de análisis
n > 20 n < 20

5. Existencia datos atípicos No Si


Kolmogorov - Smirnov Shapiro - Wills
6. Supuesto: Normalidad n > 50 n < 50
Valor normalidad y sig
Prueba de hipótesis H0 : Existe homogeneidad Hi : Existe homogeneidad
7. Prueba a emplear para Pearson Spearman Chi cuadrado
CORRELACIONES
Tipo de escala ambas nominal / nominal
Intervalar o razón Dicotómicas
variables nominal / intervalar

Supuestos: Normalidad Si No No

8. Prueba de hipótesis
p=α p<α p>α
CORRELACIONES

9. Tomar decisión H0 Acepto o rechazo

10. Redactar conclusiones


COEFICIENTE
DE
CORRELACIÓ
N
VERIFICAR SUPUESTO DE NORMALIDAD PASO 3

PASO 2
PASO 6 PASO 4

PASO 5
PASO 4

PASO 5
PASO 6
n > 50 n < 50

PRUEBA DE HIPÓTESIS
Variable A Variable B
SUPUESTO DE NORMALIDAD
¿La distribución de los valores presentan una distribución normal?
Hipótesis
H0: La distribución en los valores en la variable SI se asemeja a la curva normal, si p > α
α = .05
Hi: La distribución en los valores en la variable NO se asemeja a la curva normal, si p < α
Valor de la prueba K-S = .050 K-S = .096
Comparar p valor con α p = .000 < α = .05 p = .000 < α = .05
Decisión H0 Rechazo H0 Rechazo H0
De acuerdo a la prueba de Kolmogorov-Smirnov con corrección de Lilliefors, con una p< .05,
Conclusión las puntuaciones de la variable A (K-S= .50) y de la variable B (K-S= .096)
difieren de una distribución normal
PASO 7

COEFICIENTE DE CORRELACIÓN
¿El comportamiento de las dos variable son independientes?
H0: El comportamiento de las dos variable es independiente por lo que
1. Redactar hipótesis NO existe una asociación lineal, si r = 0
Hi: El comportamiento de las dos variable no son independiente, por lo que
existe asociación lineal entre las dos variable, si r  0

Distribución H0 Grado de confiabilidad Nivel de significancia


2. Contraste de hipótesis
2 colas 99%, 95% o 90% α = 1%, 5% o 10%

7. Prueba a emplear para PARAMÉTRICA NO PARAMÉTRICA NO PARAMÉTRICA


correlaciones Pearson Spearman Chi cuadrado
Tipo de escala ambas nominal / nominal
Intervalar o razón Dicotómicas
variables nominal / intervalar
Supuestos: Normalidad Si No No
Existencia datos atípicos No Si
PASO 7

?
PASO 7
COEFICIENTE DE CORRELACIÓN

NIVEL MAX ALCANZADO


DE SIGNIFICANCIA
PASO 8
PRUEBA DE HIPÓTESIS
Relación Variable A Variable B
PARA CORRELACIÓN
¿El comportamiento de las dos variable son independientes?
H0: El comportamiento de las dos variable es independiente por lo que
Hipótesis NO existe una asociación lineal, si r = 0
Hi: El comportamiento de las dos variable no son independiente, por lo que
existe asociación lineal entre las dos variable, si r  0
Valor de la prueba r = .558
Comparar valor p con α p = .000 < α = .050
Decisión H0 Rechazo H0
PASO 9
Conclusión Las puntuaciones entre la variable A y variable B presentan una relación lineal
proporcional moderada y estadísticamente significativa (r = .558, p < .05)
PASO 10

+ó- tamaño de efecto

+ : relación directa o proporcional


- : relación inversamente proporcional
PASO 11

SPSS: DIAGRAMA DE DISPERSIÓN


PASO 11

SPSS: DIAGRAMA DE DISPERSIÓN

VARIABLE
X

VARIABLE
Y
COEFICIENTE
DE
CORRELACIÓ
N
EXCEL: COEFICIENTE DE CORRELACIÓN
PASO 9
r PEARSON

ρ = Rho SPEARMAN

https://youtu.be/Rg1KbgJIu8g
PASO 8
PRUEBA DE CONTRASTE DE HIPÓTESIS  PEARSON

https://youtu.be/qvHaw7h5uDw

=r*RAIZ(gl/1-POTENCIA(r;2)))

= tamaño de muestra
= gl: grados de libertad
= α = 5% Región de t = valor Z
aceptación
=INV.T.2C(α;gl) Nivel de confianza

-2.07 valor crítico Z +2.07


PASO 8
PRUEBA DE HIPÓTESIS  SPEARMAN
https://youtu.be/Rg1KbgJIu8g

=Rho/RAIZ(((1-POTENCIA(Rho;2))/gl)

= tamaño de muestra
= gl: grados de libertad
Región de t = valor Z
= α = 5% aceptación
=INV.T.2C(α;gl) Nivel de confianza

valor crítico Z
PASO 11
EXCEL

DIAGRAMA
DISPERSIÓN

DATOS VARIABLE X

DATOS VARIABLE Y
PASO 11
EXCEL

DIAGRAMA
DISPERSIÓN

COEF. DE CORR. VARIANZA


r = raíz (R2) DE LA CORRELACIÓN

NOTA: Al pie del diagrama de dispersión debe llevar el valor r y p


PRUEBA
CHI CUADRADO X2
RELACIÓN O ASOCIACIÓN
ENTRE 2 VARIABLES NOMINAL O ORDINAL
PRUEBA X2 chi cuadrado

• Prueba no paramétrica
• Compara dos o más muestras independientes
• Aplica si no hay distribución normal
• Variables categóricas: nominal u ordinal
• Especifica la existencia de una asociación, no las características o forma
• Indica intensidad o fuerza de la asociación
• En casos ordinal indica el sentido: directa o inversa
• Tipos de relación a testear: simétrico (fuerza) o direccional (predecir)
PASO 2 PASO 3 PASO 4 ¿Qué puedes ver?
Característica
Escala Asociación Prueba Sentido Escala y Significado
de la tabla Intensidad (directo / Inversa)

V de Cramer Cualquiera
De 0 a 1, donde:
Coef. de
SIMÉTRICA Cuadrados Si No 0 = ausencia de asociación
Nominal

contingencia 1 = asociación perfecta


PHI 2 filas x 2 col.
De 0 a 1, donde:
DIRECCIONAL Lambda Cualquiera Si No 0 = VI no ayuda a predecir la VD
1 = VI SI ayuda a predecir la VD

Gamma Cualquiera De -1 a 1, donde:


-1 = asociación inversa perfecta
SIMÉTRICA TAU B de Kendall Cuadradas Si Si
0 = ausencia de asociación
Ordinal

TAU C de Kendall Rectangulares 1 = asociación directa perfecta


De -1 a 1, donde:
DIRECCIONAL D de Somers Cualquiera Si Si 0 = VI no ayuda a predecir la VD
+1 = VI SI ayuda a predecir la VD
PASO 5

ESTIMACIÓN DE RIESGO
• SOLO PARA TABLAS 2 X 2 con variable dicotómicas

• Sirve para conocer que tan grande es la probabilidad de que se presente la


relación entre dos variables dicotómicas, es decir el tamaño de efecto
• El riesgo relativo (RR) se usa en la evaluación de trabajos prospectivos (estudio
longitudinal que se analiza en el presente pero comportamiento futuro)
• El odds ratio (OR) se usa en el análisis de trabajos retrospectivos (estudio
longitudinal que se analiza en el presente pero con datos del pasado)
PASO 5
PASO 5

EJEMPLO:
COEFICIENTE
X2
PASO 2

PASO 1 PASO 4
PASO 1

n
PASO 1

PRUEBA DE HIPÓTESIS
VARIABLES INDEPENDIENTES CATEGÓRICAS
CHI CUADRADA

¿La variables son estadísticamente independientes?


Hipótesis
α = .05 H0: Las variables SI son estadísticamente independiente, si p > α
Hi: Las variables NO son estadísticamente independiente, si p < α

Valor de la prueba X2 = .096

Comparar p valor con α p = .000 < α = .05

Decisión H0 Rechazo H0

Existe una asociación estadísticamente independiente entre


Conclusión las variables A y B (X2 = 26.65, p< .05)
PASO 2 PASO 3 PASO 4 ¿Qué puedes ver?
Característica
Escala Asociación Prueba Sentido Escala y Significado
de la tabla Intensidad (directo / Inversa)

V de Cramer Cualquiera
De 0 a 1, donde:
Coef. de
SIMÉTRICA Cuadrados Si No 0 = ausencia de asociación
Nominal

contingencia 1 = asociación perfecta


PHI 2 filas x 2 col.
De 0 a 1, donde:
DIRECCIONAL Lambda Cualquiera Si No 0 = VI no ayuda a predecir la VD
1 = VI SI ayuda a predecir la VD

Gamma Cualquiera De -1 a 1, donde:


-1 = asociación inversa perfecta
SIMÉTRICA TAU B de Kendall Cuadradas Si Si
0 = ausencia de asociación
Ordinal

TAU C de Kendall Rectangulares 1 = asociación directa perfecta


De -1 a 1, donde:
DIRECCIONAL D de Somers Cualquiera Si Si 0 = VI no ayuda a predecir la VD
+1 = VI SI ayuda a predecir la VD
PASO 4: PRUEBA NOMINAL

V de Cramer
0 - 0.3 Asociación baja
0.3 - 0.6 Asociación media
0.6 - 1 Asociación alta

PRUEBA DE VARIABLE NOMINAL


HIPÓTESIS V DE CRAMER
¿Las variables son estadísticamente independientes?
Hipótesis
α = .05 H0: Las variables SI son estadísticamente independiente, si p > α
Hi: Las variables NO son estadísticamente independiente, si p < α
Valor de la prueba v = .2
Comparar p valor p = .000 < α = .05
con α
Decisión H0 Rechazo H0
Conclusión Existe una asociación baja entre las variables A y B (V= .2, p< .05)
PASO 4: PRUEBA NOMINAL

VI
Lambda
VD
0 - 0.3 Predicción baja
0.3 - 0.6 Predicción media
0.6 - 1 Predicción alta

Definir Variable Dependiente (explicada)


PRUEBA DE VARIABLE NOMINAL: existe Variable Dependiente
HIPÓTESIS LAMBDA
¿VD es independiente de la dirección de la VI?
Hipótesis H0: La VD es independiente de la dirección de VI, si lambda = 0
α = .05
Hi: La VD NO es independiente de la dirección de VI, si lambda  0
Valor de la prueba lambda = .185
Comparar
p valor con α p = .001 < α = .05

Decisión H0 Rechazo H0
Conclusión La VD depende de la dirección de VI con una predicción significativamente baja (lambda= .185, p< .05)
PASO 5

ESTIMACIÓN DE RIESGO
• SOLO PARA TABLAS 2 X 2 VARIABLE DICOTÓMICA

cols = 2

filas = 2

• Entre V1 y V2 considerando el primer valor de ambas existe una posibilidad del VALOR ESTIMACIÓN % de que ocurra esta
relación
Ejem no - no : Existe una probabilidad del 2.25% de que el ETO_mayor_prom no se presente, cuando no existe
incremento_temp
• Para primer valor con 2do valor= 1* valor de riesgo = % Ejem: 1* 2.248 = .444 no - si
PASO 6
COEFICIENTE
X2

https://youtu.be/6LgaBEU_cEY
COEFICIENTE V DE KRAMER (phi)

• Determina si existe relación entre dos variables a nivel nominal


• Emplea valores dicotómicos
• La relación no es debida al azar
• Se presenta en tabla de contingencia de 2 filas x 2 columnas ó 3 x 3
• Se requiere de manera previa contar con el estadístico de Chi Cuadrado
COEFICIENTE Variables nominal dicotómica
V DE KRAMER

= 0 a 1 tamaño de efecto

x2 : estadístico Chi cuadrado


k: mínimo de filas o columnas en
una tabla de contingencias
PASO 4
COEFICIENTE V DE KRAMER
PASO 1
columnas = 2 CÁLCULO X2

https://youtu.be/Dntc_MxPdVY
filas = 5

n filas = f :
n columnas = c :
k = min (f, c) :

=RAIZ(x2/(n*(k-1)))
PASO 5
REGRESIÓN LINEAL
EXPLICACIÓN DE LA RELACIÓN O ASOCIACIÓN
ENTRE 2 VARIABLES

https://youtu.be/BDf88CXvA_8
Regresión lineal o ajuste lineal permite
determinar el grado de dependencia de
las series de valores X e Y, prediciendo
el valor y estimado que se obtendría para
un valor x que no esté en la distribución.

También podría gustarte