Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BIVARIADO
2 variables
LA HIPÓTESIS ESTADÍSTICA
HIPÓTESIS
• Es una herramienta matemáticas que hace uso de diversas técnicas para asignar un
número a la posibilidad de que un evento ocurra.
• Nos ayuda a predecir eventos futuros de los cuales no se tiene una garantía
completa de que ocurran.
PROBABILIDA
D p=
ESTADÍSTICA
PORCENTAJE
expresa la probabilidad (p)
de que un evento ocurra entre 0 y 1;
0 = imposibilidad de ocurrencia
1= 100% = certeza de que ocurre el fenómeno
SIGNIFICANCIA EN ESTADÍSTICA
• Área de rechazo = toda aquella área fuera del nivel de confianza, complementa a 1
nivel de significancia α quedaría 5% 1% ó 10%
p= 0.05, p= 0.01 ó p= 0.1
Designa el área bajo la curva de la distribución de la de prueba que está por encima de
los valores, sobre el eje horizontal; que constituyen la región de rechazo.
Todo valor calculado que cae dentro de la región de rechazo se dice que es significativo.
NIVEL DE SIGNIFICANCIA REGLA DE DECISIÓN
p= .95
α= .025 α= .025
CONTRASTE
DE HIPÓTESIS
H0 : x < y
UNILATERAL
H1 : x > y
H0 : x > y
H1 : x < y
VALOR CRÍTICO:
Punto de corte
CONTRASTE DE HIPÓTESIS
BILATERAL
H0 : x = y
H1 : x y
DECISIÓN ESTADÍSTICA
es una decisión probabilística
p < α = es significativo
H0 se rechaza
ERROR EN DECISIÓN ESTADÍTICA
Error tipo II β beta Error tipo 1 α alfa
se concluye que no hay diferencias se observan diferencias
cuando en realidad sí las hay cuando en realidad no existen
• Disponer de una teoría que guíe la investigación, evitando el “salir de pesca” con la
computadora buscando asociaciones entre variables.
• Disminuir el número de pruebas estadísticas llevados a cabo en el estudio.
• Depurar la base de datos para evitar errores de valores extremos que puedan
producir hallazgos significativos.
• Utilizar valores de alfa más reducidos (0.01 o 0.001).
• Reproducir el estudio. Si al reproducir el estudio se obtienen resultados similares,
estaremos más seguros de no estar cometiendo el error de tipo I.
RECOMENDACIONES PARA DISMINUIR EL ERROR TIPO II, β
TE
EL AN
A S AD
A R ÁM
VI S
R E
SE
CORRELACIÓN
LINEAL
RELACIÓN O ASOCIACIÓN
ENTRE 2 VARIABLES
TIPOS
ANALIZAR:
• Forma (lineal,
no lineal)
• Dirección (+, -)
• Fuerza (débil,
moderada, fuerte)
CARACTERÍSTICAS COEFICIENTE DE CORRELACIÓN (CC)
a.El valor del CC es independiente de cualquier unidad usada para medir las variables.
b.El valor del CC se altera de forma importante ante la presencia de un valor extremo, como sucede con la
desviación típica. Ante estas situaciones conviene realizar una transformación de datos que cambia la
escala de medición y modera el efecto de valores extremos (como la transformación logarítmica o
pruebas Post Hoc).
c.El CC mide solo la relación con una línea recta. Dos variables pueden tener una relación curvilínea
fuerte, a pesar de que su correlación sea pequeña. Por tanto cuando analicemos las relaciones entre dos
variables debemos representarlas gráficamente y posteriormente calcular el coeficiente de correlación.
d.El CC no se debe extrapolar más allá del rango de valores observado de las variables a estudio ya que la
relación existente entre X e Y puede cambiar fuera de dicho rango.
e.La correlación no implica causalidad. La causalidad es un juicio de valor que requiere más información
que un simple valor cuantitativo de un CC.
Correlación Coeficiente de correlación
indica la fuerza y la dirección de de Pearson o Spearman
una relación lineal y es un índice que puede utilizarse para medir
proporcionalidad entre dos el grado de relación de dos variables
variables estadísticas siempre y cuando ambas sean cuantitativas
y continuas.
¿QUÉ SE PREGUNTA?
COEFICIENTE DE
CORRELACIÓN E
V D ER
M
USAR? CRA hi
p
SPE
ARM
AN
rho
COEFICIENTE
DE CORRELACIÓN
PEARSON - SPEARMAN
EXPLICACIÓN DE LA RELACIÓN O ASOCIACIÓN
ENTRE 2 VARIABLES
EL COEFICIENTE DE CORRELACIÓN DE PEARSON (r)
Si los datos no tienen una distribución normal, una o ambas variables se pueden
transformar [transformación logarítmica= log10(x)] o si no se calcularía un
coeficiente de correlación no paramétrico (coeficiente de correlación de Spearman)
EL COEFICIENTE DE DETERMINACIÓN DE SPEARMAN (rho)
covarianza
= -1 a 1
ρ = Rho
= -1 a 1
+ó- tamaño de efecto
Paramétrico No paramétrico
4. Tipo de análisis
n > 20 n < 20
Supuestos: Normalidad Si No No
8. Prueba de hipótesis
p=α p<α p>α
CORRELACIONES
PASO 2
PASO 6 PASO 4
PASO 5
PASO 4
PASO 5
PASO 6
n > 50 n < 50
PRUEBA DE HIPÓTESIS
Variable A Variable B
SUPUESTO DE NORMALIDAD
¿La distribución de los valores presentan una distribución normal?
Hipótesis
H0: La distribución en los valores en la variable SI se asemeja a la curva normal, si p > α
α = .05
Hi: La distribución en los valores en la variable NO se asemeja a la curva normal, si p < α
Valor de la prueba K-S = .050 K-S = .096
Comparar p valor con α p = .000 < α = .05 p = .000 < α = .05
Decisión H0 Rechazo H0 Rechazo H0
De acuerdo a la prueba de Kolmogorov-Smirnov con corrección de Lilliefors, con una p< .05,
Conclusión las puntuaciones de la variable A (K-S= .50) y de la variable B (K-S= .096)
difieren de una distribución normal
PASO 7
COEFICIENTE DE CORRELACIÓN
¿El comportamiento de las dos variable son independientes?
H0: El comportamiento de las dos variable es independiente por lo que
1. Redactar hipótesis NO existe una asociación lineal, si r = 0
Hi: El comportamiento de las dos variable no son independiente, por lo que
existe asociación lineal entre las dos variable, si r 0
?
PASO 7
COEFICIENTE DE CORRELACIÓN
VARIABLE
X
VARIABLE
Y
COEFICIENTE
DE
CORRELACIÓ
N
EXCEL: COEFICIENTE DE CORRELACIÓN
PASO 9
r PEARSON
ρ = Rho SPEARMAN
https://youtu.be/Rg1KbgJIu8g
PASO 8
PRUEBA DE CONTRASTE DE HIPÓTESIS PEARSON
https://youtu.be/qvHaw7h5uDw
=r*RAIZ(gl/1-POTENCIA(r;2)))
= tamaño de muestra
= gl: grados de libertad
= α = 5% Región de t = valor Z
aceptación
=INV.T.2C(α;gl) Nivel de confianza
=Rho/RAIZ(((1-POTENCIA(Rho;2))/gl)
= tamaño de muestra
= gl: grados de libertad
Región de t = valor Z
= α = 5% aceptación
=INV.T.2C(α;gl) Nivel de confianza
valor crítico Z
PASO 11
EXCEL
DIAGRAMA
DISPERSIÓN
DATOS VARIABLE X
DATOS VARIABLE Y
PASO 11
EXCEL
DIAGRAMA
DISPERSIÓN
• Prueba no paramétrica
• Compara dos o más muestras independientes
• Aplica si no hay distribución normal
• Variables categóricas: nominal u ordinal
• Especifica la existencia de una asociación, no las características o forma
• Indica intensidad o fuerza de la asociación
• En casos ordinal indica el sentido: directa o inversa
• Tipos de relación a testear: simétrico (fuerza) o direccional (predecir)
PASO 2 PASO 3 PASO 4 ¿Qué puedes ver?
Característica
Escala Asociación Prueba Sentido Escala y Significado
de la tabla Intensidad (directo / Inversa)
V de Cramer Cualquiera
De 0 a 1, donde:
Coef. de
SIMÉTRICA Cuadrados Si No 0 = ausencia de asociación
Nominal
ESTIMACIÓN DE RIESGO
• SOLO PARA TABLAS 2 X 2 con variable dicotómicas
EJEMPLO:
COEFICIENTE
X2
PASO 2
PASO 1 PASO 4
PASO 1
n
PASO 1
PRUEBA DE HIPÓTESIS
VARIABLES INDEPENDIENTES CATEGÓRICAS
CHI CUADRADA
Decisión H0 Rechazo H0
V de Cramer Cualquiera
De 0 a 1, donde:
Coef. de
SIMÉTRICA Cuadrados Si No 0 = ausencia de asociación
Nominal
V de Cramer
0 - 0.3 Asociación baja
0.3 - 0.6 Asociación media
0.6 - 1 Asociación alta
VI
Lambda
VD
0 - 0.3 Predicción baja
0.3 - 0.6 Predicción media
0.6 - 1 Predicción alta
Decisión H0 Rechazo H0
Conclusión La VD depende de la dirección de VI con una predicción significativamente baja (lambda= .185, p< .05)
PASO 5
ESTIMACIÓN DE RIESGO
• SOLO PARA TABLAS 2 X 2 VARIABLE DICOTÓMICA
cols = 2
filas = 2
• Entre V1 y V2 considerando el primer valor de ambas existe una posibilidad del VALOR ESTIMACIÓN % de que ocurra esta
relación
Ejem no - no : Existe una probabilidad del 2.25% de que el ETO_mayor_prom no se presente, cuando no existe
incremento_temp
• Para primer valor con 2do valor= 1* valor de riesgo = % Ejem: 1* 2.248 = .444 no - si
PASO 6
COEFICIENTE
X2
https://youtu.be/6LgaBEU_cEY
COEFICIENTE V DE KRAMER (phi)
= 0 a 1 tamaño de efecto
https://youtu.be/Dntc_MxPdVY
filas = 5
n filas = f :
n columnas = c :
k = min (f, c) :
=RAIZ(x2/(n*(k-1)))
PASO 5
REGRESIÓN LINEAL
EXPLICACIÓN DE LA RELACIÓN O ASOCIACIÓN
ENTRE 2 VARIABLES
https://youtu.be/BDf88CXvA_8
Regresión lineal o ajuste lineal permite
determinar el grado de dependencia de
las series de valores X e Y, prediciendo
el valor y estimado que se obtendría para
un valor x que no esté en la distribución.