Está en la página 1de 20

ESTADÍSTICA APLICADA

Docente: Dr. Adrián Quispe Andía


CORRELACIÓN

El análisis de correlación son técnicas estadísticas que permiten


medir la intensidad de la relación que puede existir entre dos
variables.
La correlación puede ser:

• De al menos dos variables (correlación bivariada)


• Tres a más variables ( correlación múltiple).
Ejemplos:
• Relación entre los datos de peso y talla de estudiantes de
universitarios.
• Relación entre el cociente intelectual y rendimiento
académico
Coeficiente de correlación
• El coeficiente de correlación es un valor cuantitativo de la
relación entre dos o más variables.
• El coeficiente de correlación puede variar desde -1 hasta 1.
• La correlación de proporcionalidad directa o positiva se
establece con los valores +1 y de proporcionalidad inversa o
negativa con -1.
• No existe relación entre las variables cuando el coeficiente
es cero (0).
Diagrama de Dispersión
El diagrama, permite detectar la existencia de correlación entre dos variables
cuantitativas.

Diagrama o gráfica permite registrar los valores de dos variables


cuantitativas, utilizando las coordenadas cartesianas (x,y).
A través de los patrones del diagrama de dispersión se pueden
conocer el comportamiento de los datos:

Comportamiento lineal

Directa: Se da cuando una variable disminuye o aumenta y a la


vez la otra variable también en el mismo sentido.

Inverso: Se da cuando el comportamiento de una variable, es


contrario al comportamiento de la otra variable, es
decir aquellos casos en que una variable aumenta, la
otra variable disminuye.

Nula : Es el caso en que no se consigue establecer un


comportamiento entre los datos de las variables.
Coeficiente de Pearson (r)
La correlación de Pearson es un indicador de la fuerzas
con que se vinculan las variables, además de señalar la
dirección lineal entre ellas.
Altura en Peso en
cm.(x) Kg. (y)
161 50
187 76
197 85
179 65
171 66
169 60
166 54
176 84
163 68
... ...
Ejemplo : Se toman la talla y peso de 10 pacientes de un hospital ¿existirá relación?

1.-Planteamiento de hipótesis :
Peso(Kg) Estatura (cm) Ha: Existe relación entre el peso y la talla de los pacientes del hospital
persona
(x) (y)
H0: No existe relación entre el peso y la talla de los pacientes del hospital
1 72 172
2.- Elección del estadístico : como ambas variables son cuantitativas
2 69 161 continuas, elegimos al R de Pearson.
3 70 180
3.- aplicando la formula o en Excel : =Pearson( matriz1; matriz2)
4 71 175
5 70 169 =PEARSON(A3:A12;B3:B12) = 0.70
6 75 172
el coeficiente de Pearson =0.70 esto indica que existe una alta correlación.
7 70 162
8 68 163 4.- Conclusión : Por esta evidencia se probo la hipótesis alterna Ha
9 65 150
10 68 166
Regresión lineal
Es un modelo que permite describir la influencia de una variable X sobre la otra
variable Y.
185
180
175 f(x) = 2.26415094339623 x + 8.96226415094341
R² = 0.498528648087243
X: Variable independiente 170
165
Y: Variable dependiente 160

Talla
155
150
145
140
135
64 66 68 70 72 74 76
Peso

Casos:

- Estudiar la influencia del peso en enfermedades de los pacientes.


- Estudiar la influencia de las dosis para curar una enfermedad
- Estudiar el precio de una vivienda en función de la superficie.
- Estudiar la influencia de la publicidad en las ventas.
Ejemplo: Supongamos que la recta de regresión es:

Gastos familiares = 1565 + 229 x integrantes

Se estima que una familia de 5 integrantes tendrá gastos:

Gastos familiares = 1565 + 229 (5 )= 2690


Coeficiente de determinación (R2)
Ejemplo : Se mide la extensión de brazos y estatura de 10 pacientes de un hospital
¿existirá relación?
construir el diagrama de dispersión y ecuación de estimación
Calcule el coeficiente de correlación e interprete su resultado
Calcular el coeficiente de determinación e interpretar el resultado
Proyecte la estatura si la extensión del brazo es 68cm
Proyecte la extensión del brazo si la estatura es 160 cm

Extensión Estatura
persona brazos
(cm). (cm).
1 72 172
2 63 161
3 78 180
4 73 175
5 70 169
6 74 172
7 62 162
8 63 163
9 64 150
10 67 166
Ji Cuadrado (chi)
Es un estadístico no paramétrico para probar hipótesis con variables categóricas y es
aplicable cuando la variable nominal está compuesto por dos o más categorías.
Tiene dos aplicaciones:

1. La prueba de bondad de ajuste (1variable)

2. La prueba Chi-cuadrada de asociación (2 variables)

3.Prueba de homogeneidad (2 variables)

La dos últimas pruebas se utilizan para determinar si las frecuencias observadas (O)
en las categorías difieren significativamente de las frecuencias esperadas (E).
CARACTERÍSTICAS
1.La Distribución X2 se lee con grados de libertad G.L = (Nº de filas - 1)(Nº de columnas - 1).
2.No tiene valores negativos. El valor mínimo es 0.
3.Todas las curvas son asimétricas
4.Cuando aumentan los grados de libertad las curvas son menos elevadas y más
extendidas a la derecha.
5.Se utiliza para variables medidas en escala nominal u ordinal.
6.Las fórmulas son:

Total de Fila x Total de Columna


F. Esperada=
Total General
Los grados de libertad gl vienen dados por : gl= (r-1)(c-1). Donde r es el
número de filas y c el de columnas.
Ejemplo : Se hizo un estudio consistente en experimentar la efectividad de dos tratamientos
analgésicos para la reducción del dolor en 165 pacientes con cefalea. Se registró el tipo de dolor
(ausente, leve, moderado o intenso) que manifestaron sufrir los pacientes sometidos a cada
tratamiento. De los 83 pacientes sometidos al tratamiento A, 12 manifestaron no sufrir dolor de
cabeza, 24 dolor leve, 31 dolor moderado y 16 dolor intenso. De los 82 pacientes sometidos al
tratamiento B, 20 manifestaron no sufrir dolor de cabeza, 18 dolor leve, 30 dolor moderado y 14
dolor intenso. ( nivel de significancia 1% y nivel de confianza 99%)

a) Plantee las hipótesis


b) Pruebe las hipótesis
Resolución :

Se utilizó la función en excel :


Odds ratio y riesgo relativo
Odds ratio : es una medida utilizada en estudios epidemiológicos transversales y
de casos y controles.
 En términos formales, se define como la posibilidad que una condición de salud
o enfermedad se presente en un grupo de población frente al riesgo que ocurra
en otro.

Riesgo relativo :  es el cociente entre el riesgo en el grupo con el factor de


exposición o factor de riesgo y el riesgo en el grupo de referencia, que no tiene
el factor de exposición. Es un concepto estadístico utilizado como medida
de asociación entre la variable dependiente y la variable independiente.
Resolución : como es retro prospectivo OR= a*d/b*c = 23*132/34*35=2,55

Como OR=2,55>1 : existe factor de riesgo


Resolución: el RR=P(E/F)/P(E/F’) = (10/135)/(21/470) =1,66

Como RR=1,66 >1 existe factor de riesgo

También podría gustarte