Está en la página 1de 27

ESCUELA DE TRABAJO SOCIAL

ESTADISTICA I
BIVARIABLE
REGRESIÓN Y CORRELACIÓN
FACILITADOR: Dr. Cayetano Rosales
Auxiliar: Floridalma Martínez
Semestre II. 2022
Agenda pedagógica
a) Variables.

b) Relaciones entre variables.

c) Regresión lineal simple.

d) Correlación lineal.
Variable
Para Hernández Sampieri, R., Fernández Collado, C., & Baptista
Lucio, P. (2014). “Propiedad que tiene una variación que puede
medirse u observarse.” p. 105.
Estas propiedades o características que se encuentran
presentes en los objetos, situaciones o individuos y su
variación, puede describirse o medirse.

Cuyas propiedades o características pueden ser cuantitativa


o cualitativa, es de interés para analizar el comportamiento
en una investigación, estas variables según su complejidad
puede ser simple o compuesto.
Ejemplo de variable
Dimensiones
Clima social familiar

Teoría: Rudolf H. Moos 1974 Desarrollo


Estabilidad

Relaciones
El ambiente y su relación con el individuo

Teoría: Kurt Lewin Teoría dinámica de la personalidad (1935)


y Resolución de conflictos sociales (1948)
Datos con dos atributos

Población Una variable Un atributo

Muestra Dos variables Dos atributos


Datos de dos variables
Pares de valores (a, b) o (x, y) Distribución
bidimensional
Tabla de datos
x y Pares ordenados
61 50
61 85
66 40 Existe o no relación entre las dos
67 95 variables.
73 35
Los datos bivariados
Son aquellas cuyas características que se puede
expresan en números, con pares ordenados (x, y) es
una distribución bidimensional.
Estos pares de valores se pueden ordenar en tablas de
datos, los que permiten condensar información que se
puede analizar.
Para realizar análisis sobre la relación entre las
variables.
x y
Consumo de helado Variable y
Var-Indepen. Var-Depen.
7
Cantidad Q// 6

x y 5

4 Plano cartesiano
1 2 3

2 4 2

3 6 0
0 1 2 3 4

Variable X
Hay una relación
Hay una función matemática que las une Símbolo
Y= f(x)= 2x 𝒓=𝟏
Hay una Regresión lineal
Regresión

Permite determinar la influencia de


las variables independientes en las
variables dependientes.

Con la regresión se logra explicar un


fenómeno o predecir situaciones para
el futuro a partir de los datos que se
tiene.
Distribuciones bidimensionales
Relación funcional

Dos variables (x, y) están relacionadas funcionalmente cuando conocida la


primera se puede saber con exactitud el valor de la segunda.
Relación estadística
Dos variables (x, y) están relacionadas estadísticamente cuando conocida la
primera se puede estimar aproximadamente el valor de la segunda.

 Ingresos y gastos de una familia.


Ejemplo:  Horas de estudio y rendimiento académico.
 Estilo de aprendizaje y rendimiento académico.
 Inversión pública y desarrollo local
Investigación Niveles de investigación Objetivo

- Se asocian conceptos y variables


- Permiten predicciones
- Cuantifican relaciones entre
conceptos o variables
Criterios para elegir pruebas estadísticos
Naturaleza de la Tipo de variables Distribución Prueba
pregunta de
investigación

Relación entre Categórica/Categórica No normal Chi cuadrada


grupo o categorías

Correlación entre Continua/Continua Correlación de Pearson


variables Normal

Categórica/Categórica No normal Correlación


o Kendall
de Spearman
Coeficiente de correlación producto-momento o coeficiente de Pearson (r)

Para Pérez, H (2008). Designa la


magnitud de la relación entre dos
variables medidas por lo menos en una
escala de intervalos. P. 654

El coeficiente de correlación es un
estadístico que da información global
sobre el grado de dispersión de la medida Karl Pearson, 1857
estadística utilizada. Fundador de la bioestadística

Es una función matemática que describe el comportamiento de una


variable expresados en dados de valores con otras variables de valores.
Escala de interpretación
r de Pearson
Correlación
negativa No hay
perfecta Correlación
correlación positiva
negativa perfecta
moderada positiva
negativa negativa positiva moderada
alta positiva
débil débil alta

-1 -0.5 0 0.5 1

Convención entre los investigadores


M. G. Kendall y A. Stuart, 1961.
Coeficiente de Pearson

Se determina con los valores límites

-1 Es una relación negativa perfecta


No hay correlación alguna, no hay vinculo entre x - y

𝒓 0 No hay ninguna relación


Se encuentra un dato y el valor del otro como efecto

1 Es una relación positiva perfecta


Hay correlación alguna, hay vinculo entre x - y
Aclaración
Una relación causal entre dos eventos, si la ocurrencia del primero
causa efecto en el otro. El primer suceso se llamado causa y el
segundo se llama efecto.
Hay una función matemática que las une Y = 2x

Una correlación entre dos variables no implica causalidad.


No depende de un modelo matemático Y = 2x

Regresión lineal, parte de una ecuación (modelo matemático). Permite predecir


el valor de una variable a partir de la otra variable.

Fórmula r: Coeficiente de correlación de Pearson.

𝐶𝑜𝑣(𝑥,𝑦) 𝑛 𝑥𝑦− 𝑥 𝑦 Cov(x,y): covarianza entre x e y


r= =
𝑆𝑥 𝑆𝑦 𝑛 𝑥 2 −( 𝑥)2 ∗ 𝑛 𝑦2− 𝑦2 𝑺𝒙 : Desviación estándar de x
𝑺𝒚 : Desviación estándar de y
En donde:
𝑛 𝑥𝑦− 𝑥 𝑦
r=
𝑛 𝑥 2 −( 𝑥)2 ∗ 𝑛 𝑦 2 −( 𝑦)2

r= Regresión
𝑛 𝑥𝑦 = Se multiplica el número de datos con la sumatoria de XY
𝑥 𝑦= Se multiplica la sumatoria de X con la sumatoria de Y
Se calcula la raíz cuadrada a:
𝑛 𝑥2 = Se multiplica el número de datos con la sumatoria de 𝒙𝟐
( 𝑥)2 = La sumatoria de X se eleva al cuadrado

* 𝑛 𝑦2 = Se multiplica el número de datos con la sumatoria de 𝒚𝟐


( 𝑦)2 = La sumatoria de y se eleva al cuadrado
Forma de interpretar el coeficiente de correlación, r:

-1.00 = Correlación negativa perfecta


-0.90 = Correlación negativa muy fuerte
-0.75 = Correlación negativa considerable
-0.50 = Correlación negativa media
-0.25 = Correlación negativa débil

0.00 = No existe correlación alguna entre las variables.

0.10 = Correlación positiva muy débil


o.25 = Correlación positiva débil
0.50 = Correlación positiva media
0.75 = Correlación positiva considerable
0.90 = Correlación positiva muy fuerte
1.00 = Correlación positiva perfecta.
Para analizar los datos
Elementos: Indica las características de la relación con los datos
Cercanía de los datos en
Fuerza el diagrama de dispersión.
Correlación
Sentido Es: + ó -

Forma Coeficiente de Pearson


Importancia del diagrama de dispersión

Análisis de datos Establecer la relación


de una variable y otra
Estudios científicos

Estudios demográficos Para facilitar estudios


Estudios especializados
Procesos para el análisis
a) Presentación gráfico
6
Se visualizan los datos y permite representar de manera 4
accesible un conjunto de información compleja. 2

0
12 17 22

Diagramas de dispersión

b) Cálculo del coeficiente de correlación


Indica cuán asociadas se encuentran dos variables entre sí

Se obtiene a través de formulas algebraicas.


Diagramas de dispersión

¿CÓMO SE INTERPRETA? r≤1


y
Correlación positiva: r = 0.9
1 A un crecimiento de X (causa) corresponde un crecimiento
de Y (efecto). Controlando la evolución de los valores de X,
quedan controlados los valores de Y.

Correlación positiva débil:


x
r = 0.6
A un crecimiento de X se observa una tendencia a crecer
de Y, pero se presume que existen otras causas de
dependencia.
2
¿Qué diferencia tiene la organización de los puntos en
los cuadrantes?
Negativa

r ≥ −1
Correlación negativa: r = -0.9
3
A un crecimiento de X se observa una tendencia a disminuir
de Y.

Correlación negativa débil:


r = -0.7
A un crecimiento de X se observa una tendencia a
4 disminuir de Y, pero se presume que existen otras causas
de dependencia.
No existe una correlación
r=0

Correlación Compleja
6
Relación no lineal
𝐂ó𝐦𝐨 𝐬𝐞 𝐨𝐛𝐭𝐢𝐞𝐧𝐞 𝐥𝐚 "𝒓"
Un profesional de TS, estudia el tiempo de conectividad a internet al día con la
edad a un grupo de niño de una localidad. Los datos se presentan a continuación:

Var. 1 Var. 2 Si N= 10
Estudiante Edad Hr. Internet
1 15 2 Si N; V1 ≠ V2
2 14 1
3 17 3 Estaría incurrido error en el análisis.
4 16 4
5 15 3
6 16 4
7 15 3
8 13 1 Prueba de hipótesis que se aplica en las tesis de variable
correlacional
9 17 4
10 16 3
Aplicación de el Coeficiente “r” de Pearson (grado de correlación)
y
Var. 1 Var. 2
4.5 Nube de puntos
Edad Hr. Internet 4
3.5
13 1
14 1
3
2.5
Línea del mejor ajuste o “r”.
15 2 2

15 3 1.5
1
15 3
0.5
16 3 0
16 7 12 13 14 15 16 17 18

17 3 x
17 4

x Variable I Variable independiente Variable de interés

y Variable II Variable dependiente Variable explicada

R/ Con el diagrama de dispersión se evidencia que existe relación entre las


variables edad y las horas conectadas con internet al día.
Ejercicio
Elaborar un diagrama de dispersión con los siguientes datos:
a) b)
X Y X Y
48 200 61 50
50 163 61 85
53 174 66 40
59 171 67 95
64 183 73 35
95 134 80 62
145 114 75 96
166 125 76 40
70 75
72 55
78 99
55 68
78 70

También podría gustarte