Está en la página 1de 45

•Correlación

•Regresión Lineal
Simple
ESTADÍSTICA APLICADA A LA INVESTIGACIÓN
DIAGRAMAS DE
DISPERSION
¿QUÉ ES UN GRAFICO DE DISPERSION?

Se trata de una representación gráfica del grado de


relación entre dos variables cuantitativas.
Es decir entre la variable respuesta(y) y la variable
independiente (x)
DIAGRAMA DE DISPERSION:
Es un tipo de diagrama matemático
que utiliza las coordenadas
cartesianas para mostrar los valores
de dos variables para un conjunto de
datos.
Los datos se muestran como un
conjunto de puntos, cada uno con el
valor de una variable que determina
la posición en el eje horizontal y el
valor de la otra variable determinado
por la posición en el eje vertical.
NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN.

1°Correlación directa o positiva

La recta correspondiente a la nube de puntos de


la distribución es una recta creciente.
2º Correlación inversa 3º Correlación nula
o negativa

En este caso se dice que las


La recta correspondiente a la
variables son encorraladas y la
nube de puntos de la distribución es
nube de puntos tiene una forma
una recta decreciente.
redondeada.
LINEA DE TENDENCIA

Según sea la dispersión de


los datos (nube de puntos)
en el plano cartesiano,
pueden darse alguna de las
siguientes relaciones, Lineal,
Logarítmica, Exponencial,
Cuadrática, entre otras.
Modelos de diagrama de
dispersión
COEFICIENTE DE CORRELACIÓN

Es el estudio de relación que


existe entre las variables
dependientes e
independientes.
COEFICIENTE DE
CORRELACIÓN

El Coeficiente de Correlación (r):


requiere variables medidas en escala de intervalos o de
proporción, que Varía entre -1 y 1.
• Valores de -1 ó 1 indican correlación perfecta.
• Valor igual a 0 indica ausencia de correlación.
• Valores negativos indican una relación lineal
inversa
• valores positivos indican una relación lineal
directa
EJEMPLOS DE GRAFICAS DE CORRELACIÓN

CORRELACION POSITIVA PERFECTA CORRELACIÓN NEGATIVA PERFECTA


10 10
9 9, 9 9
8 8
7 7
6 6
5 5
4 4
3 3
2 2
1 1
0 0
0 2 4 6 8 10 0 2 4 6 8 10 12

CORRELACIÓN NULA
10
9
8
7
6
5
4
3
2
1
0
0 2 4 6 8 10
Escalas de correlación
Valor del Coeficiente de Grado de Correlación entre las
Pearson variables
Menor de 0,4 Correlación positiva mala

0,4 a 0,69 Correlación positiva regular

0,7 a 1 Correlación positiva buena

-1 a -0.7 Correlación negativa buena

-0.69 a -0,4 Correlación negativa regular

Mayor de -0,4 Correlación negativa mala


FORMULA QUE NOS PERMITEN HALLAR EL COEFICIENTE DE
CORRELACIÓN “r” DE PEARSON

n = es el número de pares de observaciones.


∑X = es la suma de los valores de la variable X.
∑Y = es la suma de los valores de la variable Y.
(∑X2) = es la suma de los cuadrados de los valores de la variable X.
(∑X)2 = es el cuadrado de la suma de los valores de la variable X.
(∑Y2) = es la suma de los cuadrados de los valores de la variable Y.
(∑Y)2 = es el cuadrado de la suma de los valores de la variable Y.
∑XY = suma de los productos de X y Y.
Prueba de Hipótesis del Coeficiente
de correlación
Prueba de hipótesis del coeficiente de correlación poblacional Rho,
(letra griega) se estima con “r” y responde a la siguiente hipótesis:

H0 :   0 H1 :   0
El estadístico de Contraste es una prueba “t” donde el:

n2
" t calculado "  r
1 r2

Esta prueba se hace con n-2 grados de libertad.


Al interpretar los resultados, se debe evitar extraer conclusiones de
causa-efecto a partir de una correlación significativa.
EJEMPLO

El gerente de ventas de la compañía Copiar Sales of


América empresa que tiene una gran fuerza de ventas en
todo Estados Unidos y Canadá, desea determinar si
existe una relación entre el número de llamadas
telefónicas de ventas hechas en un mes, y la cantidad de
copiadoras vendidas durante ese lapso. El gerente
selecciona al azar una muestra de 10 representantes, y
determina el número de tales llamadas que hizo cada uno
el mes anterior y la cantidad de productos vendidos.
LLAMADAS Y COPIADORAS VENDIDAS POR LOS
10 REPRESENTANTES

REPRESENTANTE NUMERO DE NUMERO DE

COPIADORAS VENDIDAS “Y”


DE VENTAS LLAMADAS “x”
TOM KELLER 20 30
JEFF HALL 40 60
BRIAN VIROST 20 40
GREG FISH 30 60
SUSAN WELLCH 10 30
CARLOS RAMIREZ 10 40
RICH NILES 20 40
MIKE KIEL 0 50
MARK REYNOLDS 20 30
SONI JONES 30 70
TOTAL 220 450
Diagrama de Dispersión
80

70

60
COPIADORAS VENDIDAS

50

40

30

20

10

0
0 5 10 15 20 25 30 35 40 45
LLAMADAS
LLAMADAS A CLIENTES REALIZADAS Y COPIADORAS
VENDIDAS POR LOS 10 VENDEDORES DE LA MUESTRAS

REPRESENTANTE NUMERO DE NUMERO DE

COPIADORAS VENDIDAS X2 Y2 xy
DE VENTAS LLAMADAS
TOM KELLER 20 30 400 900 600

JEFF HALL 40 60 1600 3600 2400

BRIAN VIROST 20 40 400 1600 800

GREG FISH 30 60 900 3600 1800

SUSAN WELLCH 10 30 100 900 300

CARLOS RAMANIREZ 10 40 100 1600 400

RICH NILES 20 40 400 1600 800

MIKE KIEL 20 50 400 2500 1000

MARK REYNOLDS 20 30 400 900 600

SONI JONES 30 70 900 4900 2100

TOTAL 220 450 5600 22100 10800


CALCULA EL COEFICIENTE DE CORRELACIÓN “r”

10(10800 )  220( 450 )


10(5600)  (220) 1022100 - 450 
r
2 2

r = 0.759
interpretación

• El coeficiente de correlación es igual a 0.759


• Es positivo de manera que hay una relación
directa entre el numero de llamadas a
clientes y la cantidad de copiadoras
vendidas
COEFICIENTE DE DETERMINACION 𝑹𝟐

Mide la variación de la variable y explicada en


la variable x.

Es útil porque da la proporción de la varianza


(variación) de una variable que es predecible a
partir de la otra variable.

El coeficiente de determinación es la proporción


de la variación explicada al total variación.
Método de calcularlo

Elevar al cuadrado el coeficiente de


correlación
r = 0.759

R  (0.759)  0.576081  57.6081%


2 2

Interpretación: El 57.61% dela variación en el


número de llamadas se explica por la variación
de número de copiadoras vendidas
REGRESION
LINEAL
DEFINICIÓN

Técnica
estadística

utilizada
ANÁLISIS
DE
REGRESIÓN
LINEAL

Para
estudiar: Relación entre variables
cuantitativas
Ejemplo:

• El precio de venta (VD; Y) depende del precio


de costo de un artículo (VI; X).

• El tiempo de servicios (VD; Y) de un


trabajador depende de su edad (VI; X).

• El consumo familiar (VD; Y) está en función


del ingreso familiar (VI; X).
Clases de regresión lineal:

Clases de regresión
lineal:

Regresión lineal Regresión lineal


simple multiple
Regresión lineal simple:
• Este tipo se presenta cuando una variable independiente
ejerce influencia sobre otra variable dependiente. Ejemplo:
Y = f(x).
• Es una ecuación que define la relación lineal entre dos
variables donde una variable depende de la otra variable. Se
puede decir que Y depende de X.

Y = f(X)
Como Y depende de X, entonces:
Y es la variable dependiente, explicativa o
de predicción .
X es la variable independiente o variable respuesta.
PRINCIPIO DE MINIMOS CUADRADOS

Técnica empleada para


obtener la ecuación de
regresión, minimizando
la suma de los
cuadrados de las
distancias verticales
entre los valores
verdaderos de Y y los
valores pronosticados
de Y.
FORMA GENERAL DE LA ECUACION DE
REGRESIÒN SIMPLE

Y =a+bX

En general, los valores de a y b en la


ecuación de regresión se denominan
coeficientes de regresión estimados,
o también coeficientes de regresión.
Y =a+bX

𝑛 Σ𝑋𝑌 −(Σ𝑋)(Σ𝑌)
b= 𝑛 Σ𝑋 2 −(Σ𝑋)2

Donde:
X es el valor de la variable independiente.
Y es el valor de la variable dependiente.
n es el numero de elementos en la muestra.
Y =a+bX

a: Es la ordenada en el origen o intercepto

b: Es la pendiente de la recta
Interpretación de los coeficientes

Y´=a+bX

a: Es el valor promedio de la variable respuesta


(y) cuando la variable predictora (x) se mantiene
constante.

b: Es el cambio del valor medio de la variable


respuesta (y) por unidad de cambio de (x).
Ejemplo

En la empresa Copiar Sales of América, el gerente de


ventas recopilo información respecto al número de
llamadas telefónicas hechas y la cantidad de
copiadoras vendidas, para una muestra de 10
representantes de ventas. El gerente de esa área, le
gustaría ofrecer información específica referente a la
relación entre el número de llamadas y la cantidad de
productos vendidos. Utilice el método de mínimos
cuadrados para determinar la ecuación lineal.
Representantes de Llamadas Copiadoras XY
ventas de ventas vendidas (Y)
(X)
CINTHIA 20 30 400 900 600

CAROLINA 40 60 1600 3600 2400

JOSE LUIS 20 40 400 1600 800

CARLOS 30 60 900 3600 1800

MILAGROS 10 30 100 900 300

MALENA 10 40 100 1600 400

BRYAN 20 40 400 1600 800

ANGEL 20 50 400 2500 1000

BEATRIZ 20 30 400 900 600

ANTONIO 30 70 900 4900 2100

TOTAL 220 450 5600 22100 10800


Hallando “b”

𝑛 Σ𝑋𝑌 −(Σ𝑋)(Σ𝑌)
b= 𝑛 Σ𝑋 2 −(Σ𝑋)2
10 10800 −(220)(450)
b= 10 5600 −(220)2
108000−99000
b=
56000−48400
9000
b=
7600
b=1.1842
El número de fotocopiadoras vendidas se
incrementará en 1.18 por cada llamada de
venta adicional.
Hallando “a”
Σ𝑌 Σ𝑋
a= -b
𝑛 𝑛
450 220
a= 10 − (1.1842) 10
a=45-(1.1842)22
a=18.9476
:El número promedio de fotocopiadoras
vendidas es 18.95 cuando la cantidad de
llamadas de ventas se mantiene constante.
Por tanto, la ecuación de regresión es:
Y’=a+b(x)
Y’=18.9476+1.1842(X)
70

60 y`=18,9476+1,1842x

50

40
Valores Y
30 Lineal (Valores Y)

20

10

0
0 10 20 30 40 50
De modo que si un vendedor hace 20 llamadas
telefónicas, puede esperarse que venda :

Y’=18.9476+1.1842(X)
Y’=18.9476+1.1842(20)
Y’=42.6316
El error de estándar de estimación
.

ejemplo

El ejemplo que se relaciona con la empresa sales


of América. La gerente de ventas determino que
la ecuación de regresión de mínimos cuadrados
era y’=18.9476+ 1.1842x donde y se refiere al
número de copiadoras vendidas y X a la cantidad
de llamadas telefónicas hechas. Evalué el error
estándar de estimación.
Representantes de Llamadas Copiadoras XY
ventas de ventas vendidas (Y)
(X)

CINTHIA 20 30 400 900 600

CAROLINA 40 60 1600 3600 2400

JOSE LUIS 20 40 400 1600 800

CARLOS 30 60 900 3600 1800

MILAGROS 10 30 100 900 300

MALENA 10 40 100 1600 400

BRYAN 20 40 400 1600 800

ANGEL 20 50 400 2500 1000

BEATRIZ 20 30 400 900 600

ANTONIO 30 70 900 4900 2100

TOTAL 220 450 5600 22100 10800


ERROR ESTANDAR DE ESTIMACION

22100  18.9476( 450 )  1.1842(10800 )


S yx   9.90
10  2
Ingreso A. X.Y
x2 y2 Y^
(x) familiar(y)
Ejemplo 48 24 1152 2304 576 23.6
40 18 720 1600 324 16.6
30 9 270 900 81 7.9
39 14 546 1521 196 15.8

Determinar el 46 22 1012 2116 484 21.9

coeficiente de 42 22 924 1764 484 18.4

correlación, 27 4 108 729 16 5.3

determinación 36 13 468 1296 169 13.1


34 10 340 1156 100 11.4
46 20 920 2116 400 21.9
32 12 384 1024 144 9.6
Modelo de 42 18 756 1764 324 18.4
regresión
Ingreso y 40 16 640 1600 256 16.6
ahorro familiar 32 8 256 1024 64 9.6
de 15 27 6 162 729 36 5.3
trabajadores
561 216 8658 21643 3654 216
GRACIAS

También podría gustarte