Está en la página 1de 52

Técnicas e

Programa de Investigación
Instrumentos para
Formativa
la Investigación
Técnicas e
Instrumentos para
la Investigación

SESIÓN 07:

Diagrama de dispersión y
Coeficiente de correlación lineal de Pearson.
Modelo de regresión lineal simple.
Coeficiente de determinación.
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

RESULTADO DE
CONTENIDOS/TEMÁTICA EVIDENCIAS DE APRENDIZAJE
APRENDIZAJE

Aplica y describe en los


informes parciales los
fundamentos de investigación,
operacionalización de
variables, técnicas e Diagrama de dispersión y Avance parcial del informe
estadístico (INV): Recopilación de
instrumentos de recolección Coeficiente de correlación lineal de
datos estadísticos para la
de datos, Población, muestra Pearson. elaboración del diagrama de
y muestreo, procesamiento de Modelo de regresión lineal simple. dispersión y su coeficiente de
datos, tablas, figuras y Coeficiente de determinación). correlación lineal.
medidas estadísticas y
presenta el segundo avance
del informe estadístico.
 
Técnicas e
Programa de Investigación
Instrumentos para
Diagrama de dispersión: Formativa
la Investigación

El diagrama de dispersión es una


gráfica de los valores de dos
variables para todos los casos u
observaciones
Se acostumbra graficar la variable
dependiente sobre el eje vertical y
la variable independiente sobre el
eje horizontal. Un diagrama de
dispersión sirve para determinar
forma de la relación entre las
variables. La gráfica puede alertar
al investigador sobre patrones en
los datos o sobre problemas
potenciales. (Malhotra, 2008 https://www.youtube.com/watch?v=S1DPtadoXSA
pp.543-548)
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Ejemplo diagrama de dispersión


Gráfica de Y (actitud hacia la ciudad) contra X
(tiempo de residencia). Los puntos están
ordenados en una banda que va de la parte
inferior izquierda hacia la parte superior derecha.
El patrón se distingue con facilidad: mientras
una variable aumenta, la otra también lo hace.
Este diagrama de dispersión parece indicar que
la relación entre X e Y es lineal, y que bien
podría describirse con una línea recta.
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

La técnica más utilizada para ajustar una línea


recta en un diagrama de dispersión es el
procedimiento de los mínimos cuadrados. Esta
técnica determina la mejor línea al disminuir lo
más posible el cuadrado de las distancias
verticales de todos los puntos a partir de la línea. e
A la línea con mejor ajuste se le denomina
línea de regresión. Cualquier punto que no caiga
en la línea regresión no estará completamente
explicado. La distancia vertical desde el punto
hasta la línea es el error. Las distancias de todos
los puntos a partir de la línea se elevan al
cuadrado y se suman para obtener la suma de los
errores cuadrados, que es una medida del error
total.
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Modelo de regresión lineal simple


En el modelo de regresión bivariada, la forma general de una línea recta es:

Y=β0 + β1 X + e
Donde:

Y = variable dependiente o de criterio

X = variable independiente o predictiva

β0 = intersección de la línea

β1 = pendiente de la línea

e = Error de estimación
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Estimación de parámetros
En mayoría de los casos b0 y b1 no se conocen y se estiman a
partir de las observaciones de las muestras, por medio de la
ecuación:
^ =𝑎+𝑏 𝑋
𝑌 𝑖 𝑖

donde es el valor estimado o predicho de Yi , y a y b son


estimadores de b0 y b1, respectivamente.
A la constante b generalmente se le denomina coeficiente de
regresión no estandarizado; es la pendiente de la línea de regresión
e indica el cambio esperado en Y cuando X se modifica en una
unidad. Las fórmulas para calcular a y b son sencillas.
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Método de los mínimos cuadrados

Consiste en hallar los valores de a y b , haciendo mínima la suma de los


cuadrados de los errores. Siendo la tarea principal en el análisis de regresión
lineal simple.

Hallaremos la Suma Cruzada de X, Y con la siguiente formula:

( ∑ 𝑿𝒊)( ∑ 𝒀𝒊)
𝑺 𝑪 𝒙𝒚 =∑ 𝑿 𝒊 𝒀 𝒊 −
𝒏

Luego, la Suma de Cuadrados de X


de la siguiente manera: 𝑆𝐶 𝑥=∑ 𝑋 −¿¿ 2
𝑖
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Con las formulas anteriores, obtenemos la pendiente b, haciendo la siguiente
división:
𝑺 𝑪 𝒙𝒚
𝒃=
𝑺 𝑪𝒙 ¿ ¿
Luego, la intersección, a, se puede calcular por medio de: 𝒂=𝒀 −𝒃 𝑿
donde:
¿
𝑋=
∑ 𝑋𝑖 ¿ ∑ 𝑌𝑖
,𝑌=
𝑛 𝑛
Así obtenemos ecuación estimada de regresión:

Variable dependiente o
Variable independiente o
de criterio
predictiva
^ =𝒂+𝒃 𝑿
𝒀 𝒊 𝒊
Intersección de la Pendiente de la línea
línea
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Error Estándar

Cuando se realiza una predicción, es importante determinar el error estándar, el cual


se representa por Sy.x y mide la dispersión de los datos observados con respecto a
la línea de regresión.

√ ∑ 𝒚 − 𝜷𝟎 ∑ 𝒚 − 𝜷𝟏 ∑ 𝒙𝒚
𝟐

𝑺𝒚 .𝒙=
𝒏−𝟐
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Coeficiente de correlación lineal de Pearson

Cuando los datos se distribuyen con una distribución normal.


El coeficiente de correlación se expresa como:

𝑺 𝑪 𝒙𝒚
𝑹=
√𝑺 𝑪 𝒙 𝑺 𝑪 𝒚
𝑆 𝐶 𝑥𝑦 =∑ 𝑋 𝑖 𝑌 𝑖 −
(∑ 𝑋𝑖)( ∑ 𝑌𝑖)
𝑛 𝑆𝐶 𝑥=∑ 𝑋 −¿¿ 2
𝑖 𝑆𝐶 𝑦 =∑ 𝑌 −¿¿2
𝑖
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Grado de correlación
Los datos se muestran como un conjunto de puntos, cada uno con el valor de
una variable que determina la posición en el eje horizontal (x) y el valor de la otra
variable determinado por la posición en el eje vertical (y)
Correlación positiva fuerte: A un crecimiento
Correlación negativa fuerte: A un
de X (causa) corresponde un crecimiento de
crecimiento de X se observa una
Y(efecto). Controlando la evolución de los
tendencia a disminuir de Y.
valores de X, quedan controlados los
valores de Y. Correlación negativa moderada: A un
Correlación positiva débil: A un crecimiento crecimiento de X se observa una
de X se observa una tendencia a crecer de tendencia a disminuir de Y, pero se
Y, pero se presume que existen muchas presume que existen otras causas de
otras causas de dependencia. dependencia.
Correlación negativa débil: A un
Correlación nula: no existe relación lineal
crecimiento de X se observa una
ninguna, las variables X e Y no se
tendencia a disminuir de Y, pero se
relacionan.
presume que existen muchas otras
causas de dependencia.
Técnicas e
Programa de Investigación
Instrumentos para
Correlación Lineal - Tendencias Formativa
la Investigación
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Coeficiente de determinación

La fuerza de la asociación se mide con el coeficiente de determinación, R2 , el


cual varía entre 0 y 1, e indica la proporción de la variación total en Y que se
explica por la variación en X.
El coeficiente de determinación o bondad de ajuste mide cuanta varianza explica
un modelo cualquiera; en el caso de tener un modelo lineal; el coeficiente de
determinación coincide con el cuadrado del coeficiente de Pearson.

100 (%)
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Caso de aplicación:

Un investigador desea explicar las actitudes hacia la ciudad de residencia de


los participantes, en términos del tiempo que han vivido en dicha ciudad. La
actitud se mide en una escala de 11 puntos (1 = no le gusta la ciudad, 11 =
le gusta mucho la ciudad), en tanto que el tiempo de residencia en la ciudad
se mide en años. De una muestra de 12 participantes se obtuvieron los datos
la tabla siguiente. Por razones ilustrativas, sólo tomamos en cuenta un
pequeño número de observaciones. En la práctica real, la correlación y la
regresión se deben realizar con una muestra mucho más grande.
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Explicación de la actitud hacia la ciudad de residencia

Número de Tiempo de Actitud hacia la


participante residencia (X) ciudad (Y)
1 10 6
2 12 9
3 12 8
4 4 3
5 12 10
6 6 4
7 8 5
8 2 2
9 18 11
10 9 9
11 17 10
12 2 2
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Gráfico de dispersión:
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Explicación de la actitud hacia la ciudad de residencia

Tiempo de
Número de Actitud hacia
residencia X.Y X2 Y2
participante la ciudad (Y)
(X)
1 10 6 60 100 36
2 12 9 108 144 81
3 12 8 96 144 64
4 4 3 12 16 9
5 12 10 120 144 100
6 6 4 24 36 16
7 8 5 40 64 25
8 2 2 4 4 4
9 18 11 198 324 121
10 9 9 81 81 81
11 17 10 170 289 100
12 2 2 4 4 4
Totales 112 79 917 1350 641
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Calculando los coeficientes la suma de cuadrados y los coeficientes a y b

𝒃=
𝑆𝐶 𝑥𝑦
=𝟎 . 𝟓𝟖𝟗𝟕 ∑ 𝑋 𝑖 =9.33 𝑌=
∑ 𝑌 𝑖 =6.58
𝑆𝐶 𝑥 𝑋= 𝑛
𝑛

𝒂=𝑌 − 𝛽1 𝑋 =6.58 −0.5877 ×9.33=𝟏 . 𝟎𝟕𝟗𝟑

^ =𝒂+𝒃 𝑿
𝒀 ^ =1.0793 + 0.5897 𝑋
𝑌
𝒊 𝒊 𝑖 𝑖

Ecuación de regresión estimada


Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Calculando el error estándar

√ ∑ 𝒚 −𝒂 ∑ 𝒚 −𝒃∑ 𝒙𝒚
𝟐

𝑺𝒚 .𝒙=
𝒏−𝟐
Desviación
estándar

𝑆𝑦 . 𝑥=
√641 −1.0793 ( 79 ) − 0.5897(917)
12 −2
=𝟏 .𝟐𝟐𝟑
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Calculando el coeficiente de correlación lineal de Pearson

𝑆 𝐶 𝑥𝑦
𝑅= -

√ 𝑆𝐶𝑥 𝑆𝐶 𝑦
179.67
𝑅= =0.9361
√304.67 ×120.92
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Calculando el coeficiente de determinación

100 (%)

100 (%)

100 (%)

%
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Calculando en Excel por el gráfico de dispersión

Ir a insertar, elegir
gráfico de
dispersión
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Seleccionar los
rangos de la
variable (x) , (y)
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Elegir en diseño
rápido la opción
“diseño 9”
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

12
f(x) = 0.589715536105033 x + 1.07932166301969 Obtenemos el
10
R² = 0.876241692517196 modelo de
regresión lineal y
8 el coeficiente de
determinación
Axis Title

0
0 2 4 6 8 10 12 14 16 18 20
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Calculando en Excel por análisis de datos

Elegimos la opción
análisis de datos

En el menú
escogemos
regresión
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Elegimos los
rangos Y , X
podemos colocar
rótulos para titular
nuestros
resultados.

Elegimos el rango
de salida donde
saldrán los
resultados y
aceptamos.
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Comparando resultados Coeficiente de


correlación de
Pearson
Resumen
Coeficiente de
Estadísticas de la regresión determinación
Coeficiente de correlación múltiple 0.93607782
Coeficiente de determinación R^2 0.87624169
R^2 ajustado 0.86386586
Error típico 1.22329236 Error estándar
Observaciones 12

ANÁLISIS DE VARIANZA
Total de la muestra
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 105.952225 105.952225 70.8026564 7.5452E-06
Residuos 10 14.964442 1.4964442
Total 11 120.916667

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0%Superior 95.0%
Intercepción 1.07932166 0.74335121 1.45196731 0.17715225 -0.57696806 2.73561138 -0.57696806 2.73561138
Tiempo de residencia (X) 0.58971554 0.07008382 8.41443144 7.5452E-06 0.43355904 0.74587203 0.43355904 0.74587203

𝒃 𝒂
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Regresión en SPSS versión 26

Trasladamos los Editamos nombre y


datos del Excel etiqueta, decimales
(control c; control v)

Editamos y
rotulamos en vista
de variables
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Elegimos
regresión/lineales

Elegimos variable
dependiente e
independiente
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Escogemos
estimaciones y
ajuste del modelo/
continuar
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Elegimos la variable
dependiente
(DEPENDENT) y
ajuste de la variable
predictora
(*ADJPRED)
Técnicas e
Programa de Investigación
Comparando resultados Formativa
Instrumentos para
la Investigación
Coeficiente de
correlación de
Pearson

Error estándar

Coeficiente de
determinación

𝒃 𝒂
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Gráfico de dispersión
12
También nos
10
muestra el grafico
Actitud hacia la ciudad

8 de dispersión
6

0
0 2 4 6 8 10 12 14

Regresión Valor pronosticado ajustado (Pulsar)


Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Análisis de correlación de Person

Elegimos
correlacionar /
bivariadas
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Elegimos las
variables
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Correlación de
Pearson para
variables
paramétricas

Correlación
significativa,
(P<0.05) evidencia
estadística para
rechazar H0
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

Ejercicios para practicar

1. Los datos de la producción de trigo en toneladas (X) y el precio del kilo de harina en
soles (Y) en la década de los 80 en Lima fueron:

Producción de trigo (X) 30 28 32 25 25 25 22 24 35 40


Precio de la harina (Y) 25 30 27 40 42 40 50 45 30 25

Ajusta la recta de regresión por el método de mínimos cuadrados.


Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

2. Los gastos semanales de publicidad y las ventas de una empresa en dólares, para una muestra
de 10 semanas son:

Gastos sem 41 54 63 54 48 46 62 61 64 71
x public

Ventas 1250 1380 1425 1425 1450 1300 1400 1510 1575 1650
seman

a) Establezca la recta de regresión que permita predecir las ventas semanales en


función de los gastos de publicidad
b) Calcular el grado de relación entre las 2 variables
c) Interpreta la pendiente
d) Pronostica las ventas para gastos semanales de 50 y 60 dólares
e) Cuales son los errores de estimación cuando predice las ventas semanales para
gastos de publicidad de 61, 62 y 63 dólares respectivamente
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

3. En un estudio, por medio de detectores radioactivos, de la capacidad corporal para


absorber hierro y plomo, participaron diez sujetos. A cada uno se le da una dosis oral
idéntica de hierro (sulfato ferroso) y de plomo (cloruro de plomo-203). Después de doce
días se mide la cantidad de cada componente retenida en el sistema corporal y, a partir de
éstas, se determinan los porcentajes absorbidos por el cuerpo. Los datos obtenidos
fueron:

Hierro (%) X 17 22 35 43 80 85 91 92 96 100


Plomo (%) Y 8 17 18 25 58 59 41 30 43 58

a) Dibuja la nube de puntos. Basándose en ella, ¿se puede esperar que el


coeficiente de correlación esté próximo a 1, -1 ó 0?.
b) Halla e interpreta el coeficiente de determinación.
c) Estima la recta de regresión y utilízala para predecir el porcentaje de hierro
absorbido por un individuo cuyo sistema corporal absorbe el 15% del plomo
ingerido.
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

4. Las calificaciones de un examen y el numero de horas de estudio para el examen,


de una muestra de 12 estudiantes, se presenta en el siguiente cuadro:

Tiempo de 3 3 3 4 4 5 5 5 6 6 7 8
estudio

Calificación 9 1 11 12 15 14 16 15 18 16 15 17
2

Hallar la recta de regresión


Interpreta la pendiente
Estimar la calificación cuando el tiempo de estudio es 10
Estimar el tiempo de estudio cuando la calificación es 8
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

5. En la siguiente tabla , donde :Y = Peso, x= Altura

a) Realice un diagrama de dispersión e indique ¿Sugiere la gráfica una asociación lineal?


b) Realice la ecuación de regresión
c) Interprete la pendiente, realice un pronóstico
d) Calcule e interprete el coeficiente de correlación
e) Calcule e interprete el coeficiente de determinación
f) Calcular e interpretar el error estándar de estimación
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

6. La materia prima que se usa en la elaboración de una fibra sintética se almacena en un local que no
tiene control de humedad. Las mediciones de la humedad relativa en el local y del contenido de humedad
de una muestra de la materia prima (ambos en porcentajes) durante 12 días, dieron los
siguientes resultados.
Contenido
de
a)Realice un diagrama de dispersión e indique Humedad humedad
¿Sugiere la gráfica una asociación lineal? (X) (Y)
b)Realice la ecuación de regresión 42 12
35 8
c)Interprete la pendiente, realice un pronóstico 50 14
d)Calcule e interprete el coeficiente de correlación 43 9
e)Calcule e interprete el coeficiente de determinación 48 11
62 16
f)Calcular e interpretar el error estándar de estimación
31 7
36 9
44 12
39 10
55 13
48 11
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

7. El siguiente conjunto de datos se ha tomado sobre grupos de trabajadoras de. Cada grupo está
formado por trabajadores de la misma profesión, en cada uno de los veinticuatro grupos muestreados se
han observado dos variables: el índice de estandarizado de consumo de cigarrillos (x) y el índice de
muertes por cáncer de pulmón (Y) variable dependiente. Se desea estudiar la relación entre estas dos
variables.

1. Realice un diagrama de dispersión e indique ¿Sugiere la gráfica una


asociación lineal?
2. Realice la ecuación de regresión
3. Interprete la pendiente, realice un pronóstico
4. Calcule e interprete el coeficiente de correlación
5. Calcule e interprete el coeficiente de determinación
6. Calcular e interpretar el error estándar de estimación
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

8. El director de una escuela está interesado en relacionar dos variables en los estudiantes y
ha tomado como información los resultados de la prueba de habilidad y del puntaje obtenido
en el examen de admisión, los cuales se muestran a continuación

a) Realice un diagrama de dispersión e interprete los Examen


resultados Prueba de de
Habilidad admisión
b) Realice la ecuación de regresión e interprete la mental X Y
pendiente. 5 15
c) Calcule e interprete el error estándar de estimación 10 19
d) Calcule e interprete el coeficiente de determinación 15 25
e) Si el puntaje de la prueba de habilidad es de 50 20 29
puntos, cual es el pronóstico en el examen de 23 32
admisión 25 34
30 39
32 42
35 46
40 50
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

9. Una cadena de restaurantes de comida rápida decide llevar a cabo un experimento para
medir la influencia sobre las ventas del gasto en publicidad. En 8 regiones del país, se
realizaron diferentes variaciones relativas en el gasto en publicidad, comparado con el año
anterior, y se observaron las variaciones en los niveles de ventas resultantes. La tabla
adjunta muestra los resultados.

a) Realice un diagrama de dispersión e interprete los resultados


b) Realice la ecuación de regresión e interprete la pendiente.
c) Calcule e interprete el error estándar de estimación
d) Calcule e interprete el coeficiente de determinación
e) Realice un pronóstico si el gasto de publicidad incrementa en un 5% y en
15%
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

10. Una compañía de seguros considera que el número de vehículos (y) que circulan por
una determinada autopista a más de 120 km/h , puede ponerse en función del número de
accidentes (x) que ocurren en ella. Durante 7 días obtuvo los siguientes resultados:

Accidentes xi 5 7 5 3 2 1 9
Vehículos yi 15 18 13 11 10 8 20

a) Realice un diagrama de dispersión e interprete los resultados


b) Realice la ecuación de regresión e interprete la pendiente.
c) Calcule e interprete el error estándar de estimación
d) Calcule e interprete el coeficiente de determinación
e) Realice un pronóstico si la cantidad de accidentes es de 4 y 6
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

REFERENCIAS

Malhotra, Narest, (2008) Investigación de mercados. Quinta edición. Editorial Pearson


Educatíón, México ISBN: 978-970-26-1185-1 Área: Administración y economía
Moore David. (1997) Estadística aplicada básica. Segunda edición. Antoni Bosch Editor
Lind, A., Marchal, G. y Wathen, A. (2012) . Estadística aplicada a los negocios y la
economía. (15. Ed). México: McGraw-Hill Interamericana Editores
Pagano, R. (2011). Estadística para ciencias del comportamiento. (9. Ed). México: Cengage
Learning Editores Corporativo Santa Fe
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación

No saber es una excusa que tiene una


solución muy simple: Aprender
Luis Medina

GRACIAS POR SU ATENCIÓN


Técnicas e
Instrumentos para
la Investigación

También podría gustarte