Está en la página 1de 6

Actividad 4. Regresión y correlación Lineal Simple.

A partir de la base de datos suministrada: Anexo 1- Pruebas SABER 11 - 160 estudiantes

2020 (16-4), cada estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas e identificar la variable dependiente e independiente.

 Horas dedicadas al internet (independiente X)

 Promedio Academico (dependiente Y)

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación

entre las variables.

Resultados Pruebas Saber de 160 estudiantes Grado 11-


Noviembre (2019), en algunos departamentos de Colombia.
90
80
70
PROMEDIO GENERAL

f(x) = 6.01 x + 43.98


60 R² = 0.28
50
40
30
20
10
0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
HORAS DE DEDICACIÓN A INTERNET

Como se observa en la gráfica, tenemos una correlación lineal positiva


-Determine al coeficiente de determinación y de correlación de las dos variables.

Interprete los resultados

El coeficiente de determinación es:

R2=O , 276∗100 %

R2=27 %

Coeficiente de correlación es:

:√ 0,276=0,52

El coeficiente de determinación es confiable en un 27 % esto quiere decir que es poco

confiable.

- Encuentre el modelo matemático que permite predecir el efecto de una variable

sobre la otra. ¿Es confiable?

Y= a (X) + b

Entonces el modelo matemático que se asocia a las horas dedicadas al internet y

promedio academico es el siguiente:

y=6,0066x + 43,976

R² = 0,276
El modelo matemático según el coeficiente de determinación, en este caso es de 0,276; lo

que significa que este modelo solamente es confiable en un 27 %, lo que es poco confiable.

- Determine el tipo de correlación de las dos variables.

Según el coeficiente de Correlación 0, 52 obtenemos un grado de Correlación lineal

positiva.

- Relacionar la información obtenida con el problema.

Teniendo en cuenta que el estudio se realizó a partir de la base de datos Anexo 1- Pruebas

SABER 11 - 160 estudiantes 2020 (16-4), a partir de las variables (horas dedicadas al

internet y promedio academico), se puede decir que el grado de relación de las variables es

regular,por lo cual, es poco confiable y no se puede obtener información a partir de estas,

ya que estas no tienen una relación directa.

Actividad 5. Regresión y correlación múltiple.

A partir de la base de datos suministrada “Anexo 1- Pruebas SABER


11

- 160 estudiantes 2020 (16-4)”, cada estudiante, deberá:

1. Identificar una variable cuantitativa dependiente y varias


variables cuantitativas independientes del estudio de
investigación.

 Número de libros de consulta (independiente X1)

 Horas de dedicación a la lectura (independiente X2)


 Puntaje en lectura crítica (dependiente Y)

2. Realizar el diagrama de dispersión de dichas variables.


3. Calcular la recta de regresión y el coeficiente de correlación para

probar estadísticamente su relación.

Y =a ( X 1 )+ b ( X 2 )+ c

Y =0 , 48 X 1+ 0,4 2 X 2+ 53 , 49

Y= 53,49

El modelo matemático según el coeficiente de determinación, en este caso es de 0,14; es

decir, solo es confiable en un 14%, es poco confiable.

Según el coeficiente de Correlación 0,37 tenemos un grado de Correlación lineal

mínima, y el grado de relación de las variables es poca.


4. Relacionar la información obtenida con el problema.

Teniendo en cuenta que el estudio se realizó a partir de la base de datos Anexo 1-

Pruebas SABER 11 - 160 estudiantes 2020 (16-4), a partir de la variable cuantitativa

dependiente: ( puntaje en lectura critica) y variables cuantitativas independientes:

(N° de libros de consulta y horas de dedicación a la lectura), se determino que el

grado de relación de las variables es mínima, teniendo en cuenta el coeficiente de

correlación en el cual tenemos un valor de 0,37. y el coeficiente de determinación

es de 0,14 significa que este modelo genera un 14% de confiabilidad, por lo tanto

es poco confiable.

También podría gustarte