Está en la página 1de 16

lOMoARcPSD|6168081

Yuri Ospina Tarea 4 - actividad estadistica descriptiva paso 4

estadística descriptiva (Universidad Nacional Abierta y a Distancia)

StuDocu no está patrocinado ni avalado por ningún colegio o universidad.


Descargado por Bayron Prada Guerrero (pradabayron48@gmail.com)
lOMoARcPSD|6168081

PASO 4 - DESCRIPCIÓN DE LA INFORMACIÓN

ESTUDIANTE:
YURI MARCELA OSPINA
PEDRAZA C.C 1112790352

GRUPO:
204040_51

TUTOR:
JUAN DAVID MEJIA
ESTADISTICA DESCRIPTIVA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD


ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES - ECSAH
CARRERA PSICOLOGIA

Descargado por Bayron Prada Guerrero (pradabayron48@gmail.com)


INTRODUCCIÓN

Por medio de las técnicas estadísticas bivariantes es posible analizar las características de

dos variables en una muestra o población con el objetivo de determinar las relaciones que

existen entre dichas variables, dependiendo de las características de las variables es posible

determinar cuál es la herramienta estadística más precisa para el análisis.

En este trabajo se presentará la conceptualización de las medidas estadísticas bivariantes y

se realizarán ejercicios prácticos para su aplicación.

JUSTIFICACIÓN

La importancia de las medidas estadísticas bivariantes radica en que su aplicación puede

ayudar a entender fenómenos de la vida cotidiana y la relación de diferentes variables que

se afectan en los contextos reales. Por ejemplo:

“El análisis de regresión lineal múltiple, a diferencia del simple, se aproxima más a

situaciones de análisis real puesto que los fenómenos, hechos y procesos sociales, por

definición, son complejos y, en consecuencia, deben ser explicados en la medida de lo

posible por la serie de variables que, directa e indirectamente, participan en su concreción.”

(Rodríguez Jaume, 2001)


OBJETIVOS

OBJETIVO GENERAL

Conceptualizar y aplicar los conceptos de medidas estadísticas bivariantes.

OBJETIVOS ESPECIFICOS

 Realizar un mapa mental con los conceptos de medias estadísticas bivariantes.


 Definir los conceptos dados en la guía de actividades.
 Desarrollar el laboratorio para aplicar los conceptos vistos y elegir algunas
variables para analizar.
lOMoARcPSD|6168081

MAPA MENTAL (Zoom para ver mejor)

Descargado por Bayron Prada Guerrero (pradabayron48@gmail.com)


lOMoARcPSD|6168081

DEFINICIÓN DE CONCEPTOS

Diagrama de dispersión.
Este diagrama se emplea en la estadística y es conocido también como la gráfica de
dispersión o gráfico de burbujas, este diagrama se usa para mostrar los valores dados para
dos variables después de realizar los análisis de correlación y regresión.

Correlación lineal simple.


Es el grado de relación que hay entre dos variables, en donde una variable es dependiente y
la otra independiente y los cambios que se den en la variable independiente afectarán a la
variable dependiente.
Coeficiente de determinación R2
Este coeficiente determina el porcentaje de la información que fue levantada por medio de
un modelo de regresión y entonces se trata de definir cuales fueron las variaciones de la
variable dependiente. La formula empleada es la siguiente:

Descargado por Bayron Prada Guerrero (pradabayron48@gmail.com)


lOMoARcPSD|6168081

Correlación positiva y correlación negativa

Existe la correlación lineal positiva y la correlación lineal negativa.


En la correlación lineal positiva la variable independiente puede tomar valor negativo o
positivos y la variable dependiente toman los mismos valores.
En la correlación lineal negativa la variable independiente puede tomar un valor negativo o
positivo y la variable dependiente toma el valor opuesto.

¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?


El coeficiente de correlación lineal es una medida de regresión, también se le conoce como
el coeficiente de Pearson y permite medir o confirmar la relación entre las variables que
están siendo estudiadas. Su fórmula es la siguiente:

Tenemos entonces que puede existir la correlación perfecta negativa, la correlación perfecta
positiva o que no exista correlación entre las variables.

Descargado por Bayron Prada Guerrero (pradabayron48@gmail.com)


lOMoARcPSD|6168081

DESARROLLO DE LABORATORIO

Actividad 3. Realizar el laboratorio de regresión y correlación lineal

a. Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas.

Variables elegidas:

Usuarios Transporte de pasajeros

Fallecidos

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo


de relación entre las variables.

Dispersión
Usuarios Transporte de Pasajeros

25

20

15

10 f(x) = − 0.02 x + 9.74


R² = 0.61
5
0
0 100 200 300 400 500 600
Fallecidos

El coeficiente de correlación que tenemos como resultado, indica que existe una relación
positiva entre ambas variables.

c. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Coeficientes regresión
b1 0,07052961
5,45323774
b0 9

Descargado por Bayron Prada Guerrero (pradabayron48@gmail.com)


El modelo es: y = 0,0705x + 5,4532. no es confiable dado que, para el ejercicio,
obtenemos un coeficiente de correlación del 40% el cual no es un valor aceptable para
poder decir que la variable dependiente se explica a partir de la variable independiente.

d. Determine el grado de correlación de las dos variables.

Coeficiente de correlación 0,69602148


Coeficiente de determinación 0,4844459

e. Relacionar la información obtenida con el problema.

El coeficiente de determinación coincide con la conclusión del coeficiente de Pearson,


existe una relación positiva no tan fuerte. Cabe señalar que existe un dato atípico que
distorsiona el modelo, al removerlo podemos tener una correlación del 100%.

f. Establezca al menos 3 nuevos valores independientes para ser hallados a través


del modelo matemático calculado.

Fallecidos Usuarios
120 13,91679098
70 10,39031047
99 12,43566916

Actividad 4. Regresión y correlación múltiple.

a. Identificar una variable cuantitativa dependiente y varias variables


cuantitativas independientes del estudio de investigación.
Variables elegidas:
Fallecidos enero – febrero 2019
Tasa fallecidos 2019
Lesionados enero – febrero 2019
b. Realizar el
Fallecidos ene- feb 2019 diagrama de
400 dispersión de
350
300 dichas
250
200 variables.
150
100
50

f(x) = 0.07 x + 35.24


0 −
0 R² = 01.0305 200 300 400 500 600 700 800

Tasa fallecidos 2019


0.03

0.02

0.02

0.01

0.01
0 R²f(x) = 0x+0
= 0.18
0 100 200 300 400 500 600 700 800

Lesionados ene - feb 2019
250

200

150

100

50
0 f(x) = 0.01 x + 3.23
0 R²
− = 01.020 200 300 400 500 600 700 800
lOMoARcPSD|6168081

c. Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación.

Resumen

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,98
Coeficiente de determinación R^2 0,97
R^2 ajustado 0,97
Error típico 35127,78
Observaciones 249,00

ANÁLISIS DE VARIANZA
Valor crítico de
Grados de libertad Suma de cuadrados Promedio de los cuadrados F F
Regresión 3,00 9426921507068,34 3142307169022,78 2546,52 0,00
Residuos 245,00 302320499438,47 1233961222,20
Total 248,00 9729242006506,81

Error Probabilida Inferior Superior Inferior Superior


Coeficientes típico Estadístico t d 95% 95% 95,0% 95,0%
Intercepción 17919,29 4114,25 4,36 0,00 9815,47 26023,11 9815,47 26023,11
Variable X 1 195,76 111,24 1,76 0,08 -23,36 414,87 -23,36 414,87
Variable X 2 -2335604,74 587416,01 -3,98 0,00 -3492634,49 -1178575,00 -3492634,49 -1178575,00
Variable X 3 12210,43 193,47 63,11 0,00 11829,36 12591,50 11829,36 12591,50
Descargado por Bayron Prada Guerrero (pradabayron48@gmail.com)
lOMoARcPSD|6168081

d. Relacionar la información obtenida con el problema.

Hemos hallado un modelo múltiple que explica con un alto grado de precisión la relación
entre las variables. Individualmente, la segunda variable es la que menos se relaciona con la
variable dependiente escogida.

Descargado por Bayron Prada Guerrero (pradabayron48@gmail.com)


CONCLUSIONES

1. Regresión Lineal

A partir de los resultados podemos concluir que el método de regresión lineal simple sirve

para formular modelos que ayuden a explicar una variable a partir de la otra, es decir, que a

partir del valor de una variable podamos calcular el valor de otra. Lo anterior tendrá validez

en la medida en que el coeficiente de correlación sea lo suficientemente confiable, es decir,

tenga un valor cercano a 1.

2. Regresión Lineal Múltiple

A partir de los resultados del ejercicio, podemos concluir que el método de regresión lineal

múltiple es válido y útil en los casos en que una variable se relaciona con más de una

variable independiente, por lo que formularemos un modelo que nos permita, a partir de los

valores de las variables independientes, predecir el valor de la variable dependiente.


REFERENCIAS BIBLIOGRÁFICAS

Regresión y correlación lineal. (s. f.). Recuperado de.

http://www.unadzsurlab.com/ovas_ibague/regresion/pagina6.htm

Ucha, A. P. (2020, 13 febrero). Coeficiente de correlación lineal. Economipedia.

https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html

Rodríguez Jaume, M. J. (2001). Estadística Informática: casos y ejemplos con el SPSS. Recuperado

de: https://rua.ua.es/dspace/bitstream/10045/8143/1/Regresion%20MUTIPLE.pdf

También podría gustarte