Está en la página 1de 14

UNIDAD 3: PASO 4: DESCRIPCION DE LA INFORMACION

PRESENTADO POR:
LUZ EDITH MAMIAN QUINTERO
C.C. 1078756101
CEL. 3124176070

TUTORA:
JAQUELINE MENDEZ
N. GRUPO: 204040_202

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES ECSHAC
PROGRAMA DE PSICOLOGIA
ESTADISTICA DESCRIPTIVA
2019
INTRODUCCION

Este trabajo es realizado a partir de la base de datos “Indicadores socioeconómicos 115


municipios de zonas vulnerables por la pobreza, violencia y ausencia del estado en
Colombia (2019) 16-4. La investigación estadística es una actividad que apela a diversas
técnicas con el propósito de llegar a la esencia de la realidad. La regresión lineal simple y la
regresión lineal múltiple son técnicas de análisis de las variables de una investigación
estadística, en este caso desde la encuesta realizada. Si bien es cierto estas técnicas
mencionadas se pueden utilizar para solucionar problemas comunes en los negocios o para
evaluar el comportamiento de su economía y en general se utiliza con mayor frecuencia en
las ciencias económicas, también es cierto que en muchos casos se requiere conocer más
que el comportamiento de una sola variable para entender una investigación cualquiera sea
su especia. Entonces, sin importar la situación presentada se hace necesario que
practiquemos estas técnicas de regresión por medio de ejercicios salientes de la
cotidianidad, a continuación, veremos pues los resultados de dicha práctica.
La realización de este trabajo es dar a conocer y poner en práctica la regresión y correlación
y medias de dispersión y estadísticas bivariantes sobre la unidad 3 de este curso, además de
los comportamientos que se dan en las variables, como los grados y resultados que se
manejan para los ejemplos que se plantean en el laboratorio propuesto, que es de vital
importancia reconocer y manejar las fórmulas que se obtienen de la herramienta de Excel.
JUSTIFICACION

Partiendo de una base de datos datos “Indicadores socioeconómicos 115 municipios de zonas
vulnerables por la pobreza, violencia y ausencia del estado en Colombia (2019) 16-4. Para
ello, en primer lugar, aplicaremos el proceso de regresión lineal simple para determinar tanto
la naturaleza como la fuerza de una relación entre dos variables y segundo lugar la regresión
lineal múltiple con la cual describiremos la relación entre dos o más variables independientes
y una variable dependiente utilizando la ecuación de regresión múltiple; estas ecuaciones de
estimaciones nos permitirán realizar una interpretación de correlación de la investigación
realizada. El trabajo de laboratorio constituye una de las mejores metodologías para la
aplicación de modelos estadísticos a las variables de los hechos, es por eso que se trabaja en
este sentido y no otro para la práctica de la unidad 3 de regresión y determinación.
OBJETIVOS

Objetivos Generales.

1. Potencializar en el estudiante habilidades y destrezas para caracterizar una situación

mediante el análisis de las medidas estadísticas bivariantes.

2. Calcular e interpretar adecuadamente las medidas estadísticas bivariantes,

asociadas a una situación específica.

3. Determinar la relación entre dos o más variables inscritas en una situación

específica a partir del análisis de regresión lineal simple y múltiple.

Objetivos Específicos

1. Realizar diagramas de dispersión en los ejercicios de laboratorio que permitan


determinar el tipo de asociación entre las variables escogidas.
2. En los ejercicios propuestos de laboratorio y de regresión y correlación lineal simple
crear modelos matemáticos que permita predecir el efecto de una variable sobre la
otra para determinar su fiabilidad.
3. Determinar porcentajes que permitan una explicación de modelo y grado de relación
de dos variables de los ejercicios de laboratorio y de regresión y correlación lineal
simple.
4. En la práctica de regresión y correlación lineal múltiple identificar una variable
cuantitativa dependiente y varias variables independientes del estudio de
investigación, diagramarlas y calcular la recta de regresión y el coeficiente de
correlación para probar estadísticamente su relación.
5. Relacionar o analizar la información obtenida en cada problema planteado en los
ejercicios de laboratorio.
MAPA MENTAL

Actividad 1.

LINK: https://www.goconqr.com/en/p/20118418-MEDIDAS-ESTADISTICAS-

BINIVARIANTES-DE-REGRECION—mind_maps
Actividad 2. DEFINICION DE CONCEPTOS.

Análisis de Correlación. Es el conjunto de técnicas estadísticas empleado para medir la


intensidad de la asociación entre dos variables.
El principal objetivo del análisis de correlación consiste en determinar qué tan intensa es la
relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un
diagrama de dispersión.
Diagrama de Dispersión. es aquel grafico que representa la relación entre dos variables.
Variable Dependiente. es la variable que se predice o calcula. Cuya representación es "Y"
Variable Independiente. es la variable que proporciona las bases para el cálculo. Cuya
representación es: X1, X2, X3.......

Coeficiente de Correlación. Describe la intensidad de la relación entre dos conjuntos de


variables de nivel de intervalo. Es la medida de la intensidad de la relación lineal entre dos
variables. El valor del coeficiente de correlación puede tomar valores desde menos uno
hasta uno, indicando que mientras más cercano a uno sea el valor del coeficiente de
correlación, en cualquier dirección, más fuerte será la asociación lineal entre las dos
variables. Mientras más cercano a cero sea el coeficiente de correlación indicará que más
débil es la asociación entre ambas variables. Si es igual a cero se concluirá que no existe
relación lineal alguna entre ambas variables.

Análisis de regresión. Es la técnica empleada para desarrollar la ecuación y dar las


estimaciones.
Ecuación de Regresión. es una ecuación que define la relación lineal entre dos variables.
Ecuación de regresión Lineal: Y’ = a + Bx
Ecuación de regresión Lineal Múltiple: Y’ = a + b1X1 + b2X2 + b3X3...
Principio de Mínimos Cuadrados. Es la técnica empleada para obtener la ecuación de
regresión, minimizando la suma de los cuadrados de las distancias verticales entre los
valores verdaderos de "Y" y los valores pronosticados "Y".

Análisis de regresión y Correlación Múltiple. consiste en estimar una variable


dependiente, utilizando dos o más variables independientes.
Actividad 3. Realizar el laboratorio de regresión y correlación lineal
Descripción de la Actividad:

A partir de la base de datos “Indicadores socioeconómicos 115 municipios de zonas


vulnerables por la pobreza, violencia y ausencia del estado en Colombia (2019) 16-4”,
desarrollar el Laboratorio denominado Regresión y correlación lineal.

a. Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas.

Cantidad de servicios públicos disponibles Y: Dependiente


% Ocupantes de viviendas sin agua de acueducto X: Independiente

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


relación entre las variables.

Estudio, Indicadores socioeconomicos de 115 municipios.


50.00
% Ocupantes en viviendas sin agua de

45.00
40.00
35.00
30.00
acueducto

25.00
20.00 y = -0,9267x + 9,7836
15.00 R² = 0,034
10.00
5.00
0.00
0 1 2 3 4 5 6 7 8
Cantidad de servicios publicos dispnibles.

Tipo de asociación entre las variables: El diagrama de dispersión indica un tipo de


asociación directa.

c. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?
Modelo matemático: Y -0,9267 X+ 9,7836 Y: % Ocupantes en viviendas sin agua
de acueducto.
R² = 0,034 X: Cantidad de servicios públicos
disponibles.
Coeficiente de determinación: R² = 0,034*100%= 3,4%.
El modelo matematico R² muestra una cofiabilidad de un 3,4% por que se estadisticamente
no es confinable.

d. Determine el grado de correlación de las dos variables.

El grado de la correlación de estas dos variables es el de el 0,18 Se puede evidenciar que no

hay correlación entre la cantidad de servicios disponibles y el % ocupantes de viviendas sin

agua de acueducto.

e. Relacionar la información obtenida con el problema.

Según la información obtenida en el diagrama de dispersión visualmente se puede afirmar

que entre las dos variables " Cantidad de servicios públicos disponibles, % Ocupantes en

viviendas sin agua de acueducto de los 115 municipios vulnerables por pobreza, violencia y

ausencia del Estado en Colombia, existe una tendencia lineal positiva (debido a que la nube

de puntos tiene forma ascendente), y se podría inferir que "a menor cantidad de servicios

públicos disponibles va a ser mayor él % de ocupantes en viviendas sin agua de acueducto";

sin embargo, el coeficiente de determinación afirma que el modelo de confiabilidad es de

3,4% lo que se puede concluir es que no es confiable, y el grado de correlación lineal que

proporcionó el coeficiente de correlación lo confirma indicando que no hay correlación entre

las variables con un R=0,18. se ha llegado a la conclusión, estadísticamente el % Ocupantes

en viviendas sin agua de acueducto no depende (no se correlaciona) de la cantidad de


servicios públicos disponibles de los 115 municipios vulnerables por pobreza, violencia y

ausencia del Estado en Colombia.

f. Establezca al menos 3 nuevos valores independientes para ser hallados a través

del modelo matemático calculado.

¿Si a (X) Cantidad de servicios públicos disponibles le doy un valor de 47,08, Cuánto

valdrá (Y) % Ocupantes en viviendas sin agua de acueducto?

X = Cantidad de servicios públicos disponibles = 47,08

Y = % Ocupantes en viviendas sin agua de acueducto =???

y = -0,9267x + 9,7836

Y = 0,9267(47,08) +9,7836

Y = 53,41

¿Si a (X) Cantidad de servicios públicos disponibles le doy un valor de 25,04, Cuánto

valdrá (Y) % Ocupantes en viviendas sin agua de acueducto?

X = Cantidad de servicios públicos disponibles = 25,04

Y = % Ocupantes en viviendas sin agua de acueducto =???

y = -0,9267x + 9,7836

Y = 0,9267(25,04) +9,7836

Y = 32, 98

¿Si a (X) Cantidad de servicios públicos disponibles le doy un valor de 86,09 Cuánto

valdrá (Y) % Ocupantes en viviendas sin agua de acueducto?

X = Cantidad de servicios públicos disponibles = 86,09


Y = % Ocupantes en viviendas sin agua de acueducto =???

y = -0,9267x + 9,7836

Y = 0,9267(86,09) +9,7836

Y = 89,56

Actividad 4. Realizar el laboratorio de regresión y correlación múltiple.

Descripción de la Actividad:

A partir de la base de datos “Indicadores socioeconómicos 115 municipios de zonas


vulnerables por la pobreza, violencia y ausencia del estado en Colombia (2019) 16-4”,
desarrollar el Laboratorios denominados Regresión y correlación múltiple.

a. Identificar una variable cuantitativa dependiente y varias variables


cuantitativas independientes del estudio de investigación.

 Variable cuantitativa dependiente: Cantidad de servicios públicos disponibles.


 Variables cuantitativas independientes: % Viviendas con algún nivel de hacinamiento y %
Población ocupada con ingreso de hasta 2 salarios mínimos.

b. Realizar el diagrama de dispersión de dichas variables.


c. Calcular la recta de regresión y el coeficiente de correlación para probar
estadísticamente su relación.

𝒚 = 𝒂 + 𝒃 𝟏 𝑿 𝟏 + 𝒃𝟐 𝑿 𝟐

Y= 6,3348 + (-0,0095) X1 + (-0,0631) X2 Modelo de regresión

R²= 0,1795, por estar por debajo de 0,30, el modelo matemático obtenido es poco confiable.

R²= 0,1795*100%= 17,95%, el modelo matemático explica el 17,95% de confiabilidad de


la información.

RAÍZ CUADRADA DE R²= 0,1795 = R= 0,4236 Coeficiente de correlación múltiple

R= 0,4236*100%= 42,36%

 La correlación entre las variables es mínima, dado que su valor de coeficiente es de


0, 4236.
 La correlación entre las variables es mínima, ya que ofrecen el 42,36%.

 En conclusión, estadísticamente se comprueba una relación mínima entre las


variables Cantidad de servicios públicos disponibles, % Viviendas con algún nivel
de hacinamiento y % Población ocupada con ingreso de hasta 2 salarios mínimos,
de los 115 municipios vulnerables por pobreza, violencia y ausencia del Estado en
Colombia.
d. Relacionar la información obtenida con el problema.

Los resultados anteriores indican que las variables "Cantidad de servicios públicos

disponibles, % Viviendas con algún nivel de hacinamiento y % Población ocupada con

ingreso de hasta 2 salarios mínimos", de los 115 municipios vulnerables por pobreza,

violencia y ausencia del Estado en Colombia, se encuentran mínimamente relacionadas a

través de un modelo de regresión múltiple Y= 6,3348 + (-0,0095)X1 + (-0,0631)X2 que

explica el 17,95% de confiabilidad. Esto debido a que dichas variables se encuentran bajo

una correlación mínima del 0,4236 que es lo mismo que decir 42,36%.
CONCLUSIONES.

En conclusión, se pudo evidenciar que para manejar cualquier tipo de variables se


necesita realizar un diagrama de dispersión y aplicar conceptos, fórmulas de relación y
correlación que permita el despeje de las ecuaciones y datos para obtener un resultado.

Los ejemplos nos muestran que son acordes a un tipo de forma lineal y la correlación es
confiable para los tipos de datos.

Hallamos los comportamientos que tienen tendencia lineal y determinamos el grado de


correlación entre las variables.
REFERNCIAS.

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151
– 158). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México


City: Cengage Learning. (pp 675 – 686). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

 Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de


mercados. México City: Cengage Learning.(pp 686 – 695).Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

 GONCORT Mapas mentales

También podría gustarte