Está en la página 1de 14

Informe Individual

Paso 4 – Descripción de la información

Harold Antonio Ruedas Balaguera


CC 1090490530

Nombre del curso:

Estadística Descriptiva

Curso:
204040_75

Presentado a:
DIANA FERNANDA JARAMILLO CARDENAS

Universidad Nacional Abierta y a Distancia UNAD


Escuela de Ciencias Básicas Tecnología e Ingeniería
Ingeniería de Telecomunicaciones
Cúcuta, Colombia
Introducción:

En este trabajo se tendrán en cuenta conceptos que conforman las mediadas


de estadística bivariantes, Diagrama de dispersión.
Correlación lineal simple, Regresión lineal simple, Regresión lineal múltiple
Estos datos podremos representarlos en, diagramas, barras que nos ayudaran
a entenderlos de una manera más práctica.
Justificación

Se realiza investigación a la base de datos “Indicadores de pobreza en algunos


municipios de Colombia para el primer trimestre de 2021 (16-4) con el fin de analizar
los índices de pobreza en los municipios en estudio.
OBJETIVOS

Objetivo general:

Aplicar las medidas estadísticas bivariantes, por medio del cálculo e


interpretación del software estadístico, en función de la problemática
objeto de estudio

Objetivos específicos:
- Conocer los conceptos básicos de la estadística bivariantes
- Aplicar los conceptos aprendidos en la investigación
- Entender los diagramas y aplicar la regresión y correlacion
- Realizar gráficos mediante los datos encontrados
DESARROLLO

Actividad 1. Mentefacto Conceptual

Para el desarrollo de esta actividad, es necesario que el estudiante revise


en el Entorno de Aprendizaje - contenidos y referentes bibliográficos
(Unidad 1), la siguiente referencia:

}
Actividad 2. Definición de Conceptos.

Descripción de la Actividad:

Definir brevemente los conceptos básicos asociados a Regresión y Correlación


como:

-Diagrama de dispersión:
Se emplea cuando una o varias variables está bajo el control del
experimentador. Si existe un parámetro que se incrementa o disminuye de
forma sistemática por el experimentador, se le denomina parámetro de
control o variable independiente y habitualmente se representa a lo largo del
eje horizontal (eje de las abscisas). La variable medida o dependiente
usualmente se representa a lo largo del eje vertical (eje de las ordenadas). Si
no existe una variable dependiente, cualquier variable se puede representar en
cada eje y el diagrama de dispersión mostrará el grado
de correlación (no causalidad) entre las dos variables. (Wikipedia. 2021, 8
noviembre)

-Correlación lineal simple.


El coeficiente de correlación lineal es una medida de regresión que sirve
para establecer una relación lineal entre dos variables. De esta manera, su
cálculo permite conocer con exactitud el grado de dispersión de los
valores de una variable en relación con una media para dicha variable,
entonces permite que se establezca una relación cuantitativa de sentido lineal
entre dos variables. La intensidad y dirección de esta relación suele
constatarse gráficamente. Supone un procedimiento estadístico que se
emplea en muchas áreas del conocimiento, para realizar análisis y reconocer
tendencias y hacer proyecciones.

-Coeficiente de determinación R2
El coeficiente de determinación es la proporción de la varianza total de la
variable explicada por la regresión. El coeficiente de determinación, también
llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que
pretender explicar. Es importante saber que el resultado del coeficiente de
determinación oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor,
mayor será el ajuste del modelo a la variable que estamos intentando explicar.
De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo
y, por tanto, menos fiable será. (López, J. F. 2021, 19 febrero).

-Correlación positiva y correlación negativa


Los valores de r positivos indican una correlación positiva, en la que los valores
de ambas variables tienden a incrementarse juntos. Los valores de
r negativos indican una correlación negativa, en la que los valores de una
variable tienden a incrementarse mientras que los valores de la otra variable
descienden.
- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
El Coeficiente de correlación es una medida que permite conocer el grado de
asociación lineal entre dos variables cuantitativas (X, Y). ... Recordar entonces
que el coeficiente de relación lineal, mide la fuerza y el sentido de la relación
lineal entre 2 variables cuantitativas.

-Regresión lineal simple


Examina la relación lineal entre dos variables continuas: una respuesta (Y) y un
predictor (X). Cuando las dos variables están relacionadas, es posible predecir
un valor de respuesta a partir de un valor predictor con una exactitud mayor
que la asociada únicamente a las probabilidades.

-Regresión lineal múltiple


Trata de ajustar modelos lineales o linealizables entre una variable dependiente
y más de unas variables independientes. En este tipo de modelos es
importante testar la heterocedasticidad, la multicolinealidad y la especificación.

Actividad 3. Ejercicio práctico.

En esta actividad cada estudiante deberá resolver un ejercicio de los que


aparecen a continuación

3.2. Edad – Peso.


Un nutricionista realizó un estudio donde desea encontrar un modelo
matemático que permita determinar la relación entre el Peso en kilogramos y la
Edad en años de un grupo de pacientes, para ello tomó una muestra al azar de
14 individuos, los resultados del estudio se ilustran en la siguiente tabla.

EDAD (X, en PESO (Y, en


años) kilogramos)
57 60
75 80
70 70
62 60
41 45
44 50
66 55
55 60
72 80
67 72
53 60
57 45
75 80
64 66
a. Realice el diagrama de dispersión y determine el tipo de asociación
entre las variables.

PESO EN FUNSION DE EDAD


90 y = 0,9784x + 3,1124
80 R² = 0,7391

70
60
50
PESO

40
30
20
10
0
0 10 20 30 40 50 60 70 80
EDAD

b. Encuentre el coeficiente de determinación y correlación.

R2= 0,7391

R= 0,85970925

c. Determine el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

y = 0,9784x + 3,1124

0,85970925 CORRELACION ACEPTABLE 0,80<r<0,90

d. Determine el grado de relación de las dos variables.

RELACION POSITIVA
Actividad 4. Regresión y correlación Lineal Simple.

Descripción de la Actividad:

A partir de la base de datos suministrada: Anexo 1- Indicadores de pobreza


en algunos municipios de Colombia para el primer trimestre de 2021 (16-
4), cada estudiante, deberá:

➢ Identificar dos variables cuantitativas de la situación estudiada que


puedan estar relacionadas e identificar la variable dependiente e
independiente.

X= Población total (habitantes)

Y= Índice de pobreza multidimensional

➢ Realizar el diagrama de dispersión de dichas variables y determinar el


tipo de relación entre las variables.

NUMERO DE INDICE DE POBREZA EN FUNCION DE POBLACION TOTAL


120 y = -7E-06x + 31,651
R² = 0,0101
100
Indice de pobreza

80

60

40

20

0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
Poblacion total

➢ Determine al coeficiente de determinación y de correlación de las dos


variables. Interprete los resultados

R2= 0,0101
R= 0,10049876
➢ Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?

y = -7E-06x + 31,651

0,10049876 NO ES CONFIABLE

➢ Determine el tipo de correlación de las dos variables.

CORRELACION LINEAL NEGATIVA

➢ Relacionar la información obtenida con el problema.

La población total y el índice de pobreza multidimensional ya que su coeficiente


de correlación nos dio 0,10049876 encontramos que no hay una correlación,
entonces el modelo matemático y = -7E-06x + 31,651 no es confinable ya que
no Podemos hacer predicciones a futuro con estas dos variables.

Actividad 5. Regresión y correlación múltiple.


Descripción de la Actividad:

- A partir de la base de datos suministrada “Anexo 1- Indicadores de


pobreza en algunos municipios de Colombia para el primer trimestre de
2021 (16-4)”, cada estudiante, deberá:

a. Identificar una variable cuantitativa dependiente y varias variables


cuantitativas independientes del estudio de investigación.

VARIABLE INDEPENDIENTE X1 = Porcentaje de ocupantes en viviendas sin agua de


acueducto
VARIABLE INDEPENDIENTE X2= Porcentaje de viviendas con algún nivel de
hacinamiento
VARIABLE DEPENDINTE Y= Porcentaje de impuestos pagados
b. Realizar el diagrama de dispersión de dichas variables

Gráfico de probabilidad normal


70

60

50

40
Y

30

20

10

0
0 20 40 60 80 100 120
Muestra percentil

c. Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

Coeficientes
Intercepción 55,0170675
Variable X 1 0,02184445
Variable X 2 0,02285316

y= 0,02184445*x1 + 0,02285316*x2 + 55,0170675

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,04756788
Coeficiente de determinación R^2 0,0022627
R^2 ajustado -0,0090112
Error típico 5,53408773
Observaciones 180

R= 0,04756788 NO HAY CORRELACION


d. Relacionar la información obtenida con el problema.

Podemos determinar que en el contexto de indicadores de pobreza de algunos


municipios de Colombia en el primer trimestre del 2021 las variables Porcentaje
de ocupantes en viviendas sin agua de acueducto y Porcentaje de viviendas con
algún nivel de hacinamiento son variables independientes y NO están asociadas a
las variable dependiente Porcentaje de impuestos pagados.
CONCLUSIONES

Las medidas de estadística bivariantes nos ayudan a encontrar la correlación


entre las variables de una base de datos obtenida inicialmente y así poder
saber que tan confiable es y si podemos tener algún tipo de predicción gracias
a ella.
BIBLIOGRAFIA

• Wikipedia. (2021, 8 noviembre). Diagrama de dispersión. Wikipedia, la

enciclopedia libre.

https://es.wikipedia.org/wiki/Diagrama_de_dispersi%C3%B3n

• López, J. F. (2021, 19 febrero). Coeficiente de determinación (R cuadrado).

Economipedia. https://economipedia.com/definiciones/r-cuadrado-coeficiente-

determinacion.html

• Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En: Estadística y


muestreo, 13a ed. [Online] Bogotá: Ecoe Ediciones. (pp 570 – 582). Recuperado
de http://www.ebooks7-24.com.bibliotecavirtual.unad.edu.co/?il=739

• Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp


130 – 158).
Recuperado de https://link.gale.com/apps/doc/CX4052100011/GVRL?u=unad&
sid=GVRL&xid=696103db

• Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México


City: Cengage Learning. (pp-675–686). Recuperado
de https://link.gale.com/apps/doc/CX4058900232/GVRL?u=unad&sid=GVRL&
xid=a2479593

• Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto


Politécnico Nacional. (pp 21-29). Recuperado de https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722

También podría gustarte