Está en la página 1de 15

PASO 4 DESCRIPCION DE LA INFORMACION

PRESENTADO POR
EDWARD LEONARDO LASSO TORRES
COD: 12238165

TUTOR
JARAMILLO HERNANDEZ FREY

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
PROGRAMA: INGENIERÍA AMBIENTAL
JUNIO 2020
INTRODUCCION

Las técnicas estadísticas bivariantes permiten el análisis conjunto de dos


características de los individuos de una población con el propósito de detectar posibles
relaciones entre ellas. La naturaleza (nominal, ordinal o numérica) de las características
objeto de estudio determinará las herramientas más adecuadas para su análisis.

La finalidad del siguiente trabajo es aplicar las medidas estadísticas bivariantes,


a través del cálculo e interpretación del software estadístico, en función de la problemática
de estudio de la base de datos que suministro el ministerio de educación nacional de los
resultados de las Pruebas Saber de 180 estudiantes Grado 11-Noviembre (2019), en algunos
departamentos de Colombia
JUSTIFICACION

La toma de decisiones a partir de un conjunto de datos cuantitativos representa


una de las habilidades más importantes en el ámbito gerencial, pues permite comprender el
escenario en el que se definirá un curso de acción y garantizar que para ello se cuente con
bases objetivas que describen las características del lugar y del momento en que se actúa;
sin embargo, esta es -a su vez- una de las habilidades directivas menos desarrolladas por los
responsables de la toma de decisiones en una organización [ CITATION San10 \l 3082 ].

Las medidas estadísticas bivariantes permiten el análisis conjunto de dos


características de los individuos de una población con el propósito de detectar posibles
relaciones entre ellas. Una de las medias estadísticas es La regresión, se encarga de
examinar la relación entre dos variables restringiendo una de ellas respecto a la otra, con el
objeto de estudiar las variaciones de la primera cuando la otra permanece constante. La
regresión es un método que se emplea para pronosticar o predecir el valor de una variable
en función de los valores dados de la otra (o de las otras, cuando se trabaja más de dos
variables) [ CITATION Ari19 \l 3082 ].
OBJETIVOS
 Aplicar las medidas estadísticas bivariantes, por medio del cálculo e interpretación
del software estadístico, en función de la problemática objeto de estudio.
 Determinar mediante un mapa mental las medidas estadísticas Bivariantes de
regresión y correlación, describiendo resumidamente cada una de ellas.
 Definir brevemente los conceptos básicos asociados a Regresión y Correlación
 Seleccionar dos variable cuantitativa de la base de datos que suministro el
ministerio de educación nacional de los resultados de las Pruebas Saber de 180
estudiantes Grado 11-Noviembre (2019), clasificarlas en dependiente e
independiente y calcular la correlación y regresión
ACTIVIDAD 1. MAPA MENTAL
ACTIVIDAD 2. DEFINICION DE CONCEPTOS
2.1 Diagrama de dispersión
El diagrama de dispersión es una herramienta de análisis la cual representa en forma gráfica
la relación existente entre dos variables pudiendo observar la dependencia o influencia que
tiene una variable sobre la otra, permitiendo visualizar de forma gráfica su posible
correlación. Conocidos también como gráficos XY es una herramienta de análisis utilizado
generalmente en el área de la gestión de calidad con el objeto de encontrar las relaciones de
las causas que producen un efecto.

2.2 Coeficiente de determinación R2: Término usado en el análisis de regresión para


denotar la proporción relativa de la variación total en la variable de criterio que puede
explicarse mediante la ecuación de regresión ajustada.

Este coeficiente nos indica el grado de ajuste de la recta de regresión a los valores de la
muestra, y se define como el porcentaje de la variabilidad total de la variable dependiente Y
que es explicada por la recta de regresión. Cuanto menos dispersos sean los residuos
(recordad que lo residuos o errores son la diferencia entre los valores observados y los
valores estimados por la recta de regresión), mejor será la bondad del ajuste2.

2.3Correlación positiva y correlación negativa:

La correlación positiva perfecta, en que un aumento dado de X determina con exactitud otro
de Y, tiene coeficiente +1. La correlación negativa perfecta, en que un incremento
de X determina exactamente una disminución de Y, produce un coeficiente –1.

2.4 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es


una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos
variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que toman
dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto
de puntos representados se aproxima a una recta.

ACTIVIDAD 3. EJERCICIO PRÁCTICO


a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.

Imagen 1. Diagrama de dispersión “relación entre la Temperatura y el consumo de gas”

Este diagrama representa la relación entre la tempertaura en ºC y el consumo de gas en


cm3. El volumen de gas consumido por ser la variable dependiente se encuentra ubicado en
el eje Y mientras que la temperatura media se encuentra ubicado en el eje X. Cada uno de
los puntos azules que se observan en el grafico corresponde a la temperatura y el volumen
de gas consumido. La línea nos muestra que existe una fuerte correlación negativa, es decir;
la variable volumen de gas consumido cm 3 claramente disminuye a medida que aumenta la
temperatura media en ºC.
b. Encuentre el coeficiente de determinación y correlación.

Tabla 1. Resultados programa estadístico Infostat

En la tabla 1 se observan los resultados de la relación entre la temperatura y el consumo de


gas, procesados en el programa estadístico Infostat. El valor que se encuentra dentro del
círculo rojo hace referencia al coeficiente de determinación que se fijó de la siguiente
manera

Coeficiente de determinación r2= 0,88 o 88%

Este coeficiente nos permite determinar qué tan confiable es el modelo matemático que se
implementó. De esta manera el modelo matemático que se utilizo es confiable, su
confiabilidad es del 88%.

Por otro lado el coeficiente de correlación se determinó de la siguiente manera


Coeficiente de correlación r= √ 0,88
Coeficiente de correlación r=0,9380

c. Determine el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Tabla 2. Resultados de la relación entre la temperatura y el consumo de gas para el modelo


matemático
En la tabla 2 se observan los resultados de la relación entre la temperatura y el consumo de
gas, los valores que se encuentran dentro del cuadro rojo hacen referencia a los coeficientes
que permiten determinar el modelo matemático.

Modelo matemático

Y= Mx + B

Y= -0,55 x1 + 8,96

El modelo matemático es confiable porque el coeficiente de determinación es del 88%. A


partir del 80% se considera que es un modelo confiable.

d. Determine el grado de relación de las dos variables

El grado de correlación entre las variables “temperatura media en ºC y el volumen de gas


consumido en cm3 es excelente. En la tabla 3 se observan los rangos establecidos para
determinar el tipo de correlación, en esta caso es excelente porque el valor de r del
coeficiente de correlación se encuentra dentro del rango de 0.90 < r < 1.

Tabla 3. Rangos de correlación entre las variables

ACTIVIDAD 4. REGRESIÓN Y CORRELACIÓN LINEAL.

a. Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas e identificar la variable dependiente e independiente.

A partir de la base de datos suministrada: Anexo 1-Pruebas SABER 11 - 180 estudiantes


2020 (8-3), a continuación se encuentran las variables dependiente e independiente.

Variables Clasificación
Cuartos en el hogar Dependiente
Número de personas en el hogar Independiente

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


relación entre las variables.

En la imagen 2 se observa el diagrama de dispersión de las variables cuartos en el hogar y


el número de personas en el hogar de la información suministrada de las pruebas saber de
180 estudiantes. Los cuartos en el hogar por ser la variable dependiente se encuentra
ubicada en el eje Y, mientras que el número de personas en el hogar por ser la variable
independiente se encuentra ubicado en el eje X. Aunque los valores están un poco
dispersos, La línea nos indica que existe una regresión lineal positiva, mostrando un
crecimiento; a mayor número de personas en el hogar mayor es el número de cuartos en el
hogar.
Imagen 2. Diagrama de dispersión “relación entre el número de personas en el hogar y los cuartos
en el hogar”

c. Determine al coeficiente de determinación y de correlación de las dos variables.


Interprete los resultados.

Tabla 4. Resultados coeficiente de determinación de las variables en estudio

En la tabla 4 se observan los resultados de la relación entre las variables número de


personas en el hogar y cuartos en el hogar procesados en el programa estadístico Infostat.
El valor que se encuentra dentro del círculo rojo hace referencia al coeficiente de
determinación que se fijó de la siguiente manera
Coeficiente de determinación r2= 0,16 o 16%

Este coeficiente nos permite determinar qué tan confiable es el modelo matemático que se
implementó. De esta manera el modelo matemático que se utilizó no es confiable, ya que su
porcentaje de confiabilidad es del 16%.

Por otro lado el coeficiente de correlación se determinó de la siguiente manera


Coeficiente de correlación r= √ 0,16
Coeficiente de correlación r=0,4

d. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Tabla 5. Resultados de la relación entre la temperatura y el consumo de gas para el modelo


matemático
En la tabla 5 se observan los resultados de la relación entre las variables número de
personas en el hogar y cuartos en el hogar, los valores que se encuentran dentro del cuadro
rojo hacen referencia a los coeficientes que permiten determinar el modelo matemático.

Modelo matemático

Y= Mx + B

Y= 0,29 x1 + 1,84

El coeficiente de determinación me indica que solamente este modelo es confiable en un


16%

e. Determine el tipo de correlación de las dos variables.

No existe correlación entre las variables “número de personas en el hogar y cuartos en el


hogar”. En la tabla 3 se observan los rangos establecidos para determinar el tipo de
correlación, en esta caso no existe porque el valor del coeficiente de correlación es 0,4
encontrándose dentro del rango de 0 < r < 0.30. Esto quiere decir que no hay relación entre
el número de personas en el hogar con los cuartos en el hogar de la información
suministrada de los resultados de las pruebas saber pro a 180 estudiantes.
CONCLUSIONES

Por medio del diagrama de dispersión se logró determinar si existe relación entre dos
variables, de igual forma se conoce el comportamiento de la recta y que tan dispersos se
encuentran los valores de las variables.

El análisis de correlación permite determinar el grado de relación entre dos variables


aleatorias
REFERENCIAS BIBLIOGRAFICAS

Arias, L. F. (10 de Mayo de 2019). Obtenido de p/mnlfkylm9lnj/medidas-estadisticas-


bivariantes-de-regresion/
Sanchez, J. (2010). Medidas estadisticas bivariantes. ESPAÑA: UNECT.

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 130 –
158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:


Cengage Learning. Páginas 675 – 686

También podría gustarte