Está en la página 1de 13

UNIIDAD 2 – PASO 4

DESCRIPCIÓN DE LA INFORMACION

ESTADÍSTICA DESCRIPTIVA 100105_11

PRESENTADO POR:
JOHAN STEFAN MARULANDA BERNAL

PRESENTADO A:
VANESSA VENTURA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


CEAD JOSE ACEVEDO Y GOMEZ
BOGOTA, 03 DE MARZO DE 2020
Introducción

Mediante el presente trabajo se desarrollan las actividades propuestas en la guía con objetivo de
aplica las medidas bivariantes (regresión lineal, coeficiente de determinación lineal, coeficiente de
correlación, análisis de correlación, regresión simple y diagramas de dispersión), en función de la
problemática de estudio, con el fin de desarrollar en la práctica los diversos conceptos propuestos
en la unidad 2, para el paso 4 y especificados en la guía.

Justificación

Este ejercicio se realiza teniendo en cuenta las medidas estadísticas bivariantes, la aplicación
mediante laboratorio de ejercicios de regresión y correlación lineal, así como el análisis de los
datos resultantes en el estudio, lo que nos lleva a identificar las medidas estadísticas bivariantes, a
través de la elaboración del mapa mental, el cual presenta relaciones significativas entre los
conceptos.

Objetivos

Objetivo general

 Aplicar de manera correcta las medidas estadísticas bivariantes, en la solución de


diferentes problemas.

Objetivos específicos

 Comprender la forma de clasificar las variables de los problemas dados para el desarrollo
de la actividad.

 Identificar los conceptos básicos de la estadística descriptiva específicamente de las


variables bivariantes.
ACTIVIDAD 1

MAPA MENTAL MEDIDAS ESTADISTICAS BIVARIANTES DE REGRESIÓN Y CORRELACIÓN:

LINK MAPA MENTAL: https://www.goconqr.com/es-ES/mindmap/21135679/MEDIDAS-


ESTADISTICAS-BIVARIANTES
ACTIVIDAD 2

DEFINICIÓN DE CONCEPTOS.

Diagrama de dispersión:

Un diagrama de dispersión o gráfica de dispersión o gráfico de burbujas es un tipo de diagrama


matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para
un conjunto de datos.

Se emplea cuando una o varias variables está bajo el control del experimentador. Si existe un
parámetro que se incrementa o disminuye de forma sistemática por el experimentador, se le
denomina parámetro de control o variable independiente y habitualmente se representa a lo largo
del eje horizontal (eje de las abscisas). La variable medida o dependiente usualmente se
representa a lo largo del eje vertical (eje de las ordenadas). Si no existe una variable dependiente,
cualquier variable se puede representar en cada eje y el diagrama de dispersión mostrará el grado
de correlación (no causalidad) entre las dos variables.

Correlación lineal simple:

Consiste en expresar cuantitativamente el grado de relación que existe entre las variables de
estudio. Si entre dos variables cuantitativas existe una relación lineal, el análisis de correlación
lineal simple se usa para determinar la dirección y la magnitud de dicha relación. La dirección de la
relación se refiere a si ésta es positiva o negativa.

Coeficiente de determinación R2:

Es un estadístico usado en el contexto de un modelo estadístico cuyo principal propósito es


predecir futuros resultados o probar una hipótesis. El coeficiente determina la calidad del modelo
para replicar los resultados, y la proporción de variación de los resultados que puede explicarse
por el modelo.

El R² es simplemente el cuadrado del coeficiente de correlación de Pearson, lo cual es sólo cierto


para la regresión lineal simple. Si existen varios resultados para una única variable, es decir, para
una X existe una Y, Z... el coeficiente de determinación resulta del cuadrado del coeficiente de
determinación múltiple. En ambos casos el R² adquiere valores entre 0 y 1. Existen casos dentro de
la definición computacional de R² donde este valor puede tomar valores negativos.

Correlación positiva y correlación negativa:

Una relación positiva entre las variables X y Y indica que existe una relación directa entre ellas, es
decir, los valores menores de X están asociados con los valores menores de Y y los valores
mayores de X están asociados con los valores mayores de Y.

Existe una relación positiva entre las variables X y Y si al aumentar los valores de X los valores de Y
tienden a aumentar.

Una relación negativa entre las variables X y Y indica que existe una relación inversa entre ellas, es
decir, los valores menores de X están asociados con los valores mayores de Y y los valores mayores
de X están asociados con los valores menores de Y.

Si existe una relación negativa entre las variables X y Y, entonces al aumentar los valores de X los
valores de Y tienden a disminuir y viceversa.
¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?:

La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una
medida de regresión que pretende cuantificar el grado de variación conjunta entre dos variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es
decir, si se representan en un diagrama de dispersión los valores que toman dos variables, el
coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos representados
se aproxima a una recta. La podemos definir como el número que mide el grado de intensidad y el
sentido de la relación entre dos variables.

Siendo:

Cov (x;y): la covarianza entre el valor «x» e «y».

σ(x): desviación típica de «x».

σ(y): desviación típica de «y».

Valores que puede tomar la correlación

ρ = -1          Correlación perfecta negativa

ρ = 0           No existe correlación

ρ = +1         Correlación perfecta positiva


ACTIVIDAD 3

1.1.      CH-Pureza. El rendimiento del producto de un proceso químico está relacionado con la temperatura de
operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno producido y el
porcentaje de hidrocarburo (x) que está presente en el condensador principal en un proceso de destilación, de
acuerdo con los siguientes datos:

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


R:
pureza dependiente
independient
% de Hidro carburos e

%HC VS Pureza
105

100

95 f(x) = 14.95 x + 74.28


R² = 0.88
Pureza

90

85

80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
% HC

Tipo de asociacion directa,entre mayor es el porcentaje de hidrocarburos mayor va a ser la pureza

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra.
¿Es confiable?

y=14,947X + 74,283
87.7% de confiabilidad

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

el coeficiente de correlacion es la raiza cuadrada de 0,877

R= 0.9364%

Confirmando que el grado de relacion de las variables es excelente

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?

y=14,947X + 74,283
Remplazamos
91.3=14.947X + 74.283
X= (91.3-74,283)/14.947
X= 1,138489329

1.1.      X-Y. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado,
se ha considerado que era importante ir anotando periódicamente el tiempo medio (medido en
minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho
proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al
nuevo proceso mejorando paulatinamente su proceso de producción.

a. Identifique la variable dependiente (y) y la variable independiente (x),realice el diagrama de


dispersión y determine el tipo de asociación entre las variables.

X= número de días
Y= tiempo de fabricación

X vs Y
50
45
Tiempo de fabricación

40
35 f(x) = − 0.36 x + 42.57
30 R² = 0.8
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
Número de días

El tipo de asociacion es inversa, ya que cuando x aumenta y disminuye

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?

y= -0,3566X +42,569
79,63% de confiabilidad

c. Determine el grado de correlación de las dos variables.

el coeficiente de correlacion es la raiz cuadrada de 0,7963


R= 0.8923%
Confirmando que el grado de relacion de las variables es aceptable

d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 90 días?


y= -0,3566X +42,569
Remplazamos
y= -0,3566X +42,569
y= -0,3566(90) +42,569
y= 10,475
El tiempo que deberá tardarse un empleado cuando lleven 90 día es de 10,475

1.1.      PIB-Ventas. Una compañía multinacional del servicio de telecomunicaciones en Colombia,


como medio de planeación estratégica para la toma de decisiones, solicita a su departamento
financiero, hacer predicciones económicas del valor anual de sus ventas totales, versus el PIB
nacional de las últimas dos décadas, para la toma de decisiones para la apertura de nuevos
mercados. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

a. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. ¿Es confiable?

X PIB Y=1,1509X + 345,1


Y VENTAS 2,88 % de confiabilidad

b. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

El coeficiente de correlacion es la raiz cuadrada de 0,0288


R=0,1697%
Confirmando que el grado de relacion de las variables es minima

c. ¿Cuál podria ser la proyección de ventas para el año 2018 si se espera que el PIB nacional sea del 3,1?

Y=1,1509X + 345,1
remplazamos
Y=1,1509(3,1) + 345,1
y= 348,66779
La proyección de ventas para el año 2018 si se espera que el PIB nacional sea del 3,1 sera 348,66779
ACTIVIDAD 4

 Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas e identificar la variable dependiente e independiente.

R:

Valor Dolar dependiente Y


Indice de Precios independiente X

 Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación


entre las variables.

R:

La relación lineal entre las variables es inversa

 Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

R: Y= -3,7381x + 2463,1
2,4% de confiabilidad

 Determine el grado de correlación de las dos variables. - Relacionar la información


obtenida con el problema.

R: -0,154841818
No existe correlación entre estas variables
CONCLUSIONES

 Se realizó el manejo y aplicación de las medidas estadísticas bivariantes, en la solución de


las actividades propuestas en la guía.
 Identifiqué las medidas estadísticas bivariantes, a través de la elaboración del mapa
mental, el cual presenta relaciones significativas entre los conceptos.
 La aplicación de las técnicas de regresión y correlación simple a las variables cuantitativas
de la problemática objeto del estudio, me permitió consolidar la descripción de la
información de manera ordenada.
Referencias Bibliográficas

 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical


Descriptive.   Cengage Learning Paraninfo, S.A. (pp 41-50). Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea6096110
7ffc27a0

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 – 158).
Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe
203c8219

 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage
Learning. (pp 675–686). Recuperado de  http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116
134cfce41

También podría gustarte