Está en la página 1de 18

ESTADÍSTICA DESCRIPTIVA

UNIDAD 2: PASO 4- DESCRIPCIÓN DE LA INFORMACIÓN. DETALLAR Y


RELACIONAR VARIABLES DE LA PROBLEMÁTICA UTILIZANDO MEDIDAS
BIVARIANTES

MARCOS EBELLUP PERALES FORERO


CÓDIGO: 13873948

CLAUDIA LORENA BETANCUR MURILLO


TUTORA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD


ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
BUCARAMANGA
2018
INTRODUCCIÓN
En el presente trabajo se plasma la aplicación de la temática propuesta en la unidad 2 y de otras
temáticas vistas durante el desarrollo de la temática del curso estadística descriptiva. Para el
desarrollo de esta actividad fue necesario poner en práctica conceptos de gran importancia
tales como media aritmética, mediana rango, varianza, desviación, mediana, entre otros conceptos
estudiaos a lo largo del periodo académico con el propósito de que el aprendizaje sea más
dinámico y se facilite más.
JUSTIFICACIÓN
En los procesos estadísticos se permite identificar variables cuantitativas dándole a cada una
de ellas un estudio determinado con su respectiva relación. De igual forma a través del
diagrama de dispersión de dichas variables se hizo necesario determinar el tipo de asociación
como también se pudo encontrar un modelo matemático que nos permitió predecir el efecto de
la variable que se utilizó sobre la otra estableciendo síes o no confiable.
OBJETIVOS

GENERAL:

Practicar algunos de los conocimientos más significativos del proceso académico en específico de
la unidad dos la cual lleva por nombre de medidas estadísticas.

ESPECIFICOS:

 Manejar conceptos que nos permitan realizar una investigación de forma confiable.
 Identificar y llevar a cabo cada una de las etapas que se deben seguir dentro de una
investigación estadística.
 Representar la informar mediantes gráficos.
 Manejar el concepto de estadística
ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE DE LAS VARIABLES
CUANTITATIVAS SELECCIONADAS

Variable Y: Costo estimado del siniestro


Variable X: velocidad

Diagrama de dispersión:

Costo estimado del siniestro con relacion a la velocidad


$120,000,000.00

$100,000,000.00

$80,000,000.00 y = 27253x + 3E+07


R² = 0.0003

$60,000,000.00

$40,000,000.00

$20,000,000.00

$-
0 20 40 60 80 100 120 140 160

CALCULO DE R Y R2
Numerador 1,27666E+13
1 Parte del Denominador 37362546
2 Parte del Denominador 1,93047E+19
Resultado Total del Denominador 7,21271E+26
Raíz Cuadrada del Denominador 2,68565E+13
Coeficiente de Correlación r 0,47536423
Coeficiente de Determinación R2 0,225971151

CALCULO DE A
Numerador 1,27666E+13
Denominador 37362546
Resultado de a 341695,6204

Calculo de b
Numerador 383.709.426
Denominador (valor de n) 159
Resultado b 2413266,831

Ecuación de Regresión o Modelo y = 66763x +


Matemático Y = ax + b 2E+07
ANÁLISIS Y CONCLUSIONES, A PARTIR DE LOS RESULTADOS
OBTENIDOS Y APLICADOS AL PROBLEMA O SITUACIÓN ESTUDIADA

YESICA IVANA LÓPEZ MORALES


R= 0,47 a partir del análisis de correlación realizado podemos decir que hay una correlación
Mínima entre el costo del siniestro con respecto a la velocidad.

Modelo Matemático y=27253x+3e+07

Entre mas se acerque el Valor de R2


El coeficiente de
a 1 (valor a la unidad), mayor será el
R² = 0,0003 determinación es de
poder explicativo del modelo
un 1%
matemático de regresión.

El coeficiente de correlación nos


arroja una correlación de 0,44 esto
r=0,47536423
nos indica que hay una correlación
mínima

R= 0,47 a partir del análisis de correlación realizado se puede concluir que hay una correlación Mínima
entre el costo del siniestro con respecto a la velocidad.
CONCLUSIONES
 Con la actividad desarrollada damos a conocer la importancia de los métodos de relación
y correlación simple para una variable cuantitativa determinada, en esta parte se encuentra
y determina que la relación entre las variables es una relación inversa utilizando el
diagrama de dispersión, como también encontramos el modelo matemático y el porcentaje
de confiabilidad.
REFERENCIAS BIBLIOGRAFICAS
 García, M.S.(2004).Introducción a la estadística económica y empresarial. Paraninfo.
Páginas 74 – 98. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900012&v=2.1&u=unad&it=r&p=G
VRL&sw=w&asid=4a9b0a469e755a4327207c94b4c0d549
 Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 130 –
172. Recuperado
de: http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p
=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219
 Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple. Mexico City: Cengage
Learning. Páginas 675 – 686 Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r&p
=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41
ANEXOS
Laboratorio de Regresión y correlación lineal:

Ejercicio 1
El rendimiento del producto de un proceso químico está relacionado con la temperatura de
operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno
producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en un
proceso de destilación, de acuerdo con los siguientes datos:

X
(% de Y
Hidro (Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


% de Hidrocarburos vs Pureza
102
100
98
96

Pureza
94
92
90
88
86
0.8 1 1.2 1.4 1.6
% Hidrocarburos

La asociación de las variables es lineal con crecimiento positivo, a medida que el % de


hidrocarburos crece, la pureza también aumenta.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. Es confiable?

% de Hidrocarburos vs Pureza
105
100 y = 14.947x + 74.283
Pureza

R² = 0.8774
95
90
85
0.8 1 1.2 1.4 1.6
% Hidrocarburos

El modelo que permite predecir el efecto de la variable % Hidrocarburos sobre pureza


es:
𝑦 = 14,947𝑥 + 74,283

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.
El porcentaje de explicación del modelo está dado por la representación porcentual del
coeficiente de determinación. Para el modelo es R2 *100= 0,8774*100= 87,74%.
El grado de relación de las dos variables está dado por la raíz cuadrada de R2 0,8774
𝐺𝑟𝑎𝑑𝑜 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 = √𝑅 = √0,8774
𝐺𝑟𝑎𝑑𝑜 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 = 0,9367 = 93,67%

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?


Si y=91,3
𝑦 = 14,947𝑥 + 74,283
91,3 = 14,947𝑥 + 74,283
91,3 − 74,283 = 14,947𝑥
14,947𝑥 = 17,017
17,017
𝑥=
14,947
𝑥 = 1,14
Ejercicio 2
El número de libras de vapor (y) consumidas mensualmente por una planta química, se relaciona
con la temperatura ambiental promedio (en oF). Para el año 2014, se registraron los siguientes
valores de temperatura y consumo anual.

2014 Registros de temperatura y consumos


de vapor.

Temperatura Consumo de
Mes
(oF) vapor (Lb)

Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


Temperatura (°F) vs Consumo de vapor
(Lb)
800

Consumo de vapor (Lb)


600

400

200

0
0 10 20 30 40 50 60 70 80
Temperatura (°F)

La asociación de las variables es positiva, presenta un crecimiento con tendencia lineal.

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
Es confiable?

800
Temperatura (°F) vs Consumo de
vapor (Lb)
Consumo de vapor (Lb)

600

400 y = 9.2087x - 6.3184


R² = 0.9999
200

0
0 10 20 30 40 50 60 70 80
Temperatura (°F)

El modelo matemático que predice el efecto de la variable Temperatura sobre Consumo de


vapor es:
𝑦 = 9,2087𝑥 − 6,3184
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
El porcentaje de explicación del modelo está dado por la representación porcentual del
coeficiente de determinación. Para el modelo es R2 *100= 0,9999*100= 99,99%.
El grado de relación de las dos variables está dado por la raíz cuadrada de R2 =0,9999
𝐺𝑟𝑎𝑑𝑜 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 = √𝑅 = √0,9999
𝐺𝑟𝑎𝑑𝑜 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 = 0,9999 = 99,99%

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?


Si x= 70°F

𝑦 = 9,2087𝑥 − 6,3184

𝑦 = 9,2087(70) − 6,3184
Ejercicio 3
Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual al
dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se mide
utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación de
punzada. Obsérvese que ambas, X e Y, son variables aleatorias.

x
(porcentaje y (umbral de
de reflejo de
sobrepeso) flexión
nociceptiva)

89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


y (umbral de reflejo de flexión
nociceptiva)
y = -0.0629x + 11.642
20
R² = 0.1115
15
Axis Title

10

0
0 20 40 60 80 100
Axis Title

y (umbral de reflejo de flexión nociceptiva)


Linear (y (umbral de reflejo de flexión nociceptiva))

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
Es confiable?

Para realizar este procedimiento se hizo con la ayuda de Excel, ya que la cantidad de datos es bastante
considerable y se obtuvieron los siguientes resultados:

∑𝒙 ∑𝒚 ∑𝒙𝒚 ∑𝒙𝟐 ∑𝒚𝟐 ̅


𝒀𝒎𝒆𝒅 = 𝒚
627 77 4461,5 45141 799,5 7,7

n b a Se 𝑺𝒚𝟐 𝑹𝟐
10 -0,06286783 11,6418129 4,79016215 20,66 -0,111

Conforme a lo anterior podemos obtener el siguiente modelo matemático:

𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦 ∑𝑌 − 𝑏∑𝑥
𝑌̂ = 𝑎 + 𝑏𝑥 ; b= ; 𝑎=
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 𝑛
Donde:
b: Pendiente de la recta
a: Intercepto de la variable Y
x: Valores de la variable independiente
Y: Valores de la variable dependiente
n: Tamaño de la muestra
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
b=
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2

10 ∗ 627 − 627 ∗ 77
b= = −0,06286783
10 ∗ 45141 − (627)2

∑𝑌 − 𝑏∑𝑥 77 − (−0,06286783) ∗ 558


𝑎= = = 11,6418129
𝑛 10

Por tanto

𝑌̂ = 𝑎 + 𝑏𝑥 = 11,64 − 0,062𝑥

Cuando el R2 es cercano a 1, se dice que el modelo de regresión lineal ajustado tiene un alto grado de
confiabilidad, si al contrario este se acerca a 0 su grado de confiabilidad es muy bajo y se recomienda no
utilizar el modelo de regresión estimado.1 En nuestro caso

𝑆𝑒 2 4,790162152
𝑅2 = 1 − = 1 − = 0,11
𝑆𝑒𝑦2 20,66
𝑅 2 = 0,11 → 𝑟 = √0,11 = 0,33
Lo cual nos permite concluir que el modelo de regresión lineal ajustado tiene un bajo grado de confiabilidad,
se recomienda no utilizar el modelo de regresión estimado.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

El 𝑅 2 afirma además que el modelo explica el 11% de la información. Y el valor de r confirma


además el grado de relación entre las variables: El porcentaje de sobrepeso, se relaciona con el
umbral de reflejo de flexión nociceptiva en un 33%

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de sobrepeso,


de 40?

𝑌̂ = 11,64 − 0,062 ∗ 40

𝑌̂ = 9,16

También podría gustarte