Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Paso4 - MARCOS EBELLUP PERALES FORERO
Paso4 - MARCOS EBELLUP PERALES FORERO
GENERAL:
Practicar algunos de los conocimientos más significativos del proceso académico en específico de
la unidad dos la cual lleva por nombre de medidas estadísticas.
ESPECIFICOS:
Manejar conceptos que nos permitan realizar una investigación de forma confiable.
Identificar y llevar a cabo cada una de las etapas que se deben seguir dentro de una
investigación estadística.
Representar la informar mediantes gráficos.
Manejar el concepto de estadística
ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE DE LAS VARIABLES
CUANTITATIVAS SELECCIONADAS
Diagrama de dispersión:
$100,000,000.00
$60,000,000.00
$40,000,000.00
$20,000,000.00
$-
0 20 40 60 80 100 120 140 160
CALCULO DE R Y R2
Numerador 1,27666E+13
1 Parte del Denominador 37362546
2 Parte del Denominador 1,93047E+19
Resultado Total del Denominador 7,21271E+26
Raíz Cuadrada del Denominador 2,68565E+13
Coeficiente de Correlación r 0,47536423
Coeficiente de Determinación R2 0,225971151
CALCULO DE A
Numerador 1,27666E+13
Denominador 37362546
Resultado de a 341695,6204
Calculo de b
Numerador 383.709.426
Denominador (valor de n) 159
Resultado b 2413266,831
R= 0,47 a partir del análisis de correlación realizado se puede concluir que hay una correlación Mínima
entre el costo del siniestro con respecto a la velocidad.
CONCLUSIONES
Con la actividad desarrollada damos a conocer la importancia de los métodos de relación
y correlación simple para una variable cuantitativa determinada, en esta parte se encuentra
y determina que la relación entre las variables es una relación inversa utilizando el
diagrama de dispersión, como también encontramos el modelo matemático y el porcentaje
de confiabilidad.
REFERENCIAS BIBLIOGRAFICAS
García, M.S.(2004).Introducción a la estadística económica y empresarial. Paraninfo.
Páginas 74 – 98. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900012&v=2.1&u=unad&it=r&p=G
VRL&sw=w&asid=4a9b0a469e755a4327207c94b4c0d549
Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 130 –
172. Recuperado
de: http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p
=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219
Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple. Mexico City: Cengage
Learning. Páginas 675 – 686 Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r&p
=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41
ANEXOS
Laboratorio de Regresión y correlación lineal:
Ejercicio 1
El rendimiento del producto de un proceso químico está relacionado con la temperatura de
operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno
producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en un
proceso de destilación, de acuerdo con los siguientes datos:
X
(% de Y
Hidro (Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
Pureza
94
92
90
88
86
0.8 1 1.2 1.4 1.6
% Hidrocarburos
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. Es confiable?
% de Hidrocarburos vs Pureza
105
100 y = 14.947x + 74.283
Pureza
R² = 0.8774
95
90
85
0.8 1 1.2 1.4 1.6
% Hidrocarburos
Temperatura Consumo de
Mes
(oF) vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
400
200
0
0 10 20 30 40 50 60 70 80
Temperatura (°F)
b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
Es confiable?
800
Temperatura (°F) vs Consumo de
vapor (Lb)
Consumo de vapor (Lb)
600
0
0 10 20 30 40 50 60 70 80
Temperatura (°F)
𝑦 = 9,2087𝑥 − 6,3184
𝑦 = 9,2087(70) − 6,3184
Ejercicio 3
Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual al
dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se mide
utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación de
punzada. Obsérvese que ambas, X e Y, son variables aleatorias.
x
(porcentaje y (umbral de
de reflejo de
sobrepeso) flexión
nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
10
0
0 20 40 60 80 100
Axis Title
b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
Es confiable?
Para realizar este procedimiento se hizo con la ayuda de Excel, ya que la cantidad de datos es bastante
considerable y se obtuvieron los siguientes resultados:
n b a Se 𝑺𝒚𝟐 𝑹𝟐
10 -0,06286783 11,6418129 4,79016215 20,66 -0,111
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦 ∑𝑌 − 𝑏∑𝑥
𝑌̂ = 𝑎 + 𝑏𝑥 ; b= ; 𝑎=
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 𝑛
Donde:
b: Pendiente de la recta
a: Intercepto de la variable Y
x: Valores de la variable independiente
Y: Valores de la variable dependiente
n: Tamaño de la muestra
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
b=
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2
10 ∗ 627 − 627 ∗ 77
b= = −0,06286783
10 ∗ 45141 − (627)2
Por tanto
𝑌̂ = 𝑎 + 𝑏𝑥 = 11,64 − 0,062𝑥
Cuando el R2 es cercano a 1, se dice que el modelo de regresión lineal ajustado tiene un alto grado de
confiabilidad, si al contrario este se acerca a 0 su grado de confiabilidad es muy bajo y se recomienda no
utilizar el modelo de regresión estimado.1 En nuestro caso
𝑆𝑒 2 4,790162152
𝑅2 = 1 − = 1 − = 0,11
𝑆𝑒𝑦2 20,66
𝑅 2 = 0,11 → 𝑟 = √0,11 = 0,33
Lo cual nos permite concluir que el modelo de regresión lineal ajustado tiene un bajo grado de confiabilidad,
se recomienda no utilizar el modelo de regresión estimado.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.
𝑌̂ = 11,64 − 0,062 ∗ 40
𝑌̂ = 9,16