Está en la página 1de 26

i

Unidad 2 paso 4 Medidas Bibariantes

PRESENTADO POR:
cherry dayanna león o. cod.
angie fanori mejia cod.
ever mauricio rodriguez cod. 1110594536
cristyan guarnizo l. cod. 93.235.774
leidy mayerly venegas cod. 1.110.452.610

GRUPO:
100105_75

TUTOR:
FRANCISCO GIRALDO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BÁSICAS DE TECNOLOGIA E INGENIERIA
ESTADÍSTICA DESCRIPTIVA
IBAGUÉ-TOLIMA
2018
ii

INTRODUCCIÓN

Parte de la Estadística corresponde a la Estadística Inferencial y dentro de


ella los capítulos de correlación y regresión son muy usados en
la Investigación Científica, una herramienta muy útil cuando se trata de
relacionar 2 o más variables, relacionadas entre sí, como por ejemplo. nivel
de hemoglobina y embarazo en el ámbito de las Ciencias de la Salud, la
Correlación implica el grado de dependencia de una variable respecto a otra
y la Regresión es otra técnica que ayuda en la investigación de la
salud Psicología costos de una Empresa etc., el siguiente trabajo presenta el
desarrollo de la  Guía Unidad 2 paso 4 de la asignatura Estadística
Descriptiva, como forma de aplicar los conocimiento obtenidos.
iii

JUSTIFICACIÓN

La estadística es una disciplina aplicada en todos los campos de la actividad


humana. De ahí que se tenga como una asignatura indispensable en todas
las áreas y carreras del conocimiento de nivel intermedio y profesional.

Si existe una función que sea importante universalmente para aquellas


personas que laboran dentro de una organización empresarial, está es la
decisión. Debido al enorme aumento de disponibilidad de datos, a través de
los computadores y de la gran complejidad, el proceso de decisión está
sometido a presiones extraordinarias. En el futuro, los responsables de las
decisiones tendrán que estar suficientemente familiarizados con las técnicas
estadísticas existentes, para poder determinar cuándo se puede analizar una
situación mediante la aplicación de la estadística.

La asignatura brinda a cada estudiante las bases en temas de Estadística


descriptiva, tales como: Descripción, análisis y representación de datos,
utilizando métodos numéricos y gráficos que resumen y presentan la
información contenida en ellos.
iv

OBJETIVOS

 Fortalecer de los conceptos y procedimientos presentes en la Unidad 2


Paso 4 Del curso estadística descriptiva.

 Analizar e identificar las características estadísticas aprendidas.

 Reconocimiento y aplicación en los casos prácticos en la estadística.

 Trabajar y resolver los ejercicios en grupo para fortalecer y reforzar


nuestro conocimiento
v

ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE DE LAS DOS VARIABLES

CUANTITATIVAS SELECCIONADAS

Identificar dos variables cuantitativas de la situación estudiada que puedan

estar relacionadas.

Variables cuantitativas seleccionadas


Variable 1 Edades Independiente
Variable 2 Número de muertos Dependiente

Realizar el diagrama de dispersión de dichas variables y determinar el tipo

de asociación entre las variables.

Muert Edad

os es
0 17
1 18
2 19
3 21
  22
  23
  24
  29
  20
  31
  32
  33
  34
  35
  36
  38
  42
  43
vi

  44
  45
  46
  48
  50
  52
  53
  54
  55
  56
  60

Numero de muertos en accidentes de


trancito teniendo en cueta sus
edades
Edades Linear (Edades)
80
60
f(x) = 1.54 x + 14.14
Edades

40 R² = 0.98
20
0
0 5 10 15 20 25 30 35
Nuemero de muertos

Encuentre el modelo matemático que permite predecir el efecto de una

variable sobre la otra. ¿Es confiable?

MODELO MATEMATICO Y=1,3x + 16,4


vii

R² = 0,9657 Coeficiente de determinación

96.57% de confiabilidad.

Para este caso el modelo matemático es confiable ya que tiene un 96.57%

de confiabilidad.

Determine el grado de relación de las dos variables.

Relación directa entre la variable dependiente número de muertos con la

variable independientes edades.

R² = 0,9657

Relacionar la información obtenida con el problema.

Por los resultados obtenidos del coeficiente de correlación y determinación

que son los que nos determina la confiabilidad del modelo matemático y que

grado de relación existe entre las variables tomadas de la base de datos

Secretaria de Transito 2018 en este caso: número de muertos con edades de

las personas involucradas en accidentes de tránsito, podemos determinar

que es confiable y que se correlacionan. además, podemos resumir que se

encuentra una relación directa entre estas dos variables, por lo tanto, son

variables que se pueden utilizar para realizar un informe estadístico de la

base de datos suministrada.

R// Conclusión
viii

Existe una tendencia lineal, hay un aumento de igualdad en las dos variables

no están muy dispersas por lo tanto hay una relación directa entre la

variable dependiente número de muertos con la variable independiente

Edades de personas involucradas en accidentes de tránsito.


ix

GRADOS DE GRADOS DE GRADOS DE GRADOS DE GRADOS DE


NUMERO ALCOHOL NUMERO ALCOHOL NUMERO ALCOHOL NUMERO ALCOHOL NUMERO ALCOHOL
DE DEL DE DEL DE DEL DE DEL DE DEL
HERIDOS CONDUCTO HERIDOS CONDUCTO HERIDOS CONDUCTO HERIDOS CONDUCTO HERIDOS CONDUCTO
R R R R R
3 1,2 0 2,7 1 1,1 0 0,8 18 1,4
2 3 2 0,6 5 2,4 3 0,3 9 2,1
1 0 1 0 3 0,6 0 1,1 2 0
2 0,6 1 2,9 6 1,6 4 2,4 2 3
8 0 3 0,6 11 0 2 0,6 2 0
0 0 4 1,8 2 1,4 6 0 1 0,6
0 3 9 0 3 2,1 4 1,2 3 1,9
4 1,4 0 1,1 2 0,8 1 3 2 1,4
2 2,1 3 2,4 1 1,1 1 2,7
6 0 15 0,6 4 2,4 1 0,6
4 1,6 2 0 2 0 4 1,9
1 2,2 2 2,9 6 1,6 1 1,1
2 3 0 1,3 4 1,2 2 0
0 1,1 1 1,4 4 3 2 0,6
2 2,4 0 2,1 2 2,7 0 1,6
2 0,6 2 0,8 3 0,6 1 2,1
3 1,6 0 0 2 0 6 0,8
4 0 4 1,2 0 3 3 0,5
2 0 2 3 1 1,1 2 2,7
5 2,1 3 0 4 2,4 0 1,1
2 1,4 0 0,6 1 0 0 2,4
4 2,6 2 1,9 3 1,6 2 0,6
2 3 4 2,7 2 0 4 1,6
10

diagrama de dispersion

2.0
1.8
1.6
f(x) = 0.65 x − 0.33
1.4 R² = 0.4
1.2
1.0
0.8
0.6
0.4
0.2
0.0
0.5 1 1.5 2 2.5 3 3.5

Tipo de asociación entre las variables: es lineal con tendencia creciente, a

mayor estado de alcohol en las personas mayor la cantidad de heridos.

Modelo matemático: y=0.65 x−0.325

Coeficiente de determinación: R2=0.3972

Coeficiente correlación: 0.63

Confiabilidad: R2=0.3972∗100=0.39 % de confiabilidad

Porcentaje de explicación del modelo y el grado de relación de las dos

variables: 0.93 la correlación es buena


11

Correlación de edad y hora


4:48

0:00

19:12
Hora

14:24

9:36 f(x) = − 0 x + 0.47


R² = 0
4:48

0:00
0 20 40 60 80 100 120
Edad

Tipo de asociación de las variables: Es lineal, con Relación creciente, porque

a mayor edad, mayor accidentalidad en horas nocturnas.

Modelo matemático: Y = 0,0036x + 0,3324

Coeficiente de determinación: R² = 0,0229

Coeficiente de correlación: Raíz cuadrada del coeficiente de determinación:

0,15

Confiabilidad: R² (0,0229) * 100 = 2,29% poco confiable.

Coeficiente de correlación: 0,15 la correlación es mínima


12

Número Número Número Número


Velocida de Velocida de Velocida de Velocida de
dx Muertos dx Muertos dx Muertos dx Muertos
y y y y
66 0 65 2 40 0 85 0
111 2 60 2 73 1 80 1
66 1 83 1 69 0 81 2

80 0 95 2 70 2 62 0
75 0 86 0 75 1 79 1
66 2 68 2 55 1 76 2
45 1 55 1 69 1 80 0
88 2 88 4 50 0 70 1
55 0 63 0 73 0 80 0
70 1 70 2 38 1 83 0
105 1 78 0 60 0
88 3 83 2 50 2
69 1 138 3 100 1
48 2 55 1 75 1
70 1 66 0 80 0
83 0 108 1 95 0
138 2 69 0 70 2
68 1 72 1 66 0
77 1 74 0 69 1
81 1 69 0 67 0
50 0 79 1 83 1
88 2 65 1 70 0
71 1 74 0 150 4
55 3 77 1 55 2
78 1 51 1 66 3
80 0 75 0 68 1
68 1 72 0 79 0
74 0 77 1 79 0
75 1 67 0 60 1
83 2 55 1 33 2
13

Muertes en Accidentes de Tránsito


4.5
4
3.5
Número de Muertos

3
2.5
2
1.5
1 f(x) = − 0 x + 1.19
0.5 R² = 0.02
0
0 20 40 60 80 100 120
Velocidad

Tipo de asociación entre las variables: Las variables no tienen ningún tipo de

correlación, mientras una variable aumenta, la otra no tiene ningún efecto.

Modelo matemático: 0,0144x - 0,0788

Coeficiente de determinación: R² =0,0765

Coeficiente de correlación: Raíz cuadrada del coeficiente de determinación:

0,27

Confiabilidad: R² (0,27) * 100 = 27% de confiabilidad, no es confiable.

Porcentaje de explicación del modelo y el grado de relación de las dos

variables.

Coeficiente de correlación: 0,27, no hay correlación.

¿Cuántos muertos se registraron en los accidentes de tránsito cuando la

velocidad estaba en 82 km?


14

y = 0,0144x - 0,0788 x velocidad = 82

x= 82 y número de muertos =?

Reemplazar en la ecuación:

y = 0,0144x - 0,0788

y = 0,0144(82) - 0,0788

y= 1,102

y= 1,102

Conclusión: En este estudio se determinó que las variables cuantitativas

Velocidad y número de muertos no tienen ninguna relación, ambas pueden

aumentar y no se verá reflejado en ninguna.

Conclusiones
15

Las técnicas de regresión y correlación cuantifican la asociación estadística


entre dos o más variables. La regresión lineal simple expresa la relación
entre una variable dependiente Y y una variable independiente X, en
términos de la pendiente y la intersección de la línea que mejor se ajuste a
las variables.

La correlación simple expresa el grado o la cercanía de la relación entre las


dos variables en términos de un coeficiente de correlación que proporciona
una medida indirecta de la variabilidad de los puntos alrededor de la mejor
línea de ajuste- Ni la regresión ni la correlación dan pruebas de relaciones
causa – efecto.

Se pudo determinar los comportamientos que tienen tendencia lineal y


determinar el grado de correlación entre las variables.

reconocimos muchos de los fundamentos que son necesarios para el estudio


de la estadística.

Gracias al desarrollo de los ejercicios anteriores podemos decir que se


reconoció y fortalecieron los conceptos y procedimientos presentes en la
estadística descriptiva.

Referencia Bibliografía
16

Rodríguez. (2016) Formulas básicas en la regresión lineal simple: recuperado


de: www.uca.edu.sv/matematica/.../REGRESION%20SIMPLE%20Y
%20MULTIPLE.pdf

Callajan.j.(2012) Correlación lineal y análisis de regresión recuperado:


https://www.uoc.edu/in3/emath/docs/RegresionLineal.pdf

Montero, J. M. (2007). Estadística descriptiva. Madrid: Paraninfo. Página 3 -


16 Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100007&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=0a7332df0
d4700de0bd272caa41e1718

Pava, M.F, (2015). Estadística Descriptiva. ESTADÍSTICA 100105 Recuperado


de http://estadisticadescriptivaunad100105.blogspot.com/

Rada, A, (2012). Estadística Descriptiva. Recuperado


http://blade1.uniquindio.edu.co/uniquindio/facultades/humanas/cinfo/uniqui
ndio/assets/documentos/4/06_estadistica.pdf
17

LABORATORIO REGRESIÓN Y CORRELACIÓN LINEAL.

1.El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que
existe entre la pureza (y) del oxígeno producido y el porcentaje de
hidrocarburo (x) que está presente en el condensador principal en un
proceso de destilación, de acuerdo con los siguientes datos:
18

Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

Asociación directa entre el % de hidrocarburos y la pureza


La ecuación matemática es confiable

a. b. Encuentre el modelo matemático que permite predecir el efecto


de una variable sobre la otra. ¿Es confiable?
Y =14,947x +74,283 R2 =0,8774
R2 =coeficiente X de determinación=
87,74% por lo (% de Y tanto es confiable.
Hidro (Pureza)
b. c. Determine el carburos) porcentaje de explicación
del modelo y el 0,99 90,01 grado de relación de las
dos variables. 1,02 89,05
1,15 91,43
R=coeficiente de 1,29 93,74 correlación
R=raíz cuadrada 1,46 96,73 de 87,74 R=
0,93% 1,36 94,45
0,87 87,59
1,23 91,77 la correlación es muy
buena 1,55 99,42
1,4 93,65
c. d. ¿Cuál es el porcentaje de
1,19 93,54
hidrocarburo cuando la pureza del
1,15 92,52
oxígeno es igual a 91,3?
0,98 90,56
Y= pureza 1,01 89,54
1,11 89,85
X= hidrocarburo? 1,2 90,39
Y= 91,3 1,26 93,25
1,32 93,41
91,3=14,947x + 1,43 94,98 74,283
91,3- 0,95 87,33 74,283=14,947x
17,02/14,947=x
X=1,13
El porcentaje de hidrocarburo será 1,13 cuando el oxígeno es igual
a 91,3
19

2. El número de libras de vapor (y) consumidas mensualmente por una


planta química, se relaciona con la temperatura ambiental promedio (en o F).
Para el año 2014, se registraron los siguientes valores de temperatura y
consumo anual.

Temperatura Consumo de
Mes
(oF) vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

a. Realice el diagrama de dispersión y determine el tipo de asociación


entre las variables.
20

Existe relación directa entre la temperatura y el consumo de vapor

Su correlación es muy buena con un 0,99%

Posee un alto grado de confiabilidad

R2 = 99,99%

b. Ajuste un modelo matemático que permita predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Y=9,2087x-6,3184 R2=0,9999

R2 = coeficiente de determinación=99,99% es confiable

c. Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

R=coeficiente de correlación

R=raíz cuadrara de 0,9999%

R= 0,9999 lo cual es muy bueno

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?

Y= consumo de vapor?

X=temperatura en oF
21

X= 70 oF

Y=9,2084(70) +6,3184

Y=644,609

Y=650,89

el consumo de vapor es = a 650,89 cuando la temperatura es = a 70 oF

3. Los investigadores están estudiando la correlación entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo
de reflexión nociceptiva (y) que es una medida de sensación de punzada.
Obsérvese que ambas, X e Y, son variables aleatorias

x (porcentaje de y (umbral de
sobrepeso) reflejo de flexión
nociceptiva)

89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
22

a. Realice el diagrama de dispersión y determine el tipo de asociación


entre las variables.

Tendencia negativa modelo no recomendable

Grado de confiabilidad muy bajo por tener un R 2 =11,15%

Relación inversa entre el % de sobrepeso y el umbral de reflejo de flexión a


medida que aumenta el % de sobrepeso disminuye el umbral de reflejo de
flexión.

b. Ajuste un modelo matemático que permita predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Y=-0,0629x+11,642

R2=0,1115

c. Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

R= coeficiente de correlación

R=raíz cuadrada de 0,1115

R=0,33 la correlación es muy baja


23

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un


porcentaje de sobrepeso, de 40?

y = umbral de reflejo de flexión nociceptiva?

x=% de sobrepeso

x=40% sobrepeso

y= (-0,0629) (40) +11,642

y= -2,516 +11,642

y=9,126

% de sobrepeso 40 %

Umbral de flexión 9,126


xxiv
25
xxvi

También podría gustarte