Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Trabajo Colaborativo - 204040A - 471
Trabajo Colaborativo - 204040A - 471
Estudiantes
204040A_471
Presentado a
13 de mayo de 2018
1
INTRODUCCIÓN
La Estadística Descriptiva nos ofrece dentro del proceso de aprendizaje una clara
orientación a un proceso mediante el cual se recopila, organiza, presenta, analiza
e interpreta datos de manera que describa fácil y rápidamente las características
esenciales de estos mediante el empleo de métodos gráficos, tabulares o
numéricos en un estudio planteado.
2
JUSTIFICACIÓN
Este estudio de caso corroborara que los métodos estadísticos se utilizan para
propósitos descriptivos, en donde podemos organizar y resumir datos numéricos,
ya que al poner en práctica estos diferentes tipos de representación estadística,
lograremos gran parte de la utilidad que tiene la Estadística Descriptiva;
proporcionando así un medio informativo basado en recopilación de datos, en
donde veremos reflejada la eficacia con que se pueda realizar dicho proceso de
información en el entorno de la presentación detallada de datos, observando a
través de la forma gráfica una de las formas más rápidas y eficientes en el
análisis de los resultados.
3
OBJETIVOS
GENERALES
ESPECÍFICOS
4
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
Año * P_C de
AÑO(X) Población Cantidad de Personas(Y) X^2 Y^2
Personas
TOTALES:
319.611 7.250.105.880 1,46E+13 6,4E+08 3,31E+17
Diagrama de dispersión:
La grafica anterior nos muestra claramente que desde el año 2004 hasta el año
2017 la población cantidad de personas ha aumentado exponencialmente un
digito más o menos cada año y medio.
5
Tipo de asociación de las variables Directa
Modelo matemático y = 524758x - 1E+09
R2 0.9943
R 0.9947
Confiabilidad 99.43%
% de explicación 99.47%
Grado de relación Excelente
Método de Mínimos Cuadrados.
Ecuación lineal: Y = a + bX
Y = Variable independiente
A = intercepto con el eje y
X = variable dependiente
B= pendiente
Ahora calculamos a:
𝑅^2 = 0.9943
2=
R Coeficiente de determinación 99.43 % por lo tanto es confiable
R= coeficiente de correlación
R= raíz cuadrada de 0,9943
R = 0.997 La correlación es Excelente.
6
Estudiante 2: Luis Alberto Giraldo
Variable Y: Personas con empleo
Variable X: Cantidad de empresa
Diagrama de dispersión:
R² = 0.9646
25,000,000
20,000,000
15,000,000 Series1
10,000,000 Linear (Series1)
5,000,000
-
- 100,000 200,000 300,000 400,000
Empresas
7
Estudiante 3: Ruben Dario Andrade Bonilla
Diagrama de dispersión:
50,000,000
45,000,000
40,000,000
35,000,000
30,000,000
25,000,000
20,000,000
15,000,000
10,000,000
y = 556018x - 3E+07
5,000,000
R² = 0.9638
-
0.0 20.0 40.0 60.0 80.0 100.0 120.0 140.0 160.0
Indice de precios
8
Tipo de asociación de las variables Directa
Modelo matemático y = 556018x - 3E+07
R2 0,9638
R 0,981733161
Confiabilidad 0.96%
% de explicación 0.98%
Grado de relación Excelente
9
REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,99511851
Coeficiente de determinación R^2 0,99026084
R^2 ajustado 0,99013598
Error típico 886587,365
Observaciones 159
ANÁLISIS DE VARIANZA
Grados
de
libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 1,2468E+16 6,23399E+15 7930,90812 1,2725E-157
Residuos 156 1,22622E+14 7,86037E+11
Total 158 1,25906E+16
Inferior Superior
Coeficientes Error típico
Estadístico t Probabilidad Inferior 95% Superior 95% 95,0% 95,0%
- - -
Intercepción -62835462 1622461,444 38,72847781 6,3833E-82 66040289,85 -59630634,2 -66040289,8 59630634,2
Variable X 1 435535,735 7367,218187 59,11807192 1,024E-108 420983,3606 450088,109 420983,361 450088,109
Variable X 2 803526,797 39030,99788 20,58688839 2,5037E-46 726429,3547 880624,24 726429,355 880624,24
Y=A+B1X1+B2X2
10
Diagrama de dispersión:
(X1,Y)
45,000,000
40,000,000
35,000,000
30,000,000
25,000,000
Biilones
20,000,000
15,000,000
10,000,000
5,000,000 y = 556018x - 3E+07
R² = 0.9638
-
0.0 20.0 40.0 60.0 80.0 100.0 120.0 140.0 160.0
Indice de Precios
(X2,Y)
45,000,000
40,000,000
35,000,000
30,000,000
25,000,000
Biilones
20,000,000
15,000,000
10,000,000
5,000,000 y = 3E+06x - 1E+08
R² = 0.7721
-
0.0 10.0 20.0 30.0 40.0 50.0 60.0 70.0
Tasa de empleo (%)
11
Tipo de asociación de las variables Directa
Modelo matemático y=-62835462 + 435535,735x1 + 803526,797x2
R2 (X1,Y) 0,9902
R 0,9951
Confiabilidad 99.02%
% de explicación 99,51%
Grado de relación Excelente
R^2= 0,9902 por ser tan cercano a 1 se puede determinar que el modelo es
bastante confiable
Los resultados obtenidos indican que las variables Índice de Precios, Tasa de
empleo (%) e Inversión Nacional e internacional en el país Billones se encuentran
relacionadas a través de un modelo matemático de reversión múltiple y=-
62835462 + 435535,735x1 + 803526,797x2, que explica el 99,02% de
confiabilidad, esto debido a que dichas variables se encuentran bajo una
correlación excelente de 0,995 que equivale a un 99,5%
12
CONCLUSIONES
13
REFERENCIAS BIBLIOGRÁFICAS
•http://www.conevyt.org.mx/bachillerato/material_bachilleres/cb6/5sempdf/edin1
/edi1_f03.pdf
14
ANEXO
LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL
15
Diagrama de dispersión:
94
92
90
88
86
0 0.5 1 1.5 2
% Hidrocarburos
X
(% de Y
y = 14,947x + 74,283
Hidro (Pureza)
carburos)
1,14 91,3 (91,3)=14,947x + 74,283
91,3 - 74,283=14,947x
x=17,017/14,947
x=1,138
A la variable rendimiento de un proceso químico donde intervienen la pureza y el
% de hidrocarburos podemos determinar que efectivamente la pureza si depende
del % de hidrocarburos, encontramos un modelo matemático que es confiable y
que permite determinar la pureza a partir del % de hidrocarburos, además hay
una correlación aceptable entre las dos variables.
16
2.2 El número de libras de vapor (y) consumidas mensualmente por una planta
química, se relaciona con la temperatura ambiental promedio (en o F). Para el
año 2014, se registraron los siguientes valores de temperatura y consumo
anual:
Diagrama de dispersión:
Registros de temperatura vs
consumos de vapor en el año 2014
800
700
600
Consumo de Vapor
500
400
300
200
100 y = 9.2087x - 6.3184
R² = 0.9999
0
0 10 20 30 40 50 60 70 80
Temperatura °F
17
Tipo de asociación de las variables Directa
Modelo matemático y = 9,2087x - 6,3184
R2 0,9999
R 1
Confiabilidad 0.99%
% de explicación 100%
Grado de relación Perfecta
Consumo
Temperatura y = 9,2087x -
de vapor
(oF) 6,3184
(Lb)
70 638,29 y=9,2087(70) -6,3184
y=644,609 - 6,3184
y=638,29
18
2.3 Los investigadores están estudiando la correlación entre la obesidad y la
respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de
reflexión nociceptiva (y) que es una medida de sensación de punzada.
Obsérvese que ambas, X e Y, son variables aleatorias:
Diagrama de dispersión:
14
12 y = -0.0629x + 11.642
10 R² = 0.1115
8
6
4
2
0
0 20 40 60 80 100
Porcentaje de Sobrepeso
19
Tipo de asociación de las variables Inversa
Modelo matemático y = -0,0629x + 11,642
R2 0,1115
R 0.33
Confiabilidad 11.15%
% de explicación 0.33%
Grado de relación mínima
x y (umbral
(porcentaje de reflejo
y = -0,0629x + 11,642
de de flexión
sobrepeso) nociceptiva)
y= -0,0629(40) +
40 9,126 11,642
y=-2,516+11,642
y=9,126
20