Está en la página 1de 12

Tarea 4 – Descripción de la información

Nombre: Henry Trujillo Criollo

Código: 1123430367

Tutor: Juan Carlos Mosquera

Universidad Nacional Abierta y a Distancia (UNAD)


Tecnología en Desarrollo de Software
CEAD-ACACIAS
Año 2021
Introducción
La estadística descriptiva trata de un análisis sobre regresión y correlación lineal con la
finalidad de buscar o encontrar la relación que existe entre dos variables cuantitativas
seleccionadas, teniendo en cuenta la información sobre la base de datos venido trabajando
en actividades anteriores como lo es los índices de pobreza en algunos municipios de
Colombia para el primer trimestre de 2021. Así mismo se describen los conceptos
relacionados con la temática trabajada; son muchos conceptos los cuales nos han ayudado a
apropiarnos de la temática, desarrollo de los ejercicios, la comprensión y el análisis de los
mismos.
Justificación
La estadística descriptiva es la disciplina adoptada para hacer de una manera que unos
conjuntos de datos tengan un uso fácil, los datos a los que se les aplica son organizados
presentados de manera descrita como la manera más sencilla de uso de datos, generalmente
mediante tablas, medidas numéricas, aunque se frecuenta muchísimo más las gráficas para
esto.
De un modo directo vemos como ejemplo la estadística descriptiva aplicada a nuestra
cotidianidad que en este caso hablamos de los índices de pobreza a causa de desempleo, ya
que la época de la pandemia ha generado estragos a muchas empresas franquicias grandes
han decaído en ventas por lo tanto se ven obligados a hacer cortes de personal que genera
desempleo y en poco tiempo eso lleva a causar más índice de pobreza en Colombia.
Objetivos

Objetivo General: Tener en cuenta los diferentes métodos a aplicar en una


base de datos, para hacer de este estudio descriptivo.
Objetivo Específico:
 Obtener información concreta a partir de fórmulas.
 Entender cómo funcionan las variables.
 Aplicar métodos en busca de profundizar la información.
Mentefacto conceptual

Definición de conceptos.
-Diagrama de dispersión: Un diagrama de dispersión o gráfica de dispersión o gráfico de
burbujas gráfico de bolas es un tipo de diagrama matemático que utiliza las coordenadas
cartesianas para mostrar los valores de dos variables para un conjunto de datos.
-Correlación lineal simple: la regresión lineal simple es un modelo de regresión lineal con
una sola variable explicativa.
-Coeficiente de determinación R2: En estadística, el coeficiente de determinación,
denominado R² y pronunciado R cuadrado, es un estadístico usado en el contexto de un
modelo estadístico cuyo principal propósito es predecir futuros resultados o probar una
hipótesis.
-Correlación positiva y correlación negativa: Los valores de r positivos indican una
correlación positiva, en la que los valores de ambas variables tienden a incrementarse
juntos. Los valores de r negativos indican una correlación negativa, en la que los valores de
una variable tienden a incrementarse mientras que los valores de la otra variable
descienden.
- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
El coeficiente de correlación es la medida específica que cuantifica la intensidad de la
relación lineal entre dos variables en un análisis de correlación. En los informes de
correlación, este coeficiente se simboliza con la r; Para dos variables, la fórmula compara la
distancia de cada dato puntual respecto a la media de la variable y utiliza esta comparación
para decirnos hasta qué punto la relación entre las variables se ajusta a una línea imaginaria
trazada entre los datos. A esto nos referimos cuando decimos que la correlación examina
las relaciones lineales.
-Regresión lineal simple: a regresión lineal simple es un modelo de regresión lineal con
una sola variable explicativa.
-Regresión lineal múltiple: La regresión lineal múltiple trata de ajustar modelos lineales o
linealizables entre una variable dependiente y más de unas variables independientes. En
este tipo de modelos es importante testar la heterocedasticidad, la multicolinealidad y la
especificación.
Ejercicio Practico
 Las variables elegidas son Edad (x) y peso en kilogramos (y).
Realizar un diagrama de dispersión de dichas variables y determinar el tipo de
asociación entre las variables.

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,859718545
Coeficiente de determinación R^2 0,739115976
R^2 ajustado 0,717375641
Error típico 6,465687274
Observaciones 14

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 1421,26723 1421,26723 33,9974506 8,0766E-05
Residuos 12 501,661343 41,8051119
Total 13 1922,92857

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 3,112372523 10,4274591 0,29847852 0,77044335 -19,6071091 25,8318541 -19,6071091 25,8318541
Variable X 1 0,978352896 0,16779243 5,83073328 8,0766E-05 0,6127646 1,34394119 0,6127646 1,34394119

 El modelo matemático es y=0,9784 x+3,1124


2
r =0,8645
De acuerdo a lo anterior, se puede asegurar que el modelo es confiable ya que el R2
se acerca a 1.
 La correlación de estas variables es 97% que nos hace referencia que si existe
un alto grado de correlación entre sí.

Análisis de correlación lineal simple de las dos variables


cuantitativas seleccionadas
 Las variables elegidas son Cantidad de Resguardos (x) y Cantidad de Servicios (y).
Realizar un diagrama de dispersión de dichas variables y determinar el tipo de
asociación entre las variables.

Cantidad de resguardos - Cantidad de servicios


8
7
6
Cantidad de servicios

5
4
f(x) = − 0.035726507425912 x + 4.15180343576757
3 R² = 0.00129114074192194

2
1
0
0 1 2 3 4 5 6 7
Cantidad de resguardos

 El modelo matemático es y=−0,0357 x+ 4,1518


r 2=0,0013
El modelo matemático es poco confiable ya que solo tiene un 001% de
confiabilidad.
Entre las variables no existe correlación ya que el valor de esta es de -03% de
correlación.
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,035932447
Coeficiente de determinación R^2 0,001291141
R^2 ajustado -0,004319583
Error típico 2,012974123
Observaciones 180

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 0,93246184 0,93246184 0,23012017 0,63202364
Residuos 178 721,267538 4,05206482
Total 179 722,2

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 4,151803436 0,18485991 22,4591877 7,906E-54 3,78700442 4,51660245 3,78700442 4,51660245
Variable X 1 -0,035726507 0,07447546 -0,47970842 0,63202364 -0,18269497 0,11124195 -0,18269497 0,11124195

Análisis de correlación lineal múltiple de las variables cuantitativas


Seleccionadas

 El modelo matemático es y=−0,0357 x+ 4,1518


2
r =0,0013
El modelo matemático es poco confiable ya que solo tiene un 001% de
confiabilidad.
Entre las variables no existe correlación ya que el valor de esta es de -02% de
correlación.
 El modelo matemático es y=−0,0823 x +2,0472
2
r =0,0185
El modelo matemático es poco confiable ya que solo tiene un 001% de
confiabilidad.
Entre las variables no existe correlación ya que el valor de esta es de -22% de
correlación.

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,138935697
Coeficiente de determinación R^2 0,019303128
R^2 ajustado 0,008221807
Error típico 2,01189696
Observaciones 180

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 14,1019001 7,05095004 1,74195194 0,17816768
Residuos 177 716,4481 4,04772938
Total 179 730,55

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 1,996540232 0,40684085 4,90742319 2,0836E-06 1,19365722 2,79942324 1,19365722 2,79942324
Variable X 1 -0,028981484 0,07496988 -0,38657506 0,69953515 -0,17693132 0,11896836 -0,17693132 0,11896836
Variable X 2 -0,221870047 0,12305482 -1,80301796 0,07308634 -0,46471346 0,02097337 -0,46471346 0,02097337

Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o


situación estudiada
A partir de los datos obtenidos en la actividad número 4 “Análisis de correlación lineal
simple de las dos variables cuantitativas seleccionadas” podemos concluir que la
correlación entre estas dos variables es bastante baja, es decir que en el promedio de
correlación se ubica en la parte donde es totalmente el desacuerdo de relación de dichas
variables, también hallamos el modelo matemático y realizamos su tabla de dispersión, en
la actividad 5 “Análisis de correlación lineal múltiple de las variables cuantitativas
seleccionadas” nos encontramos con bajos índices de correlación esto se debe a que la
relación que se trató de hallar estaba errónea a pesar de suponer que una dependía de la
otra, igual se halló los datos como el modelo matemático y los coeficientes de las variables
(x).

Conclusiones
Se puede concluir que gracias a las fórmulas enseñadas en esta tarea 4, sabemos de una
manera estadística la relación entre dos variables una dependiente y otra independiente, con
esto podemos hallar el coeficiente de relación además de un modelo matemático para
aplicarlo en la misma variable y ver si grado de eficacia, y con la gráfica de dispersión
observamos de manera grafica la relación de las dos variables si lo hablamos de manera
lineal, si es de manera múltiple podemos ver la relación de dependencia de dos variables
(X) sobre una (y); también hallamos el modelo matemático y la correlación de las mismas.
Además de tener la libertad de realzar graficas de dispersión.
Referencias Bibliográficas.
 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas.
130 – 158.
 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:
Cengage Learning. Páginas 675 – 68
 Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de
mercados. México City: Cengage Learning. Páginas 686 – 695

También podría gustarte