Está en la página 1de 22

Paso 4 Descripción de la Información.

Yerson Andrey Camargo Olaya

Grupo: 202107095_235

Tutora:
Sonia Consuelo Barahona

Universidad Nacional Abierta y a distancia UNAD

Escuela de ciencias sociales, Artes y Humanidades

Estadística

27/11/2020

Introducción:
La estadística es una ciencia referente a la recolección, análisis e
interpretación de datos, ya sea para ayudar en la resolución de la toma de
decisiones o para explicar condiciones regulares o irregulares de algún
fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o
condicional. Sin embargo, estadística es mucho más que eso, dado que en
otras palabras es el vehículo que permite llevar a cabo el proceso
relacionado con la investigación científica.
También se denominan estadísticas (en plural) a los datos estadísticos.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las
ciencias sociales, desde las ciencias de la salud hasta el control de calidad.
Se usa para la toma de decisiones en áreas de negocios o instituciones
gubernamentales.
La estadística se divide en dos grandes áreas:
La estadística descriptiva, que se dedica a los métodos de recolección,
descripción, visualización y resumen de datos originados a partir de los
fenómenos en estudio. Los datos pueden ser resumidos numérica o
gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y
la desviación estándar. Algunos ejemplos gráficos son:
histograma, pirámide poblacional, clústers, entre otros.

Justificación:
Hasta hoy los métodos de las variables de estadística, se han centrado en
darle al estudiante una definición o formula la cual concluye la Estadística
de exportación de algún producto, importación de algún producto, nivel de
inseguridad de tu país, nivel de ventas en tu país, estadística de población en
cada año, estadística sobre personas trabajadoras y desempleadas en los
últimos años, Cantidad de autos vendidos, motos, ropa, estadística sobre la
población mundial "hombres, mujeres", Estadística de personas que les
gusta un equipo o un deporte.
La estadística inferencial, que se dedica a la generación de los modelos,
inferencias y predicciones asociadas a los fenómenos en cuestión teniendo
en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones
en los datos y extraer inferencias acerca de la población bajo estudio. Estas
inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba
de hipótesis), estimaciones de características numéricas (estimación),
pronósticos de futuras observaciones, descripciones de asociación
(correlación) o modelamiento de relaciones entre variables (análisis de
regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo
y minería de datos.
Objetivo:

Los objetivos del desarrollo de cada una de las actividades tienen como
finalidad, conocer el concepto que abarca la estadística desde sus diferentes
autores y sus investigaciones a través de los años, las principales
características de un problema, saber explicar las posibles relaciones o
factores entre las variables y a anticipar fenómenos en los que estas
intervienen.

Actividad 1. Mapa Mental


Mapa mental las medidas estadísticas Bivariantes de regresión y correlación.

Link:
https://mm.tt/1703981899?t=OBeuVvaMHn

Actividad 2. Definición de Conceptos.

-Diagrama de dispersión:
Las medidas de dispersión están encaminadas a cuantificar los próximos o alejados que
están los datos de la muestra de un punto central. Estas medidas indicaran por un lado el
grado de variabilidad que hay en la muestra y, por otro, la representatividad de dicho punto
central, ya que, si se obtiene un valor pequeño, eso significara que los valores se concentran
entorno a ese centro (por lo que habrá poca variabilidad y el centro representar bien a
todos). En cambio, si se obtiene un valor grande, significará que los valores no están
concentrados, sino dispersos (por lo que habrá mucha variabilidad y el centro no será muy
representativo).

(A. Colubi, A. Lubiano, P. Ter´an, Pág. 1)

Recuperado de: http://ocw.uniovi.es/pluginfile.php/4436/mod_label/intro/1C_C6587/


materia_de_clase/Tema4_EAI_teoria.pdf

-Correlación lineal simple:

La finalidad de la correlación es examinar la dirección y la fuerza de la asociación entre dos


variables cuantitativas. Así conoceremos la intensidad de la relación entre ellas y si, al
aumentar el valor de una variable, aumenta o disminuye el valor de la otra variable. Para
valorar la asociación entre dos variables, la primera aproximación suele hacerse mediante
un diagrama de dispersión.

Figura 4.3. En el diagrama de dispersión de la figura 4.3 parece existir una relación lineal
entre el peso y el índice de masa corporal de los pacientes. Además, si nos fijamos parece
que existe un dato atípico que se aleja de la nube de puntos. Con la nube de puntos
podemos apreciar si existe o no una tendencia entre las dos variables, pero si queremos
cuantificar esta asociación debemos calcular un coeficiente de correlación.

(Clara Laguna, Pag. 2, instituto Aragonés)

Recuperado de:
http://www.ics-aragon.com/cursos/salud-publica/2014/pdf/M2T04.pdf

-Coeficiente de determinación R2

El coeficiente de determinación es la proporción de la varianza total de la variable


explicada por la regresión. El coeficiente de determinación, también llamado R cuadrado,
refleja la bondad del ajuste de un modelo a la variable que pretender explicar.
Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1.
Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que
estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado
estará el modelo y, por tanto, menos fiable será.

En la expresión anterior tenemos una fracción. Así pues, vayamos por partes. En primer
lugar, analizaremos el numerador, es decir, la parte de arriba.

Para aquellos que no conozcan la expresión de la varianza, les recomiendo que lean el
artículo sobre la misma. Para aquellos que sí la conozcan, podrán caer en la cuenta de que
es la expresión de la varianza, pero con dos diferencias fundamentales.

(José Francisco López, Pág. 2, Conopedia)


Recuperado de:
https://economipedia.com/definiciones/r-cuadrado-coeficiente-determinacion.html

-Correlación positiva y correlación negativa:

La correlación estadística es medida por lo que se denomina coeficiente de correlación (r).


Su valor numérico varía de 1,0 a -1,0. Nos indica la fuerza de la relación.
En general, r> 0 indica una relación positiva y r <0 indica una relación negativa, mientras
que r = 0 indica que no hay relación (o que las variables son independientes y no están
relacionadas). Aquí, r = 1,0 describe una correlación positiva perfecta y r = -1,0 describe
una correlación negativa perfecta.
Cuanto más cerca estén los coeficientes de +1,0 y -1,0, mayor será la fuerza de la relación
entre las variables.

Como norma general, las siguientes directrices sobre la fuerza de la relación son útiles
(aunque muchos expertos podrían disentir con la elección de los límites).

Valor de r Fuerza de relación

-1,0 A -0,5 o 1,0 a 0,5 Fuerte

-0,5 A -0,3 o 0,3 a 0,5 Moderada

-0,3 A -0,1 o 0,1 a 0,3 Débil

-0,1 A 0,1 Ninguna o muy débil

Recuperado de https://explorable.com/es/la-correlacion-estadistica#:~:text=En%20general
%2C%20r%3E%200%20indica,describe%20una%20correlaci%C3%B3n%20negativa
%20perfecta.

¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

El Coeficiente de correlación es una medida que permite conocer el grado de asociación


lineal entre dos variables cuantitativas (X, Y).
En los siguientes Diagramas de dispersión se puede observar que existe una relación lineal
entre la variable X y la variable Y.
Sin embargo, si trazamos una línea recta en los diagramas.

Podemos observar que en un diagrama B los puntos se acercan más a la recta, caso
contrario en el diagrama A, los puntos están más alejados. Entonces podemos decir que la
relación lineal del diagrama A es más débil con comparación a la relación que existe en el
diagrama B.
Un diagrama dispersión no nos da certeza de que tan débil o fuerte es la relación lineal,
necesitamos una medida que nos de la fuerza de la asociación y la dirección que toma esta
relación.
Para esto sirve el coeficiente de correlación que esta dado por la siguiente formula.
¿De dónde sacamos estos valores?

Recordar entonces que el coeficiente de relación lineal, mide la fuerza y el sentido de la


relación lineal entre 2 variables cuantitativas.
Luego de haber aplicado la formula, según el resultado se puede clasificar en este rango.

Entre más cercano es a 1 es más fuerte, entre más cercano a 0 es débil hasta llegar hacerse
nula, si los valores del coeficiente de relación son -1 es una Asociación lineal perfecta
Negativa, si es 0 no existe relación y si es 1 es una Asociación Lineal perfecta Positiva.
¿Entonces como identificamos cuan dispersos son los puntos de la línea recta?
Con la siguiente tabla podemos clasificar nuestros resultados y responder esta interrogante.

Recuperado de: https://platzi.com/tutoriales/1269-probabilidad-estadistica/2308-


coeficiente-de-correlacion-que-es-y-para-que-sirve/#:~:text=El%20Coeficiente%20de
%20correlaci%C3%B3n%20es,cuantitativas%20(X%2C%20Y).&text=Recordar
%20entonces%20que%20el%20coeficiente,lineal%20entre%202%20variables
%20cuantitativas.
3.1 Edad – Masa Muscular.
Una nutricionista desea estudiar la relación entre la edad y la masa muscular de las
personas, y para realizar el estudio seleccionó un grupo de mujeres con características
semejantes, con edades diferentes y midió su masa muscular. La nutricionista registró los
datos de edad y masa muscular en las siguientes tablas:

2. Masa
1. Edad
muscular
57 98
75 83
70 90
62 98
41 67
44 90
66 80
55 69
72 74
67 79
53 100
57 60
75 84
64 110
diagrama de dispersión y determine el tipo de asociación entre las variables:

EDAD Y MASA MUSCULAR


120
Masa Muscular

100
80
60
40
20
0
35 40 45 50 55 60 65 70 75 80
Edad

Como se puede observar en la grafica ambas variables dando una correlación positiva
B. Encuentre el coeficiente de determinación y correlación.

Coeficiente de correlación

Resultado Interpretación
Existe una baja correlación positiva directa entre las variables Edad y Masa
r= 0,10650435 muscular

Coeficiente de determinación

R2 0,01134318 El 1% de la variable de la masa muscular, es explicado por la variable de la edad.

C. Determine el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

EDAD Y MASA MUSCULAR


120

100
Masa Muscular

80

60

40

20

0
35 40 45 50 55 60 65 70 75 80
Edad

Rta: El efecto de la variable es confiable ya que tiende ser positiva.


Actividad 4. Regresión y correlación Lineal Simple.

 Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas e identificar la variable dependiente e independiente:

Variable Cuantitativa discreta y continua.


Variable Discreta Variable Continua

Horas de
NUMERO
dedicación a la Horas de
DE
ESTRATO lectura dedicació
PERSONAS
FAMILIAR ESTU_DEDICACIO na
EN EL
N LECTURA Internet
HOGAR
DIARIA

2 2 0,5 1
1 3 0,5 1
2 5 0,5 1
2 1 0,5 1
2 4 0,5 1
4 6 2,5 2,5
3 10 0,5 2,5
3 6 0,5 2,5
3 2 0,5 2,5
5 3 2,5 2,5
2 3 0,5 1
4 5 2,5 2,5
2 3 0,5 1
4 7 2,5 2,5
5 3 2,5 2,5
5 5 2,5 2,5
4 4 2,5 2,5
3 4 0,5 2,5
3 4 0,5 2,5
3 4 0,5 2,5
4 2 2,5 2,5
3 4 0,5 2,5
4 4 2,5 2,5
5 4 2,5 2,5
3 4 0,5 2,5
2 4 0,5 1
4 4 2,5 2,5
6 4 2,5 2,5
3 4 0,5 2,5
4 4 2,5 3,5
4 4 2,5 3,5
5 4 2,5 3,5
1 7 0,5 1
2 3 0,5 1
1 3 0,5 1
0 5 0,5 1
1 7 0,5 1
1 3 0,5 1
2 3 0,5 1
1 2 0,5 1
1 3 0,5 1
1 2 0,5 1
1 3 0,5 1
1 3 0,5 1
1 3 1,5 1
1 2 1,5 1
1 10 1,5 1
3 6 1,5 3,5
2 4 1,5 1
1 2 1,5 1
1 2 1,5 1
1 4 1,5 1
1 6 1,5 1
1 6 1,5 1
1 4 1,5 1
3 6 1,5 3,5
1 11 1,5 1
1 2 2,5 1
1 4 2,5 1
1 6 2,5 0,5
1 2 2,5 0,5
2 6 2,5 0,5
1 4 2,5 0,5
3 5 2,5 3,5
1 5 2,5 0,5
1 5 2,5 0,5
1 6 2,5 0,5
1 6 2,5 0,5
1 2 2,5 0,5
1 2 2,5 0,5
3 4 2,5 3,5
3 5 2,5 3,5
3 4 2,5 3,5
3 6 2,5 3,5
5 6 2,5 3,5
4 2 2,5 3,5
4 4 2,5 3,5
4 4 2,5 3,5
2 4 2,5 0,5
4 4 2,5 3,5
3 4 2,5 3,5
3 4 2,5 3,5
4 4 2,5 3,5
4 4 2,5 3,5
3 4 2,5 3,5
2 4 2,5 0,5
3 4 3,5 3,5
1 2 3,5 0,5
5 4 2,5 3,5
3 4 3,5 3,5
4 4 2,5 3,5
3 4 3,5 3,5
2 4 3,5 0,5
5 12 2,5 3,5
1 4 3,5 0,5
4 4 2,5 3,5
3 4 3,5 3,5
3 4 3,5 3,5
3 4 3,5 3,5
3 4 3,5 3,5
5 4 2,5 3,5
4 4 2,5 3,5
2 4 3,5 0,5
4 6 2,5 3,5
5 4 2,5 3,5
1 6 3,5 0,5
4 4 2,5 3,5
5 4 2,5 3,5
4 4 1,5 3,5
5 6 1,5 3,5
4 4 1,5 3,5
4 2 1,5 3
4 4 1,5 3
4 6 1,5 3
4 4 1,5 3
6 4 1,5 3
4 6 1,5 3
4 4 1,5 3
6 4 1,5 3
3 4 3,5 3
1 11 3,5 0,5
4 4 1,5 3
6 4 1,5 3
6 4 1,5 3
6 6 1,5 3
4 4 1,5 3
6 4 1,5 3
6 4 1,5 3
6 4 1,5 3
6 6 1,5 3
5 4 1,5 3
6 4 1,5 3
5 6 1,5 3
5 4 1,5 3
4 4 1,5 3
4 6 1,5 3
6 4 1,5 3
4 4 1,5 3
5 6 1,5 3
4 6 1,5 3
4 4 1,5 3
3 6 3,5 3
6 6 1,5 3
6 4 1,5 3
4 4 1,5 3
4 4 1,5 3
4 6 1,5 4,5
6 4 1,5 4,5
4 4 1,5 4,5
4 4 1,5 4,5
3 6 3,5 4,5
6 4 1,5 4,5
5 8 1,5 4,5
6 6 1,5 4,5
5 6 1,5 4,5
2 4 3,5 0,5
5 4 1,5 4,5
6 4 1,5 4,5
4 4 1,5 4,5
4 4 1,5 4,5

 Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


relación entre las variables.

Diagrama de variable Discreta.

NUMERO DE PERSONAS EN EL HOGAR


14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7

Diagrama de variable continua.

Horas de dedicación a Internet


5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
0 0.5 1 1.5 2 2.5 3 3.5 4

 Determine al coeficiente de determinación y de correlación de las dos variables.


Interprete los resultados

Variable discreta
Coeficiente de correlación
Resultado Interpretación
0,0815248 existe una baja correlación positiva directa entre las variables estrato
r= 4 familiar y número de personas en el hogar

coeficiente de determinación

el 1% de la variable del número de personas en el hogar, es explicado


R2 0,0066463 por la variable de estrato familiar

variable continua
coeficiente de correlación
Resultado interpretación
0,1370144 existe una baja correlacion positiva directa entre las variables
r= 7 estu_dedicacion lectura diaria y horas de dedicación a internet

coeficiente de determinación

0,0187729 el 2% de la variable de horas de dedicación a internet, es explicado


R2 7 por la variable de estu_dedicacion lectura diaria

 Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

Variable Discreta:

NUMERO DE PERSONAS EN EL HOGAR Y


ESTRATO FAMILIAR
14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7
Variable Continua:

Horas de dedicación a Internet Y


ESTU_DEDICACION LECTURA DIARIA
5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
0 0.5 1 1.5 2 2.5 3 3.5 4

 Determine el tipo de correlación de las dos variables. - Relacionar la información


obtenida con el problema.

Rta: el tipo de correlacion de las dos variables son positivas directas ya que la línea tiende a
mejorar su resultado.

Actividad 5. Regresión y correlación múltiple.

a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas


independientes del estudio de investigación.

PEARSON 8% DIRECTA
R² 0,0066463  
RELACION
  BAJA  

La relación existente entre el numero de personas en el hogar y el estrato familiar, es


directamente proporcional. Dicha relación es baja, debido a que una variación numero de
personas en el hogar afecta un 1%

b. Realizar el diagrama de dispersión de dichas variables.


NUMERO DE PERSONAS EN EL HOGAR VS ES-
TRATO FAMILIAR
7

0
0 2 4 6 8 10 12 14

c. Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

recta de regresión:

NUMERO DE PERSONAS EN EL HOGAR Y


ESTRATO FAMILIAR
14

12

10

4 f(x) = 0.0836284784965667 x + 4.14434405493314

0
0 1 2 3 4 5 6 7

Coeficiente de correlación:

Coeficiente de correlacion 0,08152484


NUMERO DE PERSONAS EN EL HOGAR Y ES-
TRATO FAMILIAR
14

12

10

6 f(x) = 1.09327146171694 x
R² = 0.719683588657476
4

0
0 1 2 3 4 5 6 7

d. Relacionar la información obtenida con el problema:

Rta: el tipo de correlacion de las dos variables son positivas directas ya que la línea tiende a
mejorar su resultado.
Conclusión:

La estadística es una Ciencia que tiene como finalidad facilitar la solución de


problemas en los cuales necesitamos conocer algunas características sobre el
comportamiento de algún suceso o evento. Características que nos permiten
conocer o mejorar el conocimiento de ese suceso. Además, nos permiten inferir
el comportamiento de sucesos iguales o similares sin que estos ocurran

Referencias bibliográficas:
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 130 –
158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:


Cengage Learning. Páginas 675 – 686

También podría gustarte