Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Grupo: 202107095_235
Tutora:
Sonia Consuelo Barahona
Estadística
27/11/2020
Introducción:
La estadística es una ciencia referente a la recolección, análisis e
interpretación de datos, ya sea para ayudar en la resolución de la toma de
decisiones o para explicar condiciones regulares o irregulares de algún
fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o
condicional. Sin embargo, estadística es mucho más que eso, dado que en
otras palabras es el vehículo que permite llevar a cabo el proceso
relacionado con la investigación científica.
También se denominan estadísticas (en plural) a los datos estadísticos.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las
ciencias sociales, desde las ciencias de la salud hasta el control de calidad.
Se usa para la toma de decisiones en áreas de negocios o instituciones
gubernamentales.
La estadística se divide en dos grandes áreas:
La estadística descriptiva, que se dedica a los métodos de recolección,
descripción, visualización y resumen de datos originados a partir de los
fenómenos en estudio. Los datos pueden ser resumidos numérica o
gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y
la desviación estándar. Algunos ejemplos gráficos son:
histograma, pirámide poblacional, clústers, entre otros.
Justificación:
Hasta hoy los métodos de las variables de estadística, se han centrado en
darle al estudiante una definición o formula la cual concluye la Estadística
de exportación de algún producto, importación de algún producto, nivel de
inseguridad de tu país, nivel de ventas en tu país, estadística de población en
cada año, estadística sobre personas trabajadoras y desempleadas en los
últimos años, Cantidad de autos vendidos, motos, ropa, estadística sobre la
población mundial "hombres, mujeres", Estadística de personas que les
gusta un equipo o un deporte.
La estadística inferencial, que se dedica a la generación de los modelos,
inferencias y predicciones asociadas a los fenómenos en cuestión teniendo
en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones
en los datos y extraer inferencias acerca de la población bajo estudio. Estas
inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba
de hipótesis), estimaciones de características numéricas (estimación),
pronósticos de futuras observaciones, descripciones de asociación
(correlación) o modelamiento de relaciones entre variables (análisis de
regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo
y minería de datos.
Objetivo:
Los objetivos del desarrollo de cada una de las actividades tienen como
finalidad, conocer el concepto que abarca la estadística desde sus diferentes
autores y sus investigaciones a través de los años, las principales
características de un problema, saber explicar las posibles relaciones o
factores entre las variables y a anticipar fenómenos en los que estas
intervienen.
Link:
https://mm.tt/1703981899?t=OBeuVvaMHn
-Diagrama de dispersión:
Las medidas de dispersión están encaminadas a cuantificar los próximos o alejados que
están los datos de la muestra de un punto central. Estas medidas indicaran por un lado el
grado de variabilidad que hay en la muestra y, por otro, la representatividad de dicho punto
central, ya que, si se obtiene un valor pequeño, eso significara que los valores se concentran
entorno a ese centro (por lo que habrá poca variabilidad y el centro representar bien a
todos). En cambio, si se obtiene un valor grande, significará que los valores no están
concentrados, sino dispersos (por lo que habrá mucha variabilidad y el centro no será muy
representativo).
Figura 4.3. En el diagrama de dispersión de la figura 4.3 parece existir una relación lineal
entre el peso y el índice de masa corporal de los pacientes. Además, si nos fijamos parece
que existe un dato atípico que se aleja de la nube de puntos. Con la nube de puntos
podemos apreciar si existe o no una tendencia entre las dos variables, pero si queremos
cuantificar esta asociación debemos calcular un coeficiente de correlación.
Recuperado de:
http://www.ics-aragon.com/cursos/salud-publica/2014/pdf/M2T04.pdf
-Coeficiente de determinación R2
En la expresión anterior tenemos una fracción. Así pues, vayamos por partes. En primer
lugar, analizaremos el numerador, es decir, la parte de arriba.
Para aquellos que no conozcan la expresión de la varianza, les recomiendo que lean el
artículo sobre la misma. Para aquellos que sí la conozcan, podrán caer en la cuenta de que
es la expresión de la varianza, pero con dos diferencias fundamentales.
Como norma general, las siguientes directrices sobre la fuerza de la relación son útiles
(aunque muchos expertos podrían disentir con la elección de los límites).
Recuperado de https://explorable.com/es/la-correlacion-estadistica#:~:text=En%20general
%2C%20r%3E%200%20indica,describe%20una%20correlaci%C3%B3n%20negativa
%20perfecta.
Podemos observar que en un diagrama B los puntos se acercan más a la recta, caso
contrario en el diagrama A, los puntos están más alejados. Entonces podemos decir que la
relación lineal del diagrama A es más débil con comparación a la relación que existe en el
diagrama B.
Un diagrama dispersión no nos da certeza de que tan débil o fuerte es la relación lineal,
necesitamos una medida que nos de la fuerza de la asociación y la dirección que toma esta
relación.
Para esto sirve el coeficiente de correlación que esta dado por la siguiente formula.
¿De dónde sacamos estos valores?
Entre más cercano es a 1 es más fuerte, entre más cercano a 0 es débil hasta llegar hacerse
nula, si los valores del coeficiente de relación son -1 es una Asociación lineal perfecta
Negativa, si es 0 no existe relación y si es 1 es una Asociación Lineal perfecta Positiva.
¿Entonces como identificamos cuan dispersos son los puntos de la línea recta?
Con la siguiente tabla podemos clasificar nuestros resultados y responder esta interrogante.
2. Masa
1. Edad
muscular
57 98
75 83
70 90
62 98
41 67
44 90
66 80
55 69
72 74
67 79
53 100
57 60
75 84
64 110
diagrama de dispersión y determine el tipo de asociación entre las variables:
100
80
60
40
20
0
35 40 45 50 55 60 65 70 75 80
Edad
Como se puede observar en la grafica ambas variables dando una correlación positiva
B. Encuentre el coeficiente de determinación y correlación.
Coeficiente de correlación
Resultado Interpretación
Existe una baja correlación positiva directa entre las variables Edad y Masa
r= 0,10650435 muscular
Coeficiente de determinación
100
Masa Muscular
80
60
40
20
0
35 40 45 50 55 60 65 70 75 80
Edad
Horas de
NUMERO
dedicación a la Horas de
DE
ESTRATO lectura dedicació
PERSONAS
FAMILIAR ESTU_DEDICACIO na
EN EL
N LECTURA Internet
HOGAR
DIARIA
2 2 0,5 1
1 3 0,5 1
2 5 0,5 1
2 1 0,5 1
2 4 0,5 1
4 6 2,5 2,5
3 10 0,5 2,5
3 6 0,5 2,5
3 2 0,5 2,5
5 3 2,5 2,5
2 3 0,5 1
4 5 2,5 2,5
2 3 0,5 1
4 7 2,5 2,5
5 3 2,5 2,5
5 5 2,5 2,5
4 4 2,5 2,5
3 4 0,5 2,5
3 4 0,5 2,5
3 4 0,5 2,5
4 2 2,5 2,5
3 4 0,5 2,5
4 4 2,5 2,5
5 4 2,5 2,5
3 4 0,5 2,5
2 4 0,5 1
4 4 2,5 2,5
6 4 2,5 2,5
3 4 0,5 2,5
4 4 2,5 3,5
4 4 2,5 3,5
5 4 2,5 3,5
1 7 0,5 1
2 3 0,5 1
1 3 0,5 1
0 5 0,5 1
1 7 0,5 1
1 3 0,5 1
2 3 0,5 1
1 2 0,5 1
1 3 0,5 1
1 2 0,5 1
1 3 0,5 1
1 3 0,5 1
1 3 1,5 1
1 2 1,5 1
1 10 1,5 1
3 6 1,5 3,5
2 4 1,5 1
1 2 1,5 1
1 2 1,5 1
1 4 1,5 1
1 6 1,5 1
1 6 1,5 1
1 4 1,5 1
3 6 1,5 3,5
1 11 1,5 1
1 2 2,5 1
1 4 2,5 1
1 6 2,5 0,5
1 2 2,5 0,5
2 6 2,5 0,5
1 4 2,5 0,5
3 5 2,5 3,5
1 5 2,5 0,5
1 5 2,5 0,5
1 6 2,5 0,5
1 6 2,5 0,5
1 2 2,5 0,5
1 2 2,5 0,5
3 4 2,5 3,5
3 5 2,5 3,5
3 4 2,5 3,5
3 6 2,5 3,5
5 6 2,5 3,5
4 2 2,5 3,5
4 4 2,5 3,5
4 4 2,5 3,5
2 4 2,5 0,5
4 4 2,5 3,5
3 4 2,5 3,5
3 4 2,5 3,5
4 4 2,5 3,5
4 4 2,5 3,5
3 4 2,5 3,5
2 4 2,5 0,5
3 4 3,5 3,5
1 2 3,5 0,5
5 4 2,5 3,5
3 4 3,5 3,5
4 4 2,5 3,5
3 4 3,5 3,5
2 4 3,5 0,5
5 12 2,5 3,5
1 4 3,5 0,5
4 4 2,5 3,5
3 4 3,5 3,5
3 4 3,5 3,5
3 4 3,5 3,5
3 4 3,5 3,5
5 4 2,5 3,5
4 4 2,5 3,5
2 4 3,5 0,5
4 6 2,5 3,5
5 4 2,5 3,5
1 6 3,5 0,5
4 4 2,5 3,5
5 4 2,5 3,5
4 4 1,5 3,5
5 6 1,5 3,5
4 4 1,5 3,5
4 2 1,5 3
4 4 1,5 3
4 6 1,5 3
4 4 1,5 3
6 4 1,5 3
4 6 1,5 3
4 4 1,5 3
6 4 1,5 3
3 4 3,5 3
1 11 3,5 0,5
4 4 1,5 3
6 4 1,5 3
6 4 1,5 3
6 6 1,5 3
4 4 1,5 3
6 4 1,5 3
6 4 1,5 3
6 4 1,5 3
6 6 1,5 3
5 4 1,5 3
6 4 1,5 3
5 6 1,5 3
5 4 1,5 3
4 4 1,5 3
4 6 1,5 3
6 4 1,5 3
4 4 1,5 3
5 6 1,5 3
4 6 1,5 3
4 4 1,5 3
3 6 3,5 3
6 6 1,5 3
6 4 1,5 3
4 4 1,5 3
4 4 1,5 3
4 6 1,5 4,5
6 4 1,5 4,5
4 4 1,5 4,5
4 4 1,5 4,5
3 6 3,5 4,5
6 4 1,5 4,5
5 8 1,5 4,5
6 6 1,5 4,5
5 6 1,5 4,5
2 4 3,5 0,5
5 4 1,5 4,5
6 4 1,5 4,5
4 4 1,5 4,5
4 4 1,5 4,5
Variable discreta
Coeficiente de correlación
Resultado Interpretación
0,0815248 existe una baja correlación positiva directa entre las variables estrato
r= 4 familiar y número de personas en el hogar
coeficiente de determinación
variable continua
coeficiente de correlación
Resultado interpretación
0,1370144 existe una baja correlacion positiva directa entre las variables
r= 7 estu_dedicacion lectura diaria y horas de dedicación a internet
coeficiente de determinación
Variable Discreta:
Rta: el tipo de correlacion de las dos variables son positivas directas ya que la línea tiende a
mejorar su resultado.
PEARSON 8% DIRECTA
R² 0,0066463
RELACION
BAJA
0
0 2 4 6 8 10 12 14
recta de regresión:
12
10
0
0 1 2 3 4 5 6 7
Coeficiente de correlación:
12
10
6 f(x) = 1.09327146171694 x
R² = 0.719683588657476
4
0
0 1 2 3 4 5 6 7
Rta: el tipo de correlacion de las dos variables son positivas directas ya que la línea tiende a
mejorar su resultado.
Conclusión:
Referencias bibliográficas:
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 130 –
158.