Está en la página 1de 21

Estadística

Universidad nacional abierta y a distancia

Nombre: Jineth Dayanna Muñoz Prieto


CC. 1007714906
Skype: live: cid.9d5db90a4edceec

Entregado a: Carlos Eduardo rueda

El bordo cauco
(05/11/2020)
Universidad nacional abierta y a distancia
Escuela de ciencias sociales arte y humanizaciones
Introducción
La estadística es la fase más importante dentro de la matemática ya que permite un estudio
más afondo dando conocer las características en una población, el cual se puede organizar
por medio las tablas y gráficos así permitiendo identificar mejor el análisis para poder
diferencia las conclusiones de cada población de una empresa etc.
Justificación
La estadística ahora en el mundo sea considerado como una de las más importancia
porque suministra los mejores instrumentos de investigación, no sólo para observar y
recopilar toda una gama de información incubada dentro de un mismo entorno o fuera de
ello, sino también en el control de ciertas actividades desarrolladas como son: producción,
ventas, organización, proyecciones o estimaciones a corto plazo, mediano y largo plazo,
procesos encaminados a facilitar la conceptualización y toma de decisiones de unos datos
plasmados en tablas y gráficos.
Objetivos

1. Consiste en indiferenciar acerca de los valores estadísticos de la población


denominan parámetros a través de la información obtenida mediante una muestra
que nos permite el cálculo estibadores

2. Permite identificar problemas por medio de gráficos y tablas así llevando un control

3. Interpretar las principales áreas del conocimiento donde se aplica la metodología


estadística.

4. Analizar la necesidad que tiene el investigador de organizar y presentar los datos en


cuadros o tablas de distribución de frecuencias.

5. Distinguir datos cualitativos y datos cuantitativos. Usar apropiadamente las


diferentes técnicas para elaborar tablas de distribución de frecuencias
Mapa mental

https://www.mindmeister.com/es/1187497437/medidas-de-estad-sticas-univariantes?
fullscreen=1#
Actividad 2. Definición de Conceptos.

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:


-Diagrama de dispersión.
-Correlación lineal simple.
-Coeficiente de determinación R2
-Correlación positiva y correlación negativa
- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
Diagrama de dispersión.

El Diagrama de Dispersión se denomina como el propósito de controlar mejor el proceso y


mejorarlo, es muy importante ya que nos permite conocer el comportamiento de las
variables y sus características de calidad entre sí, así descubrir si el comportamiento de
unas depende del comportamiento de otras, o no, y en qué grado.
El Diagrama de dispersión es una herramienta utilizada cuando se desea realizar un análisis
gráfico de datos vivaríamos, es decir, los que se refieren a dos conjuntos de datos. El
resultado del análisis puede mostrar que existe una relación entre una variable y la otra.
o El estudio puede ampliarse para incluir una medida cuantitativa de tal relación.
o Las dos variables pueden estar relacionadas de la siguiente manera:
o Una característica de calidad y un factor que incide sobre ella.
o Dos características de calidad relacionadas.
o Dos factores relacionados con una misma característica de calidad.
¿Para qué sirve el Diagrama de Dispersión?
Indica si dos variables (o factores o características de calidad) están relacionados.
Proporciona la posibilidad de reconocer fácilmente relaciones Causa / efecto.
¿Cómo se construye el Diagrama de Dispersión?
Paso 1.- Recolectar n parejas de datos de la forma (Xi, Yi), con i = 1, 2, 3, …n donde Xi y
Yi representan los valores respectivos de las dos variables. Los datos se suelen representar
en una tabla.
.
Paso2.- Diseñar las escalas apropiadas para los ejes X y Y.
Paso3.- Graficar las parejas de datos. Si hay puntos repetidos, se mostrarán como
círculos concéntricos.
Paso 4.- Documentar el diagrama.

Correlación lineal simple


Relación lineal
Es la que da con exactitud mediante una línea recta
Se puede decir que si hay dos variables cuantitativas existe una relación lineal, el análisis
de correlación lineal simple se usa para determinar la dirección y la magnitud de dicha
relación, La magnitud de la relación o grado de relación entre las variables se refiere a la
fuerza de la relación que existe entre las variables
Coeficiente de determinación R2
El coeficiente de determinación R2 se determina por la proporción de varianza total de la
variable explicada por la regresión. El coeficiente de determinación, también llamado R
cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar.
Es muy importante saber que el resultado del coeficiente de la determinación oscila entre 0
y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable
que estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos
ajustes estará el modelo y, por tanto, menos fiable será

En la expresión anterior tenemos una fracción. Así pues, vayamos por partes. En primer
lugar, analizaremos el numerador, es decir, la parte de arriba
Para aquellos que no conozcan la expresión de la varianza, les recomiendo que lean el
artículo sobre la misma. Para aquellos que sí la conozcan, podrán caer en la cuenta de que
es la expresión de la varianza, pero con dos diferencias fundamentales
La primera diferencia es que la Y lleva un circunflejo o lo que los profesores llaman de
forma didáctica “sombrerito”. Ese sombrerito lo que detalla es que esa Y es la estimación
de un modelo sobre lo que según las variables explicativas vale Y, pero no es el valor real
de Y, sino una estimación de Y.
En Segundo lugar, faltaría divido entre T. Que, en otros casos, se nota como N o número de
observaciones. Sin embargo, dado que la fórmula del denominador también la llevaría,
eliminamos los denominadores (parte de abajo) de ambas formulas para simplificar la
expresión. De esta manera es más fácil trabajar con ella.
A continuación, vamos a realizar el mismo análisis con la parte del denominador (parte de
abajo).

En este caso, la única diferencia existente respecto a la fórmula original de la varianza es la


ausencia de su denominador. Es decir, no dividimos entre T o N. De esta manera, una vez
explicadas las dos partes de la expresión genérica del R cuadrado o coeficiente de
determinación,
Correlación positiva y correlación negativa
La correlación positiva y correlación negativa es una medida de fuerza de la relación entre
dos variables. El coeficiente de correlación cuantifica el grado de cambio de una variable
en función del cambio de la otra variable. En estadística, la correlación está conectada con
el concepto de dependencia, que es la relación estadística entre dos variables.
El coeficiente de correlación de Pearson o el coeficiente de correlación producto-momento
de Pearson, o simplemente el coeficiente de correlación se obtiene Mediante las siguientes
fórmulas.
Para una población:
Para una muestra:
y la siguiente expresión es equivalente a la expresión anterior.
El coeficiente de correlación de Pearson (o simplemente el coeficiente de correlación) es el
coeficiente de correlación más utilizado y es válido solo para una relación lineal entre las
variables. r es un valor entre -1 y 1 (-1 ≤ r ≤ +1). Si r = 0, no existe una relación y, si r ≥ 0,
la relación es directamente proporcional y el valor de una variable aumenta con la otra. Si r
≤ 0, una variable disminuye a medida que la otra aumenta y viceversa.
Debido a la condición de linealidad, el coeficiente de correlación r también se puede usar
para establecer la presencia de una relación lineal entre las variables.
¿Cuál es la diferencia entre correlación positiva y correlación negativa?

• Cuando hay una correlación positiva (r> 0) entre dos variables aleatorias, una variable se
mueve proporcionalmente a la otra variable. Si una variable aumenta, la otra aumenta. Si
una variable disminuye, la otra también disminuye.
• Cuando hay una correlación negativa (r <0) entre las dos variables aleatorias, las variables
se mueven opuestas entre sí. Si una variable aumenta, la otra disminuye y viceversa.
• Una línea que se aproxima a una correlación positiva tiene un gradiente positivo, y una
línea que se aproxima a una correlación negativa tiene un gradiente negativo.
¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
La coeficiencia de correlación lineal nos ayuda es una medida que permite conocer el grado
de asociación lineal entre dos variables cuantitativas (X, Y).
En los siguientes Diagramas de dispersión se puede observar que existe una relación lineal
entre la variable X y la variable Y.

Sin embargo si trazamos una linea recta en los diagramas.

Podemos observar que en un diagrama B los puntos se acercan mas a la recta, caso
contrario en el diagrama A, los puntos están mas alejados. Entonces podemos decir que la
relación lineal del diagrama A es mas débil con comparación a la relación que existe en el
diagrama B.
Un diagrama dispersión no nos da certeza de que tan débil o fuerte es la relación lineal,
necesitamos una medida que nos de la fuerza de la asociación y la dirección que toma esta
relación.
Para esto sirve el coeficiente de correlación que esta dado por la siguiente formula.
¿De dónde sacamos estos valores?

Recordar entonces que el coeficiente de relación lineal, mide la fuerza y el sentido de la


relación lineal entre 2 variables cuantitativas.
Luego de haber aplicado la formula, según el resultado se puede clasificar en este rango.
Entre más cercano es a 1 es más fuerte, entre más cercano a 0 es débil hasta llegar hacerse
nula, si el valor del coeficiente de relación es -1 es una Asociación lineal perfecta Negativa,
si es 0 no existe relación y si es 1 es una Asociación Lineal perfecta Positiva.

¿Entonces como identificamos cuan dispersos son los puntos de la linea recta?.
Con la siguiente tabla podemos clasificar nuestros resultados y responder esta interrogante.
Actividad 3. Ejercicio práctico.
En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a
continuación; posterior a ello compartirá su elección en el foro del entorno de Aprendizaje
Foro de discusión Unidad 3- Paso 4 Descripción de la Información. En cada ejercicio
deberá responder los siguientes interrogantes:
Datos
1.Temperatura Media 2. Volumen
en grados centígrados de Gas
(X) consumido –
cm3 (Y)
3 7
6 5
3 8
1 8
5 7
7 5
9 4

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

Temperatura Media en grados centígrados (X) Vs Volumen de Gas


consumido – cm3 (Y)
9
8 f(x) = − 0.55 x + 8.96
R² = 0.88
7
6
Temperatura

5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
Volumen

Se evidencia dentro de la grafica una relación entre los datos negativos, ya que su
pendiente negativa
b. Encuentre el coeficiente de determinación y correlación.
El coeficiente de determinación según la grafica esta determinado por:

R2=0.88
Mientras que el coeficiente de correlación esta dado por:
r =√ 0.88
r =0.93

c. Determine el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?
A partir de la ecuacion que se tiene por medio de la grafica, lo se determina que hay una
correlación excelente de los datos lo cual es un modelo matemático confiable para este
caso.
y=−0.551 x +8.9618
Para ello se puede realizar una prueba con los datos existentes es decir:
1.Temperatura Media 2. Volumen de Gas
en grados centígrados consumido – cm3 (Y)
(X)
3 7

Para el primer caso


y=−0.551 x +8.9618
Reemplazamos el valor de (x)
y=−0.551 ( 3 )+ 8.9618
y=7.3
Como se puede determina, aunque no es exacta la predicción, pero tiene un acercamiento
considerable.

d. Determine el grado de relación de las dos variables.


El grado de relación entre las dos variables es excelente ya que r =0.93
Actividad 4. Regresión y correlación Lineal Simple.

Descripción de la Actividad Individual: A partir de la base de datos suministrada: Anexo 1-


Pruebas SABER 11 - 160 estudiantes 2020 (16-4), cada estudiante, deberá:
Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas e identificar la variable dependiente e independiente.
Las variables serán:
 Promedio general
 Edad del estudiante

Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


relación entre las variables.
Edad estudiante VS Promedio general
90.0

80.0

70.0 f(x) = − 5.48 x + 149.42


R² = 0.29
60.0
Promedio

50.0

40.0

30.0

20.0

10.0

0.0
12 13 14 15 16 17 18 19 20
Axis Title

Determine al coeficiente de determinación y de correlación de las dos variables.


Interprete los resultados
En este caso el coeficiente de determinación es de:

R2=0.293
Y el coeficiente de correlación
r =√ R

r =0.54

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?
El modelo matemático y teniendo en cuenta su coeficiente de correlación se puede
determinar que el modelo no es confiable de igual manera se realiza una prueba para
comprobar ello.
y=−5.4823 x +149.42

Comparando con el valor que es el correcto este se encuentra muy alejado por lo tanto el
modelo no es confiable.
Determine el tipo de correlación de las dos variables.
Existe una correlación negativa dentro de las dos variables.

Relacionar la información obtenida con el problema.


Tenemos en cuenta uno de los datos de la base de datos donde:
Promed
Edad io
15 58,0

y=−5.4823 x +149.42
Reemplazamos (x)
y=−5.4823 ( 15 ) +149.42
y=67.18
Conclusiones
La función más importante universalmente para aquellas personas que laboran dentro de
una organización empresarial, está es la decisión. Debido al enorme aumento de
disponibilidad de datos, a través de los computadores y de la gran complejidad, el proceso
de decisión está sometido a presiones extraordinarias. En el futuro, los responsables de las
decisiones tendrán que estar suficientemente familiarizados con las técnicas estadísticas
existentes, para poder determinar cuándo se puede analizar una situación mediante la
aplicación de la estadística.
Referencias bibliográficas

Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En: Estadística y muestreo,


13a ed. [Online] Bogotá: Ecoe Ediciones. (pp 570 – 582). Recuperado
de http://www.ebooks7-24.com.bibliotecavirtual.unad.edu.co/?il=739
 
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 130 – 158).
Recuperado  de https://link.gale.com/apps/doc/CX4052100011/GVRL?
u=unad&sid=GVRL&xid=696103db
Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:
Cengage Learning. (pp-675–686). Recuperado
de  https://link.gale.com/apps/doc/CX4058900232/GVRL?
u=unad&sid=GVRL&xid=a2479593
  Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto Politécnico
Nacional. (pp 21-29).  Recuperado de https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722       
 
OVI. Ortegon Pava, M. (27,07,2020). Regresión lineal. [Archivo de video]. Recuperado
de https://repository.unad.edu.co/handle/10596/35461

También podría gustarte