Está en la página 1de 15

1

ESTADISTICA DESCRIPTIVA GRUPO

100105_17

Paso tres. Análisis de la información

PRESENTADO POR:

LAURA VANESSA ALVARADO-CÓDIGO: 1023970869

PRESENTADO A TUTOR:

CAMPO RIANO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)

ECACEN

BOGOTA, ABRIL 2020


2

INTRODUCCION.

En el presente trabajo, se presentara inicialmente un mapa mental construido por el estudiante

sobre las medidas estadísticas bivariantes de regresión y correlación. Posteriormente, se hará

una definición para el diagrama de dispersión, correlación lineal simple, coeficiente ed

determinación R2, correlacion positiva y negativa y la aplicación de correlación lineal.

Se demostrara la apropiación de temas con la realización de un laboratorio, creado por el curso

de estadística, donde se seleccionaran diferentes puntos, para el desarrollo y aplicación de los

diferentes conceptos.

Finalmente se desarrollara la actividad propuesta por el curso, donde se seleccionaran dos

variables cuantitativas, para este caso fue número de libros y promedio general, para

identificar según los resultados obtenidos, los factores que influyen e los resultados de las

pruebas SABER 11, permitiendo en si manejar una información precisa y eficaz ara el análisis

de estudio con respecto a la problemática.


3

JUSTIFICACION.

Esta investigación, se realiza con el fin de aplicar los conocimientos de la estadística

descriptiva, por medio de las medidas bivariantes, las cuales permiten obtener una grafica o

diagrama de dispersión y notar la concentración de resultados. Por otro lado, se puede

determinar como el grado de distanciamiento de un conjunto de valores, con respecto al

valor medio. Siendo asi que se derivan las medidas de dispersión como: rango, varianza,

desviación, covarianza, coeficiente de correlación.

El diagrama de dispersión o gráfico de dispersión, consiste en la representación gráfica de

dos variables para un conjunto de datos. Es decir, se puede analizar la relación de dos

variables, conceiendo que tanto se afectan entre sí, o de que manera pueden ser

independientes una de la otra.

Posteriormente, ambas variables se representan como un punto en el plano cartesiano y

dependiendo la relación que existen entre ellas, se define se define su tipo de correlación.

Del mimo modo, la correlación simple o lineal, Tambien conocida como, coeficiente de

correlación lineal de Pearson, es una medida de regresiónque pretende cuantificar, el grado de

variación conjunta entre dos variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es

decir que, si se representan enn un diagrama de dispersión de valores los valores que toan dos

variables, el coeficiente de correlación demostrara lo bien o lo mal que el diagrama de puntos,

representados se aproxima auna recta.

, La covarianza, depende de las escalas en que se miden las variables, por lo tanto no es

comparable. Sedebe aclarar que para hacer comparaciones, se estanderiza la covarianza,

generando lo que se conoce como coeficiente s de correlación. El coeficiente de

determinación que tiene como función principal, de predecir el resultado de la hipótesis.

Se puede predecir, una variable considerada aleatoria a través de su medida. El resultado puede
4

variar entre 0 y 1, esto significa que mientras más cerca esté del uno estará más ajustada a la

variable que intentas probar, mientras que en el caso contrario, es decir, cuanto más se acerca a 0

menos fiable será ya que estará menos ajustado el modelo. Siendo así, las medidas más estratégicas

por medio del programa Infostat, que realiza los cálculos pertinentes obteniendo la mayor y

coherente información, con el fin de estudiar, analizar y comprender los factores, en este caso las

variables escogidas para determinar un tipo de solución.


5

OBJETIVOS.

Aplicar las medidas bivariantes, en función de la problemática de estudio

(Factores que influyen en los resultados de las pruebas SABER 11).

Objetivos Específicos:

 Identificar cuales son las medidas univariantes.

 Realizar los ejercicios planteados en el laboratorio.

 Seleccionar dos varibales cuantitativas desde la base de datos de los

estudiantes.

 Calcular e interpretar los resultados obtenidos.

 Relacionar los resultados con la problemática presentada.


6

Actividades a desarrollar

Actividad 1. Mapa Mental

Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión y


correlación.

Actividad 2. Definición de Conceptos.

Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de


conocimiento (Unidad 2), las siguientes referencias:

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 –
158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage
Learning. Páginas 675 – 686

Descripción de la Actividad Individual:

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

-Diagrama de dispersión.

Dispersión, se puede determinar como el grado de distanciamiento de un conjunto de


7

valores, con respecto al valor medio. Siendo asi que se derivan las medidas de dispersión
como: rango, varianza, desviación, covarianza, coeficiente de correlación.
El diagrama de dispersión o gráfico de dispersión, consiste en la representación gráfica de
dos variables para un conjunto de datos. Es decir, se puede analizar la relación de dos
variables, conceiendo que tanto se afectan entre sí, o de que manera pueden ser
independientes una de la otra.
Posteriormente, ambas variables se representan como un punto en el plano cartesiano y
dependiendo la relación que existen entre ellas, se define se define su tipo de correlación.

-Correlación lineal simple.

Son métodos estadísticos, que estudia la relación lineal que existe entre dos variables. Uno
de los parámetros mas destacados es la covarianza, la cual indica el grado de variación
conjunta de dos variables aleatorias.

La covarianza, depende de las escalas en que se miden las variables, por lo tanto no es
comparable. Sedebe aclarar que para hacer comparaciones, se estanderiza la covarianza,
generando lo que se conoce como coeficiente s de correlación.

-Coeficiente de determinación R2.

Coeficiente de determinación, que se conoce también como R2, que tiene como función
principal, de predecir el resultado de la hipótesis.
Se puede predecir, una variable considerada aleatoria a través de su medida. El resultado
puede variar entre 0 y 1, esto significa que mientras más cerca esté del uno estará más
ajustada a la variable que intentas probar, mientras que en el caso contrario, es decir, cuanto
más se acerca a 0 menos fiable será ya que estará menos ajustado el modelo.

-Correlación positiva y correlación negativa.


Correlación positiva:
Se presenta cuando una variable aumenta, o disminuye una de la otra respectivamente,
8

Existe una relación proporcional.

Correlación Negativa:
Se presenta cuando, una variable se importa de fora contraria o de la otra, es decir que si una
variable aumenta la otra disminuye. Hay una relación inversa proporcional.

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

Tambien conocida como, coeficiente de correlación lineal de Pearson, es una medida de

regresiónque pretende cuantificar, el grado de variación conjunta entre dos variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es

decir que, si se representan enn un diagrama de dispersión de valores los valores que toan dos

variables, el coeficiente de correlación demostrara lo bien o lo mal que el diagrama de puntos,

representados se aproxima auna recta.


9

Se habla de correlación positiva si siempre que el valor «x» sube, el valor «y» sube, y además
con la misma intensidad (+1).

En el caso opuesto, si siempre que el valor «x» sube, y el valor «y» baja, y además con la
misma intensidad, entonces estamos hablando de correlación negativa (-1).

Actividad 4. Regresión y correlación Lineal.

Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de


conocimiento (Unidad 2), las siguientes referencias:

Descripción de la Actividad Individual:

A partir de la base de datos suministrada: Pruebas SABER 11 - 220 estudiantes 2020 (16-1),
cada estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas
e identificar la variable dependiente e independiente.
Variable Numero de libros (Regresora)
Variable Promedio (Dependiente)

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre


las variables.
10

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra.
¿Es confiable?

Ecuación Lineal

Y =m ( X ) + b

Donde m= Pendiente
Donde b= Ordenada al origen

ENTONCES, el modelo matemático que asocia EL NUMERO DE LIBROS Y PROMEDIO


- Determine el grado de correlación de las dos variables
11

Entonces: Y =0,45 ( X ) +52,44

Coeficiente de determinación= 0,11*100%= Es del 11%, lo que indica la confiabilidad


del modelo matemático.
Si hallamos la raíz de cuadrada de 0,11, se obtiene 3,3 que es el coeficiente de
correlación y mide el tipo de correlación entre número de libros y promedio general.

A partir del coeficiente de determinación= 0,11se puede concluir que el modelo matemático es

confiable un 11%.
12

Indica, que los números de libros no dependen para el resultado del promedio general, ya que

en algunos casos, como se puede determinar en la gráfica de dispersión, pueden haber ledio

bastantes libros y el puntaje general no es tan alto y de manera inversa. Donde no habría

correlación.

- Relacionar la información obtenida con el problema.

Con la información obtenida de las dos variables relacionadas donde el promedio dependiente

del número de libros, pero con los resultados obtenidos se puede notar que primeramente

el modelo matemático, no es tan confiable ya que cuenta con un 11%, además se puede

notar que varios estudiantes que pueden tener un alto nivel de lectura no cuentan con un

buen puntaje en las pruebas, entonces se puede decir que no es un variable totalmente

dependiente. Porque actualmente, se puede determinar que hay mas factores que

intervienen para los resultados en las PRUEBAS SABER 11, también puede entrar la

variable de horas de dedicación a Internet porque puede ser una estrategia de educación

virtual y audiovisual. Al relacionar toda la información, se puede concluir que hay mas

factores a estudiar, ya que cuando se estudió las dos variables anteriores no se pudo

determinar en si los factores.


13

CONCLUSIONES
14

REFERENCIAS.
15

También podría gustarte