Está en la página 1de 16

Paso 4. Descripción de la Información.

Sergio Felipe Grisales

Mayo 2020

Universidad nacional abierta y a distancia-UNAD

ECACEN

Estadística descriptiva
Introducción.

En esta fase seguiremos profundizando en distintos conceptos y técnicas de estadística, en

este caso las medidas bivariantes, para esta fase veremos su importancia como herramienta,

sus utilidades, sus características, entre otras cosas. Es importante tener en cuenta que, como

administrador de empresas en formación, estos conceptos son una herramienta que aplicadas

de la manera correcta pó9nen a cualquier emprendedor un paso delante de los demás,

permitiéndonos casi que predecir cosas que sucederá permitiéndonos adelantar a los hechos.

Es por esto que profundizar e ir lo más lejos posible es muy importante y es algo en lo que

seguiré trabajando en mi vida académica y laboral.

• Justificación.

El motivo de este trabajo es conocer las medidas bivariantes, dominar sus herramientas y

sus procedimientos, con el fin de poderlos aplicar en contextos reales y así sacar provecho de

esto, dentro de un mercado de dura competencia y de gran hostilidad, la estadística sin duda

me pondrá un paso por delante del os demás y es por esto que una herramienta como esta no

se puede dejar de emplear si se quiere ser un profesional competitivo y exitoso.

• Objetivos.

General:

Dominar los conceptos relacionados a las medidas bivariantes con el fin de aplicarlos y

hacer grandes aportes a la economía local, mejorando las condiciones económicas del país

dando un grano de arena.

Específicos:

-profundizar en el conocimiento buscando llegar lo más lejos posible.

-Reflexionar sobre la importancia de estos conceptos en la vida personal y laboral de un

administrador d empresas.
-Aplicar los conocimientos en la vida cotidiana.

• Mapa Mental

• Definición de conceptos
• Definición de conceptos

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

-Diagrama de dispersión.

El diagrama de dispersión permite analizar si existe algún tipo de relación entre dos

variables. Por ejemplo, puede ocurrir que dos variables estén relacionadas de manera que al

aumentar el valor de una, se incremente el de la otra. En este caso hablaríamos de la

existencia de una correlación positiva.

-Correlación lineal simple.

La correlación lineal y la regresión lineal simple son métodos estadísticos que estudian la

relación lineal existente entre dos variables. Antes de profundizar en cada uno de ellos,

conviene destacar algunas diferencias:

 La correlación cuantifica como de relacionadas están dos variables, mientras que la

regresión lineal consiste en generar una ecuación (modelo) que, basándose en la relación

existente entre ambas variables, permita predecir el valor de una a partir de la otra.

 El cálculo de la correlación entre dos variables es independiente del orden o asignación

de cada variable a XX e YY, mide únicamente la relación entre ambas sin considerar

dependencias. En el caso de la regresión lineal, el modelo varía según qué variable se considere

dependiente de la otra (lo cual no implica causa-efecto).

 A nivel experimental, la correlación se suele emplear cuando ninguna de las variables

se ha controlado, simplemente se han medido ambas y se desea saber si están relacionadas. En

el caso de estudios de regresión lineal, es más común que una de las variables se controle

(tiempo, concentración de reactivo, temperatura…) y se mida la otra.

 Por norma general, los estudios de correlación lineal preceden a la generación de

modelos de regresión lineal. Primero se analiza si ambas variables están correlacionadas y, en

caso de estarlo, se procede a generar el modelo de regresión.


Correlación lineal

Para estudiar la relación lineal existente entre dos variables continuas es necesario disponer

de parámetros que permitan cuantificar dicha relación. Uno de estos parámetros es la

covarianza, que indica el grado de variación conjunta de dos variables aleatorias.

-Coeficiente de determinación R2

El coeficiente de determinación, se define como la proporción de la varianza total de la

variable explicada por la regresión. El coeficiente de determinación, también llamado R

cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar.

-Correlación positiva y correlación negativa

Con los diagramas de dispersión podemos ver cómo se relacionan ambas variables entre

sí. Esto es lo que se conoce como correlación. Hay tres tipos de correlación: positiva,

negativa y nula (sin correlación).

 Correlación positiva: ocurre cuando una variable aumenta y la otra también. Por

ejemplo, la altura de una persona y el tamaño de su pie; mientras aumenta la altura, el pie

también.

 Correlación negativa: es cuando una variable aumenta y la otra disminuye. El

tiempo de estudio y el tiempo que pasas jugando videojuegos, tienen una correlación
negativa, ya que cuando tu tiempo de estudio aumenta, no te queda tanto tiempo para jugar

videojuegos.

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

La correlación, también conocida como coeficiente de correlación lineal (de Pearson),

es una medida de regresión que pretende cuantificar el grado de variación conjunta

entre dos variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos

variables, es decir, si se representan en un diagrama de dispersión los valores que toman dos

variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de

puntos representados se aproxima a una recta.

De una forma menos coloquial, la podemos definir como el número que mide el grado de

intensidad y el sentido de la relación entre dos variables

Análisis de correlación lineal simple de las dos variables cuantitativas seleccionadas.

(Laboratorio)

Laboratorio Regresión y Correlación Lineal: Desarrollar en el paso 4. Actividades a

desarrollar: Este ejercicio práctico, pretende hacer la transferencia del conocimiento

adquirido a partir de la elaboración del laboratorio de Regresión y Correlación Lineal, el cual

se realizará utilizando Microsoft Excel® la cual aparece instalada por defecto en el Office de

su computador o el software gratuito INFOSTAT, que podrá descargar ingresando a

Laboratorios Estadística Descriptiva: Infostat, Tutoriales, (Entorno de aprendizaje práctico).

Cada estudiante deberá resolver tres ejercicios según las opciones ofrecidas en la siguiente

tabla, para ello deberán compartir su elección en el foro del entorno de aprendizaje
Colaborativo Paso 4 Descripción de la Información, identificándolos de la siguiente tabla,

donde anexará su nombre a la opción de grupo de ejercicios escogido:

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables

Tipo de asociación: relación directa

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?

Es relativamente confiable pues está relativamente cerca de 1

y = 14,247x + 75,263
105 Título del gráfico R² = 0,8532
100

95

90

85
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8

A=20(2187,66)-(23,64)(1842,06)

------------------------------------

20(28,6686)-(23,64)(23,64)
A=43753,2-43546,2984

-------------------------

573,372-558,8496

A=206,9016

---------------

14,5224

A=14,2470666

B=1842,06-(14,2470666)(23,64)

------------------------------------

20

B=1842,06-336,800654

---------------------------

20

B=75,2629673
Y= 14,2470666x + 75,2629673

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos

variables.
Relación lineal positiva fuerte

El grado de correlación es elevado

R=0,923685

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 92,3?

92,3= 14,2470666 x + 75,2629673

X=1,19

1.4. X-Y Montaje – Horas de trabajo. En una empresa se desea verificar si la calidad de

los computadores con defectos de montaje tiene relación con las horas trabajadas por día. Los

siguientes datos representan dicha situación:

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el

diagrama de dispersión y determine el tipo de asociación entre las variables

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?


Título del gráfico
90
80 y = 0,7165x + 0,0067
R² = 0,9997
70
60
50
40
30
20
10
0
0 20 40 60 80 100 120

Es confiable pues es muy cercano a 1

c. Determine el grado de correlación de las dos variables.

0,999844

Correlación alta

Relación lineal positiva fuerte

d. ¿Cuál será la cantidad de computadores con defectos producidas si un trabajador labora

6 horas?

Y=0,7165(6) +0,0067

Y=4,3057

1.7. PIB-Energía. En un estudio realizado por la UNAD se desea analizar si el crecimiento

económico medido por el PIB es influenciado por el consumo de energía a partir de los

siguientes datos:
a. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la

otra. ¿Es confiable?


Título del gráfico y = 273,62x - 131,92
R² = 0,8465
600

500

400

300

200

100

0
2 2,05 2,1 2,15 2,2 2,25 2,3 2,35 2,4 2,45

Es relativamente confiable pues está relativamente cerca de 1

b. Determine el porcentaje de explicación del modelo y el grado de relación de las dos

variables.

Relación lineal positiva fuerte

Correlación

0,920028

El grado de correlación es alto

c. ¿Cuál podría ser la proyección de PIB para el año 2021 si se espera que el PIB nacional

sea del 3,2?

Y=272,62(3,2)-131,92

Y=740,464

• Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema

o situación estudiada.

Actividad 4. Regresión y correlación Lineal. Para el desarrollo de esta actividad, es

necesario que el estudiante revise en el Entorno de conocimiento (Unidad 2), las siguientes

referencias: Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.


Paginas. 151 – 158. Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.

México City: Cangare Learning. Páginas 675 – 686 Descripción de la Actividad Individual:

A partir de la base de datos suministrada: Pruebas SABER 11 - 220 estudiantes 2020 (16-1),

cada estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas e identificar la variable dependiente e independiente.

ESTRATO FAMILIAR x PUNT_LECTURA_CRITICA Y

X independiente

Y dependiente

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación

entre las variables.

PUNT_LECTURA_CRITICA y = 4,2727x + 44,519


100 R² = 0,2949

80

60

40

20

0
0 1 2 3 4 5 6 7

Relación lineal positiva.

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable? - Determine el grado de correlación de las dos variables.

No es muy confiable pues se encuentra muy lejano a 1

Correlación:

0,543073

La correlación es poca entre ellas dos


- Relacionar la información obtenida con el problema.

Según los datos arrojados puedo determinar que la relación entre el estrato de la familia no

infiere mucho en la capacidad de lectura crítica de los alumnos, al parecer podría estar más

ligada a algún otro aspecto como puede ser, las horas de estudio del joven o la cantidad de

libros de lectura que tiene en casa, o incluso el acceso a internet, en este sentido un estudiante

de bajos recursos con mucho esfuerzo puede tener excelentes desempeños en cuanto a la

lectura crítica se refiere si se esfuerce la suficiente y un alumno de estrato alto podría tener un

mal desempeño si no trabaja para ello.

• Conclusiones.

Para finalizar quiero concluir enfatizando en la importancia de estos conceptos, pues como

emprendedor soy consciente de la dura competencia que existe en el mercado y que aplicar

estas medidas me dará una tendía y datos muy valiosos que serán determinantes en el éxito o

el fracaso de cualquier empresa, es por esto que seguiré profundizando en mis conocimientos

llendo más allá sede mis límites, sabiendo que el esfuerzo es quien determina el éxito de todo

proyecto.

Sin duda estas herramientas deben ser empleadas de la mejor manera, teniendo en cuenta

que Colombia es un país en desarrollo es importante seguir reflexionando en la importancia

de estos conceptos para la economía del país, pues una empresa que triunfa puede significar

empleo para miles de personas, posibilidades y mejor futuro, y muchas empresas que triunfan

pueden representar una moneda más fuerte y al final mejores ingresos y familias que pueden

salir de la pobreza, es por esto que estos conocimientos no se deben quedar solo en el papel

sino que deben ser aplicados para mejorar las condiciones de vida de las personas

fortaleciendo la economía, compitiendo contra fuertes empresas de todo el mundo.


• Referencias Bibliográficas.

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:

Cengage Learning.

Anexos

Anexo 1 mapa mental Sergio Grisales

También podría gustarte