Está en la página 1de 16

1

Paso 4. Descripción de la Información.

Sergio Felipe Grisales

Mayo 2020

Universidad nacional abierta y a distancia-UNAD

ECACEN

Estadística descriptiva
2

Introducción.

En esta fase seguiremos profundizando en distintos conceptos y técnicas de estadística, en

este caso las medidas bivariantes, para esta fase veremos su importancia como herramienta, sus

utilidades, sus características, entre otras cosas. Es importante tener en cuenta que, como

administrador de empresas en formación, estos conceptos son una herramienta que aplicadas de

la manera correcta pó9nen a cualquier emprendedor un paso delante de los demás,

permitiéndonos casi que predecir cosas que sucederá permitiéndonos adelantar a los hechos. Es

por esto que profundizar e ir lo más lejos posible es muy importante y es algo en lo que seguiré

trabajando en mi vida académica y laboral.

• Justificación.

El motivo de este trabajo es conocer las medidas bivariantes, dominar sus herramientas y sus

procedimientos, con el fin de poderlos aplicar en contextos reales y así sacar provecho de esto,

dentro de un mercado de dura competencia y de gran hostilidad, la estadística sin duda me

pondrá un paso por delante del os demás y es por esto que una herramienta como esta no se

puede dejar de emplear si se quiere ser un profesional competitivo y exitoso.

• Objetivos.

General:

Dominar los conceptos relacionados a las medidas bivariantes con el fin de aplicarlos y hacer

grandes aportes a la economía local, mejorando las condiciones económicas del país dando un

grano de arena.

Específicos:

-profundizar en el conocimiento buscando llegar lo más lejos posible.


3

-Reflexionar sobre la importancia de estos conceptos en la vida personal y laboral de un

administrador d empresas.

-Aplicar los conocimientos en la vida cotidiana.

• Mapa Mental

• Definición de conceptos
4

• Definición de conceptos

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

-Diagrama de dispersión.

El diagrama de dispersión permite analizar si existe algún tipo de relación entre dos

variables. Por ejemplo, puede ocurrir que dos variables estén relacionadas de manera que al

aumentar el valor de una, se incremente el de la otra. En este caso hablaríamos de la existencia

de una correlación positiva.

-Correlación lineal simple.

La correlación lineal y la regresión lineal simple son métodos estadísticos que estudian la

relación lineal existente entre dos variables. Antes de profundizar en cada uno de ellos, conviene

destacar algunas diferencias:

 La correlación cuantifica como de relacionadas están dos variables, mientras que la

regresión lineal consiste en generar una ecuación (modelo) que, basándose en la relación existente

entre ambas variables, permita predecir el valor de una a partir de la otra.

 El cálculo de la correlación entre dos variables es independiente del orden o asignación de

cada variable a XX e YY, mide únicamente la relación entre ambas sin considerar dependencias.

En el caso de la regresión lineal, el modelo varía según qué variable se considere dependiente de

la otra (lo cual no implica causa-efecto).

 A nivel experimental, la correlación se suele emplear cuando ninguna de las variables se

ha controlado, simplemente se han medido ambas y se desea saber si están relacionadas. En el caso

de estudios de regresión lineal, es más común que una de las variables se controle (tiempo,

concentración de reactivo, temperatura…) y se mida la otra.


5

 Por norma general, los estudios de correlación lineal preceden a la generación de modelos

de regresión lineal. Primero se analiza si ambas variables están correlacionadas y, en caso de

estarlo, se procede a generar el modelo de regresión.

Correlación lineal

Para estudiar la relación lineal existente entre dos variables continuas es necesario disponer de

parámetros que permitan cuantificar dicha relación. Uno de estos parámetros es la covarianza, que

indica el grado de variación conjunta de dos variables aleatorias.

-Coeficiente de determinación R2

El coeficiente de determinación, se define como la proporción de la varianza total de la

variable explicada por la regresión. El coeficiente de determinación, también llamado R

cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar.

-Correlación positiva y correlación negativa

Con los diagramas de dispersión podemos ver cómo se relacionan ambas variables entre sí.

Esto es lo que se conoce como correlación. Hay tres tipos de correlación: positiva, negativa y

nula (sin correlación).

 Correlación positiva: ocurre cuando una variable aumenta y la otra también. Por

ejemplo, la altura de una persona y el tamaño de su pie; mientras aumenta la altura, el pie
6

también.

 Correlación negativa: es cuando una variable aumenta y la otra disminuye. El tiempo de

estudio y el tiempo que pasas jugando videojuegos, tienen una correlación negativa, ya que

cuando tu tiempo de estudio aumenta, no te queda tanto tiempo para jugar videojuegos.

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es

una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos

variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables,

es decir, si se representan en un diagrama de dispersión los valores que toman dos variables, el

coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos

representados se aproxima a una recta.

De una forma menos coloquial, la podemos definir como el número que mide el grado de

intensidad y el sentido de la relación entre dos variables

Análisis de correlación lineal simple de las dos variables cuantitativas seleccionadas.

(Laboratorio)

Laboratorio Regresión y Correlación Lineal: Desarrollar en el paso 4. Actividades a

desarrollar: Este ejercicio práctico, pretende hacer la transferencia del conocimiento adquirido a

partir de la elaboración del laboratorio de Regresión y Correlación Lineal, el cual se realizará


7

utilizando Microsoft Excel® la cual aparece instalada por defecto en el Office de su computador

o el software gratuito INFOSTAT, que podrá descargar ingresando a Laboratorios Estadística

Descriptiva: Infostat, Tutoriales, (Entorno de aprendizaje práctico). Cada estudiante deberá

resolver tres ejercicios según las opciones ofrecidas en la siguiente tabla, para ello deberán

compartir su elección en el foro del entorno de aprendizaje Colaborativo Paso 4 Descripción de

la Información, identificándolos de la siguiente tabla, donde anexará su nombre a la opción de

grupo de ejercicios escogido:

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables

Tipo de asociación: relación directa

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?

Es relativamente confiable pues está relativamente cerca de 1

y = 14,247x + 75,263
105 Título del gráfico R² = 0,8532
100

95

90

85
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8

A=20(2187,66)-(23,64)(1842,06)

------------------------------------
8

20(28,6686)-(23,64)(23,64)

A=43753,2-43546,2984

-------------------------

573,372-558,8496

A=206,9016

---------------

14,5224

A=14,2470666

B=1842,06-(14,2470666)(23,64)

------------------------------------

20

B=1842,06-336,800654

---------------------------

20
9

B=75,2629673

Y= 14,2470666x + 75,2629673

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos

variables.

Relación lineal positiva fuerte

El grado de correlación es elevado

R=0,923685
10

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 92,3?

92,3= 14,2470666 x + 75,2629673

X=1,19

1.4. X-Y Montaje – Horas de trabajo. En una empresa se desea verificar si la calidad de los

computadores con defectos de montaje tiene relación con las horas trabajadas por día. Los

siguientes datos representan dicha situación:

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama

de dispersión y determine el tipo de asociación entre las variables

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?


11

Título del gráfico


90
80 y = 0,7165x + 0,0067
R² = 0,9997
70
60
50
40
30
20
10
0
0 20 40 60 80 100 120

Es confiable pues es muy cercano a 1

c. Determine el grado de correlación de las dos variables.

0,999844

Correlación alta

Relación lineal positiva fuerte

d. ¿Cuál será la cantidad de computadores con defectos producidas si un trabajador labora 6

horas?

Y=0,7165(6) +0,0067

Y=4,3057

1.7. PIB-Energía. En un estudio realizado por la UNAD se desea analizar si el crecimiento

económico medido por el PIB es influenciado por el consumo de energía a partir de los

siguientes datos:
12

a. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.

¿Es confiable?
13

Título del gráfico y = 273,62x - 131,92


R² = 0,8465
600

500

400

300

200

100

0
2 2,05 2,1 2,15 2,2 2,25 2,3 2,35 2,4 2,45

Es relativamente confiable pues está relativamente cerca de 1

b. Determine el porcentaje de explicación del modelo y el grado de relación de las dos

variables.

Relación lineal positiva fuerte

Correlación

0,920028

El grado de correlación es alto

c. ¿Cuál podría ser la proyección de PIB para el año 2021 si se espera que el PIB nacional sea

del 3,2?

Y=272,62(3,2)-131,92

Y=740,464

• Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o

situación estudiada.
14

Actividad 4. Regresión y correlación Lineal. Para el desarrollo de esta actividad, es necesario

que el estudiante revise en el Entorno de conocimiento (Unidad 2), las siguientes referencias:

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cangare

Learning. Páginas 675 – 686 Descripción de la Actividad Individual: A partir de la base de datos

suministrada: Pruebas SABER 11 - 220 estudiantes 2020 (16-1), cada estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas e identificar la variable dependiente e independiente.

ESTRATO FAMILIAR x PUNT_LECTURA_CRITICA Y

X independiente

Y dependiente

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre

las variables.

PUNT_LECTURA_CRITICA y = 4,2727x + 44,519


100 R² = 0,2949

80

60

40

20

0
0 1 2 3 4 5 6 7

Relación lineal positiva.

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable? - Determine el grado de correlación de las dos variables.

No es muy confiable pues se encuentra muy lejano a 1


15

Correlación:

0,543073

La correlación es poca entre ellas dos

- Relacionar la información obtenida con el problema.

Según los datos arrojados puedo determinar que la relación entre el estrato de la familia no

infiere mucho en la capacidad de lectura crítica de los alumnos, al parecer podría estar más

ligada a algún otro aspecto como puede ser, las horas de estudio del joven o la cantidad de libros

de lectura que tiene en casa, o incluso el acceso a internet, en este sentido un estudiante de bajos

recursos con mucho esfuerzo puede tener excelentes desempeños en cuanto a la lectura crítica se

refiere si se esfuerce la suficiente y un alumno de estrato alto podría tener un mal desempeño si

no trabaja para ello.

• Conclusiones.

Para finalizar quiero concluir enfatizando en la importancia de estos conceptos, pues como

emprendedor soy consciente de la dura competencia que existe en el mercado y que aplicar estas

medidas me dará una tendía y datos muy valiosos que serán determinantes en el éxito o el

fracaso de cualquier empresa, es por esto que seguiré profundizando en mis conocimientos

llendo más allá sede mis límites, sabiendo que el esfuerzo es quien determina el éxito de todo

proyecto.

Sin duda estas herramientas deben ser empleadas de la mejor manera, teniendo en cuenta que

Colombia es un país en desarrollo es importante seguir reflexionando en la importancia de estos

conceptos para la economía del país, pues una empresa que triunfa puede significar empleo para
16

miles de personas, posibilidades y mejor futuro, y muchas empresas que triunfan pueden

representar una moneda más fuerte y al final mejores ingresos y familias que pueden salir de la

pobreza, es por esto que estos conocimientos no se deben quedar solo en el papel sino que deben

ser aplicados para mejorar las condiciones de vida de las personas fortaleciendo la economía,

compitiendo contra fuertes empresas de todo el mundo.

• Referencias Bibliográficas.

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:

Cengage Learning.

Anexos

Anexo 1 mapa mental Sergio Grisales

También podría gustarte