Está en la página 1de 17

Herramientas para la administración

Estadística básica
Herramientas para la administración
Estadística básica

Herramientas para la administración / Estadística básica 2


Herramientas para la administración / Estadística básica 3
Escuela de Negocios

Director de Escuela / Lorena Baus

ELABORACIÓN

Experto disciplinar / José Luis Fuentes Morales

Diseñador instruccional / Camila Palacios Dussuel

VALIDACIÓN PEDAGÓGICA

Jefa de diseño instruccional y multimedia / Alejandra San Juan Reyes

Experto disciplinar / Katherine Canales

DISEÑO DOCUMENTO

Equipo de Diseño Instruccional AIEP

Herramientas para la administración / Estadística básica 4


Contenido
Aprendizaje esperado de la semana ..................................................................................................................6
Ideas Clave ..................................................................................................................................................................6
1. Correlación de variables .....................................................................................................................................7
1.1 Variable independiente ............................................................................................................... 7
1.2 Variable dependiente .................................................................................................................. 7
2. Diagrama de dispersión .....................................................................................................................................8
Taller 1 ..........................................................................................................................................................................9
3. Recta de regresión lineal ................................................................................................................................. 11
Taller 2 ........................................................................................................................................................................ 12
4. Covarianza (σxy) .................................................................................................................................................. 13
Taller 3 ........................................................................................................................................................................ 13
5. Coeficiente de correlación Pearson (r)........................................................................................................ 14
Taller 4........................................................................................................................................................................ 14
6. Coeficiente de determinación (R2)................................................................................................................ 15
Taller 5 ........................................................................................................................................................................ 15
Conclusiones ............................................................................................................................................................ 17
Bibliografía ................................................................................................................................................................ 17
Enlaces y material multimedia ............................................................................................................................ 17

Herramientas para la administración / Estadística básica 5


Aprendizaje esperado de la semana
Aplican funciones de software de planilla de cálculo en el análisis de correlación, de acuerdo con
sus alcances

Ideas Clave
En esta semana, se complementarán los contenidos de la semana anterior profundizando un
análisis a partir de determinar la dependencia o no de dos variables cuantitativas.

Es importante considerar que hasta la semana pasada solo se analizó cada variable de manera
individual y las comparaciones entre ellas se hizo a través de cuadros.

Variables
dependientes

Variables
Correlación de variables

independientes

Diagrama de
disperción

Recta de regresión
lineal

Covarianza

Coeficiente de
correlación pearson

Coeficiente de
determinación

Herramientas para la administración / Estadística básica 6


1. Correlación de variables
El conocer la existencia o no una relación de dependencia entre dos variables es importante en
el análisis de datos porque permite modelar el comportamiento y encontrar una función que
explique dicho comportamiento que servirá al momento de pretender hacer predicciones.

En este módulo, solo se verá la relación entre variables cuantitativas. Eso no quiere decir que no
se puedan relacionar dos variables cualitativas. Para quienes quieran profundizar esto último, les
recomiendo estudiar el coeficiente de correlación Phi.

Para cualquier estudio de correlación de dos variables, es necesario determinar qué variable es
explicada por otra. Dicho de otra forma, se debe conocer cuál es la variable dependiente y cuál
es la variable independiente.

1.1 Variable independiente


Es aquella que se define como la que, en la medida de ser intervenida, porducirá una variación
en la variable que se defina como dependiente. En una gráfica, corresponde al eje de las abscisas
(eje horizontal). En el modelo matemático, corresponde a la variable x.

1.2 Variable dependiente


Es aquella cuya respuesta variará dependiendo directamente de los valores que tome la variable
independiente. En una gráfica, corresponde al eje de las ordenadas (eje vertical). En el modelo
matemático, corresponde a la variable y.

E JES X E Y EN UN GRÁFICO

Herramientas para la administración / Estadística básica 7


2. Diagrama de dispersión
Una de las primeras herramientas que puede mostrar la existencia o no de una relación entre
dos variables es el diagrama de dispersión. Corresponde a una representación visual a partir de
una gráfica cuya lectura permite inferir a priori la existencia de una relación de dos variables. No
es concluyente, puesto que para concluir de debe realizar otros procedimientos.

Un diagrama de dispersión muestra puntos en donde cada uno de ellos representa una
observación que responde a dos características que están siendo analizadas.

La gráfica puede visualizarse de las siguientes formas:

Herramientas para la administración / Estadística básica 8


Si se analizan los tres pares de imágenes, se puede concluir que:

• En la primeras dos, aparentemente y teniendo como referencia los valores que va


tomando el eje x, se podría concluir que, a mayor valor de la variable x, también es mayor
el valor que tomará la variable y. Esto indicaría una correlación positiva.

• En la segundas dos, aparentemente y teniendo como referencia los valores que va


tomando el eje x, se podría concluir que, a mayor valor de la variable x, es menor el valor
que tomará la variable y. Esto indicaría una correlación negativa.

• En las últimas dos figuras, no se puede inferir ninguna de las situaciones descritas en la
figuras anteriores. Esto indicaría que no existe correlación.

Taller 1
La siguiente tabla muestra los registros de estatura y peso de un grupo de personas. Se pide
mostrar visualmente la información a través de un diagrama de dispersión.
Registro Estatura (x) Peso (y) Registro Estatura (x) Peso (y)
1 180 77 16 173 66
2 160 68 17 164 70
3 165 77 18 166 74
4 191 110 19 185 96
5 156 60 20 159 65
6 150 55 21 167 59
7 166 64 22 180 74
8 181 78 23 187 84
9 176 86 24 164 70
10 159 68 25 168 73
11 163 80 26 172 66
12 170 84 27 174 79
13 177 90 28 181 93
14 195 97 29 190 98
15 180 66 30 168 77

Para esto, la herramienta de Excel a utilizar es la misma que la que hemos utilizado para hacer
cualquier gráfica. La diferencia es que, al momento de elegir el tipo, se debe seleccionar
Dispersión, tal como se muestra a continuación.

Al igual que todos los gráficos, le propondrá varios modelos. Por ahora, solo utilizaremos aquel
que muestra los puntos.

Herramientas para la administración / Estadística básica 9


Seleccione como rango las dos variables a graficar. Luego, haga clic en Insertar gráfico,
Dispersión y dar la opción que se muestra.

La gráfica resultante será:

Como se mencionó anteriormente, el diagrama permite visualizar la tendencia. Sin embargo,


para cerciorarse que esta tendencia es la correcta, será necesario analizar el coeficiente de
regresión Pearson (r).

Antes de ver como se calcula, es necesario señalar que se asumirá que el modelo que explica la
relación de las variables sigue un comportamiento lineal, por lo que será necesario calcular la
recta de regresión lineal.

Herramientas para la administración / Estadística básica 10


3. Recta de regresión lineal
La recta de regresión lineal es un modelo matemático que define la dependencia de dos
variables bajo el supuesto de un comportamiento definido por la ecuación de la recta. La
regresión lineal puede ser del tipo simple o múltiple y por los contenidos del módulo se trabajará
solo con regresión lineal simple.

Se sabe que la función lineal tiene la forma:

A partir de lo anterior, la recta de regresión lineal simple será:

Para calcular los parámetros, es necesario utilizar las siguientes fórmulas

La importancia radica es que al conocerla se pueden hacer predicciones como, por ejemplo:

• Se desea saber el peso óptimo (y) si se conoce una estatura de 179 centímetros. Si se ve
la información inicial, no hay referencia al respecto. Sin embargo, conociendo la recta,
se puede reemplazar el valor en x y se dará respuesta a la interrogante.

y = - 86,1965 + 0,9488 (179)

Se desea saber qué estatura (x) debe tener una persona cuyo peso es de 71 kilogramos. Al igual
que el ejemplo anterior, en la base de datos, no existe referencia para ese peso. La solución es
simple, reemplazar el valor de y en la recta de regresión y resolver la ecuación de primer grado
que queda.

71 = - 86,1965 + 0,9488(x)

Herramientas para la administración / Estadística básica 11


Taller 2
Para este ejercicio, debemos calcular la recta de regresión del ejercicio desarrollado en el Taller
1. Para esto, será necesario agregar las columnas y totales necesarios para reemplazar en las
fórmulas. El primer parámetro por calcular es b1, puesto que para calcular b0 se necesita el valor
de b1.
Registro Estatura Peso (y) xy x² Registro Estatura Peso (y) xy x²
(x) (x)
1 180 77 1386 32400 16 173 66 11418 29929
2 160 68 10880 25600 17 164 70 11480 26896
3 165 77 12705 27225 18 166 74 12284 27556
4 191 110 21010 36481 19 185 96 17760 34225
5 156 60 9360 24336 20 159 65 10335 25281
6 150 55 8250 22500 21 167 59 9853 27889
7 166 64 10624 27556 22 180 74 13320 32400
8 181 78 14118 32761 23 187 84 15708 34969
9 176 86 15136 30976 24 164 70 11480 26896
10 159 68 10812 25281 25 168 73 12264 28224
11 163 80 12877 26569 26 172 66 11352 29584
12 170 84 13600 28900 27 174 79 13746 30276
13 177 90 14868 31329 28 181 93 16833 32761
14 195 97 17550 38025 29 190 98 18620 36100
15 180 66 17460 32400 30 168 77 12936 28224
Totales x: 5167 y: 2317 xy: 402499 x²: 893549

Reemplazando los totales y los productos en la fórmula, resulta

Por lo anterior, la recta de regresión es:

Herramientas para la administración / Estadística básica 12


4. Covarianza (σxy)
Conocido el concepto de regresión lineal, cómo se calcula y su importancia, corresponde ver si
el modelo elegido explica significativamente la relación entre las variables. Para esto, será
necesario conocer y calcular:

• La covarianza
• El coeficiente de correlación de Pearson
• El coeficiente de determinación
Para el desarrollo de estos contenidos, se utilizarán funciones que ofrece Excel.

La covarianza indica la relación lineal entre dos variables, indicando el grado de variación
respecto de sus medias. Por sí sola, no es suficiente para determinar la relación.

• Si σxy > 0, existe dependencia directa


• Si σxy < 0, existe dependencia inversa
• Si σxy = 0, no existe dependencia

Taller 3
Calcularemos la covarianza utilizando funciones de Excel. Para esto, debemos ubicarnos en una
celda y utilizar la función =COVARIANZA(rango1;rango2), como se muestra a continuación.

El resultado es σxy = 114,47

Interpretación: existe correlación directa.

Herramientas para la administración / Estadística básica 13


5. Coeficiente de correlación Pearson (r)
El coeficiente de correlación de Pearson mide qué tan fuerte es la relación entre las variables de
una correlación. Resulta del cociente entre la covarianza y el producto de las respectivas
desviaciones estándares de las variables relacionadas. Se utiliza cuando los datos vienen de
poblaciones normales y sus valores están entre -1 y 1:

• Si se acerca a -1, correlación negativa fuerte


• Si se acerca a 1, correlación positiva fuerte
• Si es 0, no existe correlación
Excel ofrece una función que permite calcularla sin recurrir a utilizar fórmulas.

Taller 4
Calcularemos e interpretaremos el coeficiente de correlación Pearson utilizando herramienta de
Excel. La forma de hacerlo es igual que para calcular la covarianza, solo hay que cambiar la
función por =COEF.DE.CORREL(rango1;rango2)

El resultado es r = 0,81908

Interpretación: la correlación de las variables es directa (positiva) y fuerte. Lo anterior quiere decir
que a mayor estatura implicará mayor peso.

Herramientas para la administración / Estadística básica 14


Observación: existen muchas escalas para interpretar el coeficiente de correlación Pearson.
Nosotros utilizaremos la siguiente.

6. Coeficiente de determinación (R2)


Resulta de elevar al cuadrado el coeficiente de correlación de Pearson.

• Mide la calidad del modelo


• Se conoce como bondad de ajuste
• Se expresa en porcentaje
Si se toma r = 0,81908 obtenido en el taller 4, R2 = 0,6709

Taller 5
Elaboraremos un diagrama de dispersión que muestre:

• La recta de regresión

• El coeficiente de determinación

Para esto, se debe modificar la gráfica del Taller 1, utilizando la herramienta de Excel que ofrece
hacer un diseño rápido, como se muestra a continuación:

Herramientas para la administración / Estadística básica 15


Luego, debemos elegir la opción que entrega lo solicitado:

Finalmente, debemos hacer los ajustes finales, como eliminar lo que no se necesita (referencia
al costado derecho) y mover la recta con el coeficiente fuera del gráfico para una mejor
visualización.

Si observan, la recta de regresión es exactamente la misma calculada en el Taller 2.

Herramientas para la administración / Estadística básica 16


Conclusiones
Esta semana, se ha profundizado en los contenidos de estadística con el fin de realizar análisis
más completos de los datos con que trabajemos. El relacionar dos variables cuantitativas para
medir el grado de dependencia entre ellas es una herramienta importante si se desea investigar
situaciones en las que se tiene indicio de que la respuesta de una variable está influenciada por
el comportamiento de otra.

El encontrar el modelo matemático que se ajuste a las variaciones de las características relacionas
es otra herramienta útil al momento de predecir comportamientos.

Descarguen la base de datos adjunta y repliquen los ejemplos de desarrollados en la semana.

Bibliografía
• Teoría y problemas de probabiliad y estadística. Autor: Spiegel, Murray R. Ed. McGraw-
Hill. Serie Schaum; México.

Enlaces y material multimedia

MÓDULO: Herramientas para la administración Unidad: Estadística básica


Recurso Descripción

En el siguiente enlace, encontrarás una guía para realizar gráficos de dispersión


en Microsoft Excel:
https://www.youtube.com/watch?v=coRKk-H1Osg
Video

Herramientas para la administración / Estadística básica 17

También podría gustarte