Está en la página 1de 62

UNIDAD DIDÁCTICA DE

ESTADÍSTICA PARA LOS


NEGOCIOS

PORTAFOLIO DEL
ESTUDIANTE
Unidad 3
Estadística descriptiva 1
Duración: Semana 11-15

LOGRO: Resuelve situaciones problemáticas


mediante la determinación e interpretación de
indicadores de dispersión y el análisis de la
correlación y regresión lineal con miras a
optimizar los procesos de toma de decisiones
vinculadas al ámbito de los negocios en MS
EXCEL y PSPP.

Temas de la unidad:
 Rúbrica a la evaluación continua N°3
 Medidas de variabilidad
 Correlación y regresión lineal
 Aplicación de negocios
 Preparatorio de la evaluación continua N°3


ESTADÍSTICA PARA LOS NEGOCIOS
INDICADOR DE LOGRO Nº3: ESTADÍSTICA DESCRIPTIVA 2
RÚBRICA DE EVALUCIÓN: EC3

LOGRADO EN PROCESO/LOGRADO CON


CRITERIOS LOGRADO NO LOGRADO
SOBRESALIENTE DIFICULTADES
Calcula e interpreta las medidas Calcula e interpreta las medidas de Calcula e interpreta las medidas de Calcula e interpreta las medidas de
MEDIDAS DE de variabilidad en un 100% en variabilidad en un 75% en las variabilidad un 50% en las tablas variabilidad en un 25% en las
VARIABILIDAD las tablas cuantitativas en Excel tablas cuantitativas en Excel y cuantitativas en Excel y PSPP, en los dos tablas cuantitativas en Excel y
(CALCULADORA, y PSPP, en los dos casosPSPP, en los dos casos planteados. casos planteados. PSPP, en los dos casos planteados.
EXCEL Y PSPP) planteados.
6 PUNTOS 5 PUNTOS 4 PUNTO 3 PUNTOS
Calcula e interpreta el Calcula e interpreta el coeficiente No calcula el coeficiente de
COEFICIENTE DE Calcula e interpreta el coeficiente de
coeficiente de correlación y de correlación y determinación de correlación y determinación de
CORRELACIÓN y correlación y determinación de Pearson
determinación de Pearson en el Pearson en el caso planteado, Pearson en el
DETERMINACIÓN en el caso planteado, con errores en el
caso planteado. con mínimos errores en la caso.
(CALCULADORA, cálculo e interpretación.
interpretación.
EXCEL Y PSPP)
6 PUNTOS 5 PUNTOS 4 PUNTO 3 PUNTOS
ECUACIÓN DE Determina la ecuación de Determina la ecuación de Determina la ecuación de regresión, Determina la ecuación de
REGRESIÓN LINEAL Y regresión, elabora su respectivo regresión pero no interpreta o elabora su respectivo gráfico e interpreta regresión pero interpreta o elabora
GRÁFICA gráfico e interpreta en los dos elabora su gráfico en los dos casos en uno de los casos planteados. su gráfico en un solo caso.
(CALCULADORA, casos planteados. planteados.
EXCEL Y PSPP) 6 PUNTOS 5 PUNTOS 4 PUNTO 3 PUNTOS
Pronostica el valor futuro a Pronostica el valor futuro a partir Plantea la ecuación, pero no llega a No plantea ni pronostica el valor
partir de la ecuación de de la ecuación de regresión, pero pronosticar el valor futuro a partir de la futuro a partir de la ecuación de
PRONÓSTICO con algún error en el cálculo.
regresión. ecuación de regresión. regresión.
2 PUNTOS 1.5 PUNTOS 1 PUNTOS 0.5 PUNTO
TOTAL
LOGRADO SOBRESALIENTE (18-20)
LOGRADO (14 - 17)
CALIFICACIÓN LOGRADO CON DIFICULTADES/EN PROCESO (11-13)

NO LOGRADO (0 – 10)
Sesión 11: Medidas de variabilidad

Si bien se estiman los montos promedios requeridos para el mantenimiento del negocio, la
variabilidad de los mismos puede ayudar a identificar los ingresos máximos a los que se
puede llegar en una buena temporada. Asimismo, identificar los ingresos mínimos a los que
se podría llegar cuando los ingresos disminuyen. Esta información podría facilitar las
proyecciones de crecimiento e inversión anuales.

Estadígrafos de dispersión

Son indicadores que permiten medir el grado de dispersión de los datos con respecto al valor
promedio.

Tenemos:

R : Rango

DM : Desviación media

S2 : Varianza

S : Desviación estándar

CV : Coeficiente de Variación

Rango

Es la medida de variabilidad más sencilla. Se define como la diferencia del dato mayor y el
dato menor de la muestra.

Debido a que sólo se incluyen los valores mayores y menores, se considera que el riesgo de
esta medida es la inclusión de valores extremos, lo cual afecta la variabilidad. En ese
sentido, este rango es sólo un indicador de la variabilidad, mas no el único criterio para
definir la variabilidad.
Rango = Valor mayor – Valor menor

CASO 1: Existe un cierto número de medidas posibles en el desempeño en las ventas,


incluyendo que tan coherente es un vendedor en el logro de los objetivos establecidos. Los
datos que presentamos a continuación son un registro de ventas de determinado producto
diario de lunes a viernes.

Lunes Martes Miércoles Jueves Viernes

PATRICIA 88 68 89 92 103

JOHN 76 88 90 86 79

FRANK 104 88 118 88 123

Patricia (Rango): ________________________

John (Rango): __________________________

Frank (Rango): _________________________

Varianza (S2)

Es la medida de variabilidad que representa en cuanto difiere el valor de cada observación


(xi) de la media de los datos.

A diferencia del rango, la varianza emplea todos los datos disponibles de la variable.

Se recomienda su uso cuando se compara las variabilidades de dos o más variables.


Desviación estándar (S)

Es la medida de dispersión más importante y de mayor uso en trabajos estadísticos.


Un valor relativamente grande, significa, que los datos están alejados de la media. Es la raíz
cuadrada positiva de la varianza.

S = ඥ𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎

CASO 2: Markus Boggs es gerente de Nest Egg Investment. Recientemente Markus esta
interesado en las tasas de rendimiento de los últimos cinco años de dos fondos mutuos.
Megabucks Inc. Mostró, durante un periodo de cinco años tasas de rendimiento del 12%,
10%, 13%, 9% y 11%, mientras, que Dynamics Corporatión arrojó 13%, 12%, 14%, 10% y
6%. Un cliente se acerco a Boggs y expresó su interés por uno de esos fondos mutuos. ¿Cuál
debería escoger Boggs para su cliente?.

Vale la pena destacar que ambos fondos ofrecen un rendimiento promedio del 11%. Debido
a que ambos ofrecen el mismo rendimiento en promedio, una inversión más segura es la que
tiene un grado menor de riesgo, tal como se midió mediante la desviación estándar.

Webster A. (2000), Estadística Aplicada a los Negocios y la Economía, Bogotá, Colombia

Para Megabucks, Boggs halla la varianza y desviación estándar:


Para Dynamics, Boggs halla la varianza y desviación estándar:

Interpretación:____________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________

CASO 3: Ante la pregunta sobre el número de hijos por familia, una muestra de 12
hogares marcó las respuestas mostradas en la siguiente tabla:
2 1 2 4 1 3 2 3 2 0 5 1

Nº hijos
fi Xi fi 𝑓(𝑋𝑖 − 𝑋̅)2
Xi

Σ Σ Σ
Coeficiente de variación (CV)

El coeficiente de variación (CV) es una medida estadística que indica porcentualmente qué
tan separados están los datos en relación con su promedio. Se obtiene al dividir la desviación
estándar (S) entre el promedio (𝑥̅ )

S
CV  100
x
• Si CV ≤ 40% entonces la distribución es homogénea y la media es
representativa.
• Si CV > 40% entonces la distribución no es homogénea y la media no es
representativa. En este caso debemos tomar la mediana como medida
representativa.

CASO 4: Los datos presentados corresponden a los montos y el tipo de pago realizado por
60 clientes de una tienda. El dueño de la tienda pidió tomar la muestra para conocer el pago
de los clientes.

PAGO CON EFECTIVO

5.08 5.15 5.91 5.98 6.93 7.02 7.17 7.22 7.40 7.41

1.09 1.27 1.85 2.44 2.87 2.96 3.31 3.65 4.34 4.75

15.07 15.10 15.57 16.28 16.38 16.69 18.09 20.48

7.88 8.81 8.85 9.00 11.17 11.54 11.77 12.07 13.09 14.28

PAGO CON TARJETA

69.77 94.36 14.44 19.78 22.59 25.57 26.57 26.91 27.66 27.89

33.76 44.53 46.13 46.24 48.11 50.30 53.35 52.63 53.32 54.19

55.21 57.55
¿Cuál de las dos formas de pago presenta mayor homogeneidad?

PAGO CON EFECTIVO

PAGO CON TARJETA

Interpretación:
_________________________________________________________________________
_________________________________________________________________________

CASO 5: La gerencia del hotel CIELO ha dispuesto efectuar un mayor control sobre el
tiempo de las llamadas internacionales que utiliza el personal del área de promoción; por tal
motivo, el gerente solicita la información sobre los tiempos utilizados durante las últimas 50
llamadas internacionales que realizó el personal de promoción. Estos tiempos tienen la
distribución siguiente:
Número de llamadas internacionales según el tiempo utilizado
INTERVALOS 𝒇𝒊 𝒙𝒊 𝒇𝒊 𝒙 𝒊 𝒇𝒊 𝒙 𝒊 𝟐
[1-3[ 2 2
[3-5[ 13 4
[5-7[ 24 6
[7-9[ 7 8
[9-11] 4 10
TOTAL 50
Cálculo de las medidas de dispersión
Primero: Calcula la media Segundo: Calcula la Varianza ( S 2 ) y lo graba
aritmética. (Grabar con X) con la letra A

x S2 

x
 xi  fi
n

Tercero: Calcula la desviación Cuarto: Calcular el coeficiente de variación (CV)


estándar (Raíz cuadrada de la
varianza) y lo graba con la letra B.

S= 𝑺
S= A CV = (𝟏𝟎𝟎)
X CV =

𝑩
CV = (𝟏𝟎𝟎)
𝑿

 Si CV ≤ 40% entonces la distribución es homogénea y la media es representativa.


 Si CV > 40% entonces la distribución no es homogénea y la media no es representativa.
En este caso debemos tomar la mediana como medida representativa.

Interpretación:
________________________________________________________________________
________________________________________________________________________
EJERCICIOS DE APLICACIÓN

CASO 1: En una empresa se realizó una encuesta de clima laboral y ante la pregunta sobre
el número de bonificaciones que reciben los empleados durante el año, 12 trabajadores
marcaron las siguientes respuestas:
Tabla N°1
Número de bonificaciones que reciben anualmente 12 empleados
2 1 2 4 1 3
2 3 2 0 5 1

Calcule y describa el rango de la variable.

Respuesta:
_________________________________________________________________________

CASO 2: Hay dos conjuntos de datos sobre los ingresos en miles de dólares de dos empresas
dedicadas al rubro de metales preciosos durante 1 año, REX y GiM.

Tabla N°2
Ingresos anuales en miles de dólares de las empresas REX y GiM

Calcula y describa el rango de los sueldos en cada una de las empresas.

Respuesta:
_________________________________________________________________________
CASO 3: A continuación, se presenta la cantidad de minutos que toma viajar desde el hogar
hasta el trabajo para un grupo de ejecutivos con automóvil. A partir de los siguientes datos:

28 25 48 37 41 39 32 26 16 23

23 29 36 31 26 21 32 25 31 43

35 42 38 33 28 40 45 20 45 52

63 80 64 54 23 25 38 34 45 50

70 60 45 54 55 42 80 25 32 48

Realizar el proceso en Excel y con ayuda de funciones. Coloca en el cuadro el coeficiente


de variación e interpreta.

Coeficiente de
variación

Interpretación:
_________________________________________________________________________
_________________________________________________________________________

CASO 4: De acuerdo de un estudio de mercado se ha determinado el ingreso diario de 50


trabajadores.

60 220 310 200 450 650 720 450 90 100

180 70 500 180 590 500 140 680 350 570

250 240 1200 490 280 200 350 190 800 560

210 350 280 340 400 490 520 75 120 750

85 90 295 410 175 70 60 350 350 430

Realizar el proceso en Pspp y determina:


Desviación estándar
Media
Una vez con la información con ayuda de tu calculadora coloca en el cuadro el
coeficiente de variación e interpreta.

Coeficiente de
variación

Interpretación:
_________________________________________________________________________
_________________________________________________________________________

CASO 5: En la siguiente tabla se muestran los resultados de una muestra de 60 reses cuyos
pesos se encuentran en la siguiente tabla:

271 363 159 100 227 337 295 250 279 319

205 279 266 199 177 162 232 303 192 181

309 246 278 185 180 335 120 150 200 240

475 290 170 190 320 430 294 570 342 120

280 240 435 120 330 225 342 500 600 290

100 156 248 386 248 380 480 380 370 480

Realizar el proceso en Pspp y determina:


Desviación estándar
Media

Una vez con la información con ayuda de tu calculadora coloca en el cuadro el


coeficiente de variación e interpreta.

Coeficiente de
variación

Interpretación:
_________________________________________________________________________
_________________________________________________________________________
CASO 5: Una muestra de 50 trabajadores fue reportado sobre los minutos de tardanza en la
siguiente tabla:

1 1 1 1 1 1 1 2 2 2

2 2 2 2 2 2 2 2 2 3

3 3 3 3 3 3 3 3 3 3

3 4 1 3 2 1 4 4 4 5

5 5 2 1 3 4 5 1 2 3

Realizar el proceso en Pspp y determina:


Desviación estándar
Media

Una vez con la información con ayuda de tu calculadora coloca en el cuadro el


coeficiente de variación e interpreta.

Coeficiente de
variación

Interpretación:
_________________________________________________________________________
_________________________________________________________________________

CASO 6: Una empresa de taxis desea brindar sus servicios en el distrito de San Miguel, por
esta razón ha realizado una encuesta a 56 personas para conocer algunos aspectos
fundamentales del consumo, entre ellos los gastos en pasajes. Los resultados han sido
presentados en la siguiente tabla.
Tabla N°3
Gastos en pasajes de 56 personas del distrito de San Miguel

Gastos en pasajes
fi
L. inferior L. superior
10 13 3
13 16 7
16 19 9
19 22 12
22 25 15
25 28 6
28 31 4
Σ 56

Completa la tabla, calcule e interprete el coeficiente de variación


Intervalos
N fi xi xi  fi xi 2 xi 2  fi
Li Ls

1 10 13 3

2 13 16 7

3 16 19 9

4 19 22 12

5 22 25 15

6 25 28 6

7 28 31 4

Σ 56 Σ Σ
Cálculo de las medidas de dispersión
Primero: Calcula la media Segundo: Calcula la Varianza ( S 2 ) y lo graba
aritmética. (Grabar con X) con la letra A

x S2 

x
 xi  fi
n

Tercero: Calcula la desviación Cuarto: Calcular el coeficiente de variación (CV)


estándar (Raíz cuadrada de la
varianza) y lo graba con la letra B.

S= 𝑺
S= A CV = (𝟏𝟎𝟎)
X CV =

𝑩
CV = 𝑿 (𝟏𝟎𝟎)

 Si CV ≤ 40% entonces la distribución es homogénea y la media es representativa.


 Si CV > 40% entonces la distribución no es homogénea y la media no es representativa.
En este caso debemos tomar la mediana como medida representativa.

Interpretación:
________________________________________________________________________
________________________________________________________________________

CASO 7: Los siguientes datos corresponden a los precios de los celulares vendidos en una
semana de la empresa Nikita:
Precios (USD) fi
[40;50[ 2
[50;60[ 6
[60;70[ 10
[70;80[ 13
[80;90[ 7
[90;100] 2
Σ

Completa la tabla, calcule e interprete el coeficiente de variación


Tabla N°4
Precios en dólares de los celulares vendidos en una semana por la empresa Nikita

Precios (USD) fi xi xi  fi xi 2 xi 2  fi

[40;50[ 2
[50;60[ 6
[60;70[ 10
[70;80[ 13
[80;90[ 7
[90;100] 2
Σ Σ Σ

Cálculo de las medidas de dispersión


Primero: Calcula la media Segundo: Calcula la Varianza ( S 2 ) y lo graba
aritmética. (Grabar con X) con la letra A

x S2 

x
 xi  fi
n

Tercero: Calcula la desviación Cuarto: Calcular el coeficiente de variación (CV)


estándar (Raíz cuadrada de la
varianza) y lo graba con la letra B.

S= 𝑺
S= A CV = (𝟏𝟎𝟎)
X CV =

𝑩
CV = (𝟏𝟎𝟎)
𝑿

 Si CV ≤ 40% entonces la distribución es homogénea y la media es representativa.


 Si CV > 40% entonces la distribución no es homogénea y la media no es representativa.
En este caso debemos tomar la mediana como medida representativa.

Interpretación:
________________________________________________________________________
________________________________________________________________________
CASO 8: Los pesos de las papayas compradas por la juguería “Hijo de fruta” vienen dadas
por la siguiente tabla:

Tabla N°5
Pesos en kg de las papayas compradas por la juguería “Hijo de fruta”

Peso fi xi xi  fi xi 2 xi 2  fi
(kg)
[1.70, 1.75[ 1
[1.75, 1.80[ 3
[1.80, 1.85[ 4
[1.85, 1.90[ 8
[1.90, 1.95[ 5
[1.95, 2.00] 2
Σ Σ Σ

Completa la tabla, calcule e interprete el coeficiente de variación


Cálculo de las medidas de dispersión
Primero: Calcula la media Segundo: Calcula la Varianza ( S 2 ) y lo graba
aritmética. (Grabar con X) con la letra A

x S2 

x
 xi  fi
n

Tercero: Calcula la desviación Cuarto: Calcular el coeficiente de variación (CV)


estándar (Raíz cuadrada de la
varianza) y lo graba con la letra B.

S= 𝑺
S= A CV = (𝟏𝟎𝟎)
X CV =

𝑩
CV = 𝑿 (𝟏𝟎𝟎)

 Si CV ≤ 40% entonces la distribución es homogénea y la media es representativa.


 Si CV > 40% entonces la distribución no es homogénea y la media no es representativa.
En este caso debemos tomar la mediana como medida representativa.
Interpretación:
________________________________________________________________________
________________________________________________________________________

CASO 9: El administrador de una empresa desea tomar medidas para mejorar la


productividad de los trabajadores. Para ello ha realizado un estudio sobre los minutos de
tardanza de 21 trabajadores. Completa la tabla, calcule e interprete el coeficiente de
variación

Tabla N°6
Tardanzas en minutos de 21 trabajadores de una empresa

Intervalos
fi xi xi  fi xi 2 xi 2  fi
(Minutos de tardanza)
[10, 15[ 9
[15, 20[ 5
[20, 25[ 1
[25, 30[ 1
[30, 35] 5
Σ Σ Σ

Cálculo de las medidas de dispersión


Primero: Calcula la media Segundo: Calcula la Varianza ( S 2 ) y lo graba con
aritmética. (Grabar con X) la letra A

x S2 

x
 xi  fi
n
Tercero: Calcula la desviación Cuarto: Calcular el coeficiente de variación (CV)
estándar (Raíz cuadrada de la
varianza) y lo graba con la letra
B.
S= 𝑺
S= A CV = (𝟏𝟎𝟎)
X CV =

𝑩
CV = 𝑿 (𝟏𝟎𝟎)

 Si CV ≤ 40% entonces la distribución es homogénea y la media es representativa.


 Si CV > 40% entonces la distribución no es homogénea y la media no es representativa.
En este caso debemos tomar la mediana como medida representativa.
Interpretación:
________________________________________________________________________
________________________________________________________________________

CASO 10: El vicepresidente de mercadotecnia de una cadena de restaurantes de comida


rápida está estudiando el desarrollo de las ventas de las 100 sucursales que se encuentran
Lima Metropolitana y ha elaborado la siguiente distribución de frecuencias para las ventas
anuales. Completa la tabla, calcule e interprete el coeficiente de variación

Tabla N°7
Ventas en miles de soles de 100 restaurantes de Lima Metropolitana
Venta (miles soles) fi xi xi  fi xi 2 xi 2  fi

[700 – 800[ 4

[800 – 900[ 7

[900 – 1000[ 8

[1000 – 1100[ 10

[1100 – 1200[ 12

[1200 – 1300[ 17

[1300 – 1400] 13

Σ Σ Σ
Cálculo de las medidas de dispersión
Primero: Calcula la media Segundo: Calcula la Varianza ( S 2 ) y lo graba
aritmética. (Grabar con X) con la letra A

x S2 

x
 xi  fi
n

Tercero: Calcula la desviación Cuarto: Calcular el coeficiente de variación (CV)


estándar (Raíz cuadrada de la
varianza) y lo graba con la letra B.

S= 𝑺
S= A CV = (𝟏𝟎𝟎)
X CV =

𝑩
CV = 𝑿 (𝟏𝟎𝟎)

 Si CV ≤ 40% entonces la distribución es homogénea y la media es representativa.


 Si CV > 40% entonces la distribución no es homogénea y la media no es representativa.
En este caso debemos tomar la mediana como medida representativa.
Interpretación:
________________________________________________________________________
________________________________________________________________________
Sesión 12: Correlación y regresión

Correlación

El método estadístico que estudia y define el grado de afinidad o relación entre las variables
se denomina “correlación simple”; la cual también expresa el grado de bondad del ajuste de
las líneas de regresión.

Decimos que dos variables, X e Y, están correlacionadas cuando existe:

Ejemplo:
• Altura y peso de niños.
• Velocidad máxima que alcanza un coche y potencia de su motor.

• Sea un conjunto de pares de valores de las variables X e Y. Si los representamos en
un diagrama de dispersión obtendremos una “nube de puntos” que nos dará una idea
gráfica de la posible correlación entre ambas variables.

Índice o coeficiente de correlación


El índice de correlación se define mediante fórmulas específicas (dependiendo del modelo
de regresión)

El valor de “r” varía entre -1 y +1, es decir: -1≤ 𝑟 ≤ 1


Para la interpretación clásica el índice de correlación de todo modelo de regresión se tiene
la siguiente tabla de categorías:

ESCALA CATEGORIAS ESCALA

-0,2 < r < 0,0 Existe correlación no significativa 0,0 < r < 0,2

-0,4 < r ≤ -0,2 Existe baja correlación 0,2 ≤ r < 0,4

-0,7 < r ≤-0,4 Existe una significativa correlación 0,4 ≤ r < 0,7

-1,0 < r ≤-0,7 Existe alto grado de correlación 0,7 ≤ r < 1,0

r = -1 Existe perfecta correlación r=1

r=0 Los datos están incorrelacionados r=0

La categorización mostrada en la tabla es arbitraria ya que dependerá de la naturaleza de la


investigación o definición especifica del investigador.

Fórmula:

n x y   x  y
r
n x 2   x  n y 2   y 
2 2

Donde:

n : Número de datos.

X : Variable independiente.

Y : Variable dependiente.

r : Coeficiente de correlación o de Pearson.


Coeficiente de Determinación ( 𝒓𝟐 )

Proporción de la variación total en la variables dependiente “Y” que se explica, o


contabiliza, por la variación en la variable independiente “X ”. Es el coeficiente de
correlación elevado al cuadrado.

Por ejemplo: Si resulta r = 0.80 → 𝑟 2 = (0.80)2 *100

Entonces el coeficiente de determinación es 64%, que de los datos de la variable “x”


condiciona a los datos de la variable “y” en un 64% de los casos.

Su valor oscila entre 0 y 1. El coeficiente se expresa normalmente en porcentaje. Así


mientras más cercano este a 100% se entiende que la bondad del ajuste nos indica que la
mayor cantidad de los puntos de la distribución se pueden explicar mediante la recta de
regresión. Por el contrario, su cercanía al cero % nos indica la poca fiabilidad de la recta de
tendencia.

Regresión Lineal

Es un modelo matemático de pronóstico que relaciona dos conjuntos de datos, función, que
permite calcular una variable aleatoria cuando otra toma un valor determinado. Su aplicación
implica suponer un comportamiento lineal creciente o decreciente, por tal razón, debe de
existir un análisis previo de correlación entre ambas variables que nos indique la intensidad
de dicha relación.

Y  a  b*(X )
Donde:


𝒀 : Es el valor estimado de la variable “Y” (pronóstico).

a : Es la intersección con el eje Y.

b : Es la pendiente de la recta

X : Es cualquier valor de la variable independiente que se seleccione.

Calculando la pendiente de la recta

Calculando la intersección con el eje Y

a
 y  b x
n

Interpretación de la ecuación de la recta de regresión lineal


Si b > 0 o r > 0 Esto significa que la relación es lineal positiva o directa, es decir,
aumenta “y” en la medida que aumenta “x”
Si b < 0 o r < 0 Esto implica que la relación es lineal negativa o inversa, es decir,
aumenta “y” en la medida que disminuye “x”
CASO 1: Los siguientes datos representan los años de experiencia y el ingreso anual (en
miles de soles) para un conjunto de profesionales.

Año 5 15 24 16 19 3 6 12 27 13

Ingresos 40 40 90 70 60 20 30 30 70 50

Primer paso: Utilizar el método de los mínimos cuadrados.

Años (X) Ingresos (Y) X2 Y2 XY

x  y x y   xy 
2

2

Completa el cuadro en base a los resultados hallados anteriormente.

n ∑𝑋 ∑𝑦

∑ 𝑋𝑌 ∑ 𝑋2 ∑ 𝑌2
Segundo paso: Con los resultados de la tabla anterior reemplaza los datos en la fórmula
del coeficiente de correlación, determinación y ecuación de la recta.

n x y   x  y
r
n x 2   x  n y 2   y 
2 2

r= r2

Ecuación de la recta

n xi yi   xi  yi
b
n xi2   xi 
2

a  y i  b xi
n
a b

Y= a + b (X)

Interpretación:

Coeficiente de correlación:
_________________________________________________________________________
_________________________________________________________________________

Coeficiente de determinación:
_________________________________________________________________________
_________________________________________________________________________

Para 20 años de experiencia laboral se espera un valor por INGRESOS de:

_________________________________________________________________________

_________________________________________________________________________

_________________________________________________________________________
EJERCICIOS DE APLICACIÓN
CASO 1: A partir de los siguientes datos referentes a horas trabajadas en un taller (X) y
unidades producidas (Y), determinar, el coeficiente de correlación lineal e interprétalo.
n° X Y X2 Y2 XY
1 80 300
2 79 302
3 83 315
4 84 330
5 78 300
6 60 250
7 82 300
8 85 340
9 79 315
10 84 330
11 80 310
12 62 240
Total

x  y x y   xy 
2

2

Completa el cuadro en base a los resultados hallados anteriormente.

n ∑𝑋 ∑𝑦

∑ 𝑋𝑌 ∑ 𝑋2 ∑ 𝑌2

Con los resultados de la tabla anterior reemplaza los datos en la fórmula del coeficiente de
correlación, determinación y ecuación de la recta.

n x y   x  y
r
n x 2   x  n y 2   y 
2 2
r= r2

Interpretación:

Coeficiente de correlación:
_________________________________________________________________________
_________________________________________________________________________

Coeficiente de determinación:
_________________________________________________________________________
_________________________________________________________________________

Ecuación de la recta

n xi yi   xi  yi
b
n xi2   xi 
2
a  y i  b xi
n

a b

Y= a + b (X)

Con 90 horas trabajadas en un taller, cuántas unidades se proyecta producir.

_________________________________________________________________________

_________________________________________________________________________

_________________________________________________________________________

CASO 2: Un trabajo estadístico consiste en obtener un modelo de regresión lineal a nivel


descriptivo para predecir las ventas semanales de un producto específico en función de la
publicidad del producto en un canal de televisión de la ciudad de Lima. Para esto, han
recopilado al azar los tiempos de duración en minutos de la publicidad de las últimas 10
semanas y el respectivo número unidades vendidas al producto. Los datos se dan en la tabla
que sigue.
Semana 1 2 3 4 5 6 7 8 9 10
Publicidad 20 30 30 40 50 60 60 60 70 80
Ventas 50 73 69 87 108 128 135 132 148 140

Halla el coeficiente de correlación de la distribución e interpretarlo.

X Y X2 Y2 XY

x  y x 
2 y 2

 xy 

Completa el cuadro en base a los resultados hallados anteriormente.

n ∑𝑋 ∑𝑦

∑ 𝑋𝑌 ∑ 𝑋2 ∑ 𝑌2
Con los resultados de la tabla anterior reemplaza los datos en la fórmula del coeficiente de
correlación, determinación y ecuación de la recta.

n x y   x  y
r
n x 2   x  n y 2   y 
2 2

r= r2

Interpretación:

Coeficiente de correlación:
_________________________________________________________________________
_________________________________________________________________________

Coeficiente de determinación:
_________________________________________________________________________
_________________________________________________________________________

Ecuación de la recta

n xi yi   xi  yi
b
n xi2   xi 
2
a  y i  b xi
n

a b

Y= a + b (X)

Con 110 minutos en publicidad se proyecta ganar en ventas.

_________________________________________________________________________

_________________________________________________________________________

_________________________________________________________________________

CASO 3: Una conocida marca de leche del Perú, estudió la relación entre las ventas y la
cantidad que gastaba en publicidad. As continuación se muestra la información de las
ventas de los últimos cuatro meses.
Completa la tabla:
X Y X2 Y2 X*Y

 xy 
x  y x y 
2

2

Completa el cuadro en base a los resultados hallados anteriormente.

n ∑𝑋 ∑𝑦

∑ 𝑋𝑌 ∑ 𝑋2 ∑ 𝑌2

Con los resultados de la tabla anterior reemplaza los datos en la fórmula del coeficiente de
correlación, determinación y ecuación de la recta.

n x y   x  y
r
n x 2   x  n y 2   y 
2 2
r= r2

Interpretación:

Coeficiente de correlación:
_________________________________________________________________________
_________________________________________________________________________

Coeficiente de determinación:
_________________________________________________________________________
_________________________________________________________________________

Ecuación de la recta

n xi yi   xi  yi
b
n xi2   xi 
2
a  y i  b xi
n

a b

Y= a + b (X)

Estime las ventas cuando se gastan US$3 millones en publicidad.

_________________________________________________________________________

_________________________________________________________________________

_________________________________________________________________________
CASO 4: Grupo Empresarial SURA -Grupo SURA- es
una compañía latinoamericana que cotiza en la Bolsa de
Valores de Colombia (BVC) y está inscrita en el
programa ADR - Nivel I en Estados Unidos. Es además
la única entidad latinoamericana, del sector Servicios
Financieros Diversos, que forma parte del Índice de
Sostenibilidad Dow Jones con el cual se reconocen a las compañías que se destacan a nivel
mundial por sus buenas prácticas en materia económica, ambiental y social. Los siguientes
datos acerca de las ventas en millones de dólares de la empresa:

Años (X) 2010 2011 2012 2013 2014


Ventas (Y) 3.6 4.1 4.7 4.2 4.5

Año
X Y XY X2 Y2
(X)
2010 1
2011 2
2012 3
2013 4
2014 5

x  y  xy  x y 
2

2
Total

Completa el cuadro en base a los resultados hallados anteriormente.

n ∑𝑋 ∑𝑦

∑ 𝑋𝑌 ∑ 𝑋2 ∑ 𝑌2

Con los resultados de la tabla anterior reemplaza los datos en la fórmula del coeficiente de
correlación, determinación y ecuación de la recta.
n x y   x  y
r
n x 2   x  n y 2   y 
2 2

r= r2

Interpretación:

Coeficiente de correlación:
_________________________________________________________________________
_________________________________________________________________________

Coeficiente de determinación:
_________________________________________________________________________
_________________________________________________________________________

Ecuación de la recta

n xi yi   xi  yi
b
n xi2   xi 
2
a  y i  b xi
n

a b

Y= a + b (X)

Estime las ventas el 2020.

_________________________________________________________________________

_________________________________________________________________________
CASO 5: Los siguientes datos corresponden a las ventas (en millones de $) de la empresa

Año (X) 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

Ventas (Y) 3.9 3.5 3.6 3.7 4 3.6 4.1 4.7 4.2 4.5

Año
X Y XY X2 Y2
(X)
2001 1
2002 2
2003 3
2004 4
2005 5
2006
2007
2008
2009
2010

x  y  xy  x y 
2

2
Total

Completa el cuadro en base a los resultados hallados anteriormente.

n ∑𝑋 ∑𝑦

∑ 𝑋𝑌 ∑ 𝑋2 ∑ 𝑌2

Con los resultados de la tabla anterior reemplaza los datos en la fórmula del coeficiente de
correlación, determinación y ecuación de la recta.
n x y   x  y
r
n x 2   x  n y 2   y 
2 2

r= r2

Interpretación:

Coeficiente de correlación:
_________________________________________________________________________
_________________________________________________________________________

Coeficiente de determinación:
_________________________________________________________________________
_________________________________________________________________________

Ecuación de la recta

n xi yi   xi  yi
b
n xi2   xi 
2

a  y i  b xi
n
a b

Y= a + b (X)

Estime las ventas cuando se gastan US$3 millones en publicidad.

_________________________________________________________________________

_________________________________________________________________________

_________________________________________________________________________
Sesión 13: Aplicación de negocios

CASO: STARBUCKS

Identifica que tipo de variable corresponde:

PREGUNTA VARIABLE TIPO DE


VARIABLE
1 Confort del local
2 ¿Por qué prefieres Starbucks?
3 Desempeño del personal
4 Tiempo de atención del pedido
5 ¿Cuántas veces has visitado Starbucks)
1. Completa la siguiente tabla:

PREGUNTA N°01: En relación con el confort del local.


Puede marcar más de una alternativa
Alternativas fi Fi pi
Los muebles son cómodos 29

Sus ambientes son 54


cómodos
Sus ambientes son amplios 16

La decoración es agradable 31

El aire acondicionado es 13
adecuado
Su señal wi-fi es rápida 13

n= 156

Coloca el porcentaje respectivo en base a la tabla anterior:


Interpretación:

_________________________________________________________________________
_________________________________________________________________________

2. Completa la siguiente tabla:

PREGUNTA N°02: ¿Por qué prefieres Starbucks?


Puede marcar más de una alternativa
Alternativas fi Fi pi
Por la calidad de su café 37
Por la variedad de sus postres 16
Promueve el bienestar colectivo 4
Por sus envases biodegradable 8
Porque me hacen sentir mejor 6
Por sus Frapuccinos 46
Porque son hospitalarios con los pacientes 28
n= 145
Coloca el porcentaje respectivo en base a la tabla anterior:

Interpretación:

_________________________________________________________________________
_________________________________________________________________________

3. Completa la siguiente tabla:

PREGUNTA N°03: En relación con el desempeño del personal


Puede marcar más de una alternativa
Alternativas fi Fi pi
Son rápidos en entregar el pedido 35
Son muy atentos 76
Me sugirió alternativas 14
Desconoce los productos que ofrece
1
Starbucks
n= 126
Coloca el porcentaje respectivo en base a la tabla anterior:

Interpretación:

_________________________________________________________________________
_________________________________________________________________________

4. Completa la siguiente tabla y determina el coeficiente de variación.

PREGUNTA N°04: ¿En cuánto tiempo recibiste el pedido?

Li Ls Xi fi Fi fi* Xi fi*Xi2
1 [3.00 2.00[ 15
3 [5.00 4.00[ 28
5 [7.00 6.00[ 49
7 [9.00 8.00[ 10
9 [11.00 10.00] 2
n= 104

Cálculo de las medidas de dispersión


Primero: Calcula la media Segundo: Calcula la Varianza ( S 2 ) y lo graba
aritmética. (Grabar con X) con la letra A

x S2 

x
 xi  fi
n
Tercero: Calcula la desviación Cuarto: Calcular el coeficiente de variación (CV)
estándar (Raíz cuadrada de la
varianza) y lo graba con la letra B.

S= 𝑺
S= A CV = (𝟏𝟎𝟎)
X CV =

𝑩
CV = 𝑿 (𝟏𝟎𝟎)

 Si CV ≤ 40% entonces la distribución es homogénea y la media es representativa.


 Si CV > 40% entonces la distribución no es homogénea y la media no es representativa.
En este caso debemos tomar la mediana como medida representativa.
Interpretación:
________________________________________________________________________
________________________________________________________________________

5. Completa la siguiente tabla y determina el coeficiente de variación.

PREGUNTA N°5: Al mes ¿Cuántas veces has visitado Starbucks?


Li Ls Xi fi Fi fi* Xi fi*Xi2
[1 4[ 3 10
[4 7[ 6 22
[7 10[ 9 48
[10 13[ 12 10
[13 16] 15 14

n= 104
Cálculo de las medidas de dispersión
Primero: Calcula la media Segundo: Calcula la Varianza ( S 2 ) y lo graba
aritmética. (Grabar con X) con la letra A

x S2 

x
 xi  fi
n

Tercero: Calcula la desviación Cuarto: Calcular el coeficiente de variación (CV)


estándar (Raíz cuadrada de la
varianza) y lo graba con la letra B.

S= 𝑺
S= A CV = (𝟏𝟎𝟎)
X CV =

𝑩
CV = 𝑿 (𝟏𝟎𝟎)

 Si CV ≤ 40% entonces la distribución es homogénea y la media es representativa.


 Si CV > 40% entonces la distribución no es homogénea y la media no es representativa.
En este caso debemos tomar la mediana como medida representativa.
Interpretación:
________________________________________________________________________
________________________________________________________________________
6. En base al siguiente gráfico

Gráfico N°1
Tiempo de Atención vs Número de Visitas
20

r= -0.97445984
15

y = -1.9434x + 17.173
10
R² = 0.9496
5

0
0.00 2.00 4.00 6.00 8.00 10.00 12.00

-5

Interpretación:

a) Coeficiente de correlación:
_____________________________________________________________________
_____________________________________________________________________

b) Coeficiente de determinación:
_____________________________________________________________________
_____________________________________________________________________

c) ¿Cuál es el pronóstico sobre el número de visitas que se pueden producir para un


tiempo de atención de 6 minutos?

_____________________________________________________________________
_____________________________________________________________________

Conclusiones:

_________________________________________________________________________
_________________________________________________________________________

_________________________________________________________________________
_________________________________________________________________________

_________________________________________________________________________
_________________________________________________________________________
Sesión 14: Aplicación de negocios
1. En base al siguiente gráfico realiza las siguientes descripciones:

Descripción:

_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
Descripción:

_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________

Descripción:

_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________

Descripción:
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________

Descripción:

_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________

Por zona geográfica

Descripción:

_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
Descripción:

_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________

Descripción:

_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
Descripción:

_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
UNIDAD DIDÁCTICA: Estadística para los negocios

Evaluación Continua 3 (PREPARATORIO)

1. El gerente de una clínica dental analiza el tiempo empleado por los odontólogos en
atención a los clientes por minutos:
Linferior Lsuperior 𝒇𝒊
[22.75 34.25[ 13
[34.25 45.75[ 11
[45.75 57.25[ 8
[57.25 68,75[ 10
[68.75 80,25[ 13
[80.25 91,75[ 3
[91.75 103,25[ 7
[103.25 114,75[ 4
[114.75 126,25] 6
Total 75

Completa la tabla, calcule e interprete el coeficiente de variación. (4 puntos)


Tabla N° 1
Tiempo de demora en atender a clientes (en minutos)
Clase Intervalo 𝒇𝒊 𝒙𝒊 𝒇𝒊 𝒙 𝒊 𝒙 𝒊 𝟐 𝒇𝒊
Linferior Lsuperior
1 13
[22.75 34.25[
2 11
[34.25 45.75[
3 8
[45.75 57.25[
4 10
[57.25 68,75[
5 13
[68.75 80,25[
6 3
[80.25 91,75[
7 7
[91.75 103,25[
8 4
[103.25 114,75[
9 6
[114.75 126,25]
TOTAL 75
Cálculo de las medidas de dispersión
Primero: Calcula la media Segundo: Calcula la Varianza ( S 2 ) y lo graba
aritmética. (Grabar con X) con la letra A

x S2 

x
 xi  fi
n

Tercero: Calcula la desviación Cuarto: Calcular el coeficiente de variación (CV)


estándar (Raíz cuadrada de la
varianza) y lo graba con la letra B.

S= 𝑺
S= A CV = (𝟏𝟎𝟎)
X CV =

𝑩
CV = 𝑿 (𝟏𝟎𝟎)

 Si CV ≤ 40% entonces la distribución es homogénea y la media es representativa.


 Si CV > 40% entonces la distribución no es homogénea y la media no es representativa.
En este caso debemos tomar la mediana como medida representativa.

Interpretación:
________________________________________________________________________
________________________________________________________________________

2. Una supervisora de mantenimiento de aeronaves debe revisar una nueva entrega de


pernos por parte de su nuevo proveedor. Una parte de la entrega llamó
poderosamente su atención. Por lo tanto, envió 100 pernos a un laboratorio de
pruebas para determinar la fuerza necesaria para romperlos. A continuación,
presentamos los resultados en miles de g de fuerza. Abrir el archivo en Excel y con
ayuda de funciones. Coloca en el cuadro el coeficiente de variación e interpreta
(1 punto)

Coeficiente de
variación

Interpretación:
_________________________________________________________________________
_________________________________________________________________________
3. Los gastos semanales en transporte urbano (nuevos soles) que efectúan los habitantes
de Lima han sido estudiados mediante una muestra. Abrir el archivo en Pspp y
determina:
Desviación estándar
Media

Una vez con la información con ayuda de tu calculadora coloca en el cuadro el


coeficiente de variación e interpreta (1 punto)

Coeficiente de
variación

Interpretación:
_________________________________________________________________________
_________________________________________________________________________
4. El dueño de una pequeña compañía que fabrica Televisores. Desde que inició de su
empresa, el número de televisores que han vendido está representado por esta serie
temporal:

Año 2010 2011 2012 2013 2014 2015 2016 2017


Televisores
vendidas 111 124 116 138 140 134 149 150

X Y XY X2 Y2

x  y  xy  x y 
2
 2

Completa el cuadro en base a los resultados hallados anteriormente.

n ∑𝑋 ∑𝑦

∑ 𝑋𝑌 ∑ 𝑋2 ∑ 𝑌2

Con los resultados de la tabla anterior reemplaza los datos en la fórmula del coeficiente de
correlación, determinación y ecuación de la recta. (3 puntos)

n x y   x  y
r
n x 2   x  n y 2   y 
2 2
r= r2

Interpretación:

Coeficiente de correlación:
_________________________________________________________________________
_________________________________________________________________________

Coeficiente de determinación:
_________________________________________________________________________
_________________________________________________________________________

5. Una aplicación importante del análisis de regresión en contabilidad es para estimar


costos. Al reunir datos sobre volumen y costo un contador puede estimar el costo
asociado con determinada operación de manufactura. Abrir el archivo en Excel y
determina e interpreta el coeficiente de correlación y determinación. (2 puntos)

r= r2

Interpretación:

Coeficiente de correlación:
_________________________________________________________________________
_________________________________________________________________________

Coeficiente de determinación:
_________________________________________________________________________
_________________________________________________________________________
6. Las Inmobiliarias a menudo están interesadas en ver cómo el valor de una casa varía
de acuerdo con su tamaño. A continuación, se muestran alguno de los datos del área
(en miles de pies cuadrados) y valor tasado (en miles de dólares para una muestra de
50 casas. Abrir el archivo en Pspp y determina el coeficiente de correlación y
determinación. (1 punto)
r= r2

Interpretación del Coeficiente de correlación:


_________________________________________________________________________
_________________________________________________________________________

7. Un estudiante de estadística comercial tomó una muestra aleatoria de sueldos


iniciales y promedios de notas en la universidad de algunos estudiantes recién
graduados. Los datos son los siguientes:

Promedio 18 16 17 12 14 19 13 14
de
notas
Sueldo 3 600 3 000 3 000 2 400 2 700 3 300 2 100 2 700
inicial

X Y XY X2 Y2

x  y  xy  x y 
2

2

Completa el cuadro en base a los resultados hallados anteriormente. (4 puntos)


n ∑𝑋 ∑𝑦

∑ 𝑋𝑌 ∑ 𝑋2 ∑ 𝑌2
Ecuación de la recta

n xi yi   xi  yi
b
n xi2   xi 
2

a  y i  b xi
n

a b

Y= a + b (X)

¿Cuánto es la proyección de sueldo inicial con un promedio de nota 20? (1 punto)

_________________________________________________________________________

_________________________________________________________________________
8. En la tabla tenemos información sobre niveles de ventas realizados en una serie
temporal que va de 2005 al 2018. Los datos están en millones de dólares. Abrir el
archivo en Excel gráfica la recta de regresión y determina una proyección para
el 2020. (2 puntos)

a b

_________________________________________________________________________

_________________________________________________________________________

9. Una empresa que fabrica y exporta jugo de naranja en botella personal (300 ml.). El
número de botellas personales que han vendido está representado por la siguiente
serie de tiempo. Abrir el archivo en Pspp, gráfica la recta de regresión y
determina una proyección para el 2020. (1 punto)

a b

_________________________________________________________________________

_________________________________________________________________________

También podría gustarte