Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En esta parte del curso estudiaremos la asociación entre dos variables 𝑋 i 𝑌, conocida también
como asociación simple.
Una forma de estudio de la asociación entre las variables 𝑋 i 𝑌 es la regresión que consiste en
determinar una relación funcional entre ellas con el fin de que se pueda predecir el valor de una
variable en base a la otra. La variable que va a predecir se denomina variable dependiente y la
variable que es la base de la predicción se denomina variable independiente.
Otra forma del estudio de la asociación entre las variables X i Y, es denominada correlación, que
consiste en determinar la variación conjunta de las dos variables, su grado de relación, y su sentido
(positivo o negativo). La medida del grado de relación se denomina coeficiente o índice de
correlación, el cuadrado del índice de correlación se denomina “Coeficiente de determinación”.
DIAGRAMA DE DISPERSIÓN.
La investigación de una relación entre dos variables comienza con un intento de descubrir la forma
aproximada de esta, para lo cual se presentan los datos observados de la variable bidimensional
mediante una gráfica en un sistema de coordenadas cartesianas. Esta gráfica recibe el nombre de
“diagrama de dispersión” o “nube de puntos” que muestra la ubicación de los valores (𝑥𝑖 , 𝑦𝑖 ). Es
frecuentemente posible visualizar el tipo de relación existente entre dos variables a partir del
diagrama de dispersión.
COVARIANZA
La covarianza es una estadística que mide el grado de dispersión o variabilidad conjunta de dos
variables X i Y con respecto a sus medias respectivas (𝑋̅, 𝑌̅).
Definición.
𝑆𝑥𝑦
𝑟=
𝑆𝑋 𝑆𝑌
𝑆𝑦 𝑒𝑠 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑑𝑒 𝑌
Interpretación:
0.8 ≤ 𝑟 < 1 ó − 1 < 𝑟 ≤ 0.8 𝑠𝑒 𝑑𝑖𝑐𝑒 𝑞𝑢𝑒 ℎ𝑎𝑦 𝑢𝑛𝑎 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑒𝑥𝑐𝑒𝑙𝑒𝑛𝑡𝑒.
0.5 ≤ 𝑟 < 0.8 ó − 0.8 < 𝑟 ≤ −0.5 ℎ𝑎𝑦 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑏𝑢𝑒𝑛𝑎.
0.3 ≤ 𝑟 < 0.5 ó − 0.5 < 𝑟 ≤ −0.3 ℎ𝑎𝑦 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑝𝑜𝑏𝑟𝑒.
REGRESIÓN
La regresión es la función matemática que para un valor de una característica da el valor esperado
de otra característica con la cual está ligada. La regresión entre dos características puede ser lineal
o no lineal.
ESTADISTICA I
𝑌 = 𝛼 + 𝛽𝑥 + 𝜉.
Donde: 𝑦̂ : 𝑒𝑠 𝑒𝑙 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑑𝑒 𝑌.
𝑎: 𝑒𝑠 𝑒𝑙 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑑𝑒 𝛼.
𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖 𝑆𝑥𝑦
𝑏= ó 𝑏=
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2 𝑆𝑋2
𝑎 = 𝑦̅ − 𝑏𝑥̅
EJERCICIOS
1. Los ingresos “𝑋” y los gastos ”𝑌“ mensuales en dólares de una muestra de 100 familias han
dado los siguientes resultados.
2. Supongamos que se quiere estimar la relación entre ingreso y consumo para tal efecto se
eligió una muestra de 6 familias. De los datos se define la variable dependiente (𝑌 =
𝑐𝑜𝑛𝑠𝑢𝑚𝑜) y la variable independiente (𝑋 = 𝑖𝑛𝑔𝑟𝑒𝑠𝑜), estos datos se muestran en la tabla
siguiente:
INGRESO 35 40 38 55 42 60
CONSUMO 30 35 30 50 35 50
SEMANA 2 3 4 5 6 7
TIEMPO DE PROPAGANDA 20 25 22 28 36 40
VENTA DE PRODUCTOS 300 310 -- 320 350 420
ESTADISTICA I
X Y XY 𝑋2
4. Una compañía de alimentos maneja una cadena de tiendas al menudeo para medir la
eficiencia de las tiendas se estudió la relación del número de empleados (X) y el promedio del
volumen de ventas mensuales (Y) expresado en cientos de dólares para todas las tiendas durante el
año pasado. La gráfica de los datos sugiere una relación lineal entre las variables. S e tiene la
siguiente información:
𝑛 = 100 ∑ 𝑋 = 600 ∑ 𝑌 = 1600 ∑ 𝑋𝑌 = 13600 ∑ 𝑋 2 = 5200 ∑ 𝑌 2 = 37700
a) Hallar la recta de regresión de mínimos cuadrados para estimar las ventas a partir de
número de empleados. ¿En cuánto se estiman las ventas para una tienda de 12 empleados?
b) ¿Qué porcentaje de la varianza de las ventas es explicada por la variabilidad del número de
empleados?
c) ¿Cuántos empleados tiene la tienda cuya venta promedio se estima en $1,100