Documentos de Académico
Documentos de Profesional
Documentos de Cultura
REGRESIÓN Y CORRELACIÓN.
Son numerosos los ejemplos que se pueden dar al trabajar con dos variables que están
relacionadas: producción y consumo; ingresos y gastos; horas trabajadas y accidentes de
trabajo. Pero no basta con disponer de la información que ha sido recolectada, es
necesario establecer si en realidad existe relación entre ellas, procedimiento que se
denomina análisis de regresión y correlación.
El análisis de regresión da lugar a una ecuación matemática, que nos permite describir
la relación existente entre dos variables. Es decir, obtener el ajuste “ideal” que nos
describa la relación o dependencia entre dos variables.
El análisis de correlación nos describe el grado o fuerza con que se produce esta
relación, para ello se utiliza una medida conocida como coeficiente de correlación o
coeficiente de Pearson.
Así como el análisis de correlación permite medir la fuerza de asociación entre dos
variables, el análisis de regresión permite la predicción o sea la estimación de un valor o
promedio de una variable denominada dependiente, con base en un valor o promedio
supuestamente conocido para la otra variable, denominada independiente.
Hay que tener claridad, que el análisis de regresión, además de explicar la relación
entre dos variables, de causa y efecto, nos permite estimar los valores de una variable,
suponiendo conocida un valor de la otra variable.
Sistema de ecuaciones
Σyi =bΣxi +nc
2
Σyi x i=bΣx i +cΣx i
Producción Costo
(miles mill $) (miles mill $)
xi yi
10 3
18 5
12 4
16 5
22 8
36 12
30 10
32 14
26 12
12 3
Por medio de Excel se encuentra la Ecuación de ajuste Lineal: Y =bx +c , donde
^
Ŷ = es el valor estimado, ya sea que haya hecho una interpolación o una extrapolación.
b = es la pendiente, que nos indica el crecimiento o decrecimiento en y respecto de x.
c = es la intersección con la ordenada o eje y, en un plano cartesiano.
16
14
f(x) = 0.42 x − 1.47
12 R² = 0.89
Costo (miles mill $)
10
0
5 10 15 20 25 30 35 40
Producción (miles mill$)
Coeficiente de correlación:
r= √ R2 ; en este caso el valor de r = 0,95; luego la
correlación es excelente
Sistema de Ecuaciones
2
Σyi =aΣxi + bΣx i +nc
3 2
Σyi x i=aΣx i +bΣx i +cΣx i
2 4 3 2
Σyi x i =aΣx i +bΣxi +cΣxi
Costo Producción
(miles mill $) (miles mill $)
xi yi
23 32
36 48
48 57
56 70
70 86
38 46
30 40
26 36
20 32
10 26
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
100
90
Coeficiente de correlación:
r= √ R2 ; en este caso el valor de r = 0,997; luego la
correlación es excelente.
Se espera un costo aproximado de $49,444 miles de mil anuales para una producción
anual de 40 miles de millones de $ anuales.
xi yi
7 15
5 7
6 10
4 8
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
10 20
8 16
6 12
5 8
10 16
6 8
8 14
AJUSTE EXPONENCIAL
Motores mensuales reconstruidos
50
40 f(x) = 0.89 x^1.59
R² = 0.97
30
20
10
0
0 2 4 6 8 10 12 14
Años de educación
Rta.
a. Se espera que la producción de un trabajador que presenta en su hoja de vida 9 años
de estudio, sea de:
Y= 0,8916*(9)1,5929 = 29,5 = 30 motores reconstruidos en promedio mensualmente.
2
√
b.El coeficiente de Pearson r= R = 0,98 ,lo que implica una correlación excelente.
SERIES DE TIEMPO
Las series de tiempo también se denominan series cronológicas. Una serie de tiempo es
un conjunto de observaciones ordenadas respecto a una característica cuantitativa de un
fenómeno individual o colectivo, que se toman en diferentes períodos de tiempo (diario,
semanal, mensual, trimestral, anual, etc)
En la vida diaria nos encontramos con mucha información de este tipo: nacimientos,
accidentes de tránsito o laborales, exportaciones e importaciones, ventas, presupuestos,
etc.
Las series de tiempo como el análisis de regresión, corresponden a distribuciones
bidimensionales, o bivariantes es decir, se trabaja y analizan conjuntamente dos
variables, salvo que en este caso una de ellas corresponde al tiempo que podría
considerarse como la variable independiente o explicativa, y que se simboliza por X ; la
otra variable es la que se va a estimar, ya sea dentro de la serie (interpolar) o su
comportamiento futuro(extrapolar), simbolizado por Y, y puede corresponder, como por
ejemplo producción, ventas, inversión, etc. Se trata de una regresión unilateral.
Vale la pena mencionar que las proyecciones o la tendencia en el futuro, debe hacerse
para períodos cortos de uno o dos años, máximo cinco años, bajo el supuesto que las
condiciones dadas en la serie van a seguir siendo iguales que en el presente; imposible
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
que se mantenga en períodos largos, a fin de que no se produzcan diferencias entre lo
esperado y su comportamiento real.
TENDENCIA
Para la determinación de la tendencia, es decir, la obtención del ajuste ideal que nos
permita estimar el comportamiento futuro, aplicaremos el método de los mínimos
cuadrados, con el objeto de cuantificar los parámetros en la ecuación correspondiente:
rectilínea, parabólica o exponencial.
r= √ R2
Ejemplo 1: Con la siguiente serie, tomando los valores de Utilidades anuales de una
empresa en unidades de millar, estimar el valor de utilidad Ŷ para el año 2017.
Años Xi Yi
2009 1 24
2010 2 29
2011 3 36
2012 4 42
2013 5 56
2014 6 60
2015 7 67
∑
Solución:
80
70
Utilidades, en unidades de millar
70
f(x) = 0.13 x² + 6.49 x + 16.29
60 R² = 0.98
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8
Años
40
30
20
10
0
0 1 2 3 4 5 6 7 8
Años
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
EJERCICIOS
2.El número de piezas defectuosas producidas por una máquina durante el mes de
septiembre del 2016 fueron
Días 1 2 3 4 5 6 7 8 9 1 11 12 13 1 15
0 4
#piezas 8 5 1 7 9 11 3 6 6 8 5 6 9 3 7
defectuosas 0
Días 16 17 1 19 20 21 2 23 24 2 26 27 28 2 30
8 2 5 9
#piezas 10 9 1 8 4 2 8 8 6 5 10 9 4 7 3
defectuosas 3
52,452 50,432 37,748 51,831 73,808 61,065 35,807 57,277 44,719 51,179
48,698 65,854 75,850 36,949 75,548 69,010 61,477 65,585 62,215 74,582
44,411 41,886 34,754 59,888 59,449 67,632 89,116 69,483 37,402 58,708
63.692 70,003 65,996 61,390 49,677 46,502 67,467 61,752 51,269 48,035
84,588 40,709 50,238 66,519 85,720 45,313 46,724 28,625 37,654 82,919
55,643 55,912 46,681 41,715 59,168 66,313 35,884 48,172 34,182 67,124
47,012 71,360 78,635 41,715 72,635 41,463 48,996 48,172 61,979 41,830
79,426 67,662 53,324 49,011 29,480 41,128 30,252 33,412 80,502 61,030
48,240 57,884 55,257 84,656 48,662 10,504 60,951 38,420 4,3068 58,267
74,239 60,727 56,155 86,070 90,565 53,751 76,580 68,629 35,342 41,539
Se pide:
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
a- Construir una taba de frecuencias para esos datos tomando como número de
intervalos el que proporciona la fórmula de Sturges. Interpretar la tabla.
b- Dibujar el histograma de frecuencias.
4. Con los siguientes datos se pide hacer un análisis de correlación del número de días
vs deuda adquirida. Estimar cuál será la deuda a los 180 días. Revisar cuál sería el mejor
ajuste.
181- 271- >371
Nit Nombre # Fra Días Saldo 0-30 31-60 61-90 91-180 270 370 dias
1317405 GONZALEZ CARLOS ALBERTO 27072 127 96.001,0 0,0 0,0 0,0 96.001,0 0,0 0,0 0,0
1317405 GONZALEZ CARLOS ALBERTO 27123 106 192.637,0 0,0 0,0 0,0 192.637,0 0,0 0,0 0,0
1317405 GONZALEZ CARLOS ALBERTO 27124 105 57.640,0 0,0 0,0 0,0 57.640,0 0,0 0,0 0,0
1317405 GONZALEZ CARLOS ALBERTO 27126 104 294.240,0 0,0 0,0 0,0 294.240,0 0,0 0,0 0,0
1317405 GONZALEZ CARLOS ALBERTO 27149 93 423.088,0 0,0 0,0 0,0 423.088,0 0,0 0,0 0,0
1317405 GONZALEZ CARLOS ALBERTO 27218 64 92.023,0 0,0 0,0 92.023,0 0,0 0,0 0,0 0,0
1317405 GONZALEZ CARLOS ALBERTO 27221 64 17.390,0 0,0 0,0 17.390,0 0,0 0,0 0,0 0,0
1317405 GONZALEZ CARLOS ALBERTO 27253 51 110.355,0 0,0 110.355,0 0,0 0,0 0,0 0,0 0,0
1317405 GONZALEZ CARLOS ALBERTO 27266 47 26.944,0 0,0 26.944,0 0,0 0,0 0,0 0,0 0,0
1317405 GONZALEZ CARLOS ALBERTO 27266 47 33.3250 0,0 33.325,0 0,0 0,0 0,0 0,0 0,0
Producción Costo
(miles mill $) (miles mill $)
xi yi
1 1.25
2 5
3 11.25
4 20
5 30.50