Está en la página 1de 10

UNIVERSIDAD LIBRE SECCIONAL CÚCUTA

FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES


ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
INFERENCIA ESTADISTICA

REGRESIÓN Y CORRELACIÓN.

Son numerosos los ejemplos que se pueden dar al trabajar con dos variables que están
relacionadas: producción y consumo; ingresos y gastos; horas trabajadas y accidentes de
trabajo. Pero no basta con disponer de la información que ha sido recolectada, es
necesario establecer si en realidad existe relación entre ellas, procedimiento que se
denomina análisis de regresión y correlación.

El análisis de regresión da lugar a una ecuación matemática, que nos permite describir
la relación existente entre dos variables. Es decir, obtener el ajuste “ideal” que nos
describa la relación o dependencia entre dos variables.

El análisis de correlación nos describe el grado o fuerza con que se produce esta
relación, para ello se utiliza una medida conocida como coeficiente de correlación o
coeficiente de Pearson.

Así como el análisis de correlación permite medir la fuerza de asociación entre dos
variables, el análisis de regresión permite la predicción o sea la estimación de un valor o
promedio de una variable denominada dependiente, con base en un valor o promedio
supuestamente conocido para la otra variable, denominada independiente.

Hay que tener claridad, que el análisis de regresión, además de explicar la relación
entre dos variables, de causa y efecto, nos permite estimar los valores de una variable,
suponiendo conocida un valor de la otra variable.

1. REGRESIÓN Y CORRELACIÓN: AJUSTE RECTILINEO


Y^ =bx +c

Método de los mínimos cuadrados:

Sistema de ecuaciones
Σyi =bΣxi +nc
2
Σyi x i=bΣx i +cΣx i

Coeficiente de Pearson (Correlación)


nΣx i yi −Σx i ( Σy i )
r=
√[nΣx 2i −( Σx i )2 nΣyi2−( Σy i )2
][ ]

EJERCICIO. Supongamos la realización de una investigación a 10 empresas, que


producen determinado producto, en cuanto al valor de la producción (miles mill $
anuales) y el costo del mismo (miles mill de $ anuales). Los resultados fueron:
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2

Producción Costo
(miles mill $) (miles mill $)
xi yi
10 3
18 5
12 4
16 5
22 8
36 12
30 10
32 14
26 12
12 3
Por medio de Excel se encuentra la Ecuación de ajuste Lineal: Y =bx +c , donde
^
Ŷ = es el valor estimado, ya sea que haya hecho una interpolación o una extrapolación.
b = es la pendiente, que nos indica el crecimiento o decrecimiento en y respecto de x.
c = es la intersección con la ordenada o eje y, en un plano cartesiano.
16

14
f(x) = 0.42 x − 1.47
12 R² = 0.89
Costo (miles mill $)

10

0
5 10 15 20 25 30 35 40
Producción (miles mill$)

Coeficiente de correlación:
r= √ R2 ; en este caso el valor de r = 0,95; luego la
correlación es excelente

El grado de correlación lo podemos clasificar:


 Correlación perfecta, cuando r = 1
 Correlación excelente, cuando r es mayor de 0.90 y menor de 1
 Correlación aceptable, cuando r se encuentra entre 0.80 y 0.90
 Correlación regular, cuando r se encuentra entre 0.60 y 0.80
 Correlación mínima, cuando r se encuentra entre 0.30 y 0.60
 No hay correlación para r menor de 0.30 y mayor a 0

¿Cuál será el costo esperado en miles de millones de $, si se espera producir anualmente


40 miles de millones de $?. Se Reemplaza en la ecuación de ajuste ideal:
Yˆ = 0,4237X-1,468 = 0,4237* 40 – 1,468 = $15,48 miles de mill anuales
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
Se espera un costo aproximado de $15,48 miles de mill anuales para una producción
anual de 40 miles de millones de $ anuales.

2. REGRESIÓN Y CORRELACIÓN: AJUSTE PARABÓLICO: Y^ =a x2 +bx +c

Aplicada cuando aquellos fenómenos que se observan en un diagrama de Dispersión,


presenta una concentración de puntos inicialmente ascendente y en seguida descendente
(puede darse lo contrario). Esta regresión parabólica es utilizada, en gran parte, por los
economistas en el análisis de funciones de utilidad, ingresos, etc.

Método de los mínimos cuadrados.

Sistema de Ecuaciones
2
Σyi =aΣxi + bΣx i +nc
3 2
Σyi x i=aΣx i +bΣx i +cΣx i
2 4 3 2
Σyi x i =aΣx i +bΣxi +cΣxi

Coeficiente de Pearson (Correlación)


nΣx i yi −Σx i ( Σy i )
r=
√[nΣx 2i −( Σx i )2 nΣyi2−( Σy i )2
][ ]
EJERCICIO. Supongamos la realización de una investigación a 10 empresas, que
producen un determinado producto, en cuanto al valor del costo en (miles mil $ anuales)
y el valor de la producción (en miles mil de $ anuales). Los resultados fueron:

Costo Producción
(miles mill $) (miles mill $)
xi yi
23 32
36 48
48 57
56 70
70 86
38 46
30 40
26 36
20 32
10 26
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
100
90

Producción (miles de mill $)


80 f(x) = 0.01 x² + 0.45 x + 19.82
R² = 0.99
70
60
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80
Costo(miles de mill $)

Coeficiente de correlación:
r= √ R2 ; en este caso el valor de r = 0,997; luego la
correlación es excelente.

¿Cuál será el costo esperado en miles de millones de $, si se espera producir anualmente


40 miles de millones de $?. Nuevamente se reemplaza en la ecuación de ajuste ideal:
Yˆ = 0,0072X2 + 0,4526X + 19,82 = 0,0072(40)2 + 0,4526(40) + 19,82 = 49,444 miles de mil
anuales

Se espera un costo aproximado de $49,444 miles de mil anuales para una producción
anual de 40 miles de millones de $ anuales.

3. REGRESIÓN Y CORRELACIÓN: AJUSTE EXPONENCIAL.


Y^ =bx c

Cuando las variables estudiadas presentan un crecimiento o decrecimiento aritmético, la


regresión lineal es la más adecuada, pero si hay un crecimiento o decrecimiento
geométrico, se debe adoptar la regresión exponencial.

EJERCICIO: Un funcionario de una entidad, que generalmente, presta asesoría a


pequeños establecimientos donde se reconstruyen pequeños motores a gasolina para
bombas hidráulicas, ha realizado un estudio acerca de las diferencias entre la habilidad
de los trabajadores para aprender el nuevo trabajo y su capacidad de realizarlo sin
supervisión. Después de varias semanas, ha obtenido la siguiente información, donde Y
= producción mensual de motores correctamente construidos y X= años de educación
en cada uno de los trabajadores.
a. Estime la producción mensual promedio de motores correctamente reconstruidos
por un trabajador que presenta en su hoja de vida 9 años de estudio.
b. Interprete el coeficiente de correlación

xi yi
7 15
5 7
6 10
4 8
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
10 20
8 16
6 12
5 8
10 16
6 8
8 14

AJUSTE EXPONENCIAL
Motores mensuales reconstruidos

50
40 f(x) = 0.89 x^1.59
R² = 0.97
30
20
10
0
0 2 4 6 8 10 12 14
Años de educación

Rta.
a. Se espera que la producción de un trabajador que presenta en su hoja de vida 9 años
de estudio, sea de:
Y= 0,8916*(9)1,5929 = 29,5 = 30 motores reconstruidos en promedio mensualmente.
2

b.El coeficiente de Pearson r= R = 0,98 ,lo que implica una correlación excelente.

SERIES DE TIEMPO

Las series de tiempo también se denominan series cronológicas. Una serie de tiempo es
un conjunto de observaciones ordenadas respecto a una característica cuantitativa de un
fenómeno individual o colectivo, que se toman en diferentes períodos de tiempo (diario,
semanal, mensual, trimestral, anual, etc)

En la vida diaria nos encontramos con mucha información de este tipo: nacimientos,
accidentes de tránsito o laborales, exportaciones e importaciones, ventas, presupuestos,
etc.
Las series de tiempo como el análisis de regresión, corresponden a distribuciones
bidimensionales, o bivariantes es decir, se trabaja y analizan conjuntamente dos
variables, salvo que en este caso una de ellas corresponde al tiempo que podría
considerarse como la variable independiente o explicativa, y que se simboliza por X ; la
otra variable es la que se va a estimar, ya sea dentro de la serie (interpolar) o su
comportamiento futuro(extrapolar), simbolizado por Y, y puede corresponder, como por
ejemplo producción, ventas, inversión, etc. Se trata de una regresión unilateral.

Vale la pena mencionar que las proyecciones o la tendencia en el futuro, debe hacerse
para períodos cortos de uno o dos años, máximo cinco años, bajo el supuesto que las
condiciones dadas en la serie van a seguir siendo iguales que en el presente; imposible
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
que se mantenga en períodos largos, a fin de que no se produzcan diferencias entre lo
esperado y su comportamiento real.
TENDENCIA

Para la determinación de la tendencia, es decir, la obtención del ajuste ideal que nos
permita estimar el comportamiento futuro, aplicaremos el método de los mínimos
cuadrados, con el objeto de cuantificar los parámetros en la ecuación correspondiente:
rectilínea, parabólica o exponencial.

1. SERIES DE TIEMPO: TENDENCIA LINEAL. Y^ =bx +c

Método de los mínimos cuadrados: Sistema de ecuaciones


Σyi =bΣxi +nc
2
Σyi x i=bΣx i +cΣx i
nΣx i yi −Σxi ( Σy i )
r=
2 2 2 2
Coeficiente de correlación √ [nΣx −( Σx ) ][nΣy −( Σy ) ]
i i i i

r= √ R2

Ejemplo 1: Con la siguiente serie, tomando los valores de Utilidades anuales de una
empresa en unidades de millar, estimar el valor de utilidad Ŷ para el año 2017.
Años Xi Yi
2009 1 24
2010 2 29
2011 3 36
2012 4 42
2013 5 56
2014 6 60
2015 7 67

Solución:
80
70
Utilidades, en unidades de millar

f(x) = 7.54 x + 14.71


60 R² = 0.98
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8
Años
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
Ecuación de la recta ajustada: Ŷ = 7,537x + 14,714
si se va a estimar Ŷ para el año 2017, se tendrá Ŷ17 = 7,537(9) + 14,714 = 82,5353
Ŷ17 = 82,5353

2. SERIES DE TIEMPO: AJUSTE PARABÓLICO


Y^ =ax 2 +bx+c ,

Método de los mínimos cuadrados: Sistema de ecuaciones


Σyi =aΣx 2i + bΣx i +nc
Σyi x i=aΣx 3i +bΣx 2i +cΣx i
Σy i x 2i =aΣx 4i +bΣx3i +cΣx2i
Ejemplo. El ajuste parabólico ha sido desarrollado con los datos del ejemplo anterior:
80
Utilidades, en unidades de millar

70
f(x) = 0.13 x² + 6.49 x + 16.29
60 R² = 0.98
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8
Años

3. SERIES DE TIEMPO: AJUSTE EXPONENCIAL Y^ =cb x

Ejemplo: En el ajuste exponencial se utilizaron los datos del ejemplo de tendencia


lineal.
80
70
60 f(x) = 21.54 x^0.55
50 R² = 0.95
Utilidades

40
30
20
10
0
0 1 2 3 4 5 6 7 8
Años
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2

EJERCICIOS

1. Se tomó una muestra de 60 cuentas corrientes de personas naturales en una sucursal


de un banco y en cada una se contó el número de sobregiros que habían tenido en el
último año. Se obtuvieron los siguientes datos:
3 1 2 2 1 0 0 0 1 2
1 2 3 2 1 0 1 0 2 1
2 3 2 1 2 1 2 1 0 1
1 2 4 2 4 3 3 3 2 1
1 4 2 0 5 2 4 6 2 1
a. Organizar los datos en una distribución de frecuencia ygraficar el histograma
b. Qué se puede interpretar de la distribución de frecuencia elaborada

2.El número de piezas defectuosas producidas por una máquina durante el mes de
septiembre del 2016 fueron
Días 1 2 3 4 5 6 7 8 9 1 11 12 13 1 15
0 4
#piezas 8 5 1 7 9 11 3 6 6 8 5 6 9 3 7
defectuosas 0
Días 16 17 1 19 20 21 2 23 24 2 26 27 28 2 30
8 2 5 9
#piezas 10 9 1 8 4 2 8 8 6 5 10 9 4 7 3
defectuosas 3

a. Organizar los datos en una distribución de frecuencia ygraficar el histograma


b. Qué se puede interpretar de la distribución de frecuencia elaborada

3. Un fabricante de neumáticos ha obtenido, de los diferentes concesionarios,


información sobre la cantidad de miles de kilómetros recorridos por un modelo concreto
de esos neumáticos hasta que se ha producido un pinchazo o un reventón del neumático.
Los concesionarios le han proporcionado los siguientes datos:

52,452 50,432 37,748 51,831 73,808 61,065 35,807 57,277 44,719 51,179
48,698 65,854 75,850 36,949 75,548 69,010 61,477 65,585 62,215 74,582
44,411 41,886 34,754 59,888 59,449 67,632 89,116 69,483 37,402 58,708
63.692 70,003 65,996 61,390 49,677 46,502 67,467 61,752 51,269 48,035
84,588 40,709 50,238 66,519 85,720 45,313 46,724 28,625 37,654 82,919
55,643 55,912 46,681 41,715 59,168 66,313 35,884 48,172 34,182 67,124
47,012 71,360 78,635 41,715 72,635 41,463 48,996 48,172 61,979 41,830
79,426 67,662 53,324 49,011 29,480 41,128 30,252 33,412 80,502 61,030
48,240 57,884 55,257 84,656 48,662 10,504 60,951 38,420 4,3068 58,267
74,239 60,727 56,155 86,070 90,565 53,751 76,580 68,629 35,342 41,539

Se pide:
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
a- Construir una taba de frecuencias para esos datos tomando como número de
intervalos el que proporciona la fórmula de Sturges. Interpretar la tabla.
b- Dibujar el histograma de frecuencias.

4. Con los siguientes datos se pide hacer un análisis de correlación del número de días
vs deuda adquirida. Estimar cuál será la deuda a los 180 días. Revisar cuál sería el mejor
ajuste.
181- 271- >371
Nit Nombre # Fra Días Saldo 0-30 31-60 61-90 91-180 270 370 dias

1317405 GONZALEZ CARLOS ALBERTO 27072 127 96.001,0 0,0 0,0 0,0 96.001,0 0,0 0,0 0,0

1317405 GONZALEZ CARLOS ALBERTO 27123 106 192.637,0 0,0 0,0 0,0 192.637,0 0,0 0,0 0,0

1317405 GONZALEZ CARLOS ALBERTO 27124 105 57.640,0 0,0 0,0 0,0 57.640,0 0,0 0,0 0,0

1317405 GONZALEZ CARLOS ALBERTO 27126 104 294.240,0 0,0 0,0 0,0 294.240,0 0,0 0,0 0,0

1317405 GONZALEZ CARLOS ALBERTO 27149 93 423.088,0 0,0 0,0 0,0 423.088,0 0,0 0,0 0,0

1317405 GONZALEZ CARLOS ALBERTO 27218 64 92.023,0 0,0 0,0 92.023,0 0,0 0,0 0,0 0,0

1317405 GONZALEZ CARLOS ALBERTO 27221 64 17.390,0 0,0 0,0 17.390,0 0,0 0,0 0,0 0,0

1317405 GONZALEZ CARLOS ALBERTO 27253 51 110.355,0 0,0 110.355,0 0,0 0,0 0,0 0,0 0,0

1317405 GONZALEZ CARLOS ALBERTO 27266 47 26.944,0 0,0 26.944,0 0,0 0,0 0,0 0,0 0,0

1317405 GONZALEZ CARLOS ALBERTO 27266 47 33.3250 0,0 33.325,0 0,0 0,0 0,0 0,0 0,0

1.343.643,0 0,0 170.624,0 109.413,0 1.063.606,0 0,0 0,0 0,0

5. Supongamos la realización de una investigación a 5 empresas, que producen un


determinado producto, en cuanto al valor de la producción (miles mil $ anuales) y el
costo del mismo (miles mil de $). Los resultados fueron:

Producción Costo
(miles mill $) (miles mill $)
xi yi
1 1.25
2 5
3 11.25
4 20
5 30.50

Con los datos anteriores se pide hacer un análisis de correlación de la producción vs


costo. Estimar cuál será el costo para una producción de 7 miles de millones de $.
Desarrollar un análisis lineal, parabólico y exponencial y seleccionar el mejor ajuste.

6. Con los siguientes datos se pide:

Años 2013 2014 2015 2016 2017 2018 2019


Producción(Miles Ton 360 383 337 390 406 459 480
UNIVERSIDAD LIBRE SECCIONAL CÚCUTA
FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
ESPECIALIZACIÓN EN REVISORÍA FISCAL
MUESTREO ESTADÍSTICO GUÍA N.2
carbón)

Estimar la producción (Miles Tons) para el 2022 seleccionando el mejor ajuste

7. Durante nueve días se observó el número de unidades que produjeron dos


trabajadores de una fábrica que elaboraban el mismo artículo, obteniendo:
Operario 1. 22 25 28 29 35 27 26 20 30
Operario 2. 21 24 26 28 28 27 29 24 26
Cuál de los dos operarios es:
a. Más eficiente en su producción diaria? Porqué?
b. Más uniforme en su producción diaria? Porqué?

8. El consejo de Administración de una corporación está estudiando la posibilidad de


adquirir una de dos compañías y para ello analiza la administración de cada una en
relación con su inclinación a correr riesgos. En los últimos cinco años, la primera
compañía alcanzó un promedio de rendimiento sobre las inversiones del 28% con una
desviación estándar de 5,3%. La segunda tuvo un rendimiento medio de 37,8% con una
desviación estándar de 6,29%. Cuál de estas dos empresas ha aplicado una estrategia
más riesgosa en sus inversiones? Porqué?. Cuál de las dos empresas recomendaría
comprar? Porqué?

9. Un inversionista está interesado en hacerse socio en una de dos empresas de


inversiones. El desearía ser socio de aquella empresa de la cual considere que obtiene
mayor rentabilidad con menor riesgo. Para decidir observa que las últimas inversiones
realizadas por las empresas han tenido las siguientes rentabilidades (%)
EMPRESA A: 27 32 31 28 25 22 24
EMPRESA B: 25 29 24 26 24 30 35 23
En cuál de las dos empresas le recomendaría invertir ? Porqué?

También podría gustarte