Está en la página 1de 22

Estadstica Inferencial para Tasadores

2008

EstadsticaInferencialparaTasadores

Ing. MSc. Luis Fernando Restrepo Gmez


Ing. Civil - Mster en Gerencia - Tasador

Ing.MSc.LuisFernandoRestrepoGmez Luisferes15@gmail.com

2008

Tabladecontenido
I.- INTRODUCCIN ................................................................................................................ 3 II.- MARCO TERICO ............................................................................................................ 3 REGRESIN. ..................................................................................................................... 3 Clases de Regresin. ..................................................................................................... 3 Regresin Simple: ...................................................................................................... 3 Coeficiente de Regresin ...................................................................................... 4 Regresin Mltiple: .................................................................................................... 6 Anlisis de Regresin Mltiple ............................................................................... 6 APLICACIONES A LA TASACIN DE INMUEBLES .......................................................... 9 Ejemplo de Regresin lineal mltiple para tasar un edificio ..................................... 10 Prueba de los Resultados mediante el Estadstico t ........................................... 12 Prueba de los Resultados mediante los Estadsticos R2 y F.......................... 14 Otro Ejemplo de Regresin lineal mltiple para tasar un terreno ............................. 15 Prueba de los Resultados mediante el Estadstico t ........................................... 16 Prueba de los Resultados mediante los Estadsticos R2 y F.......................... 17

Pgina luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

I.- INTRODUCCIN
La Estadstica Inferencial permite trabajar con una variable a nivel de intervalo o razn, de igual forma con ella tambin se puede comprender la relacin de dos o ms variables y permite relacionar mediante ecuaciones, una variable en relacin de la otra variable llamndose Regresin Simple y una variable en relacin a otras variables llamndose Regresin Mltiple. Casi constantemente en la practica de la investigacin estadstica, se encuentran variables que de alguna manera estn relacionados entre si, por lo que es posible que una de las variables puedan relacionarse matemticamente en funcin de otra u otras variables. La Estadstica Inferencial incluye lo relativo a la correlacin y regresin, lo cual es muy usado en la investigacin cientfica, y es una herramienta muy til cuando se trata de relacionar 2 o ms variables, entre si. La correlacin implica el grado de dependencia de una variable respecto a otra y la regresin analiza la relacin de dos o ms variables continuas. La regresin permite el cambio en una de las variables llamadas respuesta y que corresponde a otra conocida como variable explicativa, siendo sta una tcnica utilizada para inferir datos a partir de otros y hallar una respuesta de lo que puede suceder.

II.- MARCO TERICO


REGRESIN.
Se define como un procedimiento mediante el cual se trata de determinar si existe o no relacin de dependencia entre dos o ms variables. Es decir, conociendo los valores de una variable independiente, se trata de estimar los valores, de una o ms variables dependientes. La regresin en forma grafica, trata de lograr que una dispersin de las frecuencias sea ajustada a una lnea recta o curva.

CLASES DE REGRESIN.
La regresin puede ser Lineal y Curvilnea o no lineal, ambos tipos de regresin pueden ser a su vez:

REGRESIN SIMPLE:
Este tipo se presenta cuando una variable independiente ejerce influencia sobre otra variable dependiente. Ejemplo: Y = f(x) Esta regresin se utiliza con mayor frecuencia en las ciencias econmicas, y sus disciplinas tecnolgicas. Cualquier funcin no lineal, es linealizada para su estudio y efectos prcticos en las ciencias econmicas, modelos no lineales y lineales multiecuacionales. Objetivo: Se utiliza la regresin lineal simple para: 1. 2. 3. Determinar la relacin de dependencia que tiene una variable respecto a otra. Ajustar la distribucin de frecuencias de una lnea, es decir, determinar la forma de la lnea de regresin. Predecir un dato desconocido de una variable partiendo de los datos conocidos de otra variable.

Por ejemplo: Podra ser una regresin de tipo lineal:

En la tabla representa Y (Ganancias $.) e X (Nmero de usuarios)

luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

En una empresa de servicio de Internet, se busca relacionar las ganancias que obtiene cada computadora, con el nmero de usuarios que ingresan a dicha cabina diariamente.

Pgina

Y 100 98 99 102 1 102 111 97 104 10 96 02 X 116 96 110 105 9 99 106 100 109 98 108 8
COEFICIENTE DE REGRESIN D Indica el nm mero de unidade en que se m es modifica la variable dependiente Y por efecto del cambio de la e o e variable independiente X o viceversa e una unidad de medida. en Clases de coeficiente de Regresin: s e : El coeficiente de regresin puede ser: Positivo Negativo y Nu o, ulo. p o ndependiente X son directament proporcionale a te es Es positivo cuando las variaciones de la variable in las variaciones de la variable depen v a ndiente Y Es negativo, cua ando las variac ciones de la variable indep pendiente X son inversame ente prop porcionales a las variaciones de las variables de s ependientes Y Es nulo o cero, cua n ando entre las va ariables dependiientes Y e inde ependientes X no existen relac cin alguna.

25 20 15 10 5 0 0 5 10 15 Positiv vo 20

0,6 0,5 0,4 0,3 0,2 0,1 0 0 5 Negativ vo 10

Pgina

10 Nulo

20

30

luisfe eres15@gmail.com luisferes15@yahoo o.com ; Cel.: 3 311.354.52.24 4

4 4

25 20 15 10 5 0

Proced dimiento para h hallar el Coefici iente de Regres sin Para determin el valor del c nar coeficiente de re egresin de una manera fcil y exacta es utiliza a ando el mtodo de los Mnim Cuadrados de dos maneras mos s: 1.1 Forma Direc cta De la ecuacin de la recta: n

Si a 0 y a1 , se obtienen a p partir de las ecua aciones normale es:

Aplicando norm males Y sobre X se tiene:

El Coeficiente de Regresin es

De la misma manera la recta d regresin de X sobre Y se dada de la siguiente manera m de er a:

Donde: b0 y b1 se obtienen a partir de las e ecuaciones norm males:

Aplicando norm males X sobre Y se tiene:

Pgina luisfe eres15@gmail.com luisferes15@yahoo o.com ; Cel.: 3 311.354.52.24 4

5 5

2.2 Forma Indire del Mtodo de los Mnimo Cuadrados. ecta o os El fundamento de este mtodo es de las desv o o viaciones de X re especto a su me aritmtica edia

Ecuacin d y sobre x de

Ecu uacin de x sobre y

Donde: x, y = desviaciiones X = media ar ritmtica de las X Y = media ar ritmtica de las Y

REGRESIN MLTIPLE:
Este tipo se presenta cuando dos o ms va p o ariables indepen ndientes influyen sobre una var n riable dependien nte. o: . Ejemplo Y = f (x, w, z k). Por ejemplo: Podra ser una r regresin de tipo mltiple: o Una Empresa de desarrollo de software estab blece relacionar sus Ventas en funcin del num de pedidos de r mero s los tipos de software que desarrolla (Sistemas, Ed s ducativos y Aut tomatizaciones Empresariales), para atender 10 , proyecto en el presente ao. os e En la Tabla representa Y (Ventas miles d $) e X (N pedidos de sistemas), W ( de pedidos de r de (N Aplicacio ones Educativas y Z (N de p s) pedidos de Autom matizaciones em mpresariales).
Y X W Z 440 50 105 75 455 4 40 140 1 68 470 35 110 70 510 0 45 130 0 64 506 51 125 67 480 55 115 72 460 53 100 70 500 48 103 73 490 0 38 118 8 69 450 44 98 74

Objetivo: Se presentara primero el anlisis d regresin mltiple al desarrolllar y explicar el uso de la ecuac de cin de regre esin mltiple, as como el error estndar mltiple de estimacin Despus se m s n. medir la fuerza d la relacin en de ntre las varia ables independie entes, utilizando los coeficientes mltiples de de eterminacin. ANLISIS DE REGRESIN MLTIPLE E Dispone de un ecuacin con dos variables in na ndependientes a adicionales:

Pgina
Se puede amp para cualqu nmero m de variables ind pliar uier dependientes:

luisfe eres15@gmail.com luisferes15@yahoo o.com ; Cel.: 3 311.354.52.24 4

6 6

Para poder res solver y obtener a, b1 y b2 en una ecuaci de regresin m r n mltiple el clculo se presenta m muy tedioso p porque se tiene que atender 3 e ecuaciones que s generan por e mtodo de m se el nimo de cuadra ados:

Para poder res solver se puede utilizar program informticos como por ejemplo la Hoja de C mas Calculo de Micros soft Excel. El erro estndar de l regresin m or la ltiple

( S xy )

Es una medida de dispersin, la estimacin s hace ms pre , se ecisa, cuando el grado de dispe ersin alrededor del plano de regresin se ha ms peque e ace o. Para medirla se utiliza la formula: s

Y: Valo observados en la muestra ores s : Valores estimados a partir de la ecuacin de regresin n: Nm de datos mero m: Nmero de variable independienttes es
El Coe eficiente de Det terminacin M ltiple

(r )
2

Mide la tasa porcentual de los cambios de Y que pueden se explicados po X1, X2 y X3 s s er or simultneamente e.

Ejemp de Aplicaci de Regresin Mltiple plo n n

Pgina

Mediante el sig guiente problem se puede ilust la aplicacin de Regresin M ma trar n Mltiple: En la Faculta de Ingenier Civil de una Universidad d Medelln se quiere entende los factores de ad a a de er aprendiz de los alumnos que cursan la asignatura de PHP, para lo c se escoge a azar una mues de 15 alumn zaje e cual al stra nos y ellos re egistran notas promedios en las asignaturas de Algoritmos, Ba de Datos y Programacin como se muest p s ase tran en el sig guiente cuadro.

luisfe eres15@gmail.com luisferes15@yahoo o.com ; Cel.: 3 311.354.52.24 4

7 7

Alumno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

PHP Y 13 13 13 15 16 15 12 13 13 13 11 14 15 15 15

Algoritmo os

Base de Da atos

Programacin

X1
15 14 16 20 18 16 13 16 15 14 12 16 17 19 13

X2
15 13 13 14 18 17 15 14 14 13 12 11 16 14 15

X3
13 12 14 16 17 15 11 15 13 10 10 14 15 16 10

Lo que se bus es construir un modelo para determinar la dependencia qu existe de aprendizaje, refleja sca r ue ada en las notas de la as signatura de PH conociendo las notas de las asignaturas Algoritmos, Base de Datos y HP, s s Program macin. Se pres sentara la siguiente ecuacin a r resolver:

Utilizando las formulas de las ecuaciones nor rmales a los dat se obtendrn los coeficien de regresi tos n ntes n o utilizan la funcin Regresin de la herramienta ndo Anlisis de da atos, en la Hoja de Calculo de Microsoft Excell se a puede o obtener tambin y ms fcilmente los coeficiente de regresin como se muestr a continuacin: es ra

e e buscamos: Por lo tanto se puede construiir la ecuacin de regresin que b

El Erro Estndar de Regresin Ml or ltiple

(S x, y )

Mediante esta medida de dispersin se hace ms pre a e eciso el resultad obtenido, cu do uando el grado de dispersi alrededor dell plano de regres n sin, se hace m pequeo. s Para calcularla se utiliza la for a rmula siguiente:

Pgina luisfe eres15@gmail.com luisferes15@yahoo o.com ; Cel.: 3 311.354.52.24 4

8 8

El coeficiente de determinacin mltiple

(r2)

Utilizaremos para determinar la tasa porcentual de Y para ser explicadas las variables mltiples, utilizando la siguiente formula:

r2 =
r2 =

SCregresin SCTotal

18.7737874 = 0.69704656 26.9333333

Coeficiente de Determinacin R2, se observa que este es igual a 0.69704656, lo que indica o traduce que El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las asignaturas de Algoritmos, Base de Datos y Programacin. En los resultados de Excel se llama error tpico al error estndar y mediante la interpretacin de este resultado, se puede explicar la relacin del aprendizaje de PHP versus las asignaturas Algoritmos, Base de Datos y Programacin que se viene desarrollando (el resultado es de 0,861), el cual se observa en la cuarta fila de la tabla que arroja Excel presentada en el punto anterior, denominada Estadsticas de la Regresin. Como se dijo en la definicin, entre ms pequeo sea el error estndar, menos dispersin hay de los datos y mayor precisin en la prediccin de la variable dependiente Y se logra.

Leyendo los resultados que arroja el anlisis de regresin utilizando el Excel, en la segunda fila en donde dice

APLICACIONES A LA TASACIN DE INMUEBLES


De la misma forma, para resolver este Anlisis de Regresin, se puede hacer utilizando la Funcin estadstica Estimacin Lineal, de Microsoft EXCEL La funcin ESTIMACIN LINEAL arroja como resultado una matriz que describe una ecuacin del tipo:

Y = m1 X1 + m2 X2 + m3 X3 +....... + mn Xn + b
Donde el valor Y dependiente es una funcin de los valores Xi independientes. Los valores mi son coeficientes que corresponden a cada valor de Xi y b es un valor constante. La metodologa asume que existe una relacin lineal entre cada una de las variables independientes con la variable dependiente que se considere. Para interpretar de una mejor forma la informacin que se presentar EXCEL, antes se definirn algunos elementos que contienen los cuadros a presentar. R2: Coeficiente de determinacin o error cuadrtico, el cual explica el nivel de certidumbre o acierto con que las variables independientes juntas, permiten predecir la Variable dependiente.

Pgina

luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

F:

Estadstico utilizado para verificar el grado de significancia entre la variable dependiente y las variables independientes, como un todo. Constante de la ecuacin de regresin. Estadstico utilizado para comprobar la importancia de cada una de las variables independientes en la explicacin del fenmeno en estudio o de la variable dependiente. La Funcin Estimacin lineal tambin puede devolver estadsticas de regresin, de esta forma arroja lo

mi: Coeficiente de cada variable independiente en la ecuacin de regresin. b: ti:

siguiente:
ESTADISTICA DESCRIPCION Valores de error estndar para los coeficientes m1 ; m2 ; m3 ;....... mi

e1 ; e2 ; e3 ;..........; ei

r2

El

coeficiente

de

determinacin, 1 y 0. Si es 1,

cuyo valor flucta entre

existe una correlacin perfecta entre las variables. Por el contrario si el

coeficiente de determinacin es cero la ecuacin de regresin no ser til en la prediccin de un valor de Y.

Estadstica para

F,

la si o

cual los si

se

utiliza

determinar al

resultados todas las

ocurrieron

azar

variables son significativas.

Se utilizar el estadstico t , para determinar la importancia de cada una de las variables independientes en el anlisis de regresin.

Grados de Libertad

Se crticos,

utiliza

para de

valores una

de

dentro y

tabla del

estadstica estadstico por ( 1 - )

valores , tomando

crticos en

ambos

casos un intervalo de confianza dado

Valor de b

Valor

constante

para

cada

ecuacin de regresin.

EJEMPLO DE REGRESIN LINEAL MLTIPLE PARA TASAR UN EDIFICIO

Pgina

El programador puede utilizar el anlisis de regresin lineal mltiple para estimar el valor de un edificio de oficinas en un rea determinada basndose en las variables siguientes.

luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

10

Suponga que un programador comercial est pensando en adquirir un grupo de pequeos edificios de oficinas en un distrito comercial conocido.

Variable
Y X1 X2 X3 X4

Indica
Valor tasado del edificio de oficinas Superficie en metros cuadrados Nmero de oficinas Nmero de entradas Antigedad del edificio en aos

Este ejemplo supone que existe una relacin de lnea recta entre cada variable independiente (X1, X2, X3, y X4) y la variable dependiente (Y), representada por el valor de los edificios de oficinas en esa rea. Se elige al azar una muestra de 11 edificios de oficinas de 1.500 edificios posibles y obtiene los datos siguientes. "Media entrada" significa una entrada mensajeros con slo encomiendas y entregas.

A Superficie (x1)
2.310 2.333 2.356 2.379 2.402 2.425 2.448 2.471 2.494 2.517 2.540

B Oficinas (x2)
2 2 3 3 2 4 2 2 3 4 2

C Entradas (x3)
2 2 1,5 2 3 2 1,5 2 3 4 3

D Antigedad (x4)
20 12 33 43 53 23 99 34 23 55 22

E Valor tasado (Y)


142.000 144.000 151.000 150.000 139.000 169.000 126.000 142.900 163.000 169.000 149.000

La frmula a utilizar es: =ESTIMACION.LINEAL(conocido Y, conocido X,VERDADERO,VERDADERO) Nota: La frmula del ejemplo debe escribirse como frmula matricial, con CONTROL+ MAYSCULA + INTRO. Si la frmula no se introduce en formato matricial, no dar el resultado deseado. Cuando se introduce como una matriz, se devuelven las siguientes estadsticas de regresin. Utilice esta clave para identificar las estadsticas deseadas. El ejemplo puede resultar ms fcil si lo copia en una hoja de clculo en blanco, de la forma siguiente:

2 3 4 5 6 7 8 9 10 11 12

A Superficie (X1) 2.310 2.333 2.356 2.379 2.402 2.425 2.448 2.471 2.494 2.517 2.540

B Oficinas (X2) 2 2 3 3 2 4 2 2 3 4 2

C Entradas (X3) 2 2 1,5 2 3 2 1,5 2 3 4 3

D Antigedad (X4) 20 12 33 43 53 23 99 34 23 55 22

E Valor tasado (Y) 142.000 144.000 151.000 150.000 139.000 169.000 126.000 142.900 163.000 169.000 149.000

Pgina

luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

11

Luego median la Funcin de Excel nte e =ESTIMACIN.LINEAL(E2:E E12,A2:D12,VER RDADERO,VERDADERO), se obtiene la ma atriz de resultad dos presenta a continua ada acin. Recuerde Debe Oprimi sobre el resultado las Tec e ir clas CONTROL+ MAYSCULA + A INTRO Cuando se int troduce como un matriz, se dev na vuelven las sigu uientes estadstic de regresin Utilice esta cla cas n. ave para ide entificar las estad dsticas deseada as.

Ahora puede obtenerse la ecu o uacin de regres mltiple, y = m1*x1 + m2*x2 + m3*x3 + m4*x4 + b, utilizando los sin valores o obtenidos:

1 2 3 4 5

A B C Eda ad Entradas Oficina as (X4) (X3) (X2) -234,2 2372 2.553,2107 12.529,77 13,2680 530,6692 400,0668 8382 0,99675 970,5785 #N/A A 459,7 7537 6 #N/A A 1.732.393. .319,2293 5 5.652.135,316 62 #N/A A

D Supe erficie (X1) X 27 7,64 5,429374042 #N N/A #N N/A #N N/A

E b 52.317,83 5 12 2237,3616 #N/A #N/A #N/A

De los resultad arrojados po el Excel, se obtiene la siguien Ecuacin: dos or nte

Y = 27,64*x1 + 12.530 x2 + 2.553 x3 - 234,2 x4 + 52.3 0* 3* 24* 318


Ahora, sustituy yendo en la Ecu uacin el TASAD puede pred DOR decir, con un alto coeficiente de correlacin (0.99) e el valor tasado de un ed dificio de oficina en la misma z as zona con 2.500 m, 3 oficinas, 2 entradas y una antigedad de 25 a e aos, re esultando la expr resin matemtic siguiente: ca

Y= 27,6 64*2.500 + 12.530*3 + 2.553*2 - 2 234,24*25 + 52.318 = $ 158.261


Para el anlisiis de los resultados presentados en la tabla anterior se utiliza lla distribucin F para determina si ar todas la variables son significativas y la distribucin t, para determinar la importan de cada un de las variab as n ncia na bles independientes en el an nlisis de regresin. PRUEBA DE LOS RESULTADOS M S MEDIANTE EL ESTA ADSTICO t Para medir el grado de import tancia en cada u de las variab independien versus la va una bles ntes ariable dependie ente se utiliz el estadstico t, con los siguien parmetros: t ntes Grados de Lib bertad

Pgina

e L. terior) Grados de Libertad = G.L = n - (k+ 1) = 6 (Ver Celda B4 de la Tabla Ant Donde k = Nmero de va ariables independ dientes en el anlisis de regresin (4) y n = N mero de datos c considerados (11)

luisfe eres15@gmail.com luisferes15@yahoo o.com ; Cel.: 3 311.354.52.24 4

12 12

Intervalo de confianza del 95 %, dado por ( 1 - ), donde = 0,05

Es una prueba hipottica, la cual determinar si cada coeficiente es til para estimar el valor tasado del edificio de oficinas del ejemplo anterior. En ese mismo Ejemplo, para probar si el coeficiente de antigedad tiene significado estadstico, se puede dividir el (coeficiente de la pendiente de antigedad) -234,24 entre 13,268 (el error estndar estimado de los coeficientes de antigedad en la celda A5). El siguiente es el valor t observado:

t4 = m4 se4 = -234,24 13,268 = -17,7


De la misma manera, se obtienen los valores observados de t, para cada variable sern:

Variable valor t observado Superficie 5,1 Nmero de oficinas 31,3 Nmero de entradas 4,8 Edad 17,7
Se realiza un contraste de hiptesis: H0: mi = 0 H1: mi 0

Zona de Rechazo

Zona de Aceptacin

Zona de Rechazo

- 2,447

t
2,447

Valores Tabulados

Si se consulta una tabla de un manual de estadstica, observar que el valor t crtico, de dos colas, con 6 grados de libertad y alfa = 0,05 es 2,447. Este valor crtico puede encontrarse tambin utilizando la funcin DISTR.T.INV de Excel. DISTR.T.INV (0,05.6) = 2,447. Puesto que el valor absoluto de t1 = 17,7, es superior a 2,447; se concluye que la antigedad es una variable importante para estimar el valor tasado de un edificio de oficinas.

Pgina

Si el valor absoluto de t es suficientemente alto, puede deducirse que el coeficiente de la pendiente es til para calcular el valor tasado del edificio de oficinas del ejemplo.

luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

13

El significado estadstico de cada una de las dems variables independientes puede probarse de forma similar, con los valores de t obtenidos para cada una de las variables independientes.

En este caso con un nivel de significacin de = 0,05, todos los valores de t observados tienen un valor absoluto superior a 2,447; por tanto, todas las variables utilizadas en la ecuacin de regresin son tiles (individualmente significativas en la explicacin de la variable dependiente) para predecir el valor tasado de los edificios de oficinas de esta rea. PRUEBA DE LOS RESULTADOS MEDIANTE LOS ESTADSTICOS R2 Y F En el ejemplo del edificio de oficinas, el coeficiente de determinacin, o r2, es 0,99675 (consultar la celda A3 en la tabla que muestra los resultados de la funcin ESTIMACION.LINEAL), que indicara una relacin marcada entre las variables independientes y el precio de venta. Puede utilizarse el estadstico F para determinar si estos resultados, con un valor r2 tan alto, se produjeron por casualidad. Suponga por un momento que en realidad no existe relacin entre las variables, pero que ha extrado una muestra peculiar de 11 edificios de oficinas que hace que el anlisis estadstico demuestre una relacin marcada. F (estadstico) y (Grados de Libertad) en la salida ESTIMACION.LINEAL se pueden utilizar para determinar la probabilidad de que se produzca por eventualidad un valor F ms elevado. F se puede comparar con los valores crticos de las tablas de distribucin F. En el contraste de hiptesis, para verificar si el grupo de variables independientes explican el fenmeno en forma conjunta se utiliz el estadstico F, con los siguientes parmetros: Grados de Libertad

1 = k = 4 (G.L. para el numerador) 2 = n - (k+ 1) = 6 (G.L. para el denominador)


Donde k = Nmero de variables independientes en el anlisis de regresin (4) n = Nmero de observaciones consideradas (11) Intervalo de confianza del 95 %, dado por ( 1 - )

= 0,05
En el ejemplo, GL = 6 (celda B18) y F = 459,7537 (celda A18).

Con el siguiente contraste de hiptesis:

H0 : m1 = m2 = m3 = m4 = 0 H1 : m1 m2 m3 m4 0

Zona de Aceptacin

Zona de Rechazo

Pgina

4,53

F
Valor Tabulado

luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

14

El valor crtico de F es 4,53 (en la tabla), puesto que el valor observado que arroja el Anlisis de Regresin a travs de Excel es F = 459,7537 y este ultimo es mucho mayor que (ms elevado) que 4,53, es extremadamente improbable que un valor F tan elevado se produzca por azar. Con = 0,05, la hiptesis de que no hay relacin entre las variables independientes y la variable dependiente hay que rechazarla cuando F sobrepasa el nivel crtico, (459,7537 >> 4,53). Con DISTR.F (F, 1, 2) de Excel se puede obtener la probabilidad de que se produzca por casualidad un valor F superior, o sea, la probabilidad de que un valor F tan elevado se produzca por azar. Luego, ejecutando la funcin DISTR.F (459,753674. 4. 6) en Excel, se obtiene el Valor = 1,37*10-7, es decir que la probabilidad de que un valor F tan alto curra por casualidad o por azar es de0,00000013723147lo cual implica una probabilidad extremadamente pequea. Hay que recordar que es vital utilizar los valores correctos de 1 y 2 calculados anteriormente y mediante lo anterior se concluye que en el Ejemplo del Edificio de Oficinas las variables independientes en conjunto son significativas para explicar el comportamiento de la variable dependiente.

OTRO EJEMPLO DE REGRESIN LINEAL MLTIPLE PARA TASAR UN TERRENO


(tomado de Stumps Marco Aurelio. Metodologa para la Tasacin de Inmuebles. 1a Ed. en espaol, Miguel Camacaro Ediciones, Caracas, Venezuela.2006) Suponga que se desea tasar un inmueble (Lote) de 360 m2 en un sector calificado como estrato seis (6), a siete (7) Km. de distancia al centro comercial de la ciudad. Los datos obtenidos de un conjunto de terrenos vendidos en la regin son los siguientes:

N 1 2 3 4 5 6 7 8 9 10 11 12

Tabla de Muestra de Terrenos X2 X1 Y 2 Precio (US$) Distancia (Km) rea (m ) 26.250 300 8,150 48.360 520 6,200 33.285 420 7,650 33.600 280 6,900 50.048 736 7,350 20.250 360 8,500 30.260 475 7,300 28.500 305 8,000 31.700 360 7,750 29.750 610 8,500 59.000 580 6,000 24.500 320 7,900

X3 Local 8 7 6 8 7 5 4 9 8 4 9 7

Pgina

Utilizando la Funcin de Excel, y suponiendo que existe una relacin de lnea recta entre cada variable independiente (X1, X2 y X3) y la variable dependiente (Y), el valor de los edificios de oficinas en esa rea. La frmula a utilizar es: =ESTIMACION.LINEAL (conocido Y, conocido X,VERDADERO,VERDADERO) Cuando se introduce como una matriz, se devuelven las siguientes estadsticas de regresin. Utilice esta clave para identificar las estadsticas deseadas.

luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

15

Local

Distancia

rea
49,936285 3,456096 #N/A #N/A #N/A 14,448757

Valores de t Valor de F

2.277,142072 -7.341,063438 298,694894 647,906984 0,989454 1.402,308004 250,188228 8,000000 1.475.961.236,344720 15.731.741,905281 7,623639 -11,330428 250,19

b 52.331,399582 7.147,131985 #N/A #N/A #N/A

De la matriz de resultados arrojada por Excel, se tiene la ecuacin de regresin siguiente:

Y = 52.331,40 + 49,94 x rea 7.341,06 x Distancia + 2.277,14 x Local


Para el anlisis de los resultados tambin se utilizar la distribucin F para determinar si todas las variables son significativas y la distribucin t, para determinar la importancia de cada una de las variables independientes en el anlisis de regresin. PRUEBA DE LOS RESULTADOS MEDIANTE EL ESTADSTICO t Para medir el grado de significacin de las variables independientes en cada una de las variables dependientes se utiliz el estadstico t, para los siguientes parmetros: Grados de Libertad G.L. = n - (k+ 1) = 8 Donde k = Nmero de variables independientes en el anlisis de regresin (3) n = Nmero de datos considerados (12) Intervalo de confianza del 95 %, dado por ( 1 - ), donde = 0,05 Los valores de t para cada variable segn la matriz de resultados es:

Variable valor t observado rea 14,45 Distancia 11,33 Local 7,62


Se realiza la prueba de hiptesis, tal como se realiz con el ejemplo anterior, y se consulta una tabla t en un manual de estadstica, encontrndose que el valor t crtico, de dos colas, con 8 grados de libertad y alfa = 0,05 (intervalo de confianza del 95%) es 2,306. Este valor crtico puede encontrarse tambin utilizando la funcin DISTR.T.INV de Excel. DISTR.T.INV (0,05.8) = 2,306. Puesto que el valor absoluto de t1 = 14,45, es superior a 2,31; se puede concluir que el rea es una variable importante para estimar el valor tasado del terreno. El significado estadstico de cada una de las dems variables independientes puede probarse de forma similar, con los valores de ti obtenidos para cada una de las variables independientes.

Pgina

En este caso con un nivel de significacin de = 0,05, todos los valores tienen un valor absoluto superior a 2.31; por tanto, todas las variables utilizadas en la ecuacin de regresin son tiles (individualmente significativas en la explicacin de la variable dependiente) para predecir el valor tasado del terreno.

luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

16

Si el valor absoluto de t es suficientemente alto, puede deducirse que el coeficiente de la pendiente es til para calcular el valor tasado del terreno en el ejemplo.

PRUEBA DE LOS RESULTADOS MEDIANTE LOS ESTADSTICOS R2 Y F De la matriz de resultados del ejemplo (consultar las estadsticas de regresin en el resultado de ESTIMACION.LINEAL), el coeficiente de determinacin, o r2, es 0,9894, que indicara una relacin marcada entre las variables independientes y el precio de venta. Puede utilizarse el estadstico F para determinar si estos resultados, con un valor r2 tan alto, se produjeron por azar. Suponga por un momento (hiptesis nula) que en realidad no existe relacin entre las variables, pero que ha extrado una muestra peculiar de 12 terrenos vendidos que hace que el anlisis estadstico demuestre una relacin marcada. F (estadstico) y (Grados de Libertad) en la salida ESTIMACION.LINEAL se pueden utilizar para determinar la probabilidad de que se produzca por azar un valor F ms elevado. F se puede comparar con los valores crticos de las tablas de distribucin F. En la prueba de hiptesis, para verificar si el grupo de variables independientes explican el fenmeno en forma conjunta se utiliza el estadstico F, con los siguientes parmetros: Grados de Libertad

1 = k = 3 (G.L. para el numerador) 2 = n - (k+ 1) = 8 (G.L. para el denominador)


Donde k = Nmero de variables independientes en el anlisis de regresin (3) n = Nmero de observaciones considerados (12) Intervalo de confianza del 95 %, dado por ( 1 - ) = 0,05 F = 250,1882 (consultar las estadsticas de regresin en el resultado de ESTIMACION.LINEAL) Realizando la prueba de hiptesis, tal como se efectu en el ejemplo anterior, y se consulta una tabla de un manual de estadstica, observar que el valor crtico de F es 4,07 (en la tabla), puesto que el valor observado que arroja la matriz de resultados es F = 250,1882 es mucho ms elevado que 4,07, es muy poco improbable que un valor F tan elevado se produzca por azar. (Con Alfa = 0,05, la hiptesis de que no hay relacin entre las variables independientes y la variable dependiente hay que rechazarla cuando F observado > F en el nivel crtico). Con DISTR.F(F,1,2) de Excel se puede obtener la probabilidad de que se produzca al azar un valor F superior, o se la probabilidad de que un valor F tan elevado se produzca por azar. DISTR.F (250.19, 3, 8) = 3,03*10-8, es decir 0,0000000303 la cual es una probabilidad extremadamente pequea. Recuerde que es vital utilizar los valores correctos de df1 y df2 calculados anteriormente. Con lo anterior se concluye que las variables independientes en conjunto son significativas para explicar el comportamiento de la variable dependiente. Con lo cual el terreno se puede tasar de la siguiente forma:

Y = 52.331,40 + 49,94 x rea 7.341,06 x Distancia + 2.277,14 x Local


Es decir,

Pgina

luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

17

Y = 52.331,40 + 49,94 x 330 7.341,06 x 7 + 2.277,14 x 6 = US $31.087,02

BIBLIOGRAFA Damodar Gujarati. Econometra Bsica. Ed. en espaol, Mc GRAW- HILL LATINOAMERICANA, Bogot, Colombia.1998. Stumps Marco Aurelio. Metodologa para la Tasacin de Inmuebles. 1a Ed. en espaol, Miguel Camacaro Ediciones, Caracas, Venezuela.2006. http://www.monografias.com/trabajos55/estadistica-en-tasacion/estadistica-en-tasacion.shtm Shao Stephen, Estadstica para Economistas y Administradores de Empresas. Ed. Herrero Hermanos. Mxico.1970. Microsoft Excel. Ayuda de la Funcin ESTIMACION.LINEAL de Regresin Lineal Mltiple. http://www.monografias.com/trabajos30/regresion-multiple/regresion-multiple.shtml Torino H . Resumen del libro de Estadsticas de Berenson y Levine Direccin: http:// www.mografias.com/trabajos13 /beren/beren.shtml) El Rincn del Vago, SL C htlm.rincondelvago.com/estadistica/html) Vommi : MJ Qu es una monografa? direccin: http://www.mografias.com/trabajos7/beren/beren.shtml) El Rincn Del Vago, SL C Toro 76,2 Salamanca (Espaa) Direccin: http://htlm.rincondelvago.com/estadistica/html) http://www.scielospphp?piol=s1135-5727200200020000&scrip[=sciarte Galdos Clculo y Estadstica III Edicin nica. Grupo La Republica. Lima Per;2005. Cannavos G. Probabilidad y Estadstica Aplicacin y mtodos. Ed. en espaol Mc GRAWHILL/INTERAMERICANA DE MEXICO.1995. Toro 76,2 Salamanca (Espaa) Direccin: http://

Pgina luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

18

Pgina luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

19

Valores de F para las probabilidades seleccionadas

Pgina luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

20

Valores de F para las probabilidades seleccionadas


5% ( = 0,05) 14 1 2 3 4 5 245,36 19,42 8,71 5,87 4,64 3,96 3,53 3,24 2,86 2,64 2,48 2,37 2,22 2,13 2,04 1,95 1,89 1,79 1,74 1,69 16 246,46 19,43 8,69 5,84 4,60 3,92 3,49 3,20 2,83 2,60 2,44 2,33 2,18 2,09 1,99 1,90 1,85 1,75 1,69 1,64 20 248,01 19,45 8,66 5,80 4,56 3,87 3,44 3,15 2,77 2,54 2,39 2,28 2,12 2,03 1,93 1,84 1,78 1,68 1,62 1,57

1 (G.L. para el numerador)


24 249,05 19,45 8,64 5,77 4,53 3,84 3,41 3,12 2,74 2,51 2,35 2,24 2,08 1,98 1,89 1,79 1,74 1,63 1,57 1,52 30 250,10 19,46 8,62 5,75 4,50 3,81 3,38 3,08 2,70 2,47 2,31 2,19 2,04 1,94 1,84 1,74 1,69 1,57 1,52 1,46 40 251,14 19,47 8,59 5,72 4,46 3,77 3,34 3,04 2,66 2,43 2,27 2,15 1,99 1,89 1,79 1,69 1,63 1,52 1,46 1,40 50 251,77 19,48 8,58 5,70 4,44 3,75 3,32 3,02 2,64 2,40 2,24 2,12 1,97 1,86 1,76 1,66 1,60 1,48 1,41 1,35 100 253,04 19,49 8,55 5,66 4,41 3,71 3,27 2,97 2,59 2,35 2,19 2,07 1,91 1,80 1,70 1,59 1,52 1,39 1,32 1,24 200 253,68 19,49 8,54 5,65 4,39 3,69 3,25 2,95 2,56 2,32 2,16 2,04 1,88 1,77 1,66 1,55 1,48 1,34 1,26 1,17

254,00 19,50 8,53 5,63 4,36 3,67 3,23 2,93 2,54 2,30 2,13 2,01 1,84 1,73 1,62 1,51 1,44 1,28 1,19 1,00

2 (G.L. para el denominador)


1% ( = 0,01)

6 7 8 10 12 14 16 20 24 30 40 50 100 200

1 (G.L. para el numerador)


1 1 2 3 4 5 4.052,18 98,50 34,12 21,20 16,26 13,75 12,25 11,26 10,04 9,33 8,86 8,53 8,10 7,82 7,56 7,31 7,17 6,90 6,76 6,64 2 4.999,50 99,00 30,82 18,00 13,27 10,92 9,55 8,65 7,56 6,93 6,51 6,23 5,85 5,61 5,39 5,18 5,06 4,82 4,71 4,60 3 5.403,35 99,17 29,46 16,69 12,06 9,78 8,45 7,59 6,55 5,95 5,56 5,29 4,94 4,72 4,51 4,31 4,20 3,98 3,88 3,78 4 5.624,58 99,25 28,71 15,98 11,39 9,15 7,85 7,01 5,99 5,41 5,04 4,77 4,43 4,22 4,02 3,83 3,72 3,51 3,41 3,32 5 5.763,65 99,30 28,24 15,52 10,97 8,75 7,46 6,63 5,64 5,06 4,69 4,44 4,10 3,90 3,70 3,51 3,41 3,21 3,11 3,02 6 5.858,99 99,33 27,91 15,21 10,67 8,47 7,19 6,37 5,39 4,82 4,46 4,20 3,87 3,67 3,47 3,29 3,19 2,99 2,89 2,80 7 5.928,36 99,36 27,67 14,98 10,46 8,26 6,99 6,18 5,20 4,64 4,28 4,03 3,70 3,50 3,30 3,12 3,02 2,82 2,73 2,64 8 5.981,07 99,37 27,49 14,80 10,29 8,10 6,84 6,03 5,06 4,50 4,14 3,89 3,56 3,36 3,17 2,99 2,89 2,69 2,60 2,51 10 6.055,85 99,40 27,23 14,55 10,05 7,87 6,62 5,81 4,85 4,30 3,94 3,69 3,37 3,17 2,98 2,80 2,70 2,50 2,41 2,32 12 6.106,32 99,42 27,05 14,37 9,89 7,72 6,47 5,67 4,71 4,16 3,80 3,55 3,23 3,03 2,84

2 (G.L. para el denominador)

6 7 8 10 12 14 16 20 24 30 40 50 100 200

Pgina

2,66 2,56 2,37 2,27 2,18

luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

21

Valores de F para las probabilidades seleccionadas


1% ( = 0,01) 14 1 2 3 4 5 6.142,67 99,43 26,92 14,25 9,77 7,60 6,36 5,56 4,60 4,05 3,70 3,45 3,13 2,93 2,74 2,56 2,46 2,27 2,17 2,07 16 6.170,10 99,44 26,83 14,15 9,68 7,52 6,28 5,48 4,52 3,97 3,62 3,37 3,05 2,85 2,66 2,48 2,38 2,19 2,09 1,99 20 6.208,73 99,45 26,69 14,02 9,55 7,40 6,16 5,36 4,41 3,86 3,51 3,26 2,94 2,74 2,55 2,37 2,27 2,07 1,97 1,87

1 (G.L. para el numerador)


24 6.234,63 99,46 26,60 13,93 9,47 7,31 6,07 5,28 4,33 3,78 3,43 3,18 2,86 2,66 2,47 2,29 2,18 1,98 1,89 1,79 30 6.260,65 99,47 26,50 13,84 9,38 7,23 5,99 5,20 4,25 3,70 3,35 3,10 2,78 2,58 2,39 2,20 2,10 1,89 1,79 1,69 40 6.286,78 99,47 26,41 13,75 9,29 7,14 5,91 5,12 4,17 3,62 3,27 3,02 2,69 2,49 2,30 2,11 2,01 1,80 1,69 1,59 50 6.302,52 99,48 26,35 13,69 9,24 7,09 5,86 5,07 4,12 3,57 3,22 2,97 2,64 2,44 2,25 2,06 1,95 1,74 1,63 1,52 100 6.334,11 99,49 26,24 13,58 9,13 6,99 5,75 4,96 4,01 3,47 3,11 2,86 2,54 2,33 2,13 1,94 1,82 1,60 1,48 1,36 200 6.349,97 99,49 26,18 13,52 9,08 6,93 5,70 4,91 3,96 3,41 3,06 2,81 2,48 2,27 2,07 1,87 1,76 1,52 1,39 1,25

6.366,00 99,50 26,12 13,46 9,02 6,88 5,65 4,86 3,91 3,36 3,00 2,75 2,42 2,21 2,01 1,81 1,68 1,43 1,28 1,00

2 (G.L. para el denominador)

6 7 8 10 12 14 16 20 24 30 40 50 100 200

Pgina luisferes15@gmail.com luisferes15@yahoo.com ; Cel.: 311.354.52.24

22

También podría gustarte