Está en la página 1de 26

enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.

net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
TOPICOS BASICOS SOBRE: TOPICOS BASICOS SOBRE:
LA TECNICA DE REGRESIN MULTIPLE DISCRETA. LA TECNICA DE REGRESIN MULTIPLE DISCRETA.
MODELOS LINEALES GENERALES. MODELOS LINEALES GENERALES.
EL PRONSTICO EN AVALOS CON MODELOS HEDONICOS. EL PRONSTICO EN AVALOS CON MODELOS HEDONICOS.
El pronstico, prediccin o estimacin de una respuesta () en funcin de varios factores (variables predictoras Xi),
requiere la construccin de un modelo de regresin (modelo poblacional), que puede tener muchas formas, pero que la
literatura economtrica y biolgica por experiencia, recomienda que un modelo de regresin lineal mltiple cuadrtico
con interacciones de primer orden, a!usta bastante bien a "casi# cualquier proceso o comportamiento$
Modelo lineal polinmico cuadrtico con interacciones de primer orden:
%or e!emplo, para la respuesta precio ( 1), y para dos variables predictoras X1 (modelo carro) y X2 (&ondicin del
carro); el modelo poblacional '((X1, X2) + e, tendr la siguiente forma$
1 = 0+ 1X1+ 2X2+ 11X1
2
+ 22X2
2
+ 12 X1X2 + e. )onde
1 ' *espuesta a estimar+ 0= &oeficiente no regresor (termino independiente)+
1, 2, 11, 22 12 = &oeficientes regresores+ e ' Error total (de muestreo o experimental)+
Entonces, suponiendo a priori que este modelo se a!usta bastante bien a los datos tomados, el siguiente paso es estimar
los coeficientes regresores 1, 2, 11, 22 12 para as, tener un modelo, que al introducirles valores de X1 y X2,
pronostiquemos valores de +
En el modelo poblacional anterior$
El termino 1X1+ 2X2 representa la parte de primer orden (linear) del modelo+
El termino 11X1
2
+ 22X2
2
representa la parte de segundo orden (cuadrtica) del modelo+
El termino 12 X1X2 representa la interaccin (sinergia) de primer orden entre las dos variables predictoras+
-,, las variables predictoras fuesen tres (X1, X2 X!); siendo X1 'modelo de carro, X2 = condicin del carro
X! =.ilometra!e recorrido+ El modelo se expresar,a como$
1 = 0+ 1X1+ 2X2+ !X! + 11X1
2
+ 22X2
2
+ !!X!
2
+ 12 X1X2 + 1! X1X! + 2! X2X! + error.
-, un coeficiente regresor tiene signo positivo por e!emplo + 1X1, significa que$ por cada incremento unitario de la
variable X1, la respuesta aumentar 1 veces+
-,, un coeficiente regresor tiene signo negativo por e!emplo / 2X2, significa que$ por cada incremento unitario de la
variable X2, la respuesta disminuir 2 veces+
%odemos darnos cuenta que si las variables predictoras Xi" son muchas, el modelo se hace grande y los clculos se
hacen dif,ciles de hacerlos manualmente0 por ello se recomienda usar un programa de un soft1are estad,stico2
matemtico2grafico, que nos ayude en la resolucin del problema+
1
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
El soft1are estad,stico2matemtico para encontrar los 1, 2, 11, 22 ## i" del modelo, aplica el mtodo de
"3&43# m,nimos cuadrados ordinarios matriciales$
5s,$ %ara dos variables predictoras (Xi")0 se reali6a la siguiente operacin matricial+ $i" = %X&X)
'1
( %X&))
'1
1
2
11
22 = X& X ( X&)
.
.
+
12
4bservemos la siguiente limitante o exigencia del mtodo$ 7ue se pueda invertir la matri6 %X&X)

o sea que se pueda
reali6ar %X&X)
'1
Esto se puede reali6ar si$
8+ 9os datos son numricos continuos infinitos+
:+ 9as columnas (vectores) son independientes, o sean ortogonales (no multicolinealidad)+
*ecordemos +ue un so,t-are es una .erramienta +ue nos auda, /l no es inteli0ente, nosotros somos los inteli0entes , s1 le
metemos 2asura al pro0rama, este nos de3ol3er 2asura. Es por ello que debemos saber +u/ datos recolectar, +u/ tipo de
3aria2les recolectamos, +u/ estudio tratamiento de2emos aplicar a los datos crudos antes de utili4arlos, cmo se or0ani4an los
datos en una .o"a de calculo, +u/ pro0rama especi,ico del so,t-are utili4ar, etc+
El mtodo comn o tradicional para estimar los coeficientes regresores i" de un modelo poblacional de este tipo es$
M/todo de M1nimos 5uadrados 6rdinarios Matricial %M56M), esto es solo para variables predictoras Xi" y
respuestas que sean num/ricas continuas+
En el caso de avalos, la mayor,a de las variables son discretas, categricas (nominal u ordinal), se requiere entonces
aplicar un mtodo ms general o sea M/todo de Modelos 7ineales 8enerales (39;)+ %or ello se habla de mtodos de
regresin discretos+ )ado que la escala de estas variables son hednicas en su mayor,a0 entonces hablamos de modelos
de regresin hednicos+
-, los valores de respuesta () medidos, presenta problemas como autocorrelacin seriada, se aplica logaritmo a la
respuesta medida+ -i la respuesta tiene varias posibilidades (dico o policotomica$ escala hednica) se implementa
Modelos 7o01sticos (39)+

39; implementa un mtodo de seleccin de variables predictoras de "paso a paso# (step1ise) y el "me"or
su2con"unto9 (best2subset) como procedimiento para construir el modelo+
2
X es la matri6 de datos originales0 con tantas columnas o vectores <i, como i"
necesite el modelo que queremos a!ustar+ %or e!emplo si queremos detectar la
interaccin entre <8 y <: o sea <8=<:, construimos una nueva columna (vector),
multiplicndolos y luego ortogonali6andola+
-i una variable es dicotmica, entonces no podemos construir trminos
cuadrticos para ella, ya que por dos puntos no puede tra6arse una curva+
X& es la matri6 traspuesta de la matri6 <+
) es la matri6 del vector columna de la respuesta medida+
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.

;93 para poder resolver el problema de traba!ar con variables discretas, usa el mtodo de mxima verosimilitud
(mximum >elihood) para probar hiptesis de los efectos de las variables predictoras sobre la respuesta0 o puede
utili6ar inversa generali6ada de 3oore2%enrose o la inversa condicional+
-i los datos son de series de tiempos, entonces usamos un mtodo como el de series de ?ourier o redes neuronales+
-e sabe que en avalos el precio depende del sitio (espacio geogrfico) y del tiempo0 para ello se habla entonces de
regresin para construir un 3odelo @ednico Espacio2Aemporal, con anlisis variogrfico del precio+
&uando la variable dependiente es discreta (escala hednica), se recomienda utili6ar re0resin lo01stica o re0resin
lo01stica multinominal+ Esto es lo que se llama regresin discreta y limitada de variables dependientes+
5dems de todas las complicaciones y todos los intr,ngulis que tienen que hacerse para hacer un buen pronostico,
deben comprobarse y satisfacerse los requerimientos (supuestos) del mtodo de anlisis de regresin, esto para que
sean validos los resultados y el modelo sea un buen predictor+ 9os supuestos son$
1. @omogeneidad de varian6a o varian6a constante entre las observaciones+
2. Bormalidad de los errores e ' %' )+
C+ Dndependencia de las observaciones (no correlacin seriada)+
E+ 5ditividad de los efectos+
%or otro lado, para hacer el anlisis de la bondad de a!uste del modelo (regresin, falta de a!uste, coeficiente de
regresin), se usa prueba de hiptesis de relacin de varian6a (? de ?ischer)0 para lo cual necesita comprobarse y
satisfacerse los supuestos del anlisis de varian6a$ que los errores deben distribuirse en forma normal, Dndependientes,
con media cero y varian6a constante F
:
0 e G BD) (H, F:)+
En cualquier caso, s los datos son mitos !cualquier ti"o de varia#le $ escala de
medida%, con cualquier nivel !dico, tri "olicot&mica o 'ed&nica de niveles variados%,
muc'os casos, muc'as varia#les, datos mu$ com"licados $ datos mu$ com"le(os)
entonces es "re*eri#le usar t+cnicas alternativas avanzadas como son, -n.lisis
/ultivariado, 0edes 1euronales, 2&gica 3i*usa o 4istemas 1eurodi*usos.
)e la introduccin anterior puede observarse que la implementacin y construccin de un modelo de regresin,
requiere de un conocimiento previo sobre tipos de 3aria2les y escalas de medidas, para as, decidir que tipo de
programa de regresin utili6ar+
I%or qu un 5valuador requiere conocer las bases tericas, los fundamentos tericos y los intr,ngulis del mtodo de
regresinJ
3
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
%orque en algn momento de su existencia tendr que enfrentar un problema legal, donde debe defender su traba!o ba!o
ese mtodo0 donde necesariamente estar,an presentes !ueces expertos avaluadores y qui6s expertos matemticos2
estad,sticos a la hora del !uicio de carcter legal2!ur,dico+
:;<6= >? @A*;AB7?= ) ?=5A7A= >? M?>;>A=.
:ipos de @aria2les.
9as variables pueden clasificarse como$
1. @aria2les dependientes %@aria2les *espuestas)
Estas variables (respuestas medidas), dependen de las variables predictoras, y se denominan con la letra ,
luego despus de construido el modelo y pronosticada (predicha) las respuestas, se denomina con la letra + 9a
diferencia entre la respuesta medida y la respuesta pronosticada (predicha) se denomina residuales o error
residual
%' )+
9a sumatoria al cuadrado de estos errores, se llama -uma de &uadrados de los Errores (-&E)$
C %
i
'
i
)
2
, los mtodos de regresin construyen muchos modelos, sin embargo seleccionan el me!or
modelo como aquel que presenta el m,nimo valor de -&E+
2. @aria2les ;ndependiente %@aria2les <redictoras).
Estas variables se denominan con la letra Xi+
!. @aria2les ;nter3inientes %5o3aria2les).
-on aquellas variables que aunque no pudieron medirse o se midieron mal, se saben que influencian la
respuesta+ En estos casos donde se de!an de introducir variables, s, dichas variables predictoras influencian
grandemente (tiene alta correlacin con la respuesta), entonces tendremos un deficiente modelo poblacional+
4tra forma de clasificar las variables$ Bumricas y &ategricas (con sus escalas de medidas)+
1. Dum/ricas. 2. 5ate0ricas %discretas)
1.1. 5ontinuas+
Estas variables, caen dentro de la escala de proporcin+
Esta escala da informacin acerca de las relaciones de
orden, de distancia y de ra6n o proporcin entre dos
observaciones+ 5qu, el punto cero es natural y las
unidades son arbitrarias (peso, tamaKo, volumen, tiempo
de efecto de un factor, etc+)+
;n,inita$ %uede tomar cualquier valor real+
Einita$ %uede tomar cualquier valor real, pero dentro de
una escala o rango, por e!emplo cualquier valor entre 8 y
8H+
2.1. Dominal.
9a escala nominal utili6a nmeros, letras o palabras
como medio para asignar o separar las propiedades o
elementos en clases, en grupos o en categor,as distintas+
%or e!emplo, 3arca, tipo de 6ona, tipo de construccin,
color, calidad de, etc+ 5qu, la asignacin de los nmeros
o letras a cada nominacin es arbitraria+
4
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
1.2. ;nter3alo continuo.
Esta escala da informacin acerca de la relacin de orden
y relacin de distancia entre dos observaciones+ Esta
escala se caracteri6a por una unidad de medida comn y
punto cero arbitrario (escala de temperatura, tiempo con
relo!, tiempo con un calendario, etc+)+
2.2. 6rdinal.
9a escala ordinal se refiere a medidas en las cuales
solamente tengan sentido los trminos de comparacin
"mayor#, "menor# e "igual# entre las observaciones+ El
valor numrico o letra es utili6ado exclusivamente para
indicar orden+ &omo e!emplo se tiene$
5+ 9as respuestas de opinin y las escalas de
calidad (survey) de un bien (escala hednica)+
L+ &lasificacin$ AamaKo, &olor, 3arca, Edad, etc+
&+ *angos$ *enta, Dngresos, etc+
)+ &onta!es$ &asos at,picos en un condominio,
animales muertos en una carretera+
-,, una variable ordinal representa incrementos
constantes, puede ser tratada como una variable discreta+
2.!. ;nter3alo discreto.
%uede tomar cualquier valor entero dentro de una escala,
por e!emplo 8H posibles valores entre 8 y 8H (escala
hednica)+
En general en una investigacin de avalu se recogen una gran diversidad de variables predictoras categricas
(discretas), en estos casos hay que codificar los niveles de esta variable, o lo que es lo mismo, crear variables "dummy#
(falsas)+ 9o que si hay que tener presente es que los niveles para cada variable deber,an ser constantes, si se puede+ %or
e!emplo$ todas dicotmicas, todas tricotmicas, etc+ -, no, cuando introdu6camos los datos en la ho!a de clculo del
soft1are, quedarn celdas vac,as, las cuales crearan perturbaciones en los clculos+ -in embargo no nos preocupemos
por eso, el soft1are te preguntar si quieres obviar del anlisis los datos vacios (faltantes$ -eleccionando la opcin
%air1ise)+
%or e!emplo, como anali6ar,a la recogida de los siguientes datos espaciales2temporales y de precios, usando las
siguientes escalas+ I7u tipo de variable y de escala es en cada casoJ, como introducir,a la variable calidad de las v,as
de acceso, s,$ en M& es mala, en ML es buena y en M5 es excelente+
5Ko Edificacin %recio$ Nalor de 3ercado+
H'3uy alto, 8'alto :'medio, C'
La!o+
Mona & (M&)
Mona marginal
Mona L (ML)
Mona clase media
Mona 5 (M5)
Mona clase alta
8 5 8 H H 8
8 L : H 8 H
8 & C 8 H H
8 ) C 8 H H
: 5 H H H 8
: L 8 H 8 H
: & C 8 H H
: ) : 8 H H
E 5 H H H 8
E L 8 H 8 H
E & : 8 H H
E ) C 8 H H
F5ules son las 3aria2les cuales los casosG F5mo arre0lar1a estos datos para acomodarlos correctamente en una .o"a de
clculo .acer una re0resin del precio en ,uncin de aHo, edi,icacin, 4ona la calidad de la 31a de accesoG
5
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
?=<?5;E;5A5;ID >? 7A= @A*;AB7?= ) >A:6= ?D JDA K6LA >? 5M75J76.
&ualquier programa de un soft1are estad,stico2matemtico, exige que las variables en la ho!a de clculo, le sea
declarado el tipo de medida, tipo de dato y el formato+ %or e!emplo el soft1are estad,stico muestran un cuadro de
dialogo en el cual se deben especificar las caracter,sticas de las variables y datos$
Aipo de medida (3easuremet Aype)+
Aipo de dato ()ata Aype)
?ormato del dato ()isplay ?ormat)
Measurement tpe.
:ipo de medida.
Onespecified
5uto
&ontinuos
&ategorical
4rdinal
>ata :pe
:ipo de
dato
)ouble
Aext
Dnteger
Lyte
>ispla Eormat
Eormato del dato
;eneral
Bumber
)ate
Aime
-cientific
&urrency
%ercentage
?raction
&ustom
El manual electrnico del soft1are presenta la siguiente descripcin, la cual explica cada caso+
Double. Ahe Double ()ouble %recision abbreviated) data type is the default format for storing numeric values in
STATISTICA+ Aechnically, the values are stored as PE2bit floating point real numbers, 1ith 8Q2digit precision (8 bit for
the sign, 88 for the exponent, and Q: for the mantissa)+ Ahe range of values supported by this data type is
approximately R8+S=8H
CHT
+ Each numeric value can have a unique text label attached (see Aext 9abels Editor) of
practically unlimited length 1hen the Display format is General+ Ahis is the only data type that allo1s numbers
containing decimals+ Uhen your data type is Double, each cell ta>es up T bytes of storage (plus the optional text label)+
Bote that for the Double data type, the missing data code is 2VVVV+
Integer. Df Integer is the data type, you can enter integers bet1een and including 2:,8ES,ETC,PET through
:,8ES,ETC,PES+ Wou cannot enter numeric values containing decimals into a variable of this type+ Each numeric value
can have an unique text label attached (see Aext 9abels Editor) of practically unlimited length 1hen the Display format
is General+ Uhen your data type is Integer, each cell ta>es up E bytes of storage0 hence this data type offers a more
economical 1ay of storing numbers than 1hen Double is the data type and is recommended for storing integer data
especially in large datafiles+ Bote that for the Integer data type, the missing data code is the same as Double$ 2VVVV+
Byte. Df Byte is the data type, you can enter integers bet1een and including H through :QQ+ Wou cannot enter numeric
values containing decimals into a variable of this type+ Each byte value can have a unique text label attached (see Aext
9abels Editor) of practically unlimited length 1hen the Display format is General+ Ahe advantage of specifying Byte as
6
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
your data type is that it offers the most economical storage for values that are small integers, as each cell ta>es up only
8 byte of storage+ Bote that for the Byte data type, the missing data code is :QQ+
Text. Ahe Text data type is optimi6ed for storing sequences of any characters of practically unlimited length+ Bote that
in STATISTICA, you can perform numerical analyses on text values, and in those circumstances, STATISTICA 1ill
assign unique numeric equivalents to all text values being processed (unli>e the relation bet1een the numeric data
types listed above and their permanent text labels, the relations bet1een text values and numbers are created ad hoc
and are not stored by STATISTICA; hence, most li>ely different numbers 1ill be created the next time if a text variable
is included in numerical analyses)+ Ahe length of a field reserved for text variable type is not constant and can be
ad!usted+ Bote that for the Text data type, the missing data code is al1ays an empty string+
Transforming variables of type text STATISTICA also supports various logical and other (e+g+, concatenation)
operations on variables of type text+ ?or available transformations of these variables (variables of type text), see
Aransformation of Aext Nariables (Nariables of Aype Aext)+ Bote that STATISTICA -preadsheets also support text labels
for numeric values (these are labels XattachedX to numeric values, 1hich are used for display purposes only)0 1hen
transforming the values 1ith attached text labels, the respective transformations are performed on the numeric
representations, and not on the text labels+
Why do you need different variable types? Ahe difference bet1een the text and the numeric types is straightfor1ard0
ho1ever, the main reason for having three types of numeric values is the storage efficiency+ ?or most data files, that is
not important and, thus, using the default (Double) data type is recommended+ @o1ever, for very large data files, being
able to s1itch to a : (or even T) times more efficient storage (by using different data types) could ma>e a difference
bet1een being able to perform the necessary analysis on a specific computer system or not+
9a ho!a de clculo del soft1are statistica !STATISTICA -preadsheets), all, podemos elegir mostrar el
,ormato (display format), que acompaKa una variable con el tipo de dato (data type) como$ double, integer, o
byte+ 5qu, se da la explicacin para cada caso+
Display Format Explanation
General Ahis category has no specific number format+
umber -elect this category if the values of the variable are numeric, or numeric 1ith text equivalents+ Uhen you
select this category, you can specify the number of decimal places to be displayed in the spreadsheet via
the Decimals places option+
!epresentation. Ahese values are represented in decimal format, 1ith or 1ithout commas (e+g+, 8HHH or
8,HHH)+ Begative values of the variable can be represented either 1ith a negative sign (e+g+, 28HHH) or 1ith
parentheses enclosing the number (e+g+, (8HHH))+ Ahere are four "umber representations available in this
category$
#$$$;%#$$$ ; #&$$$;%#&$$$; #$$$;!#$$$'; #&$$$;!#&$$$'
Bote that a European representation (e+g+, 8,:H) is supported by STATISTICA if you select this style in the
Control (anel+ Df this style is not selected in the Control (anel, and you enter a comma in the decimal
place, STATISTICA 1ill treat the value as a text label+
Date -elect this category in order for variables to be interpreted as dates (e+g+, variables containing Yulian date
values imported or pasted from Excel)+ Bote that in order to be displayed as a valid date, all values in the
variable must be correct dates or explicitly defined text labels+
7
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
!epresentation. -elect the desired Date representation from the list of Date formats+ Dn the )dit *ormat
dialog, the various Date representations are as follo1s$
+,#-,./; $+,#-,#../; #-%0ar%./; #-%0ar; 0ar%#../; #-,$+,./; #../,$+,#-; 1indo2s Date *ormat
Bote that if the 1indo2s Date *ormat is selected, STATISTICA 1ill format the date display using the
specifications given in the 3egional Settings dialog of the Control (anel+
"onversion of #ulian days to displayed dates. Ahe exact algorithm of ho1 integer values (Yulian date or
XdaysX) are converted to standard dates and vice versa is affected by the setting of the Ad4ust 5ulian dates
to account for no leap year in #.$$ option on the 6ptions dialog Spreadsheet tab+ ?or example, a date
entered and displayed as 8Z:8Z8VPT may be stored as the Yulian date :ETQT or :ETQP, depending on the
setting of that option+
Time Ahis category 1ill display the values of the variables in one of several Time formats+ Aime values of
variables are stored in the data as (optional) decimal values representing the fraction of the day since
midnight+ ?or example, P$HH53 is stored as H+:Q+ Aime values stored in this manner can be used in
subsequent analyses and transformed using arithmetic operations0 at the same time, they can be displayed
as times in reports or graphs (e+g+, used to label scale values)+ STATISTICA 1ill format the display of time
values according to the current settings in the 3egional Settings dialog of the Control (anel+
!epresentation. Time can be represented in one of several formats+ Wou can choose from a date2time
combination [1ith either :E2hour time or 8:2hour (53Z%3) time format\, or !ust time [either a :E2hour
time or 8:2hour (53Z%3) time format\ in hours and minutes or hours, minutes, and seconds+ Wou could
also select the 1indo2s Time *ormat, 1hich 1ill use the current settings in the 3egional Settings dialog
of the Control (anel+ Dn the )dit *ormat dialog, the various Time representations are as follo1s$
+,#-,./ 78/$ (0; +,#-,./ #-8/$; 78/$ (0 ; #-8/$; 78/$8#.(0; #-8/$8#.; 1indo2s Time *ormat
$%ientifi% Ahis category allo1s you to display the values of the variable in scientific notation+ Uhen you select this
category, you can specify the number of decimal places to be displayed in the spreadsheet via the
Decimal places edit field+
!epresentation. Ahe first representation (standard scientific notation) 1ill display all numbers in the
column in scientific notation according to the follo1ing rules$
?or example, 8+:CEQE2H: or 2C+:8HHE]HT+
Ahe second representation 1ill apply the scientific format only to those (small) values of the variable
1hich 1ould be displayed as H (6ero) in "umber format [i+e+, they are from the interval (28,8) and the
significant digits start after the position specified by the Decimal places edit field\+ ?or example, if
Decimal places ' E, and the value is H+HHHH8:C, then in "umber format, the value 1ould be displayed as
H+HHHH, 1hereas, in the second Scientific representation, the number 1ould be displayed as 8+:CHE2Q
(displaying E digits before E)+
"urren%y -elect this category to display the values of the variable in a Currency format+ Uhen you select this
category, you can specify the number of decimal places to be displayed in the spreadsheet via the
Decimal places edit field+
!epresentation. Currency values are displayed 1ith a currency symbol before or after the number
(depending on the configuration specified on your computer0 e+g+, ^, )3, etc+, see the 3egional Settings
dialog in the Control (anel)+ Wou can choose to represent negative values of the variable either 1ith a
negative sign (e+g+, ^28,HHH) or 1ith parentheses enclosing the number (e+g+, (^8,HHH))+ Dn the )dit *ormat
dialog, the Currency representations are as follo1s$
8
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
9#&$$$; %9#&$$$; 9#&$$$; !9#&$$$'
&er%entage -elect this category to display the values of the variable as percentages+ Uhen you select this category,
you can specify the number of decimal places to be displayed in the spreadsheet via the Decimal places
edit field+ Ahe percentage is based on 1hat fraction of 8 the value of the variable represents+ ?or example,
the value H+:C 1ill be translated to :C_ 1hile :C+E 1ill be translated to :CEH_+
!epresentation. (ercentages are represented 1ith a _ character at the end of the number+
Fra%tion -elect this category to display the values of the variable as fractions+ Uhen you select this format, you
can choose the number of digits (one or t1o) to be displayed in the fraction, or the denominator to be
used in the fraction (e+g+, sixteenth)+
!epresentation. Dn the Edit ?ormat dialog, the *raction representations are as follo1s$
:p to one digit !#,/'; :p to t2o digits !#-,/.'; :p to three digits !#/.,/7-'; As halves !#,/';
As fourths !#,;'; As eighths !7,<'; As sixteenths !+,#='; As thirty%seconds !#-,+/';
As tenths !-,#$'; As hundredths !--,#$$'
"ustom Ahis category of display formats allo1s you to choose from predefined Custom number formats, or to
create your o1n using standard custom number format syntax+
Ahe sections of the custom number format are separated by colons+ Ahe section before the semicolon
defines ho1 a positive number is displayed+ Ahe section after the semicolon defines ho1 a negative
number is displayed+
-ee custom number format codes for more information about the syntax used to create ne1 custom
number display formats+
ADA7;=;= >? 56**?7A5;6D, AJ:656**?7A5;ID 57J=:?*
Ona ve6 que hemos recolectado adecuadamente los datos y construido la ho!a de clculo, se reali6a$
A. Jn anlisis de correlaciones mNltiples entre las 3aria2les:
8+ Entre la respuesta , y las variables predictoras Xi+
Esto para detectar la correlacin (cantidad y tipo), permitindonos detectar y estratificar las variable
predictoras en orden de importancia+
:+ Entre las variables predictoras Xi+
Esto permite detectar multicolinealidad , o sea si hay o no independencia entre vectores predictoras+ -in
embargo hay que tener mucha precaucin en el anlisis visual, ya que las variables son discretas, y estas
formaran grupos, alineados verticalmente+
B. Jn anlisis de autocorrelacin seriada.
Esto permite estudiar la variable respuesta y detectar si los valores, medidos en la secuencia reali6ada son
dependientes o independiente0 para que los resultados sean validos y el modelo prediga adecuadamente, debe
9
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
haber independencia (no autocorrelacin)+ -olo para la columna (vector) respuesta+
". 'n(lisis "luster.
Este permite clasificar las variables en grupos, de tal manera que cada grupo explica la misma variabilidad sobre el
precio, como si estuvieran solas+ )e esta manera podr,amos ba!ar la dimensionalidad0 as, que podr,amos tomar
solo una de cada grupo (la ms importante) y utili6arla en el modelo+ )e esta manera simplificar,amos el modelo+
'n(lisis de "orrela%iones.
&orrelacin (r) es una medida de la relacin lineal entre dos o ms variables+ 9a escala de medida a usar debe
ser por lo menos en escala de intervalo, sin embargo otros coeficientes de correlacin estn disponibles
cuando se mane!an otro tipo de datos+ El coeficiente de correlacin va desde 28+HH hasta ]8+HH, o viceversa+
On valor de de 28+HH representa una perfecta correlacin negativa, mientras que un valor de ]8+HH representa
una perfecta correlacin positiva+ On valor de H+HH representa una falta de correlacin (ver la siguiente
figura)+
El coeficiente de correlacin ms ampliamente usado es el &oeficiente de correlacin de %earson (r), llamado
correlacin producto2momento+
9as graficas de correlaciones permiten detectar visualmente valores extraKos o influnciales (outliers)+
AJ:656**?7A5;ID.
10
5ra6ca de correlaci&n de $ vs
7i(.
S r tiene un valor cercano a
0,00; signica !ue cual!uier
cam"io #e la varia"le pre#ictora
7i(, no in$uencia
signicativamente la respuesta $.
%ste graco permite a#em&s
#etectar valores e'tra(os.
5ra6ca de correlaci&n 7i vs
7(.
%n el caso #on#e r tiene un valor
cercano a )1; signica !ue la
varia"le pre#ictora 7i, esta
correlaciona#a con la varia"le 7(.
%sto signica !ue *a+
multicolineali#a# ,no *a+
in#epen#encia #e vectores-; en
consecuencia si metemos am"as
varia"les en el mo#elo, el mo#elo
pre#ice mal, aun cuan#o
o"tengamos un alto valor #e .
2
.
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
&uando las observaciones (respuestas) tienen un orden secuencial en forma natural, la correlacin entre un dato
anterior y otro posterior, se denomina autocorelacin+ Esto generalmente ocurre en lo que se llama medidas repetidas
en el tiempo+ &uando muchas medidas son tomadas de la misma unidad de muestreo (edificio, terreno, carro, etc+), las
medidas tienden a estar correlacionadas una con la siguiente (s), -,, a la misma unidad le medimos varias cosas como
rea, condiciones, depreciacin, revalori6acin, etc+0 estas estarn correlacionadas, con las medidas que se realicen la
prxima ve6+
:ipos de autocorrelacin.
Autocorrelacin pura.
8+ 4bservaciones sucesivas en el tiempo o en el espacio tienden a tener residuales correlacionados ya que ellas
estn afectadas por condiciones similares+
:+ -eries grandes de errores positivos o negativos son seguidos por series grandes de errores positivos y negativos
ya que residuales adyacentes generalmente presentan dimensiones similares+
Autocorrelacin operati3a.
8+ -istemati6acin en la obtencin de los datos en la variable dependiente, como en las serie de tiempo+
:+ 4misin de una o ms variables predictoras en el modelo+ &uando los efectos de secuencias de las variables
claves "perdidas# estn correlacionadas, los trminos de error en el modelo de regresin tendern a estar
correlacionados debido a que stos incluyen efectos de las variables perdidas+
C+ Oso de un modelo de primer orden (linear) en lugar de otro ms apropiado (curvil,neo, exponencial, etc+) o
falta de una transformacin tal como la logar,tmica+
5onsecuencias de la autocorrelacin.
8+ 9os coeficientes de regresin obtenidos por m,nimos cuadrados ordinarios aunque siguen siendo insesgados
pierden la propiedad de la varian6a m,nima y pueden ser muy ineficientes+
:+ 9os cuadrados medios esperados de un factor (&3fact' -&EfactZgl) y el error estndar pueden estar fuertemente
subestimados, por lo que las verdaderas varian6as del error (&3e) y las desviaciones estndar de regresin+
C+ El coeficiente de determinacin (*:) puede resultar sobre2estimado (alto), dando la impresin de aparente
exactitud y buena bondad de a!uste del modelo, sin embargo el modelo predice mal+
E+ 9as pruebas de t, ? y los intevalos de confian6a no son estrictamente aplicables+
>eteccin de la autocorrelacin.
;raficar los errores en forma secuencial en el tiempo como se midi la respuesta0 no deber,a haber correlacin, o sea
que r'H,HH+
<rue2a de rac.as.
9a grafica anterior aunque no presente correlacin, tampoco debe presentarse rachas de grupos negativos seguidos de
grupos positivos o viceversa, en forma secuencial+
<rue2a estad1stica+
11
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
%rueba de "d# de )urbin2Uatson+
Esta prueba se basa en el supuesto de que los errores constituyen una serie autorregresiva de primer orden+ -e ha
demostrado que el valor de "d# se aproxima a 2%1'O).
d = 2%1'O)
Aeniendo en cuenta los l,mites de variacin del coeficiente de correlacin emp,rico, 8 ` 8 ,
se puede deducir el rango de variacin del estad,stico de )urbin2Uatson y el signo de la
autocorrelacin,
` = 8 d E se considera que existe autocorrelacin negativa
` = H d : indica ausencia de autocorrelacin
` = 8 d H se puede admitir que existe autocorrelacin positiva
5s,, se aprecia que el estad,stico experimental tomar valores entre H y E de tal modo que cunto
ms prximo a cero (a cuatro) sea el valor del estad,stico d mayor es la evidencia de
autocorrelacin positiva (negativa)+ -i el valor del estad,stico experimental d es dos, entonces la
correlacin muestral ser nula y por tanto no se detectar un problema de autocorrelacin entre
las perturbaciones (errores)+
M/todo para paliar la autocorrelacin.
9os soft1are estad,sticos 2matemticos, poseen programas que pueden paliar esta situacin0 basta con indicrselos+
8+ Aransformacin de &ochrane y 4rcutt+
:+ Aransformacin de &ontraste+
C+ Aransformacin polinomial+
E+ Aransformacin @elmert+
Q+ Aransformacin 3edia+
P+ Aransformacin %rofile
Es comn y til aplicar logaritmo a la variable respuesta para minimi6ar la correlacin entre la media y la varian6a de
la data, y as, reali6ar el anlisis de regresin+
?studio de clasi,icacin de las 3aria2les predictoras %si ,uera el caso).
En el caso de medidas sobre bienes para avalos es t,pico el caso de presentarse autocorrelacin seriada, deber,amos
entonces usar primero un procedimiento de discriminacin2clasificacin2agrupamiento (cluster) de variable predictoras
para determinar cuales variables predictoras dicen o tienen la misma capacidad de predecir+ %ara esto se recomienda
aplicar un 5nlisis 3ultivariado0 s,, estamos interesados en explicar (discriminar) el comportamiento de cada variable
sobre la respuesta precio0 por e!emplo &omponentes %rincipales o 5nlisis &luster+
12
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
?=:J>;6 >? 7A B6D>A> >? ALJ=:? >?7 M6>?76 >? *?8*?=;ID.
Ona ve6 construido el modelo de regresin, debemos estudiar la bondad de a!uste de este, esto es verificar si realmente
predice+
9o primero que se debe revisar son los valores predichos por el modelo ( ) para cada valor medido (), estos sern
idnticos s, el modelo es perfecto, sin embargo sabemos que en el proceso asumimos errores, as, como sabemos que el
mtodo de regresin utili6ado es una aproximacin discreta0 por tanto habr diferencia entre ellos, esta diferencia es lo
que se llama residual o errores y debe ser lo m,nimo posible para cada caso medido+ &uando un valor predicho es muy
diferente al valor medido "real#, debe revisarse este dato para ver si es un valor extraKo y, si es susceptible de
sustraerlo del anlisis+ )ebemos tener cuidado con los valores extraKos, qui6s sean mas importantes que la otra gran
masa de datos+
&on base a lo anterior y s, aceptamos que el modelo es suficiente+ *eali6amos un anlisis de varian6a (5B5N5*)+
El 5B5N5* es un cuadro donde discrimina cada parte del modelo de regresin, su falta de a!uste y el error0 de la
siguiente manera (ver cuadro siguiente)$ E!emplo para el caso de dos variables predictoras y para una respuesta+
Bota$ &ada respuesta, se corresponde con un modelo, por lo que cada respuesta tendr su 5B5N5*+
Bota$ Este cuadro tal y como est conformado, no lo da ningn soft1are en forma automtica, el soft1are da alguna
parte en forma fraccionada, el resto se construye manualmente0 sabiendo que$
:otal = :ratamiento + ?rror + *epeticin + Blo+ue.
:ratamiento=*e0resin +Ealta de A"uste. Ealta de A"uste = :ratamiento ' *e0resin
En datos tomados para avalos las repeticin son iguales a los tratamiento, adems no hay bloques0 por tanto
tendremos el 5B5N5* as,$
:otal = *e0resin + Ealta de A"uste + ?rror.
=5tot. = =5re0. + =5,a + =5er.
I&mo conocemos el valor de tratamiento, con el fin de conocer la falta de a!usteJ$ -abemos que cada caso medido es
un tratamiento distinto+ -e construye una columna adicional con todos los Pn9 casos medidos, as, los gl de tratamiento
ser n28+ &on esto al reali6ar el anavar con el procedimiento de modelos lineales generali6ados, le pedimos que nos
haga precio'tratamiento, y as, obtenemos la suma de cuadrados de tratamiento (-&trat)+
5uadro QQ. Anlisis de 3arian4a para la re0resin de la respuesta precio de autos marca ---,
para dos 3aria2les predictoras %X1=modelo, X2=5lase).
?N
?uente de
Nariacin
gl
;rados de 9ibertad
-&
-uma de
&uadrados
&3
&3'-&Zgl
&uadrados 3edios
?
%rueba de ?ischer
?'&3fvZ&3er
%rob+a?
Aratamiento
*egresin Q
<8 8
13
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
<: 8
<8
:
8
<:
:
8
<8<: 8
?alta de 5!uste
Error
Aotal
4bservemos que a cada coeficiente regresor le corresponde un gl, y que la suma de ellos da los grados de libertad de
regresin+ -, conociramos los gl de tratamiento, los gl de ?alta de 5!uste ser' Arat / *egres+ 5dems conocemos los
gl totales' n28, siendo n el numero total de casos medidos0 por tanto podemos conocer los gl del Error, por diferencia+
-in embargo, no nos preocupemos por construir el ana3ar anterior, IporqueJ+
%orque los datos son discretos y el modelo es discreto hednico, en consecuencia el anavar que da el soft1are
es suficiente para estudiar el modelo y estudiar el r
2
+
?"ercicio 1. >atos tomados de 0u1a del pro,esor M=5. Los/ 5ontreras =alas.
%@er resultados en .o"as aneQas).
&alcular el valor actual "N5# por el mtodo de regresin mltiple, de un automvil, marca Aoyota, modelo
&orolla, aKo 8VVH, placa 3LA2QE@, en buen estado de conservacin+ 3otor recin anillado, recin pintado,
cuatro cauchos nuevos, tr,podes y amortiguadores nuevos, tapi6ado, con aire acondicionado, automtico 8+P+
Equipo de sonido y rines de lu!o+
*evisando las pginas 1eb y revistas de tu carro+com y la gu,a del motor, se encontraron 8S referenciales, de
valores de mercado para el mes HV del aKo :HHP, de Aoyota &orolla de aKos anteriores a 8VVH, de 8VVH y
posteriores al aKo 8VVH (8VTV, 8VVH, 8VV8 y 8VV:), todos automticos+ Ner tabla siguiente+
9o primero que hay que decir es que los datos no son una serie de tiempo ni espacial, ya que los valores de
mercado son puntuales para el mes HV del aKo :HHP+
4bservando la tabla, para efecto de nuestro e!ercicio, se le anexaron dos columnas adicionales para crear dos
variables dummy o variables codificadas, para aKo y color+ 9a variable color se codific segn el criterio del
autor original de los datos+
14
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
*?E?*?D5;A7?=.
DR Euente Eec.a AHo
AHo
5odi,icado
<recio 5olor
5olor
5odi,icado
1 :u carro.com 1ST0UT0V 1UWU 1 W.000 @ino tinto 1
2 :u carro.com 1ST0UT0V 1UWU 1 W.000 Blanco 1
! :u carro.com 1ST0UT0V 1UU2 S 1!.!00 *o"o 1
S :u carro.com 1ST0UT0V 1UU1 ! 11.X00 A4ul 1
X :u carro.com 1ST0UT0V 1UU2 S 1!.100 A4ul 1
V :u carro.com 1ST0UT0V 1UU1 ! 11.V00 @erde 1
Y :u carro.com 1ST0UT0V 1UU2 S 1S.000 *o"o <erlado 2
W 7a 0u1a del motor 1ST0UT0V 1UU1 ! 10.W00 A4ul 5laro 1
U
2a gua del
motor
1ST0UT0V 1UU0 2 10.U00 8ris 1
10
2a gua del
motor
1ST0UT0V 1UU1 ! 11.UW0 8ris 6scuro 1
11
2a gua del
motor
1ST0UT0V 1UU2 S 1!.SX0 @ino tinto 1
12
2a gua del
motor
1ST0UT0V 1UU2 S 1!.X00 Blanco 1
1!
2a gua del
motor
1ST0UT0V 1UU2 S 1!.S00 @erde claro 2
1S
2a gua del
motor
1ST0UT0V 1UU2 S 1!.Y00 A4ul 6scuro 1
1X
2a gua del
motor
1ST0UT0V 1UU2 S 1S.X00 Marrn 2
1V :u carro.com 0UT0UT0V
1UWU
1 W.Y00 Blanco 1
1Y :u carro.com 1ST0UT0V
1UWU
1 W.000 Bei0e 1
9o segundo que hay que decir es que las variables predictoras aKo y color, son variables numricas continuas finita
(discreta)+ Esto significa que no existe un valor de aKo intermedio entre uno y otro, por e!emplo 8VTV,Q o 8VV8,T+ Estas
variables aunque tienen un orden, especifican grupos, clases o categor,as distintas, sin involucrar el termino menor,
igual o mayor0 por tanto esta variable se clasifica como B43DB59+
-, quisiramos me!orar la escala, podr,amos suponer o considerar que el carro de un aKo posterior es me!or que el
carro de un aKo anterior0 de esta forma le damos 4*)EB a la escala y entonces se considerar,a 4*)DB59+
En general la gran mayor,a de los datos de las variables predictoras medidas para reali6ar un avalo, son variables
(discretas) nominales u ordinales, con mltiples nominaciones o sea en escala hednica+
Aoda la teor,a anterior, se hace solo para modelos lineales mltiples cuadrticos+ %ero Iqu pasa si hay relaciones no
lineales entre las variablesJ
15
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
%ara estos casos se recomienda utili6ar procedimientos de regresin tal como 34)E94- 9DBE59E-
;EBE*59DM5)4- (;9M)+
5dems de lo anterior, hay casos donde se tiene que la variable respuesta (precio) es categrica (escala hednica)$
%recio ba!o, precio medio, precio alto y hasta precios muy altos+ Esto complica adicionalmente el anlisis cuando las
variables predictoras son categricas+ %ara este caso (respuesta en escala hednica), se recomienda usar *E;*E-DbB
94;c-AD&5 3O9ADB43DB59, que es una categor,a de 34)E94- 9DBE59E- ;EBE*59DM5)4-+
/or otro la#o la matri0 #e #atos, se correspon#e con una matri0 #e #ise(o !ue es incompleta
,#atos vacios en la matri0 1actorial-; por lo que algunos o ningn efecto podr ser
estimado; en este caso podremos investigar en lnea (on-line del software
statistica) documentacin para opciones disponibles para analizar matrices
incompletas.
Entonces, basado en los datos anteriores, I&mo se hace un anlisis de regresin para estos casosJ+
%rimero nos proponemos dos artificios+
8+ -abemos a priori que las variables predictoras son categrica0 sin embargo las codificamos en forma
numrica y supondremos que las variables predictoras son continuas, podemos as, for6ar el uso de
regresin lineal general (;93)0 la cual funciona bastante bien+
:+ -abemos a priori que la matri6 de datos, es una matri6 factorial incompleta, esto indica que si
factori6amos las variables (como deber,a ser) obtendremos celdas (datos) vacios+ -in embargo
podemos usar el siguiente artificio$ en la ca!a de dialogo de declaracin de las variables, donde se
especifica M> deletion, asignar <air-ise; de esta manera el programa no usa estos datos para el
anlisis, o sea no incluye los datos perdidos, faltantes (missing) en el anlisis+
?"ercicio 2. >atos propios tomados de la re3ista tucarro.com del 21 al 2Y de Mar4o del 200W. A+u1 se
muestran X0 re,erenciales para carros A@?6.
@o!a de clculo del soft1are statistica, con los datos ()ata)+
9a figura siguiente es la ho!a principal del soft1are statistica, mostrando la ho!a de clculo+
9os datos all, registrados se corresponden con CQ referenciales, a utili6ar para el e!ercicio+
9as columnas o vectores son+
)= <recio; X1=AHo; X2=5olor; X!=Zilometra"e; XS=:ipo de :ransmisin XX= DR de puertas.
4bserve que aqu, se muestran los datos crudos+
9o primero que se hace es codificar las variables (crear variables )ummy) o sea variables falsas, que nos
posibilite dar valores (introducir datos) al modelo discreto para predecir+ Esto es debido a que todos los
soft1are estad,stico codifican y normali6an automticamente las columnas, luego entonces no sabr,amos
mane!ar el modelo para predecir, ya que no sabr,amos la codificacin para un caso particular+
16
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.

En la figura anterior se muestran tres columnas adicionales <8c0 <:c y <Ec0 estas se corresponden con las
columnas de <8, <: y <E pero codificadas0 y son las que se usan para la regresin+
%ara continuar hacemos clic> en la pestaKa statistics de la ventana principal anterior, al hacer esto, se muestra
una ca!a de dialogo, aqu, hacemos clic> en la pestaKa Ad3anced linearTDonlinear Models y se muestra una
segunda ca!a de dialogo con varias opciones, de las cuales se selecciona 8eneral 7inear Model +
5l hacer clic> en la pestaKa 8eneral 7inear Model , obtenemos la siguiente ca!a de dialogo+
17
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
5l hacer clic> en la pestaKa 4., se muestra el siguiente cuadro de dialogo+
18
%sta ca2a #e #ialogo presenta
m3ltiples alternativas #e an&lisis; sin
em"argo para nuestro caso "asta
utili0ar4
5eneral 2inear models con
8uic9 s"ecs dialog .
5"serve la le+en#a4
678 anali0a #ise(os con varia"les
pre#ictoras con escalas mi'tas,
%sta ca2a #e #ialogo presenta #os
pesta(as, 8uic9 + :"tions ; en
!uic9 especicamos las varia"les a
incluir en el an&lisis + el mo#elo !ue
!ueremos ,!ue po#amos-.
:l *acer clic9 en la pesta(a
Varia#les, tenemos el siguiente
cua#ro para especicar las varia"les.
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
19
5"servemos !ue a!u se especican
tres grupos #e varia"le4 ;epen#iente
,precio-,
/re#ictores categ<ricas + pre#ictores
continuos.
.ecor#emos ,ver teora- !ue la 3nica
!ue es continua es =3 ,9ilometra2e-; +
!ue in#icarle al programa !ue to#as
son continuas es un arti6cio. :s !ue
ten#remos !ue tener algunas
consi#eraciones en las pre#icciones.
4e recomienda en sus ratos de
ocio registrar 73 como continua $
el resto como categ&ricas $
com"are resultados. ;8ue modelo
"odr. construir, "odr. incluir
%ste cua#ro #e #ialogo es el mismo
!ue el anterior, pero con la pesta(a
<et=een e>ects activa; a!u se
especica el mo#elo !ue !ueremos
,!ue permita el so1t>are #e acuer#o a
la cali#a# #e la escala #e las
varia"les4 #iscretas, continuas-;
*acemos clic9 a!u + se nos presenta
el siguiente cua#ro #e #ialogo.
7a pesta(a :"tions; :!u
#e"emos incrementar ,usar,
pro"ar- un valor alto ,30
para este caso 1ue
suciente- #e 4=ee" delta
,43E2?-- para evitar !ue
apare0ca el pro"lema !ue se
in#ica en la parte superior #e
este cua#ro.
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
5l hacer clic> en 4. en el cuadro anterior y en el posterior, tenemos el siguiente cuadro de dialogo de
resultados+ Este cuadro (de la i6quierda) es de m,nimo resultado0 pero al hacer clic> en la pestaKa more
results obtenemos un cuadro de dialogo con muchas ms opciones (pestaKas) de escudriKar el modelo+
9o primero que debemos revisar es la bondad de a!uste del modelo, para ello iniciamos con$
20
%l cua#ro se presenta con las
pesta(as #e /et'od no activas, para
activarlas seleccione ,som"rear- las
varia"les + mar!ue a#em&s la opci<n
@se Austom e>ects *or t'e
#et=een desing.
7uego *aga clic9 en la pesta(a
4ur*ace + las varia"les !ue#aran
especica#as en el cua#ro en "lanco
a la #erec*a4 :!u !ue#a in#ica#o !ue
el mo#elo ser& un lineal m3ltiple
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
8+ )ebido a que queremos usar un modelo cuadrtico con interacciones de primer orden, entonces
debemos extraer variables con solo dos niveles, ya que con ellos no se puede generar curvatura0 en
este caso es <E (sincrnico, 5utomtico)+
:+ &omparamos los precios actuales (valor actual o valor de mercado) con los predichos por el modelo,
numricos y grficos+
C+ Bormalidad de los errores (residuales)+
E+ *evisamos el coeficiente de regresin con su probabilidad+
Q+ En el grafico de observados vs predichos, detectamos valores extraKos y probamos extraerlos, para
ver si me!ora la bondad de a!uste del modelo+
-i estos procedimientos nos satisfacen, entonces podemos predecir con este modelo, utili6ando la opcin
pro,iler.
)atos originales+
y X1 X2 X3 X4 X5 X1c X2c X4c
1 44000 2005 BeigeDuna 109000 Auto 4 1 2 1
2 38000 2005 GrisCumberlan 86000 Auto 4 1 2 1
3 45000 2005 BeigeDuna 70000 Auto 4 1 2 1
4 41300 2005 GrisCumberlan 36000 Sincr 4 1 2 2
**5 46000 2005 Vere!onaco 1 Auto 4 1 6 1
6 46000 2005 "o#o$are 69000 Auto 5 1 5 1
7 44000 2005 GrisCumberlan 40000 Auto 5 1 2 1
**8 43500 2005 A%ul&ceano 3600 Auto 5 1 4 1
9 41000 2005 "o#o$are 40000 Sincr 5 1 5 2
10 43000 2005 "o#o'las( 41000 Auto 4 1 5 1
11 39000 2005 A%ul&ceano 70000 Sincr 5 1 4 2
12 45000 2005 Vere!onaco 26000 Auto 5 1 6 1
13 40000 2005 BeigeDuna 69000 Sincr 4 1 2 2
14 41800 2005 )lateoCelestial 67000 Sincr 5 1 2 2
15 45000 2005 Vere!onaco 42000 Sincr 4 1 6 2
16 45000 2006 BeigeDuna 46500 Auto 4 2 2 1
17 43000 2006 A%ulSu*erior 64000 Sincr 4 2 4 2
18 46000 2006 BeigeDuna 27000 Sincr 5 2 2 2
**19 48000 2006 "o#o'las( 7400 Auto 4 2 5 1
20 46000 2006 BeigeDuna 38000 Sincr 5 2 2 2
21 45000 2006 A%ulSu*erior 39000 Sincr 4 2 4 2
22 45000 2006 A%ul&ceano 31000 Sincr 4 2 4 2
23 43000 2006 GrisCumberlan 42000 Sincr 4 2 2 2
24 42000 2006 GrisConstelaci+n 13500 Sincr 3 2 2 2
21
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
25 52000 2007 Vere!onaco 19500 Sincr 4 3 6 2
26 50000 2007 GrisConstelacion 11300 Auto 3 3 2 1
**27 49000 2007 BeigeDuna 7300 Sincr 4 3 2 2
**28 55000 2007 GrisCumberlan 12500 Auto 4 3 2 1
**29 68500 2007 )lateaoCelestial 700 Auto 4 3 2 1
30 76000 2007 )lateaoCelestial 3250 Auto 4 3 2 1
31 69000 2007 BeigeDuna 5000 Auto 4 3 2 1
32 68000 2007 A%ul&ceano 10000 Auto 4 3 4 1
33 45000 2007 A%ulSu*erior 9000 Sincr 3 3 4 2
34 68000 2007 "o#o'las( 6000 Auto 4 3 5 1
35 47000 2007 GrisCumberlan 32500 Sincr 4 3 2 2
%rimero se prueba construir el modelo con <E incluido y verificaremos que se nos presentaran problemas de
datos de doble precisin de punto flotante+ @galo en sus ratos de ocio+
Ona ve6 sustra,do <E, corremos el anlisis y se verifica que hay algunos datos extraKos o perturbadores y que
al sustraerlos el modelo me!or (se indican con un = en la matri6 anterior)+
%redichos vs actuales+ ;rafica de %redichos vs 4bservados
&bser-e )reicte
"esiual
Values
1 44000.00 44628.21 /628.21
2 38000.00 41101.89 /3101.89
3 45000.00 40423.14 4576.86
4 41300.00 43814.70 /2514.70
6 46000.00 44551.49 1448.51
7 44000.00 41939.41 2060.59
9 41000.00 42779.81 /1779.81
10 43000.00 43172.95 /172.95
11 39000.00 42742.70 /3742.70
12 45000.00 43888.16 1111.84
13 40000.00 40429.05 /429.05
14 41800.00 39737.42 2062.58
15 45000.00 43891.07 1108.93
16 45000.00 43108.46 1891.54
17 43000.00 38451.99 4548.01
18 46000.00 49183.58 /3183.58
20 46000.00 43977.43 2022.57
22
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
21 45000.00 45684.00 /684.00
22 45000.00 48748.92 /3748.92
23 43000.00 45006.64 /2006.64
24 42000.00 40838.99 1161.01
25 52000.00 54959.98 /2959.98
26 50000.00 49145.03 854.97
30 76000.00 73608.04 2391.96
31 69000.00 71993.99 /2993.99
32 68000.00 63834.85 4165.15
33 45000.00 47015.98 /2015.98
34 68000.00 65524.51 2475.49
35 47000.00 48917.62 /1917.62
En ambos casos anteriores, se detecta que hay buena capacidad de prediccin+
Aest of -- Uhole 3odel vs+ -- *esidual (E!ercicio pronostico 5valuo 5veo)
)ultiple
!
)ultiple
!
*
'd+usted
!
*
$$
)odel
Df
)odel
)$
)odel
$$
!esidual
Df
!esidual
)$
!esidual
F p
y H,VPEVVH H,VC8:HQ H,TP:E8H :,EQSHSPE]HV 8E 8SQQHQE:Q 8T8Q::PSQ 8E 8:VPQVHQ 8C,QCQV: H,HHHHHV
5qu, un coeficiente de regresin de VC,8:_ y un a!ustado de TP,:E0 con una alta significancia, es muy bueno+
<rediction e+uation ,or: : <recio
='1YYUX0,WW',2W1XYV1S([X![+,2WS!SW?'X([X![\2+UWVVX,020S([XX[
'1102V,XS0([XX[\2+2WV!2,!U1Y([X1c['2VVS,YVVW([X1c[\2'!V2!,!Y1X
([X2c[+1X2,Y22W!0([X2c[\2+,01X!X!20W([X![([XX[',2Y2!0X22([X![([X1c[
'1VSY,!WUU([XX[([X1c[+,0SXVX!VXY([X![([X2c[+2!V,01XS01([XX[([X2c[
'1Y1,YYWU2([X1c[([X2c[
-i quisiramos reducir el modelo para mane!arlo manualmente, chequeamos el siguiente cuadro, y verificar
cual variable es importante o no+
&lic> en la pestaKa =ummar y luego en la opcin coe,,icients+
<arameter ?stimates %?"ercicio pronostico A3aluo A3eo) =i0ma'restricted parameteri4ation
)
<arameter
i"
)
?rror ?st
)
t
)
p
'UX,00] +UX,00] 'UX,00] +UX,00]
;ntercept 0 '1YYUX1 WWYYW,!! '2,00SSS 0,0VSYV1 '!VW!V1 12SXU,Y
[X![ '0 0,W2 '0,!S1X2 0,Y!YYWX '2 1,X '0,YY0WU 2,2XY22S 'X,V121X S,0Y0!W
[X![\2 0 0,00 1,!120S 0,210V1S '0 0,0 0,YWYSX 0,V001YS '0,SUUYU 2,0YSY0
[XX[ UWVVX !X220,01 2,W01!U 0,01S1S2 2!12V 1YS20S,S V,11XYY 2,1W!120 1,S!!SX 10,YUW10
[XX[\2 '1102Y !Y2X,VV '2,UXUV2 0,010!SY '1U01Y '!0!X,W 'X,Y00WU 1,U2V222 'U,W!22! '1,XVUXV
23
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
[X1c[ 2WV!2 2W1V1,0U 1,01VYS 0,!2VX2U '!1YVY WU0!1,U 2,X01!Y 2,SV01UU '2,YYX2! Y,YYYUY
[X1c[\2 '2VVX !!2!,WU '0,W01Y0 0,S!V12! 'UYUS SSVS,! '0,U2!XU 1,1X20!Y '!,!USSV 1,XSY2U
[X2c[ '!V2! Y0!X,!U '0,X1X02 0,V1SXYS '1WY1! 11SVV,0 '0,XV12V 1,0WUYW0 '2,WUWV0 1,YYV0U
[X2c[\2 1X! XWW,1W 0,2XUVX 0,YUWU10 '110U 1S1S,2 0,1YV1X 0,VYWS0V '1,2YWWW 1,V!11U
[X![([XX[ 0 0,1S 0,110WS 0,U1!!1X '0 0,! 0,1WSXW 1,VVX2SS '!,!WY02 !,YXV1Y
[X![([X1c[ '0 0,1! '2,01WVW 0,0V!0UU '1 0,0 '0,W!XYY 0,S1S01U '1,Y2!YX 0,0X221
[XX[([X1c[ '1VSY S0YW,!W '0,S0!U! 0,VU2!VX '10!UX Y0UU,U '0,X21U0 1,2U20XU '!,2U!10 2,2SU2U
[X![([X2c[ 0 0,0S 1,0S!WU 0,!1S22Y '0 0,1 0,S1YU! 0,S00!V2 '0,SS0YV 1,2YVV2
[XX[([X2c[ 2!V 10YY,SX 0,21U0X 0,W2UYY! '20YX 2XSV,U 0,1Y0!X 0,YYYVVX '1,SUYXW 1,W!W2Y
[X1c[([X2c[ '1Y2 U21,0V '0,1WVX0 0,WXSY2Y '21SY 1W0!,Y '0,0Y0YS 0,!YU2U0 '0,WWS2S 0,YS2YV
4bservemos que la variable <C, <C
:
, no tiene influencia en la respuesta+
9as interacciones <C= <Q0 <C=<8 y <C=<:, tampoco influencia la respuesta+
%or tanto podemos extraerlas del modelo+
%*E)D&&DbB )E %*E&D4 O-5B)4 95 4%&DbB %*4?D9E* (%E*?D9E- )E %*E)D&&DbB)+
@aciendo clic> en la pestaKa pro,iler, se nos muestra la siguiente ca!a de dialogo, seleccionando aqu, la
opcin ^ Jser 3als, (cuadro select ,actorTco3ariate 3alues) aqu, indicamos los valores de las variables para el
carro que queremos predecir+
24
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
5qu, estamos indicando que se requiere predecir el precio de un carro con QHHHH de >ilometra!e, sedan E
puertas, color :, aKo : (:HHP)+
Ona ve6 dadas todas estas instrucciones con 4., hacemos clic> en la pestaKa 3ie-, y tendremos la siguiente
grafica de perfil de prediccin+
25
enriqcavila@gmail.com MANEJO COMPUTARIZADO DE DATOS DE AVALOS. MANEJO COMPUTARIZADO DE DATOS DE AVALOS. enriqueavila@cantv.net 0258-
4335084 Venezuela.
LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS. LA TECNICA DE RGRESIN MULTIPLE DISCRETA, EL PRONSTICO EN AVALOS. TOPICOS BASICOS.
%ara las caracter,sticas del carro especificadas, el precio mximo es de QH+P:P,H Ls?, un valor medio de
E8+S8:,H Ls? y un valor m,nimo de C:+SVS,H Ls?+
26

También podría gustarte