Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Las relaciones entre variables pueden ser determinísticas o estocásticas (o aleatorias). Una
relación determinística es por ejemplo la que calcula el perímetro de una circunferencia:
P=π x d porque la relación es exacta y no hay error (excepto por la aproximación de π ).
Sin embargo muy pocas relaciones en el mundo son así de exactas. Con frecuencia se
encuentra que al utilizar una variable para explicar otra existe alguna variación en la relación.
Por ejemplo, se podría observar que cuando se hace publicidad por cierta cantidad Xi, las
ventas tienen algún valor Yi, sin embargo la próxima vez que se fije la publicidad en la misma
cantidad, las ventas pueden producir otro valor. La variable dependiente (ventas en este caso)
1
presenta algún grado de aleatoriedad, por lo tanto habrá algún error en el intento de explicar o
predecir las ventas según la publicidad. Se dice que este modelo es estocástico por la
presencia de la variación aleatoria y puede expresarse como un modelo lineal:
Y=β o + β 1X + ε
Esta fórmula describe la relación verdadera o poblacional según la cual se hace regresión de
Y sobre X. Como los parámetros β o y β 1 son desconocidos se pueden estimar solo con
datos muestrales. Además como ε es aleatoria Y solo puede estimarse por lo que el modelo
de regresión lineal quedaría:
Y = b0 + b1X
Nota: Como recordaremos en la ecuación de una recta b0 representa el valor donde la recta
intersecta el eje Y y b1 represnta la pendiente de la recta y se halla así:
b1 = pendiente = variación vertical y su valor nos indica no solo en cuanto varía Y cuando
variación horizontal X varía sino además en qué dirección.
El propósito del análisis de regresión es determinar una recta que se ajuste a los datos
muestrales mejor que cualquier otra recta que pueda dibujarse. Para esto lo primero que hay
que hacer es representar los datos (por pares) en un diagrama de dispersión para
determinar el modelo que mejor se ajuste, esto es, si es lineal positiva o negativa o curvilinea.
Veamos un ejemplo con los siguientes datos:
Esto es, MCO produce una recta tal que la diferencia entre los valores observados Yi y los
valores estimados Yi pueden ser positivas o negativas sin embargo al sumarse esas
diferencias o errores de estimación, es igual a cero. Además si elevo al cuadrado esos errores
y los sumo el número resultante es menor que el que se obtendría con cualquier otra recta, es
decir, minimiza la suma de los errores al cuadrado. De ahí el nombre.
2
Para calcular b0 y b1 primero calcularemos algunos valores intermedios:
Nota: Como estos cálculos son muy sensibles a la aproximación se aconseja manejar seis
cifras decimales.
3
Ejemplo:
La gerencia de una aerolínea considera que existe una relación entre los gastos publicitarios y
el número de pasajeros que escogen viajar por ella. Para determinar si esta relación existe y
si es así cuál podría ser la naturaleza exacta, se decidió utilizar el método de mínimos
cuadrados (MCO) para determinar el modelo de regresión.
Se recolectaron los valores mensuales por gastos de publicidad y el número de pasajeros de
los n=15 meses más recientes. Los datos aparecen en la siguiente tabla donde se observa
que los pasajeros están representados con la variable Y, ya que se asume que depende de la
publicidad.
Por lo tanto:
b1 = SCxy = 148.933333 =1.08 y como X = 12.46667 y Y = 17.86667
SCx 137.733333
4
El modelo de regresión entonces es:
Y = 4.40 + 1.08 X
Esto quiere decir que si se gastan X=10 unidades ($10,000) en publicidad el modelo predice
que Y=15.2 (es decir, 15,200 personas decidirán volar por esa aerolínea).
El valor b1= 1.08 indica que por cada incremento de una unidad de X, Y aumentará en 1.08
unidades, esto es si se incrementan en $ 1000 los gastos de publicidad, entonces 1080
pasajeros más decidirán volar en esa aerolínea.
Para comprender mejor el modelo de regresión lineal se deben examinar los cuatro supuestos
sobre los cuales se construye:
4. El supuesto de linealidad.-
Como en el supuesto 1, dado un valor de X, ocurrirá una distribución normal de los
valores Y. Esta distribución normal tiene una media igual a µ y| x .Como esto vale para
todos los valores X, esta medias quedan en una recta, que es precisamente la recta de
regresión.
5
El error estándar de estimación
La recta de regresión, denominada la recta del ajuste óptimo representa la relación entre X y
Y mejor que cualquier otra recta, sin embargo existen al menos dos medidas de la bondad de
este ajuste: 1) el error estándar de estimación y el coeficiente de determinación.
El error estándar de estimación, Se, es una medida del grado de dispersión de los valores
Yi, alrededor de la recta de regresión. Mide la variación promedio de los puntos de datos por
encima o por debajo de la recta de regresión. Se calcula de la siguiente manera:
Se = ∑( y
i − yi )
n−2
El error estándar se expresa en las mismas unidades que la variable dependiente Y, en este
caso miles de pasajeros, por lo tanto el error estándar de .907, significa que hay una variación
promedio de 907 pasajeros alrededor de la recta de regresión ajustada.
Como el error estándar de estimación es similar a la desviación estándar para una sola
variable, puede interpretarse de manera similar. Por lo tanto vale la Regla Empírica cuya
condición es que los datos estén distribuidos normalmente lo cual cumplen las Yi estimadas.
Así para un valor dado X=10, por ejemplo, Y = 4.4 + 1.08(10) = 15.2. Para ilustrar la Regla
empírica para el error estándar de estimación, calculemos un error estándar más y uno menos
de 15.2, esto es, 14.29 (15.2-.907) y 16.11 (15.2+.907). Si se trazan rectas paralelas a la
recta de regresión pasando por estos puntos, aproximadamente el 68.3% de las
observaciones caerán dentro de estas dos rectas.. Esto quiere decir, que si se invierte
$10,000 en publicidad, el 68.3% de las veces, el número de pasajeros estará entre 14,290 y
16,110 como se muestra en la siguiente figura:
6
Análisis de Correlación.
En la ecuación de regresión del ejemplo anterior el valor positivo de b1 nos indica una
relación directa, esto es a medida que aumenta la publicidad también lo hace el número de
pasajeros. Sin embargo es útil conocer una medida de la fuerza de esa relación. Esta medida
nos la da el coeficiente de correlación, el cual está representado por una r y puede tomar
cualquier valor entre –1 y +1 , es decir, -1 ≤ r ≤ +1.
Un valor de r=-1 nos indica una relación negativa perfecta entre X y Y, esto es, todas las
observaciones quedan en una línea recta perfecta con pendiente negativa. Por el contrario si
r=+1 las observaciones forman una línea recta con pendiente positiva como se muestra en
las siguientes gráficas.
Sin embargo en toda relación siempre existe alguna variación por lo que r es poco probable
que sea exactamente 1, como se muestra en las gráficas siguientes:
7
Además cuando las dos variables no tengan ninguna relación el valor de r=0
SC xy
r=
( SC x ) ( SC y )
r= 148.93333 = 0.9683
√(137.7333)(171.73333)
Esto nos indica que hay una relación muy fuerte entre la publicidad y el número de pasajeros
Cabe recordar que el error estándar es una de las medidas de la bondad de ajuste de la recta
de regresión. Esta nos proporciona una medida cuantificable de qué tan bien se ajusta el
modelo a los datos recolectados. La otra medida es el coeficiente de determinación el cual
se calcula de la siguiente manera:
r2 = (SCxy)2
(SCx)(SCy)
8
El coeficiente de determinación proporciona una medida de la bondad de ajuste porque revela
que porcentaje del cambio en Y se explica por un cambio en X.
Para el ejemplo anterior:
Esto quiere decir que el 94% del cambio en el número de pasajeros se explica mediante un
cambio en la publicidad.
Nota: El coeficiente de determinación solo tiene significado para las relaciones lineales. Dos
variables pueden tener un r2 = 0 y sin embargo estar relacionadas en sentido curvilíneo.
Además no se interpreta este valor como si el 94% del cambio en los pasajeros fuera causado
por un cambio en la publicidad . La correlación no significa causa.
9
Como τ = 113.995>2.160, la Ho de que β 1 = 0 se rechaza. Entones si no es cero, ¿cuál es
su valor?. Para esto calcularemos un intervalo de confianza (I.C.) para β 1 así:
.913 ≤ β 1 ≤ 1.247
Esto significa que se puede estar 95% seguro de que el coeficiente de regresión para toda la
población de todos los valores X,Y está entre .913 y 1.247.
Debido a que τ = 14.033 > 2.160, se rechaza la hipótesis nula. A un nivel de significancia del
5%, se concluye que el coeficiente de correlación poblacional no es cero y que los pasajeros y
la publicidad están relacionados.
10
Intervalos de confianza en el análisis de regresión.
Un estimado por intervalo para el valor promedio de Y dado cualquier valor X. Se puede
estimar la media poblacional para todos los valores de Y cuando X es igual a algún valor
dado. Por ejemplo se puede estimar el número promedio de pasajeros en todos los meses
en los que se gastó $10,000 en publicidad. A esto se le denomina media condicionada.
Un estimado por intervalo para un valor único de Y dado que X se fija en una cantidad
específica. Este estimado se llama intervalo de predicción (I.P.)
Así, mientras la media condicionada es una estimación del valor promedio de Y en todos los
meses en los cuales X es igual a un monto especificado, los estimados por intervalo de
predicción, estiman Y en cualquier mes en el cual X se fija en un monto dado.
Cabe recordar que este intervalo puede tener dos interpretaciones(por ejemplo para un
intervalo de confianza del 95%):
Dada una X fija, se puede estar 95% seguros de que la media de los valores Y (µ yx )
caerá dentro del intervalo especificado.
Para calcular el primer intervalo es necesario determinar Sy, el error estándar de la media
condicionada, el cual reconoce que se utiliza una muestra para calcular bo y b1 en la
ecuación de regresión y por lo tanto están sujetos al error de muestreo. Si se tomaran otras
muestras, los valores bo y b1 serian otros por lo que Sy toma en cuenta estas variaciones. Se
calcula de la siguiente manera:
Error estándar de
1 ( xi − x )
2
11
Yi ± τ Sy donde Yi es el estimador puntual hallado con la
ecuación de regresión y τ se busca con n-2 grados de
libertad
Si se utiliza u nivel de confianza del 95% con 13 grados de libertad, τ = ± 2.160 .Por otro lado
para Xi=10, evaluamos la recta de regresión y tenemos: Yi =4.4 +1.08 (10) = 15.2
Esto se puede interpretar como: La aerolínea puede estar 95% seguro de que si se invierten
$10,000 en publicidad, el promedio de los pasajeros estará entre 14,550 y 15,850.
Cabe hacer notar que se vuelve más ancha en cada extremo porque el análisis de regresión
se basa en las medias, y entre más se aleja de la media de X, los resultados se vuelven
menos precisos, por lo tanto para mantener un nivel de confianza del 95%, la banda debe ser
más amplia.
Si lo que deseo construir es un intervalo de confianza para un valor único dee Y que se
obtiene cuando X se fija a un valor dado una sola vez. Para calcular este intervalo de
predicción primero se debe calcular el error estándar del pronóstico Syi . Este error
estándar del pronóstico explica el hecho que los valores individuales están más dispersos que
las medias y se calcula así:
12
1 ( x1 − x )
2
Syi = Se√ 1+ 1 + (10 – 12.47)2 = .907 √1.1114 = .956 y Yi=4.4 + 1.08(10) = 15.2
15 137.73333
13.14 ≤ Yx ≤ 17.27
Como el propósito final de un intervalo de confianza es la estimación del algún valor, mientras
más pequeño sea éste, más precisa será la predicción. Sin embargo hay tres factores que
influyen en el ancho del intervalo:
1. El grado de dispersión de los datos originales. -Mientras más dispersos, mayor
será el error estándar de estimación Se.
2. El tamaño de la muestra.- Mientras más grande sea la muestra, menor es el
error estándar.
3. La cercanía de los valores Xi con su media X.- Mientras mas cerca este un valor
de su media, producirá intervalos más pequeños.
13
UNIDAD 2: Análisis de Regresión y Correlación Múltiple
Así como el modelo de regresión simple analiza una sola variable explicativa para
predecir el valor de la variable dependiente, el modelo de regresión múltiple permite
incorporar dos o más variables independientes para predecir el comportamiento de la variable
dependiente. El modelo de regresión múltiple con k variables independientes se expresa
como:
En donde las β i son los coeficientes de regresión y ε es el término de error aleatorio. Este
modelo se estima a partir de datos muestrales así:
En donde Y es el valor estimado para la variable dependiente y las bi son los estimados para
los coeficientes β i. Los bi se denominan coeficientes parciales (o netos) de regresión y
tienen la misma interpretación que en la regresión simple. Por tanto, b1 es la cantidad por la
cual Y1 cambiará si X1 cambia en una unidad, suponiendo que todas las otras variables
independientes se mantienen constantes.
La regresión múltiple implica los mismos supuestos que la regresión simple más otros dos:
• El número de observaciones n, debe exceder el número de variables k en por lo
menos dos unidades, debido a que en la regresión múltiple hay k+1 parámetros por
estimar, para que los grados de libertad relacionados con el modelo sean al menos
1, ya que g.l.= n – (k+1).
• Que ninguna de las variables independientes este linealmente relacionada. Por
ejemplo, si X1 = X2 + X3 o X1 = .5 X2, etc., porque en este caso existiría
multicolinealidad. La multicolinealidad puede hacer que los signos algebraicos de
los coeficientes sean ilógicos además de que incrementan el error estándar de los
coeficientes.
Ejemplo: Siguiendo con el ejemplo de la aerolínea donde se utilizó la publicidad para explicar
y predecir el número de pasajeros, ahora desean incorporar una segunda variable explicativa
dentro de su modelo par explicar el número de pasajeros. Basándose en que el ingreso
nacional es determinante de la demanda, se escogió ésta como segunda variable. El modelo
de regresión múltiple quedaría:
Y = b0 + b1X1 + b2X2
14
Plano de regresión.- Los coeficientes de las dos variables independientes se representan
mediante las pendientes del plano de regresión.
Este modelo predice que si se incrementa la publicidad una unidad ($1000), los pasajeros
aumentarán .84 unidades (840 pasajeros) si el ingreso no cambia. Además si el ingreso
nacional incrementa en una unidad ($ 1 billón), los pasajeros incrementarán en 1.44 unidades
(1,440 pasajeros) si la publicidad no cambia.
Al igual que en la regresión simple, el error estándar (Se) de estimación puede utilizarse como
medida de bondad de ajuste. Tiene la misma interpretación, mide los grados de dispersión de
los valores Yi alrededor del plano de regresión. Se entiende que mientras menos dispersos
estén estos valores del plano, más pequeño será el Sey más preciso será el modelo en su
predicción y pronóstico.
Para medir dicha porción se utiliza la relación de la variación explicada (SCR o Suma de los
cuadrados de la regresión) con la variación total (SCT o Suma Total de Cuadrados). Por tanto:
Pero debido a que SCT = SCR + SCE también se puede calcular así:
En nuestro ejemplo R2 = 163.632 = .953 Lo cual indica que 95.3% del cambio en el No.
171.7333 de pasajeros se explica por los cambios en la
publicidad y en el ingreso nacional.
Coeficiente de determinación
múltiple corregido R2 = 1 - SCE/(n - k – 1)
SCT /(n – 1)
16
R2 = 1 – [(1 - .953)*(15 – 1)/(15- 2 – 1)] = .945
El siguiente paso lógico es probar cada coeficiente individualmente para determinar cuál es (o
cuáles son) significante(s). Probaremos primero la publicidad. Si β 1 fuera = 0 significaría que
la publicidad no contribuye con poder explicativo al modelo, dado que el ingreso nacional ya
está incluido. Por lo tanto nuestras hipótesis son:
1er. Paso: 2o. Paso:
Ho: β 1 = 0 Calculamos el estadístico τ :
HA: β 1 ≠ 0 τ = b1 – β 1 = .8398 – 0 = 5.92
Sb1 .1419
3er. Paso:
Buscamos los valores críticos:
Para α = 1% con (n- k – 1)=15 – 2 –1 = 12 grados de libertad, τ = 3.055
Como τ =5.92>3.055, se rechaza la Ho, es decir, β 1 ≠ 0. Por lo que puedo afirmar que al
nivel de significancia del 1%, la publicidad contribuye significativamente al poder explicativo
del modelo, aun incluido el ingreso nacional.
Cabe señalar que cuando la publicidad era la única variable explicativa el valor de τ =
13.995. Al haber otra variable explicativa en el modelo este valor disminuye, sin embargo
como es ≠ 0, sigue teniendo significancia dentro del modelo.
Probaremos ahora si el ingreso nacional tiene significancia dentro del modelo. Para esto
probaremos que β 2 ≠ 0.
1er. Paso: Las hipótesis son: 2o. Paso: Calculemos el estadístico de prueba
17
La multicolinealidad surge cuando una de las variables independientes está relacionada
linealmente con una o más de las otras variables independientes. Dicha condición contraviene
una de las condiciones de la regresión múltiple. Específicamente la multicolinealidad ocurre si
existe una “alta” correlación entre dos variables independientes.
Si el coeficiente de correlación r se aplica a dos variables independientes X i y Xj , en
regresión múltiple se puede calcular el coeficiente de correlación r ij . Si rij es alto existe
multicolinealidad. Pero ¿cuándo es alto?. No existe un punto en el cual se pueda determinar
que la correlación es demasiado alta y que por ende exista multicolinealidad.
Veamos un ejemplo. Supongamos que estamos utilizando las técnicas de regresión para
estimar una curva de demanda (o función de demanda) para un producto. Al reconocer que el
número de consumidores está relacionado con la demanda, se seleccionan como variables
explicativas las siguientes:
La multicolinealidad incluso puede hacer que el signo del coeficiente sea opuesto a lo que la
lógica dicta. Por ejemplo, si se incluye el precio como una de las variables explicativas en un
modelo de regresión para la demanda y éste ( el precio) tiene una alta correlación con otra
variable, puede hacer que su coeficiente de positivo. Esto implicaría que si el precio aumenta,
la demanda también aumenta, lo cual es una contradicción.
18
Para compensar estas deficiencias, algunas veces se mide la respuesta de Y a los cambios
en los coeficientes de regresión estandarizados. Los coeficientes d regresión estándar,
también denominados coeficientes beta (no confundir con el valor β , el cual es el coeficiente
de regresión desconocido a nivel poblacional), reflejan el cambio en la respuesta promedio de
Y, calculada en el número de desviaciones estándar de Y, de los cambios en Xi, medida en el
número de desviaciones estándar de Xi. El efecto que se pretende con el cálculo de los
valores beta es que los coeficientes “no tengan dimensiones”.
Lo cual quiere decir que un cambio de una desviación estándar en el ingreso nacional da un
cambio en la desviación estándar de pasajeros de .2436. De igual forma el coeficiente beta
para la publicidad se convierte a .7519. Esto sugiere que la publicidad tiene un impacto más
fuerte en los pasajeros. Sin embargo cabe señalar, que aun estos coeficientes estandarizados
sufren deficiencias si existe multicolinealidad.
Anteriormente se ha supuesto que la relación entre X y Y puede expresarse como una linea
recta, sin embargo, no siempre es el caso. El diagrama de dispersión de los datos puede
sugerir que un modelo curvilineal (no lineal) puede proporcionar un mejor ajuste. Veamos un
ejemplo: El alcalde de una ciudad recolecta los siguientes datos (en millones) con la intención
de predecir las declaraciones de impuestos con base en la población:
Impuestos Población
85 2.68
118 2.98
164 3.50
228 3.79
31 1.57
43 2.01
61 2.15
611 4.90
316 4.16
444 4.50
19
El diagrama de estos datos nos sugiere un modelo curvilineal.
Se dice que la expresión anterior es un polinomio de grado k porque es la potencia más alta
de cualquier variable explicativa.
Siguiendo con nuestro ejemplo, supongamos que el alcalde decide utilizar un modelo
curvilineal utilizando un polinomio de grado 2 o de segundo orden:
Y = b0 + b1X + b2X2
Es decir:
I = = b0 + b1POB + b2(POB)2 donde I = Impuestos y
POB = Población
Estimar los coeficientes es algo complejo, por lo que solo veremos la comparación de los
resultados (obtenidos por computadora) si usáramos otros modelos. Si le intentamos ajustar
un modelo de regresión lineal a éstos datos obtendríamos la siguiente función:
20
Un método alternativo para los modelos curvilineales puede lograrse mediante la
transformación de los datos mediante el uso de logaritmos. Esta transformación logarítmica
puede hacer que los datos sean lineales en el logaritmo. En la tabla siguiente se muestran los
mismos datos del ejemplo anterior pero con sus logaritmos naturales en las columnas
siguientes:
De esta forma, simplemente se hace regresión del logaritmo de los impuestos sobre el
logaritmo de la población. Resolviéndolo por computadora se nota el mejoramiento del error
estándar de solo 0.1680 y r2 = 82.2% pues el modelo de regresión queda:
Imp =159.33
21
UNIDAD 3: Análisis de Series de Tiempo
Series de Tiempo.- Es una recolección de datos para alguna variable o conjunto de variables
durante varios periodos.
El propósito del análisis de las series de tiempo es predecir o proyectar los valores futuros de
la variable a partir de observaciones anteriores. Un método directo es el método intuitivo de
proyección, el cual presume que el mejor predictor del valor de la variable en el periodo
siguiente es su valor en el periodo corriente. Esto se puede expresar así:
Donde Yt+1 es el estimado del valor de la serie de tiempo en el siguiente periodo t+1 y Yt es
el valor real en el periodo corriente t . Este método de pronóstico es más exitoso para los
datos que se recogen en intervalos cortos de tiempo como los diarios o los semanales. Sin
embargo, la mayoría de las series de tiempo son más complejas.
22
Todas las series de tiempo contienen por lo menos uno de los siguientes cuatro componentes:
• Tendencia secular.- Es el movimiento continuo de una variable durante un periodo de
tiempo extendido.
Es la conducta a largo plazo de la variable en un periodo prolongado. Refleja la
dirección general de la serie de tiempo, como ascendente o descendente.
Un modelo de series de tiempo puede expresarse como alguna combinación de estos cuatro
elementos. El modelo es simplemente una expresión matemática de la relación entre los
cuatro componentes. Los modelos más comunes son: 1) el modelo aditivo y 2) el modelo
multiplicativo.
23
en donde Yt es el valor de la serie de tiempo para el periodo t y a la derecha están la
tendencia, la variación estacional, la variación cíclica y la aleatoria de la serie de tiempo para
el mismo periodo.
En el modelo aditivo, todos los valores están expresados en las mismas unidades que las
originales. Además S,C e I son desviaciones alrededor de T.
Por ejemplo: Si se desarrollara un modelo de series de tiempo para las ventas en dólares de
una tienda minorista y se encontrara que T=$500, S=$100, C=-$25 e I=-$10, el modelo de
ventas sería:
Y = 500 + 100 – 25 – 10 = $ 565
Cabe señalar que el valor positivo de S indica que las influencias estacionales existentes han
tenido un impacto positivo en las ventas, que el valor cíclico negativo sugiere que el ciclo
comercial está actualmente descendiendo y que aparentemente sucedió algún evento
aleatorio que tuvo un impacto negativo en las ventas.
El modelo aditivo supone que los componentes son independientes uno del otro, lo cual es
algo irreal, pues raramente sucede en la vida real. Generalmente los movimientos de un
componente tienen un impacto en los otros componentes, por lo que este supuesto no se
cumple.
Como resultado de esto, el modelo multiplicativo es el que se prefiere con frecuencia, pues
supone que los componentes interactúan entre sí y no se mueven independientemente. Este
modelo se expresa así: Yt = Tt x St x Ct x It
Debido a que las fluctuaciones ocurren dentro de periodos de menos de un año, podrían no
reflejarse en los datos anuales, es decir en S. Una serie de tiempo para datos anuales se
expresaría así:
Yt = Tt x Ct x It
Técnicas de suavizamiento.
24
• Promedios móviles
Promedio móvil (PM).- Una serie de promedios aritméticos sobre un número dado de
periodos; es la estimación del promedio de la variable a largo plazo.
Veamos un ejemplo: En la siguiente tabla se muestran las ventas de una empresa durante
los últimos 12 meses y se han calculado los promedios móviles para tres y para cinco meses
Nótese que cuando se usa un número impar de periodos para calcular el PM, éste se puede
ubicar en el período central. Sin embargo si el número de periodos es par, el PM debe
ajustarse, ya que éste estaría siempre entre los valores centrales. Para ajustar los promedios
móviles, lo que se hace es promediar cada par sucesivo de PM previamente calculados y
ubicarlo en el periodo inmediato siguiente.
Los promedios móviles tienen el efecto de suavizamiento de las variaciones grandes de los
datos. Entre más grande sea el número de periodos en un promedio móvil, más pronunciado
será el efecto del suavizamiento. Vale la pena notar que el rango de valores en un PM de tres
meses es menor que en los datos originales, pero mayor que el rango de PM de 5 meses. A
continuación se muestra la gráfica de las tres columnas para ver el efecto del “suavizamiento”.
25
Cuando el número de periodos en un promedio móvil es suficiente para abarcar todo un año
(12 meses, 52 semanas, etc,) las variaciones estacionales se promedian y se eliminan de la
serie, entonces se afirma que los datos están desestacionalizados.
• Suavizamiento exponencial
Esta técnica además de tener el efecto de suavizar una serie proporciona un medio efectivo
de predicción. El suavizamiento exponencial de primer orden, se utiliza cuando los datos no
presentan ningún patrón de tendencia. El modelo contiene un mecanismo de autocorrección
que ajusta los pronósticos en dirección opuesta a los errores pasados. La ecuación es:
Ft +1 = α At +(1 – α )Ft
Teniendo en cuenta que los datos no tienen tendencia ascendente o descendente, pero
varían alrededor de algún promedio a largo plazo, se toma el valor F t+1 como pronóstico para
cualquier periodo futuro.
Ejemplo: Supongamos que es el último día hábil de Febrero y las ventas totales del mes
fueron de $110,000 en una empresa. Esta desea pronosticar las ventas para el mes de
Marzo. De acuerdo a lo anterior, la proyección para Marzo (Ft +1) requiere:
26
• Ventas reales de Febrero, At
• Pronóstico para Febrero, Ft .
Sin embargo como Marzo es el primer mes que voy a pronosticar, no se hizo un pronostico
para Febrero y por lo tanto Ft es desconocido. En este caso se utiliza el valor real del período
anterior , Enero en este caso, para la primera proyección. Las ventas de Enero fueron de
$105,000. Para un valor de α =.03 , el pronóstico para Marzo es:
FMarzo = α AFeb +(1-α )FFeb
= (.3)(110) + (.7)(105)
= 106.5
Es decir, la proyección de las ventas en Marzo es de $106,500. Si las ventas reales en Marzo
fueron de $ 107,000 , el error se calcula como FMarzo – AMarzo = 106.5 – 107.0 = -.5.
Por otro lado podemos estimar las proyecciones de Abril y Mayo de la misma manera, si
conocemos las ventas reales de Abril (112.0):
Como lo que deseamos es producir un pronóstico con el error más pequeño posible, el valor
α que minimiza el cuadrado medio del error (CME = ∑( Ft –At)2/n –1 ) debe ser óptimo. El
ensayo y error es con frecuencia el mejor método para determinar el valor de α apropiado.
Generalmente hablando, si los datos son volátiles se precisa un menor valor α , debido a que
los valores más pequeños de α asignan menos peso a las observaciones más recientes. Si
los datos presenta un movimiento considerable, la última observación puede no ser
representativa del promedio a largo plazo.
Nota: Vale la pena recordar que el suavizamiento exponencial de primer orden solo es
apropiado si los datos no presentan ninguna tendencia, es decir, se mueven alrededor de
algún valor promedio a largo plazo. Si la tendencia fuera ascendente o descendente se debe
utilizar el suavizamiento exponencial de segundo orden que no analizaremos.
27
Análisis de Tendencia.
Si una serie de tiempo tiene una tendencia ascendente o descendente a largo plazo, el
análisis de tendencia puede ser útil para desarrollar pronósticos. Es decir , si una tendencia
está presente debido a que los datos no varían alrededor de algún promedio a largo plazo ,
los métodos de suavizamiento como el promedio móvil y el suavizamiento exponencial no son
apropiados. En su lugar, se puede estimar una recta de tendencia utilizando las técnicas de
regresión lineal vistas anteriormente. En este caso, la variable dependiente es la serie de
tiempo que se desea pronosticar y el tiempo se utiliza como variable independiente. El modelo
quedaría así:
Yt = b0 + b1t
Ejemplo: Una constructora desea estimar el número de casas iniciadas ( en miles) en una
comunidad ajustando su serie de tiempo mediante el desarrollo de un modelo de regresión
lineal.
Y = 7.02 + 0.173t
Con esto podemos ver la recta de regresión sobre el diagrama de dispersión de los datos
originales:
28
Además con la ecuación de regresión podríamos predecir el número de viviendas iniciados
en períodos futuros simplemente sustituyendo el año (codificado) que se desea estimar. Si se
desea pronosticar para 2001, sustituimos t=17 en la ecuación y la proyección sería:
Con frecuencia es útil descomponer una serie de tiempo para examinar individualmente cada
componente. Veamos:
• Examinar solo la tendencia puede reflejar patrones anteriores de comportamiento para
desarrollar modelos de tendencia útiles en la proyección y pronóstico, como acabamos de
ver.
• Por otro lado, el desempeño cíclico del negocio puede también influir en la dirección de
la planeación del negocio.
29
Aislamiento de la componente estacional
Como vimos anteriormente el promedio móvil para un año elimina los movimientos
estacionales recurrentes (debido a que las variaciones estacionales ocurren dentro de un
año), así como el efecto aleatorio durante el transcurso del año.
Razón por promedio móvil.- Al dividir los datos de la serie de tiempo por el promedio móvil
se obtiene la razón por promedio móvil, que contiene los componentes S e I.
Ahora se debe calcular una razón media (o promedio) por promedio móvil para cada
periodo. Esto se logra promediando todas las razones promedio móvil que correspondan l
mismo periodo. Estas doce (si la variación estacional ocurre en un año) razones promedio se
suman. En forma ideal, deberían sumar 12, aunque siempre se aproxima rara vez ocurre así.
Para normalizar estas razones es necesario obtener un índice estacional. Para esto dividimos
el número de periodos entre la suma de las razones promedio por promedio móvil. Este
resultado, llamado razón de normalización se multiplica por cada razón promedio y se
obtiene el índice estacional para cada período. Con este proceso de normalización se elimina
toda actividad irregular, dejando sólo el factor estacional.
1. El índice estacional para un periodo en particular indica como se comporta ese periodo
respecto al año como un todo.
2. Los índices pueden utilizarse para desestacionalizar los datos. Esto tiene el efecto de
eliminar la variación estacional de un serie para determinar lo que serían los valores ante
la ausencia de variaciones estacionales, es decir, un valor promedio por mes que se
cumpliría si no existieran cambios estacionales. Este valor desestacionalizado se halla
dividiendo el valor real durante el periodo por el índice estacional he dicho periodo. Estos
valores también se denominan corregidos estacionalmente.
30
3. También pueden utilizarse para estacionalizar los datos y obtener un mejor panorama de
lo que puede suceder en un periodo. Por ejemplo, si estimamos el valor de una serie para
un periodo en particular pero no consideramos la variación estacional, podemos
ponderarla con el índice estacional correspondiente a ese periodo.
Muchos negocios se ven afectados por las oscilaciones en el ciclo de los negocios. Esto es,
cuando la economía se activa, su actividad comercial se puede acelerar, mientras que un
descenso económico trae una caída en los negocios. Sin embargo existen industrias que
presentan movimientos en dirección opuesta la ciclo, como por ejemplo la industria del
entretenimiento.
Y =TxSxCxI = Cx I
Tx S T x S
31
Por último se elimina el componente irregular tomando un promedio móvil de cuatro periodos
(porque los datos son trimestrales), dejando sólo el factor cíclico. Estos últimos representan
los valores para esos períodos como un porcentaje de la tendencia.
Variación irregular
32
UNIDAD 4: Construcción y Uso de Números Indices.
El uso de números índice puede proporcionar a quienes toman decisiones una idea del
comportamiento de las variables económicas a través del tiempo, además que permite hacer
comparaciones más significativas. Un número índice relaciona un valor en un periodo de
tiempo, denominado período de base, con un valor en otro periodo, denominado período de
referencia (o actual).
Para calcular un índice simple, se divide el precio del producto en el período de referencia
por su precio en el período base y se multiplica por 100
Precio / Unidad
Artículo Unidad 1995 1996 1997
Res 1 libra 3.00 3.30 4.50
Cerdo 1 libra 2.00 2.20 2.10
Ternera 1 libra 4.00 4.50 3.64
33
La tabla de Indices de Precios quedaría así:
Se puede observar que desde el año base de 1995 a 1996, el índice de precios incrementó de
100 a 110, por lo que se puede concluir que el precio de la carne es incrementó en un 10%.
De igual forma se puede concluir que de 1995 a 1997 ocurrió un incremento del 50%, lo cual
podría hacer pensar que un incremento del 40% se presentó de 1996 a 1997, lo cual no fue
así como puede observarse en la tabla. Esta diferencia del 40% entre los números índice de
1996 y 1997 se denomina el incremento puntual porcentual, no incremento porcentual.
También podemos observar que el índice de precios en el año base es siempre 100. Esto
siempre será así pues el precio en el año base es el 100% de sí mismo.
Interpretación: Los períodos en los cuales los valores son menores que el del año base
tendrán un índice menor que 100, y los períodos con valores superiores al del año base
tendrán un índice mayor de 100.
Cuando se desea calcular un índice de precios para varios productos se le denomina índice
de precios agregativo. Esto es útil para las empresas que producen más de un artículo. Otro
ejemplo es el índice de precios al consumidor, el cual mide los precios relativos para una
“canasta” típica de productos y servicios consumidos por el público en general y es usado
para la toma de decisiones políticas y económicas en el gobierno.
Utilizando los datos del ejemplo anterior tenemos que el índice agregativo para 1995 para los
tres productos, manteniendo 1995 como período base, es:
Esto significa que en 1997, se necesitarán $113.80 para comprar lo que con $100 se
compraba en 1995.
Los índices de precios agregativos tal y como se calculan presentan dos problemas:
1) cuando los precios se dan en medidas diferentes, y
2) cuando no tienen en cuenta el hecho de que algunos productos se venden más que otros.
Para esto se calcula el índice de precios agregativos ponderado que asigna ponderaciones (o
pesos) diferentes a los precios individuales. Estas ponderaciones proporcionan un reflejo más
exacto del costo verdadero de la canasta básica del consumidor. Las cantidades
seleccionadas como ponderaciones pueden tomarse del número de unidades vendidas en:
1)el período base o en 2) el período de referencia.
Dos índices comunes son: el índice de Laspeyres y el índice de Paasche. El primero utiliza
cantidades vendidas en el año de base como ponderaciones y el segundo se basa en
cantidades vendidas en el periodo de referencia como ponderaciones.
Por otra parte, el índice de Paasche utiliza como ponderaciones las cantidades vendidas en
cada uno de los varios años de referencia. Esto tiene la ventaja de que el índice se basa en
los patrones de comportamiento el consumidor corriente. A medida que los consumidores
cambian en sus hábitos para comprar, éstos cambios en los gustos del consumidor se reflejan
en el índice. Este se calcula así:
35
Por otra parte, el índice de Paasche tiende a sobreponderar los productos cuyos precios
bajan. En un esfuerzo por compensar estas dos situaciones, se sugiere el uso del Indice de
Fisher, el cual combina ambos, encontrando la raíz cuadrado de su producto (√L x P ) aunque
su interpretación todavía está sujeta a discusión.
Aunque algunos de los índices son elaborados por la iniciativa privada para fines específicos,
los más ampliamente calculados y utilizados son los que elabora el Gobierno Federal.
Describiremos algunos de ellos.
El INPC tiene la finalidad de medir los cambios de precios de alimentos, ropa, alojamiento,
combustible, medicamentos, transporte, servicio médico, dental y otros bienes y servicios
que las personas adquieren para la vida cotidiana. Este índice se deriva de una “canasta
básica de productos del mercado” con cantidades fijas de productos que representan
todos los bienes y servicios que adquiere para su consumo. Además constituye una razón
de los costos de compra de un conjunto de productos de calidad y cantidad constantes en
dos períodos de tiempo distintos.
Algunas aplicaciones importantes es el uso del INPC como medida de la variación del
precio. Durante periodos de alza de los precios, es una medida de la inflación y sirve
como indicador del acierto o el fracaso de las políticas económicas del gobierno. Otro uso
común es como índice de la deflación de otra serie de precios, como la de ventas al
menudeo, ingresos, gastos de consumo y el producto nacional bruto. Se utiliza también
como un índice de ajuste proporcional para sueldos y pensiones que se pagan por
contratos colectivos.
Inicialmente llamado índice de precios para ventas al mayoreo, el IPP tiene la finalidad de
medir las variaciones en el promedio de los precios que se reciben en los mercados
primarios, por los fabricantes de los productos en todas las fases del proceso de
producción. Al igual que otros índices, está basado en una muestra.
Los índices de precios al productor se calculan por separado, según la fase de producción
(la cual pude ser: productos terminados, productos intermedios y materias primas) y el
producto. El índice de todos los productos se compone de dos grupos de productos
principales: el índice de productos agrícolas, alimentos y procesados y el índice de
productos industriales.
A diferencia de los índices que miden variaciones en los precios, éste índice mide
variaciones en el volumen físico o en la cantidad de la producción, por eso se dice que es
un índice de cantidad. Este índice es importante porque mide anualmente la producción
en las áreas de manufacturas, minerías y servicios públicos del país. Además manifiesta la
variación de la producción en cada ciclo comercial.
36
En épocas de inflación, este índice de cantidad constituye una medida más confiable de la
producción real de materias primas y bienes terminados que el correspondiente índice de
precios. De manera análoga la producción agrícola se mide mejor con un índice de
cantidad, pues éste elimina los efectos engañosos de la fluctuación de precios.
Cualquiera de los métodos utilizados para determinar los índices de precios pueden
incluirse en el cálculo de los índices de cantidades. Cuando calculamos los índices de
precios, las cantidades son los “pesos”, pero cuando queremos obtener los índices de
cantidad los “pesos” son los precios.
Algunas aplicaciones
El INPC con frecuencia se ve como una medida de la inflación en la economía. Las tasas
anuales de inflación se miden por el cambio porcentual en el IPC de un año al siguiente. Se
calcula de la siguiente manera:
El INPC es con frecuencia la base de los ajustes en las tasas salariales o en los pagos del
Seguro Social. Muchos contratos laborales estipulan que un incremento en el INPC de una
cantidad previamente acordada automáticamente disparará el alza en los niveles salariales.
El INPC también puede utilizarse para deflactar una serie de tiempo. En estos casos el índice
de precios que se utiliza para deflactar una serie se le conoce como índice de deflación.
Deflactar una serie de tiempo es eliminar el efecto de los cambios en el precio y expresa la
serie en “pesos reales”. Hay que diferenciar entre “pesos nominales(o corrientes)” y “pesos
reales(o constantes)”. Si una serie de tiempo tal como el ingreso anual durante varios años,
se expresa en términos de pesos de 1980, por ejemplo, se dice que dicho ingreso es un
ingreso real o que esta expresada en “pesos reales”. Veamos un ejemplo en la siguiente
tabla:
37
Vemos aquí, que el ingreso nominal en 1994 fue de $42,110 e incrementó a $53,500 en 1997.
Esto haría parecer que las cosas están bien financieramente. Pero los precios también han
ido subiendo. Para obtener una medida de cuánto se ha incrementado el ingreso en términos
reales se debe deflactar el ingreso corriente. Esto se logra dividiendo el ingreso nominal entre
el IPC y multiplicando por 100. El resultado es su ingreso real expresado en “pesos reales” de
un año base dado.
Así tenemos que el Ingreso Real es el poder adquisitivo del ingreso monetario, esto es:
Esto quiere decir que si sus ingresos en 1994 fueron de $42,110 equivale a solo $28,414 a
precios de 1980, es decir, que si los precios no hubieran cambiado sólo estaría ganando
$28,414.
Los economistas comúnmente deflactan el producto interno bruto (PIB) para obtener una
medida del incremento de la producción real de la nación. El producto interno bruto es el
valor monetario de todos los bienes y servicios finales producidos por una economía. Al
deflactar el PIB con el tiempo, los economistas eliminan todo incremento debido a la inflación
de precios y llegan a una medida del incremento verdadero en la producción de los bienes y
servicios disponibles para el consumo.
PIB real .- Es una medida del valor de la producción de la nación en pesos reales en algún
período base; omite toda fluctuación o variación debida a los precios cambiantes.
38
UNIDAD 5: Análisis de Decisiones.
En muchas situaciones de la vida real, nos enfrentamos a decisiones que nos pueden llevar
al éxito o al fracaso de lo que queremos llevar a cabo. Sin embargo si contamos con la
información necesaria, adecuada, suficiente y perfecta, nuestra decisión optimizará los
resultados; pero no siempre es así y en ocasiones las decisiones dependen de sucesos o
eventos futuros que no está en nuestras manos controlar (o conocer con certeza) y esto nos
llevará de una u otra forma al fracaso. En la teoría de decisiones debemos decidir entre
varias opciones tomando en cuenta la información que se tiene y como repercute
monetariamente en nuestras acciones.
El primer paso consiste en identificar las opciones que ha de evaluar la persona que decidirá.
Para la empresa de nuestro ejemplo la decisión final consistirá en rentar uno de tres sistemas
de cómputo que difieren en tamaño y capacidad. Las tres opciones de decisión, que se
denotan d1, d2 y d3 son las siguientes:
Por esto, el segundo paso en un análisis de decisiones consiste en identificar los eventos
futuros que pueden presentarse. A estos eventos, que no están bajo el control de quien toma
las decisiones se les denomina estados de la naturaleza. Se supone que dichos estados son
mutuamente excluyentes.
Para nuestro ejemplo, la empresa consideró que la posible aceptación del servicio en el
mercado se podría categorizar en una de dos alternativas: aceptación elevada y aceptación
baja. De modo que los estados de la naturaleza, denominados s1 y s2 son:
Dadas las tres alternativas de decisión y los dos estados de la naturaleza, ¿que sistema de
cómputo debe rentar la empresa?. Para estar en posibilidad de contestar esta pregunta se
39
requiere información respecto a los beneficios correspondiente a cada combinación de una
alternativa de decisión con un estado de la naturaleza.
Estados de la Naturaleza
Alternativas de decisión Aceptación alta Aceptación baja
S1 S2
Rentar un sistema grande d1 $200,000 -$20,000
Rentar un sistema mediano d2 $150,000 $20,000
Rentar un sistema pequeño d3 $100,000 $60,000
Alta $200,000
Grande
Baja -$20,000
Alta $150,000
Mediano
Baja $ 20,000
Alta $100,000
Pequeño
Baja $ 60,000
Utilizando la terminología para los árboles de decisión, a las intersecciones o cruces del árbol
se les llama nodos y a los arcos o enlaces entre los nodos se les denomina ramas . En el
diagrama se les ha enumerado del 1 al 4. Cuando las ramas que salen de un nodo son ramas
de decisión, al nodo se le denomina nodo de decisión (en forma de cuadro). Cuando las
40
ramas que salen de un nodo corresponden a un estado de la naturaleza se les denomina
nodos de estado de la naturaleza (simbolizados con círculos).
Una vez identificados los tres primeros pasos en el análisis de decisiones, la cuestión que se
presenta es: ¿Cómo se puede utilizar de la mejor manera la información presentada en la
tabla de resultados o en el diagrama de árbol para tomar una decisión?. Veremos varios
métodos, según si conocemos las probabilidades de ocurrencia de los eventos futuros o no.
• El método optimista.
En este método se evalúa cada alternativa de decisión en términos del mejor resultado que
puede ocurrir. La alternativa de decisión que se recomienda es la que ofrece la mejor
consecuencia posible. Si las consecuencias son variables deseables que queremos
maximizar (como por ejemplo: beneficios, índices de rentabilidad, participaciones en el
mercado o ingresos por venta) el criterio es maximizar los resultados máximos de cada
alternativa, en cuyo caso a este método se le conoce como Máximax. Si por el contrario las
consecuencias son variables no deseables que queremos minimizar (como costos, pérdidas,
impuestos, rotación de empleados, etc) el criterio es minimizar los resultados mínimos de
cada alternativa y de así que se le conozca como criterio MiniMin.
Para nuestro problema de ejemplo, donde se desea maximizar utilidades, el método optimista
conduciría a elegir la alternativa que corresponde a las utilidades más altas. Como podemos
observar tanto en la tabla de resultados como en el diagrama de árbol, el mejor resultado es
$200,000 que corresponde al arrendamiento de un equipo grande.
• El método conservador
En este método se evalúa cada alternativa de decisión en términos del peor resultado que
pueda ocurrir. Nuevamente si las variables son deseables, la alternativa que se recomienda
es la mejor de las peores consecuencias posibles y se denomina criterio Maximin y si las
variables son no deseables se recomienda la peor de las mejores consecuencias posibles y
se denomina criterio MíniMax.
Para nuestro ejemplo, este método conduciría a elegir la opción que maximiza el valor mínimo
posible de utilidades que puedan obtenerse. Para ilustrar este método, primero se identifica el
resultado mínimo para cada alternativa y de éstos se elige el mayor. Como en nuestro
ejemplo, $ 60,000 es el máximo de los resultados mínimos, se recomienda la alternativa de
arrendar un sistema pequeño.
41
Este método se considera conservador porque se concentra en el peor de los resultados
posibles y después recomienda la alternativa que evita llegar a consecuencias
extremadamente “malas”. Al utilizar este método se garantiza una utilidad de cuando menos
$60,000. Aunque pudiera la empresa obtener utilidades mayores, no es posible que obtenga
menos de $60,000.
Veamos su aplicación con nuestro ejemplo. Supongamos que decidimos rentar un sistema
pequeño y después se sabe que la aceptación de los clientes es alta. De acuerdo con la tabla
de resultados, las utilidades obtenidas son de $100,000. Sin embargo ahora que se conoce
que ha ocurrido la aceptación de los clientes, se observa que la decisión óptima hubiera sido
arrendar el sistema grande que le hubieran reportado utilidades de $200,000. A la diferencia
entre el resultado óptimo ($200,000) y el que se obtiene ($100,000) se le denomina pérdida
de oportunidad o deploración correspondiente a la decisión de arrendar un sistema
pequeño(d3) cuando ocurre la aceptación del cliente(s1). Si se hubiera tomado la decisión d2 y
hubiera ocurrido el estado de la naturaleza s1, la pérdida de oportunidad hubiera sido
($200,000 - $150,000) = $50,000.
42
El siguiente paso al aplicar este método es identificar la pérdida máxima para cada alternativa
de decisión y dentro de éstas se elige la mejor decisión seleccionando la alternativa que
corresponde al mínimo de los valores de la deploración máxima. De ahí el nombre de
deploración minimax. Para nuestro ejemplo, la decisión que se recomienda de acuerdo a este
método es la de arrendar un sistema mediano al que le corresponde la deploración de
$50,000. Si hubieran sido costos las consecuencias, entonces la tabla resultante(de restar al
costo mínimo cada uno de los resultados) se evalúa con el método maximin y se le conoce
como deploración maximin.
Cómo puede observarse cada método recomendó una alternativa diferente, sin embargo la
persona que toma la decisión tendrá que elegir el método más apropiado según la filosofía
que lo sustenta. Las principales críticas a estos métodos es que no consideran las
probabilidades de ocurrencia de cada estado de la naturaleza.
Para nuestro ejemplo de muestra, considérese que se sabe que el estado de la naturaleza de
una aceptación elevada (s1) tiene una probabilidad de .3 y que s2 el estado de la naturaleza de
una aceptación baja tiene una probabilidad de .7, entonces los valores esperados para cada
alternativa serían:
Así que de acuerdo al método del valor esperado, como d 3 tiene el valor esperado más alto,
ésta es la alternativa a recomendar.
También se puede obtener el valor esperado con ayuda del árbol de decisión, poniendo en
cada rama de los estados de la naturaleza, la probabilidad correspondiente.
43
Análisis de Sensibilidad.
En esta sección analizaremos la forma en la que los cambios en las estimaciones de las
probabilidades para los estados de la naturaleza pueden afectar o alterar la decisión que se
recomienda. Al estudio del efecto de estos cambios se le denomina análisis de sensibilidad.
Una forma de hacer este análisis es ir cambiando las probabilidades de los estados de la
naturaleza y volver a calcular el valor esperado para cada una de las alternativas de decisión.
Por ejemplo, si en lugar de considerar P(s1)=.3, la consideramos P(s1)=.6 y P(s2)=.4,
tendríamos los siguientes valores esperados para las tres alternativas:
Esto da lugar a tres ecuaciones lineales que expresan el valor esperado para cada alternativa.
Si graficamos estas tres rectas con p en el eje X y los valores esperados en el eje Y, podemos
realizar el análisis de sensibilidad.
44
Nótese que para valores pequeños de p, la mejor alternativa sería d3 y para valores grandes
la mejor alternativa sería d1. Sin embargo nunca, excepto en la intersección de ellas, la
alternativa d2 se recomienda. Esta intersección puede calcularse gráficamente o resolviendo
el sistema de ecuaciones dos a dos. Hagámoslo con las rectas de las alternativas d 1 y d3 , por
el método de igualación: (Nota: no siempre se cortarán en el mismo punto todas las rectas)
Esto quiere decir, que cuando p= .44 las alternativas 1 y 3 arrojan los mismos valores
esperados. Además sabemos que cuando p< .44 la mejor alternativa es d 3 y cuando p>.44 la
mejor alternativa es d1.
Suponga ahora que la empresa tuviera ahora la oportunidad de llevar a cabo una
investigación de mercado para re-evaluar las probabilidades de los estados de la naturaleza.
Pero si el costo de obtener esta nueva información supera el valor de la misma, este estudio
no se debe llevar a cabo.
Para poder determinar el máximo valor que la empresa debe pagar para obtener información
adicional suponga que la empresa pueda obtener información perfecta respecto a los estados
de la naturaleza, es decir, que la empresa pueda determinar con certidumbre cual estado de
la naturaleza ocurrirá. Para emplear la información perfecta, la empresa debe desarrollar una
estrategia de decisión.
Una estrategia de decisión es una política o una regla de decisión que se debe seguir.
Para calcular el valor esperado de la información perfecta (VEIP), primero debo definir la
estrategia de decisión, que es una regla que especifica que alternativa de decisión se debe
elegir dado cada estado de la naturaleza. De acuerdo con la tabla de resultados de nuestro
ejemplo, podemos plantear la estrategia óptima de decisión que la empresa debe seguir, la
cual considera la información perfecta, de la siguiente manera:
Entonces, ¿cuál es el valor esperado para esta estrategia de decisión?. Como P(s1)=.3 y
P(s2)=.7, esto quiere decir que existe una probabilidad de .3 de ganar $200,000 al elegir d1 y
una probabilidad de .7 de ganar $60,000 al elegir d3. Por lo tanto, el valor esperado de la
estrategia de decisión en la que se utiliza la información perfecta es:
45
Cuando no se disponía de la información perfecta, el método del valor esperado recomendaba
la alternativa d3 , con un valor esperado de $72,000, por lo tanto:
Esto es, el valor esperado sin información perfecta es de $72,000 y con información perfecta,
el valor esperado es de $102,000, por lo tanto, su diferencia $102,000 - $72,000 = $30,000
representa el valor esperado de la información perfecta ( VEIP).
En otras palabras, $30,000 representa el valor adicional que puede obtenerse si está
disponible la información perfecta respecto a los estados de la naturaleza. En términos
generales, una investigación de mercado para obtener la información perfecta sobre los
estados de la naturaleza, no deberán “comerse” este valor adicional que se puede obtener.
Suponga ahora que la información adicional recabada puede emplearse para modificar o
actualizar las probabilidades previas de los estados de la naturaleza. Generalmente esta
información adicional se busca mediante experimentos diseñados para obtener información
muestral. En el caso de nuestro ejemplo, las probabilidades previas fueron: P(s1)=.3 y
P(s2)=.7, las cuales dieron como resultado que la decisión óptima era d 3 con un valor
esperado de $72,000. Además recordaremos que el VEIP= $30,000.
Supongamos que la empresa decide contratar una investigación de mercados para estudiar la
posible aceptación potencial del servicio, Con esta nueva información, combinada con las
probabilidades previas, se podrán obtener nuevas estimaciones de probabilidades para los
estados de la naturaleza. A estas probabilidades modificadas, se les conoce como
probabilidades posteriores. A la nueva información que se obtiene mediante investigación o
experimentación se le denomina indicador o información muestral, pues es obtenida a partir
de una muestra.
Usando el término Indicador, pueden identificarse dos resultados del estudio de mercado:
Las nuevas probabilidades son de la forma P(sj/Ii), es decir, son probabilidades condicionales
de que ocurra el estado sj dado que ocurrió el Indicador i.
Como recordaremos, según el teorema de Bayes, es necesario conocer las probabilidades
P(Ij/si), pues P(si/Ij) =P(Ij/si)P(si)/P(Ij)
46
Estado de la naturaleza Reporte de Investigación de mercado
Favorable (I1) Desfavorable(I2)
Obsérvese que estas probabilidades indican que puede asignarse un buen grado de
confianza al reporte de investigación de mercados, pues cuando el verdadero estado de la
naturaleza es s1 , el reporte de investigación será favorable el 80% de las veces y
desfavorable solamente el 20%. De igual manera cuando el verdadero estado de la naturaleza
es s2 , el reporte hace la indicación correcta el 90% de las veces.
Una estrategia de decisión es una política o regla de decisión que la persona que decide debe
seguir. En el caso de nuestro ejemplo, con el estudio de investigación de mercado, la
estrategia de decisión es la regla que recomienda una decisión determinada con base en si el
reporte de investigación de mercado es favorable o desfavorable. Para determinar cuál es la
estrategia decisoria óptima se utiliza un análisis de árbol de decisión.
47
Alta (s1)
$200,000
Grande (d1)
Baja (2)
-$20,000
Alta (s1)
Mediano (d2) $150,000
Favorable (I1)
Baja (2)
$20,000
Alta (s1)
Pequeño (d3) $100,000
Baja (2)
$60,000
Alta (s1)
Grande (d1) $200,000
Baja (2)
-$20,000
Baja (2)
$20,000
Baja (2)
$60,000
Como puede observarse el valor esperado de la estrategia de decisión óptima, bajo estas
circunstancias es:
VE(nodo 1) = P(I1)VE(nodo 2) + P(I2) VE(nodo 3)
= P(I1)[ Max (P(s1/I1)(200,000)+P(s2/I1)(-20,000),........)] +
P(I2)[ Max (P(s1/I2(200,000)+P(s2/I2)(-20,000),........)]
= $ 90, 402
De aquí podemos concluir que la óptima estrategia de decisión si se lleva a cabo el estudio de
investigación de mercado es:
Si Entonces
Reporte favorable Arrendar el sistema grande
Reporte desfavorable Arrendar el sistema pequeño.
48