1Estad-Probab UD GesPro 2011-3 Entrega7

DOS VARIABLES ALEATORIAS DISCRETAS
Si X puede asumir valores x1, x2, x3, … , xn

y Y puede asumir valores y1, y2, y3, … , ym
La función masa de probabilidad conjunta del

evento X = xi y Y = yj esta dada por
Los conceptos tratados se pueden generalizar a p ( xi , y j )  P ( X  xi , Y  y j )

dos o mas variables, sean ellas discretas o
continuas. Mirar el comportamiento conjunto. Donde debe cumplir las dos condiciones:
i) p(x, y)  0 ii)  p(x, y)  1
x y
Ejemplo: X:= Numero de caras obtenidas en los 2 primeros lanzamientos
Experimento: Lanzar una moneda 3 veces S X: S  Reales Reales

CCC CCC 2 2
S= {(C,C,C), (C,C,S), (C,S,C), (C,S,S), CCS CCS 2 2 Imágenes de
(S,C,C), (S,C,S), (S,S,C), (S,S,S)} CSC CSC 1 1 cada uno de
CSS CSS 1 1 los puntos
Definimos dos variables aleatorias: SCC SCC 1 1
muestrales por
causa de la
SCS SCS 1 1 variable
X:= Numero de caras obtenidas en los 2 primeros
SSC SSC 0 0 aleatoria X
lanzamientos
SSS SSS 0 0
Y:= Numero de caras obtenidas en los 2 últimos Tenemos el Conjunto imagen X(S) = {0,1,2}
lanzamientos.
1
Y:= Numero de caras obtenidas en los 2 últimos lanzamientos La distribución de las dos variables aleatorias X, Y a la vez
S X: S  Reales Reales
La probabilidad de que las dos variables tomen cada una un
CCC CCC 2 2 punto de su conjunto imagen.
CCS CCS 1 1 Imágenes de
CSC CSC 1 1 cada uno de
Y
CSS CSS 0 0 los puntos 0 1 2
X
muestrales por
SCC SCC 1 2
causa de la 0 P(X=0, Y=0) P(X=0, Y=1) P(X=0, Y=2)
SCS SCS 1 1 variable
SSC SSC 0 1 aleatoria Y 1 P(X=1, Y=0) P(X=1, Y=1) P(X=1, Y=2)
SSS SSS 0 0
2 P(X=2, Y=0) P(X=2, Y=1) P(X=2, Y=2)
Tenemos el Conjunto imagen Y(S) = {0,1,2}
. .
SUMAR las probabilidades DE TODOS los puntos muestrales

Y así sucesivamente llenamos los demás espacios,
de S que tienen como imagen por X el valor xi y también como obteniendo:
imagen por Y el valor yi
P(X=0, Y=0) = P ({(S, S, S)}) = 1/8
Para hallar la P(X=0, Y=0) debemos buscar los puntos P(X=0, Y=1) = P({(S,S,C)}) = 1/8
muestrales que a la vez tengan como imagen por X el punto P(X=0, Y=2) = P(ø) =0.
cero y como imagen por Y el punto cero.
P(X=1, Y=0) = P({(C,S,S)}) = 1/8
Al observar las tablas que definen estas dos variables
P(X=1, Y=1) = P ({(C, S, C)}) + P({(S,C,S)})
aleatorias tendríamos que lo cumplen {(S,S,S)} y ningún otro = 1/8 + 1/8 = 2/8
punto. P(X=1, Y=2) = P ({(S, C, C)}) = 1/8
P(X=2, Y=0) = P (ø) = 0
Luego P(X=0, Y=0) = P({(S,S,S)}) = 1/8 (Favorables / P(X=2, Y=1) = P ({(C, C, S)}) = 1/8
Posibles) P(X=2, Y=2) = P ({(C, C, C)}) = 1/8
2
Para verificar si forma una distribución de
La distribución de probabilidad conjunta de X y Y probabilidad conjunta debemos observar las dos
quedaría: condiciones:
Y a. _ P ( X  xi , Y  y j )  0
0 1 2
X n m
0 1/8 1/8 0 b. _   P( X  x , Y  y i j ) 1
i 1 j 1
1 1/8 2/8 1/8
2 0 1/8 1/8 La primera condición se cumple ya que todas las
probabilidades en el interior de la tabla son ≥ 0
DOS VARIABLES ALEATORIAS CONTINUAS

Las funciones masa de probabilidad marginal de X y
La función de densidad de probabilidad conjunta
de Y están dadas por
f(x,y) de dos variables aleatorias continuas X y Y, y
que cumplen los axiomas básicos, esta dada por
PX ( x)   p( x, y) b d
y
P( X , Y )    f ( x, y )dxdy
a c
PY ( y)   p( x, y) En donde a, b, c, y d, conforman un rectángulo de tal

x forma que:
a  x  b, c  y  d
3
Método estadístico por medio del
Las funciones de densidad de probabilidad marginal cual se definen los criterios y
de X y de Y están dadas por técnicas que deben orientar el
proceso de recolección u obtención

de información
f X ( x)   f ( x, y)dy

con    x   i. El procedimiento de selección de la muestra y
su tamaño depende de los objetivos de la
 investigación.
fY ( y )   f ( x, y)dx

con    y   ii. Las poblaciones son en lo general diferentes
y por lo tanto, deberán utilizarse criterios
distintos para seleccionar las unidades bajo
estudio.
Marco: Lista de
unidades
muestrales para En el m.a.s. existe diferencia si la población es finita
MUESTREO ALEATORIO SIMPLE
un estudio. La o infinita.
Población homogénea de tamaño N. muestra es
aleatoria para Finita: enumerar los individuos que hacen parte de
Cada elemento tiene la misma probabilidad de ser
seleccionar la población (ejemplo de 1 a 2500). Se saca una tabla
elegido en la muestra. unidades del
marco
de aleatorios. Se cuentan de cuatro cifras todo lo que
Procedimiento: este de 2500 para abajo es valido los demás se
Ejemplo: en
Identificar el marco muestral ignoran. Así hasta completar 30 números. Pueden restaurante
Seleccionar aleatoriamente n números de emplearse paquetes de software (Excel). tomar el
entre 1 a N. individuo
Infinita: cada situación debe ser especial y cada
Rifa simple o números aleatorios. que llega
elemento debe seleccionarse independientemente. después de
Identificar los números seleccionados en el
alguien que
marco. tenga
gafas.
4
MUESTREO ALEATORIO ESTRATIFICADO MUESTREO POR CONGLOMERADOS
Población compuesta por varios grupos. Cuando no se tiene un marco de unidades elementales.
Grupos bien identificados (estratos). Aparecen naturalmente agrupados.
Los individuos pertenecen solo a un estrato. A estos grupos se les llama conglomerados.
Mejor cuando la varianza entre elementos de cada Mejor cuando cada conglomerado proporciona una
estrato es relativamente pequeña representación a menor escala de la población.
Procedimiento: Procedimiento:
N tamaño de la población Marco de conglomerados 1, 2, …, M.
L número de estratos Seleccionar muestra aleatoria de m conglomerados.
N = N1 + N2 + … + NL Conglomerado seleccionado obtener un marco de las
Nh el número de elementos en el h-ésimo estrato. Mi unidades, i = 1,2,…,m.
Determinamos n y los distribuimos en los L estratos. Censar cada conglomerado.
(Asignación proporcional o Asignación por variabilidad)
MUESTREO SISTEMATICO MUESTREO NO ALEATORIO

Poblaciones ordenadas físicamente en filas, Muestras aleatorias no representativas.
gavetas o en el tiempo. Cuando se tiene conocimiento de la población es
Se aprovecha el orden y se hace una selección posible seleccionar muestras aleatorias bastante
sistemática. representativas.
Procedimiento:
La población de tamaño N se divide en n Muestras a Juicio: Muestras por cuotas:
grupos de tamaño, k. N  nk Un experto de la población Se establecen en términos
De los primeros k elementos, se selecciona puede garantizar de algunas variables.
uno aleatoriamente. representatividad. Las cuotas se dan a los
El resto de los elementos se obtienen No necesita ser muy trabajadores de campo o
sistemáticamente. grande para ser de calidad. encuestadores.
Tomando el elemento j + ik La experiencia garantiza
j es el lugar elegido entre los primeros k e i = una buena información.
1, 2, … , (n-1)
5
CASO: En la empresa SENSOR Ltda. el director
ESTIMACION PUNTUAL de personal suministra sueldo medio anual
de los 2500 administradores y la
Una estimación puntual es un procedimiento proporción de los que se han capacitado.
(formula) que se utiliza para calcular un estimador
puntual de un parámetro poblacional, a partir de un Los parámetros poblacionales brindados son:
estadístico muestral. Media poblacional: = $51.800
Desviación estándar poblacional: σ= $ 4.000
A la media muestral x̅ se le conoce como el estimador Proporción (de capacitados): p= 1.500/2.500=0,60
puntual de la media poblacional .
Se emplean los datos de una muestra de 30
A la desviación estándar muestral s se le conoce como
administradores obteniéndose:
el estimador puntual de la desviación estándar
Media muestral: x̅ = $51.814
poblacional σ.
Desviación estándar muestral: s= $ 3.348
Proporción (de capacitados): p̅= 19/30=0,63
Salario anual medio($) Frecuencia Frecuencia relativa

DISTRIBUCIONES MUESTRALES
49500-49999 2 0,004
Para el caso anterior tomamos otra muestra de 30 50000-50499 16 0,032
administradores, y obtenemos: 50500-50999 52 0,104
Media muestral: x̅ = $52.670 51000-51499 101 0,202
51500-51999 133 0,266
Desviación estándar muestral: s= $ 3.465 52000-52499 110 0,220
Proporción (de capacitados): p̅= 0,70 52500-52999 54 0,108
53000-53499 26 0,052
Existe diferencia con la anterior y desde luego que 53500-53999 6 0,012
sucederá al repetirse el proceso una y otra vez. Total: 500
Si tomamos 500 muestras, y realizamos una Como los valores que ha tomado x̅ son resultado de distintas
agrupación (distribución de frecuencias e muestras aleatorias simples, a esta distribución de
probabilidad se le conoce como:
histograma) de los valores obtenidos de medias (x̅ )
vemos su comportamiento. Distribución muestral de x̅
6
Pero como el valor esperado de las medias muestrales
Distribución Muestral de x̅ es igual a la media de la población de la que se
E x   
tomaron las muestras, tenemos…
Es la distribución de probabilidad de todos los
valores de la media muestral de x̅, la cual es una
variable aleatoria. Desviación estándar de x̅
(conocida como error estándar)
Propiedades
Depende de si la población es finita o infinita
Como se ha observado en anteriores distribuciones
de probabilidad, todas tienen un valor esperado, una Población finita Población infinita
desviación estándar y una forma característica.
N n    También se
x    x  aconseja usar esta
Valor esperado de x̅ (conocido como gran media X̿) N 1  n  n
para finita si:
Se calcula de la forma usual
(sumar las medias y dividir por E  x   x 
 x Se conoce como factor
de corrección para pobl.
N n
n
N
 0,05
k N 1
finitas
la cantidad de muestras (k):
La demostración del
TLC requiere
Forma de la distribución muestral de x̅ observaciones
independientes en la
muestra. Esta
Si la población tiene distribución normal, su condición se
distribución muestral de x̅ está distribuida satisface cuando se
normalmente sea cual fuere su tamaño. trata de poblaciones
infinitas y cuando se
Si la población NO tiene distribución normal, su trata de poblaciones
finitas y el muestreo
distribución muestral de x̅ es comprensible por el se hace con
TEOREMADEL LÍMITE CENTRAL, reemplazo. Aunque el
TLC no se refiere
el cual indica que … a medida que n se vuelve mas directamente a
grande, la distribución de las medias muestrales se muestreos sin
remplazo de
aproximará a una distribución normal con una media poblaciones finitas se
 aplican los hallazgos
x y error estándar x  del TLC cuando la
población es de
n tamaño grande.
7
VALOR PRÁCTICO CASO: TIGOMEX registró mensajes telefónicos para
DE LA DISTRIBUCIÓN MUESTRAL DE x̅ sus clientes los cuales promediaron en 150
segundos y con una desviación de 15 segundos.
Las mediciones obtenidas de una muestra sirven para
la toma de decisiones pero que mejor que tomarlas de La probabilidad de que una sola llamada dure entre
varias que en conjunto se parecen más a las 150 y 155 segundos es: x   155  150
características de la población. Z   0,33
 15
Según la tabla al punto 0,33 le corresponde un 0,6293
Como la distribución muestral de las medias tiene
por tanto P(150 ≤ X ≤ 155) = 0,6293 – 0,5 = 0,1293
comportamiento normal, también se trabaja con
puntos tipificados pero ajustados, así:
X 
Z
x
TIGOMEX desea ahora conocer la probabilidad de RELACION ENTRE EL TAMAÑO DE LA MUESTRA

que la media de n = 30 llamadas esté entre 150 y 155 Y LA DISTRIBUCIÓN MUESTRAL DE x̅
segundos. X   155  150
Z  15  1,83 Considerando en el caso TIGOMEX un n = 50 para
x llamadas entre 150 y 155 segundos.
30
Según la tabla al punto 1,83 le corresponde un 0,9663 Como la gran media E(x̅) =  independientemente del
por tanto P(150 ≤ X̅ ≤ 155) = 0,9663 – 0,5 = 0,4663 tamaño de la muestra, pero el error estándar si está
relacionado con el tamaño de la muestra, aplicamos:
La gran diferencia
X  155  150
en las P se debe al Z   2,36 Según la tabla al punto
x 15
hecho de que las 50 2,36 le corresponde un
medias muestrales 0,9909 por tanto P(150
están menos dispersas que las observaciones ≤ X̅ ≤ 155) = 0,9909 –
individuales y que las X̅s están mas compactas 0,5 = 0,4909
alrededor de  = 150.
8
La proporción
muestral de
Distribución muestral de p̅ es el estimador
puntual de la
Entonces, aumentando el tamaño de la muestra n, de proporción
30 a 50 llamadas, la probabilidad de obtener una Es la distribución de probabilidad de todos los poblacional p.
m.a.s. que esté a la derecha en 5 llamadas de la media posibles valores de la proporción muestral de p̅, la
poblacional aumenta de 0,9663 a 0,9909. cual es una variable aleatoria.
Propiedades
El punto importante es que cuando aumenta el También tienen un valor esperado, una desviación
tamaño de la muestra, el error estándar de la media estándar y una forma característica.
disminuye. Una muestra de mayor tamaño
proporciona mayor probabilidad de que la media Valor esperado de p̅
muestral esté dentro de una distancia determinada de
Se calcula de la forma usual
la media poblacional.
(sumar las proporciones y dividir E p 
p
por la cantidad de muestras (k): k
Al igual que
Pero como el valor esperado de las proporciones en las medias
muestrales la
TÉCNICAS DE PRONÓSTICO
muestrales es igual a la proporción poblacional (de diferencia esta
i. Modelos Cualitativos
E p   p
donde se tomaron las muestras), tenemos… en el factor de
corrección .
Subjetivo, sentencioso; basado en estimaciones y opiniones
Desviación estándar de p̅ N n
N 1  Método Delphi: Grupo de expertos responden un
Depende de si la población es finita o infinita Al igual que
cuestionario.
en las medias  Investigación de mercado: Encuestas, entrevistas.
Población finita Población infinita muestrales se  Consenso grupal: intercambio abierto entre
distingue como
N n p(1  p) p(1  p) profesionales.
p  p  error estándar
N 1 n n de la  Analogía histórica: Vincula el pronóstico con un
proporción
También se aconseja artículo similar.
usar esta para finita  Niveles inferiores: Datos obtenido del front line en
si: n contacto con mercado
 0,05
N
9
ii. Análisis de series de tiempo
Serie de Tiempo es un conjunto de observaciones sobre
valores que toma una variable (cuantitativa) en diferentes
momentos del tiempo. Uso de la historia de sucesos durante
un período para hacer un pronóstico:
Promedio móvil simple: promedio de datos en un

determinado período
Promedio móvil ponderado: Ponderación relativa de los
datos, según la experiencia
Suavizamiento exponencial: Suavizamiento de los datos,
reduciendo el peso de los datos menos vigentes
Análisis de regresión
Descomposición de los datos de series de tiempo

Promedio móvil simple
• La Demanda no presenta bruscos cambios de
tendencia
• No posee características estacionales
• Ayuda a eliminar fluctuaciones aleatorias del
pronóstico
• Empleo de períodos breves:
– oscilaciones, tendencia mas cercana
• Empleo de períodos largos:
– regularidad en respuesta, rezago en tendencia
• Inclusión de todos los datos individuales
• Igualdad a cada componente
10
Se utiliza la fórmula: t Ejemplo
 Di
i ( t  n 1)
Periodo Demanda Promedio movil Pronostico Ft Error
Ft 1 
Dt PM para n=3 Ft-Dt
1 10
n 2 18
t numero de periodo actual 3 29 19
n número de periodos anteriores a tener en 4 15 20.7 19 4.0
cuenta en el promedio móvil (Conocido como 5 30 24.7 20.7 - 9.3
el “orden” del promedio móvil)
Ft+1 Pronostico para el próximo periodo 6 12 19 24.7 12.7
Di Hechos ocurridos (Demanda real) en el 7 16 16 19 3.0
periodo i
Pronóstico basado en promedio móviles: 3 y Pronóstico basado en promedios móviles: 3 y 9 semanas

9 semanas
Semana Demanda n=3 n=9 Semana Demanda n=3 n=9
1 1800 16 1700 2200,0 1811,1
2 1400 17 1800 2000,0 1800,0
3 1000 18 2200 1833,3 1811,1
4 1500 1400,0 19 1900 1900,0 1911,1
5 1500 1300,0 20 2400 1966,7 1933,3
6 1300 1333,3 21 2400 2166,7 2011,1
7 1800 1433,3 22 2600 2233,3 2111,1
8 1700 1533,3 23 2000 2466,7 2144,4
9 1300 1600,0 24 2500 2333,3 2111,1
10 1700 1600,0 1477,8 25 2600 2366,7 2166,7
11 1700 1566,7 1466,7 26 2200 2366,7 2266,7
12 1500 1566,7 1500,0 27 2200 2433,3 2311,1
13 2300 1633,3 1555,6 28 2500 2333,3 2311,1
14 2300 1833,3 1644,4 29 2400 2300,0 2377,8
15 2000 2033,3 1733,3 30 2100 2366,7 2377,8 Mientras mas largo sea el periodo en que se hace el promedio, mas lenta es la
respuesta ante los cambios a la demanda
11
A F A F
PROMEDIO PRONOSTICO error
AÑO PERIODO CLIENTES n=3 n=3 n=3 error absolu cuadrado error PROMEDIO PRONOSTICO error
AÑO PERIODO CLIENTES n=4 n=4 n=4 error absolu cuadrado error
2002 1 200
2002 1 200
2003 2 208
2004 3 192 200,0 2003 2 208
2005 4 181 193,7 200,0 -19,0 19,0 361,0 2004 3 192
2006 5 204 192,3 193,7 10,3 10,3 106,8 2005 4 181 195,3
2007 6 215 200,0 192,3 22,7 22,7 513,8 2006 5 204 196,3 195,3 8,8 8,8 76,6
2008 7 205 208,0 200,0 5,0 5,0 25,0 2007 6 215 198,0 196,3 18,8 18,8 351,6
2009 8 210 210,0 208,0 2,0 2,0 4,0 2008 7 205 201,3 198,0 7,0 7,0 49,0
2009 8 210 208,5 201,3 8,8 8,8 76,6
PROMEDIO 4,2 16,0 202,1
10,8 10,8 138,4
A F Promedio móvil ponderado

PROMEDIO PRONOSTICO error cuadrado
AÑO PERIODO CLIENTES n=2 n=2 n=4 error absolu error
 Un refinamiento de la aproximación del promedio
2002 1 200 móvil es ponderar el dato más nuevo (o el dato más
2003 2 208 204,0 viejo) más fuertemente, en lugar de utilizar pesos
2004 3 192 200,0 204,0 -12,0 12 144,0 iguales.
2005 4 181 186,5 200,0 -19,0 19 361,0
2006 5 204 192,5 186,5 17,5 17,5 306,3 • Comúnmente podemos pensar que el dato más
2007 6 215 209,5 192,5 22,5 22,5 506,3 moderno es el mejor indicador de dónde se dirigen los
2008 7 205 210,0 209,5 -4,5 4,5 20,3 datos, y que los demás datos previos tienen un nivel
2009 8 210 207,5 210,0 0,0 0 0,0 decreciente de importancia.
0,8 12,583 223,0
12
En promedio móvil ponderado, podríamos utilizar diferentes
combinaciones de pesos.
Realmente un promedio móvil simple es un promedio Para un caso de orden cuatro tendríamos por ejemplo:
ponderado en el que se considera que el peso de todos w1 w2 w3 w4
los datos es igual. Combinación 1 0,10 0,20 0,30 0,40
Combinación 2 0,20 0,20 0,25 0,35
Por ejemplo en un promedio móvil simple de orden Combinación 3 0,05 0,10 0,25 0,60
cuatro, podemos considerar que el peso para cada uno
de los cuatro datos es 0,25 es decir que todos los datos (Nótese que todas suman 1).
pesan igual.
Aplicando el primer conjunto de pesos 0,10, 0,20, 0,30 y
Ejemplo: 0,40 a cuatro períodos de datos, obtenemos el pronóstico
así: F  0,10 D  0,20 D  0,30 D  0,40 D
F5  0,25 (180 )  0,25 (205 )  0,25 (210 )  0,25 (195 ) 5 1 2 3 4
La constante de suavizado  puede ser interpretada como un

Suavización Exponencial peso al último dato (por ejemplo, al actual) .
Se basa en la idea de que es posible calcular un Pronostico nuevo
El remanente del peso (1-  ) se aplica al último pronostico.
a partir de un Pronostico anterior y también del ultimo dato
Ft 1   Dt  1    Ft
observado.
Ft 1   Dt  1    Ft
El nombre de suavizado exponencial deriva del hecho de
t numero de periodo actual
que los pesos declinan exponencialmente a medida que
Dt Demanda real en el periodo actual t
los datos sean más y más viejos.
Ft Pronostico para el periodo actual
Ft+1 Pronostico para el próximo periodo
Este modelo no elimina ninguna información pasada,
 Constante de suavización exponencial (o atenuación)
simplemente ajusta los pesos dados a los datos pasados
Con la condición que: 0 <  < 1
de tal forma que, mientras mas viejos son los datos menos
peso reciben.
13
Cuanto más alto sea el peso asignado a la demanda Ft 1   Dt  1    Ft
actual, mayor será la influencia que este dato tendrá en el
pronóstico.   Dt  Ft   Ft
Ft 1   Dt  1    Ft
 Ft   Dt   Ft
Por ejemplo, si  es 1, el pronóstico de demanda del
próximo período será igual al valor de la demanda actual. Ft 1  Ft   Dt  Ft 
Ft 1  1 Dt  1  1 Ft Ft 1  1Dt  0  Ft (At – Ft ) representa el error de pronóstico hecho en el
período t.
Cuanto más cercano sea el valor de  a 0, más cercano
El nuevo pronóstico para el período t + 1 es igual al
será el pronóstico del período previo para el período
viejo pronóstico más cierto porcentaje del error
presente.
(dado que  está entre 0 y1).
Ft 1  0 Dt  1  0 Ft Ft 1  0 Dt  1 Ft
Selección del valor apropiado de  Selección del valor apropiado de 

Nuestro objetivo en el pronóstico exponencial es elegir el El valor de  es crítico para obtener buenos pronósticos, y
valor de  que nos de los mejores pronósticos. si se selecciona un valor grande de  , el pronóstico será
muy sensible respecto al valor de la demanda real.
Los pronósticos que siempre tienden a ser demasiado altos Con un valor grande de  , un suavizado exponencial hará
se dice que están sesgados positivamente y si son que el pronóstico reaccione rápidamente a las
demasiado bajos se dice que están sesgados fluctuaciones en la demanda.
negativamente.
Por el contrario, un valor pequeño de  pesa los datos
Cuando se yerran los pronósticos, los costos de operación históricos más que la demanda presente y hará que el
serán innecesariamente altos debido a la capacidad ociosa pronóstico no reaccione rápidamente a cambios en los
si el pronóstico es alto (sesgo positivo) y a la capacidad datos, o sea, el modelo de pronóstico será de alguna
insuficiente (horas extra, etc.) si el pronóstico es bajo manera insensible a las fluctuaciones en los datos
(sesgo negativo). presentes.
14
Selección del valor apropiado de  Selección del valor apropiado de 
Los valores grandes de  se utilizan en general en las Se aconseja utilizar un valor de  bajo cuando los datos
situaciones en las cuales los datos siguen una pauta están sujetos a un alto grado de variación. Esta situación
suave, es decir exhiben Poca Variación. dará como resultado un pronóstico que sobrerreaccionará
constantemente a los cambios en la demanda más
reciente.
Selección del valor apropiado de  Ejemplo

Periodo Demanda Pronostico Ft Error
Al igual que en los Promedios simples y ponderados, los n Dt con = 0.1 Ft-Dt
los definíamos inicialmente a nuestro parecer, el valor 15 5.0
1 10
apropiado de  se determina generalmente también por
medio de prueba y error. 2 18 14.5 -3.5
3 29 14.85 -14.15
Los valores usuales caen en el rango de 0,01 a 0,30.
4 15 16.26 1.26
Un método para seleccionar el mejor valor es 5 30 16.14 -13.86

probar algunos valores con los datos históricos 6 12 17.62 5.52
existentes (o con una porción de los datos) y elegir
el valor que minimiza los errores promedio de 7 16 16.97 0.97
los pronósticos.
15
Con F1+1 =  (D1)+ (1–) F1 Errores en el Hacer Pronósticos
Error nos refiere: Diferencia entre el valor del pronostico y
Para t = 1 tenemos: lo ocurrido en realidad, o viceversa. Para la continuación
de nuestro curso lo relacionaremos de esta forma, es decir
F2 = 0,1 (10) + (1 – 0,1) 15 (Ft-At)
= 1 + (0,9) 15 = 14, 5 Pero cuando el valor del pronostico se ubica dentro de

límites confiables, (Ver en medición de error más
Para t = 2 tenemos: adelante), en realidad no se trataría de un error, a pesar
de que comúnmente se le denomine así.
F3 = 0,1 (18) + (1 – 0,1) 14,5
La demanda de un producto es generada por la
= 1,8 + (0,9) 14,5 = 14,85 interacción de una serie de factores demasiado compleja
como para que un modelo la describa con exactitud. Por lo
Y así sucesivamente… tanto, todos los pronósticos tienen cierto grado de error.
Medición del error Medición del error

Existen diversos Métodos para medir el error, como son:
1. Error medio (o Sesgo) 3. Error cuadrado medio n
 ( Ft  Dt )
n
 ( Ft  Dt )
2
ME( Sesgo)  i 1 MSE  i 1
n n
2. Desviacion absoluta media 4. Desviacion tipica de los errores

n n
 F D t t  (F  D ) t t
2
MAD  i 1
SDE  i 1
n n 1
16
Medición del error Medición del error
5. Error porcentual 7. Error porcentual absoluto medio

D  Ft
PEt  t *100 n
Dt  PE i
MAPE  i 1
n
6. Error porcentual medio
n
 PE i
MPE  i 1
n
Aunque son muy similares en apariencia, estas dos

Medición del error variables miden efectos de pronóstico muy diferentes.
Inicialmente trabajaremos con los dos primeros métodos:

Desviación Absoluta Media
1. Error medio (o Sesgo) n n
 ( Ft  Dt ) F A
Dado que MAD suma
sólo valores absolutos t t
ME( Sesgo)  i 1
de error, se adicionan a MAD  i 1
n la sumatoria tanto los n
errores positivos como
2. Desviacion absoluta media los negativos y se El gerente podría utilizar esta
información para decir: "Nuestros
n determina el tamaño pronósticos tienen una aproximación
 F D t t
promedio del error.
Esto le da al gerente una
del 10 %, es mejor
mantengamos un stock extra de
que
MAD  i 1
idea de la precisión del más o menos el 10 % para
n modelo de pronóstico. prevenirnos contra este error
potencial".
17
Error Medio o Sesgo MAD y Sesgo
MAD muestra sólo el tamaño promedio del error.

El sesgo, por otro lado, n
indica si el pronóstico  ( Ft  At) El Sesgo muestra el error promedio total y su dirección.

típico es o demasiado ME( Sesgo)  i 1
bajo o demasiado alto. n

Como dijimos, el mejor pronóstico exhibirá el menor
error.
Sabiendo esto, el gerente podría decir: "En promedio,
Sin embargo, dado que MAD y sesgo proveen cada uno
estamos pronosticando un 10 % demasiado alto,
una visión diferente de los errores de pronóstico, a
podríamos comprar entre el 5 y 10 % menos para
veces es deseable utilizar ambas medidas para evaluar
protegernos de este error".
métodos alternativos de pronóstico
Ejemplo: MAD y Sesgo

A modo de ilustración, supongase que se prueban dos MAD para el método A será
métodos de pronóstico contra los datos de demanda de
un período de 4 meses. 105  103  107  106  109  106  109  111   2
4
Definimos que las demandas reales son 103, 106, 106, y
111. y el sesgo será
El método A nos arroja un pronóstico de enero a abril de 105  103  107  106  109  106  109  111  1
105, 107,109, y 109, respectivamente. 4
El método B nos arroja un pronóstico de enero a abril de Por lo tanto, MAD indica que el error promedio de pronóstico
108,107,105, y 106, respectivamente. utilizando el método A es 2, y el sesgo de +1 indica que el
pronóstico tiende a exceder la demanda.
18
MAD y Sesgo El cociente entre el sesgo y la MAD a veces se llama
"señal de seguimiento" en ciertos modelos adaptativos
MAD para el método B será de pronóstico.
108  103  107  106  105  106  106  111   3 SEÑALdeSEGUIMIENTO

SESGO
4 MAD
y el sesgo será
108  103  107  106  105  106  106  111  0 Los modelos adaptativos de pronóstico se auto—ajustan
4 cuando una señal de seguimiento se torna muy grande.
Con el método B, los errores de pronóstico se cancelan entre sí, lo
que resulta en un sesgo nulo. Dado que esta razón puede ir sólo de —1 a +1, su valor
Sin embargo, examinando el MAD indica que aunque no hay absoluto se utiliza como la constante de suavi-zación, 
sesgo, los pronósticos desarrollados son menos precisos que los
generados utilizando el método A.
Las razones que se aproximan a —1 indican que TALLER 1:

todos o la mayor parte de los errores tienden a ser
negativos (por ejemplo, los pronósticos tienden a ser Utilizar el suavizado exponencial para pronosticar los
muy bajos). servicios de emergencia en la clínica Colombia de
Colsánitas, teniendo en cuenta dos constantes de
Las razones que se aproximan a +1 indican que todos suavizado diferentes,  de 0,1 y 0,3.
o la mayor parte de los errores tienden a ser positivos.
Calcule Pronosticos, errores, MAD y sesgo para
De cualquier manera, cuando la señal de seguimiento determinar cuál pronóstico es el mejor, así como la
se acerca a —1 o a +1,  automáticamente se señal de seguimiento.
incrementa, haciendo que el modelo responda más y
(se espera) lleve a menos errores de pronóstico.
19
Año desde
apertura Trimestre
Período
Numero
A
Real
Pronóstico
0,1
Pronóstico
0,3
F2   A1  1   F1
 0,1 * 3.500  1  0,1 * 3500
1 1 1 3500 3500 3500
2 2 8000 3500 3500
3 3 5500 3950 4850
2
4
1
4
5
10000
4500
4105
4695
5045
6532
 350  0,9 * 3.500
 3.500
2 6 6000 4675 5922
3 7 3000 4808 5945
4 8 5500 4627 5062
3 1 9 5000 4714 5193
2 10 9500 4743 5135
3
4
11
12
7500
15000
5218
5447
6445
6761 F3  0,1* 8.000  0,9 * 3.500
4 1 13 13500 6402 9233
2 14 17500 7112
8151
10513
12609
 3.950
Como puede verse, F15, el pronóstico para el trimestre Las señales de seguimiento son ambas bastante altas
siguiente utilizando cada uno de los valores es 8.151 y (cercanas a +1 ó —1), indicando que existe un
12.609, una diferencia considerable. problema.
Como indican los cálculos de MAD, el error es bastante En general, si los valores de  mayores de 0,3 parecen
grande con ambos valores de , aunque 0,3 parece ser dar mejores resultados, probablemente no debería
el mejor. utilizarse el pronóstico exponencial.
El gran valor negativo del sesgo indica que gran parte Un modelo simple de suavizado es mejor en la
del error es debido al sesgo negativo del modelo, o sea situaciones donde la demanda fluctúa alrededor de una
que el pronóstico "va detrás" o es muy bajo, lo que es tendencia.
una característica de los modelos simples de pronóstico
exponencial. Otros modelos son generalmente más apropiados si la
tendencia es creciente o decreciente.
20
La línea de regresión lineal tiene la forma:
ANALISIS DE REGRESION LINEAL
Los dos métodos anteriores pronostican datos que no
Y  a  bX
tienen una tendencia marcada, es decir, son estables Donde:
La Regresión es la relación funcional de dos o mas y: es la variable dependiente
variables correlacionadas. x: es la variable independiente
a: es la intercepción con y
Referenciamos esta relación a partir de datos b: es la pendiente
observados.
En el análisis de series de tiempo, X representa las
Se grafican los datos para observar si los datos o una unidades de tiempo.
parte de ellos se presentan en forma lineal.
La principal restricción es que presupone que los datos Para hacer uso de esta ecuación se hace necesario
del pasado y las proyecciones del futuro quedan
aproximadamente en línea recta. conocer b0 y b1.
De ahí el concepto básico de TENDENCIA: Utilizamos para hallar b1: DONDE:
( ty)  nt y
b0 : intercepción con eje Y
Si definimos a:
b1  b1 : pendiente de la línea
T como la variable dependiente (TENDENCIA)
t: como la variable independiente (VALOR EN LA SERIE)

( t )  n(t ) t
2 2 y : Promedio de todas las y
: Promedio de todas los t
t :Valor de t en cada punto de
b0: como la intercepción con T … y para hallar b0: los datos
b1: como la pendiente
b  y bt y :Valor de y en cada punto de
T  b0  b1t
0 1 los datos
Entonces: n Número de puntos en los datos
21
Ejemplo: Graficamos
TRIMESTRE VENTAS TRIMESTRE VENTAS
1 600 7 2600
2 1550 8 2900
3 1500 9 3800
4 1500 10 4500
5 2400 11 4000
6 3100 12 4900
La empresa quiere calcular la tendencia para cada uno

de los trimestres del cuarto año.
Desarrollamos Reemplazamos en:

t y ty t²
1
2
600
1550
600
3100
1
4 b1 
 ty  nt y 
(268 .200 )  12 (6,5)( 2.779 ,17 )
3 1500 4500 9  t  n(t )
2 2
650  12 (6,5) 2
4 1500 6000 16
5 2400 12000 25 268.200  216.775,26 51.424,74
   359,61
650  507
6 3100 18600 36
7 2600 18200 49 143
8 2900 23200 64
9 3800 34200 81 b0  y  b1t  2.779,17  359,6153(6,5)  441,66
t 10
11
y 4500
4000
ty 45000
44000
t 2
100
121 Como…
12 4900 58800 144
suma: 78 33350 268200 650 T  b0  b1t T  441,66  359,61(t )
promedio: 6,5 2779,17
22
Y con la ecuación ―particular‖ obtenemos las tendencias Ejercicio:
o pronósticos solicitados:
Una agencia de viajes en Villavicencio tiene los datos de
T  441,66  359,61(t ) los clientes que han solicitado sus servicios durante los
últimos 10 años. En la tabla están los datos de la
agencia de viajes. Hallar la tendencia de los clientes
para los siguientes 3 años.
T13  441,66  359,61(13)  5.116,4
T14  441,66  359,61(14)  5.476,0
AÑO CLIENTES AÑO CLIENTES
1 1000 6 1900
T15  441,66  359,61(15)  5.835,6 2 1200 7 2030
3 1500 8 2400
T16  441,66  359,61(16)  6.195,2 4 1300 9 1970
5 1800 10 2700
23

1Estad-Probab UD GesPro 2011-3 Entrega7

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

1Estad-Probab UD GesPro 2011-3 Entrega7

Cargado por

Copyright:

Formatos disponibles

DOS VARIABLES ALEATORIAS DISCRETAS

Si X puede asumir valores x1, x2, x3, … , xn

La función masa de probabilidad conjunta del

Los conceptos tratados se pueden generalizar a p ( xi , y j )  P ( X  xi , Y  y j )

Ejemplo: X:= Numero de caras obtenidas en los 2 primeros lanzamientos

Experimento: Lanzar una moneda 3 veces S X: S  Reales Reales

SUMAR las probabilidades DE TODOS los puntos muestrales

DOS VARIABLES ALEATORIAS CONTINUAS

PY ( y)   p( x, y) En donde a, b, c, y d, conforman un rectángulo de tal

MUESTREO SISTEMATICO MUESTREO NO ALEATORIO

Salario anual medio($) Frecuencia Frecuencia relativa

TIGOMEX desea ahora conocer la probabilidad de RELACION ENTRE EL TAMAÑO DE LA MUESTRA

Promedio móvil simple: promedio de datos en un

Descomposición de los datos de series de tiempo

Pronóstico basado en promedio móviles: 3 y Pronóstico basado en promedios móviles: 3 y 9 semanas

A F Promedio móvil ponderado

La constante de suavizado  puede ser interpretada como un

Selección del valor apropiado de  Selección del valor apropiado de 

Selección del valor apropiado de  Ejemplo

Un método para seleccionar el mejor valor es 5 30 16.14 -13.86

= 1 + (0,9) 15 = 14, 5 Pero cuando el valor del pronostico se ubica dentro de

Medición del error Medición del error

1. Error medio (o Sesgo) 3. Error cuadrado medio n

ME( Sesgo)  i 1 MSE  i 1

2. Desviacion absoluta media 4. Desviacion tipica de los errores

5. Error porcentual 7. Error porcentual absoluto medio

Aunque son muy similares en apariencia, estas dos

Inicialmente trabajaremos con los dos primeros métodos:

MAD muestra sólo el tamaño promedio del error.

indica si el pronóstico  ( Ft  At) El Sesgo muestra el error promedio total y su dirección.

bajo o demasiado alto. n

Ejemplo: MAD y Sesgo

108  103  107  106  105  106  106  111   3 SEÑALdeSEGUIMIENTO

Las razones que se aproximan a —1 indican que TALLER 1:

De ahí el concepto básico de TENDENCIA: Utilizamos para hallar b1: DONDE:

TRIMESTRE VENTAS TRIMESTRE VENTAS

La empresa quiere calcular la tendencia para cada uno

Desarrollamos Reemplazamos en:

También podría gustarte