Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Y:= Numero de caras obtenidas en los 2 últimos Tenemos el Conjunto imagen X(S) = {0,1,2}
lanzamientos.
1
Y:= Numero de caras obtenidas en los 2 últimos lanzamientos La distribución de las dos variables aleatorias X, Y a la vez
S X: S Reales Reales
La probabilidad de que las dos variables tomen cada una un
CCC CCC 2 2 punto de su conjunto imagen.
CCS CCS 1 1 Imágenes de
CSC CSC 1 1 cada uno de
Y
CSS CSS 0 0 los puntos 0 1 2
X
muestrales por
SCC SCC 1 2
causa de la 0 P(X=0, Y=0) P(X=0, Y=1) P(X=0, Y=2)
SCS SCS 1 1 variable
SSC SSC 0 1 aleatoria Y 1 P(X=1, Y=0) P(X=1, Y=1) P(X=1, Y=2)
SSS SSS 0 0
2 P(X=2, Y=0) P(X=2, Y=1) P(X=2, Y=2)
Tenemos el Conjunto imagen Y(S) = {0,1,2}
. .
2
Para verificar si forma una distribución de
La distribución de probabilidad conjunta de X y Y probabilidad conjunta debemos observar las dos
quedaría: condiciones:
Y a. _ P ( X xi , Y y j ) 0
0 1 2
X n m
0 1/8 1/8 0 b. _ P( X x , Y y i j ) 1
i 1 j 1
1 1/8 2/8 1/8
2 0 1/8 1/8 La primera condición se cumple ya que todas las
probabilidades en el interior de la tabla son ≥ 0
3
Método estadístico por medio del
Las funciones de densidad de probabilidad marginal cual se definen los criterios y
de X y de Y están dadas por técnicas que deben orientar el
proceso de recolección u obtención
de información
f X ( x) f ( x, y)dy
con x i. El procedimiento de selección de la muestra y
su tamaño depende de los objetivos de la
investigación.
fY ( y ) f ( x, y)dx
con y ii. Las poblaciones son en lo general diferentes
y por lo tanto, deberán utilizarse criterios
distintos para seleccionar las unidades bajo
estudio.
Marco: Lista de
unidades
muestrales para En el m.a.s. existe diferencia si la población es finita
MUESTREO ALEATORIO SIMPLE
un estudio. La o infinita.
Población homogénea de tamaño N. muestra es
aleatoria para Finita: enumerar los individuos que hacen parte de
Cada elemento tiene la misma probabilidad de ser
seleccionar la población (ejemplo de 1 a 2500). Se saca una tabla
elegido en la muestra. unidades del
marco
de aleatorios. Se cuentan de cuatro cifras todo lo que
Procedimiento: este de 2500 para abajo es valido los demás se
Ejemplo: en
Identificar el marco muestral ignoran. Así hasta completar 30 números. Pueden restaurante
Seleccionar aleatoriamente n números de emplearse paquetes de software (Excel). tomar el
entre 1 a N. individuo
Infinita: cada situación debe ser especial y cada
Rifa simple o números aleatorios. que llega
elemento debe seleccionarse independientemente. después de
Identificar los números seleccionados en el
alguien que
marco. tenga
gafas.
4
MUESTREO ALEATORIO ESTRATIFICADO MUESTREO POR CONGLOMERADOS
Población compuesta por varios grupos. Cuando no se tiene un marco de unidades elementales.
Grupos bien identificados (estratos). Aparecen naturalmente agrupados.
Los individuos pertenecen solo a un estrato. A estos grupos se les llama conglomerados.
Mejor cuando la varianza entre elementos de cada Mejor cuando cada conglomerado proporciona una
estrato es relativamente pequeña representación a menor escala de la población.
Procedimiento: Procedimiento:
N tamaño de la población Marco de conglomerados 1, 2, …, M.
L número de estratos Seleccionar muestra aleatoria de m conglomerados.
N = N1 + N2 + … + NL Conglomerado seleccionado obtener un marco de las
Nh el número de elementos en el h-ésimo estrato. Mi unidades, i = 1,2,…,m.
Determinamos n y los distribuimos en los L estratos. Censar cada conglomerado.
(Asignación proporcional o Asignación por variabilidad)
5
CASO: En la empresa SENSOR Ltda. el director
ESTIMACION PUNTUAL de personal suministra sueldo medio anual
de los 2500 administradores y la
Una estimación puntual es un procedimiento proporción de los que se han capacitado.
(formula) que se utiliza para calcular un estimador
puntual de un parámetro poblacional, a partir de un Los parámetros poblacionales brindados son:
estadístico muestral. Media poblacional: = $51.800
Desviación estándar poblacional: σ= $ 4.000
A la media muestral x̅ se le conoce como el estimador Proporción (de capacitados): p= 1.500/2.500=0,60
puntual de la media poblacional .
Se emplean los datos de una muestra de 30
A la desviación estándar muestral s se le conoce como
administradores obteniéndose:
el estimador puntual de la desviación estándar
Media muestral: x̅ = $51.814
poblacional σ.
Desviación estándar muestral: s= $ 3.348
Proporción (de capacitados): p̅= 19/30=0,63
6
Pero como el valor esperado de las medias muestrales
Distribución Muestral de x̅ es igual a la media de la población de la que se
E x
tomaron las muestras, tenemos…
Es la distribución de probabilidad de todos los
valores de la media muestral de x̅, la cual es una
variable aleatoria. Desviación estándar de x̅
(conocida como error estándar)
Propiedades
Depende de si la población es finita o infinita
Como se ha observado en anteriores distribuciones
de probabilidad, todas tienen un valor esperado, una Población finita Población infinita
desviación estándar y una forma característica.
N n También se
x x aconseja usar esta
Valor esperado de x̅ (conocido como gran media X̿) N 1 n n
para finita si:
Se calcula de la forma usual
(sumar las medias y dividir por E x x
x Se conoce como factor
de corrección para pobl.
N n
n
N
0,05
k N 1
finitas
la cantidad de muestras (k):
La demostración del
TLC requiere
Forma de la distribución muestral de x̅ observaciones
independientes en la
muestra. Esta
Si la población tiene distribución normal, su condición se
distribución muestral de x̅ está distribuida satisface cuando se
normalmente sea cual fuere su tamaño. trata de poblaciones
infinitas y cuando se
Si la población NO tiene distribución normal, su trata de poblaciones
finitas y el muestreo
distribución muestral de x̅ es comprensible por el se hace con
TEOREMADEL LÍMITE CENTRAL, reemplazo. Aunque el
TLC no se refiere
el cual indica que … a medida que n se vuelve mas directamente a
grande, la distribución de las medias muestrales se muestreos sin
remplazo de
aproximará a una distribución normal con una media poblaciones finitas se
aplican los hallazgos
x y error estándar x del TLC cuando la
población es de
n tamaño grande.
7
VALOR PRÁCTICO CASO: TIGOMEX registró mensajes telefónicos para
DE LA DISTRIBUCIÓN MUESTRAL DE x̅ sus clientes los cuales promediaron en 150
segundos y con una desviación de 15 segundos.
Las mediciones obtenidas de una muestra sirven para
la toma de decisiones pero que mejor que tomarlas de La probabilidad de que una sola llamada dure entre
varias que en conjunto se parecen más a las 150 y 155 segundos es: x 155 150
características de la población. Z 0,33
15
Según la tabla al punto 0,33 le corresponde un 0,6293
Como la distribución muestral de las medias tiene
por tanto P(150 ≤ X ≤ 155) = 0,6293 – 0,5 = 0,1293
comportamiento normal, también se trabaja con
puntos tipificados pero ajustados, así:
X
Z
x
8
La proporción
muestral de
Distribución muestral de p̅ es el estimador
puntual de la
Entonces, aumentando el tamaño de la muestra n, de proporción
30 a 50 llamadas, la probabilidad de obtener una Es la distribución de probabilidad de todos los poblacional p.
m.a.s. que esté a la derecha en 5 llamadas de la media posibles valores de la proporción muestral de p̅, la
poblacional aumenta de 0,9663 a 0,9909. cual es una variable aleatoria.
Propiedades
El punto importante es que cuando aumenta el También tienen un valor esperado, una desviación
tamaño de la muestra, el error estándar de la media estándar y una forma característica.
disminuye. Una muestra de mayor tamaño
proporciona mayor probabilidad de que la media Valor esperado de p̅
muestral esté dentro de una distancia determinada de
Se calcula de la forma usual
la media poblacional.
(sumar las proporciones y dividir E p
p
por la cantidad de muestras (k): k
Al igual que
Pero como el valor esperado de las proporciones en las medias
muestrales la
TÉCNICAS DE PRONÓSTICO
muestrales es igual a la proporción poblacional (de diferencia esta
i. Modelos Cualitativos
E p p
donde se tomaron las muestras), tenemos… en el factor de
corrección .
Subjetivo, sentencioso; basado en estimaciones y opiniones
Desviación estándar de p̅ N n
N 1 Método Delphi: Grupo de expertos responden un
Depende de si la población es finita o infinita Al igual que
cuestionario.
en las medias Investigación de mercado: Encuestas, entrevistas.
Población finita Población infinita muestrales se Consenso grupal: intercambio abierto entre
distingue como
N n p(1 p) p(1 p) profesionales.
p p error estándar
N 1 n n de la Analogía histórica: Vincula el pronóstico con un
proporción
También se aconseja artículo similar.
usar esta para finita Niveles inferiores: Datos obtenido del front line en
si: n contacto con mercado
0,05
N
9
ii. Análisis de series de tiempo
Serie de Tiempo es un conjunto de observaciones sobre
valores que toma una variable (cuantitativa) en diferentes
momentos del tiempo. Uso de la historia de sucesos durante
un período para hacer un pronóstico:
10
Se utiliza la fórmula: t Ejemplo
Di
i ( t n 1)
Periodo Demanda Promedio movil Pronostico Ft Error
Ft 1
Dt PM para n=3 Ft-Dt
1 10
n 2 18
t numero de periodo actual 3 29 19
n número de periodos anteriores a tener en 4 15 20.7 19 4.0
cuenta en el promedio móvil (Conocido como 5 30 24.7 20.7 - 9.3
el “orden” del promedio móvil)
Ft+1 Pronostico para el próximo periodo 6 12 19 24.7 12.7
Di Hechos ocurridos (Demanda real) en el 7 16 16 19 3.0
periodo i
11
A F A F
PROMEDIO PRONOSTICO error
AÑO PERIODO CLIENTES n=3 n=3 n=3 error absolu cuadrado error PROMEDIO PRONOSTICO error
AÑO PERIODO CLIENTES n=4 n=4 n=4 error absolu cuadrado error
2002 1 200
2002 1 200
2003 2 208
2004 3 192 200,0 2003 2 208
2005 4 181 193,7 200,0 -19,0 19,0 361,0 2004 3 192
2006 5 204 192,3 193,7 10,3 10,3 106,8 2005 4 181 195,3
2007 6 215 200,0 192,3 22,7 22,7 513,8 2006 5 204 196,3 195,3 8,8 8,8 76,6
2008 7 205 208,0 200,0 5,0 5,0 25,0 2007 6 215 198,0 196,3 18,8 18,8 351,6
2009 8 210 210,0 208,0 2,0 2,0 4,0 2008 7 205 201,3 198,0 7,0 7,0 49,0
2009 8 210 208,5 201,3 8,8 8,8 76,6
PROMEDIO 4,2 16,0 202,1
10,8 10,8 138,4
12
En promedio móvil ponderado, podríamos utilizar diferentes
combinaciones de pesos.
Realmente un promedio móvil simple es un promedio Para un caso de orden cuatro tendríamos por ejemplo:
ponderado en el que se considera que el peso de todos w1 w2 w3 w4
los datos es igual. Combinación 1 0,10 0,20 0,30 0,40
Combinación 2 0,20 0,20 0,25 0,35
Por ejemplo en un promedio móvil simple de orden Combinación 3 0,05 0,10 0,25 0,60
cuatro, podemos considerar que el peso para cada uno
de los cuatro datos es 0,25 es decir que todos los datos (Nótese que todas suman 1).
pesan igual.
Aplicando el primer conjunto de pesos 0,10, 0,20, 0,30 y
Ejemplo: 0,40 a cuatro períodos de datos, obtenemos el pronóstico
así: F 0,10 D 0,20 D 0,30 D 0,40 D
F5 0,25 (180 ) 0,25 (205 ) 0,25 (210 ) 0,25 (195 ) 5 1 2 3 4
Ft 1 Dt 1 Ft
observado.
Ft 1 Dt 1 Ft
El nombre de suavizado exponencial deriva del hecho de
t numero de periodo actual
que los pesos declinan exponencialmente a medida que
Dt Demanda real en el periodo actual t
los datos sean más y más viejos.
Ft Pronostico para el periodo actual
Ft+1 Pronostico para el próximo periodo
Este modelo no elimina ninguna información pasada,
Constante de suavización exponencial (o atenuación)
simplemente ajusta los pesos dados a los datos pasados
Con la condición que: 0 < < 1
de tal forma que, mientras mas viejos son los datos menos
peso reciben.
13
Cuanto más alto sea el peso asignado a la demanda Ft 1 Dt 1 Ft
actual, mayor será la influencia que este dato tendrá en el
pronóstico. Dt Ft Ft
Ft 1 Dt 1 Ft
Ft Dt Ft
Por ejemplo, si es 1, el pronóstico de demanda del
próximo período será igual al valor de la demanda actual. Ft 1 Ft Dt Ft
Ft 1 1 Dt 1 1 Ft Ft 1 1Dt 0 Ft (At – Ft ) representa el error de pronóstico hecho en el
período t.
Cuanto más cercano sea el valor de a 0, más cercano
El nuevo pronóstico para el período t + 1 es igual al
será el pronóstico del período previo para el período
viejo pronóstico más cierto porcentaje del error
presente.
(dado que está entre 0 y1).
Ft 1 0 Dt 1 0 Ft Ft 1 0 Dt 1 Ft
14
Selección del valor apropiado de Selección del valor apropiado de
Los valores grandes de se utilizan en general en las Se aconseja utilizar un valor de bajo cuando los datos
situaciones en las cuales los datos siguen una pauta están sujetos a un alto grado de variación. Esta situación
suave, es decir exhiben Poca Variación. dará como resultado un pronóstico que sobrerreaccionará
constantemente a los cambios en la demanda más
reciente.
3 29 14.85 -14.15
Los valores usuales caen en el rango de 0,01 a 0,30.
4 15 16.26 1.26
15
Con F1+1 = (D1)+ (1–) F1 Errores en el Hacer Pronósticos
Error nos refiere: Diferencia entre el valor del pronostico y
Para t = 1 tenemos: lo ocurrido en realidad, o viceversa. Para la continuación
de nuestro curso lo relacionaremos de esta forma, es decir
F2 = 0,1 (10) + (1 – 0,1) 15 (Ft-At)
( Ft Dt )
n
( Ft Dt )
2
n n
MAD i 1
SDE i 1
n n 1
16
Medición del error Medición del error
PE i
MPE i 1
n
MAD i 1
idea de la precisión del más o menos el 10 % para
n modelo de pronóstico. prevenirnos contra este error
potencial".
17
Error Medio o Sesgo MAD y Sesgo
El método A nos arroja un pronóstico de enero a abril de 105 103 107 106 109 106 109 111 1
105, 107,109, y 109, respectivamente. 4
El método B nos arroja un pronóstico de enero a abril de Por lo tanto, MAD indica que el error promedio de pronóstico
108,107,105, y 106, respectivamente. utilizando el método A es 2, y el sesgo de +1 indica que el
pronóstico tiende a exceder la demanda.
18
MAD y Sesgo El cociente entre el sesgo y la MAD a veces se llama
"señal de seguimiento" en ciertos modelos adaptativos
MAD para el método B será de pronóstico.
19
Año desde
apertura Trimestre
Período
Numero
A
Real
Pronóstico
0,1
Pronóstico
0,3
F2 A1 1 F1
0,1 * 3.500 1 0,1 * 3500
1 1 1 3500 3500 3500
2 2 8000 3500 3500
3 3 5500 3950 4850
2
4
1
4
5
10000
4500
4105
4695
5045
6532
350 0,9 * 3.500
3.500
2 6 6000 4675 5922
3 7 3000 4808 5945
4 8 5500 4627 5062
3 1 9 5000 4714 5193
2 10 9500 4743 5135
3
4
11
12
7500
15000
5218
5447
6445
6761 F3 0,1* 8.000 0,9 * 3.500
4 1 13 13500 6402 9233
2 14 17500 7112
8151
10513
12609
3.950
Como puede verse, F15, el pronóstico para el trimestre Las señales de seguimiento son ambas bastante altas
siguiente utilizando cada uno de los valores es 8.151 y (cercanas a +1 ó —1), indicando que existe un
12.609, una diferencia considerable. problema.
Como indican los cálculos de MAD, el error es bastante En general, si los valores de mayores de 0,3 parecen
grande con ambos valores de , aunque 0,3 parece ser dar mejores resultados, probablemente no debería
el mejor. utilizarse el pronóstico exponencial.
El gran valor negativo del sesgo indica que gran parte Un modelo simple de suavizado es mejor en la
del error es debido al sesgo negativo del modelo, o sea situaciones donde la demanda fluctúa alrededor de una
que el pronóstico "va detrás" o es muy bajo, lo que es tendencia.
una característica de los modelos simples de pronóstico
exponencial. Otros modelos son generalmente más apropiados si la
tendencia es creciente o decreciente.
20
La línea de regresión lineal tiene la forma:
ANALISIS DE REGRESION LINEAL
Los dos métodos anteriores pronostican datos que no
Y a bX
tienen una tendencia marcada, es decir, son estables Donde:
La Regresión es la relación funcional de dos o mas y: es la variable dependiente
variables correlacionadas. x: es la variable independiente
a: es la intercepción con y
Referenciamos esta relación a partir de datos b: es la pendiente
observados.
En el análisis de series de tiempo, X representa las
Se grafican los datos para observar si los datos o una unidades de tiempo.
parte de ellos se presentan en forma lineal.
La principal restricción es que presupone que los datos Para hacer uso de esta ecuación se hace necesario
del pasado y las proyecciones del futuro quedan
aproximadamente en línea recta. conocer b0 y b1.
( ty) nt y
b0 : intercepción con eje Y
Si definimos a:
b1 b1 : pendiente de la línea
T como la variable dependiente (TENDENCIA)
t: como la variable independiente (VALOR EN LA SERIE)
( t ) n(t ) t
2 2 y : Promedio de todas las y
: Promedio de todas los t
t :Valor de t en cada punto de
b0: como la intercepción con T … y para hallar b0: los datos
b1: como la pendiente
b y bt y :Valor de y en cada punto de
T b0 b1t
0 1 los datos
Entonces: n Número de puntos en los datos
21
Ejemplo: Graficamos
1 600 7 2600
2 1550 8 2900
3 1500 9 3800
4 1500 10 4500
5 2400 11 4000
6 3100 12 4900
22
Y con la ecuación ―particular‖ obtenemos las tendencias Ejercicio:
o pronósticos solicitados:
Una agencia de viajes en Villavicencio tiene los datos de
T 441,66 359,61(t ) los clientes que han solicitado sus servicios durante los
últimos 10 años. En la tabla están los datos de la
agencia de viajes. Hallar la tendencia de los clientes
para los siguientes 3 años.
T13 441,66 359,61(13) 5.116,4
T14 441,66 359,61(14) 5.476,0
AÑO CLIENTES AÑO CLIENTES
1 1000 6 1900
T15 441,66 359,61(15) 5.835,6 2 1200 7 2030
3 1500 8 2400
T16 441,66 359,61(16) 6.195,2 4 1300 9 1970
5 1800 10 2700
23