Está en la página 1de 41

PROFESOR: DR. JORGE ACUA A.

1
ESTADISTICA
INFERENCIAL
PROFESOR: DR. JORGE ACUA A. 2
LA ESTADISTICA
Estadstica descriptiva
Mtodo cientfico
Muestreo
Informacin de entrada y de salida
Estadstica inferencial
Inferencias
Intervalos de confianza
Pruebas de hiptesis
Dgitos significativos
Diseo de experimentos
Errores
Distribuciones de probabilidad
Toma de decisiones
PROFESOR: DR. JORGE ACUA A. 3
BASES DE PROBABILIDAD
Experimento actividad con resultados inciertos y
que dependen de los elementos del sistema
Dimetro de una pieza, tiempo de proceso,
tiempo de espera, nmero de piezas que se
producen por turno?
Espacio muestral lista completa de todos los
posibles resultados individuales de un
experimento

PROFESOR: DR. JORGE ACUA A. 4
BASES DE PROBABILIDAD
Evento un subconjunto del espacio muestral
Se denota por E, F, E
1
, E
2
, etc.
Unin, interseccin, complementos
Probabilidad de un evento es la posibilidad relativa de
que este ocurra al realizar el experimento
Es un nmero real entre 0 y 1 (inclusive)
Se denota por P(E), P(E F), etc.
Interpretacin proporcin de veces que el evento
ocurre en muchas repeticiones independientes del
experimento

PROFESOR: DR. JORGE ACUA A. 5
BASES DE PROBABILIDAD
Algunas propiedades de la probabilidad
Si S es la totalidad de ocurrencias, entonces P(S) = 1
Si es un evento, entonces P() = 0
Si E
C
es el complemento de E, entonces P(E
C
) = 1 P(E)
La P(E o F)= P(E F) = P(E) + P(F) P(E F)
Si E y F son mutuamente excluyentes (ejemplo, E F =
), entonces P(E F) = P(E) + P(F)
Si E es un subconjunto de F (ejemplo, la ocurrencia de E
implica la ocurrencia de F), entonces P(E) s P(F)
Si o
1
, o
2
, son resultados individuales en el espacio
muestral, entonces

PROFESOR: DR. JORGE ACUA A. 6
VARIABLES ALEATORIAS
Es una forma de cuantificar y simplificar eventos
asociados a probabilidades
Una variable aleatoria (VA) es un nmero cuyo
valor est determinado por el resultado de un
experimento
Se pueden obtener inferencias sin tener que
trabajar con el espacio muestral completo.
VA es un nmero cuyo valor no conocemos con
certeza pero que podemos conocer algo acerca
de el.
Se denota con letras latinas: X, Y, W
1
, W
2
, etc.
Su conducta probabilstica se describe por medio
de una distribucin

PROFESOR: DR. JORGE ACUA A. 7
VARIABLES ALEATORIAS
CONTINUAS Y DISCRETAS
Dos formas bsicas de VAs usadas para representar un
modelo
Discreta puede tomar solamente ciertos valores
separados
El nmero de valores posibles puede ser finito o
infinito
Continua puede tomar cualquier valor en un rango
El nmero de valores es siempre infinito
El intervalo puede ser abierto o cerrado en ambos o
un lado
PROFESOR: DR. JORGE ACUA A. 8
DISTRIBUCIONES
DISCRETAS
Sea X una variable aleatoria discreta que puede
tomar valores x
1
, x
2
, (lista finita o infinita)
Funcin densidad de probabilidad (FDP)
p(x
i
) = P(X = x
i
) para i = 1, 2, ...
La expresin X = x
i
es un evento que puede
o no ocurrir, sea que tiene una probabilidad de
ocurrencia, que es medida por la FDP
Dado que X debe ser igual a algn valor de x
i
,
y dado que los valores x
i
s son todos distintos,
PROFESOR: DR. JORGE ACUA A. 9
DISTRIBUCIONES
DISCRETAS
Distribucin acumulada de probabilidad (DAP)
probabilidad de que la VA sea s a un valor fijo x:

Propiedades de la DAP:
0 s F(x) s 1 para todo x
Como x , F(x) 0
Como x +, F(x) 1
F(x) no es decreciente en x
F(x) es una funcin continua de la derecha que brinca
de un valor discreto a otro

Estas cuatro propiedades
son tambin verdaderas
para variables continuas
PROFESOR: DR. JORGE ACUA A. 10
DISTRIBUCIONES
DISCRETAS
Para calcular valores sumar los valores de p(x
i
) para
aquellos x
i
s que satisfacen la condicin:




Tener cuidado con desigualdades
PROFESOR: DR. JORGE ACUA A. 11
VALOR ESPERADO DE LA
MEDIA
El conjunto de datos tiene un centro el promedio
Las variables aleatorias tienen un centro valor
esperado

Se le llama tambin la media o esperado de X
Se puede indicar con notacin: ,
X

Promedio ponderado de los posibles valores de x
i
,
donde los pesos son las respectivas probabilidades de
ocurrencia
Esperado significa:
Repetir el experimento muchas veces, observando
muchos valores de X
1
, X
2
, , X
n
E(X) es valor al que se converge cuando n
PROFESOR: DR. JORGE ACUA A. 12
VALOR ESPERADO DE LA
VARIANZA
Medidas de dispersin
Varianza muestral
Desviacin estndar muestral
Las VAs tiene medidas similares

Otra notacin:
Promedio ponderado de las desviaciones cuadradas
de los posibles valores de x
i
de la media
La desviacin estndar de X es
La interpretacin es anloga a la de E(X)
PROFESOR: DR. JORGE ACUA A. 13
DISTRIBUCIONES
CONTINUAS
Sea X una variable aleatoria continua VA
Rango limitado a la izquierda o derecha o
ambos
No importa lo pequeo del rango, el
nmero de valores posibles de X es
siempre incontable (infinito)
No es significativa la P(X = x) aunque x
est en el rango. Ese valor es un
diferencial con valor cercano a 0
Se describe la conducta de X en trminos
de intervalos
PROFESOR: DR. JORGE ACUA A. 14
DISTRIBUCIONES
CONTINUAS
Funcin densidad de probabilidad (FDP) es
una funcin f(x) con las siguientes tres
propiedades:
f(x) > 0 para todos los valores reales de x
El rea total bajo la curva es f(x) es 1:
Para cualquier valor fijo de a y b con a s b,
la probabilidad de que X caiga entre a y b
es el rea bajo f(x) entre a y b:

PROFESOR: DR. JORGE ACUA A. 15
DISTRIBUCIONES
CONTINUAS
Distribucin acumulada de probabilidad (FAP)
probabilidad de que la VA sea s a un valor fijo x:

Propiedades de la FAP
0 s F(x) s 1 para todo x
Si x , F(x) 0
Si x +, F(x) 1
F(x) no es decreciente en x
F(x) es una funcin continua con pendiente igual a FDP:
f(x) = F'(x)
Estas cuatro propiedades
son tambin verdaderas
para variables discretas
PROFESOR: DR. JORGE ACUA A. 16
VALOR ESPERADO DE LA
MEDIA
Esperado o media de X es


Promedio ponderado continuo de los posibles
valores de X
Misma interpretacin del caso discreto:
promedio de un nmero infinito de
observaciones de la variable X
PROFESOR: DR. JORGE ACUA A. 17
VALOR ESPERADO DE LA
VARIANZA
Varianza de X es



Desviacin estndar de X es

PROFESOR: DR. JORGE ACUA A. 18
DATOS EN SIMULACION
ENTRADA
Distribuciones de entrada
Recolectar datos
Ajustar distribuciones de probabilidad
Probar H
0
: los datos se ajustan a la
distribucin seleccionada
SALIDA
Comparar dos o mas diseos o modelos
Probar H
0
: todos los diseos dan el mismo
rendimiento, o H
0
: uno de los diseos es mejor
que el otro u otros.
PROFESOR: DR. JORGE ACUA A. 19
MUESTREO
Anlisis estadstico estima o infiere algo acerca
de una poblacin o proceso basado en una nica
muestra extrada de ella.
Muestra aleatoria es un conjunto de
observaciones independientes e idnticamente
distribuidas X
1
, X
2
, , X
n

En simulacin, muestreo se aplica al hacer
varias corridas del modelo recolectando datos
No se conocen los parmetros de la poblacin
(o distribucin) y se quiere estimarlos o inferir
algo acerca de ellos basado en una muestra
PROFESOR: DR. JORGE ACUA A. 20
MUESTREO
Parmetro poblacional
Media = E(X)
Varianza o
2

Proporcin P
Parmetro se necesita
trabajar con toda la
poblacin
Fijo pero desconocido
Estimado muestral
Media x
Varianza muestral s
2

Proporcin muestral p
Estadstico muestral
puede ser calculado de
una muestra
Vara de una muestra a
otra es una VA, y tiene
una distribucin, llamada
distribucin muestral.
PROFESOR: DR. JORGE ACUA A. 21
DATOS EN SIMULACION
Los datos obtenidos de una simulacin pueden ser
de dos tipos: datos de observacin o datos
dependientes del tiempo.
Datos de observacin son aquellos para los cuales el
tiempo de recoleccin no modifica su valor.
Ejemplo: nmero de entidades procesadas en el
sistema se recoleta al final de la corrida.
Datos dependientes del tiempo son aquellos cuyo
valor vara de acuerdo con el tiempo. Ejemplo:
nmero de entidades residentes en una cola pues al
calcular el valor se debe considerar el tiempo que
dur esperando.
PROFESOR: DR. JORGE ACUA A. 22
DIGITOS SIGNIFICATIVOS
Los valores finales de una medida de efectividad se
deben reportar en forma puntual, pero con cuntas
cifras significativas?
Si un determinado valor del tiempo de ciclo da
14.87151 minutos, qu tan significativas son asl
ltimas tres cifras?
Si en tres corridas se obtienen los valores de
14.87151, 14.88155, 14.85141 es poco probable
que nos equivoquemos si reportamos 14.8 minutos.
En realidad la respuesta se da en trminos de que
tan grande es la desviacin estndar del conjunto
de tiempos de ciclo.
PROFESOR: DR. JORGE ACUA A. 23
DIGITOS SIGNIFICATIVOS
Procedimiento:
1. Recolectar los n-valores de la medida de
efectividad.
2. Agrupe los valores segn teorema del lmite central
3. Calcule el promedio de promedios.
4. Calcule el valor de la desviacin estndar s.
5. Calcule el valor de 2(s/\n)
6. Identifique el dgito mas significativo. Ejemplos:
0.5678 es el (5) 1.235 es el (1) 13.45 es el (1)
7. Reporte el valor de la variable basado en el
promedio calculado en 3), pero con un dgito menos
que el valor calculado en 5).
PROFESOR: DR. JORGE ACUA A. 24
DIGITOS SIGNIFICATIVOS
Ejemplos:

Promedio 2(s/\n) Puntual Intervalo
14.6875 0.7585 14 10 - 20
188.8 6.8675 180 180-190
499.09 13.76 400 400-500
2529.89 3.2789 2520 2520-2530
10.1 5.277 10 10 - 20
508.67 16.243 500 500-600
1256.5 0.9876 1256 1256-1257
PROFESOR: DR. JORGE ACUA A. 25
INTERVALOS DE CONFIANZA
Un estimador puntual es un simple nmero, con alguna
incertidumbre o variabilidad asociada a el
Intervalo de confianza cuantifica la imprecisin probable del
estimador puntual
Un intervalo que contiene el parmetro poblacional
desconocido con una probabilidad alta especificada 1 o

Intervalo de confianza para media poblacional :



t
n-1,1-o/2
bajo el cual el rea es
1 o/2 en t student con
n 1 grados de libertad
PROFESOR: DR. JORGE ACUA A. 26
PRUEBA DE HIPOTESIS
Prueba alguna conjetura sobre la poblacin o sus
parmetros
Nunca determina algo verdadero o falso con
certeza, solamente da evidencia para tomar una de
las dos direcciones
Hiptesis nula (H
0
) lo que va a ser probado
Hiptesis alternativa (H
1
or H
A
) negacin de H
0

H
0
: = 6 vs. H
1
: = 6
H
0
: o < 10 vs. H
1
: o > 10
H
0
:
1
=
2
vs. H
1
:
1
=
2

Desarrolla una regla de decisin para decidir sobre
H
0
o H
1
basado en los datos de la muestra
PROFESOR: DR. JORGE ACUA A. 27
ERRORES EN PRUEBA DE
HIPOTESIS
H
0
es verdadera H
1
es verdadera
Decide H
0

(Acepta H
0
)
No hay error
Probabilidad 1 o
o es seleccionado
Error tipo II
Probabilidad |
| no est controlado
afectado por o y n
Decide H
1

(Rechaza H
0
)
Error tipo I
Probabilidad o

No hay error
Probabilidad | =
potencia de la
prueba


PROFESOR: DR. JORGE ACUA A. 28
VALORES DE p
Calcular el valor de p de la prueba
p-value (valor p) = probabilidad de obtener un
resultado mas en favor de H
1
que lo obtenido en la
muestra
Pequeo p (< 0.01) evidencia convincente en
contra de H
0

Gran p (> 0.20) indica falta de evidencia contra H
0

Coneccin con el mtodo tradicional
Si p < o, rechazar H
0

Si p > o, no rechazar H
0

PROFESOR: DR. JORGE ACUA A. 29
EJEMPLO 1
En un proceso de fabricacin de piezas de
precisin se quiere que el valor nominal
del dimetro de una pieza sea 20,0 mm.
Se conoce que la desviacin estndar de
esta caracterstica es 3,0 mm. Se toma
una muestra de 25 piezas obtenindose
un promedio de dimetro de 19,2 mm. Se
ha cumplido con lo requerido? Use o=5%.
PROFESOR: DR. JORGE ACUA A. 30
SOLUCION
Se seguir el procedimiento planteado.
a. Planteo de la hiptesis
H
0
: = 20,0
H
a
: = 20,0
b. La hiptesis es bilateral puesto que no
se cumple con lo requerido si el promedio de la
muestra es mayor o menor que lo especificado.
c. El nivel de significacin es dado, o= 5%.
d. El estadstico por usar es el siguiente:
_
x
Z =
o/\ n

PROFESOR: DR. JORGE ACUA A. 31
SOLUCION
e. Las reas de cumplimiento de la hiptesis .
f. Clculo del estadstico citado en d.
_
x 19,2 20,0
Z = = = 1,33
o/\ n 3,0/ \ 25

g. El valor de Z calculado (1,33) se encuentra en
el rea de cumplimiento de la hiptesis nula.
h. En conclusin, se puede afirmar, con o=5%, que
estadsticamente se cumple con el valor nominal
requerido.
PROFESOR: DR. JORGE ACUA A. 32
EJEMPLO 6
Una inspeccin de calidad efectuada sobre dos marcas
de bateras para linterna, revel que una muestra
aleatoria de 61 unidades de la marca A gener un
promedio de vida til de 36,5 horas con una
desviacin estndar de 1,8 horas, mientras que otra
muestra aleatoria de 31 unidades de la marca B
gener un promedio de 36,8 horas con una desviacin
estndar de 1,5 horas.
Con un nivel de significacin del 5% se desea saber si
hay diferencia significativa entre la vida til de ambas
marcas.
PROFESOR: DR. JORGE ACUA A. 33
SOLUCION
Para probar si hay diferencia significativa entre los
promedios se debe comprobar primero la diferencia
entre las varianzas, para as seleccionar el estadstico
adecuado.
1. Hiptesis de varianzas
Siguiendo los pasos de una prueba de hiptesis se
tiene:
a. Planteo de la hiptesis
H
0
: o
2
A
= o
2
B
H
a
: o
2
A
= o
2
B

b. Como la hiptesis alternativa es de desigualdad,
entonces es bilateral. Esto significa que puede darse
una relacin mayor o menor.

PROFESOR: DR. JORGE ACUA A. 34
SOLUCION
c. El nivel de significancia es o= 5%.
d. El estadstico por usar es Fc = s
1
2
/ s
2
2

(distribucin F-Fisher), pues lo que se desea es medir la
relacin de varianzas.
e. Las reas de la hiptesis que se va a probar.
v1 = n11 = 611=60 v2=n2-1 = 311=30
De una Tabla F con o/2= 2.5% se tiene:
F
60,30,0.025
= 0,551
F
60,30,0.975
= 1,440
f. Fc= s
1
2
/ s
2
2
= 1,8
2
/1,5
2
= 1,44
g. Este valor calculado de Fc cae en el rea donde se
cumple Ho, por lo tanto se acepta Ho.

PROFESOR: DR. JORGE ACUA A. 35
SOLUCION
h. Se concluye que ambas varianzas, al 5% de
significancia, son iguales.
Se procede entonces a hacer la hiptesis de
promedios.
Siguiendo los pasos de prueba de hiptesis se tiene:
a. Planteo de la hiptesis
H
o
:
1
=
2
H
a
:
1
=
2
b. La hiptesis es bilateral al igual que en la
hiptesis anterior.
c. El nivel de significacin es del 5%
PROFESOR: DR. JORGE ACUA A. 36
SOLUCION
d. Segn la hiptesis anterior las varianzas son
desconocidas pero iguales, adems, los tamaos de
muestra son mayores que 30. Por lo tanto el estadstico
por usar es:




e. Las reas de cumplimiento y rechazo.
v = n1 + n2 2
v = 61 + 31 2
v = 90

2
2
2
1
2
1
2 1
n
s
n
s
x x
t
+

=
o
PROFESOR: DR. JORGE ACUA A. 37
SOLUCION
De tablas se obtienen los valores:
t
90, 0,025
= 1,987 t
90,0,975
=1,987

f. El estadstico calculado es:




En este caso (
1

2
) = 0 pues es de suponer que
tratndose de un mismo producto las medias
poblacionales son iguales.
g. No hay evidencia estadstica, con o = 5%, para
concluir que ambas medias sean diferentes.
845 , 0
355 , 0
3 , 0
31
5 , 1
61
8 , 1
0 8 , 36 5 , 36
2 2
=

=
+

= t
PROFESOR: DR. JORGE ACUA A. 38
CORRIDAS DE SIMULACION
No sacar conclusiones en simulacin con base en una sola
corrida. Se debe aplicar muestreo. Para ello:
1. Hacer un nmero inicial de corridas n
i
(10).
2. Calcular la desviacin estndar para la medida de
efectividad mas importante del modelo.
3. Estimar el valor de h = t
o/2,n-1
*s/\n
4. Calcular n = n
i
*(h/h)
2
h es el valor deseado de
intervalo
5. Correr la simulacin por el nmero de corridas
faltantes sea por n - n
i
, cambiando la semilla de
nmero aleatorios, de lo contrario se repite la salida.
Si n
i
>

n entonces no hay necesidad de mas corridas.
PROFESOR: DR. JORGE ACUA A. 39
CORRIDAS DE SIMULACION
EJEMPLO:
Se han obtenido 10 corridas de una simulacin que
han generado los siguientes tiempos de ciclo: 93, 113,
107, 103, 112, 103, 112, 100, 98 y 105. Se desea un
h de 3.
1. Calcular la desviacin estndar, s = 6.59
2. Estimar h=t
o/2,n-1
*s/\n = 2.262*6.59/\9 = 4.97
t
0.975,9
= 2.262 (en tablas)
3. Calcular n = n
i
*(h/h)
2
= 10 * (4.97/3)
2
= 27.44 ~ 28
4. Obtener 18 corridas mas de la simulacin.
PROFESOR: DR. JORGE ACUA A. 40
CALENTAMIENTO DE LA
SIMULACION
Los resultados de una simulacin deben ser
obtenidos en el estado estable de la corrida.
El momento desde el inicio de la simulacin
hasta que se obtiene el estado estable se
llama perodo de calentamiento.
En el estado transiente el estado las
entidades residentes inicia en cero lo cual
puede no representar la realidad. Esto hace
que el sistema aparezca funcionando mejor
de lo que realmente puede ser.
PROFESOR: DR. JORGE ACUA A. 41
CALENTAMIENTO DE LA
SIMULACION
Formas de eliminar informacin obtenida durante el
periodo de calentamiento:
1. Seleccionar las condiciones iniciales del sistema antes
de las corridas. Se debe conocer muy bien el sistema.
2. Descartar los datos obtenidos en la fase transiente, se
utilizan para ello el mtodo de los promedios mviles
para identificar el inicio del estado estable de la
corrida.
3. Correr el modelo por un periodo lo suficientemente
grande a fin de que los resultados obtenidos durante la
fase transiente sean absorbidos por los datos de la fase
estable.

También podría gustarte