Está en la página 1de 86

Probabilidades

DEFINICIÓN
Probabilidad de un suceso es el número al que tiende la
frecuencia relativa asociada al suceso a medida que el
número de veces que se realiza el experimento crece.

La frecuencia relativa de un suceso A:

Fr (a)= número de veces que aparece A


Número de veces que se realiza el experimento

Curso : Modelación y Simulación 1


Probabilidades
DEFINICIÓN DE LAPLACE
En el caso de que todos los sucesos elementales del espacio muestral
E sean equiprobables, Laplace define la probabilidad del suceso A
como el cociente entre el número de resultados favorables a que ocurra
el suceso A en el experimento y el número de resultados posibles del
experimento.

Si E={x1,x2,…..,xk} y P(x1)=P(x2)=……=P(xk), entonces:

P(A)= número de casos favorables al suceso A


número de casos posibles

Curso : Modelación y Simulación 2


Probabilidades
Permutaciones
Una permutación es un arreglo de todo o parte de un conjunto de
datos, el número de permutaciones de n objetos distintos es n!
el número de permutaciones de n objetos tomados de r a la vez es
n!
n Pr 
(n  r )!
Ejemplo 1
Considere las tres letras a,b y c, las permutaciones posibles son
abc, acb, bac, bca, cab y cba
n !=3 !=1*2*3=6

Curso : Modelación y Simulación 3


Probabilidades
Ejemplo 2
Se sacan dos billetes de lotería de 20 para un primer y
un segundo premios. Encuentre el número de puntos
muéstrales en el espacio S.
Solución
n! 20!
 P   20 *19  380
n Pr 
20 2
( n  r )! ( 20  2)!

Curso : Modelación y Simulación 4


Probabilidades
Combinaciones
El número de combinaciones de n objetos distintos tomados de r a
la vez es
n n!
  
 r  r!(n  r )!
Ejemplo
En una mano de póquer que consiste en cinco cartas, encuentre la
probabilidad de tener 2 ases y tres sotas

Curso : Modelación y Simulación 5


Probabilidades
Solución
El número de formas de tener dos ases de cuatro es:
 4 4!
   6
 2  2!(2)!
y el número de formas de tener tres sotas de cuatro es:
 4 4!
   4
 3  3!(1)!
Mediante la regla de multiplicación hay n=6*4=24 manos con dos
ases y tres sotas.

Curso : Modelación y Simulación 6


Probabilidades
El número total de 5 manos de póquer de cinco cartas, las cuales son
igualmente probables es

 52  52!
N      2.598.960
 5  5!(47)!

por tanto la probabilidad de obtener dos ases y tres sotas en una mano de
póquer de cinco cartas es:

24
P( x)   0,9 x10  5
2.598.960

Curso : Modelación y Simulación 7


Probabilidades

Experimentos Aleatorios
Un experimento aleatorio es aquel que proporciona diferentes
resultados aun cuando se repita siempre de la misma forma.
Espacio Muestral
Un conjunto de los posibles resultados de un experimento
aleatorio recibe el nombre de espacio muestral del experimento
Evento
Un evento es un subconjunto del espacio muestral de un
experimento aleatorio.

Curso : Modelación y Simulación 8


Probabilidades

Axiomas de Probabilidades
La probabilidad es un número que se asigna a cada miembro de una
colección de eventos de un experimento aleatorio y que satisface las
siguientes propiedades

1.- P(s) =1
2.- 0  P ( E )  1

3.- Para dos eventos E1 y E2


P(E1 U E2)= P(E1)+P(E2)-P(E1∩E2 )
con E1∩E2 =ø, P(E1 U E2)= P(E1)+P(E2)

Curso : Modelación y Simulación 9


Probabilidades

Probabilidad Condicional
La probabilidad condicional de un evento A dado un Evento B, denotada
por P(A\B), es :

P(A\B)= P( A ∩ B) / P(B) si P(B)>0


Probabilidad Total
Sea A1,a2,… An, un sistema completo de sucesos tales que la probabilidad
de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del
que se conocen las probabilidades condicionales P(B\Ai), entonces la
probabilidad del suceso B viene dada por la expresión.
P(B)= P(A1)*P(B/A1)+P(A2)*P(B/A2)+…..+P(An)*P(B/An)

Curso : Modelación y Simulación 10


Probabilidades

Teorema de Bayes
Sea A1,A2,....An un sistema completo de sucesos,
tales que la probabilidad de cada uno de ellos es
distinta de cero, y sea B un suceso cualquier del que

se conocen las probabilidades condicionales P(B/Ai),


entonces la probabilidad P(Ai/B) viene dada por la
expresión :
P(Ai/B)= P(Ai)* P(B/Ai)
P(A1)*P(B/A1)+ P(A2)*P(B/A2) +.....+ P(An)*P(B/An)

Curso : Modelación y Simulación 11


1.- Tres líneas de producción de ánodos, A, B, C producen el 40%, 35%, 25%,
respectivamente, del total de la producción. Los porcentajes de ánodos defectuosos de
estas líneas son del 2%, 3%, 4%.

Solución

sea D = " La pieza es defectuosa", y N="La pieza no es defectuosa"


La información del problema puede expresarse en el diagrama de árbol

0.02 D
A
0,40 0.98 N

0,35 0.03 D
B
0.97 N

0,25 0.04 D
C
0.96 N

a.- Para calcular la probabilidad de que la pieza elegida sea defectuosa, P(D)
por la Propiedad de la probabilidad total,

P(D)= P(A)*P(D/A)+P(B)*P(D/B)+P(C)*P(D/C)

P(D)= 0,4*0,02+0,35*0,03+0,25*0,04
P(D)= 0,0285

b.- Debemos calcular P(B/D). Por el teorema de Bayes

P(B/D)= P(B)*P(D/B)
P(A)*P(D/A)+P(B)*P(D/B)+P(C)*P(D/C)

P(B/D)= 0,35*0,03
0,4*0,02+0,35*0,03+0,25*0,04

P(B/D)= 0,0105
0,0285

P(B/D)= 0,368

c.- Calculamos P(A/D) y P(C/D), comparándolas con el valor de P(B/D)


ya calculado. Aplicando el teorema de Bayes , obtenemos

P(A/D)= 0,4*0,02 = 0,008 = 0,281


0,4*0,02+0,35*0,03+0,25*0,04 0,0285

P(C/D)= 0,25*0,04 = 0,01 = 0,351


0,4*0,02+0,35*0,03+0,25*0,04 0,0285
12
La línea de producción con mayor probabilidad de haber producido la pieza defectuosa es B
Estadística:
 El campo de la Estadística tiene que ver con la recopilación,
presentación, análisis y uso de datos para tomar decisiones
y resolver problemas.

 La importancia de la estadística en la ingeniería, la ciencia y


la administración ha sido subrayada por la participación en
la industria en el aumento de la calidad. Muchas compañías
se han dado cuenta de que la baja calidad de un producto
(defectos de fabricación, baja confiabilidad en su
rendimiento) tiene un efecto muy pronunciado en la
productividad global de la Empresa. La estadística es un
elemento decisivo en el incremento de la calidad, ya que las
técnicas estadísticas pueden emplearse para describir y
comprender la variabilidad.

Curso : Modelación y Simulación 13


Estadística Descriptiva

Media aritmética:
La media aritmética o media de un conjunto de N números x1,x2,x3,....,xn
se representa por x y se define como
n
 xj
j=1__
x = x1 + x2 +x3 +......+ xn =
N N

Curso : Modelación y Simulación 14


Estadística Descriptiva
Mediana:

Sean x1,x2,x3,.....,xn una muestra acomodada en orden creciente de


magnitud,; esto es x1 denota la observación pequeña y x n denota la
observación más grande. Entonces la mediana x se define como la parte
media o la (  n+1 / 2)-ésima observación si n es impar, o el promedio
entre las dos observaciones intermedias la (n / 2)-ésima y la (  n / 2)+1)-
ésima si n es par. En términos matemáticos

  n  1 / 2   impar

x n  2   x  n / 2  1  par
___________________
2

Curso : Modelación y Simulación 15


Estadística Descriptiva
Moda:

La moda es la observación que se presenta con mayor frecuencia en la


muestra. Esta puede no existir cuando los datos no están agrupados o ser
bimodales, etc.

Curso : Modelación y Simulación 16


Estadística Descriptiva
Varianza muestral y desviación estándar muestral.

Las medidas más importantes de variabilidad son la varianza muestral y la


desviación estándar muestral.
Si x1,x2,x3,.....,xn es una muestra de n observaciones, entonces la varianza
muestral es:

2
1 n
 _

x  X i  X 
2
S 
n  1 i 1  

La desviación estándar S es la raíz cuadrada positiva.

Curso : Modelación y Simulación 17


Estadística Descriptiva
Coeficiente de Variación:

En ocasiones es deseable expresar la variación como una fracción de la


Media. El coeficiente de variación es útil cuando se compara la variabilidad
de dos o más conjuntos de datos que difieren de manera considerable en la
magnitud de las observaciones.
El coeficiente muestral es:

S
CV 
x

Curso : Modelación y Simulación 18


Estadística Descriptiva

Error estándar:

El error estándar de una estadística es la desviación estándar de su


distribución de muestreo.
Si el error estándar involucra parámetros desconocidos cuyos valores
pueden estimarse, la sustitución de estas estimaciones en el error estándar
da como resultado un error estándar estimado.

 x 

El error estándar da alguna idea sobre la precisión de la estimación. Si no


se sabe que valor tiene  pero se sustituye la desviación estándar muestral
S en la ecuación anterior, entonces el error estándar estimado de x es

 
S
 x

n

Curso : Modelación y Simulación 19


Estadística Descriptiva

Rango de la Muestra:

Una medida muy sencilla de variabilidad es el rango de la muestra,


definido como la diferencia entre las observaciones más grande y más
pequeña.

r = máx (xi) - min (xi)

Curso : Modelación y Simulación 20


Estadística Descriptiva
Coeficiente de Asimetría:

El coeficiente de simetría  que mide el grado de asimetría o falta de


simetría de una distribución. Y se define por

3
  
n n 
Xi  X 
   
(n 1)(n  2) i 1  
 S 

Curso : Modelación y Simulación 21


Estadística Descriptiva
Curtosis:

El coeficiente de curtosis es una medida de achatamiento de un histograma


con respecto al modelo teórico de Gauss.
El coeficiente de curtosis se define por
4
  
n(n 1) n 
Xi  X  3 (n 1)
2

k    
(n 1)(n  2)(n  3) i 1 

S 

(n  2)(n 3)

Se puede demostrar que:

E  0  histograma más puntiagudo que la ley de Gauss (leptocúrtica)

E  0  histograma más achatado que la ley de Gauss (platicúrtica)

E  0  histograma sin achatamiento (mesocúrtica)

Curso : Modelación y Simulación 22


Estadística Descriptiva
 Histograma

  Un histograma o histograma de frecuencias consiste en una serie de rectángulos que

tienen:

  1.- Sus bases sobre un eje horizontal con centros en las marcas de clase y longitud

igual al tamaño de los intervalos de clase.

2.- Superficie proporcionales a las frecuencias de clase, el número de observaciones en

una clase recibe el nombre de frecuencia de clase. La marca de clase es el punto

medio del intervalo de clase y se obtiene sumando los límites inferior y superior de la

clase y dividiendo por 2. 

3.- Un polígono de frecuencia es un gráfico de línea trazado sobre las marcas de clase.
Curso : Modelación y Simulación 23
Estadística Descriptiva
 Reglas generales para formar la distribución de frecuencias

1.- Determinar el mayor y el menor entre los datos registrados y así encontrar el rango.

2.- Dividir el rango en un número conveniente de intervalos de clase del mismo tamaño,

el número de clases que se emplea para clasificar los datos en un conjunto dependen

del total de observaciones en éste. Si el número de observaciones es relativamente

pequeño, el número de clase a emplear será cercano a cinco, pero generalmente nunca

menor que este valor. Si existe una cantidad sustancial de datos, el número de clases

debe encontrarse entre ocho y doce y generalmente no existirán mas de 15 clases. Un

número muy pequeño de clases puede ocultar la distribución real del conjunto de datos,

mientras que un número muy grande puede dejar sin observaciones o lagunas de las

clase, limitando de esta forma su uso.


Curso : Modelación y Simulación 24
Estadística Descriptiva
 Criterio de Sturguess

 Es usado ampliamente , ya que entrega la dimensión del intervalo de clase que

permite la mejor definición de la forma real de la distribución en estudio. Para

estimar el intervalo de clase Sturguess planteó la siguiente expresión.


xmax  xmin
  IC 
 
1  3,322 log(n)
 Raíz cuadrada del número de observaciones

IC  n
Curso : Modelación y Simulación 25
Estadística Descriptiva
Desviación estandar 12,05147 Mínimo 10
Media 36,53264 Varianza de la muestra 145,238 Máximo 69,9
Error Típico 0,163652 curtosis -0,39836 Suma 198116,5
Mediana 36 coeficiente de asimetría 0,291128 Cuenta 5423
Moda 45,5 Rango 59,9

Histograma Grupal vacios<4

600 0,035

500 0,03
F r e c u e n c ia

0,025
400
0,02
Frcuencia
300
norm al
0,015
200
0,01

100 0,005

0 0

Velocidad [Km/h]

Curso : Modelación y Simulación 26


Histograma Sturges vacios<4

800 0,035

700 0,03

600
Fre 0,025
cu
en 500
cia 0,02
Frecuencia
400
normal
0,015
300

0,01
200

100 0,005

0 0
10,00 14,47 18,9423,41 27,88 32,35 36,83 41,3045,77 50,24 54,71 59,18 63,65

Velocidad [Km/h]

Histograma raiz de (n) vacios <4

200 0,035
180
0,03
F r e c u e n c ia

160
140 0,025

120 0,02
Frecuencia
100
0,015 norm al
80
60 0,01
40
0,005
20
0 0

Velocidad [Km/h]

Curso : Modelación y Simulación 27


Distribución de Poisson
Es una distribución de probabilidad discreta con un parámetro λ < 0 cuya función de
masa para sucesos es

Aquí e significa el número e y x! significa el factorial de x.


Se prefiere su uso por sobre una distribución binominal cuando los valores de p <
0.10 y (p * n) < 10 ", donde p es la probabilidad de acierto y n es el numero de
eventos.
La distribución de Poisson describe el número de sucesos en una unidad de tiempo
de un proceso de Poisson. Muchos fenómenos se modelan como un proceso de
Poisson, por ejemplo las llamadas telefónicas en una empresa o los accidentes en
una carrera.
El valor esperado y la varianza de una variable aleatoria X de distribución Poisson
son
E[X] = V[X] = λ

Curso : Modelación y Simulación 28


Distribución de Poisson
Ejemplo

Un número promedio de camiones tanque que llega cada día a cierta ciudad
portuaria es 10. Las instalaciones en el puerto pueden manejar a lo más 15
camiones tanque por día. ¿ Cuál es la probabilidad de que en un día dado los
camiones se tengan que regresar?

Solución

Sea X el número de camiones tanque que llegan cada día.Entonces con el uso de la
tabla de poisson tenemos

15
P(x>15)= 1- P(X15)=1-  p ( x;10) = 1-0,9513= 0,0487
x 0

15 1510
P ( x  15)  e
10!

Curso : Modelación y Simulación 29


Distribución Binomial
En estadística la distribución binomial es una distribución probabilidad discreta
describiendo el numero de éxitos de n experimentos independientes con
probabilidad p de un éxito.

Su función de densidad es

Eso es por que en n experimentos (o eventos) hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x éxitos (o aciertos) (probabilidad pk) y n − x no-
éxitos ((1 − p)n − x).

El valor esperado de una variable aleatoria de probabilidad binominal es E[x] = np y


su varianza V[x] = np(1 − p).

Curso : Modelación y Simulación 30


Distribución Binomial
La probabilidad de que cierta clase de componente sobreviva a una prueba de choque
dada es 3/4 . Encuentre la probabilidad de que sobrevivan exactamente dos de los
siguientes cuatro componentes que se prueben.

Solución

Suponga que las pruebas son independientes y como p=3/4 para cada una de las 4
pruebas tenemos

2
4 4¡ 32
B(2;4,3/4)=    3 / 4  2
(1 / 4 ) 2
 x  27 / 128 =0,2109
2 2¡ x 2¡ 4 4

Curso : Modelación y Simulación 31


Distribución Normal
 Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su

propio nombre indica su extendida utilización, justificada por la frecuencia o

normalidad con la que ciertos fenómenos tienden a parecerse en su

comportamiento a esta distribución.

 Muchas variables aleatorias continuas presentan una función de densidad cuya

gráfica tiene forma de campana.

 En resumen, la importancia de la distribución normal se debe principalmente a que

hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la

normal
Curso : Modelación y Simulación 32
Distribución Normal

• Sin lugar a dudas, la distribución más utilizada para


modelar experimentos aleatorios es la distribución normal

Representación gráfica de esta función de densidad

Curso : Modelación y Simulación 33


Distribución Normal
F(x) es el área sombreada de esta gráfica

Curso : Modelación y Simulación 34


Distribución Normal
TIPIFICACIÓN

Por tanto su función de densidad es

y su función de distribución es

Curso : Modelación y Simulación 35


Distribución Normal
siendo la representación gráfica de esta función

a la variable Z se la denomina variable tipificada de X, y a la curva de su


función de densidad curva normal tipificada.

Curso : Modelación y Simulación 36


Manejo de tablas, casos más frecuentes

La distribución de la variable z se encuentra tabulada

Curso : Modelación y Simulación 37


Manejo de tablas, casos más frecuentes

Curso : Modelación y Simulación 38


Manejo de tablas, casos más frecuentes

Curso : Modelación y Simulación 39


Manejo de tablas, casos más frecuentes

Curso : Modelación y Simulación 40


EJERCICIO
 
 
Tipificamos:
 
Los resultados de una prueba objetiva de La probabilidad de obtener puntuación entre 70 y 90 es:
P(70≤X≤90)=p(-1,67≤X≤1,67)
selección pasada a 200 personas indicaron que
z1=(70-80)/6=-1,66666667
la distribución de puntuaciones era normal, con
z2=(90-80)/6=1,66666667
media de 80 puntos y desviación típica de 6
0,0478 0,9522
puntos. Calcular cuántos examinados han
+0,9522-0,0478=0,9044
obtenido una puntuación entre 70 y 90 puntos.
Si se eligen al azar dos de esas 200 personas,
 y el número esperado de individuos que la obtienen es:
calcular la probabilidad de que ambas personas
 
tengan puntuación superior a 90.
n=0,9044*200=180,883859
n= 181
 
La probabilidad de que una persona tenga puntuación
superior a 90 es:

P(X>90)=P(Z>1,67)=1- 0,9522 =0,0478


 
Y para dos personas:
 
p= 0,0478*0,0478 =0,00228484

Curso : Modelación y Simulación 41


EJERCICIO
z1=(30-60)/6 -5

z1=(40-60)/6 -3,33333333
Los resultados de una prueba objetiva
de selección pasada a 200 personas La probabilidad de obtener puntuación entre 30 y 40 es:
indicaron que la distribución de
puntuaciones era normal, con media 60 0,0000 0,0004
puntos y desviación típica de 6 puntos.
Cada prueba se puntuó con 0 ó 1 con lo cual no hay ningún examinado con una puntuación entre 30 y 40
puntos. Calcular cuántos examinados
han obtenido una puntuación entre 30 y Por otro lado , la mínima puntuación por debajo de la cual está el 75 % de los examinados
40 puntos, y cuál es la mínima
puntuación por debajo de la cual están z normal
el 75 % de los examinados. 0,67 0,7486
0,68 0,7517
 
  se realiza una interpolación

Tipifiquemos la variable con los valores 0,01 0,0031


extremos dados:
valor buscado 0,0014
Luego

x=(0,0014*0,01)/0,0031 0,00451613

Zx=0,67+0,0045 0,6745

x1=6*zx+60 6*0,6745+60 64
Curso : Modelación y Simulación 42
La mínima puntuación por debajo de la cual está el 75 % de los examinados es 64
Distribución Normal
 Media Aritmética
1 n
 x   xi
n i 1
 Mediana
La mediana de un conjunto de observaciones se
ordenan de manera creciente, la mitad de éstas es
menor que este valor y la otra mitad mayor
 Moda
La moda de un conjunto de observaciones es el valor de
la observación que ocurre con mayor frecuencia en un
conjunto
Curso : Modelación y Simulación 43
Distribución Normal
 Desviación Estándar
1 n
 x   ( xi   x ) 2
n i 1
 Coeficiente de Simetría
Esta función caracteriza el grado de asimetría de una
distribución con respecto a su media. La asimetría positiva
indica una distribución unilateral que se extiende hacia valores
más positivos. La asimetría negativa indica una distribución
unilateral que se extiende hacia los valores más negativos
m3 1 n
  3 en que m3   ( xi   x )3
 n i 1
Curso : Modelación y Simulación 44
Distribución Normal
 Curtosis
La curtosis representala elevación o achatamiento de una
distribución , Una curtosis positiva indica una distribución
relativamente elevada, mientras que una curtosis negativa
indica una distribución relativamente plana.

m4 1 n
  4 en que m4   ( xi   x ) 4
 n i 1

Curso : Modelación y Simulación 45


Distribución Ji Cuadrado (2 )

•Es una distribución asimétrica.


• Solo toma valores positivos y es asintótica con
respecto al eje de las x positivas (0 < 2 < +).
• Está caracterizada por un único parámetro llamado:
grados de libertad (g.l.)
• El área comprendida entre la curva y el eje de las x
es 1 o 100%.

Curso : Modelación y Simulación 46


Gráfico de la distribución Ji Cuadrado

Región de Región de rechazo


aceptación

1- 
2 gl,

Curso : Modelación y Simulación 47


Distribución Ji Cuadrado

( 0  E ) 2

 
2 i i

Ei

Curso : Modelación y Simulación 48


Ejercicio Chi - Cuadrado
25

6
5
4 4

2 2 2 2
1

Curso : Modelación y Simulación 49


Ejercicio Chi-cuadrado
Marca
ai bi Fi Clase Fi*MC (xi-x) ^2 fi*(xi-x)^2
1,18 1,22 1 1,2 1,2 0,07002639 0,07002639
1,22 1,27 2 1,245 2,49 0,04823514 0,09647028
1,27 1,32 2 1,295 2,59 0,02877264 0,05754528
1,32 1,37 4 1,345 5,38 0,01431014 0,05724056
1,37 1,42 6 1,395 8,37 0,00484764 0,02908584
1,42 1,47 8 1,445 11,56 0,00038514 0,00308113
1,47 1,52 5 1,495 7,475 0,00092264 0,0046132
1,52 1,57 4 1,545 6,18 0,00646014 0,02584056
1,57 1,62 2 1,595 3,19 0,01699764 0,03399528
1,62 1,67 3 1,645 4,935 0,03253514 0,09760542
1,67 1,72 1 1,695 1,695 0,05307264 0,05307264
1,72 1,8 2 1,76 3,52 0,08724639 0,17449278
             
    40 suma 58,585 suma 0,70306938
      media 1,464625 varianza 0,01802742
          desviación 0,13426623
50
Ejercicio Chi-cuadrado area1 area2 area2-area1
frecuen
cia fre en %
(oj-
ej)^2
(oj-
ej)^2/ej
ai bi (ai-x)/s (bi-x)/s N(yc1)*100 N(yc2)*100 oj ej f*100/40
1,18 1,22 -2,113 -1,816 1,7299 3,4680 1,7380 1 2,500 0,5806 0,2322
1,22 1,27 -1,816 -1,445 3,4680 7,4246 3,9567 2 5,000 1,0886 0,2177
1,27 1,32 -1,445 -1,074 7,4246 14,1483 6,7236 2 5,000 2,9709 0,5942
1,32 1,37 -1,074 -0,702 14,1483 24,1188 9,9705 4 10,000 0,0009 0,0001
1,37 1,42 -0,702 -0,331 24,1188 37,0212 12,9024 6 15,000 4,3998 0,2933
1,42 1,47 -0,331 0,040 37,0212 51,5915 14,5703 8 20,000 29,4817 1,4741
1,47 1,52 0,040 0,411 51,5915 65,9500 14,3585 5 12,500 3,4540 0,2763
1,52 1,57 0,411 0,782 65,9500 78,2979 12,3479 4 10,000 5,5127 0,5513
1,57 1,62 0,782 1,153 78,2979 87,5645 9,2666 2 5,000 18,2040 3,6408
1,62 1,67 1,153 1,525 87,5645 93,6331 6,0686 3 7,500 2,0489 0,2732
1,67 1,72 1,525 1,896 93,6331 97,1012 3,4681 1 2,500 0,9372 0,3749
1,72 1,80 1,896 2,490 97,1012 99,3609 2,2597 2 5,000 7,5092 1,5018

x 1,4646 97,630996 40 100 9,42992


s 0,1347
chi calculado =9,43
v=k-1-m=12-1-2=9

chi v9,95= 16,93


chiv9 ,5= 3,32

ajuste bueno, es una


distribución normal
51
Ejercicio Chi-cuadrado

Límite Límite Frecuencia Frecuencia Porcentaje


Inferior Superior Acumulada
1,18 1,22 1 1 2,5
1,22 1,27 2 3 7,5
1,27 1,32 2 5 12,5
1,32 1,37 4 9 22,5
1,37 1,42 6 15 37,5
1,42 1,47 8 23 57,5
1,47 1,52 5 28 70,0
1,52 1,57 4 32 80,0
1,57 1,62 2 34 85,0
1,62 1,67 3 37 92,5
1,67 1,72 1 38 95,0
1,72 1,80 2 40 100,0

Curso : Modelación y Simulación 52


120

20

10
0

5 10 90
Curso : Modelación y Simulación 53
Ejercicio Chi-cuadrado

300

275 263
245
250

225

200

172
175
156
150

125

100

75 67
56
50

23
25 14
1 3
0

Curso : Modelación y Simulación 54


Ejercicio Chi-cuadrado
ai bi Fi Marca Clase Fi*MC (x-X)**2 Fi*(x-X)**2
27,5 31,5 1 29,5 29,5 331,677 331,677
31,5 35,5 14 33,5 469 201,981 2827,733
35,5 39,5 56 37,5 2100 104,285 5839,957
39,5 43,5 172 41,5 7138 38,589 6637,298
43,5 47,5 245 45,5 11147,5 4,893 1198,771
47,5 51,5 263 49,5 13018,5 3,197 840,796
51,5 55,5 156 53,5 8346 33,501 5226,147
55,5 59,5 67 57,5 3852,5 95,805 6418,931
59,5 63,5 23 61,5 1414,5 190,109 4372,506
63,5 67,5 3 65,5 196,5 316,413 949,239

1000 suma 47712 suma 34643,056


media 47,71 varianza 34,678
desviacion 5,889

Curso : Modelación y Simulación 55


Ejercicio Chi-cuadrado
area2- (oj-
        area1 area2 area1 frecuencia fre en % (oj-ej)^2 ej)^2/ej
ai bi (ai-x)/s (bi-x)/s N(yc1)*100 N(yc2)*100 oj ej f*100/1000    
27,5 31,5 -3,434 -2,754 0,0297 0,2940 0,2642 1 0,1 0,0270 0,270
31,5 35,5 -2,754 -2,075 0,2940 1,9001 1,6062 14 1,4 0,0425 0,030
35,5 39,5 -2,075 -1,395 1,9001 8,1474 6,2473 56 5,6 0,4190 0,075
39,5 43,5 -1,395 -0,716 8,1474 23,7113 15,5638 172 17,2 2,6770 0,156
43,5 47,5 -0,716 -0,036 23,7113 48,5634 24,8521 245 24,5 0,1240 0,005
47,5 51,5 -0,036 0,644 48,5634 74,0077 25,4443 263 26,3 0,7322 0,028
51,5 55,5 0,644 1,323 74,0077 90,7113 16,7036 156 15,6 1,2179 0,078
55,5 59,5 1,323 2,003 90,7113 97,7400 7,0287 67 6,7 0,1080 0,016
59,5 63,5 2,003 2,682 97,7400 99,6345 1,8945 23 2,3 0,1644 0,071
63,5 67,5 2,682 3,362 99,6345 99,9613 0,3268 3 0,3 0,0007 0,002
                     
x 47,712           1000     0,732
s 5,886                  
          chi calculado =0,7315   chi v7,95= 14,1    
          v=k-1-m=10-1-2=7   chiv7 ,5= 2,17    
                     
          ajuste muy bueno          
Curso : Modelación y Simulación 56
Ejercicio Chi-cuadrado

Límite Frecuencia Frecuencia Porcentaje


Superior Acumulada  
31,5 1 1 0,1
35,5 14 15 1,5
39,5 56 71 7,1
43,5 172 243 24,3
47,5 245 488 48,8
51,5 263 751 75,1
55,5 156 907 90,7
59,5 67 974 97,4
63,5 23 997 99,7
67,5 3 1000 100,0

Curso : Modelación y Simulación 57


Curva tonelaje vs ley
Formulas
Calculo de área: Ocupando la normal reducida

Xc  
Yc 

%( Xc)   (Yc)

Ley media Yc 2

 e 2
 ( Xc)    *
2  (Yc)

Curso : Modelación y Simulación 58


Curva tonelaje vs ley
Ejemplo
µ=47,712 =5,886 Xc=40

Xc   40  47,712
Yc    1,31
 5,886
%(  Xc)   (Yc)  1  0,0951  0,9049  90,49%

Ley media Yc 2 ( 1, 31) 2


 
 e 2 5,886 e 2
 ( Xc)    *  47,712  *  53,385
2  (Yc) 2 * 3,14 0,9049

Curso : Modelación y Simulación 59


Curva tonelaje vs ley
Tonelaje Total =100.000 toneladas 100.000

% XC (ai-x)/s Normal %(+Xc) Tonelaje n exp Ley


25 -3,859 0,000 1,000 99994,3 -7,445 0,001 47,71
30 -3,009 0,001 0,999 99869,1 -4,528 0,011 47,74
35 -2,160 0,015 0,985 98460,5 -2,332 0,097 47,94
40 -1,310 0,095 0,905 90494,8 -0,858 0,424 48,81
45 -0,461 0,322 0,678 67751,8 -0,106 0,899 50,83
50 0,389 0,651 0,349 34873,7 -0,076 0,927 53,96
55 1,238 0,892 0,108 10781,5 -0,767 0,465 57,83
60 2,088 0,982 0,018 1841,1 -2,179 0,113 62,14
x 47,712
s 5,8858

R2pi 2,50659769

2
Yc

 e 2
  Xc     *
2  ( Yc )
(  1 , 31 ) 2

5 , 886 e 2
   40   47 , 712  *
2 * 3 ,14 0 , 9049
Curso : Modelación y Simulación 60
Curva tonelaje vs ley

Curso : Modelación y Simulación 61


Coeficiente de correlación
 El coeficiente de correlación se define por :
S xy
rxy 
Sx * S y
donde :
 1  rxy  1
 La correlación es nula si rxy=0

Curso : Modelación y Simulación 62


Línea de Regresión
 La linea de regresión se define por:

 Sx    
y  rxy  x  x  y
Sy  

Curso : Modelación y Simulación 63


Producción Costo
n x y X-x Y-y (X-x)^2 (Y-y)^2 (X-x)(Y-y)
1 1,5 2,5 -1,45 -1,01 2,103 1,020 1,4645
2 2,0 3,1 -0,95 -0,41 0,903 0,168 0,3895
3 3,0 3,8 0,05 0,29 0,002 0,084 0,0145
4 1,5 2,1 -1,45 -1,41 2,103 1,988 2,0445
5 3,5 4,3 0,55 0,79 0,303 0,624 0,4345
6 3,0 3,2 0,05 -0,31 0,002 0,096 -0,0155
7 4,5 4,8 1,55 1,29 2,403 1,664 1,9995
8 4,0 3,9 1,05 0,39 1,103 0,152 0,4095
9 4,0 4,4 1,05 0,89 1,103 0,792 0,9345
10 2,5 3,0 -0,45 -0,51 0,203 0,260 0,2295

Suma 29,5 35,1 10,225 6,849 7,905


Media 2,95 3,51
Varianza 1,136 0,761
Desviación Sta 1,066 0,872
Covarianza 0,878
Coeficiente correlación 0,945 0,77310513
2,28066015
S  
 
1,22933985
y  r xy
x
 x  x   y
S y  
Y=1,229+0,77*X

6,0

5,0

4,0

3,0 Datos
Recta
2,0
Lineal (Recta)
1,0

0,0
0,0 1,0 2,0 3,0 4,0 5,0 6,0

64
Regresión Lineal Múltiple
Supongamos que la variable Y depende de las variables X1,X2,X3,
por analogía con el modelo lineal simple se puede formular el
modelo siguiente

Y    1 X 1   X 2   X 3
i 0 i 2 i 3 i

En que X1,X2;x3 son los valores de las variable independientes en


el experimento i, siendo Yi, la respuesta correspondiente.
Debido a la presencia de más de dos variables , este modelo se
llama regresión lineal múltiple.

Para estimar los parámetros 0 , 1, 2, 3 se utiliza el método de


los mínimos cuadrados, minimizando la cantidad:

n
D   (Y     X 1   X 2   X 3 )2
0 1 i 2 i 3 i
i 1 i

Curso : Modelación y Simulación 65


Regresión Lineal Múltiple
al derivar parcialmente D con respecto a parámetros 0, 1, 2, 3,
se llega al sistema de ecuaciones siguientes, llamado sistema
normal

n 0  X 1 1  X 2  2  X 3  3  Y
X 1  0  X 12 1  X 1 X 2  2  X 1 X 3  3  X 1Y
X 2  0  X 2 X 1 1  X 22  2  X 2 X 3  3  X 2Y
X 3  0  X 3 X 1 1  X 3 X 2  2  X 32  3  X 3Y

Coeficiente de determinación r2 que corresponde al índice de


ajuste lineal, siendo r el coeficiente de correlación múltiple

Curso : Modelación y Simulación 66


Regresión Lineal Múltiple
Ejemplo

Montgomery y Peck (1992) describen el uso de un modelo de


regresión para relacionar la cantidad de tiempo que requiere un
vendedor para dar servicio a una máquina expendedora de refrescos,
con el número de envases contenidos en la máquina y la distancia del
vehículo de servicio al sitio donde se encuentra la máquina . Este
modelo fue utilizado para diseñar la ruta , los horarios y la salida de
vehículos, La tabla presenta 25 observaciones del tiempo de
suministro tomadas del mismo estudio descrito por Montgomery y
Peck.

Curso : Modelación y Simulación 67


Regresión Lineal Múltiple
Y x1 x2 x1*x1 x1*x2 x1*y x2*x2 x2*y
1 9,95 2,00 50,00 4,00 100,00 19,90 2500 497,5
2 24,45 8,00 110,00 64,00 880,00 195,60 12100 2689,5
3 31,75 11,00 120,00 121,00 1320,00 349,25 14400 3810
4 35,00 10,00 550,00 100,00 5500,00 350,00 302500 19250
5 25,02 8,00 295,00 64,00 2360,00 200,16 87025 7380,9
6 16,86 4,00 200,00 16,00 800,00 67,44 40000 3372
7 14,38 2,00 375,00 4,00 750,00 28,76 140625 5392,5
8 9,60 2,00 52,00 4,00 104,00 19,20 2704 499,2
9 24,35 9,00 100,00 81,00 900,00 219,15 10000 2435
10 27,50 8,00 300,00 64,00 2400,00 220,00 90000 8250
11 17,08 4,00 412,00 16,00 1648,00 68,32 169744 7036,96
12 37,00 11,00 400,00 121,00 4400,00 407,00 160000 14800
13 41,95 12,00 500,00 144,00 6000,00 503,40 250000 20975
14 11,66 2,00 360,00 4,00 720,00 23,32 129600 4197,6
15 21,65 4,00 205,00 16,00 820,00 86,60 42025 4438,25
16 17,89 4,00 400,00 16,00 1600,00 71,56 160000 7156
17 69,00 20,00 600,00 400,00 12000,00 1380,00 360000 41400
18 10,30 1,00 585,00 1,00 585,00 10,30 342225 6025,5
19 34,93 10,00 540,00 100,00 5400,00 349,30 291600 18862,2
20 46,59 15,00 250,00 225,00 3750,00 698,85 62500 11647,5
21 44,88 15,00 290,00 225,00 4350,00 673,20 84100 13015,2
22 54,12 16,00 510,00 256,00 8160,00 865,92 260100 27601,2
23 56,23 17,00 590,00 289,00 10030,00 955,91 348100 33175,7
24 22,13 6,00 100,00 36,00 600,00 132,78 10000 2213
25 21,15 5,00 400,00 25,00 2000,00 105,75 160000 8460
Y
suma 725,42 206 8294 2396 77177 8001,67 3531848 274580,71

Ecuaciones 1 B0*n+B1*X1+B2*X2=Y
2 B0*X1+B1*X1*X1+B2*X1*X2=X1*Y
3 B0*X2+B1*X1*X2+B2*X2*X2=X2*Y

Y=B0+B1*x1+B2*X2

68
Regresión Lineal Múltiple
Ecuaciones 1 25*B0 +206*B1 +8294*B2 =725,42 *206
2 206*B0 +2396*B1 +77177*B2 =8001,67 *25
3 8294*B0 +77177*B1 +3531848*B2 =274580,71

5150 42436 1708564 149436,52


5150 59900 1929425 200041,75

0 17464 220861 50605,23 12,64664453

B1 = 2,89768839 -12,646644*B2

6942,861377 -30301,36028
223634,8967 -976030,0846

206 46875,64 1058,81 *8294


8294 2555817,92 50945,82 *206

1708564 388786558 8781770,14


1708564 526498492 10494838,92

0 137711933 1713068,78

B2 = 0,012439509 57,73041402
B1= 2,740370335 475,6986021 2,309216515
B0= 2,309216561

Y=2,3092+2,7403*X1+0,0124*X2

Curso : Modelación y Simulación 69


Regresión Lineal Múltiple
Y= 2,31 + 2,740 X1 0,0124 X2

Y Ys ei Y-YM Ys-YsM (Y-YM)^2 (Ys-YsM)^2 (Y-YM)*(Ys-YsM)


1 9,95 8,4098 1,54 -19,07 -20,59 363,543 424,084 392,648
2 24,45 25,5956 -1,15 -4,57 -3,41 20,856 11,611 15,561
3 31,75 33,9405 -2,19 2,73 4,94 7,470 24,378 13,495
4 35,00 36,5322 -1,53 5,98 7,53 35,799 56,687 45,048
5 25,02 27,8896 -2,87 -4,00 -1,11 15,974 1,240 4,450
6 16,86 15,7504 1,11 -12,16 -13,25 147,788 175,634 161,110
7 14,38 12,4398 1,94 -14,64 -16,56 214,236 274,343 242,434
8 9,60 8,4346 1,17 -19,42 -20,57 377,012 423,063 399,374
9 24,35 28,2119 -3,86 -4,67 -0,79 21,779 0,626 3,692
10 27,50 27,9516 -0,45 -1,52 -1,05 2,301 1,106 1,595
11 17,08 18,3792 -1,30 -11,94 -10,62 142,487 112,867 126,815
12 37,00 37,4125 -0,41 7,98 8,41 63,731 70,718 67,134
13 41,95 41,3928 0,56 12,93 12,39 167,268 153,505 160,239
14 11,66 12,2538 -0,59 -17,36 -16,75 301,259 280,539 290,714
15 21,65 15,8124 5,84 -7,37 -13,19 54,270 173,994 97,173
16 17,89 18,2304 -0,34 -11,13 -10,77 123,806 116,051 119,866
17 69,00 64,5552 4,44 39,98 35,55 1598,656 1263,952 1421,487
18 10,30 12,3035 -2,00 -18,72 -16,70 350,319 278,877 312,563
19 34,93 36,4082 -1,48 5,91 7,41 34,966 54,836 43,788
20 46,59 46,5137 0,08 17,57 17,51 308,817 306,621 307,717
21 44,88 47,0097 -2,13 15,86 18,01 251,641 324,238 285,642
22 54,12 52,478 1,64 25,10 23,47 630,171 551,071 589,295
23 56,23 56,2103 0,02 27,21 27,21 740,558 740,232 740,395
24 22,13 19,991 2,14 -6,89 -9,01 47,428 81,218 62,065
25 21,15 20,9707 0,18 -7,87 -8,03 61,887 64,519 63,189

SUMA 725,42 725,08 6084,021 5966,009 5967,491


MEDIA 29,0168 29,00 253,501 248,584 248,645
15,922 15,767

Coeficiente de correlación múltiple r 0,99049999


Coeficiente de determinación r^2 0,98109023

Curso : Modelación y Simulación 70


Regresión Lineal Múltiple Matricial
 Sean
 K: Número de variables de Regresión
 n: número de observaciones en la forma
 ((Xi1;Xi2;Xi3;…..;Xik);Yi) con i=1,2,3,…n)

 Y el modelo de regresión
k
 Yi= Bo+  j X ij   i
j 1

Curso : Modelación y Simulación 71


Regresión Lineal Múltiple Matricial
 Este Modelo es un sistema de n ecuaciones
que puede expresarse en forma matricial
como

Y1  1 X 11 X 12 ......X 1k   0   1 
Y       
 1 X X ...... X 2k 
Y   2    1  y  2
21 22
X  
.  . .  . 
       
Yn  1 X n1 X n 2 ...... X nk   k   n 

Curso : Modelación y Simulación 72


Regresión Lineal Múltiple Matricial
 Se desea encontrar el vector de estimadores de
minimos cuadrados que es:

 L=´= (y-Xβ)´(y-Xβ)

 Al derivar en forma parcial nos queda


 X´Xβ=X´y

 El estimador de mínimos cuadrados es:


ˆ  X T X  1
X tY
Curso : Modelación y Simulación 73
Regresión Lineal Múltiple Matricial
 En el ejemplo : x1 x2
9,95 1 2 50
24,45 1 8 110
31,75 1 11 120
35,00 1 10 550
25,02 1 8 295
16,86 1 4 200
14,38 1 2 375
y 9,60 X 1 2 52
24,35 1 9 100
27,50 1 8 300
17,08 1 4 412
37,00 1 11 400
41,95 1 12 500
11,66 1 2 360
21,65 1 4 205
17,89 1 4 400
69,00 1 20 600
10,30 1 1 585
34,93 1 10 540
46,59 1 15 250
44,88 1 15 290
54,12 1 16 510
56,23 1 17 590
22,13 1 6 100
21,15 1 5 400

Curso : Modelación y Simulación 74


Regresión Lineal Múltiple Matricial
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 50
2 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5 1 8 110
50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 1 11 120
1 10 550
25 206 8294 1 8 295
206 2396 77177 1 4 200
8294 77177 3531848 1 2 375
1 2 52
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 9 100
2 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5 1 8 300
50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 1 4 412
1 11 400
725,42 9,95 1 12 500
8001,67 24,45 1 2 360
274580,71 31,75 1 4 205
35,00 1 4 400
25 206 8294 -1 725,42 25,02 1 20 600
206 2396 77177 8001,67 16,86 1 1 585
8294 77177 3531848 274581 14,38 1 10 540
9,60 1 15 250
0,2146526 -0,0074909 -0,0003404 725,42 24,35 1 15 290
-0,0074909 0,0016708 -0,0000189 8001,67 27,50 1 16 510
-0,0003404 -0,0000189 0,0000015 274581 17,08 1 17 590
37,00 1 6 100
41,95 1 5 400
2,309200429 11,66
2,740369424 21,65
0,012439581 17,89
69,00
Y=2,3092+2,74037*X1+0,01244*X2 10,30
34,93
46,59
44,88
54,12
56,23
22,13
21,15

Curso : Modelación y Simulación 75


Estimación Puntual
Propiedades de los estimadores

ECM (ˆ)  E   ˆ   2 
Insesgadez :
Es mínimo cuando E (ˆ)   . Y de este modo,
el Error Cuadrático Medio es la varianza del
estimador.
Eficiencia: Dado un tamaño de muestra fijo, se
busca, entre los estimadores, el que menor
varianza tenga.
Curso : Modelación y Simulación 76
Estimación Puntual
Consistencia: Nos dice que, cuando el tamaño de las
muestra se incrementa, el estimador puntual debe estar próximo
al parámetro con probabilidad alta.
Suficiencia: El estimador puntual debe resumir la
información proporcionada por la muestra aleatoria Además no
debe haber pérdida de ésta.

Invarianza: Si es el estimador de , esta propiedad nos


dice que g() tiene como estimador a g( ).

Robustez: Se presenta cuando la distribución del


estimador no se ve seriamente afectada por violaciones en los
supuestos.
Curso : Modelación y Simulación 77
Consistencia: Nos dice que, cuando el tamaño de
las muestra se incrementa, el estimador puntual debe
estar próximo al parámetro con probabilidad alta.

Suficiencia: El estimador puntual debe resumir la


información proporcionada por la muestra aleatoria
Además no debe haber pérdida de ésta.

Invarianza: Si es el estimador de , esta propiedad


nos dice que g() tiene como estimador a g(ˆ).

Robustez: Se presenta cuando la distribución del


estimador no se ve seriamente afectada por violaciones
en los supuestos.

Curso : Modelación y Simulación 78


Ley de los Grandes Números
Como caso especial, cuando Z es x , la
=
media muestral, tenemos que E( ) x
y x converge a .
De la misma manera, s2 converge a 2
cuando n tiende a infinito.

Curso : Modelación y Simulación 79


Teorema del Límite central
Sea x1, x2, ..., xn una muestra aleatoria de
observaciones tomadas de la misma distribución y
sea E(Xi)= y Var(Xi)= 2.
Entonces la distribución muestral de la variable
aleatoria
n( x   )
Zn 

converge a la normal standard cuando n tiende a


infinito.
Curso : Modelación y Simulación 80
Teorema central del Límite
El TCL es una herramienta muy poderosa
porque se cumple aún cuando la
distribución desde la que se toman las
observaciones no sea normal. Esto significa
que si nosotros nos aseguramos que el
tamaño de la muestra es grande, entonces
podemos usar la variable Zn para responder
preguntas acerca de la población de la cual
provienen las observaciones.
Curso : Modelación y Simulación 81
Estos dos conceptos anteriores sirven para
prepararnos para dos objetivos básicos de
cualquier estudio empírico: la estimación de
parámetros desconocidos que nos interesan
y la prueba de hipótesis

Curso : Modelación y Simulación 82


Cálculo del tamaño de la muestra
El tamaño de la muestra para un diseño de encuestas
basado en una muestra aleatoria simple, puede calcularse
por la siguiente fórmula

Z 2 pqN
n
NE 2  Z 2 pq

Curso : Modelación y Simulación 83


Cálculo del tamaño de la muestra
 Donde:
  n es el tamaño de la muestra
 Z es el nivel de confianza del 95%, y es igual a 1,96 según la tabla de distribución normal
es decir: P(-1,96<z<1,96)=0,95

 p es la variabilidad positiva, es decir la probabilidad con que se acepta la hipótesis que se


quiere investigar, con un valor de 0,5.

 q es la variabilidad negativa, es decir, la probabilidad con que se rechaza la hipótesis


que se quiere investigar, con un valor de 0,5.
 N es el tamaño de la población, de 684 individuos.

 E es la precisión o el error, con un valor del 5 % de error.

1,96 2 x0,5 x0,5 x0,5 x684


n  246 individuos
684 x0,05  1,96 x0,5 x0,5
2 2

Curso : Modelación y Simulación 84


Cálculo del tamaño de la muestra
otra Forma: El tamaño de la muestra para un diseño de
encuestas basado en una muestra aleatoria simple, puede
calcularse por la siguiente fórmula

t 2 * p(1  p)
n
m2
n= tamaño de la muestra requerido
T= nivel de fiabilidad (95 % = 1,96)
P=probabilidad de ocurrencia
m=margen de error( 5%=0.05)
Curso : Modelación y Simulación 85
Ejemplo
Se ha determinado que en una población cerca del 30 %(0.3) de los
niños están desnutridos.
Este datos de basa en estadísticas nacionales . Determine con una 95
% de confianza el tamaño de la muestra requerido

1,96 2 * 0.3(1  0.3)


n
0.05 2
n=322,72 323
Se considera un efecto de diseño 2 luego el número de muestreas
es : n*d=323X2=646
Corrección por imprevistos aumenta en un 5 % como errores
N=646x1,05=690 niños
Curso : Modelación y Simulación 86

También podría gustarte