Clase 1 Probabilidades Distribuciones

Probabilidades
DEFINICIÓN
Probabilidad de un suceso es el número al que tiende la
frecuencia relativa asociada al suceso a medida que el
número de veces que se realiza el experimento crece.
La frecuencia relativa de un suceso A:
Fr (a)= número de veces que aparece A

Número de veces que se realiza el experimento
Curso : Modelación y Simulación 1

Probabilidades
DEFINICIÓN DE LAPLACE
En el caso de que todos los sucesos elementales del espacio muestral
E sean equiprobables, Laplace define la probabilidad del suceso A
como el cociente entre el número de resultados favorables a que ocurra
el suceso A en el experimento y el número de resultados posibles del
experimento.
Si E={x1,x2,…..,xk} y P(x1)=P(x2)=……=P(xk), entonces:
P(A)= número de casos favorables al suceso A

número de casos posibles

Probabilidades
Permutaciones
Una permutación es un arreglo de todo o parte de un conjunto de
datos, el número de permutaciones de n objetos distintos es n!
el número de permutaciones de n objetos tomados de r a la vez es
n!
n Pr 
(n  r )!
Ejemplo 1
Considere las tres letras a,b y c, las permutaciones posibles son
abc, acb, bac, bca, cab y cba
n !=3 !=1*2*3=6

Probabilidades
Ejemplo 2
Se sacan dos billetes de lotería de 20 para un primer y
un segundo premios. Encuentre el número de puntos
muéstrales en el espacio S.
Solución
n! 20!
 P   20 *19  380
n Pr 
20 2
( n  r )! ( 20  2)!

Probabilidades
Combinaciones
El número de combinaciones de n objetos distintos tomados de r a
la vez es
n n!
  
 r  r!(n  r )!
Ejemplo
En una mano de póquer que consiste en cinco cartas, encuentre la
probabilidad de tener 2 ases y tres sotas

Probabilidades
Solución
El número de formas de tener dos ases de cuatro es:
 4 4!
   6
 2  2!(2)!
y el número de formas de tener tres sotas de cuatro es:
 4 4!
   4
 3  3!(1)!
Mediante la regla de multiplicación hay n=6*4=24 manos con dos
ases y tres sotas.

Probabilidades
El número total de 5 manos de póquer de cinco cartas, las cuales son
igualmente probables es
 52  52!
N      2.598.960
 5  5!(47)!
por tanto la probabilidad de obtener dos ases y tres sotas en una mano de
póquer de cinco cartas es:
24
P( x)   0,9 x10  5
2.598.960

Probabilidades
Experimentos Aleatorios
Un experimento aleatorio es aquel que proporciona diferentes
resultados aun cuando se repita siempre de la misma forma.
Espacio Muestral
Un conjunto de los posibles resultados de un experimento
aleatorio recibe el nombre de espacio muestral del experimento
Evento
Un evento es un subconjunto del espacio muestral de un
experimento aleatorio.

Probabilidades
Axiomas de Probabilidades
La probabilidad es un número que se asigna a cada miembro de una
colección de eventos de un experimento aleatorio y que satisface las
siguientes propiedades

1.- P(s) =1
2.- 0  P ( E )  1
3.- Para dos eventos E1 y E2

P(E1 U E2)= P(E1)+P(E2)-P(E1∩E2 )
con E1∩E2 =ø, P(E1 U E2)= P(E1)+P(E2)

Probabilidades
Probabilidad Condicional
La probabilidad condicional de un evento A dado un Evento B, denotada
por P(A\B), es :
P(A\B)= P( A ∩ B) / P(B) si P(B)>0

Probabilidad Total
Sea A1,a2,… An, un sistema completo de sucesos tales que la probabilidad
de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del
que se conocen las probabilidades condicionales P(B\Ai), entonces la
probabilidad del suceso B viene dada por la expresión.
P(B)= P(A1)*P(B/A1)+P(A2)*P(B/A2)+…..+P(An)*P(B/An)

Probabilidades
Teorema de Bayes
Sea A1,A2,....An un sistema completo de sucesos,
tales que la probabilidad de cada uno de ellos es
distinta de cero, y sea B un suceso cualquier del que

se conocen las probabilidades condicionales P(B/Ai),

entonces la probabilidad P(Ai/B) viene dada por la
expresión :
P(Ai/B)= P(Ai)* P(B/Ai)
P(A1)*P(B/A1)+ P(A2)*P(B/A2) +.....+ P(An)*P(B/An)

1.- Tres líneas de producción de ánodos, A, B, C producen el 40%, 35%, 25%,
respectivamente, del total de la producción. Los porcentajes de ánodos defectuosos de
estas líneas son del 2%, 3%, 4%.
Solución
sea D = " La pieza es defectuosa", y N="La pieza no es defectuosa"

La información del problema puede expresarse en el diagrama de árbol
0.02 D
A
0,40 0.98 N
0,35 0.03 D
B
0.97 N
0,25 0.04 D
C
0.96 N
a.- Para calcular la probabilidad de que la pieza elegida sea defectuosa, P(D)
por la Propiedad de la probabilidad total,
P(D)= P(A)*P(D/A)+P(B)*P(D/B)+P(C)*P(D/C)
P(D)= 0,4*0,02+0,35*0,03+0,25*0,04
P(D)= 0,0285
b.- Debemos calcular P(B/D). Por el teorema de Bayes
P(B/D)= P(B)*P(D/B)
P(A)*P(D/A)+P(B)*P(D/B)+P(C)*P(D/C)
P(B/D)= 0,35*0,03
0,4*0,02+0,35*0,03+0,25*0,04
P(B/D)= 0,0105
0,0285
P(B/D)= 0,368
c.- Calculamos P(A/D) y P(C/D), comparándolas con el valor de P(B/D)

ya calculado. Aplicando el teorema de Bayes , obtenemos
P(A/D)= 0,4*0,02 = 0,008 = 0,281

0,4*0,02+0,35*0,03+0,25*0,04 0,0285
P(C/D)= 0,25*0,04 = 0,01 = 0,351

0,4*0,02+0,35*0,03+0,25*0,04 0,0285
12
La línea de producción con mayor probabilidad de haber producido la pieza defectuosa es B
Estadística:
 El campo de la Estadística tiene que ver con la recopilación,
presentación, análisis y uso de datos para tomar decisiones
y resolver problemas.
 La importancia de la estadística en la ingeniería, la ciencia y

la administración ha sido subrayada por la participación en
la industria en el aumento de la calidad. Muchas compañías
se han dado cuenta de que la baja calidad de un producto
(defectos de fabricación, baja confiabilidad en su
rendimiento) tiene un efecto muy pronunciado en la
productividad global de la Empresa. La estadística es un
elemento decisivo en el incremento de la calidad, ya que las
técnicas estadísticas pueden emplearse para describir y
comprender la variabilidad.

Estadística Descriptiva
Media aritmética:
La media aritmética o media de un conjunto de N números x1,x2,x3,....,xn
se representa por x y se define como
n
 xj
j=1__
x = x1 + x2 +x3 +......+ xn =
N N

Mediana:
Sean x1,x2,x3,.....,xn una muestra acomodada en orden creciente de

magnitud,; esto es x1 denota la observación pequeña y x n denota la
observación más grande. Entonces la mediana x se define como la parte
media o la (  n+1 / 2)-ésima observación si n es impar, o el promedio
entre las dos observaciones intermedias la (n / 2)-ésima y la (  n / 2)+1)-
ésima si n es par. En términos matemáticos
  n  1 / 2   impar
x n  2   x  n / 2  1  par
___________________
2

Moda:
La moda es la observación que se presenta con mayor frecuencia en la

muestra. Esta puede no existir cuando los datos no están agrupados o ser
bimodales, etc.

Varianza muestral y desviación estándar muestral.
Las medidas más importantes de variabilidad son la varianza muestral y la

desviación estándar muestral.
Si x1,x2,x3,.....,xn es una muestra de n observaciones, entonces la varianza
muestral es:
2
1 n
 _

x  X i  X 
2
S 
n  1 i 1  
La desviación estándar S es la raíz cuadrada positiva.

Coeficiente de Variación:
En ocasiones es deseable expresar la variación como una fracción de la

Media. El coeficiente de variación es útil cuando se compara la variabilidad
de dos o más conjuntos de datos que difieren de manera considerable en la
magnitud de las observaciones.
El coeficiente muestral es:
S
CV 
x

Error estándar:
El error estándar de una estadística es la desviación estándar de su

distribución de muestreo.
Si el error estándar involucra parámetros desconocidos cuyos valores
pueden estimarse, la sustitución de estas estimaciones en el error estándar
da como resultado un error estándar estimado.
 x 

El error estándar da alguna idea sobre la precisión de la estimación. Si no

se sabe que valor tiene  pero se sustituye la desviación estándar muestral
S en la ecuación anterior, entonces el error estándar estimado de x es
 
S
 x

n

Rango de la Muestra:
Una medida muy sencilla de variabilidad es el rango de la muestra,

definido como la diferencia entre las observaciones más grande y más
pequeña.
r = máx (xi) - min (xi)

Coeficiente de Asimetría:
El coeficiente de simetría  que mide el grado de asimetría o falta de

simetría de una distribución. Y se define por
3
  
n n 
Xi  X 
   
(n 1)(n  2) i 1  
 S 

Curtosis:
El coeficiente de curtosis es una medida de achatamiento de un histograma

con respecto al modelo teórico de Gauss.
El coeficiente de curtosis se define por
4
  
n(n 1) n 
Xi  X  3 (n 1)
2
k    
(n 1)(n  2)(n  3) i 1 

S 

(n  2)(n 3)
Se puede demostrar que:
E  0  histograma más puntiagudo que la ley de Gauss (leptocúrtica)
E  0  histograma más achatado que la ley de Gauss (platicúrtica)
E  0  histograma sin achatamiento (mesocúrtica)

 Histograma
 Un histograma o histograma de frecuencias consiste en una serie de rectángulos que
tienen:
1.- Sus bases sobre un eje horizontal con centros en las marcas de clase y longitud
igual al tamaño de los intervalos de clase.
2.- Superficie proporcionales a las frecuencias de clase, el número de observaciones en
una clase recibe el nombre de frecuencia de clase. La marca de clase es el punto
medio del intervalo de clase y se obtiene sumando los límites inferior y superior de la
clase y dividiendo por 2.
3.- Un polígono de frecuencia es un gráfico de línea trazado sobre las marcas de clase.
 Reglas generales para formar la distribución de frecuencias
1.- Determinar el mayor y el menor entre los datos registrados y así encontrar el rango.
2.- Dividir el rango en un número conveniente de intervalos de clase del mismo tamaño,
el número de clases que se emplea para clasificar los datos en un conjunto dependen
del total de observaciones en éste. Si el número de observaciones es relativamente
pequeño, el número de clase a emplear será cercano a cinco, pero generalmente nunca
menor que este valor. Si existe una cantidad sustancial de datos, el número de clases
debe encontrarse entre ocho y doce y generalmente no existirán mas de 15 clases. Un
número muy pequeño de clases puede ocultar la distribución real del conjunto de datos,
mientras que un número muy grande puede dejar sin observaciones o lagunas de las
clase, limitando de esta forma su uso.

 Criterio de Sturguess
 Es usado ampliamente , ya que entrega la dimensión del intervalo de clase que
permite la mejor definición de la forma real de la distribución en estudio. Para
estimar el intervalo de clase Sturguess planteó la siguiente expresión.

xmax  xmin
IC 

1  3,322 log(n)
Raíz cuadrada del número de observaciones
IC  n
Desviación estandar 12,05147 Mínimo 10
Media 36,53264 Varianza de la muestra 145,238 Máximo 69,9
Error Típico 0,163652 curtosis -0,39836 Suma 198116,5
Mediana 36 coeficiente de asimetría 0,291128 Cuenta 5423
Moda 45,5 Rango 59,9
Histograma Grupal vacios<4
600 0,035
500 0,03
F r e c u e n c ia
0,025
400
0,02
Frcuencia
300
norm al
0,015
200
0,01
100 0,005
0 0
Velocidad [Km/h]

Histograma Sturges vacios<4
800 0,035
700 0,03
600
Fre 0,025
cu
en 500
cia 0,02
Frecuencia
400
normal
0,015
300
0,01
200
100 0,005
0 0
10,00 14,47 18,9423,41 27,88 32,35 36,83 41,3045,77 50,24 54,71 59,18 63,65
Velocidad [Km/h]
Histograma raiz de (n) vacios <4
200 0,035
180
0,03
F r e c u e n c ia
160
140 0,025
120 0,02
Frecuencia
100
0,015 norm al
80
60 0,01
40
0,005
20
0 0
Velocidad [Km/h]

Distribución de Poisson
Es una distribución de probabilidad discreta con un parámetro λ < 0 cuya función de
masa para sucesos es
Aquí e significa el número e y x! significa el factorial de x.

Se prefiere su uso por sobre una distribución binominal cuando los valores de p <
0.10 y (p * n) < 10 ", donde p es la probabilidad de acierto y n es el numero de
eventos.
La distribución de Poisson describe el número de sucesos en una unidad de tiempo
de un proceso de Poisson. Muchos fenómenos se modelan como un proceso de
Poisson, por ejemplo las llamadas telefónicas en una empresa o los accidentes en
una carrera.
El valor esperado y la varianza de una variable aleatoria X de distribución Poisson
son
E[X] = V[X] = λ

Distribución de Poisson
Ejemplo
Un número promedio de camiones tanque que llega cada día a cierta ciudad
portuaria es 10. Las instalaciones en el puerto pueden manejar a lo más 15
camiones tanque por día. ¿ Cuál es la probabilidad de que en un día dado los
camiones se tengan que regresar?
Solución
Sea X el número de camiones tanque que llegan cada día.Entonces con el uso de la
tabla de poisson tenemos
15
P(x>15)= 1- P(X15)=1-  p ( x;10) = 1-0,9513= 0,0487
x 0
15 1510
P ( x  15)  e
10!

Distribución Binomial
En estadística la distribución binomial es una distribución probabilidad discreta
describiendo el numero de éxitos de n experimentos independientes con
probabilidad p de un éxito.
Su función de densidad es
Eso es por que en n experimentos (o eventos) hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x éxitos (o aciertos) (probabilidad pk) y n − x no-
éxitos ((1 − p)n − x).
El valor esperado de una variable aleatoria de probabilidad binominal es E[x] = np y

su varianza V[x] = np(1 − p).

Distribución Binomial
La probabilidad de que cierta clase de componente sobreviva a una prueba de choque
dada es 3/4 . Encuentre la probabilidad de que sobrevivan exactamente dos de los
siguientes cuatro componentes que se prueben.
Solución
Suponga que las pruebas son independientes y como p=3/4 para cada una de las 4
pruebas tenemos
2
4 4¡ 32
B(2;4,3/4)=    3 / 4  2
(1 / 4 ) 2
 x  27 / 128 =0,2109
2 2¡ x 2¡ 4 4

Distribución Normal
 Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su
propio nombre indica su extendida utilización, justificada por la frecuencia o
normalidad con la que ciertos fenómenos tienden a parecerse en su
comportamiento a esta distribución.
 Muchas variables aleatorias continuas presentan una función de densidad cuya
gráfica tiene forma de campana.
 En resumen, la importancia de la distribución normal se debe principalmente a que
hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la
normal
• Sin lugar a dudas, la distribución más utilizada para

modelar experimentos aleatorios es la distribución normal
Representación gráfica de esta función de densidad

F(x) es el área sombreada de esta gráfica

TIPIFICACIÓN
Por tanto su función de densidad es
y su función de distribución es

siendo la representación gráfica de esta función
a la variable Z se la denomina variable tipificada de X, y a la curva de su

función de densidad curva normal tipificada.

Manejo de tablas, casos más frecuentes
La distribución de la variable z se encuentra tabulada




EJERCICIO

Tipificamos:

Los resultados de una prueba objetiva de La probabilidad de obtener puntuación entre 70 y 90 es:
P(70≤X≤90)=p(-1,67≤X≤1,67)
selección pasada a 200 personas indicaron que
z1=(70-80)/6=-1,66666667
la distribución de puntuaciones era normal, con
z2=(90-80)/6=1,66666667
media de 80 puntos y desviación típica de 6
0,0478 0,9522
puntos. Calcular cuántos examinados han
+0,9522-0,0478=0,9044
obtenido una puntuación entre 70 y 90 puntos.
Si se eligen al azar dos de esas 200 personas,
y el número esperado de individuos que la obtienen es:
calcular la probabilidad de que ambas personas

tengan puntuación superior a 90.
n=0,9044*200=180,883859
n= 181

La probabilidad de que una persona tenga puntuación
superior a 90 es:
P(X>90)=P(Z>1,67)=1- 0,9522 =0,0478

Y para dos personas:

p= 0,0478*0,0478 =0,00228484

EJERCICIO
z1=(30-60)/6 -5
z1=(40-60)/6 -3,33333333
Los resultados de una prueba objetiva
de selección pasada a 200 personas La probabilidad de obtener puntuación entre 30 y 40 es:
indicaron que la distribución de
puntuaciones era normal, con media 60 0,0000 0,0004
puntos y desviación típica de 6 puntos.
Cada prueba se puntuó con 0 ó 1 con lo cual no hay ningún examinado con una puntuación entre 30 y 40
puntos. Calcular cuántos examinados
han obtenido una puntuación entre 30 y Por otro lado , la mínima puntuación por debajo de la cual está el 75 % de los examinados
40 puntos, y cuál es la mínima
puntuación por debajo de la cual están z normal
el 75 % de los examinados. 0,67 0,7486
0,68 0,7517

se realiza una interpolación
Tipifiquemos la variable con los valores 0,01 0,0031

extremos dados:
valor buscado 0,0014
Luego
x=(0,0014*0,01)/0,0031 0,00451613
Zx=0,67+0,0045 0,6745
x1=6*zx+60 6*0,6745+60 64
La mínima puntuación por debajo de la cual está el 75 % de los examinados es 64
 Media Aritmética
1 n
 x   xi
n i 1
 Mediana
La mediana de un conjunto de observaciones se
ordenan de manera creciente, la mitad de éstas es
menor que este valor y la otra mitad mayor
 Moda
La moda de un conjunto de observaciones es el valor de
la observación que ocurre con mayor frecuencia en un
conjunto
 Desviación Estándar
1 n
 x   ( xi   x ) 2
n i 1
 Coeficiente de Simetría
Esta función caracteriza el grado de asimetría de una
distribución con respecto a su media. La asimetría positiva
indica una distribución unilateral que se extiende hacia valores
más positivos. La asimetría negativa indica una distribución
unilateral que se extiende hacia los valores más negativos
m3 1 n
  3 en que m3   ( xi   x )3
 n i 1
 Curtosis
La curtosis representala elevación o achatamiento de una
distribución , Una curtosis positiva indica una distribución
relativamente elevada, mientras que una curtosis negativa
indica una distribución relativamente plana.
m4 1 n
  4 en que m4   ( xi   x ) 4
 n i 1

Distribución Ji Cuadrado (2 )
•Es una distribución asimétrica.

• Solo toma valores positivos y es asintótica con
respecto al eje de las x positivas (0 < 2 < +).
• Está caracterizada por un único parámetro llamado:
grados de libertad (g.l.)
• El área comprendida entre la curva y el eje de las x
es 1 o 100%.

Gráfico de la distribución Ji Cuadrado
Región de Región de rechazo

aceptación
1- 
2 gl,

Distribución Ji Cuadrado
( 0  E ) 2
 
2 i i
Ei

Ejercicio Chi - Cuadrado
25
6
5
4 4
2 2 2 2
1

Ejercicio Chi-cuadrado
Marca
ai bi Fi Clase Fi*MC (xi-x) ^2 fi*(xi-x)^2
1,18 1,22 1 1,2 1,2 0,07002639 0,07002639
1,22 1,27 2 1,245 2,49 0,04823514 0,09647028
1,27 1,32 2 1,295 2,59 0,02877264 0,05754528
1,32 1,37 4 1,345 5,38 0,01431014 0,05724056
1,37 1,42 6 1,395 8,37 0,00484764 0,02908584
1,42 1,47 8 1,445 11,56 0,00038514 0,00308113
1,47 1,52 5 1,495 7,475 0,00092264 0,0046132
1,52 1,57 4 1,545 6,18 0,00646014 0,02584056
1,57 1,62 2 1,595 3,19 0,01699764 0,03399528
1,62 1,67 3 1,645 4,935 0,03253514 0,09760542
1,67 1,72 1 1,695 1,695 0,05307264 0,05307264
1,72 1,8 2 1,76 3,52 0,08724639 0,17449278

40 suma 58,585 suma 0,70306938
media 1,464625 varianza 0,01802742
desviación 0,13426623
50
Ejercicio Chi-cuadrado area1 area2 area2-area1
frecuen
cia fre en %
(oj-
ej)^2
(oj-
ej)^2/ej
ai bi (ai-x)/s (bi-x)/s N(yc1)*100 N(yc2)*100 oj ej f*100/40
1,18 1,22 -2,113 -1,816 1,7299 3,4680 1,7380 1 2,500 0,5806 0,2322
1,22 1,27 -1,816 -1,445 3,4680 7,4246 3,9567 2 5,000 1,0886 0,2177
1,27 1,32 -1,445 -1,074 7,4246 14,1483 6,7236 2 5,000 2,9709 0,5942
1,32 1,37 -1,074 -0,702 14,1483 24,1188 9,9705 4 10,000 0,0009 0,0001
1,37 1,42 -0,702 -0,331 24,1188 37,0212 12,9024 6 15,000 4,3998 0,2933
1,42 1,47 -0,331 0,040 37,0212 51,5915 14,5703 8 20,000 29,4817 1,4741
1,47 1,52 0,040 0,411 51,5915 65,9500 14,3585 5 12,500 3,4540 0,2763
1,52 1,57 0,411 0,782 65,9500 78,2979 12,3479 4 10,000 5,5127 0,5513
1,57 1,62 0,782 1,153 78,2979 87,5645 9,2666 2 5,000 18,2040 3,6408
1,62 1,67 1,153 1,525 87,5645 93,6331 6,0686 3 7,500 2,0489 0,2732
1,67 1,72 1,525 1,896 93,6331 97,1012 3,4681 1 2,500 0,9372 0,3749
1,72 1,80 1,896 2,490 97,1012 99,3609 2,2597 2 5,000 7,5092 1,5018
x 1,4646 97,630996 40 100 9,42992

s 0,1347
chi calculado =9,43
v=k-1-m=12-1-2=9
chi v9,95= 16,93

chiv9 ,5= 3,32
ajuste bueno, es una

distribución normal
51
Límite Límite Frecuencia Frecuencia Porcentaje

Inferior Superior Acumulada
1,18 1,22 1 1 2,5
1,22 1,27 2 3 7,5
1,27 1,32 2 5 12,5
1,32 1,37 4 9 22,5
1,37 1,42 6 15 37,5
1,42 1,47 8 23 57,5
1,47 1,52 5 28 70,0
1,52 1,57 4 32 80,0
1,57 1,62 2 34 85,0
1,62 1,67 3 37 92,5
1,67 1,72 1 38 95,0
1,72 1,80 2 40 100,0

120
20
10
0
5 10 90
300
275 263
245
250
225
200
172
175
156
150
125
100
75 67
56
50
23
25 14
1 3
0

ai bi Fi Marca Clase Fi*MC (x-X)**2 Fi*(x-X)**2
27,5 31,5 1 29,5 29,5 331,677 331,677
31,5 35,5 14 33,5 469 201,981 2827,733
35,5 39,5 56 37,5 2100 104,285 5839,957
39,5 43,5 172 41,5 7138 38,589 6637,298
43,5 47,5 245 45,5 11147,5 4,893 1198,771
47,5 51,5 263 49,5 13018,5 3,197 840,796
51,5 55,5 156 53,5 8346 33,501 5226,147
55,5 59,5 67 57,5 3852,5 95,805 6418,931
59,5 63,5 23 61,5 1414,5 190,109 4372,506
63,5 67,5 3 65,5 196,5 316,413 949,239
1000 suma 47712 suma 34643,056

media 47,71 varianza 34,678
desviacion 5,889

area2- (oj-
area1 area2 area1 frecuencia fre en % (oj-ej)^2 ej)^2/ej
ai bi (ai-x)/s (bi-x)/s N(yc1)*100 N(yc2)*100 oj ej f*100/1000
27,5 31,5 -3,434 -2,754 0,0297 0,2940 0,2642 1 0,1 0,0270 0,270
31,5 35,5 -2,754 -2,075 0,2940 1,9001 1,6062 14 1,4 0,0425 0,030
35,5 39,5 -2,075 -1,395 1,9001 8,1474 6,2473 56 5,6 0,4190 0,075
39,5 43,5 -1,395 -0,716 8,1474 23,7113 15,5638 172 17,2 2,6770 0,156
43,5 47,5 -0,716 -0,036 23,7113 48,5634 24,8521 245 24,5 0,1240 0,005
47,5 51,5 -0,036 0,644 48,5634 74,0077 25,4443 263 26,3 0,7322 0,028
51,5 55,5 0,644 1,323 74,0077 90,7113 16,7036 156 15,6 1,2179 0,078
55,5 59,5 1,323 2,003 90,7113 97,7400 7,0287 67 6,7 0,1080 0,016
59,5 63,5 2,003 2,682 97,7400 99,6345 1,8945 23 2,3 0,1644 0,071
63,5 67,5 2,682 3,362 99,6345 99,9613 0,3268 3 0,3 0,0007 0,002

x 47,712 1000 0,732
s 5,886
chi calculado =0,7315 chi v7,95= 14,1
v=k-1-m=10-1-2=7 chiv7 ,5= 2,17

ajuste muy bueno
Límite Frecuencia Frecuencia Porcentaje

Superior Acumulada
31,5 1 1 0,1
35,5 14 15 1,5
39,5 56 71 7,1
43,5 172 243 24,3
47,5 245 488 48,8
51,5 263 751 75,1
55,5 156 907 90,7
59,5 67 974 97,4
63,5 23 997 99,7
67,5 3 1000 100,0

Curva tonelaje vs ley
Formulas
Calculo de área: Ocupando la normal reducida
Xc  
Yc 

%( Xc)   (Yc)
Ley media Yc 2

 e 2
 ( Xc)    *
2  (Yc)

Ejemplo
µ=47,712 =5,886 Xc=40
Xc   40  47,712
Yc    1,31
 5,886
%(  Xc)   (Yc)  1  0,0951  0,9049  90,49%
Ley media Yc 2 ( 1, 31) 2

 
 e 2 5,886 e 2
 ( Xc)    *  47,712  *  53,385
2  (Yc) 2 * 3,14 0,9049

Tonelaje Total =100.000 toneladas 100.000
% XC (ai-x)/s Normal %(+Xc) Tonelaje n exp Ley

25 -3,859 0,000 1,000 99994,3 -7,445 0,001 47,71
30 -3,009 0,001 0,999 99869,1 -4,528 0,011 47,74
35 -2,160 0,015 0,985 98460,5 -2,332 0,097 47,94
40 -1,310 0,095 0,905 90494,8 -0,858 0,424 48,81
45 -0,461 0,322 0,678 67751,8 -0,106 0,899 50,83
50 0,389 0,651 0,349 34873,7 -0,076 0,927 53,96
55 1,238 0,892 0,108 10781,5 -0,767 0,465 57,83
60 2,088 0,982 0,018 1841,1 -2,179 0,113 62,14
x 47,712
s 5,8858
R2pi 2,50659769
2
Yc

 e 2
  Xc     *
2  ( Yc )
(  1 , 31 ) 2

5 , 886 e 2
   40   47 , 712  *
2 * 3 ,14 0 , 9049

Coeficiente de correlación
 El coeficiente de correlación se define por :
S xy
rxy 
Sx * S y
donde :
 1  rxy  1
 La correlación es nula si rxy=0

Línea de Regresión
 La linea de regresión se define por:
 Sx    
y  rxy  x  x  y
Sy  

Producción Costo
n x y X-x Y-y (X-x)^2 (Y-y)^2 (X-x)(Y-y)
1 1,5 2,5 -1,45 -1,01 2,103 1,020 1,4645
2 2,0 3,1 -0,95 -0,41 0,903 0,168 0,3895
3 3,0 3,8 0,05 0,29 0,002 0,084 0,0145
4 1,5 2,1 -1,45 -1,41 2,103 1,988 2,0445
5 3,5 4,3 0,55 0,79 0,303 0,624 0,4345
6 3,0 3,2 0,05 -0,31 0,002 0,096 -0,0155
7 4,5 4,8 1,55 1,29 2,403 1,664 1,9995
8 4,0 3,9 1,05 0,39 1,103 0,152 0,4095
9 4,0 4,4 1,05 0,89 1,103 0,792 0,9345
10 2,5 3,0 -0,45 -0,51 0,203 0,260 0,2295
Suma 29,5 35,1 10,225 6,849 7,905

Media 2,95 3,51
Varianza 1,136 0,761
Desviación Sta 1,066 0,872
Covarianza 0,878
Coeficiente correlación 0,945 0,77310513
2,28066015
S  
 
1,22933985
y  r xy
x
 x  x   y
S y  
Y=1,229+0,77*X
6,0
5,0
4,0
3,0 Datos
Recta
2,0
Lineal (Recta)
1,0
0,0
0,0 1,0 2,0 3,0 4,0 5,0 6,0
64
Regresión Lineal Múltiple
Supongamos que la variable Y depende de las variables X1,X2,X3,
por analogía con el modelo lineal simple se puede formular el
modelo siguiente
Y    1 X 1   X 2   X 3
i 0 i 2 i 3 i
En que X1,X2;x3 son los valores de las variable independientes en

el experimento i, siendo Yi, la respuesta correspondiente.
Debido a la presencia de más de dos variables , este modelo se
llama regresión lineal múltiple.
Para estimar los parámetros 0 , 1, 2, 3 se utiliza el método de

los mínimos cuadrados, minimizando la cantidad:
n
D   (Y     X 1   X 2   X 3 )2
0 1 i 2 i 3 i
i 1 i

al derivar parcialmente D con respecto a parámetros 0, 1, 2, 3,
se llega al sistema de ecuaciones siguientes, llamado sistema
normal
n 0  X 1 1  X 2  2  X 3  3  Y
X 1  0  X 12 1  X 1 X 2  2  X 1 X 3  3  X 1Y
X 2  0  X 2 X 1 1  X 22  2  X 2 X 3  3  X 2Y
X 3  0  X 3 X 1 1  X 3 X 2  2  X 32  3  X 3Y
Coeficiente de determinación r2 que corresponde al índice de

ajuste lineal, siendo r el coeficiente de correlación múltiple

Ejemplo
Montgomery y Peck (1992) describen el uso de un modelo de

regresión para relacionar la cantidad de tiempo que requiere un
vendedor para dar servicio a una máquina expendedora de refrescos,
con el número de envases contenidos en la máquina y la distancia del
vehículo de servicio al sitio donde se encuentra la máquina . Este
modelo fue utilizado para diseñar la ruta , los horarios y la salida de
vehículos, La tabla presenta 25 observaciones del tiempo de
suministro tomadas del mismo estudio descrito por Montgomery y
Peck.

Y x1 x2 x1*x1 x1*x2 x1*y x2*x2 x2*y
1 9,95 2,00 50,00 4,00 100,00 19,90 2500 497,5
2 24,45 8,00 110,00 64,00 880,00 195,60 12100 2689,5
3 31,75 11,00 120,00 121,00 1320,00 349,25 14400 3810
4 35,00 10,00 550,00 100,00 5500,00 350,00 302500 19250
5 25,02 8,00 295,00 64,00 2360,00 200,16 87025 7380,9
6 16,86 4,00 200,00 16,00 800,00 67,44 40000 3372
7 14,38 2,00 375,00 4,00 750,00 28,76 140625 5392,5
8 9,60 2,00 52,00 4,00 104,00 19,20 2704 499,2
9 24,35 9,00 100,00 81,00 900,00 219,15 10000 2435
10 27,50 8,00 300,00 64,00 2400,00 220,00 90000 8250
11 17,08 4,00 412,00 16,00 1648,00 68,32 169744 7036,96
12 37,00 11,00 400,00 121,00 4400,00 407,00 160000 14800
13 41,95 12,00 500,00 144,00 6000,00 503,40 250000 20975
14 11,66 2,00 360,00 4,00 720,00 23,32 129600 4197,6
15 21,65 4,00 205,00 16,00 820,00 86,60 42025 4438,25
16 17,89 4,00 400,00 16,00 1600,00 71,56 160000 7156
17 69,00 20,00 600,00 400,00 12000,00 1380,00 360000 41400
18 10,30 1,00 585,00 1,00 585,00 10,30 342225 6025,5
19 34,93 10,00 540,00 100,00 5400,00 349,30 291600 18862,2
20 46,59 15,00 250,00 225,00 3750,00 698,85 62500 11647,5
21 44,88 15,00 290,00 225,00 4350,00 673,20 84100 13015,2
22 54,12 16,00 510,00 256,00 8160,00 865,92 260100 27601,2
23 56,23 17,00 590,00 289,00 10030,00 955,91 348100 33175,7
24 22,13 6,00 100,00 36,00 600,00 132,78 10000 2213
25 21,15 5,00 400,00 25,00 2000,00 105,75 160000 8460
Y
suma 725,42 206 8294 2396 77177 8001,67 3531848 274580,71
Ecuaciones 1 B0*n+B1*X1+B2*X2=Y
2 B0*X1+B1*X1*X1+B2*X1*X2=X1*Y
3 B0*X2+B1*X1*X2+B2*X2*X2=X2*Y
Y=B0+B1*x1+B2*X2
68
Ecuaciones 1 25*B0 +206*B1 +8294*B2 =725,42 *206
2 206*B0 +2396*B1 +77177*B2 =8001,67 *25
3 8294*B0 +77177*B1 +3531848*B2 =274580,71
5150 42436 1708564 149436,52

5150 59900 1929425 200041,75
0 17464 220861 50605,23 12,64664453
B1 = 2,89768839 -12,646644*B2
6942,861377 -30301,36028
223634,8967 -976030,0846
206 46875,64 1058,81 *8294

8294 2555817,92 50945,82 *206
1708564 388786558 8781770,14

1708564 526498492 10494838,92
0 137711933 1713068,78
B2 = 0,012439509 57,73041402
B1= 2,740370335 475,6986021 2,309216515
B0= 2,309216561
Y=2,3092+2,7403*X1+0,0124*X2

Y= 2,31 + 2,740 X1 0,0124 X2
Y Ys ei Y-YM Ys-YsM (Y-YM)^2 (Ys-YsM)^2 (Y-YM)*(Ys-YsM)

1 9,95 8,4098 1,54 -19,07 -20,59 363,543 424,084 392,648
2 24,45 25,5956 -1,15 -4,57 -3,41 20,856 11,611 15,561
3 31,75 33,9405 -2,19 2,73 4,94 7,470 24,378 13,495
4 35,00 36,5322 -1,53 5,98 7,53 35,799 56,687 45,048
5 25,02 27,8896 -2,87 -4,00 -1,11 15,974 1,240 4,450
6 16,86 15,7504 1,11 -12,16 -13,25 147,788 175,634 161,110
7 14,38 12,4398 1,94 -14,64 -16,56 214,236 274,343 242,434
8 9,60 8,4346 1,17 -19,42 -20,57 377,012 423,063 399,374
9 24,35 28,2119 -3,86 -4,67 -0,79 21,779 0,626 3,692
10 27,50 27,9516 -0,45 -1,52 -1,05 2,301 1,106 1,595
11 17,08 18,3792 -1,30 -11,94 -10,62 142,487 112,867 126,815
12 37,00 37,4125 -0,41 7,98 8,41 63,731 70,718 67,134
13 41,95 41,3928 0,56 12,93 12,39 167,268 153,505 160,239
14 11,66 12,2538 -0,59 -17,36 -16,75 301,259 280,539 290,714
15 21,65 15,8124 5,84 -7,37 -13,19 54,270 173,994 97,173
16 17,89 18,2304 -0,34 -11,13 -10,77 123,806 116,051 119,866
17 69,00 64,5552 4,44 39,98 35,55 1598,656 1263,952 1421,487
18 10,30 12,3035 -2,00 -18,72 -16,70 350,319 278,877 312,563
19 34,93 36,4082 -1,48 5,91 7,41 34,966 54,836 43,788
20 46,59 46,5137 0,08 17,57 17,51 308,817 306,621 307,717
21 44,88 47,0097 -2,13 15,86 18,01 251,641 324,238 285,642
22 54,12 52,478 1,64 25,10 23,47 630,171 551,071 589,295
23 56,23 56,2103 0,02 27,21 27,21 740,558 740,232 740,395
24 22,13 19,991 2,14 -6,89 -9,01 47,428 81,218 62,065
25 21,15 20,9707 0,18 -7,87 -8,03 61,887 64,519 63,189
SUMA 725,42 725,08 6084,021 5966,009 5967,491

MEDIA 29,0168 29,00 253,501 248,584 248,645
15,922 15,767
Coeficiente de correlación múltiple r 0,99049999

Coeficiente de determinación r^2 0,98109023

Regresión Lineal Múltiple Matricial
 Sean
 K: Número de variables de Regresión
 n: número de observaciones en la forma
 ((Xi1;Xi2;Xi3;…..;Xik);Yi) con i=1,2,3,…n)
 Y el modelo de regresión
k
 Yi= Bo+  j X ij   i
j 1

 Este Modelo es un sistema de n ecuaciones
que puede expresarse en forma matricial
como
Y1  1 X 11 X 12 ......X 1k   0   1 
Y       
 1 X X ...... X 2k 
Y   2    1  y  2
21 22
X  
.  . .  . 
       
Yn  1 X n1 X n 2 ...... X nk   k   n 

 Se desea encontrar el vector de estimadores de
minimos cuadrados que es:
 L=´= (y-Xβ)´(y-Xβ)
 Al derivar en forma parcial nos queda

 X´Xβ=X´y
 El estimador de mínimos cuadrados es:

ˆ  X T X  1
X tY
 En el ejemplo : x1 x2
9,95 1 2 50
24,45 1 8 110
31,75 1 11 120
35,00 1 10 550
25,02 1 8 295
16,86 1 4 200
14,38 1 2 375
y 9,60 X 1 2 52
24,35 1 9 100
27,50 1 8 300
17,08 1 4 412
37,00 1 11 400
41,95 1 12 500
11,66 1 2 360
21,65 1 4 205
17,89 1 4 400
69,00 1 20 600
10,30 1 1 585
34,93 1 10 540
46,59 1 15 250
44,88 1 15 290
54,12 1 16 510
56,23 1 17 590
22,13 1 6 100
21,15 1 5 400

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 50
2 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5 1 8 110
50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 1 11 120
1 10 550
25 206 8294 1 8 295
206 2396 77177 1 4 200
8294 77177 3531848 1 2 375
1 2 52
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 9 100
2 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5 1 8 300
50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 1 4 412
1 11 400
725,42 9,95 1 12 500
8001,67 24,45 1 2 360
274580,71 31,75 1 4 205
35,00 1 4 400
25 206 8294 -1 725,42 25,02 1 20 600
206 2396 77177 8001,67 16,86 1 1 585
8294 77177 3531848 274581 14,38 1 10 540
9,60 1 15 250
0,2146526 -0,0074909 -0,0003404 725,42 24,35 1 15 290
-0,0074909 0,0016708 -0,0000189 8001,67 27,50 1 16 510
-0,0003404 -0,0000189 0,0000015 274581 17,08 1 17 590
37,00 1 6 100
41,95 1 5 400
2,309200429 11,66
2,740369424 21,65
0,012439581 17,89
69,00
Y=2,3092+2,74037*X1+0,01244*X2 10,30
34,93
46,59
44,88
54,12
56,23
22,13
21,15

Estimación Puntual
Propiedades de los estimadores
ECM (ˆ)  E   ˆ   2 
Insesgadez :
Es mínimo cuando E (ˆ)   . Y de este modo,
el Error Cuadrático Medio es la varianza del
estimador.
Eficiencia: Dado un tamaño de muestra fijo, se
busca, entre los estimadores, el que menor
varianza tenga.
Estimación Puntual
Consistencia: Nos dice que, cuando el tamaño de las
muestra se incrementa, el estimador puntual debe estar próximo
al parámetro con probabilidad alta.
Suficiencia: El estimador puntual debe resumir la
información proporcionada por la muestra aleatoria Además no
debe haber pérdida de ésta.
Invarianza: Si es el estimador de , esta propiedad nos

dice que g() tiene como estimador a g( ).
Robustez: Se presenta cuando la distribución del

estimador no se ve seriamente afectada por violaciones en los
supuestos.
Consistencia: Nos dice que, cuando el tamaño de
las muestra se incrementa, el estimador puntual debe
estar próximo al parámetro con probabilidad alta.
Suficiencia: El estimador puntual debe resumir la

información proporcionada por la muestra aleatoria
Además no debe haber pérdida de ésta.
Invarianza: Si es el estimador de , esta propiedad

nos dice que g() tiene como estimador a g(ˆ).
Robustez: Se presenta cuando la distribución del

estimador no se ve seriamente afectada por violaciones
en los supuestos.

Ley de los Grandes Números
Como caso especial, cuando Z es x , la
=
media muestral, tenemos que E( ) x
y x converge a .
De la misma manera, s2 converge a 2
cuando n tiende a infinito.

Teorema del Límite central
Sea x1, x2, ..., xn una muestra aleatoria de
observaciones tomadas de la misma distribución y
sea E(Xi)= y Var(Xi)= 2.
Entonces la distribución muestral de la variable
aleatoria
n( x   )
Zn 

converge a la normal standard cuando n tiende a

infinito.
Teorema central del Límite
El TCL es una herramienta muy poderosa
porque se cumple aún cuando la
distribución desde la que se toman las
observaciones no sea normal. Esto significa
que si nosotros nos aseguramos que el
tamaño de la muestra es grande, entonces
podemos usar la variable Zn para responder
preguntas acerca de la población de la cual
provienen las observaciones.
Estos dos conceptos anteriores sirven para
prepararnos para dos objetivos básicos de
cualquier estudio empírico: la estimación de
parámetros desconocidos que nos interesan
y la prueba de hipótesis

Cálculo del tamaño de la muestra
El tamaño de la muestra para un diseño de encuestas
basado en una muestra aleatoria simple, puede calcularse
por la siguiente fórmula
Z 2 pqN
n
NE 2  Z 2 pq

 Donde:
 n es el tamaño de la muestra
 Z es el nivel de confianza del 95%, y es igual a 1,96 según la tabla de distribución normal
es decir: P(-1,96<z<1,96)=0,95
 p es la variabilidad positiva, es decir la probabilidad con que se acepta la hipótesis que se

quiere investigar, con un valor de 0,5.
 q es la variabilidad negativa, es decir, la probabilidad con que se rechaza la hipótesis

que se quiere investigar, con un valor de 0,5.
 N es el tamaño de la población, de 684 individuos.
 E es la precisión o el error, con un valor del 5 % de error.
1,96 2 x0,5 x0,5 x0,5 x684

n  246 individuos
684 x0,05  1,96 x0,5 x0,5
2 2

otra Forma: El tamaño de la muestra para un diseño de
encuestas basado en una muestra aleatoria simple, puede
calcularse por la siguiente fórmula
t 2 * p(1  p)
n
m2
n= tamaño de la muestra requerido
T= nivel de fiabilidad (95 % = 1,96)
P=probabilidad de ocurrencia
m=margen de error( 5%=0.05)
Ejemplo
Se ha determinado que en una población cerca del 30 %(0.3) de los
niños están desnutridos.
Este datos de basa en estadísticas nacionales . Determine con una 95
% de confianza el tamaño de la muestra requerido
1,96 2 * 0.3(1  0.3)

n
0.05 2
n=322,72 323
Se considera un efecto de diseño 2 luego el número de muestreas
es : n*d=323X2=646
Corrección por imprevistos aumenta en un 5 % como errores
N=646x1,05=690 niños

Clase 1 Probabilidades Distribuciones

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase 1 Probabilidades Distribuciones

Cargado por

Copyright:

Formatos disponibles

Probabilidades

La frecuencia relativa de un suceso A:

Fr (a)= número de veces que aparece A

Curso : Modelación y Simulación 1

Si E={x1,x2,…..,xk} y P(x1)=P(x2)=……=P(xk), entonces:

P(A)= número de casos favorables al suceso A

Curso : Modelación y Simulación 2

Curso : Modelación y Simulación 3

Curso : Modelación y Simulación 4

Curso : Modelación y Simulación 5

Curso : Modelación y Simulación 6

Curso : Modelación y Simulación 7

Curso : Modelación y Simulación 8

3.- Para dos eventos E1 y E2

Curso : Modelación y Simulación 9

P(A\B)= P( A ∩ B) / P(B) si P(B)>0

Curso : Modelación y Simulación 10

se conocen las probabilidades condicionales P(B/Ai),

Curso : Modelación y Simulación 11

sea D = " La pieza es defectuosa", y N="La pieza no es defectuosa"

b.- Debemos calcular P(B/D). Por el teorema de Bayes

c.- Calculamos P(A/D) y P(C/D), comparándolas con el valor de P(B/D)

P(A/D)= 0,4*0,02 = 0,008 = 0,281

P(C/D)= 0,25*0,04 = 0,01 = 0,351

 La importancia de la estadística en la ingeniería, la ciencia y

Curso : Modelación y Simulación 13

Curso : Modelación y Simulación 14

Sean x1,x2,x3,.....,xn una muestra acomodada en orden creciente de

Curso : Modelación y Simulación 15

La moda es la observación que se presenta con mayor frecuencia en la

Curso : Modelación y Simulación 16

Las medidas más importantes de variabilidad son la varianza muestral y la

La desviación estándar S es la raíz cuadrada positiva.

Curso : Modelación y Simulación 17

En ocasiones es deseable expresar la variación como una fracción de la

Curso : Modelación y Simulación 18

El error estándar de una estadística es la desviación estándar de su

El error estándar da alguna idea sobre la precisión de la estimación. Si no

Curso : Modelación y Simulación 19

Una medida muy sencilla de variabilidad es el rango de la muestra,

r = máx (xi) - min (xi)

Curso : Modelación y Simulación 20

El coeficiente de simetría  que mide el grado de asimetría o falta de

Curso : Modelación y Simulación 21

El coeficiente de curtosis es una medida de achatamiento de un histograma

Se puede demostrar que:

E  0  histograma más puntiagudo que la ley de Gauss (leptocúrtica)

E  0  histograma más achatado que la ley de Gauss (platicúrtica)

E  0  histograma sin achatamiento (mesocúrtica)

Curso : Modelación y Simulación 22

 Un histograma o histograma de frecuencias consiste en una serie de rectángulos que

igual al tamaño de los intervalos de clase.

2.- Superficie proporcionales a las frecuencias de clase, el número de observaciones en

una clase recibe el nombre de frecuencia de clase. La marca de clase es el punto

clase y dividiendo por 2.

del total de observaciones en éste. Si el número de observaciones es relativamente

debe encontrarse entre ocho y doce y generalmente no existirán mas de 15 clases. Un

clase, limitando de esta forma su uso.

 Es usado ampliamente , ya que entrega la dimensión del intervalo de clase que

permite la mejor definición de la forma real de la distribución en estudio. Para

estimar el intervalo de clase Sturguess planteó la siguiente expresión.

Histograma Grupal vacios<4

Curso : Modelación y Simulación 26