Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual de Consulta Materia Estadistica y Analisis Numerico Docente Ing. Camilo G. Marin
Manual de Consulta Materia Estadistica y Analisis Numerico Docente Ing. Camilo G. Marin
MANUAL DE CONSULTA
ESTADISTICA Y ANALISIS NUMERICO
EJEMPLO:
Los datos siguientes corresponde a las inversiones en miles de dólares que Empresas Constructoras
efectuaron para ampliar su mercado en el rubro de construcción.
30 40 42 70 36 38 40 60 32 38 36 44
36 76 36 58 60 56 60 34 36 40 48 47
38 43 55 37 36 38 44 37 45 49 57 52
50 42 51 38 39 41 43 47 48 50 60 90
52 44 35 35 36 38 37 42 45 66 69 82
SOLUCION:
−
yi −1 − yi yi ni hi Ni Hi 100hi % Ni Hi
28-36 32 5 0,0833 5 0,0833 8,33 60 0,9997
36-44 40 26 0,4333 31 0,5166 43,33 55 0,9164
44-52 48 13 0,2166 44 0,7332 21,66 29 0,4831
52-60 56 6 0,1000 50 0,8332 10,00 16 0,2665
60-68 64 5 0,0833 55 0,9165 8,33 10 0,1665
68-76 72 2 0,0333 57 0,9498 3,33 5 0,0832
76-84 80 2 0,0333 59 0,9831 3,33 3 0,0499
84-92 88 1 0,0166 60 0,9997 1,66 1 0,0166
TOTAL n=60 1,000 100,00
13 6 5 2 2 1
444 49 52 60 68 76 84 92
𝟖 𝟑 𝟑 × 𝟏𝟑
= ⇒ 𝒙𝟏 = = 𝟒, 𝟖𝟕 ≈ 𝟓
𝟏𝟑 𝒙𝟏 𝟖
2 1
68 76 81 84 92
𝟖
𝟐
=
𝟑
𝒙𝟏
⇒ 𝒙𝟏 =
𝟐×𝟑
𝟖
𝟔
= = 𝟎. 𝟕𝟓 ≈ 𝟏
𝟖
N =1+1 = 2
𝟐
por tanto, el porcentaje es%= = 𝟔𝟎 × 𝟏𝟎𝟎 = 𝟑. 𝟑𝟑%
Ejemplo:
−
𝒚𝒊−𝟏 − 𝒚𝒊 𝒚 𝒏𝒊
𝒉𝒊
4-10 7 8 0,04
10-16 13 20 0,10
10-22 19 42 0,21
22-28 25 60 0,30
28-34 31 42 0,21
34-40 37 20 0,10
40-46 43 8 0,04
TOTAL n = 200 1.00
𝒎+𝟏 𝟕+𝟏
Como 𝒎 = 𝟐𝒌 − 𝟏 ⇒ 𝒌 = = =𝟒⇒𝒎
𝟐 𝟐
𝑱 = 𝟐: 𝒏𝟒−𝟐 = 𝒏𝟒+𝟐 ⇒ 𝒏𝟐 = 𝒏𝟔 = 𝟐𝟎
𝑱 = 𝟑: 𝒏𝟒−𝟑 = 𝒏𝟒+𝟑 ⇒ 𝒏𝟏 = 𝒏𝟕 = 𝟖
REPRESENTACIONES GRAFICAS
Representando los datos en el diagrama de sectores con sus ángulos correspondientes, se tiene:
Los gráficos, los índices, los cuadros de distribución de frecuencias son formas de resumir un
conjunto de datos a pocas cifras, las mismas que hacen innecesario el examen de todos los datos.
Las cifras descriptivas que se obtienen de una muestra ( x1 , x2 ..., xn ) se llaman estadígrafos o
estadísticos y son de 4 tipos:
a. De posición
b. De dispersión
c. De concentración
d. De forma
a) Estadígrafos de posición
Son los que describen la posición que ocupa la distribución de frecuencias respecto a un valor de
la variable y son de 2 tipos:
• Los de tendencia central
• Los de Localización
• Estadígrafos de Localización
Muestran la localización de los valores más frecuentes o de valores extremos. Los más usados
son: la moda los cuartiles etc.
b) Estadígrafos de dispersión
Muestran cuan dispersos o separados están los datos; mientras mayor sea su valor, quiere decir
que los datos se encuentran más dispersos. Los más importantes son la varianza ( 2 ) La
desviación estándar ( ) y el coeficiente de variación.
c) Estadígrafos de concentración
Muestran el grado de concentración o de desigualdad de una distribución. La concentración de
una distribución hace referencia al mayor o menor grado de igualdad en el reparto del total de los
valores de una variable. Se calculan medidas de concentración, con el fin de estudiar hasta qué
punto el total de la riqueza de un país esta equitativamente repartido entre sus habitantes.
d) Estadígrafos de forma
Muestran la forma de la curva o polígono de distribución de frecuencias y en especial su simetría
o asimetría.
ESTADIGRAFOS (DESARROLLO)
MEDIDAS DE TENDENCIA CENTRAL
Son valores representativos del conjunto de datos, que están distribuidos alrededor de cierto valor
Central.
−
1. MEDIA ARITMÉTICA (𝒙 )
La media aritmética de un conjunto de datos x1 , x2 x3 ,..., xn . finito, se define como la suma de todos
los valores dividida entre el número total de valores.
n
− x + x + x + ... + xn − x i
x= 1 2 3 o x= i =1
n = numero de datos
n n
También es conocida como el promedio del conjunto de datos.
Ejemplo: Las edades de 7 obreros de una empresa de construcción son:18,26,34,22,45,27,31.
−
Encontrar la media ( x )
Lo que se busca al calcular la media es tener un dato representativo del conjunto de datos.
− yn i i
datos: x = M ( x)o; y = M ( y ) =
− i =1
(A)
n
Ejemplo: En un grupo de personas, 3 tienen 25 años,2 tienen 26 años, 4 tienen 38 años y 7 tienen
45 años. ¿Cuál es la edad media de las personas que forman el grupo?
−
b) Se efectúa el cálculo de los productos yi . ni
−
−
c) Se aplica la fórmula: y =
y i .ni o
− n
y = y i hi
−
n i =1
52-60 56 6 336 n
60-68 64 5 320 − −
2872
68-76 72 2 144 y= y = 47,87
76-84 80 2 160 60
84-92 88 1 88
TOTAL n = 60 2872
Interpretación: Cada vez que una empresa constructora invierta para ampliar su mercado, se
espera que su inversión sea de 47,87 mil dólares.
Para una serie de datos ( x1 , x2 , x3 ,...xn ) a la que corresponde ( w1 , w2 , w3 ,..., wn )pesos, la media
n
− xw i i
x1w1 + x2 w2 + x3 w3 + ... + xn wn
ponderada se calcula de la fórmula: x = i =1
=
n
w1 + w2 + w3 + ...wn
w
i =1
i
w i
−
xe =
xw i i
=
5 x 2 + 8 x3 + 12 x5
= 9, 4($us / dia )
w i 2+3+5
− 5 x 4 + 8 x3 + 12 x5
xa = = 8, 67($us / dia)
4+3+5
M e( x)
3. LA MEDIANA
xn +xn
( ) ( ) +1
c) Si el numero de datos es par: M e( x) = 2 2
Solución: Ordenando los datos : 19, 24, 27, 37, 39, 43, 51
x1 x2 x3 x4 x5 x6 x7
𝑛 = 7 (𝑖𝑚𝑝𝑎𝑟) ∶ 𝑀𝑒(𝑥) = 𝑥(𝑛+1) = 𝑥(7+1) = 𝑥4 = 37
2 2
Solución: Ordenando:19,24,27,37,39,43,51,62
x( n /2) + x( n /2) +1 x4 + x5 37 + 39
n = 8( par ) : M e ( x ) = = = = 38
2 2 2
La mediana Me(x), es el valor central del conjunto de observaciones; antes y después de la Me(x),
no hay más de la mitad de los datos.
a) Con los valores que asume la variable; sus frecuencias absolutas ( ni ) y las frecuencias
absolutas acumuladas ( N i ), se construye el C.D.F. con estas 3 columnas. Y se calcula el
valor de ( n / 2 ).
yi 20 30 50 60 70 80 90 100
ni 12 10 20 18 15 10 7 28
Solución: a) Con los valores dados construimos la tabla de distribución de frecuencias absolutas
acumuladas “menor que “y calculamos ( n / 2 )
yi ni Ni n 120
= = 60
20 12 12 2 2
30 10 22
b) El valor de n/2=60 coincide con el cuarto valor
50 20 42
y j −1 60 18 60 N j −1 de Ni=60 a este valor lo llamamos N j −1 = 60
70 15 75
yj y j −1 + y j
80 10 85 60 + 70
c) Por tanto Me( y ) = =
90 7 92 2 2
100 28 120
n=120 Me( y ) = 65
yi ni Ni n 92
= = 46
20 12 12 2 2
30 10 22
b) El valor de n/2=46 no coincide con ningún valor
50 20 42 N j −1
yj n
60 18 60 Nj de Ni o sea 42 60
70 15 75 2
80 10 85
90 7 92 N j −1 = 42; N j = 60
n=92
n
Como N j −1 Me( y ) = y j
2
Me( y ) = 60
CASO A:
n
Cuando el valor de (n/2) coincide con un valor de “Ni” Es decir si: = N j −1 la mediana
2
Me( y ) = y y
Ejemplo:
El cuadro las ganancias semanales de 40 comerciantes informarles. Calcular la mediana
Me(y)
Solución:
GANANCIAS N° COMERCIANTES Ni n 60
yi −1 − yi ni = = 30
2 2
300-350 5 5
350-400 11 16 n
coincide con un valor de N i
y j −1 → [ 400-450 ) y j 14 30 N j −1 2
450-500 16 46
n
500-550 10 56 ó = N j −1
550-600 4 60 2
TOTAL n = 60 Por tanto: M e ( y ) = y j
M e ( y ) = 450
CASO B:
n
Cuando el valor de ( n / 2 ) no coincide con un valor de N i es decir que: N j N j −1
2
entonces para el calculo de la mediana M e ( y ) se usa la formula siguiente:
n / 2 − N j −1
M e ( y ) = y j −1 + C j (A)
N j − N j −1
4. LA MODA
La moda (Mo) La moda de un conjunto de datos x1 , x2 ,..., xn es el valor que más veces se
repite, o se presenta con mayor frecuencia en una distribución de datos.
yi −1 − yi ni Proceso de calculo
60-63 5 a) Se identifica entre las frecuencias el valor mayor: n3 = 42
63-66 18
66-69 42 b) Se determina la clase modal p/el ejemplo [66-69)
69-72 27
72-75 8 c)La ( M o ) se obtiene utilizando la fórmula:
TOTAL 100
1
M o = y j −1 + c j (B)
1 + 2
inferior: 1 = n j − n j −1 = 42 − 18
1 = 24
superior: 2 = n j − n j +1 = 42 − 27
2 = 15
24
M o = 66 + 3
24 + 15
M o = 67,85
h1
M o = y j −1 + c j (c )
h1 + h2
Donde:
y j −1 = límite inferior de la clase modal
c j = amplitud de la clase modal
h1 = Exceso de la altura modal sobre la altura de clase inferior.
h2 = Exceso de la altura modal sobre la altura de clase superior.
ESTADIGRAFOS DE DISPERSIÓN
Son parámetros estadísticos que indican la separación existente entre los valores que toma la variable,
es decir que reflejan la mayor o menor concentración con que se encuentran distribuidos los datos,
alrededor de un valor central.
1. RANGO (R)
El rango es la diferencia entre los valores extremos del conjunto de datos. En un conjunto de datos
mientras mayor sea el rango, mayor será su dispersión y viceversa. Si tenemos los datos
−
a) 8,9,10,11,12,13,14,15,16 x ( a ) = 12 ; M e ( a ) = 12
−
b) 4,6,8,10,12,14,16,18,20 x ( b ) = 12 ; M e ( b ) = 12
R( a ) = 16 − 8 = 8 R = xmax − xmin R( b ) R( a )
2. RANGO INTERCUARTILICO
Es la diferencia entre el tercer y primer cuartil o también la diferencia entre los percentiles
75avo y 25avo
El rango intercuartílico es mas exacto que el rango de la variable porque evita el inconveniente de los
valores extremos anormales.
xi − u
Ejemplo:
Calcular la desviación media de los siguientes datos:3,5,8,6,2,4,7,5.
1 n 40
Solución: Calculamos la media con: u=
n i =1
xi =
8
=5
Se prepara el cuadro: xi xi − u xi − u
n 3 -2 2
xi − u 5 0 0
D.M . = i =1
8 3 3
n 6 1 1
12 2 -3 3
D.M . = = 1.5 4 -1 1
8
7 2 2
D.M . = 1.5 5 0 0
40 12
Interpretación: En promedio los datos difieren en 1,5 unidades respecto de la media del grupo.
yi − u ni
D.M . = i =1
n
Donde:
m = numero de clases.
− −
m y i − x ni
ni = frecuencias absolutas D.M . =
i =1 n
−
y i = marcas de clase.
El proceso de cálculo es similar al del ejemplo anterior con la única diferencia del caculo previo de
las marcas de clase
Ejemplo:
Los datos de los salarios de 100 obreros de la empresa ALFA Ltda. Son los siguientes (medidos en
dólares $us)
Frecuencias 10 20 35 23 8 4
SALARIOS N° DE OBREROS − − −
yi −1 − yi ni yi yi − u ni yi − u
−
n
y i ni 45440
La media se calcula con u = i =1 n
=
100
= 454, 40($us )
m −
y i − u ni
3772
D.M . = i =1
=
n 100
Interpretación: En promedio los salarios difieren en 37,72.-($us), respecto a la media del grupo.
1 n
D.M e = xi − M e para DATOS NO TABULADOS
n i =1
1 m −
D.M e = i i − M e para DATOS TABULADOS
n i =1
n y
Estas son las medidas de dispersión más utilizadas. La varianza ( 2 ) mide la dispersión de los datos
con respecto a la media aritmética.
La varianza se define como el promedio de los cuadrados de las desviaciones de las observaciones
con respecto a la media. las fórmulas que se usan para el cálculo de la varianza son:
1 n
2 =
n i =1
( xi − u ) 2 (1) VARIANZA DE POBLACION
1 n −
s2 = i )2 (2) VARIANZA MUESTRAL
n i =1
( x − x
En esta última formula (2),se usa( n − 1 ) para muestras pequeñas y ( n ) o ( n − 1 ) para muestras
grandes( n 60 );( n − 1 ) es un factor de corrección.
Cuando se consideran los elementos de una población se emplean los signos ( 2 ) y ( ) para indicar
la varianza y desviación estándar. Si los datos son de una muestra ( s 2 )y (s)representan la varianza y
desviación estándar muestral
Ejemplo:
Los datos de estatura de la familia García con los siguientes. Calcular la varianza y desviación
estándar.
ALTURA x1 − u ( xi − u ) 2 1 n
x1 (cm) 2 =
n i =1
( xi − u ) 2
ANTONIO 180 47 2209
13593
CARMEN 130 -3 9 𝜎2= = 1941,85
7
FRANCISCO 100 -33 1089
LORENA 65 -68 4624 2 = 1941,85 Varianza
MANUEL 100 -33 1089
ISABEL 160 27 729
JOSE 195 62 3844
2 = 44,07(cms) Desviación
13593
Estándar
= x i
2
− n 2
desviación estándar poblacional
n
−2
= x i
2
−nx
desviación estándar muestral
n −1
Para el ejemplo, usando la formula abreviada se tiene:
137150 − 123823
= = 43,63
7
Donde: x i
2
= (180) 2 + (130) 2 + (100) 2 + (65) 2 + (100) 2 + (160) 2 + (195) 2 = 137150
1 m −
2 =
n i =1
( y i − u ) 2 ni VARIANZA POBLACIONAL
1 n − −
s2 = ( y i − x) ni
n − 1 i =1
VARIANZA MUESTRAL
Ejemplo:
Para los datos de salarios: de la empresa ALFA Ltda. calcular la varianza y la desviación estándar, si
la media es u = 454,40($us) .
SALARIOS N° de
yi−1 − yi obreros
ni
350-390 10
390-430 20
430-470 35
470-510 23
510-550 8
550-590 4
TOTAL N=100
Solución:
SALARIOS N° de obreros − − −
yi−1 − yi yi yi − u ( y i − u )2 −
ni ni ( y i −u ) 2
350-390 10 370 -84,4 7123,36 71233,60
390-430 20 410 -44,4 1971,36 39427,20
430-470 35 450 -4,4 19,36 677,60
470-510 23 490 35,6 1267,36 29149,28
510-550 8 530 75,6 5715,36 45722,88
550-590 4 570 115,6 13363,36 53453,44
TOTAL N=100 239664,0
239664,0
2 = = 2396,64
2
VARIANZA POBLACIONAL
100
s
c.v. = 100 c.v. = −
100
x
El coeficiente de variación es una medida muy útil para comparar la variabilidad de dos o más
conjuntos de datos que tengan distintas unidades de medida:
48,96
c.v. = 100 = 10,77%
454,40
ESTADIGRAFOS DE ASIMETRIA
−
m
( x − x )3 n
AS = i 3 i (2) Para datos agrupados en tablas de frecuencias.
i =1 n
−
m
( y − )3 ni
AS = i (3) Para datos agrupados en clases.
i =1 n 3
Para los datos de salarios del ejercicio anterior la formula a usar seria (3).
Las formas que adopta una distribución pueden ser:
ESTADIGRAFOS DE APUNTAMIENTO
1.2. CURTOSIS
− −
n
( x − x)4 n m
( y − )4
Ck = i 4 i Ck = i 4
i =1 n i =1 n
Si se tiene:
ESTADIGRAFOS DE CONCENTRACIÓN
Miden el mayor o menor grado de igualdad en el reparto de la totalidad de valores, o también miden
el grado de concentración o desigualdad de cualquier distribución.
El coeficiente o índice de Gini es el más utilizado para medir la desigualdad a través del nivel de
concentración que existe en la distribución de los valores de la variable. este índice toma valores entre
cero y 1.
Un valor que tiene a 1 refleja mayor desigualdad. por el contrario, si tiende a cero hay equidad o
igualdad en la distribución.
Definición
El análisis de regresión trata de determinar la forma como se realizan dos variables, de tal manera que
se pueda predecir el valor de una de ellas en base a la otra.
Si se tiene una función: y = fcx) de región
Dónde:
x = variable independiente
y = variable dependiente
Usando el método de los mínimos cuadrados, para el conjunto de puntos P 1 , P2 ,P3 ,… ,Pn la suma
de los cuadrados de las desviaciones (errores) entre los valores estimados (𝑦∗ ) y los valores
n
La suma de las desviaciones debe ser mínima, es decir que el valor de s debe ser el menor posible.
por consiguiente, si reemplazamos la adecuación (1) en (2) se tiene:
s = y − (a + bx) = y 2 − 2 y (a + bx) 2
2
Aplicando sumatorias:
Para que s sea mínimo debemos derivar e igualar a cero derivando (3) respecto de “a” y luego respecto
a “b” se tiene:
ds
= −2 y + 2na + 2b x = 0
da
− y + na + b x = 0 ; de donde:
a=
y − b x
(4)
n
ds
= −2 xy + 2a x + 2b x 2 = 0 ; de donde:
db
b=
xy − a x (𝜶)
x 2
xy − ( n ) x n xy − y x + b( x)
y −b x
2
b= =
x 2
n x 2
n xy − x y
b=
n x 2 − ( x ) 2
(5)
Las expresiones (4) y (5) proporcionan los valores de “a” y “b” de la ecuación de regresión lineal (1)
y* = a + bx (1)
n xy − x y
r= (6) ó
n x 2 − ( x) 2 n y 2 − ( y ) 2
cov(𝑥𝑖 𝑦)
𝑟= (7)
𝜎𝑥 𝜎𝑦
r = factor o coeficiente de correlación que varía entre -1 ≤ r ≤ 1 con (x,y) = covarianza entre “x” e
“y”
Si “r” se
aproxima a 1, entonces existe una perfecta correlación entre las variables “x” e “y” y el error es
mínimo.
Si “r” se aproxima a cero, entonces no existe correlación entre las variables “x” e “y” y por
consiguiente el error es máximo.
Si el valor de “r” <0.7 se considera que la relación es baja.
Se considera correlación positiva si siempre que el valor de “x” sube, el valor de “y” sube, y casi con
la misma o igual intensidad. (+1)
En el caso opuesto, si siempre que el valor de “x” sube, y el valor de “y” baja y además con la misma
intensidad, entonces se habla de correlación negativa (-1)
Por tanto “r” es una medida estadística que cuantifica la dependencia lineal entre 2 variables o grado
de intensidad de la relación entre 2 variables.
Ejemplo:
Una empresa varia su cantidad de producción, de acuerdo a la cantidad de empleados de la siguiente
manera.
N° de Empleados 11 15 20 22 24 26 31 36
Cantidad de
205 301 411 450 493 522 612 662
Producción
Solución:
La ecuación de regresión lineal tiene la forma: y = a + bx , donde: por las fórmulas (4)y(5) deducidas
se tiene:
a=
y − b x (4) b=
n xy − x y
(5)
n n x 2 − ( x ) 2
Empleados Producción
xi yi xi 2 yi 2
xi yi −
x=
x i
=
185
n 8
11 205 2.255 121 42.025 −
15 301 4.515 225 9.061 x = 23,125
20 411 8.220 400 168.921
−
22
24
450
493
9.900
11832
484
576
202500
243.049
y = 457
26 522 13.572 676 272.484
31 612 18.972 961 374.544
36 662 23.832 1.296 438.244
68424
r= = 0,9911 r = 0,9911
69035,10
Como r se acerca a 1, se concluye que se tiene un alto grado de relación entre las variables “x” e “y”.
Para un conjunto de puntos o datos representados en el plano coordenadas, se puede establecer límites
de confianza para el conjunto de datos.
Estos límites se establecen por el investigador de acuerdo al grado de seguridad que exija el problema
de investigación (5%;10%, etc.) estableciendo por encima y debajo de la recta estos porcentajes
permite indicar el grado de certeza con que una variable depende de la otra. Si se considera un
rango de 0 a 100% se tiene:
ESPACIO MUESTRAL ( ). - Se llama espacio muestral al conjunto formado por todos los
resultados posibles de un experimento aleatorio. El espacio muestral de los experimentos aleatorios
anteriores seria: 1 = N , E
4 = 0,1, 2,3,......
5 = x / 0 x 1 = números reales
Si E = E1 E2
= 1 2
Si: E = E1 E2
El espacio muestral ( ) de los experimentos asociados por la conjunción ( ) es:
= 1 2 PRODUCTO CARTESIANO
entonces = 1 2 = N , E N , E
= ( N , N )( N , E )( E , N )( E , E )
EJEMPLO 2.- Se lanzan 2 dados simultáneamente. Hallar el espacio muestral de este experimento.
SOLUCIÓN. - El experimento E= “lanzar 2 dados simultáneamente” es un experimento compuesto
de 2 experimentos simples E1 y E2
En donde se tiene que el numero total de elementos del espacio muestral es: # = 36
# = cardinalidad del espacio muestral o número total de elementos del espacio muestral.
TECNICAS DE CONTEO
Son técnicas útiles para determinar el número de elementos que tiene un espacio muestral o un
experimento particular. Entre estas técnicas se tiene:
i) Principio de multiplicación
ii) Principio de adición
PRINCIPIO DE MULTIPLICACIÓN. - Este principio dice:
“Si un experimento Aleatorio E1, ocurre de n1 formas y si para cada una de estas, un experimento
E2 ocurre de n2 formas entonces los dos experimentos juntos corren de ( n1 • n2 ) formas”.
“LA CONDICIÓN” para que se aplique este principio es que ambos experimentos se realicen uno
seguido del otro o simultáneamente.
si: 𝐸 = 𝐸1 ∗ 𝐸2 ⇒ #𝛺 = 𝑛1 ∗ 𝑛2 donde:
EJEMPLO 1.-
¿De cuantas formas se puede vestir una persona que tiene 3 pantalones y 4 camisas?
SOLUCIÓN.
Para vestirse la persona se pone el pantalón y luego la camisa,
n1 = 3 y n2 = 4
EJEMPLO 2.-
¿Cuántos elementos tiene el espacio muestral del experimento aleatorio: “Lanzar una moneda y un
dado simultáneamente”?
SOLUCIÓN. -
#𝛺 = 𝑛1 ⋅ 𝑛2 = 2 ∗ 6 = 12
EJEMPLO3.-
¿Cuántos números pares de 3 dígitos se pueden formar con los dígitos:1,3,4,5,6,7,8,9 Si cada digito
puede emplearse una sola vez?
SOLUCIÓN.
DIGITOS: 1, 3, 4, 5, 6, 7, 8, 9
E = “Elegir 3 dígitos” E = E1 E2 E3
PRINCIPIO DE ADICIÓN
Dice lo siguiente:
EJEMPLO 1:
¿De cuantas formas se puede cruzar un rio, sabiendo que se dispone de 3 botes y 4 lanchas?
SOLUCIÓN: E= “Cruzar el rio en bote o lancha”
EJEMPLO2:
Un producto se vende en 3 mercados, en el 1 er mercado se tienen 5 tiendas de venta, en el 2 do 4, y en
el 3er mercado 6 tiendas ¿de cuantas maneras puede venderse el producto?
SOLUCIÓN:
LA TEORIA COMBINATORIA
También proporciona formulas que ayudan a determinar el numero de elementos de un determinado
espacio muestral.
PERMUTACIONES
n!
Prn =
( n − r )!
EJEMPLO 1:
Con los dígitos 1,2,5,6,7,8,9 ¿Cuántos números de 3 dígitos se pueden formar, si cada digito puede
emplearse una sola vez?
SOLUCIÓN: a) Por teoría Combinatoria.
7! 7!
P37 = = = 210 _ números
( 7 − 3)! 4!
5!
• Números de un dígito= 1,2,3,4,5 P15 = =5
4!
• Números de dos dígitos
12 21 31 41 51
13 23 32 42 52 5!
P25 = = 20
14 24 34 43 53 3!
15 25 35 45 54
• Números de 3 dígitos
123 132 142 152 213 231 241 251 312 321
124 134 143 153 214 234 243 253 314 324
125 135 145 154 215 235 245 254 315 325
341 351 412 421 431 451 512 521 531 541
342 352 413 423 432 452 513 523 532 541
345 354 415 425 435 453 514 524 534 543
5!
P35 = = 60
2!
5!
• Números de 4 dígitos P45 = = 120
1!
5!
• Números de 5 dígitos P55 = = 120
0!
ENTONCES: N=5+20+60+120+120= 325 _ números
5 formas n1
4 formas n2
⇒ #𝛺2 = 𝑛1 ∗ 𝑛2 = 5 ∗ 4 = 20 formas
E3= “Formar números de 3 dígitos”
x_ y_z
5 formas= n1
4 formas= n2
3 formas= n3
⇒ #𝛺3 = 𝑛1 ∗ 𝑛2 ∗ 𝑛3 = 5 ∗ 4 ∗ 3 = 60 formas
E4= “Formar números de 4 dígitos”
x_ y _ z _u
5 formas= n1
4 formas= n2
3 formas= n3
2 formas= n4
⇒ #𝛺4 = 𝑛1 ∗ 𝑛2 ∗ 𝑛3 ∗ 𝑛4 = 5 ∗ 4 ∗ 3 ∗ 2 = 120 formas
E5= “Formar números de 5 dígitos”
x_ y _ z _u _v
5 formas= n1
4 formas= n2
3 formas= n3
2 formas= n4
1 formas= n5
⇒ #𝛺5 = 𝑛1 ∗ 𝑛2 ∗ 𝑛3 ∗ 𝑛4 ∗ 𝑛5 = 120 formas
Luego N=5+20+60+120+120=325 números
EJEMPLO 3:
Un curso de 5 alumnos desea nombrar un delegado titular y un delegado suplente al H.C.C. ¿De
cuantas maneras pueden nombrarse estos 2 cargos?
SOLUCIÓN:
El cargo de titular puede ser ocupado de 5 maneras diferentes; y una vez ocupado el puesto de titular,
el suplente puede ser ocupado de 4 maneras diferentes, o simplemente número de permutaciones de
5 personas tomadas2 a 2.
5! 5! 5 4 3!
P25 = = = = 20 maneras
( 5 − 2 )! 3! 3!
5 formas= n1
4 formas= n2
# = n1 n2 = 5 4 = 20 maneras
COMBINACIONES
En muchos casos interesa seleccionar r objetos de n , sin importar el orden. estas selecciones se
llaman combinaciones, que se calculan con la formula
n!
Crn =
r !( n − r ) !
EJEMPLO 1:
Un estudiante tiene que contestar 5 de 8 preguntas en un examen.
a) ¿De cuantas maneras puede escoger las 5 preguntas?
b) Si las 3 primeras son obligatorias ¿De cuantas maneras puede escoger las preguntas?
c) Si tiene que contestar 3 de las 5 primeras ¿De cuantas formas puede hacerlo?
SOLUCIÓN:
a) Como interesa subconjuntos de 5 preguntas de un conjunto de 8 preguntas, sin importar el orden,
8!
se aplica la fórmula de combinaciones: C58 = = 56 Formas.
5!3!
b) Si las 3 primeras son obligatorias; los 2 restantes tendrán que escoger de las 5 preguntas sobrantes,
5!
luego aplicando: C25 = = 10 formas
2!3!
c) Si tiene que contestar 3 de las primeras, lo haría de C35 maneras y los 2 restantes seleccionaría de
las 3 preguntas finales es decir C23 . Entonces las 5 preguntas se seleccionarán de:
𝟓! 𝟑!
𝑪𝟓𝟑 ∗ 𝑪𝟑𝟐 = ∗ = 𝟏𝟎 × 𝟑 = 𝟑𝟎 (formas)
𝟑!𝟐! 𝟐!𝟏!
EJEMPLO 2
¿De cuantas maneras puede seleccionarse una comisión de 5 o más personas, Si hay 8 personas
disponibles?
SOLUCIÓN
Nos interesa los subconjuntos de 5,6,7 y 8 personas que se pueden formar con las 8 personas
disponibles, lo cual se hace con las combinaciones siguientes:
8! 8! 8! 8!
C58 + C68 + C78 + C88 = + + +
5!3! 6!2! 7!1! 8!0!
= 56 + 28 + 8 + 1 = 93 maneras
PROBABILIDAD
Históricamente se han desarrollado 3 definiciones de probabilidad que son:
a) Definición clásica o a priori.
b) Definición por frecuencia relativa
c) Definición subjetiva o personalista.
Sin embargo, cualquiera que sea la definición que se use. Las reglas de probabilidad son las mismas.
Las 3 definiciones son complementarias y la definición que se use depende del tipo o clase de
problema especifico que se trate de resolver.
# A nA
P( A) = =
# n
AXIOMAS DE PROBABILIDAD
o P( A) 1
A3 ) Para toda partición del espacio muestral, la suma de probabilidades de todos los elementos de la
partición es igual a 1.
P( A1 ) + P( A2 ) + P( A3 ) + ...... + P( AK ) = 1 A5
.. .. .. AK
TEOREMA 1: “Para todo evento “A” contenido en el espacio muestral como muestra el grafico
se cumple.
𝛺
P( A' ) = 1 − P( A) ó
A
P( A) + P( A' ) = 1 A1
donde:
A1 = complemente de A
TEOREMA 2: Si 2 eventos no son excluyentes, es decir, pueden ocurrir al mismo tiempo entonces:
Se cumple:
P( A B) = P( A) + P( B) − P( A B) A B
A B
(1.1), (1.2), (1.3), (1.4), (1.5, ), (1.6), (2,1), (2, 2), (2,3), (2, 4), (2,5), (2, 6)
= (3,1), (3, 2), (3,3), (3, 4), (3,5), (3, 6), (4,1), (4, 2), (4,3), (4, 4), (4,5), (4, 6)
(5,1), (5, 2), (5,3), (5, 4), (5,5), (5, 6), (6,1), (6, 2), (6,3), (6, 4), (6,5), (6, 6)
de donde: # = n = 36 número total de casos posibles.
n( A) 6 1
de donde # A = n( A) = 6 número de casos favorables entonces: P( A) = = =
n 36 6
b) El evento seria: B=” obtener suma mayor a 7
(1,1), (1, 2), (1,3), (1, 4), (1,5), (2,1), (2, 2), (2,3), (2, 4), (3,1), (3, 2)
C=
(3,3), (4,1), (4, 2), (5,1)
De donde: # C = n(C ) = 15
n(C ) 15 5
Luego P(C ) = = =
n 36 12
d) D=” obtener suma mayor a 5
(1,5), (1, 6), (2, 4), (2,5), (2, 6), (3,3), (3, 4), (3,5), (3, 6), (4, 2), (4,3), (4, 4)
D= (4,5), (4, 6), (5,1), (5, 2), (5,3), (5, 4), (5,5), (5, 6), (6,1), (6, 2), (6,3), (6, 4)
(6,5), (6, 6)
De donde: # D = n( D ) = 26
n( D ) 26 13
Luego P( D) = = =
n 36 18
EJEMPLO 2: En un curso hay 5 alumnos varones y 3 damas que aspiran a ser delegados al consejo
de carrera. Si se deben escoger 2 delegados al azar, escribiendo a los nombres en fichas y sacándolos
de una urna.
a) Cuál es la probabilidad que los 2 sean varones.
b) ¿Cuál la probabilidad que sean 1 varón y 1dama o 2 damas?
SOLUCIÓN: a) 5 varones y 3 damas =8 alumnos; delegados =2
V = V1 , V2 , V3 , V4 , V5 ; D = D1 , D2 , D3
(V1 ,V2 ), (V1 ,V3 ), (V1 ,V4 ), (V1 ,V5 ), (V2 ,V3 ), (V2 ,V4 ), (V2 ,V5 ), (V3 , V4 ), (V3 , V5 )
= (V4 , V5 ), ( D1 , D2 ), ( D1 , D3 ), ( D2 , D3 ), (V1 , D1 ), (V1 , D2 ), (V1 , D3 ), (V2 , D1 ), (V2 , D2 )
(V , D ), (V , D ), (V , D ), (V , D ), (V , D ), (V , D ), (V , D ), (V , D ), (V , D ), (V , D )
2 3 3 1 3 2 3 3 4 1 4 2 4 3 5 1 5 2 5 3
8!
# = n = C28 = = 28
2!6!
A= (V1 , V2 ), (V1 , V3 ), (V1 , V4 ), (V1 , V5 ), (V2 , V3 ), (V2 , V4 ), (V2 , V5 ), (V3 , V4 ), (V3 , V5 ), (V4 , V5 )
n( A) 10 5 5!
luego P( A) = = = = 0,357 = 35, 7% o también: C25 = = 10 → n( A) = 10
n 28 14 2!3!
n( A) 10 5
P( A) = = = = 0,357
n 28 14
n( B ) 18 9
luego P( B) = = = = 0, 642 o también con combinaciones
n 28 14
5! 3!
C15 = =5 C13 = =3
1!4! 1!2!
3!
2 damas C23 = =3
2!1!
Un varón y una dama o 2 damas =15+3=18 luego: n( B) = 18
n( B) 18
P( B) = = = 0.642
n 28
A este mismo resultado puede llegarse mediante un esquema de árbol que se muestra a continuación:
5 4 5
a) P( A) = = = 0,357
8 7 14
5 3 3 5 3 2
b) P( B) = + + = 0, 642
8 7 8 7 8 7
EJERCICIO 3:
De una baraja de 52 cartas, se extraen al azar 6 cartas. Determinar la probabilidad que 3 de ellas sean
rombos (diamante) y 2 trébol.
SOLUCIÓN:
E= “Extraer 6 cartas”
Se trata de subconjuntos de 6 cartas del total de 52
52!
# = C652 = =
6!46!
El evento A= “Extraer 3 rombos y 2 trébol”
• La probabilidad de que ocurra el evento A, dado que ha ocurrido B, P A | B está dada por:
P( A B)
P A | B = (1) P( B ) 0
P( B)
EJEMPLO 1:
En el experimento E= “Se lanzan 2 dados” suponiendo que se nos informa haber obtenido suma
mayor que 6. ¿Cuál es la probabilidad de obtener suma 7?
SOLUCIÓN:
= (1,1), (1, 2),....(1, 6), (2,1), (2, 2),....(2, 6), (3,1), (3, 2).....(3, 6)........(6,1), (6, 2).....(6, 6)
# = 36 = n
El evento B es: B= “obtener suma mayor que seis”
Entonces:
#( A B) 6 2
P A | B = = =
#B 21 7
o También:
n( A B )
P( A B) n( A B ) 6 2
P A | B =
n
= = = =
P( B) n( B ) nB 21 7
n
REGLA DE MULTIPLICACIÓN
P( A B)
P A | B = se tiene: P( A B) = P( B) P A | B
P( B)
P( A B)
P B | A = P( A B ) = P ( A) P B | A
P( A)
“La probabilidad de que ocurran los eventos Ay B es igual al producto de la ocurrencia de uno de
ellos multiplicado por la probabilidad de que ocurre el 2do, dado que ha ocurrido el 1ro”
EJEMPLO:
Una urna contiene 5 bolas blancas y 6 negras; se extrae al azar sucesivamente y sin reposición 2
bolas ¿Cuál es la probabilidad que las 2 resulten blancas?
SOLUCIÓN:
# = 55 = n donde:
B = B1 , B2 , B3 , B 4 , B5 _; __ N = N1 , N 2 , N 3 , N 4 , N 5 , N 6
A = ( B1 , B2 )( B1 , B3 )( B1 , B4 )( B1 , B5 )( B2 , B3 )( B2 , B4 )( B2 , B5 )( B3 , B4 )( B3 , B5 )( B4 , B5 )
# A = n( A) = 10
n( A) 10 2
Por tanto P( A) = = = = 0,182 P( A) = 18, 2%
n 55 11
2) APLICANDO LA REGLA DE MULTIPLICACIÓN:
n( B1 ) 5
P( B1 ) = =
n 11
B2 = “La 2da bola resulto blanca” # B2 = n( B2 ) = 4
4
P B2 | B1 =
10
A= “Las 2 bolas resultan blancas”
5 4 2
A = P( B1 B2 ) = P( B1 ) P B2 | B1 = = = 0,182
11 10 11
P( B1 B2 ) = 18, 2%
Se trata de combinaciones, porque son subconjuntos de 2 bolas de 11, cuya formula es:
m!
Cnm =
n !( m − n ) !
5!
# A = n( A) = C25 = = 10
2!3!
n( A) = 10 (Número de casos favorables)
n( A) 10 2
P( A) = = = = 0,182
n 55 11
P( A) = 18, 2%
4
P B2 | B1 =
10
B2 P( B1 B2 )
5
P ( B1 ) =
11
B1
6
P n1 | B1 =
10
N1
5 Blancas
5
P B1 | N1 =
6 Negras 10
B1
6
P ( N1 ) =
11
N1
5
P N 2 | N1 =
10
N2
Donde:
5 4 2
P ( B1 B2 ) = P( B1 ) P B2 | B1 = = = 0,182
11 10 11
P ( B1 B2 ) = 18, 2%
5 6 3
P( B1 N1 ) = P( B1 ) P N1 | B1 = = = 0, 273
11 10 11
6 5 3
P( N1 B1 ) = P( N1 ) P B1 | N1 = = = 0, 273
11 10 11
6 5 3
P( N1 N 2 ) = P( N1 ) P N 2 | N1 = = = 0, 273
11 10 11
La regla de Bayes “encuentra la probabilidad de una causa especifica cuando se observa un efecto
particular” o sea: “Si el evento B ha ocurrido, cual la probabilidad de que haya sido generado por el
evento A1 (causa posible) o por A2 (otra causa posible) técnicamente Bayes dice:
Si A1,A2,……,An, son una partición del espacio muestral ( ) entonces para todo evento B,
subconjunto del espacio muestral se cumple:
A2
AUTOR: ING. CAMILO G. MARIN GUTIERREZ
57
MANUAL DE CONSULTA UNIVERSIDAD PUBLICA DE EL ALTO
ESTADISTICA Y ANALISIS NUMERICO CARRERA DE INGENIERIA CIVIL
n 𝛺
P( B ) = P( Ai ) P B | Ai A1
i =1 A3
B=B A4 An
La deducción de la regla de Bayes es la
P( B A1 ) = P ( B ) P A1 | B
P ( A1 B ) = P ( A1 ) P B | A1
P( B ) P A1 | B = P( A1 ) P B | A1 de donde:
P ( A1 ) P B | A1
P A1 | B = ()
P( B)
P( B) = P( A1 B) P( A2 B) .... P( An B) o
P ( B ) = P ( A1 ) P B | A1 + P ( A2 ) P B | A2 + .... + P ( An ) P B | An
P( A1 ) P B | A1
Reemplazando en ( ): P A1 | B =
P( A1 ) P B | A1 + P ( A2 ) P B | A2 + .... + P ( An ) P B | An
Donde:
evento B (efecto)?
El diagrama de árbol siguiente da una visión esquemática del Teorema de probabilidad total.
EJEMPLO: La empresa constructora “A” se presenta a Licitación para construir una carretera.
La probabilidad que “A” gane la licitación es 0.7 si la empresa “B” no se presenta a ella, en tanto que
es de solo 0.4 si “B” se presenta. El GERENTE de “A” estima que hay una probabilidad de 0.75 que
la empresa “B” se presente.
SOLUCIÓN. - a) llamando:
P A | B = 0.4
P( B ) = 0.75 A P( B A)
B
P A | B = 0.6
A P( B A)
P A | B = 0.7
A P( B A)
P( B ) = 0.25
B
P A | B = 0.3
A P( B A)
b) P( A) = ?
c) P B | A = ?
P( B A) 075 04
Se sabe que: P B | A = = luego P B | A = 0.632 = 63.2%
P( A) 0475
V. VARIABLES ALEATORIAS
DEFINICIÓN. - Para un experimento aleatorio “E” y su espacio muestral ( ), una función X que
asigna a cada elemento ( ) del espacio muestral ( ), uno y solamente un número real
Dominio de =
𝛸: 𝛺 ⇒ ℝ
Rango de 𝛸 = ℝ ← números reales
= ( E , E )( E , N )( N , E )( N , N ) E , N ; E= Escudo; N=numero
= ( E , E , E )( E , E , N )( E , N , E )( E , N , N )( N , E , E )( N , E , N )( N , N , N )
Y se desea encontrar “el número de Escudos que salen del espacio muestral en 3 lanzamientos”. La
función en definida por = ”número de escudos obtenidos en 3 lanzamientos de moneda”
es una función que tiene como dominio el espacio muestral ( ) y como rango un subconjunto de
números reales dado por:
( E , E , E ) = 3(escudos)
( E , E , N ) = ( E , N , E ) = ( N , E , E ) = 2(escudos)
( E , N , N ) = ( N , E , N ) = ( N , N , E ) = 1(escudos) Rx = x / x = 0,1, 2,3
( N , N , N ) = 0(escudos)
: →
Luego:
: → 0,1, 2,3
Además, a cada elemento del rango Rx le corresponde una probabilidad dada en cada caso por:
1
P(0) = P( N , N , N ) = ; P(0) = probabilidad de ningún escudo
8
3
P(1) = P( E , N , N ) + P( N , E , N ) + P( N , N , E ) =
8
3
P(2) = P( E , E , N ) + P( E , N , E ) + P( N , E , E ) =
8
1
P(3) = P( E , E , E ) =
8
TIPOS DE VARIABLES ALEATORIAS. - Existen 2 tipos:
Entre las distribuciones de probabilidad más importantes referidas a la variable aleatoria discreta se
tiene a la distribución geométrica; la distribución binomial, la hipergeométrica y la distribución de
poisson.
LA DISTRIBUCIÓN BINOMIAL
En muchos ensayos tipo Bernoulli, solo interesa conocer el número total de éxito que se obtiene al
margen del orden en que se presentan en “n” ensayos.
x = Número de éxitos obtenidos en “n” ensayos de Bernoulli con rango Rx = 0,1, 2,3,...n
n
P = x | B; n,, p = P = x = x p x q n − x x = 0,1, 2,....n
n
o simplemente: b( x; n, p ) = x p x q n − x x = 0,1, 2,....n
n
donde: n = número de ensayos; x = conbinatoria
p = probabilidad de éxitos; q = probabilidad de fracasos
x = exitos; __________ p + q = 1
Por simetría de la distribución binomial, se ha eliminado en la tabla los valores de “p” que
exceden a 0,5.
Por tanto, si se tiene un problema donde la probabilidad de éxito “p” es mayor que 0,50 debemos
usar el siguiente procedimiento:
1) r = se cambia por (n − r )
2) p = se cambia por (1 − p)
3) Se invierten las desigualdades ( se cambia por );( por ) y así sucesivamente.
a) P x 6 /11, 0.7 = ?
ii. Se busca el valor de p = 03 los valores de “p” están en las primeras filas de cada grupo,
para nuestro caso, en la primera fila del tercer grupo (Página 768).
iii. El valor de r = 6 se encuentra en la primera columna de este tercer grupo y haciendo
coincidir r = 6 con p=0.30 se determina que:
P x 6 /11, 03 = 0, 0782 = 7,82%
b) P x 6 /11, 07 = ? n = 11 p = 07 r = 6
c) P x 6 /11, 0.7 = ?
d) P x = 6 /11, 0.7 = ?
=0,2103-0,0782=0,1321=13,21%
e) P x 6 /11, 0.7 = ?
DISTRIBUCION DE POISSON
Es una de las distribuciones discretas más importantes. Esta distribución se utiliza cuando los
problemas consisten en observar la ocurrencia de eventos discretos en un intervalo continuo.
Esta distribución expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que
ocurra un determinado número de eventos durante cierto periodo de tiempo.
x = “Número de ocurrencia de eventos en “t” unidades de medida con rango Rx = 0,1, 2,3,.... ”
x e−
P = x | = donde: e = 2, 71828
x!
= numero promedio de ocurrencias de los eventos en “t” unidades de medida.
En esta distribución se requiere como dato, el valor de (promedio a largo plazo) para determinar
la probabilidad de que ocurra un numero designado de eventos (x) con un promedio de ocurrencias
( ) a corto plazo.
t
= E ( x) = media de la distribución
2 = varianza de la distribución
( x)
EJERCICIO 1.-En un hospital de una ciudad se está estudiando los nacimientos de bebes varones. Se
sabe que en una semana nacen un promedio de 7 varones. Calcular
Rx = 0,1, 2,....
x − e−
La distribución de POISSON es: P = x / =
x!
73 − e−7
a) Reemplazando: P x = 3 / = 7 = = 0, 052
3!
P x = 3 / = 7 = 5, 2%
b)
P x 3 / = 7 = P x = 0 + P x = 1 + P x = 2
7 0 e −7 71 e −7 7 2 e −7
P x 3 = + +
0! 1! 2!
P x 3 = 0, 001 + 0, 006 + 0, 022
P x 3 = 0, 029 = 2,9%
Rx = 0,1, 2,3,.....
=
t
1 24
12
= 2 acc (
mes ) luego
21 e.2
P X = 1| = 2 = = 0, 2707 27, 07%
t 1!
b) Aplicando la regla de 3 simple
(
= 8 acc 4meses
t
)
Reemplazando se tiene:
84 e−8
P X = 4 / t = 8 = = 0, 05725
4!
P X = 4 / t = 8 = 5, 725%
Esta tabla se usa para determinar probabilidades del tipo P X x / ; (TABLA II pagina 771-772).
EJEMPLO. - Las personas llegan aleatoriamente a la ventanilla de un banco en promedio a una razón
de 24 por hora.
Rx = 0,1, 2,3,.....
__________12 _ min
t
=
t
12( min ) 24( personas )
60(min)
= 4,8 pers
12 min( )
(
= 4,8 pers 12 min
t )
APLICANDO LA DISTRIBUCIÓN DE POISSON
P X = 5 = 17, 47%
Rx = 10,11,12,.....
P x 12 = 1 − 0, 0014
1, 2, 3, 4, 13, 14 15
P x 12 = 0,9986
5, 6, 7, 8, 16, 17, 18
P x 12 = 99,86%
9, 10, 11, 19, 20, 21, 22
12 . . . . . . . .
La D.N. es una curva regular simétrica en forma de campana, por lo cual recibe el nombre de
campana de Gauss.
Una variable aleatoria continua x, sigue una distribución normal de media ( )y desviación estándar
( ) y se simboliza por N( , ), si se cumplen las siguientes condiciones:
1 x−
2
1 −
f ( x) = ___ e 2 (I); para − +
2
Donde: = media o valor esperado de x . ; e = 2, 71828
2 = varianza de x
Propiedades de la distribución normal N ( , )
P1. El campo de existencia o dominio es cualquier valor real, es decir, ( −, + ); cuando x es más
P6. El área total encerrada bajo la curva y el eje de abscisas es igual a la unidad y representa a
P7. Por simetría respecto al eje x = , deja un área igual a 0.5 a la izquierda y otra igual a 0.5 a la
derecha.
− 3 − 2 − + + 2 + 3 x
Z
-3 -2 -1 0 1 2 3 unidad estándar z
La distribución NORMAL ESTÁNDAR. Cualquier valor x de una población con D.N. puede
x−
convertirse a su valor standar equivalente z con la fórmula: (A) Z = y con el uso de tablas se
halla el valor de Z. es decir que:
Para poder utilizar la tabla tenemos que transformar la variable x que sigue una distribución
N ( , ) en otra variable Z que siga una distribución N (0,1) por lo que la operación necesaria es la
señalada por la formula (A).
Con el uso de tablas pueden obtenerse las porciones de área (Probabilidades) para diversos
intervalos de valores para la distribución normal stándar.
1 2 escala _ x
= VAR( B) VAR( A) VAR(C )
2
x
Los gráficos muestran mayor o menor dispersión de los datos en las distribuciones A, B, y C.
Para la variable Z(aleatoria) que tiene una distribución normal, con media = o y varianza 2 = 1,
1 −z
2
Z Escala Z
-3 -2 -1 0 +1 +2 +3
Con la tabla se puede resolver 2 tipos de problemas: a) Conocido Z hallar el área y b) Conocido el
Área hallar Z.
Ej.1
La vida útil de un componente eléctrico tiene una media de 2500 horas con una desviación estándar
de 250 horas. a) ¿Cuál es la probabilidad de que un componente x , elegido al azar dure entre 2200
y 3000 horas? b) ¿Cuál es la probabilidad que dure más de 3100 horas?
0.8621
P x 3100 = 1 − P x 3100
x − 3100 − 2500
P x 3100 = 1 − P = 1 − Z 2.4
250
P x 3100 = 1 − f (2.4) = 1 − 0.9918
P x 3100 = 0, 0082 = 0.82%
Escala Z
-3 -2 -1 0 1 2 3
Ejemplo 2 El salario de los empleados de una empresa tiene un promedio de 450($us) y una
desviación estándar de 75($us)
x − 390 − 450
P x 390 = P = P Z 0.8 = f (−0.8)
75
x − 45 − 45 −
P x 45 = P = P Z
45 −
= f = 0.31 __(1); por otra parte
x − 64 −
P x 64 = 1 − P x 64 = 1 − P
64 −
P x 64 = 1 − f = 0.08 _________ o
64 −
f = 092 __(2)
En tabla III
45 −
Buscamos el Área A=0.31 de (1) se obtiene: = −0.5 __(a)
64 −
Buscamos el Área A=092 de (2) se obtiene: = 1, 4 __(b)
De donde: de (a) 05 − = 45
+m
1.4 + = 64 m
de (b)
1.9 = 19
= 10
Reemplazo en (b) = 64 − 1.4 10
= 50
Una Distribución Bidimensional es aquella en la que para cada elemento se consideran2 caracteres
cuantitativos distintos (x, y).
Para analizar en forma conjunta a las variables x, y, se considera el par (x, y) como una sola
variable llamada Variable estadística bidimensional o variable bivariante.
Definición: Si (x, y) es una variable bidimensional en la que los distintos valores que toman x, y son:
x : x1 , x2 , x3 ,....xi ..., xk
y : y1 , y2 , y3 ,.... y j ..., yk
k
n* j = nij Es el total de pares donde el segundo componente toma los valores
i =1
k r
n= f ij Es el total de pares con el segundo componente y j ; j = 1, 2,..., r se llama
i =1 j =1
frecuencia total de ( xi y j )
En el caso de una variable continúa agrupada en intervalos, se emplean las marcas de clase para
obtener una tabla equivalente.
Cuando x,y son variables cualitativas la tabla de distribución bidimensional se llama tabla de
contingencia.
X Y 1 2 4 6
1 2 0 1 1
3 3 1 0 1
5 0 1 0 5
Se pide:
3 4 3 4
a) nij
i =1 j =1
b) f 23 , f34 , f 21 c) ni• y n• j
i =1 j =1
Solución
a)
3 4 3
n = n
i =1 j =1
ij
i =1
i1 + ni 2 + ni 3 + ni 4 = n11 + n12 + n13 + n14 + n21 + n22 + n23 + n24 + n31 + n32 + n33 + n34 =
__________________________ = 2 + 0 + 1 + 1 + 3 + 1 + 0 + 1 + 0 + 1 + 0 + 5 = 15
b) Cada nij representa la frecuencia absoluta del par ( xi , y j ), la frecuencia relativa se define
nij 3 4
fij =
N
. Donde N = n
i =1 j =1
ij = 15
n23 0 n 5 n 3
f 23 = = = 0 ______ f34 = 34 = ______ f 21 = 21 =
N 15 N 15 N 15
C)
X Y 1 2 4 6 ni•
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 6
n* j 5 2 1 7 15
3 3 4
4 3 4
d)
X Y 1 2 4 6 ni•
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 n3• = 6
n• j 5 n•2 = 2 1 7 15
x n ( xi / Y = 2 ) n ( xi / Y = 2 )
f ( xi / Y = 2 ) =
n•2
1 0 0
2 1 ½
3 1 ½
n•2 = 2 1
y n ( y j / X = 3) n ( y j / X = 3)
f ( y j / X = 3) =
n3*
1 0 0
2 1 1/6
4 0 0
6 5 5/6
n3• = 6 1
e)
3 4 3
x n i ij x n i i1 + ni 2 + ni 3 + ni 4
1
( x1n11 + x1n12 + x1n13 + x1n14 +
i =1 j =1
a10 = = i =1
=
N N N
=
1.2 + 1.0 + 1.1 + 1.1 + 3.3 + 3.1 + 3.0 + 3.1 + 5.0 + 5.1 + 5.0 + 5.5 = 49 = 3, 26
15 15
3
xn i i*
1.4 + 3.5 + 5.6 49
O también, a10 = i =1
= = = 3, 26
N 15 15
4
x n
j =1
j *j
1.5 + 2.2 + 4.1 + 6.7 55
a01 = = = = 3, 6
N 15 15
f)
3 4
x y n
i =1 j =1
i j ij
a11 = =
N
=
1.1.2 + 1.2.0 + 1.4.1 + 1.6.1 + 3.1.3 + 3.2.1 + 3.4.0 + 3.6.1 + 5.1.0 + 5.2.1 + 5.4.0 + 5.6.5 = 205 = 13.66
15 15
g) sxy = a11 − a10 a01 = 13, 66 − 3, 26.3, 6 = 1,924
2. Las calificaciones obtenidas por un grupo de alumnos en estadística (E) y Macroeconomía (M):
E 3 4 6 7 5 8 7 3 5 4 8 5 5 8 8 8 5
M 5 5 8 7 7 9 10 4 7 4 10 5 7 9 10 5 7
Solución
E M 4 5 6 7 8 9 100 ni•
3 1 1 2
4 1 1 2
5 1 4 5
6 1 1
7 1 1 2
8 1 2 2 5
n• j 2 4 0 5 1 2 3 17
b)
− En
99 i i• E n 2
i i•
629
E = a10 = = 5,82 a20 =
i =1
= i =1
= = 37
N 17 N 17
sE2 = a20 − a102 = 37 − 5,822 = 3,13
M j n• j
119
j =1
M
j =1
2
n
j •j
903
M = a01 = = = 7 a02 = = = 53,11
N 17 N 17
sM2 = a02 − a01
2
= 53,11 − 72 = 4,11
6 7
E M n
i =1 j =1
i j ij
3.4.1 + 3.5.1 + 4.4.1 + 4.5.1 + 5.5.1 + 5.7.4 + 6.8.1 + 7.7.1 + 7.10.1 + 8.5.1 + 8.9.2 + 8.10.2
a11 = =
N 17
739
a11 = = 43, 47 sxy = a11 − a10 a01 = 43, 47 − 5,82 = 2, 73
17
3. Dada la Tabla de correlaciones, Hallar n21 para que las dos variables sean estadísticamente
independientes y calcular su covarianza en este caso.
X Y 5 7
100 8 4
200 n21 6
Solución
X Y 5 7 ni•
100 8 4 12
200 6 n21 + 6 nij ni• n• j
n21 Por ser independiente: = __ i , j
N N N
n• j n21 + 8 10 n21 + 18
4 12 10 120 120 − 72
= →4= → 4 n21 + 18 = 120 → n21 = = 12
n21 + 8 n21 + 18 n21 + 18 n21 + 18 4
X Y 5 7 ni•
100 8 4 12
Covarianza: sxy = a11 − a10 a01
200 12 6 18
n• j 20 10 30
2 2
x y n
i =1 j =1
i j ij
100.5.8 + 100.7.4 + 200.5.12 + 200.7.6 27200
a11 = = = = 906, 67
N 30 30
sxy = a11 − a10 a01 = 906, 67 − 160.5, 67 = −0,53
1. ESTIMACION DE PARAMETROS
PRUEBA DE HIPÓTESIS
Es una regla que especifica si se puede aceptar o rechazar una afirmación acerca de una población.
La Ho es el enunciado que se probara con base en los datos de una muestra. Para un nivel de
significado (generalmente=0.05).
Ejemplo: Un fabricante de galletas ha impreso en los paquetes que el peso es de 500 gramos, pero
el contenido real es una variable aleatoria, el fabricante afirma que = 500( gr ) con una
desviación estándar igual a 5(gr). Se desconfía de la afirmación de que la media sea = 500( gr ) y
se quiere analizar su veracidad.
Es necesario señalar que no se pueden pesar todos los paquetes de la producción de galletas. Por
tanto, se toma una muestra aleatoria de 100 paquetes y se mide el peso.
−
• Si la media X es muy inferior a 500(gr) o ( x − ) muy grande
Se rechaza la “ H 0 ”
−
• Si la media X es muy cercana a 500(gr) o ( x − ) es pequeña entonces evidencia
suficiente para rechazar “ H 0 ”
−
Si se obtiene por ejemplo x = 421.3( gr ) se rechaza H0
−
Si x = 499.8( gr ) evidencia para rechazar H0
H0 es V H0 es F
Zona
De
= 0.05 Aceptación
Zona de x
Rechazo Zona de Aceptación
Z
− − − − − −
x+ 2 x
x − 3 x− 2 x− x+ x + 3
Z
-3 -2 -1 0 1 2 3
−1, 64
Para = 0.05 → se determina Zcrit = −1.64 en tabla (Valor critico)
Usando la tabla III, Para = 0.05 se determina Z=-1.64 o también usando la tabla IV (B) Área bajo
la cola D.N. estándar.
Ep = −1.8 este valor cae en la zona de rechazo, lo cual implica que La H0 se rechaza
499.2 − 500
Si Ep = = −1.6 este valor cae en la zona de aceptación H0 se acepta
0.5
Pasos para realizar prueba de Hipótesis
NOTA: