Manual de Consulta Materia Estadistica y Analisis Numerico Docente Ing. Camilo G. Marin

MANUAL DE CONSULTA UNIVERSIDAD PUBLICA DE EL ALTO
ESTADISTICA Y ANALISIS NUMERICO CARRERA DE INGENIERIA CIVIL
MANUAL DE CONSULTA
ESTADISTICA Y ANALISIS NUMERICO
I. RECOLECCION Y PROCESAMIENTO DE DATOS ESTADISTICOS
AUTOR: ING. CAMILO G. MARIN GUTIERREZ

1

2

3

4

5

6
EJEMPLO:
Los datos siguientes corresponde a las inversiones en miles de dólares que Empresas Constructoras
efectuaron para ampliar su mercado en el rubro de construcción.
Inversiones (en miles de $us)
30 40 42 70 36 38 40 60 32 38 36 44
36 76 36 58 60 56 60 34 36 40 48 47
38 43 55 37 36 38 44 37 45 49 57 52
50 42 51 38 39 41 43 47 48 50 60 90
52 44 35 35 36 38 37 42 45 66 69 82
a) Elaborar el cuadro de distribución de frecuencias

b) Interpretar las frecuencias
c) Determinar el número de empresas con inversiones mayores de a 48 mil dólares.
d) El porcentaje de empresas con inversiones mayores a 80mil $us
SOLUCION:
−
yi −1 − yi yi ni hi Ni Hi 100hi % Ni  Hi 
28-36 32 5 0,0833 5 0,0833 8,33 60 0,9997
36-44 40 26 0,4333 31 0,5166 43,33 55 0,9164
44-52 48 13 0,2166 44 0,7332 21,66 29 0,4831
52-60 56 6 0,1000 50 0,8332 10,00 16 0,2665
60-68 64 5 0,0833 55 0,9165 8,33 10 0,1665
68-76 72 2 0,0333 57 0,9498 3,33 5 0,0832
76-84 80 2 0,0333 59 0,9831 3,33 3 0,0499
84-92 88 1 0,0166 60 0,9997 1,66 1 0,0166
TOTAL n=60 1,000 100,00
c) NUMERO DE EMPRESAS CON INVERSIONES MAYORES DE 48 MIL $US.

Es decir, el número de empresas que invirtieron 49 mil o más ($us) graficando se tiene:
13 6 5 2 2 1
444 49 52 60 68 76 84 92

7
𝟖 𝟑 𝟑 × 𝟏𝟑
= ⇒ 𝒙𝟏 = = 𝟒, 𝟖𝟕 ≈ 𝟓
𝟏𝟑 𝒙𝟏 𝟖
Por tanto, el Número de Empresas = 5+6+5+2+2+1 = 21
Rpta.: 21 empresas invirtieron más de 48 mil($us)
D) PORCENTAJE DE EMPRESAS CON INVERSIONES MAYORES A 80 MIL ($US)
2 1
68 76 81 84 92
𝟖
𝟐
=
𝟑
𝒙𝟏
⇒ 𝒙𝟏 =
𝟐×𝟑
𝟖
𝟔
= = 𝟎. 𝟕𝟓 ≈ 𝟏
𝟖
N =1+1 = 2
𝟐
por tanto, el porcentaje es%= = 𝟔𝟎 × 𝟏𝟎𝟎 = 𝟑. 𝟑𝟑%
SIMETRÍA DE UN CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS

Un CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS con número impar de intervalos o
m=2k-1 es simétrica, si: las clases equidistantes de la clase central tiene frecuencias absolutas iguales,
es decir:
𝒏𝒌−𝒋 = 𝒏𝒌+𝒋 𝟏≤ 𝑱≤ 𝑲−𝟏
𝒉𝒌−𝒋 = 𝒉𝒌+𝒋 𝟏≤ 𝑱≤ 𝑲−𝟏
Ejemplo:
−
𝒚𝒊−𝟏 − 𝒚𝒊 𝒚 𝒏𝒊
𝒉𝒊
4-10 7 8 0,04
10-16 13 20 0,10
10-22 19 42 0,21
22-28 25 60 0,30
28-34 31 42 0,21
34-40 37 20 0,10
40-46 43 8 0,04
TOTAL n = 200 1.00
En el cuadro, el número de clases es m=7

8
𝒎+𝟏 𝟕+𝟏
Como 𝒎 = 𝟐𝒌 − 𝟏 ⇒ 𝒌 = = =𝟒⇒𝒎
𝟐 𝟐
Entonces para: 𝑱 = 𝟏: 𝒏𝟒−𝟏 = 𝒏𝟒+𝟏 ⇒ 𝒏𝟑 = 𝒏𝟓 = 𝟒𝟐
𝑱 = 𝟐: 𝒏𝟒−𝟐 = 𝒏𝟒+𝟐 ⇒ 𝒏𝟐 = 𝒏𝟔 = 𝟐𝟎
𝑱 = 𝟑: 𝒏𝟒−𝟑 = 𝒏𝟒+𝟑 ⇒ 𝒏𝟏 = 𝒏𝟕 = 𝟖
Un CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS con número par de clases

o m=2k, es simétrico si las 2 clases centrales tienen frecuencias iguales, y las clases
equidistantes de esta clase centrales tienen también frecuencias iguales.
Ejemplo:
−
𝒚𝒊−𝟏 − 𝒚𝒊 𝒚 𝒏𝒊 𝒉𝒊
5-8 6.5 12 0073

8-11 9.5 15 0091
11-14 12.5 25 0152
14-17 15. 30 0183
17-20 18.5 30 0183
20-23 21.5 25 0152
23-26 24.5 15 0091
26-29 27.5 12 0073
TOTAL 164
REPRESENTACIONES GRAFICAS

9

10

11

12

13
Representando los datos en el diagrama de sectores con sus ángulos correspondientes, se tiene:
Los gráficos, los índices, los cuadros de distribución de frecuencias son formas de resumir un
conjunto de datos a pocas cifras, las mismas que hacen innecesario el examen de todos los datos.
Las cifras descriptivas que se obtienen de una muestra ( x1 , x2 ..., xn ) se llaman estadígrafos o
estadísticos y son de 4 tipos:
a. De posición
b. De dispersión
c. De concentración
d. De forma
a) Estadígrafos de posición
Son los que describen la posición que ocupa la distribución de frecuencias respecto a un valor de
la variable y son de 2 tipos:
• Los de tendencia central
• Los de Localización
• Estadigrafos de Tendencia central

Se llaman así porque sus valores tienden a ocupar posiciones centrales entre el menor y el
mayor valor y brindan información sobre el centro de la distribución, los más usados son: La
media aritmética, La media Geométrica, la media armónica, La media cuadrática y la mediana
• Estadígrafos de Localización
Muestran la localización de los valores más frecuentes o de valores extremos. Los más usados
son: la moda los cuartiles etc.

14
b) Estadígrafos de dispersión
Muestran cuan dispersos o separados están los datos; mientras mayor sea su valor, quiere decir
que los datos se encuentran más dispersos. Los más importantes son la varianza ( 2 ) La
desviación estándar (  ) y el coeficiente de variación.
c) Estadígrafos de concentración
Muestran el grado de concentración o de desigualdad de una distribución. La concentración de
una distribución hace referencia al mayor o menor grado de igualdad en el reparto del total de los
valores de una variable. Se calculan medidas de concentración, con el fin de estudiar hasta qué
punto el total de la riqueza de un país esta equitativamente repartido entre sus habitantes.
d) Estadígrafos de forma
Muestran la forma de la curva o polígono de distribución de frecuencias y en especial su simetría
o asimetría.
ESTADIGRAFOS (DESARROLLO)
MEDIDAS DE TENDENCIA CENTRAL
Son valores representativos del conjunto de datos, que están distribuidos alrededor de cierto valor
Central.
−
1. MEDIA ARITMÉTICA (𝒙 )
La media aritmética de un conjunto de datos x1 , x2 x3 ,..., xn . finito, se define como la suma de todos
los valores dividida entre el número total de valores.
n
− x + x + x + ... + xn − x i
x= 1 2 3 o x= i =1
n = numero de datos
n n
También es conocida como el promedio del conjunto de datos.
Ejemplo: Las edades de 7 obreros de una empresa de construcción son:18,26,34,22,45,27,31.
−
Encontrar la media ( x )
Solución: Aplicando la formula

− n
xi x 1 + x2 + ...x7 18 + 26 + 34 + 22 + 45 + 27 + 31
x= = = = 29 (años)
i =1 n n 7
Lo que se busca al calcular la media es tener un dato representativo del conjunto de datos.

15
1.1. LA MEDIA EN DATOS TABULADOS

Si los datos tabulados son discretos, se calcula con la suma de todos los productos de los valores
que asume la variable por las frecuencias absolutas respectivas dividido por el número total de
n
− yn i i
datos: x = M ( x)o; y = M ( y ) =
− i =1
(A)
n
Ejemplo: En un grupo de personas, 3 tienen 25 años,2 tienen 26 años, 4 tienen 38 años y 7 tienen
45 años. ¿Cuál es la edad media de las personas que forman el grupo?
Solución: Elaboramos la Tabla de frecuencias de los datos, agregando la columna yi .ni
Edad ni 𝑦𝑖 ∗ 𝑛𝑖 Se efectúa los productos y se aplica la formula(A)

𝑦𝑖
n
25
26
3
2
75
52 −  y .n i i
594
38 4 152 y= i =1
= = 37,125
n 16
45 7 315
TOTAL 16 594 Interpretación La edad que se espera que tenga cada
persona del grupo es 37,125
LA MEDIA EN DATOS TABULADOS EN CLASES (VARIABLE CONTINUA): [ )

Ejemplo: Calcular la media para los datos de las inversiones de empresas constructoras
−
Solución: a) Se determinan las marcas de clase de cada intervalo ( y i )
−
b) Se efectúa el cálculo de los productos yi . ni
−
−
c) Se aplica la fórmula: y =
 y i .ni o
− n
y =  y i hi
−
n i =1
El cuadro de distribución con los cálculos es el siguiente:

INVERSIONES MARCA DE CLASE −
𝒚𝒊−𝟏 − 𝒚𝒊
− 𝑛𝑖 𝑦𝑖 𝑛𝑖
𝒚𝒊
8 −
 y i ni
28-36 32 5 160
36-44 40 26 1040 −
44-52 48 13 624 y= i =1
52-60 56 6 336 n
60-68 64 5 320 − −
2872
68-76 72 2 144 y= y = 47,87
76-84 80 2 160 60
84-92 88 1 88
TOTAL n = 60 2872

16
Interpretación: Cada vez que una empresa constructora invierta para ampliar su mercado, se
espera que su inversión sea de 47,87 mil dólares.
2. LA MEDIA ARITMÉTICA PONDERADA

Esta medida es apropiada cuando en el conjunto de datos cada uno de ellos tiene una importancia
relativa (o peso) respecto de los demás datos.
Para una serie de datos ( x1 , x2 , x3 ,...xn ) a la que corresponde ( w1 , w2 , w3 ,..., wn )pesos, la media
n
− xw i i
x1w1 + x2 w2 + x3 w3 + ... + xn wn
ponderada se calcula de la fórmula: x = i =1
=
n
w1 + w2 + w3 + ...wn
w
i =1
i
Ejemplo: Una empresa de construcción tiene 3 tipos de obreros: No calificados; semicualificados y

calificados para el encofrado y armado de elementos estructurales. Calcular el costo promedio de
(mano de obra/día) para cada especialidad; si se tiene los datos siguientes
Solución: con la formula

−
x=
xw i i
w i
Donde: xi = Salario de cada tipo de obrero; wi =Peso asignado a cada tipo
−
xe =
xw i i
=
5 x 2 + 8 x3 + 12 x5
= 9, 4($us / dia )
w i 2+3+5
− 5 x 4 + 8 x3 + 12 x5
xa = = 8, 67($us / dia)
4+3+5

17
M e( x)
3. LA MEDIANA
Para un conjunto de datos x1 , x2 , x3 ,..., xn ordenados en forma ascendente es el valor de la variable

de posición central. Si el conjunto de datos tiene un numero par, la mediana es la media de los dos
valores centrales (Se ubica en el centro del conjunto total de datos.)
3.1. LA MEDIANA PARA DATOS NO TABULADOS M e ( x )
El proceso de cálculo es el siguiente:

a) Se ordena los datos en forma ascendente.
b) Si el número de datos es impar; la Me(x) se calcula con M e( x) = X n +1
( )
2
xn +xn
( ) ( ) +1
c) Si el numero de datos es par: M e( x) = 2 2
Ejemplo 1: Calcular la mediana M e ( x ) para los datos: 51,24,43,27,39,19,37
Solución: Ordenando los datos : 19, 24, 27, 37, 39, 43, 51
x1 x2 x3 x4 x5 x6 x7
𝑛 = 7 (𝑖𝑚𝑝𝑎𝑟) ∶ 𝑀𝑒(𝑥) = 𝑥(𝑛+1) = 𝑥(7+1) = 𝑥4 = 37
2 2
Ejemplo 2: Calcular la mediana M e ( x ) para los datos: 51,24,43,27,39,19,37,62
Solución: Ordenando:19,24,27,37,39,43,51,62
x( n /2) + x( n /2) +1 x4 + x5 37 + 39
n = 8( par ) : M e ( x ) = = = = 38
2 2 2
La mediana Me(x), es el valor central del conjunto de observaciones; antes y después de la Me(x),
no hay más de la mitad de los datos.
3.2. LA MEDIANA PARA DATOS TABULADOS M e ( x )
CASO1: LA VARIABLE ASUME POCOS VALORES

El proceso de cálculo es el siguiente:

18
a) Con los valores que asume la variable; sus frecuencias absolutas ( ni ) y las frecuencias
absolutas acumuladas ( N i ), se construye el C.D.F. con estas 3 columnas. Y se calcula el
valor de ( n / 2 ).
b) Se determina la menor frecuencia absoluta acumulada ( N j ) que supera a ( n / 2 ), y/o pueden

ocurrir 2 situaciones:
y j −1 + y j
1. Si: ( n / 2 )= N j −1 M e( y ) =
2
2. Si: ( n / 2 )  N j −1 M e( y ) = y j
Ejemplo: Dada la tabla de frecuencias de datos discretos hallar la mediana
yi 20 30 50 60 70 80 90 100
ni 12 10 20 18 15 10 7 28
Solución: a) Con los valores dados construimos la tabla de distribución de frecuencias absolutas
acumuladas “menor que “y calculamos ( n / 2 )
yi ni Ni n 120
= = 60
20 12 12 2 2
30 10 22
b) El valor de n/2=60 coincide con el cuarto valor
50 20 42
y j −1 60 18 60 N j −1 de Ni=60 a este valor lo llamamos N j −1 = 60
70 15 75
yj y j −1 + y j
80 10 85 60 + 70
c) Por tanto Me( y ) = =
90 7 92 2 2
100 28 120
n=120 Me( y ) = 65
Cuando el valor de (n/2), no coincide como en el siguiente ejemplo:
yi ni Ni n 92
= = 46
20 12 12 2 2
30 10 22
b) El valor de n/2=46 no coincide con ningún valor
50 20 42 N j −1
yj n
60 18 60 Nj de Ni o sea 42   60
70 15 75 2
80 10 85
90 7 92  N j −1 = 42;  N j = 60
n=92

19
n
Como  N j −1  Me( y ) = y j
2
Me( y ) = 60
3.3.LA MEDIANA PARA DATOS TABULADOS EN CLASES (VARIABLE

CONTINUA)
La mediana se encuentra en el intervalo donde la frecuencia absoluta acumulada llega hasta la mitad
de la suma de la Ni
CASO A:
n
Cuando el valor de (n/2) coincide con un valor de “Ni” Es decir si: = N j −1  la mediana
2
Me( y ) = y y
Ejemplo:
El cuadro las ganancias semanales de 40 comerciantes informarles. Calcular la mediana
Me(y)
Solución:
GANANCIAS N° COMERCIANTES Ni n 60
yi −1 − yi ni = = 30
2 2
300-350 5 5
350-400 11 16 n
coincide con un valor de N i
y j −1 → [ 400-450 )  y j 14 30  N j −1 2
450-500 16 46
n
500-550 10 56 ó = N j −1
550-600 4 60 2
TOTAL n = 60 Por tanto: M e ( y ) = y j
M e ( y ) = 450

20
CASO B:
n
Cuando el valor de ( n / 2 ) no coincide con un valor de N i es decir que: N j   N j −1
2
entonces para el calculo de la mediana M e ( y ) se usa la formula siguiente:
 n / 2 − N j −1 
M e ( y ) = y j −1 + C j   (A)
 N j − N j −1 
4. LA MODA
La moda (Mo) La moda de un conjunto de datos x1 , x2 ,..., xn es el valor que más veces se
repite, o se presenta con mayor frecuencia en una distribución de datos.
Ejemplo: Para los datos: a) 2,4,5,5,6,7,2,5  M O = 5
b) 3,4,5,6,7,8,9,  No hay moda es amodal
c)1,1,1,4,4,5,5,5,7,8,9,9,9,  M o = 1,5,9 (trimodal)
4.1. LA MODA EN DATOS AGRUPADOS EN CLASES

CASO A: Cuando todas las clases tienen la misma amplitud.
Ejemplo: Calcular la moda de los datos siguientes:
yi −1 − yi ni Proceso de calculo
60-63 5 a) Se identifica entre las frecuencias el valor mayor: n3 = 42
63-66 18
66-69 42 b) Se determina la clase modal p/el ejemplo [66-69)
69-72 27
72-75 8 c)La ( M o ) se obtiene utilizando la fórmula:
TOTAL 100
 1 
M o = y j −1 + c j   (B)
 1 +  2 

21
Donde: y j −1 = límite inferior de la clase modal=66
1 = Exceso de la frecuencia absoluta modal sobre la frecuencia de la clase
inferior: 1 = n j − n j −1 = 42 − 18
1 = 24
 2 = Exceso de la frecuencia absoluta modal sobre la frecuencia de la clase
superior:  2 = n j − n j +1 = 42 − 27
 2 = 15
c j = amplitud de la clase modal; c j = 3
 24 
M o = 66 + 3 
 24 + 15 
M o = 67,85
CASO B: Cuando los intervalos tienen amplitudes distintas

PROCESO DE CALCULO:
ni
a) Primero se hallan las alturas con hi =
ci
b) La clase modal es la que tiene mayor altura (altura modal)
c) La M o se obtiene utilizando la formula
 h1 
M o = y j −1 + c j   (c )
 h1 + h2 
Donde:
y j −1 = límite inferior de la clase modal
c j = amplitud de la clase modal
h1 = Exceso de la altura modal sobre la altura de clase inferior.
h2 = Exceso de la altura modal sobre la altura de clase superior.

22
ESTADIGRAFOS DE DISPERSIÓN
Son parámetros estadísticos que indican la separación existente entre los valores que toma la variable,
es decir que reflejan la mayor o menor concentración con que se encuentran distribuidos los datos,
alrededor de un valor central.
1. RANGO (R)
El rango es la diferencia entre los valores extremos del conjunto de datos. En un conjunto de datos
mientras mayor sea el rango, mayor será su dispersión y viceversa. Si tenemos los datos
−
a) 8,9,10,11,12,13,14,15,16  x ( a ) = 12 ; M e ( a ) = 12
−
b) 4,6,8,10,12,14,16,18,20  x ( b ) = 12 ; M e ( b ) = 12
R( a ) = 16 − 8 = 8  R = xmax − xmin R( b )  R( a )
R( b ) = 20 − 4 = 16 Los datos de b) están más dispersos.
2. RANGO INTERCUARTILICO
Es la diferencia entre el tercer y primer cuartil o también la diferencia entre los percentiles
75avo y 25avo
R.I . = Q3 − Q1 R.I . = P75 − P25
El rango intercuartílico es mas exacto que el rango de la variable porque evita el inconveniente de los
valores extremos anormales.

23
3. LA DESVIACIÓN MEDIA ABSOLUTA (D.M.)

Es el valor absoluto de la diferencia entre cada uno de los elementos de un conjunto de datos y la
media aritmética del grupo.
3.1. LA DESVIACIÓN MEDIA PARA DATOS NO TABULADOS

Se expresa de acuerdo a la fórmula:
1 n u = Promedio de población total

D.M . =  xi − u
n i =1 −
x = Promedio de la muestra
1 n −
D.M . = 
n i =1
xi − x n = numero de datos
El proceso que se sigue para el cálculo de la desviación media es el siguiente:

a) Se calcula el promedio o media de los datos.
b) Se elabora el cuadro: xi xi − u xi − u
c) Se aplica la fórmula: . . .
. . .
. . .
. . .
 xi − u
Ejemplo:
Calcular la desviación media de los siguientes datos:3,5,8,6,2,4,7,5.
1 n 40
Solución: Calculamos la media con: u= 
n i =1
xi =
8
=5
Se prepara el cuadro: xi xi − u xi − u
n 3 -2 2
 xi − u 5 0 0
D.M . = i =1
8 3 3
n 6 1 1
12 2 -3 3
D.M . = = 1.5 4 -1 1
8
7 2 2
D.M . = 1.5 5 0 0
40 12

24
Interpretación: En promedio los datos difieren en 1,5 unidades respecto de la media del grupo.
3.2. DESVIACIÓN MEDIA PARA DATOS TABULADOS

−
Para datos agrupados en clases, se asume que las marcas de clase ( y i ) representan a todos los datos
incluidos en dicha clase. Para el cálculo se usa la siguiente formula:
−
m
 yi − u ni
D.M . = i =1
n
Donde:
m = numero de clases.
− −
m y i − x ni
ni = frecuencias absolutas D.M . = 
i =1 n
−
y i = marcas de clase.
El proceso de cálculo es similar al del ejemplo anterior con la única diferencia del caculo previo de
las marcas de clase
Ejemplo:
Los datos de los salarios de 100 obreros de la empresa ALFA Ltda. Son los siguientes (medidos en
dólares $us)
Intervalo 350-390 390-430 430-470 470-510 510-550 550-590
Frecuencias 10 20 35 23 8 4
Determinar la desviación media.
Solución: Se calcula las marcas de clases y luego la media

25
SALARIOS N° DE OBREROS − − −
yi −1 − yi ni yi yi − u ni yi − u
350-390 10 370 84,4 844

390-430 20 410 44,4 888
430-470 35 450 4,4 154
470-510 23 490 35,6 818,8
510-550 8 530 75,6 604,8
550-590 4 570 115,6 462,4
n = 100 3772
−
n
y i ni 45440
La media se calcula con u = i =1 n
=
100
= 454, 40($us )
m −
 y i − u ni
3772
D.M . = i =1
=
n 100
D.M . = 37, 72($us)
Interpretación: En promedio los salarios difieren en 37,72.-($us), respecto a la media del grupo.
4. DESVIACIÓN MEDIANA ABSOLUTA (D. Me.)

La desviación mediana (D. Me.) es el promedio de los valores absolutos de las diferencias entre cada
dato u observación y la mediana de estas.
Las fórmulas que se emplean para el cálculo son las siguientes:
1 n
D.M e =  xi − M e  para DATOS NO TABULADOS
n i =1
1 m −
D.M e =  i i − M e  para DATOS TABULADOS
n i =1
n y
5. LA VARIANZA Y DESVIACION ESTANDAR.
Estas son las medidas de dispersión más utilizadas. La varianza (  2 ) mide la dispersión de los datos
con respecto a la media aritmética.

26
La varianza se define como el promedio de los cuadrados de las desviaciones de las observaciones
con respecto a la media. las fórmulas que se usan para el cálculo de la varianza son:
1 n
2 = 
n i =1
( xi − u ) 2 (1)  VARIANZA DE POBLACION
1 n −
s2 =  i )2 (2)  VARIANZA MUESTRAL
n i =1
( x − x
En esta última formula (2),se usa( n − 1 ) para muestras pequeñas y ( n ) o ( n − 1 ) para muestras
grandes( n  60 );( n − 1 ) es un factor de corrección.
La desviación estándar o desviación típica, es la raíz cuadrada positiva de la varianza.
Cuando se consideran los elementos de una población se emplean los signos (  2 ) y (  ) para indicar
la varianza y desviación estándar. Si los datos son de una muestra ( s 2 )y (s)representan la varianza y
desviación estándar muestral
Ejemplo:
Los datos de estatura de la familia García con los siguientes. Calcular la varianza y desviación
estándar.
Nombre ANTONIO CARMEN FRANCISCO LORENA MANUEL ISABEL JOSE

Altura(cm) 180 130 100 65 100 160 195
Solución: La media o promedio de estatura de los García es: u = 133(cmts)
ALTURA x1 − u ( xi − u ) 2 1 n
x1 (cm) 2 = 
n i =1
( xi − u ) 2
ANTONIO 180 47 2209
13593
CARMEN 130 -3 9 𝜎2= = 1941,85
7
FRANCISCO 100 -33 1089
LORENA 65 -68 4624  2 = 1941,85  Varianza
MANUEL 100 -33 1089
ISABEL 160 27 729
JOSE 195 62 3844
 2 = 44,07(cms)  Desviación
 13593
Estándar

27
5.1. FORMULAS ABREVIADAS

Es usual utilizar formulas abreviadas para el cálculo de la varianza y desviación estándar, estas no
requieren del calculo cada una de las desviaciones. Y son:
= x i
2
− n 2
 desviación estándar poblacional
n
−2
= x i
2
−nx
 desviación estándar muestral
n −1
Para el ejemplo, usando la formula abreviada se tiene:
137150 − 123823
= = 43,63
7
Donde: x i
2
= (180) 2 + (130) 2 + (100) 2 + (65) 2 + (100) 2 + (160) 2 + (195) 2 = 137150
5.2. LA VARIANZA Y DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS

En este caso se asume que el punto medio de cada clase, representa a todos los datos incluidos en esa
clase. Las formulas que se usan son:
1 m −
2 = 
n i =1
( y i − u ) 2 ni VARIANZA POBLACIONAL
1 n − −
s2 =  ( y i − x) ni
n − 1 i =1
VARIANZA MUESTRAL
Ejemplo:
Para los datos de salarios: de la empresa ALFA Ltda. calcular la varianza y la desviación estándar, si
la media es u = 454,40($us) .
SALARIOS N° de
yi−1 − yi obreros
ni
350-390 10
390-430 20
430-470 35
470-510 23
510-550 8
550-590 4

28
TOTAL N=100
Solución:
SALARIOS N° de obreros − − −
yi−1 − yi yi yi − u ( y i − u )2 −
ni ni ( y i −u ) 2
350-390 10 370 -84,4 7123,36 71233,60
390-430 20 410 -44,4 1971,36 39427,20
430-470 35 450 -4,4 19,36 677,60
470-510 23 490 35,6 1267,36 29149,28
510-550 8 530 75,6 5715,36 45722,88
550-590 4 570 115,6 13363,36 53453,44
TOTAL N=100 239664,0
239664,0
2 =   = 2396,64
2
VARIANZA POBLACIONAL
100
 = 2396,64   = 48,96($us) DESVIACION ESTÁNDAR POBLACIONAL
6. EL COEFICIENTE DE VARIACIÓN O DE PEARSON

Es una medida de dispersión relativa (libre de unidades de medida) que se define como la desviación
estándar dividida entre la media aritmética.
 s
c.v. =  100 c.v. = −
100
 x
El coeficiente de variación es una medida muy útil para comparar la variabilidad de dos o más
conjuntos de datos que tengan distintas unidades de medida:
48,96
c.v. = 100 = 10,77%
454,40
ESTADIGRAFOS DE ASIMETRIA
1.1. EL COEFICIENTE DE ASIMETRÍA O DE FISHER

Es la medida que indica la simetría de la distribución respecto a la media aritmética, por tanto, es una
medida de la forma de una distribución, que se calcula con las fórmulas siguientes:
−
n
( x − x )3
AS =  i 3 (1)  Para datos no agrupados.
i =1 n

29
−
m
( x − x )3 n
AS =  i 3 i (2)  Para datos agrupados en tablas de frecuencias.
i =1 n
−
m
( y −  )3 ni
AS =  i (3)  Para datos agrupados en clases.
i =1 n 3
Para los datos de salarios del ejercicio anterior la formula a usar seria (3).
Las formas que adopta una distribución pueden ser:
ESTADIGRAFOS DE APUNTAMIENTO
1.2. CURTOSIS
Es la medida de apuntamiento o achatamiento de una distribución, el apuntamiento indica la mayor o

menor altura del valor máximo central con respecto a la altura de la curva normal.
El coeficiente de curtosis se mide con:
− −
n
( x − x)4 n m
( y −  )4
Ck =  i 4 i Ck =  i 4
i =1 n i =1 n
Si se tiene:

30
ESTADIGRAFOS DE CONCENTRACIÓN
Miden el mayor o menor grado de igualdad en el reparto de la totalidad de valores, o también miden
el grado de concentración o desigualdad de cualquier distribución.
El coeficiente o índice de Gini es el más utilizado para medir la desigualdad a través del nivel de
concentración que existe en la distribución de los valores de la variable. este índice toma valores entre
cero y 1.
Un valor que tiene a 1 refleja mayor desigualdad. por el contrario, si tiende a cero hay equidad o
igualdad en la distribución.
II. ANALISIS DE REGRESION Y CORRELACION
Definición
El análisis de regresión trata de determinar la forma como se realizan dos variables, de tal manera que
se pueda predecir el valor de una de ellas en base a la otra.
Si se tiene una función: y = fcx) de región
Dónde:
x = variable independiente
y = variable dependiente
1. LA REGRESIÓN LINEAL SIMPLE

En el análisis de regresión ayuda a entender como el valor de la variable dependiente varia al cambiar
el valor de la variable independiente. Si “x” e “y” son de primer grado de función de regresión es
lineal simple y se calcula con la fórmula: y= a + bx donde:
a = es ordenada en el origen
b = pendiente de la recta de regresión
Si se considera el plano de coordenadas y en el conjunto de puntos PP

1 2 P3 ....., Pn la recta
Y* = a + bx
(1) representa al conjunto de puntos:

31
Usando el método de los mínimos cuadrados, para el conjunto de puntos P 1 , P2 ,P3 ,… ,Pn la suma
de los cuadrados de las desviaciones (errores) entre los valores estimados (𝑦∗ ) y los valores
n
observados ( 𝑦𝑖 ) está dado por s = (y − y )

i =1
*
2
(2)
La suma de las desviaciones debe ser mínima, es decir que el valor de s debe ser el menor posible.
por consiguiente, si reemplazamos la adecuación (1) en (2) se tiene:
s =   y − (a + bx)  =   y 2 − 2 y (a + bx) 2 
2
s =   y 2 − 2ay − 2bxy + a 2 + 2abx + b 2 x 2 
Aplicando sumatorias:
s =  y 2 − 2a  y − 2b xy + na 2 + 2ab x + b 2  x 2 (3)
Para que s sea mínimo debemos derivar e igualar a cero derivando (3) respecto de “a” y luego respecto
a “b” se tiene:
ds
= −2 y + 2na + 2b x = 0
da
− y + na + b x = 0 ; de donde:
a=
 y − b x
(4)
n

32
ds
= −2 xy + 2a x + 2b x 2 = 0 ; de donde:
db
b=
 xy − a x (𝜶)
x 2
Reemplazando (4) en (𝜶):
 xy − (  n  ) x n xy −  y  x + b( x)
y −b x
2
b= =
x 2
n x 2
bn x 2 − b( x) = n xy −  y  x ; de donde:

2
n xy −  x y
b=
n  x 2 − ( x ) 2
(5)
Las expresiones (4) y (5) proporcionan los valores de “a” y “b” de la ecuación de regresión lineal (1)
y* = a + bx (1)
2.1. FACTOR DE CORRELACION (r)

También se puede decir una fórmula para el factor de correlación(r) entre las 2 variables cuya
expresión deducida es:
n xy −  x y
r= (6) ó
 n x 2 − ( x) 2   n y 2 − ( y ) 2 
cov(𝑥𝑖 𝑦)
𝑟= (7)
𝜎𝑥 𝜎𝑦
r = factor o coeficiente de correlación que varía entre -1 ≤ r ≤ 1 con (x,y) = covarianza entre “x” e
“y”
2.2. ERROR EN LA PREDICCIÓN Y EL ANÁLISIS DE CORRELACIÓN

El error de la predicción del valor de la variable dependiente con relación a la variable independiente
depende del coeficiente de correlación (r).

33
Si “r” se
aproxima a 1, entonces existe una perfecta correlación entre las variables “x” e “y” y el error es
mínimo.
Si “r” se aproxima a cero, entonces no existe correlación entre las variables “x” e “y” y por
consiguiente el error es máximo.
Si el valor de “r” <0.7 se considera que la relación es baja.
Se considera correlación positiva si siempre que el valor de “x” sube, el valor de “y” sube, y casi con
la misma o igual intensidad. (+1)
En el caso opuesto, si siempre que el valor de “x” sube, y el valor de “y” baja y además con la misma
intensidad, entonces se habla de correlación negativa (-1)
Por tanto “r” es una medida estadística que cuantifica la dependencia lineal entre 2 variables o grado
de intensidad de la relación entre 2 variables.
Ejemplo:
Una empresa varia su cantidad de producción, de acuerdo a la cantidad de empleados de la siguiente
manera.
N° de Empleados 11 15 20 22 24 26 31 36
Cantidad de
205 301 411 450 493 522 612 662
Producción
Determinar: a) La ecuación de regresión lineal de “y” en x

b) Estimar la producción para 50 y 65 empleados
c) El coeficiente de correlación
Solución:

34
a) Ecuación de regresión lineal de “y” en x
Llamamos: x= número de empleados

y= cantidad o volumen de producción
La ecuación de regresión lineal tiene la forma: y = a + bx , donde: por las fórmulas (4)y(5) deducidas
se tiene:
a=
 y − b x (4) b=
n xy −  x y
(5)
n n  x 2 − ( x ) 2
En el cuadro siguiente se calcula todos los valores que necesitamos:
Empleados Producción
xi yi xi 2 yi 2
xi yi −
x=
x i
=
185
n 8
11 205 2.255 121 42.025 −
15 301 4.515 225 9.061 x = 23,125
20 411 8.220 400 168.921
−
22
24
450
493
9.900
11832
484
576
202500
243.049
y = 457
26 522 13.572 676 272.484
31 612 18.972 961 374.544
36 662 23.832 1.296 438.244
 185 3.656 93.098 4.739 1.832.368
Reemplazando en las fórmulas se tiene:
8  93098 − 185  3656 68424

b= =  b = 18,56
8  4739 − (185) 2 3687
3656 − 18,56 185 222, 4

a= =  a = 27,84
8 8
Luego la ecuación de regresión lineal es : y* = a + bx o y = 27,8 + 18,56 x

Ecuación de “y” en x
b) Estimar la producción para 50 y 65empleados.

35
− Para x=50 empleados reemplazando en la ecuación de regresión y=27,84+18,56x(50) =

955,84
− Para x=65 empleados ⇨ y=27,84+18,56x(65) = 1.234,24
c) El coeficiente de correlación se obtiene reemplazando en la ecuación (6)
n xy −  x y 8  93098 − 185  3656

r= =
 n x 2 − ( x) 2   n y 2 − ( y ) 2  8  4739 − (185) 2  8 1.832.368 − (3656) 2 
68424
r= = 0,9911  r = 0,9911
69035,10
Como r se acerca a 1, se concluye que se tiene un alto grado de relación entre las variables “x” e “y”.
2.4. LÍMITES DE CONFIANZA PARA LA PREDICCIÓN
Para un conjunto de puntos o datos representados en el plano coordenadas, se puede establecer límites
de confianza para el conjunto de datos.
Estos límites se establecen por el investigador de acuerdo al grado de seguridad que exija el problema
de investigación (5%;10%, etc.) estableciendo por encima y debajo de la recta estos porcentajes
2.5. EL COEFICIENTE DE DETERMINACIÓN (  )
Este coeficiente es el cuadrado del coeficiente de correlación:  = r

2
 es un numero positivo que varía entre cero y uno: 0   1 o 0  r2  1

36
 permite indicar el grado de certeza con que una variable depende de la otra. Si se considera un
rango de 0 a 100% se tiene:
2. REGRESIÓN LOGARÍTMICA, EXPONENCIAL Y POTENCIAL

Si el conjunto de puntos (datos) no se ajustan a una recta se puede usar regresión logarítmica;
exponencial y/o potencial.

37
III. TEORIA DE PROBABILIDADES

Es una parte de la estadística que estudia todos aquellos experimentos, sucesos o acontecimientos que
no están sujetos a leyes físicas o matemáticas, estos sucesos o acontecimientos se llaman
ALEATORIOS.
EXPERIMENTO ALEATORIO. -Es un experimento o suceso no determinado que tiene las
siguientes 3 propiedades:
i) Es un experimento que se repite cierto numero de veces sin que cambien las condiciones.
ii) Se sabe con anticipación los resultados posibles que se pueden obtener
iii) No se puede predecir con exactitud el resultado del experimento.
EJEMPLO: E1= “Lanzar una moneda;

E2= “Lanzar un dado”
E3= “Extraer 2 bolas de una urna que contiene 4 bolas blancas y 3 negras”
E4= “Contar el número de vehículos que llegan a una gasolinera en un día”
E5= “Elegir un punto del intervalo cerrado  0,1
ESPACIO MUESTRAL (  ). - Se llama espacio muestral al conjunto formado por todos los
resultados posibles de un experimento aleatorio. El espacio muestral de los experimentos aleatorios
anteriores seria: 1 =  N , E
donde: N= numero de la moneda

E= Escudo de la moneda
 2 = 1, 2,3, 4,5, 6 ; 3 = ( B, B )( B, N )( N , N )
donde B=sacar bola blanca

N= sacar bola negra
 4 = 0,1, 2,3,......
5 =  x  / 0  x  1 = números reales
Evento. - Es un subconjunto del espacio muestral.

Los eventos se representan con las letras, mayúsculas A, B, C, …
• Si el experimento E2= “Lanzar un dado”

38
Su espacio muestral  2 = 1, 2,3, 4,5, 6
Algunos eventos serian:
A= “Obtener un número par → A = 2, 4, 6
B= “Obtener un numero mayor a 4 → B = 5, 6
C= “Obtener un número menor o igual a 3 → C = 1, 2,3
Los eventos A, B y C son subconjuntos del espacio muestral  2
• Cuando el experimento aleatorio es simple, el espacio muestral  se determina fácilmente,

pero cuando el experimento es compuesto, la determinación de su espacio muestral es más
complicada.
EXPERIMENTO COMPUESTO. - Un experimento es compuesto si consiste de dos o más

experimentos simples, sucesivos o simultáneos hay 2 tipos de experimentos compuestos:
i) Experimentos unidos por la disyunción “o” excluyente, o también (  )
ii) Experimentos unidos por la conjunción “y”, o también (  )
EXPERIMENTOS UNIDOS POR LA DISYUNCION “o” EXCLUYENTE. -

Un experimento compuesto “E”, aleatorio, compuesto por 2 experimentos simples; E1 y E2 se dice
que están unidos por la “o” excluyente “si solo ocurre uno de ellos” pero no ambos.
Si E = E1  E2
El espacio muestral de “E”, está dado por
 = 1 2
EJEMPLO. – Consideremos el experimento aleatorio

E= “Lanzar una moneda o un dado”; Hallar su espacio muestral.
SOLUCIÓN. - “E” es un experimento compuesto de 2 experimentos simples E 1 y E2 donde:
E1 = “Lanzar una moneda; E2= Lanzar un dado por tanto E=E1  E2
• Los espacios muestrales de los experimentos simples E 1 y E2 son:
1 =  N , E ; donde N= numero; E= escudo
 2 = 1, 2,3, 4,5, 6

39
Luego:  = 1  2 =  N , E 1, 2,3, 4,5, 6

 =  N , E ,1, 2,3, 4,5, 6
EXPERIMENTOS UNIDOS POR LA CONJUNCIÓN LÓGICA “y”

El experimento aleatorio E, es un experimento unido por la conjunción “y” de los experimentos E1 y
E2 si y solo si ambos ocurren al mismo tiempo o sucesivamente.
Si: E = E1  E2
El espacio muestral (  ) de los experimentos asociados por la conjunción (  ) es:
 = 1  2  PRODUCTO CARTESIANO
EJEMPLO 1) Sea el experimento:

E= “Lanzar 2 monedas simultáneamente”
Hallar el espacio muestral (  )
SOLUCIÓN. - Si: E1= “Lanzar una moneda”.  1 =  N , E
E2= “Lanzar la otra moneda”   2 =  N , E
donde N=numero de la moneda; E= escudo de la moneda
entonces  = 1   2 =  N , E   N , E
 = ( N , N )( N , E )( E , N )( E , E )
EJEMPLO 2.- Se lanzan 2 dados simultáneamente. Hallar el espacio muestral de este experimento.
SOLUCIÓN. - El experimento E= “lanzar 2 dados simultáneamente” es un experimento compuesto
de 2 experimentos simples E1 y E2
Donde: E1= “Lanzar un dado”  1 = 1, 2,3, 4,5, 6
E2= “Lanzar el 2°dado”   2 = 1, 2,3, 4,5, 6
Luego:  = 1   2 = 1, 2,3, 4,5, 6  1, 2,3, 4,5, 6

40
(1,1)(1, 2)(1,3)(1, 4)(1,5)(1, 6)(2,1)(2, 2)(2,3)(2, 4)(2,5)(2, 6) 

 
 = (3,1)(3, 2)(3,3)(3, 4)(3,5)(3, 6)(4,1)(4, 2)(4,3)(4, 4)(4,5)(4, 6) 
(5,1)(5, 2)(5,3)(5, 4)(5,5)(5, 6)(6,1)(6, 2)(6,3)(6, 4)(6,5)(6, 6) 
 
El mismo resultado puede obtenerse si se considera la tabla siguiente que muestra los resultados
posibles del experimento.
SEGUNDO
PRIMER DADO 1 2 3 4 5 6
DADO
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Entonces el espacio muestral del experimento es:
 = (1,1)(1, 2)....(1, 6)(2,1)...(2, 6).....(6, 5), (6, 6)
En donde se tiene que el numero total de elementos del espacio muestral es: #  = 36
#  = cardinalidad del espacio muestral o número total de elementos del espacio muestral.
TECNICAS DE CONTEO
Son técnicas útiles para determinar el número de elementos que tiene un espacio muestral o un
experimento particular. Entre estas técnicas se tiene:
i) Principio de multiplicación
ii) Principio de adición
PRINCIPIO DE MULTIPLICACIÓN. - Este principio dice:
“Si un experimento Aleatorio E1, ocurre de n1 formas y si para cada una de estas, un experimento
E2 ocurre de n2 formas entonces los dos experimentos juntos corren de ( n1 • n2 ) formas”.
“LA CONDICIÓN” para que se aplique este principio es que ambos experimentos se realicen uno
seguido del otro o simultáneamente.
 si: 𝐸 = 𝐸1 ∗ 𝐸2 ⇒ #𝛺 = 𝑛1 ∗ 𝑛2 donde:
#  = número de elementos del espacio muestral o cardinalidad del 

41
EJEMPLO 1.-
¿De cuantas formas se puede vestir una persona que tiene 3 pantalones y 4 camisas?
SOLUCIÓN.
Para vestirse la persona se pone el pantalón y luego la camisa,
n1 = 3 y n2 = 4
#𝛺 = 3 ∗ 4 = 12 opciones diferentes de vestirse
EJEMPLO 2.-
¿Cuántos elementos tiene el espacio muestral del experimento aleatorio: “Lanzar una moneda y un
dado simultáneamente”?
SOLUCIÓN. -
E1= “Lanzar una moneda”  #  = n1 = 2
E2= “Lanzar un dado”  # 2 = n2 = 6
⇒ 𝐸 = 𝐸1 ∗ 𝐸2 = “Lanzar una moneda y un dado”
#𝛺 = 𝑛1 ⋅ 𝑛2 = 2 ∗ 6 = 12
 = 1   2 =  N , E  1, 2,3, 4,5, 6

 = ( N ,1)( N , 2)( N ,3)( N , 4)( N ,5)( N , 6)( E ,1)( E , 2)( E ,3)( E , 4)( E ,5)( E , 6)
EJEMPLO3.-
¿Cuántos números pares de 3 dígitos se pueden formar con los dígitos:1,3,4,5,6,7,8,9 Si cada digito
puede emplearse una sola vez?
SOLUCIÓN.
DIGITOS: 1, 3, 4, 5, 6, 7, 8, 9
El número es N= x _ y _ z  Numero par
Unidades (1° digito)

Decena (2° digito)
Centena (3° digito)
El experimento consiste en elegir 3 dígitos
E = “Elegir 3 dígitos”  E = E1  E2  E3

42
Donde: E1= “Elegir el 1er digito, ocurre de n1 = 3 formas
E2= “Elegir 2do digito, ocurre de n2 = 7 formas
E3= “Elegir 3er digito, ocurre de n3 = 6 formas
Por tanto, E ocurre de (𝑛1 ∗ 𝑛2 ∗ 𝑛3 ) formas y #𝛺 = 𝑛1 ∗ 𝑛2 ∗ 𝑛3 = 3 ∗ 7 ∗ 6 = 126(𝑛ú𝑚𝑒𝑟𝑜𝑠)
PRINCIPIO DE ADICIÓN
Dice lo siguiente:
“Si un experimento E1 puede ocurrir de n1 formas y un segundo experimento E2 de n2 formas,

entonces el experimento E = E1  E2 donde (E1 ,E2 no pueden ocurrir juntos) ocurre de ( n1 + n2 )
formas, siempre que los espacios muestrales 1 ,  2 de E1 y E2 sean disjuntos”
EJEMPLO 1:
¿De cuantas formas se puede cruzar un rio, sabiendo que se dispone de 3 botes y 4 lanchas?
SOLUCIÓN: E= “Cruzar el rio en bote o lancha”
E1= “Cruzar el rio en bote”; ocurre de n1 = 3 formas
E2= “Cruzar el rio en Lancha”; ocurre de n2 = 4 formas
Luego el experimento E = E1  E2 ocurre de n = (n1 + n2 ) formas n = 3 + 4 = 7 formas.
EJEMPLO2:
Un producto se vende en 3 mercados, en el 1 er mercado se tienen 5 tiendas de venta, en el 2 do 4, y en
el 3er mercado 6 tiendas ¿de cuantas maneras puede venderse el producto?
SOLUCIÓN:
Por el principio de adición n = n1 + n2 + n3 n = 5 + 4 + 6 = 15 maneras diferentes.
LA TEORIA COMBINATORIA
También proporciona formulas que ayudan a determinar el numero de elementos de un determinado
espacio muestral.

43
PERMUTACIONES
• Así por ejemplo si queremos determinar el numero de permutaciones de “ n ” objetos
diferentes utilizamos la formula Pnn = n !

• Si en cambio deseamos conocer el numero de permutaciones de “ n ” objetos diferentes
tomados r a r , y considerando el orden , de los objetos la fórmula que usamos es:
n!
Prn =
( n − r )!
EJEMPLO 1:
Con los dígitos 1,2,5,6,7,8,9 ¿Cuántos números de 3 dígitos se pueden formar, si cada digito puede
emplearse una sola vez?
SOLUCIÓN: a) Por teoría Combinatoria.
A = 1, 2,5, 6, 7,8,9  # A = 7
Podemos observar algunos números de 3 dígitos

125 567 987
152 789
varían en el orden varían en elementos
Los números de 3 dígitos tienen elementos que no deben repetirse
• Se trata entonces de Permutaciones de 7 elementos tomados de a 3.
7! 7!
P37 = = = 210 _ números
( 7 − 3)! 4!
b) Por el principio de multiplicación

E= “Formar números de 3 dígitos”
N= x _ y _ z
Primer dígito ocurre de n1 = 7 formas

Segundo dígito ocurre de n2 = 6 formas
Tercer dígito ocurre de n3 = 5 formas
#𝛺 = 𝑛1 ∗ 𝑛2 ∗ 𝑛3 = 7 ∗ 6 ∗ 5 = 210|𝑛ú𝑚𝑒𝑟𝑜𝑠

44
EJEMPLO 2: Con los dígitos del conjunto B= 1, 2,3, 4,5
¿Cuántos números se pueden formar, suponiendo que no pueden repetirse estos?

SOLUCIÓN: Por Teoría Combinatoria
5!
• Números de un dígito= 1,2,3,4,5 P15 = =5
4!
• Números de dos dígitos
12 21 31 41 51
13 23 32 42 52 5!
P25 = = 20
14 24 34 43 53 3!
15 25 35 45 54
• Números de 3 dígitos
123 132 142 152 213 231 241 251 312 321
124 134 143 153 214 234 243 253 314 324
125 135 145 154 215 235 245 254 315 325
341 351 412 421 431 451 512 521 531 541
342 352 413 423 432 452 513 523 532 541
345 354 415 425 435 453 514 524 534 543
5!
P35 = = 60
2!
5!
• Números de 4 dígitos P45 = = 120
1!
5!
• Números de 5 dígitos P55 = = 120
0!
ENTONCES: N=5+20+60+120+120= 325 _ números
POR EL PRINCIPIO DE MULTIPLICACIÓN

E1= “Formar números de un digito
Ocurre de n1 = 5 formas  # 1 = n1 = 1, 2,3, 4,5

45
E2= “Formar números de 2 dígitos

x_ y_
5 formas n1
4 formas n2
⇒ #𝛺2 = 𝑛1 ∗ 𝑛2 = 5 ∗ 4 = 20 formas
E3= “Formar números de 3 dígitos”
x_ y_z
5 formas= n1
4 formas= n2
3 formas= n3
⇒ #𝛺3 = 𝑛1 ∗ 𝑛2 ∗ 𝑛3 = 5 ∗ 4 ∗ 3 = 60 formas
x_ y _ z _u
5 formas= n1
4 formas= n2
3 formas= n3
2 formas= n4
⇒ #𝛺4 = 𝑛1 ∗ 𝑛2 ∗ 𝑛3 ∗ 𝑛4 = 5 ∗ 4 ∗ 3 ∗ 2 = 120 formas
x_ y _ z _u _v
5 formas= n1
4 formas= n2
3 formas= n3
2 formas= n4
1 formas= n5
⇒ #𝛺5 = 𝑛1 ∗ 𝑛2 ∗ 𝑛3 ∗ 𝑛4 ∗ 𝑛5 = 120 formas
Luego N=5+20+60+120+120=325 números
EJEMPLO 3:
Un curso de 5 alumnos desea nombrar un delegado titular y un delegado suplente al H.C.C. ¿De
cuantas maneras pueden nombrarse estos 2 cargos?

46
SOLUCIÓN:
El cargo de titular puede ser ocupado de 5 maneras diferentes; y una vez ocupado el puesto de titular,
el suplente puede ser ocupado de 4 maneras diferentes, o simplemente número de permutaciones de
5 personas tomadas2 a 2.
5! 5! 5  4  3!
P25 = = = = 20 maneras
( 5 − 2 )! 3! 3!
Por el principio de multiplicación: E1= “Nombrar un titular”

x_ y_ E2= “Nombrar un suplente”
5 formas= n1
4 formas= n2
#  = n1  n2 = 5  4 = 20 maneras
COMBINACIONES
En muchos casos interesa seleccionar r objetos de n , sin importar el orden. estas selecciones se
llaman combinaciones, que se calculan con la formula
n!
Crn =
r !( n − r ) !
EJEMPLO 1:
Un estudiante tiene que contestar 5 de 8 preguntas en un examen.
a) ¿De cuantas maneras puede escoger las 5 preguntas?
b) Si las 3 primeras son obligatorias ¿De cuantas maneras puede escoger las preguntas?
c) Si tiene que contestar 3 de las 5 primeras ¿De cuantas formas puede hacerlo?
SOLUCIÓN:
a) Como interesa subconjuntos de 5 preguntas de un conjunto de 8 preguntas, sin importar el orden,
8!
se aplica la fórmula de combinaciones: C58 = = 56 Formas.
5!3!
b) Si las 3 primeras son obligatorias; los 2 restantes tendrán que escoger de las 5 preguntas sobrantes,
5!
luego aplicando: C25 = = 10 formas
2!3!

47
c) Si tiene que contestar 3 de las primeras, lo haría de C35 maneras y los 2 restantes seleccionaría de
las 3 preguntas finales es decir C23 . Entonces las 5 preguntas se seleccionarán de:
𝟓! 𝟑!
𝑪𝟓𝟑 ∗ 𝑪𝟑𝟐 = ∗ = 𝟏𝟎 × 𝟑 = 𝟑𝟎 (formas)
𝟑!𝟐! 𝟐!𝟏!
EJEMPLO 2
¿De cuantas maneras puede seleccionarse una comisión de 5 o más personas, Si hay 8 personas
disponibles?
SOLUCIÓN
Nos interesa los subconjuntos de 5,6,7 y 8 personas que se pueden formar con las 8 personas
disponibles, lo cual se hace con las combinaciones siguientes:
8! 8! 8! 8!
C58 + C68 + C78 + C88 = + + +
5!3! 6!2! 7!1! 8!0!
= 56 + 28 + 8 + 1 = 93 maneras
PROBABILIDAD
Históricamente se han desarrollado 3 definiciones de probabilidad que son:
a) Definición clásica o a priori.
b) Definición por frecuencia relativa
c) Definición subjetiva o personalista.
Sin embargo, cualquiera que sea la definición que se use. Las reglas de probabilidad son las mismas.
Las 3 definiciones son complementarias y la definición que se use depende del tipo o clase de
problema especifico que se trate de resolver.
DEFINICION CLASICA O A PRIORI

(La Place en 1812) dice:
Para un evento cualquiera “A” del espacio muestral de un experimento aleatorio, “La probabilidad
de ocurrencia del evento “A”, simbolizada por P(A), es el valor que se obtiene al dividir el número
de casos favorables correspondientes al evento A entre el número total de casos posibles del espacio
muestral  ”
Si en la definición anterior:
#  = n  número de elementos del espacio muestral o número total de casos posibles de 

# A = nA  número de casos favorables correspondientes al evento A.
P( A) = probabilidad de ocurrencia del evento A

48
# A nA
P( A) = =
# n
AXIOMAS DE PROBABILIDAD
A1 ) La probabilidad de un evento cualquiera A, esta comprendido entre cero y uno ó
o  P( A)  1
Si: P(A)=0 el evento se llama imposible

Si: P(A)=1 el evento es seguro
A2 ) La probabilidad del espacio muestral es igual 1 ó P(  )=1
A3 ) Para toda partición del espacio muestral, la suma de probabilidades de todos los elementos de la
partición es igual a 1.
PARTICION DE UN ESPACIO MUESTRAL Una partición de un espacio muestral  tiene las

siguientes características:
i) Ningún elemento de la partición es cero ó Ai  0 .

ii) La intersección entre 2 elementos de la partición es vacío, es decir: Ai Aj =  .
iii) La unión de los elementos de la partición es igual al espacio muestral
A1 A2 A3 ..... Ak =  El A1 A2 A3 A4
grafico muestra las características de
una partición del espacio muestral

Es el mismo, por el axioma A3, se tiene:
P( A1 ) + P( A2 ) + P( A3 ) + ...... + P( AK ) = 1 A5
.. .. .. AK
TEOREMA 1: “Para todo evento “A” contenido en el espacio muestral  como muestra el grafico
se cumple.
𝛺
P( A' ) = 1 − P( A) ó
A
P( A) + P( A' ) = 1 A1
donde:

49
A1 = complemente de A
TEOREMA 2: Si 2 eventos no son excluyentes, es decir, pueden ocurrir al mismo tiempo entonces:
Se cumple: 
P( A B) = P( A) + P( B) − P( A B) A B
A B
EJEMPLO1: Un juego consiste en arrojar 2 dados. Calcular la probabilidad de:

a) Obtener suma 7
b) Obtener suma mayor a 7
c) Obtener suma menor a 7
d) Obtener suma mayor que 5
SOLUCIÓN: a) El experimento es: E= “Lanzar 2 dados” siendo su espacio muestral:  = 1  2
(1.1), (1.2), (1.3), (1.4), (1.5, ), (1.6), (2,1), (2, 2), (2,3), (2, 4), (2,5), (2, 6) 
 
 = (3,1), (3, 2), (3,3), (3, 4), (3,5), (3, 6), (4,1), (4, 2), (4,3), (4, 4), (4,5), (4, 6) 
(5,1), (5, 2), (5,3), (5, 4), (5,5), (5, 6), (6,1), (6, 2), (6,3), (6, 4), (6,5), (6, 6) 
 
de donde: #  = n = 36  número total de casos posibles.
El evento seria A= “obtener suma 7” es decir:
A= (1, 6), (2,5), (3, 4), (4,3), (5, 2), (6,1)
n( A) 6 1
de donde # A = n( A) = 6  número de casos favorables entonces: P( A) = = =
n 36 6
b) El evento seria: B=” obtener suma mayor a 7
(2, 6)(3,5)(3, 6)(4, 4)(4,5)(4, 6)(5,3)(5, 4)(5,5)(5, 6) 

B= 
(6, 2)(6,3)(6, 4)(6,5)(6, 6) 
n( B) 15 5
de donde # B = n( B) = 15  número de casos favorables entonces: P( B) = = =
N 36 12

50
c) C= “obtener suma menor a 7”
(1,1), (1, 2), (1,3), (1, 4), (1,5), (2,1), (2, 2), (2,3), (2, 4), (3,1), (3, 2) 
C=  
(3,3), (4,1), (4, 2), (5,1) 
De donde: # C = n(C ) = 15
n(C ) 15 5
Luego P(C ) = = =
n 36 12
d) D=” obtener suma mayor a 5
(1,5), (1, 6), (2, 4), (2,5), (2, 6), (3,3), (3, 4), (3,5), (3, 6), (4, 2), (4,3), (4, 4) 
 
D= (4,5), (4, 6), (5,1), (5, 2), (5,3), (5, 4), (5,5), (5, 6), (6,1), (6, 2), (6,3), (6, 4) 
(6,5), (6, 6) 
 
De donde: # D = n( D ) = 26
n( D ) 26 13
Luego P( D) = = =
n 36 18
EJEMPLO 2: En un curso hay 5 alumnos varones y 3 damas que aspiran a ser delegados al consejo
de carrera. Si se deben escoger 2 delegados al azar, escribiendo a los nombres en fichas y sacándolos
de una urna.
a) Cuál es la probabilidad que los 2 sean varones.
b) ¿Cuál la probabilidad que sean 1 varón y 1dama o 2 damas?
SOLUCIÓN: a) 5 varones y 3 damas =8 alumnos; delegados =2
V = V1 , V2 , V3 , V4 , V5  ; D =  D1 , D2 , D3 
El experimento aleatorio es: E= “Escoger 2 delegados”
(V1 ,V2 ), (V1 ,V3 ), (V1 ,V4 ), (V1 ,V5 ), (V2 ,V3 ), (V2 ,V4 ), (V2 ,V5 ), (V3 , V4 ), (V3 , V5 ) 
 
 = (V4 , V5 ), ( D1 , D2 ), ( D1 , D3 ), ( D2 , D3 ), (V1 , D1 ), (V1 , D2 ), (V1 , D3 ), (V2 , D1 ), (V2 , D2 ) 
(V , D ), (V , D ), (V , D ), (V , D ), (V , D ), (V , D ), (V , D ), (V , D ), (V , D ), (V , D ) 
 2 3 3 1 3 2 3 3 4 1 4 2 4 3 5 1 5 2 5 3 
#  = n = 28  número de caos posibles, o también

51
8!
#  = n = C28 = = 28
2!6!
El evento sería A= “Escoger 2 varones”
A= (V1 , V2 ), (V1 , V3 ), (V1 , V4 ), (V1 , V5 ), (V2 , V3 ), (V2 , V4 ), (V2 , V5 ), (V3 , V4 ), (V3 , V5 ), (V4 , V5 )
# A = n ( A ) = 10  número de casos favorables
n( A) 10 5 5!
luego P( A) = = = = 0,357 = 35, 7% o también: C25 = = 10 → n( A) = 10
n 28 14 2!3!
n( A) 10 5
P( A) = = = = 0,357
n 28 14
b) B= “escoger un varón y una dama o 2 damas”
# B = n( B ) = 18  números de casos favorable
n( B ) 18 9
luego P( B) = = = = 0, 642 o también con combinaciones
n 28 14
5! 3!
C15 = =5 C13 = =3
1!4! 1!2!
1 varón y 1 dama = C23 C13 = 5 3 = 15
3!
2 damas C23 = =3
2!1!
Un varón y una dama o 2 damas =15+3=18 luego: n( B) = 18
n( B) 18
P( B) = = = 0.642
n 28
A este mismo resultado puede llegarse mediante un esquema de árbol que se muestra a continuación:

52
5 4 5
a) P( A) =  = = 0,357
8 7 14
5 3 3 5 3 2
b) P( B) =  +  +  = 0, 642
8 7 8 7 8 7
EJERCICIO 3:
De una baraja de 52 cartas, se extraen al azar 6 cartas. Determinar la probabilidad que 3 de ellas sean
rombos (diamante) y 2 trébol.
SOLUCIÓN:
E= “Extraer 6 cartas”
Se trata de subconjuntos de 6 cartas del total de 52
52!
#  = C652 = =
6!46!
El evento A= “Extraer 3 rombos y 2 trébol”
# A = n( A) = C313  C213  C126 
C313  C213  C126

P ( A) =
C652

53
IV. PROBABILIDAD CONDICIONAL

DEFINICIÓN
Si se tiene 2 eventos A y B no excluyentes subconjuntos del espacio muestral 
• La probabilidad de que ocurra el evento A, dado que ha ocurrido B, P  A | B  está dada por:
P( A B)
P  A | B = (1) P( B )  0
P( B)
“Una probabilidad se dice que es condicionada cuando la ocurrencia de un determinado evento,

afecta a la ocurrencia de otro evento”
EJEMPLO 1:
En el experimento E= “Se lanzan 2 dados” suponiendo que se nos informa haber obtenido suma
mayor que 6. ¿Cuál es la probabilidad de obtener suma 7?
SOLUCIÓN:
El experimento es E= “Lanzar 2 dados” el espacio muestral tiene 36 resultados.
 = (1,1), (1, 2),....(1, 6), (2,1), (2, 2),....(2, 6), (3,1), (3, 2).....(3, 6)........(6,1), (6, 2).....(6, 6)
#  = 36 = n
El evento B es: B= “obtener suma mayor que seis”
(1, 6)(2,5)(2, 6)(3, 4)(3,5)(3, 6)(4,3)(4, 4)(4,5)(4, 6)(5, 2)(5,3) 

B= 
(5, 4)(5,5)(5, 6)(6,1)(6, 2)(6,3)(6, 4)(6,5)(6, 6) 
De donde: # B = 21 = nB  número de casos posible
El evento que se pide es: A= “obtener suma siete"
A = (1, 6)(2,5)(3, 4)(4,3)(5, 2)(6,1)  # A = n( A) = 6
A B = (1, 6)(2,5)(3, 4)(4,3)(5, 2)(6,1)  #( A B) = 6 = n( A B)
Entonces:
#( A B) 6 2
P  A | B = = =
#B 21 7
o También:

54
n( A B )
P( A B) n( A B ) 6 2
P  A | B =
n
= = = =
P( B) n( B ) nB 21 7
n
REGLA DE MULTIPLICACIÓN
De la definición de Probabilidad condicional
P( A B)
P  A | B = se tiene: P( A B) = P( B) P  A | B 
P( B)
P( A B)
P  B | A = P( A B ) = P ( A) P  B | A
P( A)
“La probabilidad de que ocurran los eventos Ay B es igual al producto de la ocurrencia de uno de
ellos multiplicado por la probabilidad de que ocurre el 2do, dado que ha ocurrido el 1ro”
EJEMPLO:
Una urna contiene 5 bolas blancas y 6 negras; se extrae al azar sucesivamente y sin reposición 2
bolas ¿Cuál es la probabilidad que las 2 resulten blancas?
SOLUCIÓN:
El experimento es: E= “Extraer 2 bolas”
 = ( B1 B2 ), ( B1 B3 )...., ( B1 B5 ), ( B1 N1 ), ( B1 N 2 )...., ( B1 N 6 ),......( B5 N 6 )
#  = 55 = n donde:
B =  B1 , B2 , B3 , B 4 , B5  _; __ N =  N1 , N 2 , N 3 , N 4 , N 5 , N 6 
EL EVENTO A= “Extraer 2 bolas blancas”
A = ( B1 , B2 )( B1 , B3 )( B1 , B4 )( B1 , B5 )( B2 , B3 )( B2 , B4 )( B2 , B5 )( B3 , B4 )( B3 , B5 )( B4 , B5 )
# A = n( A) = 10
n( A) 10 2
Por tanto P( A) = = = = 0,182  P( A) = 18, 2%
n 55 11
2) APLICANDO LA REGLA DE MULTIPLICACIÓN:
Se tiene 5 bolas blancas y 6 negras; total=11 bolas n = 11
Eventos: B1= “La primera bola resulto blanca”  # B1 = 5

55
n( B1 ) 5
P( B1 ) = =
n 11
B2 = “La 2da bola resulto blanca”  # B2 = n( B2 ) = 4
4
P  B2 | B1  =
10
A= “Las 2 bolas resultan blancas”
5 4 2
A = P( B1 B2 ) = P( B1 ) P  B2 | B1  =  = = 0,182
11 10 11
P( B1 B2 ) = 18, 2%
3) POR TEORIA COMBINATORIA: E= “Extraer 2bolas”
Se trata de combinaciones, porque son subconjuntos de 2 bolas de 11, cuya formula es:
m!
Cnm =
n !( m − n ) !
11! 11 10  9! 11 10

#  = C211 = = = = 55 = n
2!9! 2! 9! 2
El evento: A= “Extraer 2 bolas blancas”
5!
# A = n( A) = C25 = = 10
2!3!
n( A) = 10 (Número de casos favorables)
n( A) 10 2
P( A) = = = = 0,182
n 55 11
P( A) = 18, 2%

56
4) POR ESQUEMA DE ARBOL:
4
P  B2 | B1  =
10
B2 P( B1 B2 )
5
P ( B1 ) =
11
B1
6
P  n1 | B1  =
10
N1
5 Blancas
5
P  B1 | N1  =
6 Negras 10
B1
6
P ( N1 ) =
11
N1
5
P  N 2 | N1  =
10
N2
Donde:
5 4 2
P ( B1 B2 ) = P( B1 ) P  B2 | B1  =  = = 0,182
11 10 11
P ( B1 B2 ) = 18, 2%
5 6 3
P( B1 N1 ) = P( B1 ) P  N1 | B1  =  = = 0, 273
11 10 11
6 5 3
P( N1 B1 ) = P( N1 ) P  B1 | N1  =  = = 0, 273
11 10 11
6 5 3
P( N1 N 2 ) = P( N1 ) P  N 2 | N1  =  = = 0, 273
11 10 11
LA REGLA DE BAYES ó (T.P.T.)
Es una técnica para calcular las probabilidades condicionales.
La regla de Bayes “encuentra la probabilidad de una causa especifica cuando se observa un efecto
particular” o sea: “Si el evento B ha ocurrido, cual la probabilidad de que haya sido generado por el
evento A1 (causa posible) o por A2 (otra causa posible) técnicamente Bayes dice:
Si A1,A2,……,An, son una partición del espacio muestral (  ) entonces para todo evento B,
subconjunto del espacio muestral se cumple:

A2
57
n 𝛺
P( B ) =  P( Ai ) P  B | Ai  A1
i =1 A3
DEMOSTRACIÓN: Se sabe que:

B
 = A1 A2 A3 ...... An
Para todo B en él  se tiene que:
B=B  A4 An
La deducción de la regla de Bayes es la
siguiente: se sabe por la multiplicación de 2 eventos(dependientes)
P( B A1 ) = P ( B ) P  A1 | B 
P ( A1 B ) = P ( A1 ) P  B | A1 
Como: P( B A1 ) = P( A1 B)  Igualando segundos miembros
P( B ) P  A1 | B  = P( A1 ) P  B | A1  de donde:
P ( A1 ) P  B | A1 
P  A1 | B  = ()
P( B)
Si se supone que existe An, posibles causas, es decir:
A1, A2, …, An que han podido causar B entonces
P( B) = P( A1 B) P( A2 B) .... P( An B) o
P ( B ) = P ( A1 ) P  B | A1  + P ( A2 ) P  B | A2  + .... + P ( An ) P  B | An 
P( A1 ) P  B | A1 
Reemplazando en (  ): P  A1 | B  =
P( A1 ) P  B | A1  + P ( A2 ) P  B | A2  + .... + P ( An ) P  B | An 
Donde:
P  A1 | B  = dado que ocurrió el evento B (efecto), ¿Cuál es la probabilidad de que lo haya
causado el evento A1(causa)?
P( A1 ) = Probabilidad de que ocurra el evento A1
P  B | A1  = dado que ocurrió el evento A1 (causa), ¿Cuál es la probabilidad de cause el
evento B (efecto)?

58
El diagrama de árbol siguiente da una visión esquemática del Teorema de probabilidad total.
EJEMPLO: La empresa constructora “A” se presenta a Licitación para construir una carretera.
La probabilidad que “A” gane la licitación es 0.7 si la empresa “B” no se presenta a ella, en tanto que
es de solo 0.4 si “B” se presenta. El GERENTE de “A” estima que hay una probabilidad de 0.75 que
la empresa “B” se presente.
a) Construya un diagrama de árbol para ilustrar los eventos.

b) ¿Cuál es la probabilidad de que la empresa “A” gane la licitación?
c) Si la empresa A gano la licitación. ¿Cuál es la probabilidad de que la empresa “B” se haya
presentado a la misma?
SOLUCIÓN. - a) llamando:
A=La empresa “A” gana la licitación
B=La empresa “B” se presenta a la licitación

59
P  A | B  = 0.4
P( B ) = 0.75 A P( B A)
B
P  A | B  = 0.6
A P( B A)
P  A | B  = 0.7
A P( B A)
P( B ) = 0.25
B
P  A | B  = 0.3
A P( B A)
b) P( A) = ?
P( A) = P( B)  P  A | B  + P( B) P  A | B  = 0.75  04 + 0.25  07 = 0.475

P( A) = 47.5%
c) P  B | A = ?
P( B A) 075  04
Se sabe que: P  B | A = = luego P  B | A = 0.632 = 63.2%
P( A) 0475
V. VARIABLES ALEATORIAS
DEFINICIÓN. - Para un experimento aleatorio “E” y su espacio muestral (  ), una función X que
asigna a cada elemento (  ) del espacio muestral (    ), uno y solamente un número real
( x   ) se llama variable aleatoria, es decir:
Dominio de  = 
𝛸: 𝛺 ⇒ ℝ
Rango de 𝛸 = ℝ ← números reales

60
EJEMPLO 1.- Si consideramos el experimento aleatorio E, donde:
E= “Lanzar una moneda 3 veces”
Su espacio muestral es:  =  E , N    E , N    E , N  o
 = ( E , E )( E , N )( N , E )( N , N )  E , N  ; E= Escudo; N=numero
 = ( E , E , E )( E , E , N )( E , N , E )( E , N , N )( N , E , E )( N , E , N )( N , N , N )
Y se desea encontrar “el número de Escudos que salen del espacio muestral en 3 lanzamientos”. La
función  en  definida por  = ”número de escudos obtenidos en 3 lanzamientos de moneda”
es una función que tiene como dominio el espacio muestral (  ) y como rango un subconjunto de
números reales dado por:
( E , E , E ) = 3(escudos)
( E , E , N ) = ( E , N , E ) = ( N , E , E ) = 2(escudos)
( E , N , N ) = ( N , E , N ) = ( N , N , E ) = 1(escudos) Rx =  x / x = 0,1, 2,3
( N , N , N ) = 0(escudos)
: →
Luego:
 :  → 0,1, 2,3
Además, a cada elemento del rango Rx le corresponde una probabilidad dada en cada caso por:
1
P(0) = P( N , N , N ) = ; P(0) = probabilidad de ningún escudo
8
3
P(1) = P( E , N , N ) + P( N , E , N ) + P( N , N , E ) =
8
3
P(2) = P( E , E , N ) + P( E , N , E ) + P( N , E , E ) =
8
1
P(3) = P( E , E , E ) =
8
TIPOS DE VARIABLES ALEATORIAS. - Existen 2 tipos:
a) VARIABLES ALEATORIAS DISCRETAS

b) VARIABLES ALEATORIAS CONTINUAS
- La variable aleatoria es discreta si su rango es un conjunto finito o infinito numerable (se puede
contar) es decir:
Rx =  x1 , x2 , x3 ,.....

61
- La variable aleatoria es continua si su rango (R x) es un intervalo sobre la recta de los números

reales.
Es decir, la variable aleatoria continua puede tomar cualquier valor entre 2 fijados.
DISTRIBUCIONES DE PROBABILIDAD DISCRETAS
Entre las distribuciones de probabilidad más importantes referidas a la variable aleatoria discreta se
tiene a la distribución geométrica; la distribución binomial, la hipergeométrica y la distribución de
poisson.
Las distribuciones geométrica y binomial se basan en una sucesión de ensayos o experimentos de

Bernoulli.
LA DISTRIBUCIÓN BINOMIAL
En muchos ensayos tipo Bernoulli, solo interesa conocer el número total de éxito que se obtiene al
margen del orden en que se presentan en “n” ensayos.
La cardinalidad o número de elemento del espacio muestral (  ) es: #  = 2

n
Por consiguiente, la variable aleatoria de la distribución de probabilidad Binomial  :   es:
x = Número de éxitos obtenidos en “n” ensayos de Bernoulli con rango Rx = 0,1, 2,3,...n
La distribución de probabilidades Binomial se llama así porque se trabaja con 2 resultados y se

representa por:
n
P   = x | B; n,, p  = P   = x  =  x  p x q n − x x = 0,1, 2,....n
 
n
o simplemente: b( x; n, p ) =  x  p x q n − x x = 0,1, 2,....n
 
n
donde: n = número de ensayos;  x  = conbinatoria
 
p = probabilidad de éxitos; q = probabilidad de fracasos
x = exitos; __________ p + q = 1
Que se lee como: “La probabilidad de obtener x éxitos y (n − x) fracasos.

62
CARACTERISTICAS DE LA DISTRIBUCION BINOMIAL
- LA MEDIA DE LA DISTRIBUCION BINOMIAL. - De la definición de la distribución binomial se

deduce la media de la variable aleatoria binomial y se tiene: u = E( x ) = np  media de la
Binomial.
- LA VARIANZA (  2 ) DE LA DISTRIBUCION BINOMIAL. -De igual manera se puede deducir la
varianza de la binomial.
 x2 = Var ( x) = npq  varianza de la Binomial
de donde:  = npq  desviación estándar
USO DE LA TABLA DE PROBABILIDAD BINOMIAL ACUMULADA. Los valores de la función de

distribución de probabilidad acumulada Binomial P  x  r / n, p  están dadas en tablas, y el uso de
estas, simplifica el cálculo de las probabilidades binomiales.
La variable aleatoria de la distribución binomial es:
x = “número de éxitos en n ensayos de Bernoulli”
Por simetría de la distribución binomial, se ha eliminado en la tabla los valores de “p” que
exceden a 0,5.
Por tanto, si se tiene un problema donde la probabilidad de éxito “p” es mayor que 0,50 debemos
usar el siguiente procedimiento:
En P  x  r | n, p  sí: p 0.5 Se deben efectuar las siguientes sustituciones:
1) r = se cambia por (n − r )
2) p = se cambia por (1 − p)
3) Se invierten las desigualdades (  se cambia por  );( por ) y así sucesivamente.
EJEMPLO. - Calcular las siguientes probabilidades:
a) P  x  6 /11, 0.7  = ?
SOLUCIÓN. – i) en el ejemplo n = 11 ; r = 6 ; p = 0, 7 como: p>0.5 efectuando las sustituciones

se tiene:
P  x  5 /11, 03 = P  x  6 /11, 03
A continuación, en las hojas de la (Tabla I) paginas (761 al 770)
i. Se busca el valor de n = 11 que se tiene en las páginas 768 y 769

63
ii. Se busca el valor de p = 03 los valores de “p” están en las primeras filas de cada grupo,
para nuestro caso, en la primera fila del tercer grupo (Página 768).
iii. El valor de r = 6 se encuentra en la primera columna de este tercer grupo y haciendo
coincidir r = 6 con p=0.30 se determina que:
P  x  6 /11, 03 = 0, 0782 = 7,82%
b) P  x  6 /11, 07  = ? n = 11 p = 07 r = 6
Como P = 07 es mayor que 0.5 se deben efectuar sustituciones

1, 2, 3, 4,
 n−r

1− p
P  x  5 |11, 0.3
 
5, 6, 7, 8,
 n−r 1− p

P  x  5 |11, 0.3 = 1 − P  x  5 |11, 0.3
  9, 10, 11
y entrando a tablas se tiene:
1 − P  x  5 /11, 0.3 = 1 − 0.2103 = 07897 o P  x  6 /11, 0.7  = 0, 7897 = 78,97%
c) P  x  6 /11, 0.7  = ?
Como p=0.7 o p>0.5 se efectúan sustituciones

1, 2, 3, 4,
P  x  5 /11, 0.3 , esta probabilidad es lo mismo que
5, 6, 7, 8,
P  x  5 /11, 0.3 = 1 − P  x  6 /11, 0.3
9, 10, 11
P  x  5 /11, 0.3 = 1 − 0.0782 = 0.9218 = 92,18%
d) P  x = 6 /11, 0.7  = ?
Como p  0.5 se efectúan sustituciones
= P  x = 5 /11, 0.3 , esta probabilidad se puede transformar a 1, 2, 3, 4,
= P  x  5 /11, 0.3 − P  x  6 |11, 0.3 5, 6, 7, 8,
Y entrando a tablas se obtiene 9, 10, 11
=0,2103-0,0782=0,1321=13,21%
e) P  x  6 /11, 0.7  = ?

64
Como p  0.5 se efectúan sustituciones:
P  x  5 /11, 0.3 y entrando a tablas se obtiene:
P  x  5 /11, 0.3 = 0, 2103 = 21, 03%
DISTRIBUCION DE POISSON
Es una de las distribuciones discretas más importantes. Esta distribución se utiliza cuando los
problemas consisten en observar la ocurrencia de eventos discretos en un intervalo continuo.
Esta distribución expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que
ocurra un determinado número de eventos durante cierto periodo de tiempo.
EJEMPLO: 1) El número de autos que pasan por el peaje en una hora.
2) El número de llamadas telefónicas en una central telefónica por minuto.
3) El número de contratos de obra a realizarse por mes
4) El número de manchas en un metro cuadrado, etc.
Por consiguiente, la variable aleatoria se define como:
x = “Número de ocurrencia de eventos en “t” unidades de medida con rango Rx = 0,1, 2,3,.... ”
La variable aleatoria así definida se llama variable aleatoria de POISSON, y la distribución de

probabilidad de x, se llama distribución de POISSON, la cual está definida por:
 x e− 
P = x |   = donde: e = 2, 71828
x!
 = numero promedio de ocurrencias de los eventos en “t” unidades de medida.
En esta distribución se requiere como dato, el valor de  (promedio a largo plazo) para determinar
la probabilidad de que ocurra un numero designado de eventos (x) con un promedio de ocurrencias
(  ) a corto plazo.
t
LA MEDIA Y LA VARIANZA DE LA DISTRIBUCION DE POISSON Están dados por:
 = E ( x) =   media de la distribución
 2 =   varianza de la distribución
( x)
EJERCICIO 1.-En un hospital de una ciudad se está estudiando los nacimientos de bebes varones. Se
sabe que en una semana nacen un promedio de 7 varones. Calcular

65
a) La probabilidad de que nazca 3 varones en una semana.

b) La probabilidad de que nazca menos de 3 varones a la semana.
SOLUCIÓN. - La variable aleatoria es:
x = “Número de nacimientos de bebes varones en una semana”
Rx = 0,1, 2,....
Se tiene como promedio  = 7 nacimientos de varones por semana.
 x − e− 
La distribución de POISSON es: P  = x /   =
x!
73 − e−7
a) Reemplazando: P  x = 3 /  = 7  = = 0, 052
3!
P  x = 3 /  = 7  = 5, 2%
b)
P  x  3 /  = 7  = P  x = 0 + P  x = 1 + P  x = 2
7 0 e −7 71 e −7 7 2 e −7
P  x  3 = + +
0! 1! 2!
P  x  3 = 0, 001 + 0, 006 + 0, 022
P  x  3 = 0, 029 = 2,9%
EJERCICIO 2.- Cada año ocurre un promedio de 24 accidentes aéreos.
a) Calcule la probabilidad de que ocurra exactamente un accidente en un mes.
b) Calcule la probabilidad que ocurran 5 accidentes en 4 meses.
SOLUCIÓN: La variable aleatoria es
X  = Número de accidentes en un año.
Rx = 0,1, 2,3,.....
Se tiene como promedio  = 24 acc ( año )

a) Se quiere la probabilidad de un accidente en un mes.
Por regla de 3 simple: 24acc. __________12 _ meses
 acc. __________ 1_ mes

t

66
=
t
1 24
12
= 2 acc (
mes ) luego
  21 e.2
P X = 1|  = 2 = = 0, 2707 27, 07%
 t  1!
b) Aplicando la regla de 3 simple
24acc. __________12 _ meses  4 (mes)  24(acc)

 acc. __________ 4 _ mes  __ t =
 t  12 (mes)
(
 = 8 acc 4meses
t
)
Reemplazando se tiene:
84 e−8
P  X = 4 / t = 8 = = 0, 05725
4!
P  X = 4 / t = 8 = 5, 725%
TABLA DE PROBABILIDADES ACUMULATIVAS DE POISSON
Esta tabla se usa para determinar probabilidades del tipo P  X  x /   ; (TABLA II pagina 771-772).
EJEMPLO. - Las personas llegan aleatoriamente a la ventanilla de un banco en promedio a una razón
de 24 por hora.
a) ¿Cuál es la probabilidad que exactamente 5 personas lleguen durante un periodo de tiempo

de 12 min?
b) ¿Cuál que lleguen por lo menos 10 personas?
c) ¿Cuál que lleguen a lo más doce personas?
SOLUCIÓN. - a) La variable aleatoria es:
X  = ” Número de personas que llegan durante un periodo de 12 minutos”
Rx = 0,1, 2,3,.....
El promedio es  = 24 ( personas hora ) pero se requiere un promedio para un tiempo de 12
minutos, usando la regla de 3 simple: 24 personas __________ 60 _ min utos
 __________12 _ min
t

67
=
t
12( min )  24( personas )
60(min)
= 4,8 pers
12 min( )
(
 = 4,8 pers 12 min
t )
APLICANDO LA DISTRIBUCIÓN DE POISSON
(4.8) 4 e−4.8 2548, 04  8, 23 10−3

P  X = 5 / t = 4.8 = = = 01747
5! 120
P  X = 5 = 17, 47%
b) ¿Cuál que lleguen por lo menos 10 personas?
Es decir, se pide P  X  10 | t = 4.8 = ?
P  X  10 |  = 4.8 = P  x = 10 + P  x = 11 + ....
La variable aleatoria es para este inciso.
X  = ” que lleguen por lo menos 10 personas”
Rx = 10,11,12,.....
Entrando a tablas de POISSON con t = 4.8; _ x = 10 (Pg. 772)

P  X  10 |  = 4.8 = 0, 0251 = 2,51%
A este mismo resultado se llega si se aplica la distribución de Poisson en

P  X  10 |  = 4.8 = P  x = 10 + P  x = 11 + P  x = 12  + ...., es decir:
(4.8)10 e−4.8 (4.8)11 e−4.8 (4.8)12 e−4.8 (4.8)13 e−4.8
P  X  10 = + + + + ...
10! 11! 12 13!
P  X  10 = 0, 0147 + 0, 0064 + 0, 0026 + 0, 00095 + ....
P  X  10 |  = 4.8 = 0, 0251 = 2,51%
c)¿Cuál que lleguen a lo más 12 personas?
P  X  12 |  = 4.8 = P  x = 0 + P  x = 1 + ... + P  x = 12  o también se puede hacer

P  X  12 | t = 4.8 = 1 − P  x  13 y buscando en tablas P  x  13

68
P  x  12 = 1 − 0, 0014
1, 2, 3, 4, 13, 14 15
P  x  12 = 0,9986
5, 6, 7, 8, 16, 17, 18
P  x  12 = 99,86%
9, 10, 11, 19, 20, 21, 22
12 . . . . . . . .
LA DISTRIBUCIÓN NORMAL (D.N.)

La distribución de probabilidad continua más importante y más utilizada es la distribución normal.
(desarrollada por el Alemán KARL FREDERICK GAUSS). Muchas de las distribuciones muestrales son
aproximadamente NORMALES para muestras grandes.
La D.N. es una curva regular simétrica en forma de campana, por lo cual recibe el nombre de
campana de Gauss.
Variable Aleatoria de la distribución Normal.
Una variable aleatoria continua x, sigue una distribución normal de media (  )y desviación estándar
(  ) y se simboliza por N(  ,  ), si se cumplen las siguientes condiciones:
1. La variable puede tomar cualquier valor entre ( −, + ).

2. La función de densidad o ecuación matemática de la curva de gauss es:
1  x− 
2
1 − 
 
f ( x) = ___ e 2  (I); para  −     +
 2
Donde:  = media o valor esperado de x . ; e = 2, 71828
 =desviación estándar de x ;  = 3,14159
x =un valor de la variable aleatoria continua
 2 = varianza de x
Propiedades de la distribución normal N (  ,  )
P1. El campo de existencia o dominio es cualquier valor real, es decir, ( −, + ); cuando x es más
de  3  unidades → cero (0).
P2. Es simétrica respecto a la media (  ), que es el máximo.

69
P3. Crece hasta la media  , y decrece a partir de ella.
P4. En los puntos (  −  ) y (  +  ) presenta puntos de inflexión.
P5. El eje de abscisas es una asíntota de la curva ( x = asintota
P6. El área total encerrada bajo la curva y el eje de abscisas es igual a la unidad y representa a
probabilidades de ocurrencia de un evento.; Área bajo la curva=1
P7. Por simetría respecto al eje x =  , deja un área igual a 0.5 a la izquierda y otra igual a 0.5 a la
derecha.
P8. La probabilidad equivale al área encerrada al área encerrada bajo la curva.
P   −      +   = 0, 6826 = 68, 26%

P   − 2     + 2  = 0,954 = 95, 4%
P   − 3     + 3  = 0,997 = 99, 7%
La forma de la D.N. es la siguiente:
 − 3  − 2  −   +  + 2  + 3 x
Z
-3 -2 -1 0 1 2 3 unidad estándar z
P9. La desviación stándar (  ) o desviación típica determina la dispersión de la distribución
(dispersión de los datos) o varianza de la distribución.
La distribución NORMAL ESTÁNDAR. Cualquier valor x de una población con D.N. puede
x−
convertirse a su valor standar equivalente z con la fórmula: (A) Z = y con el uso de tablas se

halla el valor de Z. es decir que:
Para poder utilizar la tabla tenemos que transformar la variable x que sigue una distribución
N (  ,  ) en otra variable Z que siga una distribución N (0,1) por lo que la operación necesaria es la
señalada por la formula (A).

70
Con el uso de tablas pueden obtenerse las porciones de área (Probabilidades) para diversos
intervalos de valores para la distribución normal stándar.
1 2 escala _ x
 = VAR( B)  VAR( A)  VAR(C )
2
x
Los gráficos muestran mayor o menor dispersión de los datos en las distribuciones A, B, y C.
Para la variable Z(aleatoria) que tiene una distribución normal, con media  = o y varianza  2 = 1,
1 −z
2
la función de densidad (I) se transforma en f ( Z ) = __ e 2

2
Los valores de esta función están tabulados. Para valores de Z desde -3 a 3.

Conocidos los valores de la media y la varianza de una variable aleatoria x con distribución
normal, por cálculos posteriores se pueden encontrar probabilidades de diverso tipo.
Las tablas proporcionan el área bajo la curva normal estándar, desde − hasta el valor Z.
(figura siguiente) que se requiera.
f( z )
Z Escala Z
-3 -2 -1 0 +1 +2 +3
Con la tabla se puede resolver 2 tipos de problemas: a) Conocido Z hallar el área y b) Conocido el
Área hallar Z.

71
Ej.1
La vida útil de un componente eléctrico tiene una media de 2500 horas con una desviación estándar
de 250 horas. a) ¿Cuál es la probabilidad de que un componente x , elegido al azar dure entre 2200
y 3000 horas? b) ¿Cuál es la probabilidad que dure más de 3100 horas?
Solución: a) Se pide: P  2200  x  3000 = ?
0.8621
1750 2000 2250 2750 3250 x

2200 2500 3000
z
-3 -2 -1 0 1 2 3
Usando la tabla III (Pag 773)
 2200 − 2500 x −  3000 − 2500 

P  2200    3000 = P    
 250  250
P  2200    3000 = P  −1.2  Z  2 = f (2) − f (−1.2)
Entrando en tabla III de distribución normal se tiene
P  2200    3000 = 0,9772 − 0.1151 = 0,8621

P  2200    3000 = 86, 21%
b)Se pide P  x  3100  = ?
P  x  3100 = 1 − P  x  3100
 x −  3100 − 2500 
P  x  3100 = 1 − P    = 1 −  Z  2.4
  250
P  x  3100 = 1 − f (2.4) = 1 − 0.9918
P  x  3100 = 0, 0082 = 0.82%

72
1750 2000 2250 2500 2750 3100 3250 Escala x
Escala Z
-3 -2 -1 0 1 2 3
Ejemplo 2 El salario de los empleados de una empresa tiene un promedio de 450($us) y una
desviación estándar de 75($us)
a) ¿Cuál es la probabilidad de que un empleado gane menos de 390($us)?

b) Si la empresa tiene 80 empleados ¿Cuantos ganan más de 400($us)?
c) Si la empresa tiene 200 empleados ¡Cuantos ganan 480($us)?
225 300 375 450 525 600 675 x

390
Z
-3 -2 -1 0 1 2 3
METODO 1 a) Se pide P  x  390 = ?
 x −  390 − 450 
P  x  390 = P    = P  Z  0.8 = f (−0.8)
  75
Entrando en tabla III de distribución normal se tiene
P  x  390 = 02119 = 21.19%

73
Ejemplo 3 En una distribución normal se tiene los siguientes datos:

P  x  45 = 0.31 ___; ___ P  x  64 = 0, 08
Hallar la media (  ) y la desviación estándar (  )
Solución Se puede establecer que:
 x −  45 −    45 −  
P  x  45 = P    = P Z 
      
 45 −  
= f = 0.31 __(1); por otra parte
  
 x −  64 −  
P  x  64 = 1 − P  x  64 = 1 − P  
   
 64 −  
P  x  64  = 1 − f  = 0.08 _________ o
  
 64 −  
f = 092 __(2)
  
En tabla III
45 − 
Buscamos el Área A=0.31 de (1) se obtiene: = −0.5 __(a)

64 − 
Buscamos el Área A=092 de (2) se obtiene: = 1, 4 __(b)

De donde: de (a) 05 −  = 45
+m
1.4 +  = 64 m
de (b)
1.9  = 19
 = 10
 Reemplazo en (b)  = 64 − 1.4 10
 = 50
VI. DISTRIBUCIÓN BIDIMENSIONAL
Una Distribución Bidimensional es aquella en la que para cada elemento se consideran2 caracteres
cuantitativos distintos (x, y).

74
Para analizar en forma conjunta a las variables x, y, se considera el par (x, y) como una sola
variable llamada Variable estadística bidimensional o variable bivariante.
Definición: Si (x, y) es una variable bidimensional en la que los distintos valores que toman x, y son:
x : x1 , x2 , x3 ,....xi ..., xk
y : y1 , y2 , y3 ,.... y j ..., yk
Una Distribución Bidimensional de frecuencias es un arreglo de los valores observados (x, y) en

una tabla de doble entrada que tiene la forma siguiente:
Datos y y1 ___ y2 _____ y3 _ ... _ y j _ ... _ yr TOTAL

Datos x
x1 n11 __ n12 __ ... __ n1 j __ ... __ n1r n1*
x2 n21 __ n22 __ ... __ n2 j __ ... __ n2 r n2*
x3 n31 __ n32 __ ... __ n3 j __ ... __ n3r n3*
... ... ___ ... ___ ... __ ... ___ ... __ ... ...
xi ni1 __ ni 2 __ ... __ nij ______ ... __ nir ni*
... ... ___ ... ___ ... __ ... ___ ... __ ... ...
xk nk 1 __ nk 2 __ ... __ nkj __ ... __ nkr nk *
TOTAL n*1 ___ n*2 _____ n*3 _ ... _ n* j _ ... _ n*r n
Donde: nij = es el número de veces que se presenta el par ( xi , y j ) o frecuencia absoluta
del par para todo i = 1, 2, ..., k ___; ___ j = 1, 2, ..., r

r
ni* =  nij Es el total de pares en el que el primer componente toma los valores
j =1
fijos de xi = 1, 2,..., k se llama frecuencia marginal del valor xi
k
n* j =  nij Es el total de pares donde el segundo componente toma los valores
i =1
fijos de y j _; __ j = 1, 2,..., r se llama frecuencia marginal del valor y j
k r
n= f ij Es el total de pares con el segundo componente y j ; j = 1, 2,..., r se llama
i =1 j =1
frecuencia total de ( xi y j )

75
En el caso de una variable continúa agrupada en intervalos, se emplean las marcas de clase para
obtener una tabla equivalente.
Cuando x,y son variables cualitativas la tabla de distribución bidimensional se llama tabla de
contingencia.
EJERCICIOS RESUELTOS DE VARIABLE ESTADISTICA BIDIMENSIONAL
1. Dada la variable estadística bidimensional (x, y) con la tabla de frecuencia.
X Y 1 2 4 6
1 2 0 1 1
3 3 1 0 1
5 0 1 0 5
Se pide:
3 4 3 4
a)  nij
i =1 j =1
b) f 23 , f34 , f 21 c)  ni• y  n• j
i =1 j =1
d) f ( xi / y = 2) y f ( y j / X = 3) e) a10 _ y _ a01 f) a11 g) s xy
Solución
a)
3 4 3
 n =   n
i =1 j =1
ij
i =1
i1 + ni 2 + ni 3 + ni 4  =  n11 + n12 + n13 + n14  +  n21 + n22 + n23 + n24  +  n31 + n32 + n33 + n34  =
__________________________ =  2 + 0 + 1 + 1 + 3 + 1 + 0 + 1 + 0 + 1 + 0 + 5 = 15
b) Cada nij representa la frecuencia absoluta del par ( xi , y j ), la frecuencia relativa se define
nij 3 4
fij =
N
. Donde N =  n
i =1 j =1
ij = 15
n23 0 n 5 n 3
f 23 = = = 0 ______ f34 = 34 = ______ f 21 = 21 =
N 15 N 15 N 15

76
C)
X Y 1 2 4 6 ni•
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 6
n* j 5 2 1 7 15
3 3 4
 ni• =  n1• + n2• + n3•  =  4 + 5 + 6 = 15 = 

i =1 i =1 i =1
4 3 4
 n* j =  n*1 + n*2 + n*3 + n*4  = 5 + 2 + 1 + 7 = 15 nij

j =1 i =1 i =1
d)
X Y 1 2 4 6 ni•
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 n3• = 6
n• j 5 n•2 = 2 1 7 15
Las frecuencias relativas condicionadas f ( xi / Y = 2 ) y f ( yi / X = 3 ) :
x n ( xi / Y = 2 ) n ( xi / Y = 2 )
f ( xi / Y = 2 ) =
n•2
1 0 0
2 1 ½
3 1 ½
n•2 = 2 1
y n ( y j / X = 3) n ( y j / X = 3)
f ( y j / X = 3) =
n3*
1 0 0
2 1 1/6
4 0 0
6 5 5/6
n3• = 6 1

77
e)
3 4 3
 x n i ij  x n i i1 + ni 2 + ni 3 + ni 4 
1
( x1n11 + x1n12 + x1n13 + x1n14  +
i =1 j =1
a10 = = i =1
=
N N N
+  x2 n21 + x2 n22 + x2 n23 + x2 n24  +  x3n31 + x3n32 + x3n33 + x3n34 ) =
=
1.2 + 1.0 + 1.1 + 1.1 + 3.3 + 3.1 + 3.0 + 3.1 + 5.0 + 5.1 + 5.0 + 5.5 = 49 = 3, 26
15 15
3
xn i i*
1.4 + 3.5 + 5.6 49
O también, a10 = i =1
= = = 3, 26
N 15 15
4
x n
j =1
j *j
1.5 + 2.2 + 4.1 + 6.7 55
a01 = = = = 3, 6
N 15 15
f)
3 4
 x y n
i =1 j =1
i j ij
a11 = =
N
=
1.1.2 + 1.2.0 + 1.4.1 + 1.6.1 + 3.1.3 + 3.2.1 + 3.4.0 + 3.6.1 + 5.1.0 + 5.2.1 + 5.4.0 + 5.6.5 = 205 = 13.66
15 15
g) sxy = a11 − a10 a01 = 13, 66 − 3, 26.3, 6 = 1,924
2. Las calificaciones obtenidas por un grupo de alumnos en estadística (E) y Macroeconomía (M):
E 3 4 6 7 5 8 7 3 5 4 8 5 5 8 8 8 5
M 5 5 8 7 7 9 10 4 7 4 10 5 7 9 10 5 7
a) Hallar la tabla de frecuencias

b) Hallar las distribuciones marginales, media y varianza de las mismas
c) Covarianza
Solución
a) La variable E (Estadística) toma seis valores diferentes. La variable M (Macroeconomía)

toma siete valores distintos, por lo que para formar la tabla bastara hacer el recuento de las
veces que se repite cada par.

78
E M 4 5 6 7 8 9 100 ni•
3 1 1 2
4 1 1 2
5 1 4 5
6 1 1
7 1 1 2
8 1 2 2 5
n• j 2 4 0 5 1 2 3 17
b)
Ei ni• Ei ni• Ei 2 ni• Mj n• j E j n j• M j 2 n j•

3 2 6 18 4 2 8 32
4 2 8 32 5 4 20 100
5 5 25 125 6 0 0 0
6 1 6 36 7 5 35 245
7 2 14 98 8 1 8 64
8 5 40 320 9 2 18 162
17 99 629 10 3 30 300
17 119 903
• Distribución Marginal de Estadística:
6 6
− En
99 i i• E n 2
i i•
629
E = a10 = = 5,82 a20 =
i =1
= i =1
= = 37
N 17 N 17
sE2 = a20 − a102 = 37 − 5,822 = 3,13
• Distribución Marginal de Macroeconomía:

7 7
 M j n• j
119
j =1
M
j =1
2
n
j •j
903
M = a01 = = = 7 a02 = = = 53,11
N 17 N 17
sM2 = a02 − a01
2
= 53,11 − 72 = 4,11
c) Para hallar la covarianza: sxy = a11 − a10 a01
6 7
 E M n
i =1 j =1
i j ij
3.4.1 + 3.5.1 + 4.4.1 + 4.5.1 + 5.5.1 + 5.7.4 + 6.8.1 + 7.7.1 + 7.10.1 + 8.5.1 + 8.9.2 + 8.10.2
a11 = =
N 17

79
739
a11 = = 43, 47 sxy = a11 − a10 a01 = 43, 47 − 5,82 = 2, 73
17
3. Dada la Tabla de correlaciones, Hallar n21 para que las dos variables sean estadísticamente
independientes y calcular su covarianza en este caso.
X Y 5 7
100 8 4
200 n21 6
Solución
X Y 5 7 ni•
100 8 4 12
200 6 n21 + 6 nij ni• n• j
n21 Por ser independiente: =  __ i , j
N N N
n• j n21 + 8 10 n21 + 18
4 12 10 120 120 − 72
= →4= → 4  n21 + 18 = 120 → n21 = = 12
n21 + 8 n21 + 18 n21 + 18 n21 + 18 4
X Y 5 7 ni•
100 8 4 12
Covarianza: sxy = a11 − a10 a01
200 12 6 18
n• j 20 10 30
2 2
 xi ni* 100.12 + 200.18

y nj =1
j *j
5.20 + 7.10
a10 = x = i =1
= = 160 a01 = y = = = 5, 67
N 30 N 30
2 2
 x y n
i =1 j =1
i j ij
100.5.8 + 100.7.4 + 200.5.12 + 200.7.6 27200
a11 = = = = 906, 67
N 30 30
sxy = a11 − a10 a01 = 906, 67 − 160.5, 67 = −0,53
1. ESTIMACION DE PARAMETROS
PRUEBA DE HIPÓTESIS
Es una regla que especifica si se puede aceptar o rechazar una afirmación acerca de una población.

80
La prueba de hipótesis examina 2 hipótesis opuestas sobre la población, la hipótesis Nula

(Ho)(hipótesis que se quiere probar) y la Hipótesis Alternativa (H1)(Hipótesis contraria a Ho) que se
acepta en caso de que la primera sea rechazada.
La Ho es el enunciado que se probara con base en los datos de una muestra. Para un nivel de
significado (generalmente=0.05).
El “nivel de significación”, se representa por (  ) y se define como la probabilidad de cometer un

error de tipo I es decir,
 = P  error _ tipo _ I  = P  rechazarH 0 | H 0es _ verdadera 
P =  aceptarH1 | H1es _ falsa 
La probabilidad de cometer un error de tipo II, se representa por B, es decir
 = P  error _ tipo _ II  = P  rechazarH 0 | H 0es _ falsa 
P =  aceptarH1 | H1es _ verdadera 
TIPOS DE PRUEBAS DE HIPÓTESIS
Hay 3 tipos de pruebas que se identifican por la forma en que se formulan Ho y H 1
1. Prueba de una cola o unilateral o Prueba del lado izquierdo.

2. Prueba de la cola superior o prueba de la cola derecha
3. Prueba de 2 colas o bilaterales.
Ejemplo: Un fabricante de galletas ha impreso en los paquetes que el peso es de 500 gramos, pero
el contenido real es una variable aleatoria, el fabricante afirma que  = 500( gr ) con una
desviación estándar igual a 5(gr). Se desconfía de la afirmación de que la media sea  = 500( gr ) y
se quiere analizar su veracidad.
Solución: variable= x :peso en (gr.) de un paquete de galletes
H 0 :  = 500( gr )  Hipótesis Nula
H1 :   500( gr )  Hipótesis Alternativa
Es necesario señalar que no se pueden pesar todos los paquetes de la producción de galletas. Por
tanto, se toma una muestra aleatoria de 100 paquetes y se mide el peso.
−
• Si la media X es muy inferior a 500(gr) o ( x −  ) muy grande
Se rechaza la “ H 0 ”
−
• Si la media X es muy cercana a 500(gr) o ( x −  ) es pequeña entonces   evidencia
suficiente para rechazar “ H 0 ”

81
−
Si se obtiene por ejemplo x = 421.3( gr )  se rechaza H0
−
Si x = 499.8( gr )   evidencia para rechazar H0
La tabla siguiente resume los resultados posibles
VALOR DE VERDAD REAL DE H0
H0 es V H0 es F
DECISION Rechazo H0 Error Tipo I Decisión Correcta

Que se toma en
La (Prueba de H.) Apruebo H0 Decisión Correcta Error Tipo II
Error Tipo I Es la probabilidad de rechazar H0 cuando es V a un nivel de significado  = 0.05

gráficamente usando de D.N. se toma en cuenta 2 zonas.
Zona
De
 = 0.05 Aceptación
Zona de x
Rechazo Zona de Aceptación
Z
− − − − − −
 x+ 2 x
x − 3 x− 2 x−  x+  x + 3
Z
-3 -2 -1 0 1 2 3
−1, 64
Para  = 0.05 → se determina Zcrit = −1.64 en tabla (Valor critico)

82
Usando la tabla III, Para  = 0.05 se determina Z=-1.64 o también usando la tabla IV (B) Área bajo
la cola D.N. estándar.
En el ejemplo: Si la información de la muestra de 100 paquetes da como resultado por ejemplo

−
x = 499.1( gr )
El estadístico de prueba es Ep es decir
x− 499.1 − 500

499.1 − 500 −0.9
Ep =  = 5 = = = −1.8
n 100 0.5 0.5
Ep = −1.8 este valor cae en la zona de rechazo, lo cual implica que  La H0 se rechaza
499.2 − 500
Si Ep = = −1.6  este valor cae en la zona de aceptación  H0 se acepta
0.5
Pasos para realizar prueba de Hipótesis
1. Reconocer y definir la o las variables.

2. Formular la hipótesis nula (H0) y la hipótesis Alternativa H1.
3. Establecer el estadístico de prueba (Ep) adecuado.}
4. Seleccionar el nivel de significación (  ).
5. Determinar la zona de rechazo y establecer la regla de decisión.
6. Calcular el valor observado del estadístico de prueba (en el caso del ejemplo (  )).
7. Obtener la conclusión.
NOTA:
Se asignará dos trabajos para completar el programa:
a. Distribución de estadígrafos muestrales y Estimación de parámetros

b. Análisis Numérico: Solución de Ecuaciones Lineales, Método de Newton Raphson

83

Manual de Consulta Materia Estadistica y Analisis Numerico Docente Ing. Camilo G. Marin

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual de Consulta Materia Estadistica y Analisis Numerico Docente Ing. Camilo G. Marin

Cargado por

Copyright:

Formatos disponibles

MANUAL DE CONSULTA UNIVERSIDAD PUBLICA DE EL ALTO

ESTADISTICA Y ANALISIS NUMERICO CARRERA DE INGENIERIA CIVIL

I. RECOLECCION Y PROCESAMIENTO DE DATOS ESTADISTICOS

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

Inversiones (en miles de $us)

a) Elaborar el cuadro de distribución de frecuencias

c) NUMERO DE EMPRESAS CON INVERSIONES MAYORES DE 48 MIL $US.

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

Por tanto, el Número de Empresas = 5+6+5+2+2+1 = 21

Rpta.: 21 empresas invirtieron más de 48 mil($us)

D) PORCENTAJE DE EMPRESAS CON INVERSIONES MAYORES A 80 MIL ($US)

SIMETRÍA DE UN CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS

𝒉𝒌−𝒋 = 𝒉𝒌+𝒋 𝟏≤ 𝑱≤ 𝑲−𝟏

En el cuadro, el número de clases es m=7

Entonces para: 𝑱 = 𝟏: 𝒏𝟒−𝟏 = 𝒏𝟒+𝟏 ⇒ 𝒏𝟑 = 𝒏𝟓 = 𝟒𝟐

Un CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS con número par de clases

5-8 6.5 12 0073

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

• Estadigrafos de Tendencia central

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

Solución: Aplicando la formula

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

1.1. LA MEDIA EN DATOS TABULADOS

Solución: Elaboramos la Tabla de frecuencias de los datos, agregando la columna yi .ni

Edad ni 𝑦𝑖 ∗ 𝑛𝑖 Se efectúa los productos y se aplica la formula(A)

LA MEDIA EN DATOS TABULADOS EN CLASES (VARIABLE CONTINUA): [ )

El cuadro de distribución con los cálculos es el siguiente:

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

2. LA MEDIA ARITMÉTICA PONDERADA

Ejemplo: Una empresa de construcción tiene 3 tipos de obreros: No calificados; semicualificados y

Solución: con la formula

Donde: xi = Salario de cada tipo de obrero; wi =Peso asignado a cada tipo

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

Para un conjunto de datos x1 , x2 , x3 ,..., xn ordenados en forma ascendente es el valor de la variable

3.1. LA MEDIANA PARA DATOS NO TABULADOS M e ( x )

El proceso de cálculo es el siguiente:

Ejemplo 1: Calcular la mediana M e ( x ) para los datos: 51,24,43,27,39,19,37

Ejemplo 2: Calcular la mediana M e ( x ) para los datos: 51,24,43,27,39,19,37,62

3.2. LA MEDIANA PARA DATOS TABULADOS M e ( x )

CASO1: LA VARIABLE ASUME POCOS VALORES

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

b) Se determina la menor frecuencia absoluta acumulada ( N j ) que supera a ( n / 2 ), y/o pueden

Ejemplo: Dada la tabla de frecuencias de datos discretos hallar la mediana

Cuando el valor de (n/2), no coincide como en el siguiente ejemplo:

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

3.3.LA MEDIANA PARA DATOS TABULADOS EN CLASES (VARIABLE

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

Ejemplo: Para los datos: a) 2,4,5,5,6,7,2,5  M O = 5

b) 3,4,5,6,7,8,9,  No hay moda es amodal

c)1,1,1,4,4,5,5,5,7,8,9,9,9,  M o = 1,5,9 (trimodal)

4.1. LA MODA EN DATOS AGRUPADOS EN CLASES

AUTOR: ING. CAMILO G. MARIN GUTIERREZ

Donde: y j −1 = límite inferior de la clase modal=66

1 = Exceso de la frecuencia absoluta modal sobre la frecuencia de la clase