Documentos de Académico
Documentos de Profesional
Documentos de Cultura
% N %
Primaria - - 1 1.43 1 1.43 2 2.86
Secundaria 3 4.29 6 8.57 2 2.85 1
1
15.71
Sup. No Universitaria 26 37.14 13 18.57 3 4.29 4
2
60.00
Sup. Universitaria 12 17.14 3 4.29 - - 1
5
21.43
TOTAL 41 58.57 23 32.86 6 8.57 7
0
100.00
Tambin existen cuadros tridimensionales, estos dependen de la naturaleza de
los trabajos de investigacin.
b. DE VARIABLE CUANTITATIVA:
b.1. CUADROS UNIDIEMNSIONALES:
Se construyen cuando se analiza una sola variable cuantitativa. (Ingresos
econmicos, Rendimiento de alumnos, Peso, Edad,etc.). Ejem.
CUADRO N 3
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1 CICLO SEGN
INGRESO ECONOMICO
b.2. CUADROS BIDIMENSIONALES: Se construyen cuando se
analizan a la vez dos variables cuantitativas. Ejem.
CUADRO N 4
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGN
INGRESO ECONOMICO Y RENDIMIENTO DE LOS ALUMNOS
Ingreso
Econmico
Rendimiento
Total
0 -10 11-15 16-20
N % N % N % N %
500 - 700 3 4.29 2 2.85 - - 5 7.14
701 - 900 2 2.86 5 7.14 1 1.43 8 11.43
901 - 1100 4 5.71 8 11.43 3 4.29 15 21.43
1101-1300 4 5.71 21 30.0 - - 25 35.71
INGRESO ECONOMICO N %
500 700
701 900
901 1100
1101 - 1300
1301 - 1500
5
8
15
25
17
7.14
11.43
21.83
35.71
24.29
TOTAL 70 100.00
1301-1500 2 2.86 14 20.0 1 1.43 17 24.29
Total 15 21.43 50 71.42 5 7.15 70 100
c. DE VARIABLE CUANTITATIVA- CUALITATIVA: Se construyen cuando se
analiza una variable cuantitativa y una cualitativa. Ejem.
CUADRO N 5
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGN
INGRESO ECONOMICO Y ZONA DE RESIDENCIA
Ingreso
Econmico
Zona de Residencia
Total
Urbana Urbano
marginal
Rural
N % N % N % N %
500 - 700 - - 1 1.43 4 5.71 5 7.14
701 - 900 2 2.86 4 5.71 2 2.86 8 11.43
901 - 1100 9 12.86 6 8.57 - - 15 21.43
1101- 1300 18 25.71 7 10 - - 25 35.71
1301- 1500 12 17.14 5 13.15 - - 15 24.29
Total 41 58.57 23 32.86 6 8.57 70 100.00
2.2.2. TABLAS DE DISTRIBUCION DE FRECUENCIAS:
SIMBOLOGIA:
n : N de datos
Li : Lmite inferior de los datos
Ls : Lmite superior de los datos
R : Recorrido o rango
m : N de intervalos
c : amplitud intervlica
Xi : Recorrido o valores que toma una variable discreta
ni : Frecuencias absolutas
hi : Frecuencias relativas
Ni : Frecuencias absolutas acumuladas
Hi : Frecuencias relativas acumuladas
hix100: Frecuencias relativas porcentuales
Hix100: Frecuencias relativas porcentuales acumuladas
[yi-1 yi): Intervalo cerrado por la izquierda y abierto por la
derecha
(yi-1 yi]: Intervalo abierto por la izquierda y cerrado por la
derecha
[yi-1 yi]: Intervalo cerrado por ambos lados
2.2.2.2 DISRIBUCION DE FRECUENCIAS DE VARIABLE
DISCRETA:
Ejem : Los siguientes datos corresponde al nmero de
profesores de de 75 colegios:
49, 52, 50, 47, 49, 48, 50, 49, 51, 50, 52 47, 49, 48, 47, 46, 50, 49,
51, 50, 48, 46, 52, 49, 48, 48, 47, 51, 46, 51, 50, 47, 49, 46, 50, 49,
47, 50, 51, 48, 49, 47, 48, 48, 46, 48, 47, 51, 46, 49, 46, 48, 49, 48,
50, 52, 52, 48,48,49, 47, 48, 50, 49, 46, 51, 50,49, 47, 50, 48, 51,
52, 48, 51
a. Elabore una tabla de frecuencias para analizar los datos.
b. Interprete la tabla
Solucin
TABLA N 6
DISTRIBUCION DE FRECUENCIAS DE LOS
PROFESORES DE 75 COLEGIOS
X
i
n
i
h
i
N
i
H
i
hix100 H
i
x100
46
47
48
49
50
51
52
8
10
16
14
12
9
6
0.11
0.13
0.21
0.19
0.16
0.12
0.08
8
18
34
48
60
69
75
0.11
0.24
0.45
0.64
0.80
0.92
1.00
11
13
21
19
16
12
8
11
24
45
64
80
92
100
75 1.00 100
PROCEDIMIENTO
En la primera columna se colocan los valores que toma la
variable
X
i
.
Las frecuencias absolutas ni, resultan de contar cuantas veces
se repite los valores que toma la variable, es decir, cuantas
veces se repite el 1, cuantas veces se repite el dos, etc.
Las frecuencias relativas hi, resultan de dividir cada frecuencia
absoluta entre el total de datos (80).
La frmula para encontrar cada frecuencia relativa es
n
n
h
i
i
, de
lo que resulta:
n
n
h
1
1
;
n
n
h
2
2
;
n
n
h
3
3
; etc.
11 0
75
8
1
. h 13 0
75
10
2
. h
- Frecuencias Absolutas Acumuladas Ni: Se calculan as:
8
1 1 1
N n N
18 10 8
2 2 2 1 2
+ + N N n n N
34 34 16 10 8
3 3 3 2 1 3
+ + + + N N n n n N
As sucesivamente.
- Frecuencias Relativas Acumuladas Hi: Se calculan as de
manera similar:
11 0
1 1 1
. H h H
24 0 24 0 13 0 11 0
2 2 2 1 2
. . . . + + H H h h H
45 0 21 0 13 0 11 0
3 3 3 2 1 3
. . . . + + + + H H h h h H
- Frecuencias Relativas Porcentuales (hi x 100): Se encuentran
multiplicando por 100 a cada frecuencia relativa simple (hi):
h1x 100 = 0.11 x 100 = 11
h2x 100 = 0.13 x 100 = 13
h3x 100 = 0.21 x 100 = 21
y as sucesivamente.
- Frecuencias Relativas Porcentuales Acumuladas(Hix100): Se
encuentran multiplicando por 100 a cada frecuencia relativa
acumulada (Hi):
H1x 100 = 0.11 x 100 = 11
H2x 100 = 0.24 x 100 = 24
H3x 100 = 0.45 x 100 = 45
y as sucesivamente.
INTERPRETACIN DE LOS VALORES DE LA TABLA
Vamos a interpretar dos valores de cada columna, el resto de
valores se interpreta de manera similar.
n
3
= 16 : 16 colegios tienen 48 profesores
n
5
= 12 : 12 colegios tienen 50 profesores
h
2
= 0.13 : El 0.13 por uno de colegios tienen 47
profesores
h
4
= 0.19 : El 0.19 por uno de colegios tienen 49
profesores
N
3
= 34 : 34 colegios tienen de 46 a 48
profesores
N
6
= 69 : 69 colegios tienen de 46 a 51
profesores
H
3
= 0.45 : El 0.45 por uno de colegios tienen de
46 a 48 profesores
H
5
= 0.80 El 0.80 por uno de colegios tienen de
46 a 50 profesores
h
4
x 100 = 19 : El 19% de colegios tienen 49
profesores
h
6
x 100 = 12 : El 12% de colegios tienen 12
profesores
H
3
x 100= 45 : El 45% de colegios tienen de 46 a 48
profesores
H
5
x 100= 80 : El 80% de colegios tienen de 46 a 5o
profesores
2.2.2.3. DISRIBUCIN DE FRECUENCIAS DE VARIABLE
CONTINUA:
Cuando la variable en estudio es continua los datos se
agrupan en intervalos.
Ejem. Los siguientes datos corresponde al ingreso
econmico de 62 trabajadores.
910, 950, 1190, 620, 1040, 1100, 1070, 925, 800, 1380,
780, 456, 706, 1100, 860, 1370, 1240, 1120, 1020, 1060,
930, 1136, 1180, 990, 630,1070, 930, 1200, 920, 815, 495,
480, 460, 1090, 1220,456, 742, 1080, 1082, 1073, 1345,
790, 950,1073, 1170, 790, 1085, 820, 900, 780, 700, 650,
1020, 980, 950, 990, 935, 810, 790, 1382, 1384, 910
a. Elabore una tabla de distribucin de frecuencias
utilizando un intervalo cerrado por la izquierda y abierto
por la derecha.
b. Interprete la tabla y haga la representacin grafica
correspondiente
TABLA N 7
[y
i-1
-y
i
) y
i
n
i
h
i
N
i
H
i
h
i
x100 H
i
x100
454.5 - 587.5 521 5 0.08 5 0.08 8 8
587.5 720.5 654 5 0.08 10 0.16 8 16
720.5 853.5 787 10 0.16 20 0.32 16 32
853.5 986.5 920 13 0.21 33 0.53 21 53
986.5 1119.5 1053 16 0.26 49 0.79 26 79
1119.5 1252.5 1186 8 0.13 57 0.82 13 82
1252.5 1385.5 1319 5 0.08 62 1.00 8 100
TOTAL 62 1.00 100
PROCEDIMIENTO.
1.Para construir los intervalos se puede proceder de dos
maneras:
a. Por Conveniencia: De acuerdo a la naturaleza del
trabajo de investigacin y en funcin a la utilidad de
informacin que le pueda brindar al investigador, se
pueden construir los intervalos. No necesariamente los
intervalos deben tener la misma amplitud.
b. Metodologa para Construir los Intervalos: Existe una
metodologa que se utiliza para construir los intervalos
para una tabla de frecuencias de variable continua.
1 Se determina el Rango, con la siguiente frmula:
Li Ls R
R = Ls Li = 1384-456 = 928 R = 928
2 Se determina el nmero de intervalos:
4
5 . 2 n m
m = 2.5 62 4
m = 7
3 Se determina la amplitud del intervalo ( c ):
C = 5714286 132
7
928
.
M
R
Si el valor de C, sale con muchos decimales es preferible hacer
ampliacin de los lmites de la informacin con la finalidad de no
tener problemas a la hora de construir los intervalos. Si esto
ocurre, la tabla se construir con los nuevos lmites obtenidos.
La ampliacin de los lmites de los datos se hace, agregando al
lmite superior de los datos una cantidad pequea y restando la
misma cantidad al lmite inferior de los datos. Se debe ir
probando con varias cantidades ( 0.25, 0.50, 0.75, 1, 1.25. 1.50,
1.75, 2, etc). No necesariamente se busca que el valor de C sea
entero. Para nuestro caso la solucin es agregar al lmite
superior de los datos 1.5 y restar esta misma cantidad al lmite
inferior, con lo que tendramos los nuevos lmites de las datos:
Ls = 1385.5 y Li = 454.5, por diferencia de ambos valores se
tiene R = 931, entonces el valor de la amplitud sera
C = 133
7
931
+ . .
; 654
2
5 720 5 587
+ . .
, etc.
3.Las frecuencias se encuentran de la misma manera que en
la tabla de distribucin para variable discreta, descrita
anteriormente.
Para la interpretacin de los valores de la tabla se procede de
manera similar que se hizo para la tabla de frecuencia de
variable discreta (Tabla anterior).
.Como ejemplo interpretaremos algunos valores:
n
4
= 13: 13 trabajadores tienen un ingreso de 853.5 a 986.5
soles.
n
3
=10 Vrs. Y
3
=787: 10 trabajadores tienen un ingreso promedio
de
787 soles.
h
5
=0.24: El 0.24 por uno de trabajadores tienen un ingreso de
986.5 a 1119.5 soles.
N
4
=33 : 33 trabajadores tienen un ingreso de 454.5 a 986.5
soles.
H
5
= 0.77: El 0.77 por uno de trabajadores tienen un ingreso de
454.5 a 1119.5 soles.
h
3
x100=16: El 16 % de trabajadores tienen un ingreso de 720.5 a
853.5 soles.
H
6
x100=90 : El 90 % de trabajadores tienen un ingreso de 454.5
a 1252.5 soles.
2.3. REPRESENTACIONES GRAFICAS
Un grfico es un medio para representar de manera objetiva los datos de
una tabla estadstica. Los grficos se elaboran en funcin del tipo de
variable que se quiere representar.
2.3.1 CONSTRUCCION DE GRAFICOS:
Existen una diversidad de grficos, cuya forma depender de las variables
de estudio y de los objetivos de estudio.
Los grficos de una sola variable sirven para fines comparativos de cifras
absolutas o porcentuales y pueden tener la forma de barras, superficies o
lneas.
Los grficos de dos variables se construyen en el plano de coordenadas
cartesianas.
2.3.2. PARTES DE UN GRAFICO:
a. Titulo: Indica la naturaleza del fenmeno representado.
b. Diagrama: Representa los datos contenidos en la tabla estadstica
c. Escalas : Las escalas se construyen de acuerdo a la magnitud de las
frecuencias.
d. Fuente: Sirve para indicar la fuente de los datos representados, esto es
opcional puesto que la fuente se especifica en la tabla estadstica de
donde provienen los datos.
2.3.3. TIPOS DE GRAFICOS: Entre los principales se tiene:
a. Grficos de rea o de Superficie: Se construyen para una variable de
cualitativo. Para la ilustracin tomaremos los datos del Cuadro N 1
PADRES DE FAMILIA SEGUN NIVEL DE
INSTRUCCION
3%
16%
60%
21%
Primaria
Secundaria
Sup. No Universitaria
Sup. Universitaria
b. Grfico de Barras: Se construyen para dos variables de tipo cualitativo. Para su
ilustracin tomamos los datos del cuadro N 2.
Padres de Familia Segn Nivel de Instruccin y Zona de
Residencia
0
5
10
15
20
25
30
Primaria Secundaria Superior no
Universitaria
Superior
Universitaria
Nivel de Instruccin
N
D
e
P
a
d
r
e
s
Zona Urbana
Zona Urbano
Marginal
Zona Rural
a. Grfico de Bastones: Se construyen para variables de tipo discreto.
Para la ilustracin tomaremos los datos de la tabla N 6
b. Histograma de Frecuencias:
Se construye para variables de tipo cuantitativo y consiste en barras
que van unidas. Para la ilustracin tomaremos los datos de la tabla
N 7.
INGRESOS ECONOMICOS DE 62 TRABAJADORES DE
UNA EMPRESA
0
2
4
6
8
10
12
14
16
4
5
4
.
5
-
5
8
7
.
5
5
8
7
.
5
7
2
0
.
5
7
2
0
.
5
8
5
3
.
5
8
5
3
.
5
9
8
6
.
5
9
8
6
.
5
1
1
1
9
.
5
1
1
1
9
.
5
1
2
5
2
.
5
1
2
5
2
.
5
1
3
8
5
.
5
INGRESOS ECONOMICOS
N
D
E
T
R
A
B
A
J
A
D
O
R
E
S
c. Grficos para Series de Tiempo: Se denomina series de tiempo a los
datos ordenados en funcin del tiempo: ejemplo:
VENTA ANUAL DE COMPUTADORAS: TIENDA
INFORMAT
0
100
200
300
400
500
600
700
800
1997 1998 1999 2000 2001 2002 2003 2004 2005
AOS
N
D
E
C
O
M
P
U
T
A
D
O
R
A
S
AOS N de Alumnos de la Facultad
De Ing. Informtica y Sist.
1998
1999
2000
2001
2002
2003
2004
380
450
530
600
690
770
855
EJERCICIOS
1. La inversin mensual en compra de computadoras, en miles de dlares, por 48
pequeas empresas fue:
31 17 27 20 28 10 34 25 14 24 40 35 15 39 18 30 41 26
12 46 18 23 36 19 29 37 33 27 27 24 26 31 32 28 25 28
33 28 22 23 31 29 35 21 30 25 38 31.
a. Construir una tabla de frecuencias para analizar los datos, considerando un
intervalo
abierto por la derecha y cerrado por la izquierda. Interprete.
b. Determinar el N de empresas con una inversin menor a 25 mil dlares.
c. Determinar el porcentaje de empresas con una inversin entre 14 mil y 20 mil
dlares.
2. Con los datos del problema N 1, elabore una tabla de frecuencias utilizando un
intervalo cerrado por ambos lados. Interprete la tabla.
3. Los siguientes datos corresponde a las notas en el curso de estadstica de 52
alumnos:
12 11 12 12 7 8 12 12.5 9.5 9 9 12 7.5 12.5 10 9 11.5 13
10.5 10 12 8 14 12 11 16 12 15 9 10.5 12 12 10 13.5 12 18
10 11 10 17 12.5 10.5 14 11 10.5 14.5 12.5 11.5 12 13 11 11.5
.
Construir una tabla de frecuencias utilizando intervalos cerrados por ambos
lados. Interprete la tabla y haga la representacin grfica correspondiente.
4. Los siguientes datos corresponde al N de libros de estadstica consultados por
50
estudiantes para rendir su primer examen parcial.
2 3 4 4 0 4 0 2 1 1 0 3 0 2 2 0 3 0 4 1 0 1 2 0 1 1
5
0 5 0 3 2 0 5 4 1 1 0 4 2 1 1 4 6 2 1 2 3 0 3.
Construir una tabla de frecuencias e interprete la tabla.
5. Con respecto a la tabla de frecuencias del problema anterior se pide:
a. Qu porcentaje de alumnos consult de 4 a 6 libros?
b. Qu porcentaje de alumnos no consult ningn libro?
c. Qu porcentaje de alumnos consult hasta 3 libros?
6. La demanda diaria de azcar durante 190 das en un supermercado, se tabul en
una distribucin de frecuencias simtrica de 5 intervalos de amplitudes
iguales a 4. Si la marca de clase del intervalo central es igual a 12 y si la curva de
frecuencias absolutas satisface la relacin :
f ( x ) = - ( x 12 )
2
+ 70 . Reconstruir la distribucin y graficar.
7. Los siguientes datos corresponde a las calificaciones de 60 alumnos de un curso de
matemticas: H
4
x 100 = 85 ; H
3
x 100 = 70 y H
2
x 100 = 60 ; el lmite inferior del
2 intervalo es 5 y el lmite inferior del tercer intervalo es 9 . Complete la tabla de
frecuencias. Interprete la tabla.
8. Los siguientes datos corresponde al peso en libras de 56 trabajadores de una empresa:
167 154 134 175 184 158 175 120 115 125 136 146 148 134
126 143 178 163 152 134 145 168 129 132 118 154 115 127
135 167 183 174 156 162 165 169 170 154 160 145 134 156
166 145 134
123 145 167 156 133 155 143 166 148 125 153.
Construir una tabla de frecuencias utilizando intervalos cerrados por ambos
lados. Interprete la tabla de frecuencias y haga el grafico correspondiente.
9. Los siguientes datos corresponde a 64 de alumnos del curso de matemticas de los
cuales 25 son mujeres, 42 del curso de estadstica, de los cuales 12 son mujeres y
32 del curso de computacin I , de los cuales 18 son mujeres. Haga una tabla para
presentar los datos y grafique.
10. Complete la siguiente tabla de distribucin de frecuencias, correspondiente a las
calificaciones de 60 alumnos del curso de estadstica.
[Yi-
1
-Yi)
Hi x100 ni Yi hi Ni Hi hix100
12 0.20
05 60
09 70
85
Totales
11. El peso en gramos de 30 objetos de un mismo tipo son los siguientes : 21.3 15.8
18.4 22.7 19.6 15.8 26.4 17.3 11.2 23.9 26.8 22.7 18.0 20.5 11.0 18.5
23.0 24.6 20.1 16.2 08.3 21.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1
a. Construir una tabla de frecuencias de 6 intervalos de clase.
b. Calcular el porcentaje de objetos cuyo peso sea 21.5 gr. o ms.
c. Calcular el peso debajo del cual se encuentran el 25% de los objetos.
13. Las puntuaciones de un tes aplicado a un grupo de trabajadores de una empresa
se tabularon en una distribucin de frecuencias de 6 intervalos de igual amplitud. La
marca de clase del segundo intervalo es 25 y el lmite superior del quinto intervalo es
60, si las 4 primeras frecuencias relativas porcentuales son respectivamente de 15,
20, 35 y 14 y si el 94% de las puntuaciones son menores que 60. Elabore la tabla de
frecuencias e indique el porcentaje de trabajadores que tienen entre 38 y 53 puntos.
CAPITULO III
MEDIDAS DE TENDENCIA CENTRAL PARA
EL ANALISIS DE LOS DATOS
MEDIDAS DE CENTRALIZACIN
Las Medidas de Centralizacin o de Tendencia Central son parmetros estadsticos que
expresan en forma resumida un conjunto de datos. Estos parmetros a travs de sus
propiedades y sus definiciones hacen posible el anlisis de un conjunto de datos.
3. EL PROMEDIO O MEDIA ARITMTICA
3.1. PROMEDIO PARA DATOS ORIGINALES: Se denomina datos originales a
un conjunto de datos de cualquier variable y copiados de cualquier manera. La
frmula para su clculo es:
n
x
x
n
i
i
1
Donde x
i
: Observaciones o Datos
n: N de datos
Ejemplo: Los siguientes datos corresponde al ingreso de 8 padres de los alumnos de
ingeniera Informtica: 1200, 900, 1250, 1350, 800, , 750, 1200, 1300. Encontrar el
ingreso promedio
8
1300 1200 750 800 1350 1250 900 1200 + + + + + + +
x
75 1093. x soles
El ingreso econmico promedio de 8 padres de familia es 1093.75 soles.
3.2. PROMEDIO PARA DATOS TABULADOS
3.2.1 Promedio para datos tabulados no agrupados en intervalos
(Variable Discreta)
FORMULA:
n
n x
x
n
i
i i
1
Ejemplo: Se tomarn los datos de la tabla N 6
X
i
n
i
46 8
47 10
48 16
49 14
50 12
51 9
52 6
Total 75
Reemplazamos los valores en la frmula:
84 48
75
6 52 9 51 12 50 14 49 16 48 10 47 8 46
.
+ + + + + +
x
x x x x x x x
x
El N promedio de trabajadores por empresa es aproximadamente 49
3.2.2. Promedio para datos tabulados agrupados en intervalos (Variable
Continua)
FORMULA:
n
n y
y
n
i
i i
1
y
i
: Puntos medios del
intervalo
Ejemplo: Se tomarn los datos de la tabla N 7
Ingreso
Econmico
y
i
n
i
454.5 - 587.5 521 5
587.5 720.5 654 5
720.5 853.5 787 10
853.5 986.5 920 13
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
1053
1186
1319
16
8
5
Total 62
74 . 945
62
5 1319 8 1186 16 1053 13 920 10 787 5 654 5 521
+ + + + + +
y
x x x x x x x
y
El ingreso econmico promedio de los 80 padres de familia es de 950.03 soles.
3.2. LA MODA (Md)
La Moda en un conjunto de observaciones, viene a ser el valor de la
variable que se presenta con ms frecuencia en la distribucin de datos
3.2.1. MODA PARA DATOS CUANTITATIVOS:
2.1.1. Moda para Datos Originales
Ejemplo N 1: Los siguientes datos corresponde a los ingresos econmicos
de 10 padres de familia. Encontrar la moda.
970, 930, 860, 1040, 1020, 1380, 1410, 900, 1040, 1240
La moda es: Md = 1040
Ejemplo N 2: Ingresos econmicos de 8 trabajadores. Encontrar la moda.
1200, 1050, 1200, 910, 1300, 1550, 1420, 960
Estos datos no tienen moda.
Ejemplo N 3: corresponde a los pesos de 10 alumnos:
65, 54, 72, 60, 58, 54, 66, 70, 58
Md
1
= 54
Md
2
= 58
Un conjunto de datos puede tener una moda o ms de una moda o tambin no
tener ninguna moda.
3.2.2. Moda para Datos Tabulados
3.3.2.1 Moda para datos tabulados no agrupados en intervalos
(Variable Discreta)
FORMULA:
j
x Md
Donde: x
j
es el valor de la variable que corresponde a la mxima frecuencia
absoluta.
Ejemplo: Tomamos los datos de la tabla N 5
X
i
n
i
46 8
47 10
48 16
49 14
50 12
51 9
52 6
Total 75
La Moda ser el valor de la variable que corresponde a la mxima frecuencia
absoluta (n
4
=16), en este caso Md = 48
El resultado significa que es ms frecuente encontrar empresas con 48
trabajadores
3.3.2.2. Moda para datos tabulados agrupados en intervalos
(Variable Continua)
FORMULA:
1
1
]
1
+
+
) ( ) (
1 1
1
1
j j j j
j j
j
n n n n
n n
c y Md
Donde: n
j
= mxima frecuencia absoluta
n
j-1
= frecuencia absoluta anterior a n
j
n
j+1
= frecuencia absoluta posterior a n
j
y
j-1
= lmite inferior del intervalo que se encuentra en la misma fila
de n
j
c = Amplitud del intervalo
Ejemplo: Vamos a tomar los datos de la tabla N 7
Ingreso
Econmico
ni
454.5 587.5 5
587.5 720.5 5
720.5 853.5 10
853.5 986.5 13
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
16
8
5
Total 62
De acuerdo a la teora:
n
j
= 15 y
j-i
= 986.5
n
j-1
= 13 c = 133
n
j+1
= 8
Reemplazando valores en la frmula se tiene:
( ) ( )
1022
8 15 13 15
13 15
133 5 . 986
1
]
1
+
Md
Md
Los sueldos o ingresos econmicos ms frecuente de 62 trabajadores
encuentran alrededor de 1016.06 soles.
3.2.2. MODA PARA DATOS CUALITATIVOS:
La moda estar dada por la categora de la variable que corresponde a la
mxima frecuencia absoluta.
Ejemplo: Tomaremos los datos del cuadro N 1
NIVEL DE INSTRUCCIN n %
Primaria
Secundaria
Sup. No Universitaria
Sup. Universitaria
2
11
42
15
2.86
15.71
60.00
21.43
Total 70 100.00
L
i
L
s
Me
50% 50%
La mxima frecuencia es 42, por lo tanto, la moda es la categora superior no
universitaria, es decir: Md = Sup. No Universitaria.
3.3. LA MEDIANA
Es el valor que divide a la totalidad de datos, ordenados en forma creciente o
decreciente, en dos partes iguales, de tal manera que el 50% de los datos se encuentren a
la izquierda de la mediana y el otro 50% a la derecha de la mediana.
La mediana se aplica en lugar del promedio, cuando la variabilidad de los datos es muy
marcada. La mediana tambin se aplica a datos cualitativos ordenados de acuerdo a
rangos.
3.3.1. MEDIANA PARA DATOS CUANTITATIVOS:
3.3.1.1. Mediana para Datos Originales
Se presentan dos caso:
a. Cuando el N de datos es Par
Se ordenan los datos en forma creciente o decreciente y se toma el promedio
de los dos valores del centro.
Ejemplo: Los siguientes datos corresponde a las edades de 10 ingenieros:.
50, 22, 61, 30, 55, 42, 46, 35, 38,28
Ordenamos en forma creciente:
22, 28, 30, 35, 38, 42, 46, 50, 55, 61
40
2
42 38
Me
Me
El 50% de los ingenieros tienen una edad mxima de 40 aos
b. Cuando el N de datos es Impar
Ejemplo: Los siguientes datos corresponde al n de trabajadores de 9 empresas
63, 56, 94, 32, 58, 41, 90, 45, 104
Ordenamos de forma creciente
32, 41, 45, 56, 58, 63, 90, 94, 104
Se toma el valor del centro: Me = 58
El 50% de empresas tienen un nmero mximo de 58 trabajadores
3.3.1.2. Mediana para Datos Tabulados
a. Mediana para datos tabulados no agrupados en intervalos
1 Cuando
1
2
>
j
N
n
FORMULA: Me = x
j
Donde:
x
j
: Es el valor de la variable que se encuentra en la misma fila de N
j
N
j
: Frecuencia absoluta acumulada inmediatamente mayor que
2
n
N
j-1
: Frecuencia absoluta acumulada anterior a N
j
Ejemplo: Tomamos los datos de la tabla N 6
X
i
n
i
N
i
46 8 8
47 10 18
48 16 34
49 14 48
50 12 60
51 9 69
52 6 75
Total 75
Procedimiento:
1 5 37
2
75
2
.
n
2
48 Nj
3
34 1 Nj
efectivamente
1
2
>
j
N
n
4
49 Xj
Por lo tanto: Me = 49
50% de las empresas tienen como mximo 49 trabajadores.
2 Cuando
1
2
j
N
n
FORMULA:
2
1 j j
x x +
j
N
n
4
4
j
x
5
3
1
j
x
Reemplazando valores:
5 3
2
4 3
. Me
+
j
N
n
FORMULA:
1
1
]
1
)
2
1
1
1
j j
j
j
N N
N n
c y Me
Donde: y
j-1
= lmite inferior del intervalo que se encuentra en la misma fila
de N
j
c = Amplitud del intervalo
N
j
= frecuencia absoluta acumulada inmediatamente mayor que
2
n
N
j-1
= frecuencia absoluta acumulada anterior a N
j
Ejemplo: Vamos a tomar los datos de la tabla N 7
Ingreso
Econmico
ni
N
j
454.5 587.5 5 5
587.5 720.5 5 10
720.5 853.5 10 20
853.5 986.5 13 33
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
16
8
5
49
57
62
Total 62
procedimiento:
1 31
2
62
2
n
2 Nj= 33
3
20
1
j
N
efectivamente
1
2
j
N
n
4
5 853
1
.
j
Y
5 c = 133
Reemplazando valores se tiene:
04 966
20 33
20 31
133 5 853
.
.
1
]
1
+
Me
Me
El 50% de trabajadores tienen un ingreso mximo de 966.04 soles.
2 Cuando
1
2
j
N
n
FORMULA:
1
j
y Me
Ejemplo: Los siguientes datos corresponden al peso en kilos de 120 alumnos.
Peso n
i
N
i
30 33 10 10
34 37 20 30
38 41 30 60
42 45 30 90
46 49 16 106
50 53 14 120
Total 120
Procedimiento:
1 60
2
120
2
n
2
90
j
N
3
60
1
j
N
efectivamente
1
2
j
N
n
4
42
1
j
y
5 3 c
Reemplazando valores se tiene:
42 Me
El 50% de los alumnos tienen un peso mximo de 42 kilogramos.
3.3.2. MEDIANA PARA DATOS CUALITATIVOS:
Es factible obtener la mediana cuando se tiene datos cualitativos, susceptibles de
ordenarse de acuerdo a rangos o categoras.
L
i
L
s
Q
2
50%
75%
Q
1 Q
3
25%
Ejemplo: Tomaremos los datos de la tabla N 01
Nivel de Instruccin n
i
N
i
Primaria 2 16
Secundaria 11 54
Superior No Universitaria 42 72
Superior Universitaria 15 80
Total
70
Procedimiento:
1 35
2
n
2
54
j
N
3
16
1
j
N
La mediana esta dada por la categora que se encuentra en la misma fila de N
j
. Por lo
tanto, la mediana est dada por la categora Secundaria.
El 50% de los padres de familia de los estudiantes tienen un grado de instruccin
mximo de secundaria.
3.4. CUARTILES (Qi)
Son medidas de posicin que dividen a la distribucin de datos ordenados, en cuatro
partes iguales, de tal manera que:
3.4.1. CUARTILES PARA DATOS ORIGINALES
Una ves ordenados los datos tales que
n
x .... x x x
3 2 1
. El cuartil i-
simo (i = 1, 2 o 3), es el valor del dato que ocupa la posicin ) n )(
i
( 1
4
+ en el
ordenamiento.
Si la posicin resulta entera, se hace una interpolacin lineal entre los dos
valores correspondientes a las dos observaciones entre las cuales se encuentra
la fraccin.
Ejemplo N 1
Tomaremos los datos, ordenados previamente, correspondiente a los ingresos
econmicos semanales de 7 padres de familia.
200, 225, 300, 420, 450, 460, 540
x
1
x
2
x
3
x
4
x
5
x
6
x
7
- Clculo del Primer Cuartil (Q
1
): i =1, n =7
2 1 7
4
1
1
4
+ + ) )( ( ) n )(
i
( , posicin entera, luego Q
1
= x
2
= 225.
El 25% de los padres de familia, es decir 20 de ellos, tienen un ingreso
mximo de 225 soles.
- Clculo del Segundo Cuartil (Q
2
): i =2, n =7
4 1 7
4
2
1
4
+ + ) )( ( ) n )(
i
( , posicin entera, luego Q
2
= x
4
= 420.
El 50% de los padres de familia, es decir 40 de ellos, tienen un ingreso
mximo de 420 soles.
- Clculo del Tercer Cuartil (Q
3
): i =3, n =7
6 1 7
4
3
1
4
+ + ) )( ( ) n )(
i
( , posicin entera, luego Q
3
= x
6
= 460.
El 75% de los padres de familia, es decir 60 de ellos, tienen un ingreso
mximo de 460 soles.
Ejemplo N 2
Tomaremos los datos, ordenados previamente, correspondiente a los ingresos
semanales de 10 padres de familia
200, 225, 300, 420, 450, 460, 540, 550, 600, 650
x
1
x
2
x
3
x
4
x
5
x
6
x
7
x
8
x
9
x
10
- Clculo del Primer Cuartil (Q
1
): i =1, n =10
75 2 1 10
4
1
1
4
. ) )( ( ) n )(
i
( + + , posicin no entera, luego Q
1
estar entre
las observaciones x
2
y x
3
.
Estableciendo proporciones se tiene:
25 281
25 56 225
75 0 225 300 225
75 0
1
75 0
2 3 2 1
2 3
2 1
. Q
. Q
) . )( ( Q
) . )( x x ( x Q
.
x x
x Q
+
+
+
+
+
+
Q
) . )( (
) . )( x x ( x Q
El 50% de los padres de familia tienen un ingreso mximo de 455 soles.
- Clculo del Tercer Cuartil (Q
3
): i =3, n =10
25 8 1 10
4
3
1
4
. ) )( ( ) n )(
i
( + + , posicin no entera, luego Q
3
estar entre
las observaciones x
8
y x
9
.
Entonces:
5 562
5 12 550
25 0 550 600 550
25 0
2
8 9 8 3
. Q
.
) . )( (
) . )( x x ( x Q
+
+
+
El 75% de los padres de familia tienen un ingreso mximo de 562.5 soles.
3.4.2. CUARTILES PARA DATOS TABULADOS
FORMULA:
1
1
1
1
]
1
)
4
) (
1
1
1
j j
j
j i
N N
N
i n
c y Q
Donde i, tomar valores de 1 a 3, segn se trate de calcular el 1, 2 tercer
cuartil.
Ejemplo
Para la tabla N 7, calcular el primer, segundo y tercer cuartil.
- Clculo del primer cuartil (Q
1
): i = 1
Procedimiento: Es parecido al de la mediana
1
( ) ( )
5 15
4
1 62
4
.
i n
2 Nj = 20
3 Nj-1 = 10
4 yj-1 =
720.5
5 C =
133
Ingreso
Econmico
ni
Ni
454.5 587.5 5 5
587.5 720.5 5 10
720.5 853.5 10 20
853.5 986.5 13 33
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
16
8
5
49
57
62
Total 62
Reemplazando valores en la frmula:
1
1
1
1
]
1
)
4
) 1 (
1
1
1 1
j j
j
j
N N
N
n
c y Q
787
10 20
10 15
133 5 720
1
1
1
]
1
+
Q
Q .
El 25% de los trabajadores, es decir 16, tienen un ingreso mximo de 787 soles.
- Clculo del segundo cuartil (Q
2
): i = 2
1
1
1
1
]
1
)
4
) 2 (
1
1
1 2
j j
j
j
N N
N
n
c y Q
Procedimiento:
1
( ) ( )
31
4
2 62
4
i n
2 Nj = 33
3 Nj-1 = 20
4 Yj-1 = 853.5
5 C = 133
Reemplazando valores en la frmula:
04 966
20 33
20 31
133 5 853
2
2
.
.
1
]
1
+
Q
Q
El 50% de los trabajadores, es decir 31, tienen un ingreso mximo de 966.04 soles.
- Clculo del tercer cuartil (Q
3
): i = 3
1
1
1
1
]
1
)
4
) 3 (
1
1
1 3
j j
j
j
N N
N
n
c y Q
Procedimiento:
1
( ) ( )
5 46
4
3 62
4
.
i n
2 N
J
= 48
3 Nj-1 = 33
4 Yj-1 = 986.5
5 C = 133
Reemplazando valores en la frmula:
2 1106
33 48
33 5 46
133 5 986
3
3
.
.
.
1
]
1
+
Q
Q
El 75% de los trabajadores, es decir 47, tienen un ingreso mximo de 1106.2 soles.
3.5. MEDIDAS DESCRIPTIVAS DE RESUMEN UTILIZANDO CUARTILES
Llos cuantiles son tiles no slo como medidas de posicin no central; tambin sirven
para elaborar otras medidas importantes de tendencia central y dispersin.
Describiremos dos medidas basadas en los cuarteles: el Eje Medio y el Rango
intercuartlico.
3.5.1. EL EJE MEDIO:
Es el promedio de los cuarteles Q
1
y Q
3
de un conjunto de datos:
EJE MEDIO =
2
3 1
Q Q +
Para el ejemplo anterior: Eje Medio =
2
5 1092 790 . +
Eje Medio = 941.25
3.5.2. RANGO INTERCUARTILICO (R.I.)
El rango intercuartlico ( llamado tambin dispersin media) es la diferencia entre los
cuartiles Q
1
y Q
3
de un conjunto de datos.
Para el ejemplo anterior R.I. = Q
3
Q
1
R.I. = 302.50
Esta medida considera la dispersin en el 50% medio de los datos y, por ello, de
ninguna manera se ve influenciada por la posible ocurrencia de valores extremos.
3.6. DIAGRAMA DE BLOQUES Y LINEAS:
Para identificar y describir las principales caractersticas de los datos, el mtodo de
Anlisis Exploratorio de Datos utiliza medidas de tendencia central y de dispersin
que tienen la propiedad de resistencia; es decir, estadsticos que son relativamente
insensibles a cambios extremos de algunos de los datos. La mediana, el eje medio y el
rango intercuartlico son tres estadsticos resistentes de uso comn. Si se combinan
estas medidas resistentes con informacin referente a los extremos, se logra entonces
una mejor idea de la forma de la distribucin de datos. Cinco son los nmeros de
resumen:
Li , Q
1
, Mediana , Q
3
, Ls
Para los datos originales que sirvieron para el construir la tabla N 7 se tiene:
Li = 456 , Q1 = 790 , Me = 950 , Q3 = 1092.50 , Ls = 1384
El diagrama de bloques y lneas ofrece una representacin grfica de los datos a travs
de los cinco nmeros de resumen. En la siguiente figura se ilustra este diagrama.
Ingreso
1400,00
1200,00
1000,00
800,00
600,00
400,00
3.7. DECILES (Di)
Son medidas de posicin que dividen a la distribucin de datos, previamente ordenados,
en 10 partes.
El decil i simo es el valor del dato que ocupa la posicin ) n )(
i
( 1
10
+ en el
ordenamiento.
Si la posicin no resulta entera, se hace una interpolacin lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentre la posicin.
3.7.1. DECILES PARA DATOS ORIGINALES
EJEMPLO : Tomaremos los datos correspondiente al ingreso semanal,
previamente ordenados. de 9 trabajadores de una empresa
320, 330, 345, 410, 460, 580, 900, 940, 940
x
1
x
2
x
3
x
4
x
5
x
6
x
7
x
8
x
9
Calcular el Decil 2 y el Decil 6.
Decil 2 (D
2
): i = 2, n = 9
2 1 9
10
2
+ ) )( ( : Posicin entera
Por tanto el decil 2 es el dato que ocupa la segunda posicin: D
2
= 330.
El 20% de los trabajadores tienen un ingreso mximo de 330 soles.
Decil 6 (D
6
): i = 6, n = 9
6 1 9
10
6
+ ) )( ( : Posicin entera
Por tanto el decil 6 es el dato que ocupa la sexta posicin: D
6
= 580.
El 20% de los trabajadores tienen un ingreso mximo de 580 soles..
3.7.2. DECILES PARA DATOS TABULADOS
FORMULA:
1
1
1
1
]
1
)
10
) (
1
1
1
j j
j
j i
N N
N
i n
c y D
Donde i, tomar valores de 1 a 9, segn se trate del primero, segundo, hasta el
noveno decil.
Ejemplo
Para la tabla N 7, calcular el cuarto decil.
Procedimiento:
1
( ) ( )
8 24
10
4 62
10
.
i n
2 Nj = 33
3 Nj-1 = 20
4 Yj-1 = 853.5
5 C = 133
Reemplazando valores en la frmula:
1
1
1
1
]
1
)
10
) 4 (
1
1
1 4
j j
j
j
N N
N
n
c y D
61 902
20 33
20 8 24
133 5 853
4
4
.
.
.
1
]
1
+
D
D
El 40% de los trabajadores, tienen un ingreso mximo de 902.61 soles.
3.8. PERCENTILES
Para el clculo de los centiles o percentiles (Pi) se procede de manera similar y las
frmulas correspondientes son:
- Para datos originales: ) n )(
i
( 1
100
+
- Para datos tabulados:
Ingreso
Econmico
ni
Ni
454.5 587.5 5 5
587.5 720.5 5 10
720.5 853.5 10 20
853.5 986.5 13 33
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
16
8
5
48
56
62
Total 62
1
1
1
1
]
1
)
100
) (
1
1
1
j j
j
j i
N N
N
i n
c y P
3.9. TASAS DE CRECIMIENTO ( T.C.):
Sirve para encontrar el crecimiento de una cantidad de un periodo t con respecto a
un periodo t-1. Se calcula con la siguiente frmula:
T.C.= 100
1
x
Ct
Ct
Ejemplo: Calcular las tasas de creciminto para los siguientes datos, correspondiente al
N de alumnos matriculados de una universidad, durante el periodo 2005 2010
Ao N alumnos
Tasa (%)
x
i
2005 1250 -
2006 1500 20.00
2007 1850 23.33
2008 2120 14.59
2009 2430 14.62
2010 2870 18.11
3.10. LA MEDIA GEOMTRICA (MG)
Se usa cuando hay que promediar tasas de crecimiento, razones o proporciones.
3.10.1. Media geomtrica Simple:
FORMULA:
1
1
1
1
]
1
n
x log
log Anti MG
n
i
i
1
Ejemplo:
Calcular la media geomtrica para los siguientes datos, correspondiente al N
de alumnos matriculados de una universidad, durante el periodo 2000 2005.
Ao N alumnos
Tasa (%)
x
i
Log x
i
2005 1250 - -
2006 1500 20.00 1.301030
2007 1850 23.33 1.367915
2008 2120 14.59 1.164055
2009 2430 14.62 1.164947
2010 2870 18.11 1.257918
6.255865
Reemplazando en la frmula:
83 . 17
5
255865 . 6
log
1
]
1
MG
Anti MG
El incremento promedio anual de alumnos matriculados es del 17.83%.
3.10.2. Media geomtrica Ponderada:
FORMULA: 1
]
1
n
Yi n
Anti MG
i
log
log
Consideremos los datos de la tabla N 7 para ilustrar el clculo.
Ingreso
Econmico
Yi
ni
n
i
logYi
454.5 - 587.5 521 5 13.584189
587.5 720.5 654 5 14.077889
720.5 853.5 787 10 28.959747
853.5 986.5 920 13 38.529242
986.5 1119.5
1119.5 1252.5
1252.5 1385.5
1053
1186
1319
16
8
5
48.358854
24.592678
15.601224
Total 62 183.703823
Reemplazando valores en la frmula:
MG = Antilog
1
]
1
62
703823 . 183
MG = 918.26
El ingreso econmico promedio de los 62 trabajadores es de 918.26 soles.
En este caso la medida ms adecuada para el anlisis de los datos es el
Promedio.
Ejercicios
Para los ejercicios del capitulo anterior, calcular el promedio, moda ,mediana,
Cuartiles,y Media Geomtrica ponderada.
CAPITULO IV
MEDIDAS DE DISPERSION
4.1. MEDIDAS DE DISPERSION
Son medidas o parmetros estadsticos que sirven de complemento a las medidas de
centralizacin en el anlisis de los datos. Es necesario tener una idea del grado de
concentracin o dispersin de las observaciones alrededor de una medida de tendencia
central.
4.2. RECORRIDO O RANGO: (R)
Viene a ser la diferencia entre el valor mayor y el valor menor de los datos, es decir:
R = X
mx
X
mn
Ejem. Tomaremos los datos originales que dieron origen a la tabla N 7.
R = 1384 456 = 928 soles.
El recorrido a rango como estadgrafo de posicin es muy limitado, porque slo
considera los valores extremos de la distribucin de datos y no nos indican nada sobre el
comportamiento de los datos.
4.3. VARIANZA: (
2
)
Es el promedio de las desviaciones con respecto al promedio elevado al cuadrado. La
varianza no tiene interpretacin .
4.3.1. Varianza para datos originales:
n
) x x (
n
i
i
2
1 2
Ejem. Los siguientes datos corresponde a los ingresos econmicos por semana de 12
trabajadores de una empresa
Xi: 600, 650, 200, 710, 300, 550, 420, 460, 450, 540, 850, 225.
Para poder aplicar la frmula, primero debemos encontrar el promedio y luego
aplicar la frmula de la varianza.
1
n
x
x
n
i
i
1
25 496
12
5922
12
225 850 540 450 460 420 550 300 710 200 650 600
. x
x
x
+ + + + + + + + + + +
2
n
) x x (
n
i
i
2
1 2
cuadrado al Soles .
.
) . ( ...... ) . ( ) . ( ) . (
685 34929
12
22 419156
12
25 496 225 25 496 200 25 496 650 25 496 600
2
2
2 2 2 2
2
+ + + + +
4.3.2 DESVIACIN ESTANDAR:
Se define como la raz cuadrada de la varianza.
n
) x x (
n
i
i
2
1
Es uno de los estadgrafos de dispersin de mayor uso, en el cual las unidades de la
variable ya no estn elevadas al cuadrado.
En general los estadgrafos de dispersin se usan para comparar dos o ms
distribuciones de datos poblaciones. A mayor dispersin entre los valores o
elementos de una poblacin, le corresponde un valor mayor para el estadgrafo de
dispersin.
EJEMPLO: Encontrar la desviacin estndar para el caso anterior.
Soles .
.
89 186
685 34929
2
La dispersin promedio que existe entre los datos y la media aritmtica es de
186.89 soles.
4.3.3 VARIANZA PARA DATOS TABULADOS
a. Varianza para Datos Tabulados No Agrupados en Intervalos:
FORMULA:
n
n ) x x (
i
n
i
i
2
1 2
EJEMPLO: Tomaremos los datos de la tabla N 6
X
i
n
i
x
i
n
i
2
) x x (
i
i i
n ) x x (
2
x
x
n
n x
x
i i
Reemplazando valores de la tabla se tiene:
04 3
75
08 228
2
2
.
.
***
Desviacin estndar:
74 1
0411 3
.
.
EJEMPLO: Consideremos los datos de la tabla N 07 para ilustrar el
clculo.
Ingreso
Econmic
o
y
i
n
i
y
i
n
i
i i
n ) y y (
2
Desviacin estndar:
-
Soles 41 . 217
83662 . 47268
La variacin promedio que existe entre los ingresos econmicos de los trabajadores
con respecto al ingreso promedio (945.74 soles) es de 217.41 Soles.
4.3.4. PROPIEDADES DE LA VARIANZA
a. La varianza de una constante es cero:
V ( K ) = 0
b. La varianza del producto de una constante por una variable, es igual :
V ( K.X ) = K
2
X
c. La varianza de la suma de una variable ms una constante, es igual a la varianza de
la variable: V ( X + K ) = V(X)
4.3.5. COEFICIENTE DE VARIACIN (C.V)
Es una medida de variabilidad relativa que se utiliza para comparar dos o mas
distribuciones de datos cuando las unidades de medida de las variables estn
expresadas en diferentes unidades a escalas de medida, por ejemplo los sueldos
expresados en soles y dlares.
Si comparamos dos distribuciones, ser ms homognea, la que presente menor
coeficiente de variacin.
FORMULA:
100 *
y
V . C
V C
V C
Los ingresos de los trabajadores tienen una dispersin relativa de 23.37 %.
4.3.6. MEDIDAS DE ASIMETRIA
COEFICIENTES DE ASIMETRA (As)
Miden el grado de deformacin horizontal de la distribucin de frecuencias.
Indices de Asimetra de Pearson (As). Se definen:
) Me y (
As
3
Md y
As
El primero es el ms usual.
Interpretacin
1. Si la distribucin es Simtrica, entonces As = 0, en este caso coinciden
Md Me y .
2. Si la distribucin es Asimtrica Positiva sesgada a la derecha si: As > 0.
3. Si la distribucin es Asimtrica Negativa sesgada a la izquierda si: As < 0.
EJEMPLO: Tomando los datos de la tabla N 7 correspondiente a los ingresos
econmicos de los trabajadores de 62 empresas.
22 0
06 222
04 966 0323 950 3
.
.
) . . ( *
As
As
Los ingresos tienen una distribucin asimtrica positiva
4.3.7. ESTADIGRAFOS DE APUNTAMIENTO O KURTUOSIS
La kurtuosis viene a ser el grado de apuntamiento de una distribucin.
a. Si una distribucin tiene una elevada punta o apuntamiento, se llama Leptokrtica.
b. Si la distribucin se asemeja a una distribucin normal se llama Mesocrtica
c. Si la distribucin es aplanada se denomina Platikrtica.
El estadgrafo para analizar el apuntamiento es:
Coeficiente de Kurtuosis: a =
4
4
m
Donde
4
= (
2
)
2
m
4 =
( )
n
n Y Y
i i
4
-
Si a = 3 : La distribucin es Mesokrtica ( Normal).
- Si a > 3 : La distribucin es Leptokrtica ( apuntada)
- Si a < 3 : La distribucin es Platikrtica ( aplanada )
Ejem. Para los datos de la tabla N 6
M
4
= 19.45254
4
= 9.2416
Reemplazando valores: a =
2416 9
45254 19
.
.
a = 2.10
Como a = 2.10 es menor que 3, la distribucin es platikrtica (aplanada).
Ejercicios.
Para las tablas de frecuencias del capitulo II calcular: La varianza, la desviacin
estndar, el coeficiente de variacin, el apuntamiento y la asimetra.
CAPITULO V
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
5.1 Generalidades
Cuando en un trabajo de investigacin se observa simultneamente dos
variables en cada elemento de anlisis, entonces estamos en el campo
de las estadsticas bidimensionales, cuya agrupacin, da origen a las
distribuciones de frecuencias bidimensionales.
En el caso bidimensional puede darse el caso de que se tenga:
1. Las dos variables discretas
2. Una variable discreta y la otra continua
3. Las dos variables continuas.
5.2.DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES DE
VARIABLE DISCRETA
Una tabla bidimensional de frecuencias se construye colocando en el margen
izquierdo los distintos valores de X y en el margen superior los distintos valores de
Y, generndose una tabla de p filas y q columnas.
5.2.1. Frecuencias Marginales
Las frecuencias marginales de la variable X, se obtiene sumando las frecuencias
absolutas que figuran en cada fila ( lnea horizontal)
n
i. =
q
j
ij
n
1
Las frecuencias marginales de la variable Y, se obtiene sumando las frecuencias
absolutas que figuran en cada columna ( lnea vertical)
n
.j
=
p
i
ij
n
1
Ejem. Los siguientes datos corresponde al nmero de computadoras (X) y al
nmero de Ing. Informticos (Y) de 60 empresas tomada de la ciudad de chiclayo:
X 7 6 4 6 7 4 7 5 6 4 6 7 3 7 6 5 6 4 7 5 7 6 3 7 5 5 7 6 4 6 7 5
Y 4 4 2 3 3 1 4 3 5 3 3 3 1 2 2 2 4 2 6 3 3 3 2 6 4 3 4 4 3 2 5 3
X 6 4 6 6 5 5 7 6 7 5 6 7 6 7 7 7 7 6 5 7 7 3 7 7 6 4 7 6
Y 3 1 5 4 4 2 4 3 5 3 5 5 3 4 5 6 6 3 3 5 6 2 5 6 5 2 6 6
1. Elabore tablas de frecuencias absolutas bidimensionales para analizar los datos e
interprete las tablas.
2. Encuentre el promedio y la varianza para la variable X y Y
TABLA N 8
Distribucin de Frecuentas Absolutas Bidimensionales (nij) de 60 empresas por
nmero de computadoras (X) segn nmero de Ing. Informticos (Y) por empresa
X : computadoras
Y : Ing. Informticos
Y
X 1 2 3 4 5 6
n
i
.
3 1 2 - - - - 3
4 2 3 2 - - - 7
5 - 2 6 2 - - 10
6 2 7 4 4 1 18
7 1 3 5 6 7 22
n.
j
3 10 18 11 10 8 60
n
i.
= Frecuencias marginales de la variable X
n.
j
= Frecuencias marginales de la variable Y
INTERPRETACIN:
n
23
= 2: 2 empresas tienen 4 computadoras y 3 Ing. Informticos
n
45
= 4 : 4 empresas tienen 6 computadoras y 5 Ing. Informticos
Frecuencias Marginales:
- De la variable X
n
2.
= 7 : 7 empresas tienen 4 computadoras
n
4.
= 18 : 18 empresas tienen 6 computadoras
- De la variable Y
n.
3
= 18: 18 empresas tienen 3 Ing. Informticos
n.
5
= 10: 10 empresas tienen 5 Ing. Informticos
TABLA N 9
Distribucin de Frecuentas Relativas Bidimensionales (hij) de 60 empresas por
nmero de computadoras (X) segn nmero de Ingenieros Informticos (Y) por
empresa
Y
X 1 2 3 4 5 6
h
i
.
3 0.02 0.03 - - - - 0.05
4 0.03 0.05 0.03 - - - 0.11
5 - 0.03 0.10 0.03 - - 0.16
6 - 0.03 0.12 0.07 0.07 0.02 0.31
7 - 0.02 0.05 0.08 0.10 0.12 0.37
h.
j
0.05 0.16 0.30 0.18 0.17 0.14 1.00
Interpretacin:
h
23
= 0.03 : El 0.08 por uno de empresas tienen 4 computadoras y 3 Ing. Informticos
h
45
= 0.07: El 0.07 por uno de empresas tienen 6 computadoras y 5 Ing. informticos
Frecuencias Relativas Marginales:
- De la variable X:
h
2.
= 0.11: El 0.11 por uno de empresas tienen 4 computadoras
h
4.
= 0.31: El 0.31 por uno de empresas tienen 6 computadoras
- De la variable Y:
h.
3
= 0.30 :El 0.30 por uno de empresas tienen 3 Ing. Informticos
h.
5
= 0.17: En el 0.17 por uno de empresas tienen 5 Ing. Informticos
TABLA N 10
Distribucin de Frecuentas Absolutas Bidimensionales Acumuladas (Nij) de 60
empresas por nmero de computadoras (X) segn nmero de ingenieros (Y) por
empresa
Interpretacin:
N
23
= 10: 10 empresas tienen de 3 a 4 computadoras y de 1 a 3 Ing. Informticos
N
35
= 20: 20 empresas tienen de 3 a 5 computadoras y de 1 a 5 Ing. Informticos
Y
X 1 2 3 4 5 6
3 1 5 5 5 5 5
4 3 8 10 10 10 10
5 3 10 18 20 20 20
6 3 12 27 31 35 36
7 3 13 31 42 52 60
TABLA N 11
Distribucin de Frecuentas Relativas Bidimensionales Acumuladas (Hij) de 60
empresas por nmero de computadoras (X) segn nmero de Ingenieros
Informticos (Y) por empresa
Interpretacin :
H
25
= 0.16: El 0.16 por uno de empresas tienen de 3 a 4 computadoras y de 1 a 5
ingenieros informticos
H
34
= 0.32: El 0.32 por uno de empresas tienen de 3 a 5 computadoras y de 1 a 4 ing.
Informticos
Y
X 1 2 3 4 5 6
3 0.02 0.08 0.08 0.08 0.08 0.08
4 0.05 0.13 0.16 0.16 0.16 0.16
5 0.05 0.16 0.29 0.32 0.32 0.32
6 0.05 0.19 0.44 0.54 0.61 0.63
7 0.05 0.21 0.51 0.69 0.86 1.00
TABLA N 12
Distribucin de Frecuentas Relativas Bidimensionales Porcentuales (hijx100) de 60
empresas (X) segn nmero de Ing. Informticos (Y) por empresa
Y
X 1 2 3 4 5 6
h
i
.
3 2 3 - - - - 5
4 3 5 3 - - - 11
5 - 3 10 3 - - 16
6 - 3 12 7 7 2 31
7 - 2 5 8 10 12 37
h.
j
5 16 30 18 17 14 100
Interpretacin:
h
34
= 3: El 3% de empresas tienen 5 computadoras y cuatro ingenieros informticos
h
45
= 7: El 7% de empresas 6 computadoras y 5 ingenieros informticos
TABLA N 13
Distribucin de Frecuentas Relativas Bidimensionales Porcentuales Acumuladas
(Hijx100) de 60 empresas segn Numero de computadoras (X)y nmero de Ing.
Informticos ( Y) empresa
Y
X 1 2 3 4 5 6
3 2 8 8 8 -
4 5 13 16 16 -
5 5 16 29 32 -
6 5 19 44 54 0.61 0.63
7 5 21 51 69 0.86 1.00
Interpretacin:
H
22
x100 = 13: El 13% de empresas tienen de 3 a 4 computadoras y de uno a dos ing.
Informtico.
H
43
x100 = 44: El44 % de empresas tienen de 3 a 6 computadoras y de uno a tres Ing.
Informticos
2. Calculo del promedio
a. PARA X
1
: 82 5
60
22 7 18 6 10 5 7 4 3 3
1
.
..
.
+ + + +
x x x x x
n
n x
x
i i
82 5. x
El nmero promedio de computadoras por empresa es de aproximadamente 6
PARA Y: 65 3
60
8 6 10 5 11 4 18 3 10 2 3 1
.
..
.
+ + + + +
x x x x x x
n
n y
y
j j
65 3. y
El nmero promedio de ing. Informticos por empresa es de aproximadamente 4
CALCULO DE LA VARIANZA
a. PARA X :
..
) (
.
n
n x x
i i
2
2
1
Reemplazando valores:
+ + + +
60
22 82 5 7 18 82 5 6 10 82 5 5 7 82 5 4 3 82 5 3
2 2 2 2 2
2
1
x x x x x ) . ( ) . ( ) . ( ) . ( ) . (
19 1
42 1
60
98 84
60
63 30 58 0 72 6 19 23 86 23
1
2
1
2
1
.
.
. . . . . .
+ + + + +
b. PARA Y:
..
) (
.
n
n y y
j j
2
2 2
2
Reemplazando valores:
41 1
99 1
60
8 65 3 6 10 65 3 5 11 65 3 4 18 65 3 3 10 65 3 2 3 65 3 1
2
2
2
2 2 2 2 2 2
2
2
.
.
) . ( ) . ( ) . ( ) . ( ) . ( ) . (
+ + + + +
x x x x x x
5.3. DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES DE VARIABLE
CONTINUA Y VARIABLE DISCRETA
Las variables bidimensionales (X,Y) conservan la misma nomenclatura y las tablas
tienen la misma forma.
Ejem. Los siguientes datos corresponde al ingreso mensual (X) y al N de hijos (Y)
De 60 trabajadores de una empresa:
X 1095 1060 1450 1520 1320 1580 1600 1080 1150 1200 1190 1475
Y 5 3 3 2 3 3 1 4 3 4 3 2
X 1515 1100 1420 1580 1280 1200 1550 1170 1800 1020 1525 1435
Y 3 4 3 2 4 3 2 4 1 4 6 2
X 932 1180 1365 932 1415 1553 1225 1650 1181 932 1429 1300 1030
Y 3 5 4 2 5 4 4 1 5 6 5 3 6
X 1620 1485 1305 1425 1390 1450 1380 1700 1515 1200 1320 1650 1650
Y 2 5 4 6 4 2 6 2 5 3 6 2 3
X 1380 1540 1120 1305 1750 1300 1250 1415 1670 1380
Y 3 3 4 5 2 4 3 4 2 3
1. Construir tablas de frecuencias bidimensionales, utilice intervalos cerrados,
interprete los datos
2. Calcular el promedio y la varianza para la variable X y Y
Solucin:
Variable Ingresos X:
Ls = 1800 -
Li = 932
R = 868
m = 2.5
4
60
m = 7
C = R/m
C = 868/7
C = 124
Variable N de hijos: Li = 1, Ls = 6
Tabla N 14
Distribucin de frecuencias absolutas bidimensionales (nij) de ingresos
econmicos (X) y Nmero de hijos (Y) de 60 trabajadores de una empresa
Yi 1 2 3 4 5 6 ni.
[X
i
-
1
X
i
] Xi
932 -
1056
994 1 1 1 - 2 5
1057 -
1180
1118.
5
- - 2 4 2 - 8
1181 -
1304
1242. - - 5 4 1 10
1305 -
1428
1366.
5
- - 4 4 2 3 13
1429 -
1552
1490.
5
- 5 3 - 3 1 12
1553 -
1676
1614.
5
2 4 2 1 - - 9
1677 -
1800
1738.
5
1 2 3
n.j 3 12 17 14 8 6 60
n
52
= 5 : 5 trabajadores tienen un ingreso de 1429 a 1552 soles y tienen 2 hijos por
trabajador.
n
4
. = 13: 13 trabajadores tienen un ingreso de 1305 a 1428 soles
n.5 = 8 : 8 trabajadores tienen 5 hijos cada uno
n
3
. = 10 Vrs. Y
3
= 1242: 10 trabajadores tienen un ingreso promedio de 1242 soles.
El resto de tablas de frecuencias bidimensionales se construyen de manera similar a las
tablas anteriores.
2. Variable X:
a. Promedio:
X
=
..
.
n
n X
i
n
i
i
1
60
3 5 1738 9 5 1614 12 5 1490 13 5 1366 10 1242 8 5 1118 5 994 x x x x x x x
X
. . . . . + + + + + +
24 1362. X
El ingreso promedio mensual de los 60 trabajadores de la empresa es 1362.24 soles
b. Varianza:
( )
n
n X X
n
i
i i
1
2
2
.
( ) ( ) ( )
60
3 24 1362 5 1738 8 24 1362 5 1118 5 24 1362 994
2 2 2
2
x x x . . ........ . . . + + +
80 41548
2
.
= 203.84
La variacin promedio que existe entre los ingresos de los trabajadores con respecto al
ingreso promedio es de 203.84 soles.
5.4. EJERCICIOS:
1. Los siguientes datos corresponde la edad y al nmero de hijos de 50 padres:
Edad: 34 33 44 40 33 50 32 44 36 43 38 39 42 39 31 28 28 21 44
Hijos 3 2 5 4 3 6 3 4 3 5 3 2 4 5 3 2 2 1 5
Edad: 46 32 46 34 30 34 42 39 48 36 32 39 30 45 26 40 38 47 36 60
Hijos 6 2 6 3 2 3 4 3 5 3 2 3 2 3 2 3 2 5 4 6
Edad: 40 45 33 32 45 28 25 35 48 40 30
Hijos: 3 2 2 3 4 2 2 3 4 3 2
Construya tablas bidimensionales para analizar los datos.
2. Encuentre el promedio y la varianza para cada una de las variables del problema
anterior.
3. Los siguientes datos corresponde a los ingresos econmicos mensuales de 52
trabajadores de una empresa y a los aos de servicio:
Ingresos: 750 693 789 890 1240 945 1320 1200 1350 780 865 946 1050 830
Aos de 4 3 4 4 6 5 8 6 7 4 5 6 6 5
Servicio
Ingresos : 1560 1450 1000 1230 1500 1680 984 960 1380 1400 1600 1284
Aos de : 10 12 10 14 12 16 10 9 13 20 18 14
Ingresos : 1320 1245 965 845 760 896 1300 840 730 645 798 1620 1740 840
Aos de : 15 17 12 14 11 10 18 9 8 4 6 22 24 8
Servicio
Ingresos : 1350 1000 1120 1040 1080 1600 1750 1800 960 830 977 1120
Aos de 16 10 14 12 11 22 20 28 20 12 14 15
Servicio
Construir tablas de frecuencias bidimensionales para analizar los datos.
4. Para la tabla de frecuencias absolutas bidimensionales del problema anterior, calcular
el promedio , la varianza y la desviacin estndar.
CAPITULO VI :
PROBABILIDADES
6.1. Experimento aleatorio: Es aquel cuyos resultados dependen del azar.
6.2. Punto muestral: Viene a ser cada uno de los resultados de un
experimento.
Ejem. Cuando se lanza una moneda, existen dos puntos maestrales: cara, sello.
6.3. Espacio muestral (S): Viene a ser todos los resultados posibles de un
experimento.
Ejem. Si se arroja una moneda: S = { C, S }
Ejem. Si arrojamos dos monedas: S = { CC, CS, SC, SS }
Ejem. Si arrojamos un dado: S = { 1, 2, 3, 4, 5, 6 }
6.4. Suceso o evento: Viene a ser un subconjunto del espacio muestral y
-puede ser
Simple o compuesto.
6.4.1. Evento Simple: Es aquel que consta de un solo punto muestral.
6.4.2. Evento compuesto: Es aquel que consta de dos o ms puntos maestrales.
Ejem. Si arrojamos un dado: S = { 1, 2, 3, 4, 5, 6 }
Sucesos o eventos simples: E
1
= {1} E
2
= {2} E
3
= {5}
Sucesos o eventos compuestos: E
1
= {1, 3}; E
2
= {1, 4, 5}
A los sucesos o eventos se les puede simbolizar con cualquier letra.
6.5. Sucesos mutuamente excluyentes: Dos sucesos A y B son mutuamente
excluyentes si: AWB = . Ejem. A = {1, 3, 5}; B = {2, 4, 6}, entonces c se
puede ver, la interseccin es igual al conjunto nulo o vaco
6.6. Sucesos complementarios: Dos sucesos son complementarios, cuando
la ocurrencia de uno implica la no ocurrencia del otro.
Ejem. Si arrojamos un dado: S = {1, 2, 3, 4, 5, 6}.
y tenemos los eventos E = { 1 , 2, 3, 4 } y E = { 5, 6 }, entonces estos
eventos son complementarios.
6.7. Definicin de probabilidad: Si un experimento puede ocurrir en n
posibles resultados mutuamente excluyentes y si m de estos resultados
constituyen el evento E, entonces, la probabilidad del evento E esta dado por: P
(E) = m/n.
La probabilidad del complemento del evento esta dado por:
P (E) = 1 P (E)
Ejem. Si arrojamos un dado: S = {1, 2, 3, 4, 5, 6} y sea los eventos:
E
1
= {1, 2}, entonces P (E
1
) = 2/ 6 = 0.5
E
2
= {3, 4, 5, 6}, entonces P (E2) = 4/6 = 0.67.
Ejem. Se tiene 6 Ing Informticos , 8 ing. Civiles y 2 ing. Industriales
a. Cul es la probabilidad de elegir un ing. Informtico?
b. Cul es la probabilidad de elegir un Ing. Civil?
c. Cul es la probabilidad de elegir un Ing. Informtico
Solucin:
a. P (H) = 6/16 = 0.38
b. P ( A ) = 8/ 16 = 050
c. P ( V ) = 2/16 = 0.13
6.8. Definicin: Sea S un espacio muestral y sea E un evento cualquiera,
perteneciente al espacio muestral S, entonces se cumple que:
a. 0 P ( E ) 1
b. P ( S ) = 1
La parte a, significa que toda probabilidad de un evento siempre vara entre cero
y uno.
La parte b, significa que siempre la probabilidad de un espacio muestral es igual
a la unidad
6.9. Reglas de Probabilidad:
a. Regla de la Adicin o de la Suma: Sean A y B dos eventos pertenecientes al
espacio muestral S , entonces se cumple que :
P(AUB) = P(A) + P(B) P(AWB)
Ejem. Se tiene 5 ing. Informticos, 7 ing. Civiles y 2 ing. que tienen ambos
ttulos. Se elige un ing. Cul es la probabilidad de que el ing. elegido sea
Informtico o civil?
Solucin: Con una letra simbolizaremos a los eventos:
Ing. Infrmaticos: I , Ing. Civiles: C , entonces aplicamos la regla:
P(I U C) = P(I) + P(C) P(IWC)
P(G U F) = 5/14 + 7/14 2/14 = 10/14 = 0.71
Ejem. En la Facultad de Ingeniera de una universidad se tiene 20 Ingenieros:
14 son Ing. Informticos de los cuales 11 tienen grado de maestra y 3 tienen
doctorado . 6 son Ing. Industriales, de los cuales 4 tienen grado de maestra y
2 tienen doctorado. Se elige un Ing. al azar Cual es la probabilidad de que el
ing. elegido sea Ing. Informtico o que tenga grado de maestra?
Solucin: Los datos vamos a colocar en una tabla de dos entradas puesto que
en el problema tenemos dos variables (especialidad y grado acadmico ).
Luego con una letra vamos a simbolizar a los eventos.
Especialidad
Grado Acadmico
TOTAL
Maestra
(C)
Doctorado
(D)
Ing. Infrmtico
(A)
11 3 14
Ing. Industrial
(B)
4 2 6
TOTAL
15 5 20
P(A U C) = P(A) + P(C) P(AWC)
P( AUB ) = 14/20 + 15/20 11/20 = 18/20 = 0.90
b. Regla de la Adicin para sucesos independientes: Sean A y B dos eventos
independientes pertenecientes al espacio muestral S, entonces se cumple que:
P(AUB) = P(A) + P(B).
Ejem. En el aula A de una universidad se tiene 18 alumnos varones y 8 alumnas
mujeres. Se elige un alumno cual es la probabilidad de que el alumno elegido sea
hombre o mujer?.
Solucin:
Sea H alumnos hombres y M alumnas mujeres, entonces: P(HUM) = P(H) + P (M) ,
reemplazando valores:
P(HUM) = 18/26 + 8/26 = 1.
c. Regla de la Probabilidad Condicional
Sean A y B dos eventos pertenecientes al espacio muestral S , con P(B) > 0 ,
entonces se cumple que: P(A/B) = P(AWB)/ P(B).
Ejem. Tomaremos los datos de la tabla anterior. Cul es la probabilidad de que el
profesional elegido sea Ing. Industrial dado que tenga grado de doctor?
P(B/D) = P(BWD)/P(D) =
20 5
20 2
/
/
= 2/5 = 0.40
d. Regla de la multiplicacin:
Sean A y B dos eventos pertenecientes al espacio muestral S , entonces se cumple
que : P(AWB) = P(A) P(B/A).
Ejem. En un curso de programacin, 22 alumnos aprobaron el curso y 10
desaprobaron. Se extraen dos alumnos, uno tras otro y sin reposicin Cul es la
probabilidad de que el primer alumno elegido y el segundo hayan aprobado el curso:
Sea A , alumnos aprobados y sea D, alumnos desaprobados, entonces
P(A1WA2) = P(A1) P(A2/A1), remplazando valores se tiene:
P(VWH) = 22/32* 21/31 = 462/992 = 0.47
e. Regla de la multiplicacin para sucesos independientes
Sean A y B dos sucesos independientes pertenecientes al espacio muestral S,
entonces se cumple que : P(AWB) = P(A) P(B)
Ejem Se tiene dos grupos de alumnos, A y B que llevan el curso de matemticas. En
el grupo A se tiene 32 alumnos aprobados y 10 desaprobados. En el grupo B se tiene
36 alumnos aprobados y 8 desaprobados . Se extrae un alumno del grupo A y luego
un alumno del grupo B . Cual es la probabilidad de que el primer alumno elegido haya
sido un aprobado y el segundo un desaprobado.
Solucin:
Sea a , alumnos aprobados y sea d, desaprobados, entonces P(aWd) = 32/40* 8/44 =
256/1760 = 0.15.
f. Regla de Bayes
Sean A1, A2, A3, ., An , n eventos pertenecientes al espacio muestral Sy sea B
un evento cualquiera, con P(B) > 0, entonces se cumple que :
( )
( )
,
_
,
_
,
_
n
i
Ai
B
P Ai P
Ai
B
P Ai P
B
Ai
P
1
Ejem. En una empresa A se tiene 10 obreros , 18 empleados y 5 ejecutivos. En la sala
B , se tiene 13 obreros ,25 empleados y 4 ejecutivos. En la empresa C, se tiene 8
obreros, 14 empleados y 3 ejecutivos Se elige una empresa y se extrae un trabajador, el
mismo que resulto que era empleado. Cual es la probabilidad de que el trabajador
elegido proceda de la empresa:
a. A
b. B
c. C
Solucin
Simbolizaremos con O, a los obreros; con E, a los empleados y con Ej. a los
ejecutivos. Ahora aplicamos la frmula:
a)
( )
( ) ( )
) / ( ) ( ) / ( ) ( ) / ( ) (
/
C E P C P B E P B P A E P A P
A E P A P
E
A
P
+ +
( ) 32 0
75
14
126
25
99
18
99
18
25
14
3
1
42
25
3
1
33
18
3
1
33
18
3
1
.
+ +
,
_
,
_
+
,
_
,
_
+
,
_
,
_
,
_
,
_
E
A
P
b)
( )
( ) ( )
) / ( ) ( ) / ( ) ( ) / ( ) (
/
C E P C P B E P B P A E P A P
B E P B P
E
B
P
+ +
( ) 35 0
75
14
126
25
99
18
84
25
25
14
3
1
42
25
3
1
33
18
3
1
42
25
3
1
.
+ +
,
_
,
_
+
,
_
,
_
+
,
_
,
_
,
_
,
_
E
B
P
c)
( )
( ) ( )
) / ( ) ( ) / ( ) ( ) / ( ) (
/
C E P C P B E P B P A E P A P
C E P C P
E
C
P
+ +
( ) 33 0
75
14
126
25
99
18
108
14
25
14
3
1
42
25
3
1
33
18
3
1
25
14
3
1
.
+ +
,
_
,
_
+
,
_
,
_
+
,
_
,
_
,
_
,
_
E
C
P
6.10. EJERCICIOS
1. Construir el espacio muestral para los siguientes experimentos:
a. Cuatro electores elegidos al azar deben expresar su opinin favorable o
contraria a un determinado proyecto.
b. Un experimento consiste en seleccionar tres libros de un proceso de
elaboracin y observar si son defectuosos o no.
c. Se lanzan dos dados
d. Se lanzan cuatro monedas.
2. Con respecto a los electores del problema N 1 (a),cual es la probabilidad de
obtener:
a. Exactamente 3 electores con opiniones favorables sobre el proyecto.
b. A lo mas dos electores con opiniones favorables sobre el proyecto.
2. Se realizo una evaluacin de su estado nutricional de 56 alumnos de un centro
educativo , obtenindose los siguientes resultados: El estado nutricional de 20
alumnos fue normal, de los cuales 6 tuvieron una edad de 6 a 7 aos y 8 de 8 a 9
aos. 17 presentaron desnutricin leve, de los cuales 4 presentaron edades de 10
a 11 aos y 7 de 8 a 9 aos. 12 presentaron desnutricin moderada, de los cuales
5 presentaron edades de 6 a 7 aos y 3 de 10 a 11 aos. 7 presentaron
desnutricin severa, de los cuales 3 presento edades de 6 a 7 aos y 2 de 8 a 9
aos. Se elige un alumno, cual es la probabilidad de que:
a. Presente desnutricin leve o que tenga una edad de 6 a 7 aos.
b. Presente desnutricin severa y que tenga una edad de 8 a 9 aos.
c. Presente desnutricin moderada dado que tenga una edad de 10 a 11
aos.
3. Se lanzan dos dados, cual es la probabilidad de que:
a. La suma que aparece sobre los dados sea un nmero par.
b. El primer resultado sea un nmero menor que 3 y el segundo un nmero
impar.
4. El centro educativo 1021, cuenta con 10 profesores de fsica y 08 de qumica. El
centro educativo 1130, cuenta con 14 profesores de fsica y 6 de qumica. Se
traslada un docente del C.E. N 1021 al centro educativo N 1130 y luego se
extraen 2 docentes de este centro educativo, uno tras otro y sin reposicin. Cul
es la probabilidad de que:
a. El primer docente extrado sea de fsica y el segundo tambin.
b. El primer docente extrado sea de la especialidad de fsica y el segundo
de ciencias qumicas.
5. En un aula A hay 16 alumnos de la especialidad de primaria, 12 de secundaria y
7 de inicial. En el aula B, 14 son de la especialidad de primaria, 8 de secundaria
y 5 de inicial. En el aula C, 20 son de la especialidad de primaria, 12 de
secundaria y 8
de inicial. Se elige un aula y se extrae un alumno, el mismo que fue de la
especialidad de secundaria. Cul es la probabilidad de que provenga:
a. Del aula A.
b. Del aula B.
c. Del aula C.
6. En el aula A estudian, 25 alumnos hombres y 16 mujeres. En el aula B estudian
35
Hombres y 26 mujeres. Se elige al azar una aula y se extrae un alumno. Cul es
la probabilidad de que el alumno elegido sea hombre.
7. La probabilidad de que a lo mas 20 alumnos aprueben el curso de estadstica
Aplicada es 0.35. Cual es la probabilidad de que aprueben el curso ms de 20
alumnos.
8. Se lanza un dado normal. Se gana 30 dlares si el resultado es un nmero par o
Divisible por 3. Cul es la probabilidad de ganar?...
9. Se lanza un dado normal. Dado que el resultado es un nmero impar. Cul es la
probabilidad de que sea mayor que 3?.
10. Una urna A contiene 18 libros buenos y 2 con fallas. Una urna B, contiene 24
libros buenos y 4 con fallas. Se elige una urna y se extrae un libro. Si el
libro elegido es bueno se recibe un premio de 30 dlares. Cul es la probabilidad
de ganar el premio?.
11. Se tiene 4 aulas, en el aula N 1, se tiene 22 alumnos aprobados y 8
desaprobados en
un curso de matemticas. En el aula N 2, se tiene 18 alumnos aprobados y 6
desaprobados. En el aula N 3 , se tiene 15 alumnos aprobados y 10
desaprobados. En el aula N 4, se tiene 26 aprobados y 15 desaprobados. Se
elige una aula y se extrae un alumno, el mismo que result ser un aprobado.
Cul es la probabilidad de que el alumno provenga:
a. Del aula N 1.
b. Del aula N 2.
c. Del aula N 3.
CAPITULO VII
DISTRIBUCIONES DE PROBABILIDAD
7.1. DISTRIBUCIN BINOMIAL
Es una distribucin de variable discreta que trata de una serie de pruebas
repetidas e independientes y donde a cada resultado se le puede clasificar
(arbitrariamente) en dos categoras mutuamente excluyentes: xitos y fracasos,
como por ejemplo macho o hembra, alivio o enfermedad.
A la probabilidad de xito se representa como p y a la probabilidad de fracaso
como q, de tal manera que p + q = 1
La funcin de probabilidad es la siguiente:
x n x
q p
x n x
n
x f
)! ( !
!
) (
Promedio: = np
Varianza :
2
= npq
Ejemplo 1. Una familia tiene 8 hijos Cul es la probabilidad de que la familia
tenga:
a. Exactamente 5 hijos varones
b. Por lo menos 6 hijos varones
c. A lo mas 2 hijos varones
SOLUCIN
N = 8
S = { } M H, (Espacio muestral de acuerdo al sexo)
Entonces:
P(H)= 5 0 2 1
2
1
. / p
P(M)= 5 0 2 1
2
1
. / p
a) X = 5
Reemplazando valores:
5 8 5
5 0 5 0
5 8 5
8
) . ( ) . (
)! ( !
!
) (x f
5 8 5
5 0 5 0
3 5
5 6 7 8
) . ( ) . (
! !
* * *
) (x f
) . )( . ( ) ( 125 0 03125 0 56 x f
22 0. ) ( x f
b) X = 6, 7, 8
8 8 8 7 8 7 5 8 5
5 0 5 0
8 8 8
8
5 0 5 0
7 8 7
8
5 0 5 0
6 8 6
8
) . ( ) . (
)! ( !
!
) . ( ) . (
)! ( !
!
) . ( ) . (
)! ( !
!
) (x f
0039 0 03 0 22 0 . . . ) ( + + x f
2539 0. ) ( x f
c) X = 0, 1, 2
2 8 2 1 8 1 0 8 0
5 0 5 0
2 8 2
8
5 0 5 0
1 8 1
8
5 0 5 0
0 8 0
8
) . ( ) . (
)! ( !
!
) . ( ) . (
)! ( !
!
) . ( ) . (
)! ( !
!
) (x f
1092 0 0313 0 0039 0 . . . ) ( + + x f
1444 0. ) ( x f
Ejemplo 2. El 20% de los alumnos que llevan un curso de matemticas estn
desaprobados. Se elige una muestra de 12 alumnos. Cual es la probabilidad de
que:
a) Exactamente 3 alumnos estn desaprobados
b) Por lo menos 10 alumnos estn desaprobados
c) A lo ms 1 alumno haya sido desaprobado
SOLUCIN
p = 20% = 0.20
alumnos desaprobados
q = 80% = 0.80
alumnos aprobados
n = 12
a) x = 3
3 12 3
80 0 20 0
3 12 3
12
) . ( ) . (
)! ( !
!
) (x f
24 0. ) ( x f
b) x = 10, 11, 12
12 12 12 11 12 11 10 12 10
80 0 20 0
12 12 12
12
80 0 20 0
11 12 11
12
80 0 20 0
10 12 10
12
) . ( ) . (
)! ( !
!
) . ( ) . (
)! ( !
!
) . ( ) . (
)! ( !
!
) (x f
206158 0 068719 0 . . ) ( + x f
2749 0. ) ( x f
7.2. DISTRIBUCIN DE POISSON
Es una distribucin discreta, donde la ocurrencia de los eventos son
independientes. Esta distribucin se emplea cuando recuentan los eventos o
cantidades, distribuidas al azar en espacio o tiempo.
Si X es el nmero de ocurrencias de algn evento aleatorio en un intervalo de
espacio o tiempo (o algn volumen de materia), la probabilidad de que X ocurra
esta dada por:
!
) (
x
e
x f
x
, x = 0, 1, 2, 3
Donde:
= es el N promedio de ocurrencias del evento aleatorio dentro del intervalo
de espacio o tiempo (volumen)
e = 2.7183 es una constante
Media = Varianza =
EJEM. Parte de una va pavimentada por una compaa A recientemente, tuvo
en promedio, dos fallas por Km. Despus de haber sido utilizada durante 6
meses . Si esta compaa sigue pavimentando el resto de la va,
a. Cual es la probabilidad de que se presenten 3 fallas en cualquier Km. de la
va despus de haber tenido un trfico durante 6 meses?.
b. Cual es la probabilidad de que se presenten 3 o ms fallas en cualquier km de
la via?
SOLUCIN
a) 2 , x = 3
!
) (
x
e
x f
x
f (x) =
( ) ( )
!
.
3
2 7183 2
3
2
f(x) = 0.18
b)
!
) (
x
e
x f
x
2 por 0.5 cm
3
de lquido
X = 0
f (X = 0) =
1
1
]
1
!
) ( ) . (
0
6 7183 2
0 2
f (X = 0) = 0.1353
b) En 1 cm
3
4 , x = 0
f (X = 0) =
1
1
]
1
!
) ( ) . (
0
4 7183 2
0 4
f (X = 0) = 0.0183
7.3. DISTRIBUCIN NORMAL
Es una distribucin de variable continua muy utilizada en trabajo de
investigacin, fue descubierta por GAUSS. Se conoce tambin con el nombre de
Curva de GAUSS y presenta las siguientes caractersticas:
1. La mayor frecuencia se ubica en el centro
2. El promedio (u), la moda (Md) y la mediana (Me) coinciden
3. Es una curva simtrica, donde e rea o probabilidad bajo la curva es igual a 1
o al 100%
4. Los extremos de la curva se acercan al eje horizontal pero no cortan a este
eje.
u
Md
Me
0.5 0.5
3
2
1
u u u < <
La funcin de probabilidad de a curva esta dada por:
2
2
2
2
1
) (
) (
u x
e x f
donde
< < x
En la ecuacin, los dos parmetros de la distribucin son, la media (u) y la desviacin
estndar (
).
y
e
son constantes con valores de 3.1416 y 2.7183 respectivamente.
Los parmetros u y
3 2 1
< <
Usando la tabla correspondiente de la distribucin normal se puede comprobar que:
El rea comprendida entre + u y u es aproximadamente 68.26% del rea
total.
El rea comprendida entre 2 2 + u y u es aproximadamente 95.4% del
rea total.
El rea comprendida entre 3 3 + u y u es aproximadamente 99.7% del
rea total.
La esperanza y la varianza de una variable aleatoria con distribucin normal es:
2
) ( ) ( x V y u x E
7.4. DISTRIBUCIN NORMAL ESTNDAR O TIPIFICADA
Esta distribucin se obtiene creando una variable aleatoria
u x
z
y haciendo u=0 y
1 , entonces:
2
2
2
1
z
e z f
) (
< < z
Para calcular el rea entre dos puntos Zo y Z
1
es necesario calcular la siguiente integral:
dz e
z Z
Z
2
2
1
0
2
1
Pero como existen tablas que proporcionan los resultados de las integraciones, no es
necesario realizar la integracin.
La tabla que utilizaremos nos da las reas bajo la curva normal a partir del centro de la
curva hacia la derecha y como la curva es simtrica para valores negativos de Z se
leern con valores positivos en la tabla correspondiente de la distribucin normal. (La
tabla se encuentra en el apndice )
Ejem.
1. a) Calcular:
) ( 2 0 Z P
Graficamos la curva y marcamos los puntos Z=0 y Z=2 y luego sombreamos
el rea comprendida entre los dos puntos.
La tabla de la distribucin normal de una probabilidad de 0.4772.
4772 0.
3 Z 2 Z 1 Z 0 Z 3 Z 2 Z 1 Z
b) Calcular:
) . . ( 58 2 25 1 Z P
0.4951 0.3944 = 0.1007
c) Calcular
) . ( 45 1 Z P
0.5 0.4265 = 0.0736
d) Calcular:
) . . ( 95 0 15 2 Z P
39342 0.
3 Z 2 Z 1 Z 0 Z 3 Z 2 Z 1 Z
4951 0.
?
4265 0.
3 Z 2 Z 1 Z 0 Z 3 Z 2 Z 1 Z
5 0.
4878 0.
3 Z 2 Z 1 Z 0 Z 3 Z 2 Z 1 Z
5 0.
0.4842 0.3289 = 1.1553
d) Calcular:
) . ( 25 2 Z P
0.5 0.4878 = 0.0122
Ejem. El coeficiente de inteligencia de un grupo de alumnos tiene aproximadamente
una distribucin normal con un puntaje promedio de 100 y una desviacin estndar
de 10.5. Encontrar:
a) La proporcin de alumnos con coeficientes de inteligencia mayores que
120
3289 0.
3 Z 2 Z 1 Z 0 Z 3 Z 2 Z 1 Z
4842 0.
b) La proporcin de alumnos con coeficientes de inteligencia menores que
115
c) La proporcin de alumnos con coeficientes de inteligencia entre 114 y
124
d) Si el N total de alumnos es 180, Cual es el nmero de alumnos que
tienen coeficiente de inteligencia entre 114 y 124?
SOLUCIN
Datos:
= 100
= 10.5
a) X = 120
Sabemos que
X
Z
Remplazando valores se tiene:
90 1
5 10
100 120
.
.
Z
Z
0.5 0.4713 = 0.0287
b) X = 115
4713 0.
3 Z 2 Z 1 Z 0 Z 3 Z 2 Z 1 Z
0.5
Z=
5 10
100 115
.
Z = 1.43
0.5 + 0.4236 = 0.9236
c) X
1
= 114 y X
2
= 124
z
1
=
5 10
100 114
.
z
2
=
5 10
100 124
.
z
1
= 1.33 z
2
= 2.29
4236 0.
3 Z 2 Z 1 Z
0 Z
3 Z 2 Z 1 Z
3 Z 2 Z 1 Z 0 Z 3 Z 2 Z 1 Z
0.5
0.4082
0.4890
0.4890 - 0.4082 = 0.0808
d) Ya sabemos que la probabilidad ante 114 y 124 aos es 0.0808, entonces el N de
alumnos ser: 180x 0.0808 = 14.54
7.5. DISTRIBUCION CHI- CUADRADO
Es una prueba no parametrica que se utiliza para determinar la asociacin entre
variables. La frmula es la siguiente:
2
=
( )
e
e o
f
f f
2
Ejem. A un grupo de 132 alumnos se les ense la matemtica por tres mtodos I, II y
III. Por el mtodo I se enseo a 35 alumnos de los cuales 25 aprobaron. Por el mtodo II
se enseo a 47 alumnos, de los cuales 12 desaprobaron. Por el mtodo III se enseo a 50
alumnos , de los cuales 42 desaprobaron . Pruebe la hiptesis para verificar si los
mtodos de enseanza estn asociados al rendimiento de los alumnos. Utilice = 5%.
Solucin
Vamos ha elaborar la tabla de datos:
Mtodos de enseanza Aprobados
f
o
f
e
Desaprobados
f
o
f
e
Total
I 25 27.05 10 7.95 35
II 35 36.32 12 10.68 47
III 42 38.64 8 11.36 50
TOTAL 102 30 132
Hiptesis :
H
o
: Los mtodos de enseanza no estn asociados al rendimiento de los alumnos
H
1
: Los mtodos de enseanza si estn asociados al rendimiento de los alumnos
Reemplazando en la formula:
2
=
( ) ( ) ( )
36 11
36 11 8
32 36
32 36 35
05 27
05 27 25
2 2 2
.
.
. ..........
.
.
.
.
+ +
2
= 2.18 Valor calculado
Ahora encontramos el valor en la tabla de la chi cuadrado para poder comparar con el
valor calculado. Si el valor calculado es mayor que el valor de la tabla, rechazamos la
hiptesis nula ( H
o
), Caso contrario aceptamos H
o
.
Valor de la tabla:
2
0.95,(c-1)(f-1)
=
2
0.95,1x2
=
2
0.95,2
= 5.99
Conclusin: Aceptamos H
o
7.6. EJERCICIOS
1. Se lanza 5 veces una moneda . Cual es la probabilidad de obtener:
a. Exactamente 3 caras
b. Por lo menos 3 caras
c. A lo mas dos caras
2. Se lanza un dado 7 veces. Cual es la probabilidad de obtener exactamente 4 veces el
N 6.
3. Un estudio de las corrientes de carga en sistemas de alimentacin de computadoras en
instalaciones revel que el 10% de las instalaciones tenan razones de corriente neutral a
corriente de carga total altas. Se escoge una muestra aleatoria de 5 sistemas de
alimentacin de computadoras de un gran nmero de instalaciones , Que probabilidad
hay de que:
a. Exactamente tres tengan una relacin de corriente neutral a corriente de carga total
alta.
b. Por lo menos 3 tengan una relacin alta
c. Menos de 3 tengan una relacin alta.
4. Calcule la media, la varianza y la desviacin estndar de una variable aleatoria
binomial con n=20 y p = 0.6. Construya el intervalo 2.
5. El N de grietas por plancha de concreto hechas con cierto tipo de mezcla de
cemento tiene una distribucin de probabilidad de poisson aproximada. Adems , se
sabe que el N medio de grietas por plancha de concreto es 2.5.
a. Calcula la media y la desviacin estndar .
b. Cual es la probabilidad de que una plancha de concreto escogido al azar tenga
exactamente 5 grietas.
c. Calcule la probabilidad de que una plancha de concreto escogido al azar tenga dos o
ms grietas.
6. Un ingeniero de transito desea disear un sistema de control de trfico. Estima que el
nmero medio de automviles por minuto que llegan a una interseccin es de 2. Que
probabilidad hay de que:
a. En un minuto dado, el nmero de llegadas sea de tres o ms.
b. El nmero de llegadas sea a lo ms 4.
7. En una central Telefnica se recibe en promedio 3 llamadas por minuto. Calcular la
probabilidad de que ocurran
a. Exactamente 4 llamadas en un minuto
b. A lo ms 5 llamadas en un minuto.
c. Por lo menos 4 llamadas en un minuto.
8. Supongamos que el coeficiente de friccin para cierto sistema de copiado tiene una
distribucin normal , con media igual a 0.55 y desviacin estndar igual a 0.013.
Durante el funcionamiento del sistema, se mide el coeficiente de friccin en un
momento escogido al azar.
a. Calcular la probabilidad de que el coeficiente de friccin est entre 0.53 y 0.56
b. Es verosmil observar un coeficiente de friccin por debajo de 0.50?
9. Una compaa de comunicacin por cable ha determinado que el nmero de
interruptores terminales de de botn solicitados diariamente tiene una distribucin
normal con una media de 200 y una varianza de 2500.
a. En que porcentaje de los das la demanda ser de menos de 90 interruptores.
b. En que porcentaje de los das la demanda estar entre 225 y 275 interruptores.
10. Encontrar:
a. P ( Z 2.15 )
b. P ( Z - 1.95 )
c. P ( -0.95 Z 1.75 )
d. P ( 2Z 2.86)
e. P ( | Z | 1.26
f. P ( -0.75 Z/ 2 1.05 )
BIBLIOGRAFIA
1. Canavos, G. Probabilidad y Estadstica. Aplicaciones y Mtodos
McGraw Hill, 1992.
2. Bury, K. Distribuciones Estadsticas para Ingenieros, Cambridge
University Press, New York, 1999.
3. Devore, J. Estadstica y Probabilidad para Ingeniera y Ciencias
International Thomson Editores, 1998.
4. Hoog, R. y Craig, J. Introduction to Mathematical Statistics, Prentice
Hall, 1995.
5. Meyer, P., Probabilidad y Aplicaciones Estadsticas, Addison Wesley
Iberoamericana, Wilgminton, Delaware, 2002.
6. Miller, J.E. Freund y Johnson, R. Probabilidad y Estadstica para
Ingenieros, Prentice Hall Hispanoamericana, Mexico, 1992.
7. Montgomery, D. y Runger, G. Probabilidad y Estadstica Aplicada a la
Ingeniera, McGraw Hill ,1997.
8. Raymond, H., y Myers, S. Probabilidad y Estadstica para Ingenieros".
Sexta edicin. 1998
9. Ross, S. Introduccin a la Probabilidad y estadstica para Ingenieros,
John Wiley and Sons, New york, 2000.
10. Walpole, R. Estadstica Matemtica con Aplicaciones. Prentice Hall
Hispanoamericana S.A, 1998.