Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadstica General
Mg. Mara Vallejos Atalaya
Estadstica General
PRESENTACIN
El mdulo de Estadstica General tiene la naturaleza terico- prctica, pertenece al rea de
Formacin Bsica, en el I ciclo, con un total de 4 horas y 3 crditos. Asimismo, responde a las
exigencias curriculares de los programas acadmicos y de los diseos curriculares de la Facultad de
Ciencias Empresariales y sus respectivas carreras acadmicas profesionales, en el contexto de los
perfiles, las visiones y las misiones institucionales educativas y profesionales.
Tiene el propsito de proporcionar al futuro profesional los conocimientos necesarios de la estadstica,
que le permitir investigar y resolver problemas con el quehacer de su carrera profesional. El mundo
actual que vivimos, ha provocado incertidumbre en las personas que tienen que tomar decisiones en
las diferentes funciones que les toca desempear, ya sea en las instituciones gubernamentales,
comerciales, de negocios pblicos y privados. La estadstica es una herramienta intelectual que ayuda
a tomar decisiones racionales, porque sabemos que El pasado puede evaluarse, el presente puede
ser descrito y el futuro puede ser previsto.
El sistema modular no es sino un encuentro de los alumnos y profesores en espacios diseados y
establecidos previamente, con mucha inteligencia, seleccin adecuada y pertinente de los contenidos,
instrumentos y metodologa, cuyos alcances de autoaprendizajes sern coronados en la grandeza de
los alumnos participantes, especialmente de quienes quedan inmersos en los programas acadmicos a
distancia, cuya dinmica acadmica se ha estandarizado y responde al uso de las tecnologas
modernas. En este sentido, el mdulo ha sido diseado para desarrollarlo en dos fases: una a distancia
y la otra presencial (tutorial) que comprende 10 tutoras presenciales.
Este mdulo contiene la sumilla, las competencias, los contenidos agrupados en 5 unidades. Unidad 1:
Conceptos fundamentales y la organizacin de la informacin, Unidad 2: Medidas de resumen: anlisis
e interpretacin de los resultados, Unidad 3: Nociones de probabilidad: propiedades, anlisis
combinatorio, Unidad 4: Distribuciones de probabilidad y Unidad 5: Distribuciones muestrales. Adems,
en el mismo mdulo se encuentra la metodologa, la evaluacin y la bibliografa. Por ejemplo, se
trabajar la metodologa activa, adems, se ejercer la evaluacin de acuerdo con los indicadores,
criterios y condiciones registrados en el desarrollo de cada unidad. Este mdulo comprende una
bibliografa bsica y especializada.
Estadstica General
NDICE
Estadstica General
Sesin N5
MEDIDAS DE RESUMEN
5.1. Anlisis e interpretacin de los resultados
5.2. Medidas de tendencia central
5.2.1. La media o promedio aritmtico ( x )
5.2.1. Mediana (Me)
5.1.3. La moda (Mo)
Sesin N 6
MEDIDAS DE POSICIN
6.1. Medidas de posicin
6.1.1. Cuartiles (Qi )
6.1.2. Deciles (Di )
6.1.3. Percentiles (Pi )
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN
Sesin N 7
MEDIDAS DE DISPERSIN
7.1. Medidas de dispersin
7.1.1. Varianza (s2 )
7.1.2. Desviacin estndar (s )
7.1.3. Coeficiente de variacin (c.v. % )
Sesin N 8
MEDIDAS DE FORMA
8.1. Medidas de forma.
8.1.1. Asimetra (As)
8.1.2. Coeficiente de Kurtosis o apuntamiento (K)
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN
Estadstica General
Estadstica General
SUMILLA
La asignatura de Estadstica General tiene la naturaleza terico- prctico, pertenece al rea de
Formacin Bsica, con cuatro horas, tres crditos, corresponde al I ciclo de las Carreras Acadmico
Profesional de Administracin y Contabilidad. Pretende proporcionar los conocimientos necesarios de
la estadstica, que le permitir investigar, analizar y resolver problemas con el quehacer de su carrera
profesional, cuyo contenido son: conceptos fundamentales y la organizacin de la informacin, medidas
de resumen: anlisis e interpretacin de los resultados, nociones de probabilidad, distribuciones de
probabilidad y distribuciones muestrales.
15
UNIDAD I:
TEORA ESTADSTICA
Sesin N1:
Conceptos fundamentales y organizacin de la informacin
Sesin N2:
Etapas del Mtodo Estadstico
Sesin N3:
Organizacin de la informacin: tablas y grficos estadsticos
Sesin N4:
Representacin de la Organizacin
16
COMPETENCIAS
CONCEPTUAL
PROCEDIMENTAL
Reconocen y delimitan
la poblacin, muestra y
variables en estudio, y
adems utilizan tablas y
grficos adecuados.
17
ACTITUDINAL
Analizan e interpretan los
resultados obtenidos en
las tablas y grficos
estadsticos.
Sesin N 1
CONCEPTOS FUNDAMENTALES Y
ORGANIZACIN DE LA INFORMACIN
1.1 GENERALIDADES
1.1.1 Definicin de estadstica
La estadstica es una ciencia que nos proporciona un conjunto de mtodos y tcnicas para la
recoleccin, clasificacin, presentacin, anlisis e interpretacin de los datos, con la finalidad de
realizar una toma de decisin ms efectiva.
1.1.2. Ramas de la estadstica
Estadstica descriptiva
Consiste en recolectar, clasificar, presentar y describir los datos vlidos nicamente para la poblacin
objeto de estudio, utilizando tablas, grficos y algunas medidas de resumen. No se efectan inferencias
para un grupo mayor.
Estadstica inferencial
Se emplea para generalizar conclusiones vlidas para una poblacin a partir de datos obtenidos de
una muestra extrada de dicha poblacin.
1.1.3. Poblacin
Es el conjunto de todos los individuos, objetos u observaciones que poseen al menos una caracterstica
comn, que son objetos de estudio. Se representa con la letra N.
La poblacin se define de acuerdo a la caracterstica, unidad estadstica y extensin del problema
objeto de estudio.
Ejemplo:
1. Las edades de los estudiantes de la UPeU.
2. Los errores que presentan las facturas del supermercado La Unin.
Respecto a la caracterstica objeto de estudio se puede distinguir:
a)
Poblacin objeto. Considerada como el conjunto de elementos que son objeto de estudio.
Ejemplo.
1. Conjunto de los alumnos de la UPeU.
2. Conjunto de facturas del supermercado La Unin.
b)
La poblacin de acuerdo al nmero de elementos que la forman puede ser finita o infinita.
Poblacin finita: Es aquella que tiene un nmero limitado de elementos.
Ejemplo:
16
1.
2.
Poblacin infinita: Es aquella que tiene un nmero indeterminado de elementos. No se refiere a que
no se puede contar, sino que es imposible ubicar a todos los elementos de la poblacin.
Ejemplo:
1. Los sntomas de los enfermos tuberculosos de Lima.
2. Evasin de impuestos de las empresas adscritas al RUC.
1.1.4. Muestra
Es un subconjunto o parte de la poblacin. Se examina una muestra cuando no es posible examinar
una poblacin, ya sea por factores econmicos, disponibilidad de personal o tiempo.
La muestra debe cumplir dos requisitos bsicos: Debe ser representativa y adecuada.
Es representativa cuando contiene todos los sectores o aspectos de la poblacin en la misma
proporcin en que se hallan en la totalidad del universo. La representatividad asegura la calidad de la
muestra.
Es adecuada cuando el tamao de la muestra tiene una magnitud suficiente que permita confiar en la
estabilidad de las caractersticas presentes en la muestra. La adecuacin asegura la confiabilidad de la
muestra.
1.1.5. Unidad estadstica
Es el elemento que pertenece a la poblacin objeto de estudio. Dicho elemento contiene las
caractersticas, atributos que el individuo o fenmeno puede poseer.
Ejemplo:
1. Para un ingeniero que verifica la calidad de productos elaborados por una empresa, la unidad
estadstica son los productos terminados.
2. Para un auditor que verifica los estados financieros de una empresa en el balance general, cuentas
clientes, la unidad estadstica son las facturas por cobrar.
1.1.6. Dato estadstico
Son nmeros o medidas que han sido recopilados como resultado de observaciones que pueden ser
comparados, analizados e interpretados.
Ejemplo:
1. Si la caracterstica de estudio es la variable X: edad de un grupo de 5 estudiantes. El conjunto de
datos estadsticos seran los siguientes:
x1 = 17, x2 = 18, x3 = 21, x4 = 22, x5 = 19
2. Si la caracterstica de estudio es la variable X: n de errores ubicados en 5 facturas. El conjunto de
datos estadsticos seran los siguientes:
x1 = 2, x2 = 5 , x3 = 0, x4 = 4, x5 = 2
1.1.7. Parmetro
Es una medida de resumen que describe alguna caracterstica de toda la poblacin objeto de estudio.
Para determinar el valor del parmetro se requiere informacin de toda la poblacin.
17
2. Profesin
4. Estado Civil
6. Nivel socioeconmico
Es aquella cuyos datos estadsticos son numricos y se obtiene como resultado de mediciones o
conteos.
Ejemplo:
- Sueldos: 800, 1500, 935, 450,
- Notas: 12, 19, 16, 08, 10,
Las variables cuantitativas segn la escala de medicin pueden ser:
i) Variable cuantitativa de intervalo
Es aquella que se presenta en intervalos y no necesariamente empieza del cero racional.
Ejemplo:
- Temperatura corporal: 36, 37, 38 (una persona no puede tener 0 de temperatura, porque estara
muerta).
- Peso: 20kg, 35kg, 58kg.
Todos los signos vitales son variables cuantitativas de intervalo.
ii) Variable cuantitativa de razn
Es aquella que necesariamente empieza del cero racional.
Ejemplo:
- Notas: 0, 1, 2, 3, , 20 (empieza desde cero)
- Edad: 0, 1, 2,
Las variables cuantitativas segn su naturaleza pueden ser:
i) Variable discreta
Son aquellas que toman valores numricos aislados y no pueden tomar ningn valor entre dos
nmeros consecutivos fijados (slo asume nmeros enteros).
Ejemplo:
- N de hijos: 0, 1, 2, 3, (no puede existir 2.5 porque sera ilgico pensar en 2 hijos y medio)
- N de facturas que presentan errores: 0, 1, 2, 3,
ii) Variable continua
Son aquellas que pueden tomar infinitos valores entre dos nmeros, por muy prximos que los fijemos,
es decir, se presentan valores enteros as como decimales.
Ejemplo:
- Peso: 62.55 kg, 72.40 kg, 56.35 kg,...
- Talla: 1.50 mt, 1.65 mt, 1.85 mt,
19
Sesin N 2
Los errores que puedan cometerse en la recoleccin de los datos y la manera de controlarlos.
Las ventajas y limitaciones de los diversos mtodos empleados en la recoleccin de la informacin.
Las condiciones que deben reunir los individuos que se estudian y los procedimientos ms
convenientes para su eleccin.
El diseo de los formularios que servirn para registrar la informacin que se recoja.
N
N 1 k 2 1
NOTAS
Donde:
n = tamao de la muestra (nmero de elementos de la muestra)
N = tamao de la poblacin (nmero de elementos de la poblacin)
k = error de muestreo.
Ejemplo:
Seleccionar el tamao de la muestra para la poblacin que est constituida por 1500 estudiantes de la
UPeU, utilizando un error de muestreo del 25% y 5%.
Solucin:
si: k = 25%, para reemplazar este valor en la frmula, primero debemos convertir a real, es decir, k =
25/100 = 0.25
1500
1500 1 0.25
15.84 16 alumnos
21
si: k = 5%, para reemplazar este valor en la frmula, primero debemos convertir a real, es decir, k =
5/100 = 0.05.
1500
1500 1 0.05
La escritura.
Las respuestas inconsistentes.
Las respuestas incompletas.
Las unidades en las cifras son diferentes.
EJERCICIOS PROPUESTOS
1. Indique cules de los trminos u operaciones siguientes se relacionan con una muestra o con una
poblacin:
a) grupo de medidas llamados parmetros
b) uso de inferencia estadstica
c) hacer un censo
d) juzgar la calidad de un embarque de fruta inspeccionando varios de los bultos incluidos en el
22
embarque.
2. En los siguientes enunciados, indicar si se trata de una Muestra (M) o una Poblacin (P):
a)
b)
c)
d)
rendimiento acadmico
velocidad de lectura
peso contenido en un paquete de cereales
categora de docente
nmero de artculos defectuosos producidos
nmero de unidades de un artculo en existencia
grado de desnutricin
asistencia a los cultos devocionales
patrn conductual
cultura organizacional
tipo de alimentacin
nmero de hermanos
grado de instruccin
estado civil.
5. Clasifique las variables e indique el tipo de escala en que estn medidas las siguientes
caractersticas:
a)
b)
c)
d)
e)
f)
g)
h)
Profesin
Ao de nacimiento
Nacionalidad
Grado de instruccin
ingreso mensual familiar promedio
Nmero de telfono
Grado de instruccin
Nmero de hijos
6. Utilizando la frmula determine el tamao de la muestra, considerando los datos que se mencionan
a continuacin.
a). N =
b) N =
c) N =
d) N =
e) N =
1 500
2 000
5 000
500
1 000
k = 3%
k = 10%
k = 2%
k = 10%
k = 5%
24
Autoevaluacin
CONCEPTUAL
1.
PROCEDIMENTAL
2.
3.
4.
e. Grado de instruccin
f. Sueldos
g. Gastos
h. Rendimiento
j. Edad
l. Categora de docente
Variable cuantitativa
Discreta
Continua
b) N = 1 000
d) N = 2 000
k = 5%
k = 10%
ACTITUDINAL
5.
28
Sesin N 3
ORGANIZACIN DE LA INFORMACIN:
TABLAS Y GRFICOS ESTADSTICOS
3.1. TABLAS DE FRECUENCIAS O DISTRIBUCIN DE FRECUENCIAS
Una distribucin de frecuencias (o tabla de distribucin de frecuencias) es una representacin de una
serie de datos. En ella se muestra cmo se distribuyen los valores de la variable estadstica junto a sus
frecuencias correspondientes a cada uno de ellos.
En estas tablas de distribucin de frecuencias, como producto de la operacin de tabulacin (conteo),
se observa cuantos elementos (frecuencia o repeticin) hay en cada categora, valor o intervalo de la
variable.
Luego de la revisin de los datos recopilados, es conveniente presentar la informacin, de acuerdo a
algn sistema de ordenacin, a fin de describirlos y analizarlos. A continuacin se presenta algunos
conceptos y procedimientos comunes para la presentacin de cuadros o tablas.
fi
m
Propiedad:
f1 f 2 ... f m f i n
i 1
Frecuencia absoluta acumulada (Fi): Es igual a la suma de las frecuencias absolutas simples
inferiores o iguales a las frecuencias acumuladas que se desea encontrar.
Se denota mediante:
Fi
Propiedad:
F1 f q
F2 f1 f 2
.
.
.
Fm f1 f 2 ... f m
Frecuencia relativa simple ( hi ): Es el cociente entre la frecuencia absoluta simple de su fila y el
nmero total de observaciones realizadas (n). La suma de todas las frecuencias relativas es igual a 1.
Su frmula es:
Se denota mediante:
hi
fi
n
hi
29
Propiedad:
h1 h2 ... hm
h
i 1
Hi
Su frmula es:
Se denota mediante:
Fi
n
Hi
Propiedad:
H1 hq
H 2 h1 h2
.
.
.
H m f1 h2 ... hm
Para presentacin de la informacin mediante cuadros o tablas, es necesario construir la tabla de
distribucin de frecuencias. La cual puede ser:
3.1.1. Distribucin de frecuencias de una variable discreta
Una distribucin de frecuencias es un arreglo de los valores observados x1,...xm de una variable X con
sus respectivas frecuencias, en una tabla de la forma:
Valores fi
de X
x1
f1
x2
f2
Fi
hi
Hi
F1
F2
h1
h2
H1
H2
xk
Total
Fm
fi=n
F m= n
Hm
hi=1
Hm = 1
Ejemplo:
Dadas las edades de 12 estudiantes de la UPeU, construir la tabla de distribucin de frecuencias.
EDAD (X): 19, 20, 23, 20, 18, 20, 25, 18, 18, 20, 25, 23.
Solucin
EDAD
18
19
20
23
25
Total
fi
3
1
4
2
2
12
Fi
3
4
8
10
12
hi
0.25
0.08
0.33
0.17
0.17
1.00
Hi
0.25
0.33
0.66
0.83
1.00
La suma de las frecuencias relativas simples (hi) siempre debe ser igual a uno, en caso de error de
redondeo no diera 1, hay que ajustar, es decir, hay que sumar o restar 1 dgito a cualquier nmero para
conseguir la suma de 1.
f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al nmero 4.
30
F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al nmero 10.
h3: Indica la fecuencia relativa absoluta simple de la tercera fila y corresponde al nmero 0.33. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza
multiplicando el nmero por 100, as 0.33x100 = 33%.
H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al nmero 0.83. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando el nmero por 100, as 0.83x100 = 83%
Interpretacin:
f3: Existen 4 alumnos que tienen 20 aos de edad.
F4: Existen 10 alumnos cuyas edades varan de 18 a 23 aos.
h3: El 33% de los alumnos que tienen 20 aos de edad.
H4: El 83% de los alumnos tienen edades que varan de 18 a 23 aos.
Las frecuencias absolutas interpretan la variable en su fila, en cambio las frecuencias acumuladas
interpretan desde el principio hasta su fila.
Observacin:
Cuando se realiza una observacin en una muestra o en una poblacin, se puede presentar los
siguientes casos:
Que se hayan hecho pocas observaciones y por lo tanto, la variable estadstica tome pocos
valores.
Que se hayan hecho muchas observaciones y sin embargo, la variable estadstica toma muy pocos
valores diferentes.
Que se hayan hecho muchas observaciones y la variable toma muchos valores distintos.
(*) Los dos primeros casos caern dentro del estudio de variable discreta.
(*) El tercer caso se agrupar los valores de la variable en intervalos adecuadamente para no perder
mucha informacin.
2.1.2. Distribucin de frecuencias para datos agrupados
Es una tabla en donde los datos originales se clasifican en intervalos de clase.
Para la elaboracin de esta tabla se debe tener en cuenta las definiciones siguientes:
- Intervalos o lmites de clase: se identifica por tener su lmite superior y su lmite inferior. Los
extremos de los intervalos no se repiten.
Ejemplo:
15-19
20-24
25-29
LCI=15 y LCS=19
- Amplitud intervlica (c): Llamado tambin ancha de clase, es la cantidad de datos que estn
comprendidos en un intervalo de clase.
-
Xi
LCI LCS
2
31
Ejemplo:
La marca de clase para el primer intervalo ser:
Xi
15 19 17
2
R X mx X mn
2) Determinar el Nmero de intervalos: k
Utilizando la regla de Sturges:
k 1 3.322log(n)
R
k
104
105
100
95
113
107
106
103
104
93
113
101
111
106
118
89
105
92
105
89
125
89
125
120
127
122
115
125
95
100
32
101
126
109
129
129
89
98
107
91
115
1) Determinar el Rango: R
El rango de variacin de los datos se define por:
R X mx X mn
2) Determinar el Nmero de intervalos: k
Utilizando la regla de Sturges:
k 1 3.322log(n)
n: Nmero total de datos.
Observacin: El resultado que se obtenga de k ser redondeado al entero inmediato mayor.
Ejemplo:
Si k 6.32 entonces, k 7 (Nmero de intervalos igual a 7).
Si k 6.84 entonces, k 7 (Nmero de intervalos igual a 7).
3) Determinar la Amplitud del intervalo: c
La amplitud del intervalo se obtiene dividiendo el rango entre el nmero de intervalos.
R
k
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmite
de
clase
88 94
94 100
100 106
106 112
112 118
118 124
124 130
Yi
fi
Fi
hi
Hi
91
97
103
109
115
121
127
9
6
11
5
8
3
8
50
9
15
26
31
39
42
50
0.18
0.12
0.22
0.1
0.16
0.06
0.16
1.00
0.18
0.3
0.52
0.62
0.78
0.84
1.00
f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al nmero 11.
F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al nmero 31.
h3: Indica la relativa absoluta simple de la tercera fila y corresponde al nmero 0.22. Para interpretar se
debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza multiplicando
al nmero por 100, as 0.22x100 = 22% .
H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al nmero 0.62. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando al nmero por 100, as 0.62x100 = 62%
Interpretacin:
f3: Existen 11 estudiantes de la Universidad Peruana Unin que tienen un cociente intelectual que
vara de 100 a 106 puntos.
33
F4: Existen 31 estudiantes de la Universidad Peruana Unin que tienen un cociente intelectual que
vara de 106 a 112 puntos
h3: El 20% de estudiantes de la Universidad Peruana Unin tienen un cociente intelectual que vara de
100 a 106 puntos
H4: El 62% de estudiantes de la Universidad Peruana Unin tienen un cociente intelectual que vara de
106 a 112 puntos
Las frecuencias relativas interpretan la variable en su fila, en cambio, las frecuencias acumuladas
interpretan la variable desde el principio hasta su fila.
CUIDADOS EN LA PRESENTACIN DE CUADROS ESTADSTICOS
A continuacin sealamos los elementos necesarios que deben tenerse en cuenta para la presentacin
de informacin estadstica mediante cuadros.
1. N de cuadro
2. Ttulo: Debe responder las siguientes preguntas:
a. Qu informacin contiene el cuerpo del cuadro?
Ej. Cociente de inteligencia de 50 alumnos
b. Dnde fue tomada la informacin?
Ej. ...en la UPeU Lima
c. Cundo fue tomada la informacin?
Ej. ...Enero, 1995
3. Los encabezados: Corresponde a la identificacin de la variable y las frecuencias.
4. Columna matriz: corresponde a las categoras de clasificacin de la variable.
5. Cuerpo del cuadro: Corresponde a la informacin numrica, generalmente frecuencias absolutas y
relativas.
6. Fuente: Sealar el medio de informacin que condujo al conjunto de datos.
Ej. Test aplicado por los investigadores
7. Notas: son colocadas para esclarecimiento.
8. Comentarios: sirve para aclarar minucias en relacin a cada celda.
Para nuestro ejemplo visto anteriormente el cuadro ser:
CUADRO N 1
COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIN - LIMA, 2004
COCIENTE
DE N
INTELIGENCIA
ALUMNOS
88 94
9
94 100
6
100 106
11
106 112
5
112 118
8
118 124
3
124 130
8
TOTAL
50
Fuente: Test aplicado por los investigadores.
DE %
18
12
22
10
16
6
16
100
34
Sesin N 4
REPRESENTACIN DE LA INFORMACIN
4.1. PRESENTACIN DE LA INFORMACIN MEDIANTE GRFICOS
Los grficos ms usados son:
a. Histograma de frecuencias
b. Polgono de frecuencias
c. Polgono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo
a. Histograma de frecuencias
Es una representacin grfica de una distribucin de frecuencias agrupadas en intervalos de clase,
mediante una serie de intervalos continuos.
Se usa:
Cuando se tiene una variable cuantitativa continua
Se construye:
1. Se coloca los intervalo de clase en el eje horizontal (eje de las abscisas o eje x).
2. Se levanta cada intervalo a la altura de la frecuencia absoluta simple o relativa simple.
Ejemplo:
Considere el ejemplo de tabla de distribucin de frecuencia para datos agrupados del Puntajes del
Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
35
b. Polgono de frecuencias
Se usa:
Cuando se tiene una variable cuantitativa continua y econmica.
Se construye:
1. Se ubica en el eje x la marca de clase y se considera el punto medio,
2. Se levanta el punto de la marca de clase a la altura de la frecuencia absoluta simple o relativa
simple,
3. Luego de marcar los puntos, unirlos,
4. Finalmente, unir los extremos al eje de las abscisas.
Ejemplo:
Considerando el ejemplo de la tabla de distribucin de frecuencias para datos agrupados, en el cual
estudiamos el Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
fi
10
9
8
11
8
9
7
3
5
4
3
2
1
x
91
97
103
109
115
121
127
Ejemplo:
Considerando el ejemplo de la tabla de distribucin de frecuencias para datos agrupados, en el cual
estudiamos el Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU
36
fi
50
50
45
40
42
39
35
31
30
25
26
20
15
15
10
5
9
x
88
94
100
106
112
118
124
130
d. Barras
Se representa mediante una serie de rectngulos separados
Se usa:
Para representar variables cualitativas.
Se construye:
1. Se ubica en el eje x las categoras de la variable, utilizando intervalos y separando
aproximadamente la mitad del intervalo entre una categora y otra.
2. Se levanta cada intervalo de la categora que corresponde a la variable, a la altura de la frecuencia
absoluta simple o relativa,
Ejemplo:
Facultad
1. Ciencias Contables y Administrativas
2. Teologa
3. Ciencias de la Salud
4. Educacin y Ciencias Humanas
5. Ingeniera
Total
N de alumnos
500
200
250
250
300
1500
fi
50
045
040
035
50
0
030
025
020
0
15
0
10
0 50
20
0
25
0
25
0
30
0
e. Bastones
Tiene la forma de alfileres.
Se usa:
37
0
3
1
7
2
12
3
20
4
15
5
5
NOTAS
fi
20
20
15
15
12
10
7
5
5
3
1
f. Sectores
Se representa mediante un crculo particionado.
Se usa:
Para representar una variable cualitativa cuyo principal inters es conocer su frecuencia relativa.
Se construye:
1. Se particiona a una circunferencia equitativamente, considerando que sta constituye el 100%,
2. Se efecta la particin, segn la frecuencia relativa simple lo considere y se ubican las categoras
de la variable en cada particin.
Ejemplo:
Rubro
Diezmo
Vivienda
Alimentacin
Vestido
Educacin
Recreacin
Otros
Total
hi %
10
20
30
10
20
5
5
100
VIVIENDA
20%
ALIMENTA
OTROS
CIN
5%
30%
VESTIDO
10%
EDUCACI
N
20%
DIEZMO
10%
RECREAC.
5%
38
g. Series de tiempo
Son curvas idnticas al del polgono de frecuencias pero sus extremos no tocan el eje de las abscisas.
Se usa:
Cuando la variable de inters es el tiempo.
Ejemplo:
N DE ALUMNOS INGRESANTES A LA UPeU DE TRES
COLEGIOS DIFERENTES 1991-1995
AOS
1991
1992
1993
1994
1995
N DE ALUMNOS INGRESANTES
COLEGIO 1 COLEGIO 2 COLEGIO 3
10
20
15
15
25
20
20
20
25
25
25
20
35
25
25
fi
40
35
30
25
COLEGIO 1
20
COLEGIO 2
15
COLEGIO 3
10
5
0
1991
1992
1993
1994
1995
X
AOS
39
Ejemplo:
La representacin grfica para el ejemplo de datos agrupados de los datos del Puntajes del Cociente
de Inteligencia (CI) de 50 Estudiantes de la UPeU.
GRFICO N 1
COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIN - LIMA,
2001
EJERCICIOS PROPUESTOS
1.
En una encuesta de opinin acerca de las preferencias de una marca de bebida gaseosa por sus
colores: Amarillo (A), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas:
B, R, R, B, R, A, A, B, B, A
B, A, A, R, B, A, B, R, B, A
a) Construir la distribucin de frecuencias
b) Graficar la distribucin
2.
160 170
170 180
180 190
190 200
200 210
fi
48
Fi
hi
60
0,125
0,075
672
650
820
700
670
570
610
850
800
590
40
670
700
570
730
378
730
650
3.2.
151
161
166
167
168
169
170
172
174
176
179
181
187
3.3
730
663
930
640
740
770
569
848
708
580
720
860
461
609
860
748
685
700
766
777
630
574
456
640
720
578
258
560
840
Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en
cm)
152
161
165
167
168
169
170
172
175
177
179
182
188
154
161
166
167
168
169
170
173
175
177
180
182
189
155
162
166
168
168
169
170
173
175
177
180
182
190
159
163
166
168
168
169
171
173
176
177
180
183
159
163
166
168
169
170
171
173
176
178
181
184
160
164
166
168
169
170
171
174
176
178
181
185
161
165
167
168
169
170
172
174
176
178
181
186
El gerente de una compaa registra el nmero de cierto trabajo, completados por los
empleados. Cincuenta empleados realizan el mismo trabajo, divididos en dos grupos de 25
y en salones diferentes.
32
26
32
a) Combinar todos los puntajes y obtener la distribucin de frecuencias con tamao de clase
k=10.
b) Obtener la distribucin de frecuencias por cada saln y realice la grfica adecuada.
4.
80.6
53.2
76.9
49.6
91.2
67.9
79.1
74.8
63.7
84.4
78.6
49.9
66.2
81.4
46.4
79.3
58.6
68.8
59.4
68.2
67.3
72.9 73.6
67.4 55.6
72.3 75.8
41
88.3
75.6
65.2
54.2
80.2
94.6
41.8
62.1
75.3
60.2
57.3
73.6
44.8
50.1
71.6
87.3
71.4
82.9
61.1
77.1
74.3
83.2
81.7
42.3
94.9
73.2
67.4
70.4
68.6
61.4
90.4
99.3
74.6
56.2
82.1
76.3
62.3
76.9
70.8
78.3
52.7
89.2
85.7
47.3
51.2
71.7
86.8
40.9
66.9
79.3
42
Autoevaluacin
CONCEPTUAL
1. Seale con una V si es verdadero o F si es falso en los siguientes enunciados:
a)
b)
c)
d)
e)
(
(
(
(
(
)
)
)
)
)
PROCEDIMENTAL
2. A continuacin se presentan las notas de 50 alumnos:
60
65
71
47
80
53
41
39
94
94
85
74
35
54
61
77
55
60
98
88
33
57
81
68
41
45
78
76
66
89
52
50
91
48
66
65
35
55
69
73
77
64
73
85
42
84
74
59
67
65
Se pide:
a)
b)
c)
d)
Determinar el rango.
Nmero de clases o filas.
Amplitud de las clases o filas.
Frecuencias absolutas y relativas simples, absolutas y relativas acumuladas.
Interpretar por lo menos 2 de cada fila.
3. Al investigar el nivel socioeconmico en los valores: Bajo (B), medio (M), alto (A), 20
familias dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B
Construir la distribucin de frecuencia y trazar su grfica.
4. Dibujar un diagrama de sectores para mostrar los gastos de un hospital de una gran
ciudad, siendo stos los siguientes: 73% en sueldos, honorarios profesionales
mdicos y bonificaciones a los empleados; 13% en suministros, equipo mdico y
quirrgico; 8% en mantenimiento, alimentacin y energa; y 6% en costos
administrativos.
ACTITUDINAL
5. Considerando los conocimientos adquiridos en la primera unidad, qu aconsejaras
a un empresario que necesita tomar decisiones acertadas para el buen
funcionamiento de su negocio?
42
UNIDAD II:
MEDIDAS ESTADSTICAS
Sesin N5:
Medidas de resumen
Sesin N6:
Medidas de posicin
Sesin N7:
Medidas de dispersin
Sesin N8:
Medidas de forma
43
COMPETENCIAS
CONCEPTUAL
PROCEDIMENTAL
ACTITUDINAL
Identifican y reconocen
qu medidas de resumen
son adecuadas para el
anlisis de una serie de
datos.
44
Sesin N 5
MEDIDAS DE RESUMEN
5.1. Anlisis e interpretacin de los resultados
Se estudi los cuadros y grficos estadsticos en la unidad anterior como formas para ordenar y
describir un conjunto de datos para tomar decisiones. Sin embargo, el anlisis resulta incompleto, para
esto se utiliza ciertos indicadores.
Estos indicadores llamados medidas de resumen o ESTADGRAFOS permiten hallar un solo valor
numrico, el mismo que representa a toda la poblacin o muestra en estudio.
Los estadgrafos o medidas de resumen ms importante son:
De tendencia central: media, mediana y la moda.
De posicin: cuartiles, deciles y percentiles.
De dispersin: varianza, desviacin estndar, y coeficiente de variacin.
De forma: asimetra y el coeficiente de kurtosis.
x
n
xf
f
AOS
Primero
Segundo
Tercero
Cuarto
Quinto
Total
Fi 2
25
39
45
54
56
Clase
mediana.
Proceso:
1. Se calcula la suma de las frecuencias absolutas simples entre 2 as:
n
=
2
f
2
56
28
2
Fi 1
2
Me Linf c
fi
Donde
1
2
No est afectada por valores extremos, y por lo tanto es ms representativa que el promedio,
cuando las series son poco simtricas.
Es til cuando los datos agrupados tienen clases abiertas en los extremos (es decir, no tiene lmite
inferior en la primera clase ni lmite superior en la ltima clase).
Se aplica a variables que pertenecen a la escala ordinal.
CONSUMIDORES
(fi)
25
20
40
15
100
Clase modal,
por ser el valor ms frecuente (f =40)
Entonces, la moda ser el valor que corresponde a la categora de la variable, en la clase o fila modal.
Mo = Fibra
Interpretacin:
La mayora de los consumidores de Productos Unin prefiere pan fibra.
b) Moda para datos agrupados:
En este caso la moda se halla mediante la frmula:
Mo Linf c
1 2
Donde
Linf : Lmite inferior del intervalo que contiene a la moda
69
2 fi fi 1
Ventajas de la moda:
-
Desventajas de la moda:
-
Ejemplo:
Correspondiente a datos simple (informacin en serie):
Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de
Ciencias Contables y Administrativas:
Edad :
Xi: 18,
20,
23,
17,
18,
19,
23, 18
Solucin:
Media
x 18 20 23 17 18 19 23 18 156 19.5 20
n
Interpretacin
La edad promedio de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas
es de 20 aos.
Mediana
Me: Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la
serie es par); del conjunto de datos previamente ordenados en forma creciente.
En este caso la serie es par, por lo tanto, se procede del siguiente modo:
1 Se ordena la serie
17,
18,
18,
18,
2
17,
19,
20,
23,
23
20,
23,
23
18,
18,
19,
70
3 la mediana ser la semisuma de los dos valores centrales, por ser la serie par, es decir 8 datos.
Me
18 19
18.5 19
2
Interpretacin:
La mitad de los de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas
tiene como mximo 19 aos, aproximadamente la otra mitad tienen ms de 19 aos.
Moda
Es el valor que ms se repite.
As, en nuestra base de datos.
1 Se ordena la serie
17,
18,
18,
18,
2
19,
20,
23,
23
Interpretacin:
La mayora de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas tiene de
20 aos de edad.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas):
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos la media, mediana y moda para datos agrupados.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmites
de
clases
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
Total
Xi
fi
Fi
Xi fi
Xi 2fi
91
97
103
109
115
121
127
9
6
Mo 11
5
8
3
8
50
9
15
Me 26
31
39
42
50
819
582
1133
545
920
363
1016
5378
74529
56454
116699
59405
105800
43923
129032
585842
Solucin:
La columna de las marcas de clase denotada por Xi, se obtiene por la formula dada anteriormente en la
Unidad 1.
71
Xi
LCI LCS
2
88 94
91
2
94 100
97
2
100 106
103
2
X1
X2
X3
.
.
X7
124 130
127
2
La columna de Xi fi : se obtiene multiplicando valor por valor la columna de las marcas de clase
denotada por Xi por las frecuencias absolutas simple denotada por fi:
As:
X1 f1 = 91 x 9 = 819
X2f2 = 97 x 6 = 582
X3 f3 = 103 x 11 = 1133
X7 f7 = 127 x 8 = 1016
Observacin: Las sumas de cada columna se encuentran en la fila que corresponde al total (al final de
las columnas).
La clase mediana se ubica con las frecuencias absolutas acumuladas.
La clase modal se ubica con las frecuencias absolutas simples.
Media:
x f
f
i
5378
107.56 107
50
Interpretacin:
El cociente de inteligencia promedio de los alumnos de la Universidad Peruana Unin es de
aproximadamente 107 puntos.
Mediana:
Proceso:
1. Ubicamos la clase o fila mediana (intervalo que contenga la mediana):
Lugar de Me: n/2= 50/2= 25 (25 avo. lugar)
Analizando, la mediana se encuentra en la 4ta. Clase.
Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 25.
72
Fi 1
2
Me Linf c
fi
Linf : Lmite inferior del intervalo de la clase mediana = 100
n
: Amplitud intervlica: 6
La mediana ser:
50
15
2
= 105.45
Me 100 6
11
Interpretacin:
La mitad de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 105 puntos, aproximadamente la otra mitad tienen ms de 105 puntos.
Moda
Proceso:
1. Se ubica la clase o fila modal (donde se encuentra la moda), ubicando en la columna de las
frecuencias absolutas simples (fi) el mayor valor.
En nuestro ejemplo el mayor valor de las frecuencias absolutas simples es f3 = 11,
En nuestro ejemplo, la clase modal o fila donde se encuentra la moda es la tercera fila porque en
ella se encuentra el mayor valor de las frecuencias absolutas simples.
2. Utilizando la frmula:
Mo Linf c
1 2
hallando:
1 fi fi 1 = 11- 6= 5
2 fi fi 1 = 11-5= 6
73
5
Mo 100 6
= 102.72
56
Interpretacin:
La mayora de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia de
103 puntos.
74
Sesin N 6
MEDIDAS DE POSICIN
6.1. MEDIDAS DE POSICIN
Son estadgrafos que dividen a una serie de datos en cuatro, diez o cien partes iguales.
Estas medidas son:
- Cuartiles
- Deciles
- Percentiles
25%
25%
Q2
Q3
25%
25%
total
100%
( j )n
4 Fi 1
Q j Linf c
fi
Donde:
j
: 1,2 3
Linf : Lmite inferior del intervalo de la clase cuartlica.
n
: Nmero total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartlica.
fi
: Frecuencia absoluta simple de la clase cuartlica.
c
: Amplitud intervlica.
6.1.2. Deciles (Di )
Son estadgrafos que dividen a la informacin en diez partes iguales, donde cada uno de ellos es el
10% de la informacin.
75
Esquemticamente se tiene:
D1
10%
D2
10%
. . .
10%
D9
10%
Total
100%
( j )n
10 Fi 1
D j Linf c
fi
Donde:
j
: 1,2, 3, 9
Linf : Lmite inferior del intervalo de la clase declica.
n
: Nmero total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase declica.
fi
: Frecuencia absoluta simple de la clase declica.
c
: Amplitud intervlica.
1%
1%
. . .
1%
P2
P99
1%
total
100%
( j )n
100 Fi 1
Pj Linf c
fi
Donde:
76
j
Linf
n
Fi-1
fi
c
:
:
:
:
:
:
1,2, 3, 99
Lmite inferior del intervalo de la clase percentlica.
Nmero total de datos.
Frecuencia absoluta acumulada anterior a la clase Percentlica.
Frecuencia absoluta simple de la clase percentlica.
Amplitud intervlica.
Observacin:
Generalmente se calculan las medidas de posicin para datos agrupados, pues se tiene una gran
cantidad de informacin.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas)
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos los cuartiles 1 y 3, los deciles 2 y 8 y los percentiles 10 y 90.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES
DEL CI DE 50 ESTUDIANTES DE LA UPeU
Intervalo de clase
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
Total
Xi
91
97
103
109
115
121
127
fi
9
6
11
5
8
3
8
50
Fi
9
15
26
31
39
42
50
P10
Q1,D2
Q3,D8
P90
Solucin
Cuartil 1 (Q1)
Proceso
1. Se ubica la clase o fila cuartlica (donde se encuentra el primer cuartil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.
i f
4
(1)50
12.5
4
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 12.5.
En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F2 = 15 y es el
inmediatamente superior a 12.5.
3. La segunda fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en
la frmula.
( j )n
4 Fi 1
Q j Linf c
fi
77
Linf
n
Fi-1
fi
c
Cuartil 1 ser:
(1)50
4 9
Q1 94 6
97.5
6
Interpretacin:
El 25% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 98 puntos, aproximadamente el 75% restante tienen ms de 98 puntos.
Cuartil 3 (Q3)
Proceso
1. Se ubica la clase o fila cuartlica (donde se encuentra el tercer cuartil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.
j (n) (3)50
37.5
4
4
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 37.5.
En nuestro ejemplo corresponde a la quinta fila, pues su frecuencia acumulada es F5 = 39 y es el
inmediatamente superior a 37.5.
3. La quinta fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en la
frmula.
Linf
n
Fi-1
fi
c
:
:
:
:
: Amplitud intervlica: = 6
El cuartil 3 ser:
(3)(50)
4 31
Q3 112 6
116.87
8
Interpretacin:
El 75% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 117 puntos, aproximadamente el 25% restante tienen ms de 117 puntos.
78
Decil 2 (D2)
Proceso:
1. Se ubica la clase o fila declica (donde se encuentra el segundo decil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu decil se desea encontrar; ya sea el 1, 2, , 9.
j (n) (2)50
10
10
10
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 15.
En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F2 = 15 y es el
inmediatamente superior a 10.
3. La segunda fila es la clase declica y de all se considera los datos que van a ser reemplazados en
la frmula.
Li
n
Fi-1
fi
c
:
:
:
:
: Amplitud intervlica: = 6
El decil 2 ser:
(2)(50)
10 9
D2 94 6
95
6
Interpretacin:
El 20% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 95 puntos, aproximadamente el 80% restante tienen ms de 95 puntos.
Percentil 10 (P10)
Proceso
a. Se ubica la clase o fila percentlica (donde se encuentra el percentil 10), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2, ,
99.
j (n) (10)50
5
100
100
b. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 5.
En nuestro ejemplo corresponde a la primera fila, pues su frecuencia acumulada es F2 = 9 y es el
inmediatamente superior a 5.
c.
La primera fila es la clase percentlica y de all se considera los datos que van a ser remplazados
79
en la frmula.
Li
n
Fi-1
fi
c
El percentil 10 ser:
(10)(50)
100 0
P10 88 6
91.3
9
Interpretacin:
El 10% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 91.3 puntos, aproximadamente el 90% restante tienen ms de 91.3 puntos.
EJERCICIOS PROPUESTOS
1)
2)
b) La mediana
c) La moda
3)
La media mnima para aprobar una asignatura es 11. Si un estudiante obtiene la notas 13.5, 14,
9.5, 12, 8.5, 8, 11.5, 10 en los trabajos mensuales de la asignatura en cuestin, el estudiante
fue aprobado?
4)
85
84
35
74
61
59
55
67
98
65
33
65
81
47
41
53
78
39
66
94
52
74
50
54
91
77
48
60
66
88
65
57
35
68
55
45
69
76
73
89
Se pide:
80
1
15
2
10
3
5
4
3
6)
Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en cm)
151
152
154
155
159
159
160
161
161
161
161
162
163
163
164
165
166
165
166
166
166
166
166
167
167
167
167
168
168
168
168
168
168
168
168
168
168
169
169
169
169
169
169
169
169
170
170
170
170
170
170
170
171
171
171
172
172
172
173
173
173
173
174
174
174
175
175
175
176
176
176
176
176
177
177
177
177
178
178
178
179
179
180
180
180
181
181
181
181
182
182
182
183
184
185
186
187
188
189
190
Calcular las medidas de tendencia central, posicin, dispersin y de forma. Interpretar los
resultados.
7)
Obtenga la media y la mediana para cada uno de los siguientes conjuntos de nmeros:
1) 1, 5, 9, 13, 17 2) 1, 3, 9, 27, 81 3) 1, 4, 9, 16, 25
a)
b)
c)
8)
9)
Total
EDAD
Nmero de casos
5
15
25
35
45
55
5
10
20
22
13
5
14
24
34
44
54
64
75
81
10)
En la tabla siguiente se muestra los puntajes obtenidos por 36 alumnos en una prueba de
razonamiento matemtico:
Yi-1 - Yi
fi
hi
Fi
Hi
Yi
42 - 51
51 - 60
60 - 69
69 - 78
78 87
87 - 96
11
10
2
5
3
5
0.35
0.28
0.055
0.14
0.08
0.14
82
Autoevaluacin
CONCEPTUAL
1.
)
)
)
)
)
PROCEDIMENTAL
2.
3.
4.
b) La mediana
c) La moda
Nmero de casos
5
10
20
22
13
5
75
83
Sesin N 7
MEDIDAS DE DISPERSIN
7.1. Medidas de dispersin
Son estadgrafos que cuantifican el grado de concentracin o de dispersin de los valores de la
variable en torno a un promedio o valor central de la distribucin. Las medidas de dispersin se
necesitan para dos propsitos bsicos:
a) Para verificar la confiabilidad de los promedios y
b) Para que sirva como base para el control de la variacin de la misma.
Las principales medidas de dispersin o variabilidad son:
- Varianza
- Desviacin estndar
- Coeficiente de variacin
7.1.1. Varianza (s2 )
Es una medida que cuantifica el grado de dispersin o de variacin de los valores de una variable
cuantitativa con respecto a su media aritmtica.
Es el promedio de la suma de los cuadrados de las desviaciones de la variable respecto a su media.
Cuando el resultado de la varianza es un valor grande, se dice que los datos se encuentran bastantes
dispersos o alejados de la media aritmtica; si el resultado es bastante pequeo los datos estarn
bastante cercanos o concentrados alrededor de la media aritmtica.
Se obtiene de acuerdo a lo siguiente:
a) Varianza para datos simples (en serie):
n( x ) 2
n 1
Donde:
Cada valor de la muestra se eleva al cuadrado luego se suma todos los valores.
=
=
f n(Y )2
n 1
Donde:
Y
n
f = Cada marca de clase elevado al cuadrado y multiplicado por su frecuencia absoluta simple,
=
s s2
Es uno de los estadsticos de mayor uso en el cual las unidades de la variable ya no estn elevados al
cuadrado sino estn en unidades originales.
7.1.3. Coeficiente de variacin (c.v. % )
Es el cociente de la desviacin estndar y la media aritmtica, expresado en porcentaje. As:
s
cv % .100
x
-
Datos HOMOGNEOS
Datos HETEROGNEOS
Ejemplo:
Correspondiente a datos simples (informacin en serie):
Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de
Ciencias Contables y Administrativas:
Edad:
Xi: 18, 20,
23, 18
Solucin:
La varianza (s2) :
Proceso:
x 18 20 23 17 18 19 23 18 156 19.5
n
s2
n( x ) 2
n 1
3080 8(19.5) 2
5.43
8 1
No tiene interpretacin prctica, slo se calcula para poder determinar la desviacin estndar.
s s 2 5.43 2.33 2
Interpretacin:
Las edades de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas se
dispersan respecto al valor central en aproximadamente 2 aos.
El coeficiente de variacin (cv%):
cv%
s
2.33
.100
.100 11.95% 12%
x
19.5
Interpretacin:
Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas):
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos la varianza, desviacin estndar y coeficiente de variacin para datos agrupados.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmites
de
clases
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
Total
Xi
fi
Fi
91
97
103
109
115
121
127
9
6
9
15
11
5
8
3
8
50
Xi fi
819
582
26 1133
31 545
39
920
42
363
50
1016
5378
Xi 2fi
74529
56454
116699
59405
105800
43923
129032
585842
Solucin:
La varianza (s2) :
Proceso:
86
Media
x f
f
5378
107.56 107
50
f n( x ) 2
n 1
585842-50(107.56) 2
150.70
50 1
No tiene interpretacin prctica, slo se calcula para poder determinar la desviacin estndar.
s s 2 150.70 12.27
Interpretacin:
El cociente de inteligencia de los alumnos de la Universidad Peruana Unin se dispersa respecto al
valor central en aproximadamente 13 puntos.
El coeficiente de variacin (cv%):
cv%
s
12.27
.100
.100 11.40% 12%
x
107.56
Interpretacin:
Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.
87
Sesin N 8
MEDIDAS DE FORMA
8.1. Medidas de forma
Son aquellos que permiten identificar la distribucin de la informacin.
8.1.1. Asimetra (As)
Permite identificar hacia dnde se acumula la informacin. Se obtiene mediante la siguiente frmula:
As
S:
x Mo
s
As
Q3 Q1 2Q2
Q3 Q1
As = 0 La distribucin es simtrica
As > 0 La distribucin es positiva
As < 0 La distribucin es negativa
PLATICRTICA
Fig.1
MESOCRTICA
Fig.2
LEPTOCRTICA
Fig.3
Q3 Q1
2( P90 P10 )
Donde:
Q1 = primer cuartil
88
Q3 = tercer cuartil
Xi
91
97
103
109
115
121
127
fi
9
6
11
5
8
3
8
Fi
9
15
26
31
39
42
50
P10
Q1,D2
Q2
Q3
D8
P90
50
Solucin
La Asimetra (As):
Proceso:
Calcular los cuartiles 1, 2 y 3, como se hizo en el ejemplo de las medidas de posicin.
(1)50
4 9
Q1 94 6
97.5
6
(2)(50)
4 15
Q2 100 6
105.45
11
89
(3)(50)
4 31
Q3 112 6
116.87
8
As
0.17
Q3 Q1
116.87 97.5
Interpretacin:
Como la asimetra tiende a cero, la informacin es simtrica.
El coeficiente de Kurtosis (k):
Proceso:
Calcular los cuartiles 1 y 3 y los percentiles 10 y 90, como se hizo en el ejemplo de las medidas de
posicin
(1)50
4 9
Q1 94 6
97.5
6
(3)(50)
4 31
Q3 112 6
116.87
8
(10)(50)
100 0
P10 88 6
91.3
9
(90)(50)
100 42
P90 124 6
126.25
8
Q3 Q1
116.87 97.5
0.27
2( P90 P10 ) 2(126.25 91.3)
Interpretacin
Como k es igual 0.27 y este nmero es mayor que 0.263, entonces, la informacin es leptocrtica.
90
EJERCICIOS PROPUESTOS
1)
C.V
C.V%
700
300
250
0,10
0,20
0,36
10%
20%
36%
2)
En una empresa, el salario medio de los hombres es de S/. 4000 con una desviacin estndar de
s/. 1500 y el de las mujeres es un promedio de s/. 3000 con desviacin estndar de s/. 1200.
Hallar el Coeficiente de Variacin de los salarios de los hombres y mujeres. Interprete.
3)
yj
(0-2
4
(2-4
6
(4-6
5
(6-8
3
(8-12
12
(12-16
14
(16-20
20
DISTRIBUCION B
yj-1
nj
4)
yj
(4-8
10
(20-24
21
Una prueba de conocimiento, A, se calific sobre 20 puntos dando una media de 12 y una
desviacin estndar de 2 puntos. Mientras que una prueba de aptitud, B, se calific sobre 100
puntos, dando una media de 70 y una desviacin estndar de 5.
a) En cul de las dos pruebas los puntajes son ms homogneos?
b) Si Juan tiene 14 en A y Luis 73 en B, quin tiene mejor puntuacin estndar.
5)
6)
Se toman las medidas de 80 personas, las que tiene estatura media de 1,70mt. y desviacin
estndar de 3.4cm. Posteriormente se verific que la medida usada en la medicin tena 4 cm.
menos. Rectifique los estadgrafos mencionados.
7)
Conteste lo siguiente:
a) Si la varianza de una distribucin de edades es 19.9809, entonces la desviacin estndar de
dicha distribucin es:
a1) 399.23636
a2) 9.99045
a3) 19.9809
a4) 4.47
b) Calcular el C.V. de: y=5x + 4 sabiendo x =240, V(x)=64
b1) 4.0%
b2) 3.2%
b3) 5.1%
b4) 3.0%
8)
91
Autoevaluacin
CONCEPTUAL
1.
PROCEDIMENTAL
2.
3.
yj
Nj
nj
23
yjnj
300
400
350
17
( 100 - 120]
440
50
Grupo 1: 86, 81, 79, 73, 95, 86, 94, 90, 86, 88
Grupo 2: 16, 19, 13, 20, 14, 16, 19, 18, 17, 15
a) Calcule la media y la desviacin en cada grupo, cul de los grupos
es ms homogneo?
ACTITUDINAL
92
5.
En una empresa deseas saber cmo estn dispersos los valores de las
edades, con respecto a la media aritmtica, de todos los trabajadores,
qu medida de resumen utilizaras y porqu?
93
94