Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística General
PRESENTACIÓN
Este módulo contiene la sumilla, las competencias, los contenidos agrupados en 5 unidades. Unidad 1:
Conceptos fundamentales y la organización de la información, Unidad 2: Medidas de resumen: análisis
e interpretación de los resultados, Unidad 3: Nociones de probabilidad: propiedades, análisis
combinatorio, Unidad 4: Distribuciones de probabilidad y Unidad 5: Distribuciones muestrales. Además,
en el mismo módulo se encuentra la metodología, la evaluación y la bibliografía. Por ejemplo, se
trabajará la metodología activa, además, se ejercerá la evaluación de acuerdo con los indicadores,
criterios y condiciones registrados en el desarrollo de cada unidad. Este módulo comprende una
bibliografía básica y especializada.
Estadística General Mg. María Vallejos Atalaya
ÍNDICE
Sesión Nº1
CONCEPTOS FUNDAMENTALES Y ORGANIZACIÓN DE LA INFORMACIÓN
1.1 Generalidades
1.1.1 Definición de estadística
1.1.2. Ramas de la estadística
1.1.3. Población
1.1.4. Muestra
1.1.5. Unidad estadística
1.1.6. Dato estadístico
1.1.7. Parámetro
1.1.8. Estadístico o estadígrafo
1.1.9. Variable estadística
Sesión Nº 2
ETAPAS DEL MÉTODO ESTADÍSTICO
2.1. Etapas del método estadístico
2.1.1. Planificación del estudio
2.1.2. Recolección de la información
2.1.2.1. Método de recolección de la observación
2.1.2.2. Muestreo
2.1.2.3. Determinación del tamaño de muestra
2.1.3. Presentación u organización de la información
2.1.3.1. Revisión y corrección de la información recogida
2.1.3.2. Presentación de la información mediante cuadros
2.1.3.3. Presentación de la información mediante gráficos
2.1.4. Análisis e interpretación de los resultados
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN
Sesión Nº 3
ORGANIZACIÓN DE LA INFORMACIÓN: TABLAS Y GRÁFICOS ESTADÍSTICOS
3.1. Tablas de frecuencias o distribución de frecuencias
3.1.1. Distribución de frecuencias de una variable discreta
2.1.2. Distribución de frecuencias para datos agrupados
Sesión Nº 4
REPRESENTACIÓN DE LA INFORMACIÓN
4.1. Presentación de la información mediante gráficos
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN
Sesión Nº5
MEDIDAS DE RESUMEN
5.1. Análisis e interpretación de los resultados
5.2. Medidas de tendencia central
5.2.1. La media o promedio aritmético ( x )
5.2.1. Mediana (Me)
5.1.3. La moda (Mo)
Sesión Nº 6
MEDIDAS DE POSICIÓN
6.1. Medidas de posición
6.1.1. Cuartiles (Qi )
6.1.2. Deciles (Di )
6.1.3. Percentiles (Pi )
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN
Sesión Nº 7
MEDIDAS DE DISPERSIÓN
7.1. Medidas de dispersión
7.1.1. Varianza (s2 )
7.1.2. Desviación estándar (s )
7.1.3. Coeficiente de variación (c.v. % )
Sesión Nº 8
MEDIDAS DE FORMA
8.1. Medidas de forma.
8.1.1. Asimetría (As)
8.1.2. Coeficiente de Kurtosis o apuntamiento (K)
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN
Sesión Nº9
PROBABILIDAD
9.1. Introducción
9.2. Análisis combinatorio
9.2.1. Factorial de un número (!)
9.2.2. Permutaciones
9.2.3 variaciones
9.2.4. Combinaciones
9.2.5. Propiedad
Sesión Nº 10
ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
10.1. Algunos conceptos básicos de probabilidad
10.1.1. Experimento
10.1.2. Espacio muestral
Estadística General Mg. María Vallejos Atalaya
Sesión Nº 11
PROBABILIDAD CONDICIONAL
11.1. Probabilidad condicional
11.2. Regla de la multiplicación de eventos
11.4. Teorema de bayes
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN
Sesión Nº12
PROBABILIDAD BÁSICA
12.1. Las distribuciones de probabilidades básicas
12.2. Las variables aleatorias
12.3. Las distribuciones de probabilidad
12.3.1. La distribución binomial
12.3.1.1.1. Propiedades de una distribución binomial
12.3.1.1.2. Uso de tablas de la distribución binomial
12.3.1.1.3. Media y desviación estándar de una distribución binomial
12.3.2. La distribución de poisson
12.3.2.1. La fórmula de poisson
12.3.2.2. Uso de tablas de la distribución acumulada de poisson
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN
Sesión Nº 13
DISTRIBUCIÓN NORMAL
13.1. Distribución normal
13.1.1. Uso de tablas de distribución acumulada normal estándar
EJERCICIOS PROPUESTOS
EVALUACIÓN
AUTOEVALUACIÓN
Sesión Nº14
DISTRIBUCIONES MUESTRALES
14.1. Distribuciones muestrales
14.2. Muestreo
14.3. Etapas del muestreo
14.4. Las distribuciones muestrales de probabilidad
Estadística General Mg. María Vallejos Atalaya
Sesión Nº 15
DISTRIBUCIÓN MUESTRAL DE UNA PROPORCIÓN
15.1. Distribución muestral de una proporción
15.2. Distribución muestral de la diferencia de dos medias
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN
REFERENCIAS BIBLIOGRÁFICAS
APÉNDICES
Apéndice Nº 1 Números aleatorios
Apéndice Nº 2 Tabla de la distribución acumulada binomial
Apéndice Nº 3 Distribución de poisson - términos acumulativos
Apéndice Nº 4 Distribución acumulativa normal
Mg. María Vallejos Atalaya
SUMILLA
15
Mg. María Vallejos Atalaya
UNIDAD I:
TEORÍA ESTADÍSTICA
Sesión Nº1:
Conceptos fundamentales y organización de la información
Sesión Nº2:
Etapas del Método Estadístico
Sesión Nº3:
Organización de la información: tablas y gráficos estadísticos
Sesión Nº4:
Representación de la Organización
16
Mg. María Vallejos Atalaya
COMPETENCIAS
17
Mg. María Vallejos Atalaya
Sesión Nº 1
CONCEPTOS FUNDAMENTALES Y
ORGANIZACIÓN DE LA INFORMACIÓN
1.1 GENERALIDADES
La estadística es una ciencia que nos proporciona un conjunto de métodos y técnicas para la
recolección, clasificación, presentación, análisis e interpretación de los datos, con la finalidad de
realizar una toma de decisión más efectiva.
Estadística descriptiva
Consiste en recolectar, clasificar, presentar y describir los datos válidos únicamente para la población
objeto de estudio, utilizando tablas, gráficos y algunas medidas de resumen. No se efectúan inferencias
para un grupo mayor.
Estadística inferencial
Se emplea para generalizar conclusiones válidas para una población a partir de datos obtenidos de
una muestra extraída de dicha población.
1.1.3. Población
Es el conjunto de todos los individuos, objetos u observaciones que poseen al menos una característica
común, que son objetos de estudio. Se representa con la letra N.
Ejemplo:
1. Las edades de los estudiantes de la UPeU.
2. Los errores que presentan las facturas del supermercado “La Unión”.
a) Población objeto. Considerada como el conjunto de elementos que son objeto de estudio.
Ejemplo.
1. Conjunto de los alumnos de la UPeU.
2. Conjunto de facturas del supermercado “La Unión”.
La población de acuerdo al número de elementos que la forman puede ser finita o infinita.
Población finita: Es aquella que tiene un número limitado de elementos.
Ejemplo:
16
Mg. María Vallejos Atalaya
Población infinita: Es aquella que tiene un número indeterminado de elementos. No se refiere a que
no se puede contar, sino que es imposible ubicar a todos los elementos de la población.
Ejemplo:
1.1.4. Muestra
Es adecuada cuando el tamaño de la muestra tiene una magnitud suficiente que permita confiar en la
estabilidad de las características presentes en la muestra. La adecuación asegura la confiabilidad de la
muestra.
Es el elemento que pertenece a la población objeto de estudio. Dicho elemento contiene las
características, atributos que el individuo o fenómeno puede poseer.
Ejemplo:
1. Para un ingeniero que verifica la calidad de productos elaborados por una empresa, la unidad
estadística son los productos terminados.
2. Para un auditor que verifica los estados financieros de una empresa en el balance general, cuentas
clientes, la unidad estadística son las facturas por cobrar.
Son números o medidas que han sido recopilados como resultado de observaciones que pueden ser
comparados, analizados e interpretados.
Ejemplo:
1.1.7. Parámetro
Es una medida de resumen que describe alguna característica de toda la población objeto de estudio.
17
Mg. María Vallejos Atalaya
Es una característica de la población que interesa al investigador y que toma diferentes valores.
Se denota con las letras: X, Y, Z, etc.
Ejemplo:
1. Edad 2. Profesión
3. Ingreso familiar 4. Estado Civil
5. Estatura 6. Nivel socioeconómico
a. Variables cualitativas
Ejemplo:
- Lugar de procedencia (norte, centro sur, oriente)
- Estado civil (soltero, casado, viudo, divorciado, conviviente).
Estas variables a su vez pueden clasificarse según la escala de medición en:
Es aquella que no lleva ninguna ordenación en sus posibles modalidades (datos estadísticos).
Ejemplo:
- Estado civil: soltero, casado, viudo divorciado, conviviente (en estas clasificaciones no hay
ordenación jerárquica, si quisiéramos forzar la ordenación y pondríamos al soltero en primer lugar,
quién iría segundo, el casado o el conviviente y luego el viudo o el divorciado).
- Filiación religiosa: católico, adventista, mormón, …
Es aquella que busca ordenar sus casos en términos del grado que posee una determinada
característica.
Ejemplo:
- Nivel socio-económico: alto, medio, bajo
- Rendimiento: excelente, bueno regular malo, pésimo.
b. Variables cuantitativas
18
Mg. María Vallejos Atalaya
Es aquella cuyos datos estadísticos son numéricos y se obtiene como resultado de mediciones o
conteos.
Ejemplo:
- Sueldos: 800, 1500, 935, 450, …
- Notas: 12, 19, 16, 08, 10, …
Ejemplo:
- Temperatura corporal: 36º, 37º, 38º (una persona no puede tener 0º de temperatura, porque estaría
muerta).
- Peso: 20kg, 35kg, 58kg.
Ejemplo:
- Notas: 0, 1, 2, 3, …, 20 (empieza desde cero)
- Edad: 0, 1, 2, …
i) Variable discreta
Son aquellas que toman valores numéricos aislados y no pueden tomar ningún valor entre dos
números consecutivos fijados (sólo asume números enteros).
Ejemplo:
- Nº de hijos: 0, 1, 2, 3, … (no puede existir 2.5 porque sería ilógico pensar en 2 hijos y medio)
- Nº de facturas que presentan errores: 0, 1, 2, 3,…
19
Mg. María Vallejos Atalaya
Sesión Nº 2
a. Directa.- Cuando los datos son recolectados directamente de la fuente de origen. Ésta puede ser
mediante la observación o el interrogatorio.
b. Indirecta.- Cuando los datos provienen de datos recogidos por otros individuos en este caso se
habla de fuentes secundarias.
Ejemplo:
20
Mg. María Vallejos Atalaya
Ejemplo:
Censos hechos en el Perú cada 10 años.
Ejemplo:
Estudios de investigación realizados por algún investigador.
2.1.2.2. Muestreo
Es la técnica mediante la cual se obtiene la muestra representativa y adecuada.
a. Permite conocer con relativa aproximación determinada característica de una población de gran
tamaño, dentro de un costo razonable y en menor tiempo.
b. Permite mayor exactitud de los resultados, puesto que los factores artificiales de variación pueden
controlarse.
c. Cuando la población es infinita o muy grande, entonces, el estudio sólo podrá realizarse a través de
una muestra.
d. Cuando se trata de ensayos destructivos o no recuperables, necesariamente se tendrá que utilizar
una muestra.
e. Una limitación de la muestra, es que, por buena que pueda ser la muestra y los cuidados puestos
en ella, siempre existe el sesgo debido a factores aleatorios. Dicho riesgo debe ser establecido a
priori por el investigador de modo que se tenga suficiente garantía de la muestra seleccionada.
Se determina el tamaño de muestra utilizando la fórmula siguiente, para una muestra sacada de una
población finita cuya fuente es Arkin y Colton.
N
n
N 1 k 2 1
NOTAS
Donde:
Ejemplo:
Seleccionar el tamaño de la muestra para la población que está constituida por 1500 estudiantes de la
UPeU, utilizando un error de muestreo del 25% y 5%.
Solución:
si: k = 25%, para reemplazar este valor en la fórmula, primero debemos convertir a real, es decir, k =
25/100 = 0.25
1500
n 15.84 16 alumnos
1500 1 0.25 1
2
21
Mg. María Vallejos Atalaya
si: k = 5%, para reemplazar este valor en la fórmula, primero debemos convertir a real, es decir, k =
5/100 = 0.05.
1500
n 315.96 316 alumnos
1500 1 0.05 1
2
a) La escritura.
b) Las respuestas inconsistentes.
c) Las respuestas incompletas.
d) Las unidades en las cifras son diferentes.
a. Histograma de frecuencias
b. Polígono de frecuencias
c. Polígono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo
Para el análisis e interpretación de los resultados nos basamos en los cuadros y gráficos, y en las
medidas de resumen de la serie de datos.
EJERCICIOS PROPUESTOS
1. Indique cuáles de los términos u operaciones siguientes se relacionan con una muestra o con una
población:
22
Mg. María Vallejos Atalaya
embarque.
2. En los siguientes enunciados, indicar si se trata de una Muestra (M) o una Población (P):
a. rendimiento académico
b. velocidad de lectura
c. peso contenido en un paquete de cereales
d. categoría de docente
e. número de artículos defectuosos producidos
f. número de unidades de un artículo en existencia
g. grado de desnutrición
h. asistencia a los cultos devocionales
i. patrón conductual
j. cultura organizacional
k. tipo de alimentación
l. número de hermanos
m. grado de instrucción
n. estado civil.
5. Clasifique las variables e indique el tipo de escala en que están medidas las siguientes
características:
a) Profesión
b) Año de nacimiento
c) Nacionalidad
d) Grado de instrucción
e) ingreso mensual familiar promedio
f) Número de teléfono
g) Grado de instrucción
h) Número de hijos
6. Utilizando la fórmula determine el tamaño de la muestra, considerando los datos que se mencionan
a continuación.
a). N = 1 500 k = 3%
b) N = 2 000 k = 10%
c) N = 5 000 k = 2%
d) N = 500 k = 10%
e) N = 1 000 k = 5%
23
Mg. María Vallejos Atalaya
24
Mg. María Vallejos Atalaya
Autoevaluación
CONCEPTUAL
PROCEDIMENTAL
ACTITUDINAL
28
Mg. María Vallejos Atalaya
Sesión Nº 3
ORGANIZACIÓN DE LA INFORMACIÓN:
TABLAS Y GRÁFICOS ESTADÍSTICOS
Frecuencia absoluta simple ( f i ): Se llama al número de veces que aparece repetido dicho valor, en
un conjunto de valores realizadas. La suma de todas las frecuencias es igual al total “ n ” de datos
observados.
Se denota mediante: fi
m
Propiedad: f1 f 2 ... f m f i n
i 1
Frecuencia absoluta acumulada (Fi): Es igual a la suma de las frecuencias absolutas simples
inferiores o iguales a las frecuencias acumuladas que se desea encontrar.
Se denota mediante: Fi
Propiedad:
F1 f q
F2 f1 f 2
.
.
.
Fm f1 f 2 ... f m
Se denota mediante: hi
29
Mg. María Vallejos Atalaya
m
Propiedad: h1 h2 ... hm h
i 1
i 1
Propiedad:
H1 hq
H 2 h1 h2
.
.
.
H m f1 h2 ... hm
Una distribución de frecuencias es un arreglo de los valores observados x1,...xm de una variable X con
sus respectivas frecuencias, en una tabla de la forma:
Valores fi Fi hi Hi
de X
x1 f1 F1 h1 H1
x2 f2 F2 h2 H2
. . . . .
. . . . .
. . . . .
xk Fm F m= n Hm Hm = 1
Total fi=n hi=1
Ejemplo:
EDAD (X): 19, 20, 23, 20, 18, 20, 25, 18, 18, 20, 25, 23.
Solución
EDAD fi Fi hi Hi
18 3 3 0.25 0.25
19 1 4 0.08 0.33
20 4 8 0.33 0.66
23 2 10 0.17 0.83
25 2 12 0.17 1.00
Total 12 1.00
La suma de las frecuencias relativas simples (hi) siempre debe ser igual a uno, en caso de error de
redondeo no diera 1, hay que ajustar, es decir, hay que sumar o restar 1 dígito a cualquier número para
conseguir la suma de 1.
30
Mg. María Vallejos Atalaya
F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al número 10.
h3: Indica la fecuencia relativa absoluta simple de la tercera fila y corresponde al número 0.33. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza
multiplicando el número por 100, así 0.33x100 = 33%.
H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al número 0.83. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando el número por 100, así 0.83x100 = 83%
Interpretación:
Las frecuencias absolutas interpretan la variable en su fila, en cambio las frecuencias acumuladas
interpretan desde el principio hasta su fila.
Observación:
Cuando se realiza una observación en una muestra o en una población, se puede presentar los
siguientes casos:
Que se hayan hecho pocas observaciones y por lo tanto, la variable estadística tome pocos
valores.
Que se hayan hecho muchas observaciones y sin embargo, la variable estadística toma muy pocos
valores diferentes.
Que se hayan hecho muchas observaciones y la variable toma muchos valores distintos.
(*) Los dos primeros casos caerán dentro del estudio de variable discreta.
(*) El tercer caso se agrupará los valores de la variable en intervalos adecuadamente para no perder
mucha información.
Para la elaboración de esta tabla se debe tener en cuenta las definiciones siguientes:
- Intervalos o límites de clase: se identifica por tener su límite superior y su límite inferior. Los
extremos de los intervalos no se repiten.
Ejemplo:
15-19 LCI=15 y LCS=19
20-24
25-29
- Amplitud interválica (c): Llamado también ancha de clase, es la cantidad de datos que están
comprendidos en un intervalo de clase.
LCI LCS
Xi
2
31
Mg. María Vallejos Atalaya
Ejemplo:
La marca de clase para el primer intervalo será:
Xi
15 19 17
2
REGLA GENERAL PARA LA CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS DE
UNA VARIABLE CONTINUA AGRUPADA EN INTERVALOS
Dado “ n ” valores de una variable cuantitativa X continua, o discreta con más de 20 valores
distintos, uno de los métodos para construir la distribución de frecuencias es:
1) Determinar el Rango: “ R ”
Observación: El resultado que se obtenga de “k” será redondeado al entero inmediato mayor.
Ejemplo:
Si k 6.32 entonces, k 7 (Número de intervalos igual a 7).
Si k 6.84 entonces, k 7 (Número de intervalos igual a 7).
3) Determinar la Amplitud del intervalo: “c”
Ejemplo:
Los siguientes datos son puntajes del cociente de inteligencia (CI) de 50 alumnos de la UPeU. Con
base en estos puntajes, preparar la tabla de distribución de frecuencias.
32
Mg. María Vallejos Atalaya
1) Determinar el Rango: “ R ”
k 1 3.322log(n)
n: Número total de datos.
Observación: El resultado que se obtenga de “k” será redondeado al entero inmediato mayor.
Ejemplo:
Si k 6.32 entonces, k 7 (Número de intervalos igual a 7).
Si k 6.84 entonces, k 7 (Número de intervalos igual a 7).
Tabla Nº 1
Límite de Yi fi Fi hi Hi
clase
88 – 94 91 9 9 0.18 0.18
94 – 100 97 6 15 0.12 0.3
100 – 106 103 11 26 0.22 0.52
106 – 112 109 5 31 0.1 0.62
112 – 118 115 8 39 0.16 0.78
118 – 124 121 3 42 0.06 0.84
124 – 130 127 8 50 0.16 1.00
50 1.00
f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al número 11.
F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al número 31.
h3: Indica la relativa absoluta simple de la tercera fila y corresponde al número 0.22. Para interpretar se
debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza multiplicando
al número por 100, así 0.22x100 = 22% .
H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al número 0.62. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando al número por 100, así 0.62x100 = 62%
Interpretación:
f3: Existen 11 estudiantes de la Universidad Peruana Unión que tienen un cociente intelectual que
varía de 100 a 106 puntos.
33
Mg. María Vallejos Atalaya
F4: Existen 31 estudiantes de la Universidad Peruana Unión que tienen un cociente intelectual que
varía de 106 a 112 puntos
h3: El 20% de estudiantes de la Universidad Peruana Unión tienen un cociente intelectual que varía de
100 a 106 puntos
H4: El 62% de estudiantes de la Universidad Peruana Unión tienen un cociente intelectual que varía de
106 a 112 puntos
Las frecuencias relativas interpretan la variable en su fila, en cambio, las frecuencias acumuladas
interpretan la variable desde el principio hasta su fila.
A continuación señalamos los elementos necesarios que deben tenerse en cuenta para la presentación
de información estadística mediante cuadros.
1. Nº de cuadro
2. Título: Debe responder las siguientes preguntas:
a. ¿Qué información contiene el cuerpo del cuadro?
CUADRO Nº 1
COCIENTE DE Nº DE %
INTELIGENCIA ALUMNOS
88 – 94 9 18
94 – 100 6 12
100 – 106 11 22
106 – 112 5 10
112 – 118 8 16
118 – 124 3 6
124 – 130 8 16
TOTAL 50 100
Fuente: Test aplicado por los investigadores.
34
Mg. María Vallejos Atalaya
Sesión Nº 4
REPRESENTACIÓN DE LA INFORMACIÓN
4.1. PRESENTACIÓN DE LA INFORMACIÓN MEDIANTE GRÁFICOS
a. Histograma de frecuencias
b. Polígono de frecuencias
c. Polígono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo
a. Histograma de frecuencias
Se usa:
Se construye:
1. Se coloca los intervalo de clase en el eje horizontal (eje de las abscisas o eje x).
Ejemplo:
Considere el ejemplo de tabla de distribución de frecuencia para datos agrupados del “Puntajes del
Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU”.
35
Mg. María Vallejos Atalaya
b. Polígono de frecuencias
Se usa:
Se construye:
Ejemplo:
Considerando el ejemplo de la tabla de distribución de frecuencias para datos agrupados, en el cual
estudiamos el “Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU”.
fi
10 11
8
9
9 5
8
7
3
6 6
5 8
4
3
2
1
x
91 97 103 109 115 121 127
Se usa:
Se construye:
2. Se levanta el punto del extremo superior de cada límite de intervalo de clase a la altura de la
frecuencia absoluta acumulada o relativa acumulada.
Ejemplo:
Considerando el ejemplo de la tabla de distribución de frecuencias para datos agrupados, en el cual
estudiamos el “Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU”
36
Mg. María Vallejos Atalaya
fi
50
50 42
45 39
40
35
31
30
25
26
20
15 15
10 9
5
x
88 94 100 106 112 118 124 130
d. Barras
Se usa:
Para representar variables cualitativas.
Se construye:
1. Se ubica en el eje x las categorías de la variable, utilizando intervalos y separando
aproximadamente la mitad del intervalo entre una categoría y otra.
Ejemplo:
Facultad Nº de alumnos
1. Ciencias Contables y Administrativas 500
2. Teología 200
3. Ciencias de la Salud 250
4. Educación y Ciencias Humanas 250
5. Ingeniería 300
Total 1500
fi
50
50 0
045
040
035
030
30
025 25 25 0
020 20 0 0
0 0
15
100
0 50
x
1 2 3 4 5
e. Bastones
Se usa:
37
Mg. María Vallejos Atalaya
Se construye:
1. Se ubica en el eje x los valores de la variable, separando equitativamente entre uno y otro valor,
2. Se levanta utilizando una línea recta para cada valor de la variable, a la altura de la frecuencia
absoluta simple o relativa y se termina con un punto, en forma de alfiler.
Ejemplo:
No de Hijos (xi) 0 1 2 3 4 5
Nº de familias (fi) 3 7 12 20 15 5
NOTAS
fi
20
20
15
15
12
10 7
5
5
3
x
1 2 3 4 5
f. Sectores
Se usa:
Para representar una variable cualitativa cuyo principal interés es conocer su frecuencia relativa.
Se construye:
1. Se particiona a una circunferencia equitativamente, considerando que ésta constituye el 100%,
2. Se efectúa la partición, según la frecuencia relativa simple lo considere y se ubican las categorías
de la variable en cada partición.
Ejemplo:
VIVIENDA
20% ALIMENTA
OTROS
Rubro hi % CIÓN
5%
30%
Diezmo 10 VESTIDO
10%
Vivienda 20 EDUCACIÓ
N
Alimentación 30 20%
Vestido 10
DIEZMO
Educación 20 10% RECREAC.
Recreación 5 5%
Otros 5
Total 100
38
Mg. María Vallejos Atalaya
g. Series de tiempo
Son curvas idénticas al del polígono de frecuencias pero sus extremos no tocan el eje de las abscisas.
Se usa:
Cuando la variable de interés es el tiempo.
Ejemplo:
fi
40
35
30
COLEGIO 1
25
20 COLEGIO 2
15 COLEGIO 3
10
5
0 X
1991 1992 1993 1994 1995 AÑOS
A continuación señalamos los elementos necesarios que deben tenerse en cuenta para la presentación
de información estadística mediante gráficos.
1. Nº de gráfico
2. Título: Debe responder las siguientes preguntas:
39
Mg. María Vallejos Atalaya
Ejemplo:
La representación gráfica para el ejemplo de datos agrupados de los datos del “Puntajes del Cociente
de Inteligencia (CI) de 50 Estudiantes de la UPeU”.
GRÁFICO Nº 1
COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIÓN - LIMA,
2001
EJERCICIOS PROPUESTOS
1. En una encuesta de opinión acerca de las preferencias de una marca de bebida gaseosa por sus
colores: Amarillo (A), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas:
B, R, R, B, R, A, A, B, B, A
B, A, A, R, B, A, B, R, B, A
Ingresos fi Fi hi
160 170
170 180 48 60
40
Mg. María Vallejos Atalaya
3.2. Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en
cm)
3.3 El gerente de una compañía registra el número de cierto trabajo, completados por los
empleados. Cincuenta empleados realizan el mismo trabajo, divididos en dos grupos de 25
y en salones diferentes.
a) Combinar todos los puntajes y obtener la distribución de frecuencias con tamaño de clase
k=10.
b) Obtener la distribución de frecuencias por cada salón y realice la gráfica adecuada.
80.6 65.8 49.6 79.1 84.4 66.2 79.3 59.4 72.9 73.6
53.2 60.2 91.2 74.8 78.6 81.4 58.6 68.2 67.4 55.6
76.9 77.4 67.9 63.7 49.9 46.4 68.8 67.3 72.3 75.8
41
Mg. María Vallejos Atalaya
88.3 94.6 57.3 87.3 74.3 73.2 90.4 76.3 52.7 71.7
75.6 41.8 73.6 71.4 83.2 67.4 99.3 62.3 89.2 86.8
65.2 62.1 44.8 82.9 81.7 70.4 74.6 76.9 85.7 40.9
54.2 75.3 50.1 61.1 42.3 68.6 56.2 70.8 47.3 66.9
80.2 60.2 71.6 77.1 94.9 61.4 82.1 78.3 51.2 79.3
42
Mg. María Vallejos Atalaya
Autoevaluación
CONCEPTUAL
PROCEDIMENTAL
60 53 85 77 33 45 52 65 77 84
65 41 74 55 57 78 50 35 64 74
71 39 35 60 81 76 91 55 73 59
47 94 54 98 68 66 48 69 85 67
80 94 61 88 41 89 66 73 42 65
Se pide:
a) Determinar el rango.
b) Número de clases o filas.
c) Amplitud de las clases o filas.
d) Frecuencias absolutas y relativas simples, absolutas y relativas acumuladas.
Interpretar por lo menos 2 de cada fila.
3. Al investigar el nivel socioeconómico en los valores: Bajo (B), medio (M), alto (A), 20
familias dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B
4. Dibujar un diagrama de sectores para mostrar los gastos de un hospital de una gran
ciudad, siendo éstos los siguientes: 73% en sueldos, honorarios profesionales
médicos y bonificaciones a los empleados; 13% en suministros, equipo médico y
quirúrgico; 8% en mantenimiento, alimentación y energía; y 6% en costos
administrativos.
ACTITUDINAL
42
Mg. María Vallejos Atalaya
UNIDAD II:
MEDIDAS ESTADÍSTICAS
Sesión Nº5:
Medidas de resumen
Sesión Nº6:
Medidas de posición
Sesión Nº7:
Medidas de dispersión
Sesión Nº8:
Medidas de forma
43
Mg. María Vallejos Atalaya
COMPETENCIAS
44
Mg. María Vallejos Atalaya
Sesión Nº 5
MEDIDAS DE RESUMEN
Se estudió los cuadros y gráficos estadísticos en la unidad anterior como formas para ordenar y
describir un conjunto de datos para tomar decisiones. Sin embargo, el análisis resulta incompleto, para
esto se utiliza ciertos indicadores.
Estos indicadores llamados medidas de resumen o ESTADÍGRAFOS permiten hallar un solo valor
numérico, el mismo que representa a toda la población o muestra en estudio.
Son estadísticos que permiten hallar el valor numérico que indica el "centro" de un conjunto de datos;
señalando la característica que destaca en la información.
Proceso: Sumar todos los valores de la variable y dividir entre el número de datos que se han sumado.
_
x
x n
b) Media aritmética para datos agrupados (en tablas):
Proceso: Sumar todos los valores de la variable o marca de clase multiplicados por la frecuencia
absoluta simple y dividir entre el número de datos o la suma de las frecuencias absolutas simples.
x
xf
f
Ventajas de la media aritmética:
67
Mg. María Vallejos Atalaya
Es el estadístico que representa el punto medio de los datos en el cual cae el 50% de puntuaciones. Se
obtiene de acuerdo a lo siguiente:
a) Mediana para datos simples (en serie):
Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la serie
es par); del conjunto de datos previamente ordenados en forma creciente.
AÑOS fi 1 Fi 2
Primero 25 25
Segundo 14 39 Clase
Tercero 6 45 mediana.
Cuarto 9 54
Quinto 2 56
Total 56
Proceso:
n
=
f
56
28
2 2 2
2. El valor inmediatamente superior o igual a 28 se busca en la columna de la tabla que corresponde
a la frecuencia absoluta acumulada Fi (en este ejemplo corresponde a 39, porque 25 es menor
que 28).
3. Luego se observa la primera columna donde se encuentra la variable, en la fila donde se observó el
número 39, el valor de la variable que se encuentra en esa fila corresponde a la mediana.
Me = Segundo.
Interpretación: La mitad de los estudiantes repitentes lo hacen como máximo hasta segundo año,
aproximadamente la otra mitad repiten categorías superiores al segundo año.
Cuando los datos se encuentran agrupados en una tabla de distribución de frecuencias, la mediana se
encuentra utilizando la siguiente fórmula:
n
Fi 1
Me Linf c
2
fi
Donde
1
fi : frecuencia absoluta simple
2
Fi : frecuencia absoluta acumulada.
68
Mg. María Vallejos Atalaya
- No está afectada por valores extremos, y por lo tanto es más representativa que el promedio,
cuando las series son poco simétricas.
- Es útil cuando los datos agrupados tienen clases abiertas en los extremos (es decir, no tiene límite
inferior en la primera clase ni límite superior en la última clase).
- Se aplica a variables que pertenecen a la escala ordinal.
Ejemplo:
Hallar la moda para la siguiente información que consiste en una muestra de 100 consumidores según
preferencia por tipos de panes Unión.
TIPOS DE CONSUMIDORES
PANES (fi)
Integral 25
Americano 20
Fibra 40
Hamburguesa 15
Total 100
Clase modal,
por ser el valor más frecuente (f =40)
Entonces, la moda será el valor que corresponde a la categoría de la variable, en la clase o fila modal.
Mo = Fibra
Interpretación:
La mayoría de los consumidores de Productos Unión prefiere pan fibra.
1
Mo Linf c
1 2
Donde
Linf : Límite inferior del intervalo que contiene a la moda
69
Mg. María Vallejos Atalaya
Ventajas de la moda:
Desventajas de la moda:
Ejemplo:
Correspondiente a datos simple (información en serie):
Los datos presentados corresponden a las edades de 8 alumnos del 1er año de la Facultad de
Ciencias Contables y Administrativas:
Edad :
Xi: 18, 20, 23, 17, 18, 19, 23, 18
Solución:
Media
x
x 18 20 23 17 18 19 23 18 156 19.5 20
n 8 8
Interpretación
La edad promedio de los alumnos del 1er año de la Facultad de Ciencias Contables y Administrativas
es de 20 años.
Mediana
Me: Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la
serie es par); del conjunto de datos previamente ordenados en forma creciente.
En este caso la serie es par, por lo tanto, se procede del siguiente modo:
1º Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23
70
Mg. María Vallejos Atalaya
3º la mediana será la semisuma de los dos valores centrales, por ser la serie par, es decir 8 datos.
18 19
Me 18.5 19
2
Interpretación:
La mitad de los de los alumnos del 1er año de la Facultad de Ciencias Contables y Administrativas
tiene como máximo 19 años, aproximadamente la otra mitad tienen más de 19 años.
Moda
1º Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23
Mo = 18
Interpretación:
La mayoría de los alumnos del 1er año de la Facultad de Ciencias Contables y Administrativas tiene de
20 años de edad.
Ejemplo:
Tabla Nº 1
Solución:
La columna de las marcas de clase denotada por Xi, se obtiene por la formula dada anteriormente en la
Unidad 1.
71
Mg. María Vallejos Atalaya
LCI LCS
Xi
2
88 94
X1 91
2
94 100
X2 97
2
100 106
X3 103
2
.
.
124 130
X7 127
2
La columna de Xi fi : se obtiene multiplicando valor por valor la columna de las marcas de clase
denotada por Xi por las frecuencias absolutas simple denotada por fi:
Así:
X1 f1 = 91 x 9 = 819
X2f2 = 97 x 6 = 582
X3 f3 = 103 x 11 = 1133
X7 f7 = 127 x 8 = 1016
Observación: Las sumas de cada columna se encuentran en la fila que corresponde al total (al final de
las columnas).
x
x fi i
819 582 1133 545 920 363 1016
f i 9 6 11 5 8 3 8
5378
107.56 107
50
Interpretación:
Mediana:
Proceso:
Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 25.
72
Mg. María Vallejos Atalaya
La cuarta fila es la clase mediana y de allí se considera los datos que van a ser reemplazados en la
fórmula.
2. Utilizando la fórmula:
n
Fi 1
Me Linf c
2
fi
c : Amplitud interválica: 6
La mediana será:
50
15
Me 100 6 = 105.45
2
11
Interpretación:
Moda
Proceso:
1. Se ubica la clase o fila modal (donde se encuentra la moda), ubicando en la columna de las
frecuencias absolutas simples (fi) el mayor valor.
En nuestro ejemplo, la clase modal o fila donde se encuentra la moda es la tercera fila porque en
ella se encuentra el mayor valor de las frecuencias absolutas simples.
2. Utilizando la fórmula:
1
Mo Linf c
1 2
hallando:
1 fi fi 1 = 11- 6= 5
2 fi fi 1 = 11-5= 6
73
Mg. María Vallejos Atalaya
5
Mo 100 6 = 102.72
56
Interpretación:
74
Mg. María Vallejos Atalaya
Sesión Nº 6
MEDIDAS DE POSICIÓN
Son estadígrafos que dividen a una serie de datos en cuatro, diez o cien partes iguales.
- Cuartiles
- Deciles
- Percentiles
Son estadígrafos que dividen a la información en cuatro partes iguales, donde cada uno de ellos es el
25% de la información.
Esquemáticamente se tiene:
Q1 25%
Q2
25% Q3
25%
25%
total 100%
( j )n
4 Fi 1
Q j Linf c
fi
Donde:
j : 1,2 ó 3
Linf : Límite inferior del intervalo de la clase cuartílica.
n : Número total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartílica.
fi : Frecuencia absoluta simple de la clase cuartílica.
c : Amplitud interválica.
Son estadígrafos que dividen a la información en diez partes iguales, donde cada uno de ellos es el
10% de la información.
75
Mg. María Vallejos Atalaya
Esquemáticamente se tiene:
D1 10%
D2
10% D9
. . .
10%
10%
Total 100%
( j )n
10 Fi 1
D j Linf c
fi
Donde:
j : 1,2, 3, … ó 9
Linf : Límite inferior del intervalo de la clase decílica.
n : Número total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase decílica.
fi : Frecuencia absoluta simple de la clase decílica.
c : Amplitud interválica.
Son estadígrafos que dividen a la información en cien partes iguales, donde cada uno de ellos es el 1%
de la información.
Esquemáticamente se tiene:
P1 1%
P2
1% P99
. . .
1%
1%
total 100%
( j )n
100 Fi 1
Pj Linf c
fi
Donde:
76
Mg. María Vallejos Atalaya
j : 1,2, 3, … ó 99
Linf : Límite inferior del intervalo de la clase percentílica.
n : Número total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase Percentílica.
fi : Frecuencia absoluta simple de la clase percentílica.
c : Amplitud interválica.
Observación:
Generalmente se calculan las medidas de posición para datos agrupados, pues se tiene una gran
cantidad de información.
Ejemplo:
Tabla Nº 1
Intervalo de clase Xi fi Fi
[88 – 94> 91 9 9 P10
[94 – 100> 97 6 15 Q1,D2
[100 – 106> 103 11 26
[106 – 112> 109 5 31
[112 – 118> 115 8 39 Q3,D8
[118 – 124> 121 3 42 P90
[124 – 130> 127 8 50
Total 50
Solución
Cuartil 1 (Q1)
Proceso
1. Se ubica la clase o fila cuartílica (donde se encuentra el primer cuartil), utilizando la siguiente
fórmula, el valor i, se reemplaza de acuerdo a qué cuartil se desea encontrar; ya sea el 1, 2 ó 3.
i f (1)50
12.5
4 4
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 12.5.
3. La segunda fila es la clase cuartílica y de allí se considera los datos que van a ser reemplazados en
la fórmula.
( j )n
4 Fi 1
Q j Linf c
fi
77
Mg. María Vallejos Atalaya
Cuartil 1 será:
(1)50
4 9
Q1 94 6 97.5
6
Interpretación:
Cuartil 3 (Q3)
Proceso
1. Se ubica la clase o fila cuartílica (donde se encuentra el tercer cuartil), utilizando la siguiente
fórmula, el valor i, se reemplaza de acuerdo a qué cuartil se desea encontrar; ya sea el 1, 2 ó 3.
j (n) (3)50
37.5
4 4
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 37.5.
3. La quinta fila es la clase cuartílica y de allí se considera los datos que van a ser reemplazados en la
fórmula.
El cuartil 3 será:
(3)(50)
4 31
Q3 112 6 116.87
8
Interpretación:
78
Mg. María Vallejos Atalaya
Decil 2 (D2)
Proceso:
1. Se ubica la clase o fila decílica (donde se encuentra el segundo decil), utilizando la siguiente
fórmula, el valor i, se reemplaza de acuerdo a qué decil se desea encontrar; ya sea el 1, 2, … , ó 9.
j (n) (2)50
10
10 10
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 15.
3. La segunda fila es la clase decílica y de allí se considera los datos que van a ser reemplazados en
la fórmula.
El decil 2 será:
(2)(50)
10 9
D2 94 6 95
6
Interpretación:
Percentil 10 (P10)
Proceso
a. Se ubica la clase o fila percentílica (donde se encuentra el percentil 10), utilizando la siguiente
fórmula, el valor i, se reemplaza de acuerdo a qué cuartil se desea encontrar; ya sea el 1, 2, …, ó
99.
j (n) (10)50
5
100 100
b. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 5.
c. La primera fila es la clase percentílica y de allí se considera los datos que van a ser remplazados
79
Mg. María Vallejos Atalaya
en la fórmula.
El percentil 10 será:
(10)(50)
100 0
P10 88 6 91.3
9
Interpretación:
EJERCICIOS PROPUESTOS
Determine e interprete:
3) La media mínima para aprobar una asignatura es 11. Si un estudiante obtiene la notas 13.5, 14,
9.5, 12, 8.5, 8, 11.5, 10 en los trabajos mensuales de la asignatura en cuestión, ¿el estudiante
fue aprobado?
Se pide:
80
Mg. María Vallejos Atalaya
5) A continuación tenemos la distribución del número de accidentes por día durante 43 días, en
cierta autopista.
Nº de accidentes 0 1 2 3 4
Nº de días 10 15 10 5 3
b) ¿Cuál es el porcentaje de días en que se tuvo dos o más accidentes por día?
6) Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en cm)
151 152 154 155 159 159 160 161 161 161 161 162
163 163 164 165 166 165 166 166 166 166 166 167
167 167 167 168 168 168 168 168 168 168 168 168
168 169 169 169 169 169 169 169 169 170 170 170
170 170 170 170 171 171 171 172 172 172 173 173
173 173 174 174 174 175 175 175 176 176 176 176
176 177 177 177 177 178 178 178 179 179 180 180
180 181 181 181 181 182 182 182 183 184 185 186
187 188 189 190
Calcular las medidas de tendencia central, posición, dispersión y de forma. Interpretar los
resultados.
7) Obtenga la media y la mediana para cada uno de los siguientes conjuntos de números:
1) 1, 5, 9, 13, 17 2) 1, 3, 9, 27, 81 3) 1, 4, 9, 16, 25
5 - 14 5
15 - 24 10
25 - 34 20
35 - 44 22
45 - 54 13
55 - 64 5
Total 75
81
Mg. María Vallejos Atalaya
10) En la tabla siguiente se muestra los puntajes obtenidos por 36 alumnos en una prueba de
razonamiento matemático:
Yi-1´ - Yi´ fi hi Fi Hi
Yi
42 - 51 11 0.35
51 - 60 10 0.28
60 - 69 2 0.055
69 - 78 5 0.14
78 – 87 3 0.08
87 - 96 5 0.14
82
Mg. María Vallejos Atalaya
Autoevaluación
CONCEPTUAL
PROCEDIMENTAL
Determine e interprete:
ACTITUDINAL
83
Mg. María Vallejos Atalaya
Sesión Nº 7
MEDIDAS DE DISPERSIÓN
7.1. Medidas de dispersión
Cuando el resultado de la varianza es un valor grande, se dice que los datos se encuentran bastantes
dispersos o alejados de la media aritmética; si el resultado es bastante pequeño los datos estarán
bastante cercanos o concentrados alrededor de la media aritmética.
s 2
x 2
n( x ) 2
n 1
Donde:
x 2
Cada valor de la muestra se eleva al cuadrado luego se suma todos los valores.
n = Tamaño de la muestra. (número de datos).
x = Media para datos simples.
s 2
Y 2
f n(Y )2
n 1
Donde:
Y 2
f = Cada marca de clase elevado al cuadrado y multiplicado por su frecuencia absoluta simple,
luego se suman todos los valores.
n = Tamaño de la muestra.
84
Mg. María Vallejos Atalaya
s s2
Es uno de los estadísticos de mayor uso en el cual las unidades de la variable ya no están elevados al
cuadrado sino están en unidades originales.
s
cv % .100
x
Si C.V.A < C.V.B Los datos de la serie A presentan una menor variabilidad con respecto a los
datos de la serie B
Ejemplo:
Los datos presentados corresponden a las edades de 8 alumnos del 1er año de la Facultad de
Ciencias Contables y Administrativas:
Edad:
Solución:
La varianza (s2) :
Proceso:
x
x 18 20 23 17 18 19 23 18 156 19.5
n 8 8
x 2
182 202 232 172 182 192 232 182 3080
85
Mg. María Vallejos Atalaya
s2
x 2
n( x ) 2
3080 8(19.5) 2
5.43
n 1 8 1
No tiene interpretación práctica, sólo se calcula para poder determinar la desviación estándar.
s s 2 5.43 2.33 2
Interpretación:
Las edades de los alumnos del 1er año de la Facultad de Ciencias Contables y Administrativas se
dispersan respecto al valor central en aproximadamente 2 años.
s 2.33
cv% .100 .100 11.95% 12%
x 19.5
Interpretación:
Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.
Ejemplo:
Tabla Nº 1
Límites de Xi fi Fi Xi fi Xi 2fi
clases
[88 – 94> 91 9 9 819 74529
[94 – 100> 97 6 15 582 56454
[100 – 106> 103 11 26 1133 116699
[106 – 112> 109 5 31 545 59405
[112 – 118> 115 8 39 920 105800
[118 – 124> 121 3 42 363 43923
[124 – 130> 127 8 50 1016 129032
Total 50 5378 585842
Solución:
La varianza (s2) :
Proceso:
86
Mg. María Vallejos Atalaya
Media
x
x f
i i
819 582 1133 545 920 363 1016
f i 9 6 11 5 8 3 8
5378
107.56 107
50
x 2
f 912 (9) 97 2 (6) 1032 (11) 1092 (5) 1152 (8)
1212 (3) 127 2 (8) 585842
s 2
x 2
f n( x ) 2
585842-50(107.56) 2
150.70
n 1 50 1
No tiene interpretación práctica, sólo se calcula para poder determinar la desviación estándar.
s s 2 150.70 12.27
Interpretación:
s 12.27
cv% .100 .100 11.40% 12%
x 107.56
Interpretación:
Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.
87
Mg. María Vallejos Atalaya
Sesión Nº 8
MEDIDAS DE FORMA
Permite identificar hacia dónde se acumula la información. Se obtiene mediante la siguiente fórmula:
x Mo Q3 Q1 2Q2
As o As
s Q3 Q1
Indica el grado de aplastamiento que tiene la distribución. De acuerdo a ello se clasifican en:
distribuciones platicúrticas (Fig.1), mesocúrticas (Fig.2) y leptocúrticas (Fig.3).
PLATICÚRTICA MESOCÚRTICA
Fig.1 Fig.2
LEPTOCÚRTICA
Fig.3
Q3 Q1
k
2( P90 P10 )
88
Mg. María Vallejos Atalaya
Ejemplo:
Correspondiente a datos agrupados (información en tablas):
Tabla Nº 1
Intervalo de clase Xi fi Fi
[88 – 94> 91 9 9 P10
[94 – 100> 97 6 15 Q1,D2
[100 – 106> 103 11 26 Q2
[106 – 112> 109 5 31
[112 – 118> 115 8 39 Q3
[118 – 124> 121 3 42 D8
[124 – 130> 127 8 50 P90
Total 50
Solución
La Asimetría (As):
Proceso:
(1)50
4 9
Q1 94 6 97.5
6
(2)(50)
4 15
Q2 100 6 105.45
11
89
Mg. María Vallejos Atalaya
(3)(50)
4 31
Q3 112 6 116.87
8
Interpretación:
Proceso:
Calcular los cuartiles 1 y 3 y los percentiles 10 y 90, como se hizo en el ejemplo de las medidas de
posición
(1)50
4 9
Q1 94 6 97.5
6
(3)(50)
4 31
Q3 112 6 116.87
8
(10)(50)
100 0
P10 88 6 91.3
9
(90)(50)
100 42
P90 124 6 126.25
8
Q3 Q1 116.87 97.5
k 0.27
2( P90 P10 ) 2(126.25 91.3)
Interpretación
Como k es igual 0.27 y este número es mayor que 0.263, entonces, la información es leptocúrtica.
90
Mg. María Vallejos Atalaya
EJERCICIOS PROPUESTOS
s x C.V C.V%
Directivos 70 700 0,10 10%
Empleados 60 300 0,20 20%
Obreros 90 250 0,36 36%
2) En una empresa, el salario medio de los hombres es de S/. 4000 con una desviación estándar de
s/. 1500 y el de las mujeres es un promedio de s/. 3000 con desviación estándar de s/. 1200.
Hallará el Coeficiente de Variación de los salarios de los hombres y mujeres. Interprete.
DISTRIBUCIÓN A
DISTRIBUCION B
4) Una prueba de conocimiento, A, se calificó sobre 20 puntos dando una media de 12 y una
desviación estándar de 2 puntos. Mientras que una prueba de aptitud, B, se calificó sobre 100
puntos, dando una media de 70 y una desviación estándar de 5.
a) ¿En cuál de las dos pruebas los puntajes son más homogéneos?
b) Si Juan tiene 14 en A y Luis 73 en B, ¿quién tiene mejor puntuación estándar.
6) Se toman las medidas de 80 personas, las que tiene estatura media de 1,70mt. y desviación
estándar de 3.4cm. Posteriormente se verificó que la medida usada en la medición tenía 4 cm.
menos. Rectifique los estadígrafos mencionados.
7) Conteste lo siguiente:
a) Si la varianza de una distribución de edades es 19.9809, entonces la desviación estándar de
dicha distribución es:
a1) 399.23636 a2) 9.99045
a3) –19.9809 a4) 4.47
91
Mg. María Vallejos Atalaya
Autoevaluación
CONCEPTUAL
PROCEDIMENTAL
Grupo 1: 86, 81, 79, 73, 95, 86, 94, 90, 86, 88
Grupo 2: 16, 19, 13, 20, 14, 16, 19, 18, 17, 15
ACTITUDINAL
92
Mg. María Vallejos Atalaya
5. En una empresa deseas saber cómo están dispersos los valores de las
edades, con respecto a la media aritmética, de todos los trabajadores,
¿qué medida de resumen utilizarías y porqué?
93
Mg. María Vallejos Atalaya
94