Está en la página 1de 64

Estadística General Mg.

María Vallejos Atalaya

Estadística General

Mg. María Vallejos Atalaya


Estadística General Mg. María Vallejos Atalaya

PRESENTACIÓN

El módulo de «Estadística General» tiene la naturaleza teórico- práctica, pertenece al área de


Formación Básica, en el I ciclo, con un total de 4 horas y 3 créditos. Asimismo, responde a las
exigencias curriculares de los programas académicos y de los diseños curriculares de la Facultad de
Ciencias Empresariales y sus respectivas carreras académicas profesionales, en el contexto de los
perfiles, las visiones y las misiones institucionales educativas y profesionales.

Tiene el propósito de proporcionar al futuro profesional los conocimientos necesarios de la estadística,


que le permitirá investigar y resolver problemas con el quehacer de su carrera profesional. El mundo
actual que vivimos, ha provocado incertidumbre en las personas que tienen que tomar decisiones en
las diferentes funciones que les toca desempeñar, ya sea en las instituciones gubernamentales,
comerciales, de negocios públicos y privados. La estadística es una herramienta intelectual que ayuda
a tomar decisiones racionales, porque sabemos que «El pasado puede evaluarse, el presente puede
ser descrito y el futuro puede ser previsto».

El sistema modular no es sino un encuentro de los alumnos y profesores en espacios diseñados y


establecidos previamente, con mucha inteligencia, selección adecuada y pertinente de los contenidos,
instrumentos y metodología, cuyos alcances de autoaprendizajes serán coronados en la grandeza de
los alumnos participantes, especialmente de quienes quedan inmersos en los programas académicos a
distancia, cuya dinámica académica se ha estandarizado y responde al uso de las tecnologías
modernas. En este sentido, el módulo ha sido diseñado para desarrollarlo en dos fases: una a distancia
y la otra presencial (tutorial) que comprende 10 tutorías presenciales.

Este módulo contiene la sumilla, las competencias, los contenidos agrupados en 5 unidades. Unidad 1:
Conceptos fundamentales y la organización de la información, Unidad 2: Medidas de resumen: análisis
e interpretación de los resultados, Unidad 3: Nociones de probabilidad: propiedades, análisis
combinatorio, Unidad 4: Distribuciones de probabilidad y Unidad 5: Distribuciones muestrales. Además,
en el mismo módulo se encuentra la metodología, la evaluación y la bibliografía. Por ejemplo, se
trabajará la metodología activa, además, se ejercerá la evaluación de acuerdo con los indicadores,
criterios y condiciones registrados en el desarrollo de cada unidad. Este módulo comprende una
bibliografía básica y especializada.
Estadística General Mg. María Vallejos Atalaya

ÍNDICE

UNIDAD I: TEORÍA ESTADÍSTICA

Sesión Nº1
CONCEPTOS FUNDAMENTALES Y ORGANIZACIÓN DE LA INFORMACIÓN
1.1 Generalidades
1.1.1 Definición de estadística
1.1.2. Ramas de la estadística
1.1.3. Población
1.1.4. Muestra
1.1.5. Unidad estadística
1.1.6. Dato estadístico
1.1.7. Parámetro
1.1.8. Estadístico o estadígrafo
1.1.9. Variable estadística

Sesión Nº 2
ETAPAS DEL MÉTODO ESTADÍSTICO
2.1. Etapas del método estadístico
2.1.1. Planificación del estudio
2.1.2. Recolección de la información
2.1.2.1. Método de recolección de la observación
2.1.2.2. Muestreo
2.1.2.3. Determinación del tamaño de muestra
2.1.3. Presentación u organización de la información
2.1.3.1. Revisión y corrección de la información recogida
2.1.3.2. Presentación de la información mediante cuadros
2.1.3.3. Presentación de la información mediante gráficos
2.1.4. Análisis e interpretación de los resultados
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN

Sesión Nº 3
ORGANIZACIÓN DE LA INFORMACIÓN: TABLAS Y GRÁFICOS ESTADÍSTICOS
3.1. Tablas de frecuencias o distribución de frecuencias
3.1.1. Distribución de frecuencias de una variable discreta
2.1.2. Distribución de frecuencias para datos agrupados

Sesión Nº 4
REPRESENTACIÓN DE LA INFORMACIÓN
4.1. Presentación de la información mediante gráficos
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN

UNIDAD II: MEDIDAS ESTADÍSTICAS


Estadística General Mg. María Vallejos Atalaya

Sesión Nº5
MEDIDAS DE RESUMEN
5.1. Análisis e interpretación de los resultados
5.2. Medidas de tendencia central
5.2.1. La media o promedio aritmético ( x )
5.2.1. Mediana (Me)
5.1.3. La moda (Mo)

Sesión Nº 6
MEDIDAS DE POSICIÓN
6.1. Medidas de posición
6.1.1. Cuartiles (Qi )
6.1.2. Deciles (Di )
6.1.3. Percentiles (Pi )
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN

Sesión Nº 7
MEDIDAS DE DISPERSIÓN
7.1. Medidas de dispersión
7.1.1. Varianza (s2 )
7.1.2. Desviación estándar (s )
7.1.3. Coeficiente de variación (c.v. % )

Sesión Nº 8
MEDIDAS DE FORMA
8.1. Medidas de forma.
8.1.1. Asimetría (As)
8.1.2. Coeficiente de Kurtosis o apuntamiento (K)
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN

UNIDAD III: PROBABILIDAD

Sesión Nº9
PROBABILIDAD
9.1. Introducción
9.2. Análisis combinatorio
9.2.1. Factorial de un número (!)
9.2.2. Permutaciones
9.2.3 variaciones
9.2.4. Combinaciones
9.2.5. Propiedad

Sesión Nº 10
ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
10.1. Algunos conceptos básicos de probabilidad
10.1.1. Experimento
10.1.2. Espacio muestral
Estadística General Mg. María Vallejos Atalaya

10.1.3. Suceso o evento


10.1.4. Operaciones con eventos
10.1.5. Eventos mutuamente excluyentes
10.2. Probabilidad de un evento
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN

Sesión Nº 11
PROBABILIDAD CONDICIONAL
11.1. Probabilidad condicional
11.2. Regla de la multiplicación de eventos
11.4. Teorema de bayes
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN

UNIDAD IV: PROBABILIDAD Y DISTRIBUCIÓN

Sesión Nº12
PROBABILIDAD BÁSICA
12.1. Las distribuciones de probabilidades básicas
12.2. Las variables aleatorias
12.3. Las distribuciones de probabilidad
12.3.1. La distribución binomial
12.3.1.1.1. Propiedades de una distribución binomial
12.3.1.1.2. Uso de tablas de la distribución binomial
12.3.1.1.3. Media y desviación estándar de una distribución binomial
12.3.2. La distribución de poisson
12.3.2.1. La fórmula de poisson
12.3.2.2. Uso de tablas de la distribución acumulada de poisson
EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN

Sesión Nº 13
DISTRIBUCIÓN NORMAL
13.1. Distribución normal
13.1.1. Uso de tablas de distribución acumulada normal estándar
EJERCICIOS PROPUESTOS
EVALUACIÓN
AUTOEVALUACIÓN

UNIDAD V: DISTRIBUCIONES DE MUESTREO

Sesión Nº14
DISTRIBUCIONES MUESTRALES
14.1. Distribuciones muestrales
14.2. Muestreo
14.3. Etapas del muestreo
14.4. Las distribuciones muestrales de probabilidad
Estadística General Mg. María Vallejos Atalaya

14.5. Distribuciones de muestreo de estadísticas


14.6. Distribución muestral de la media

Sesión Nº 15
DISTRIBUCIÓN MUESTRAL DE UNA PROPORCIÓN
15.1. Distribución muestral de una proporción
15.2. Distribución muestral de la diferencia de dos medias

EJERCICIOS PROPUESTOS
AUTOEVALUACIÓN
EVALUACIÓN
REFERENCIAS BIBLIOGRÁFICAS
APÉNDICES
Apéndice Nº 1 Números aleatorios
Apéndice Nº 2 Tabla de la distribución acumulada binomial
Apéndice Nº 3 Distribución de poisson - términos acumulativos
Apéndice Nº 4 Distribución acumulativa normal
Mg. María Vallejos Atalaya

SUMILLA

La asignatura de «Estadística General» tiene la naturaleza teórico- práctico, pertenece al Área de


Formación Básica, con cuatro horas, tres créditos, corresponde al I ciclo de las Carreras Académico
Profesional de Administración y Contabilidad. Pretende proporcionar los conocimientos necesarios de
la estadística, que le permitirá investigar, analizar y resolver problemas con el quehacer de su carrera
profesional, cuyo contenido son: conceptos fundamentales y la organización de la información, medidas
de resumen: análisis e interpretación de los resultados, nociones de probabilidad, distribuciones de
probabilidad y distribuciones muestrales.

15
Mg. María Vallejos Atalaya

UNIDAD I:
TEORÍA ESTADÍSTICA
Sesión Nº1:
Conceptos fundamentales y organización de la información
Sesión Nº2:
Etapas del Método Estadístico
Sesión Nº3:
Organización de la información: tablas y gráficos estadísticos
Sesión Nº4:
Representación de la Organización

16
Mg. María Vallejos Atalaya

COMPETENCIAS

CONCEPTUAL PROCEDIMENTAL ACTITUDINAL

Reconoce los diferentes Reconocen y delimitan Analizan e interpretan los


conceptos la población, muestra y resultados obtenidos en
fundamentales y variables en estudio, y las tablas y gráficos
construye tablas y además utilizan tablas y estadísticos.
gráficos de información gráficos adecuados.
estadística.

17
Mg. María Vallejos Atalaya

Sesión Nº 1

CONCEPTOS FUNDAMENTALES Y
ORGANIZACIÓN DE LA INFORMACIÓN
1.1 GENERALIDADES

1.1.1 Definición de estadística

La estadística es una ciencia que nos proporciona un conjunto de métodos y técnicas para la
recolección, clasificación, presentación, análisis e interpretación de los datos, con la finalidad de
realizar una toma de decisión más efectiva.

1.1.2. Ramas de la estadística

Estadística descriptiva
Consiste en recolectar, clasificar, presentar y describir los datos válidos únicamente para la población
objeto de estudio, utilizando tablas, gráficos y algunas medidas de resumen. No se efectúan inferencias
para un grupo mayor.

Estadística inferencial
Se emplea para generalizar conclusiones válidas para una población a partir de datos obtenidos de
una muestra extraída de dicha población.

1.1.3. Población

Es el conjunto de todos los individuos, objetos u observaciones que poseen al menos una característica
común, que son objetos de estudio. Se representa con la letra N.

La población se define de acuerdo a la característica, unidad estadística y extensión del problema


objeto de estudio.

Ejemplo:
1. Las edades de los estudiantes de la UPeU.
2. Los errores que presentan las facturas del supermercado “La Unión”.

Respecto a la característica objeto de estudio se puede distinguir:

a) Población objeto. Considerada como el conjunto de elementos que son objeto de estudio.
Ejemplo.
1. Conjunto de los alumnos de la UPeU.
2. Conjunto de facturas del supermercado “La Unión”.

b) Población objetivo. Considerada como el conjunto de observaciones, medidas de la


característica que es de interés para el estudio de la población objeto.
Ejemplo.
1. Conjunto de edades.
2. Conjunto de errores.

La población de acuerdo al número de elementos que la forman puede ser finita o infinita.
Población finita: Es aquella que tiene un número limitado de elementos.

Ejemplo:

16
Mg. María Vallejos Atalaya

1. Ventas efectuadas durante un año en una tienda determinada.

2. Edades de los alumnos de la UPeU.

Población infinita: Es aquella que tiene un número indeterminado de elementos. No se refiere a que
no se puede contar, sino que es imposible ubicar a todos los elementos de la población.

Ejemplo:

1. Los síntomas de los enfermos tuberculosos de Lima.

2. Evasión de impuestos de las empresas adscritas al RUC.

1.1.4. Muestra

Es un subconjunto o parte de la población. Se examina una muestra cuando no es posible examinar


una población, ya sea por factores económicos, disponibilidad de personal o tiempo.
La muestra debe cumplir dos requisitos básicos: Debe ser representativa y adecuada.

Es representativa cuando contiene todos los sectores o aspectos de la población en la misma


proporción en que se hallan en la totalidad del universo. La representatividad asegura la calidad de la
muestra.

Es adecuada cuando el tamaño de la muestra tiene una magnitud suficiente que permita confiar en la
estabilidad de las características presentes en la muestra. La adecuación asegura la confiabilidad de la
muestra.

1.1.5. Unidad estadística

Es el elemento que pertenece a la población objeto de estudio. Dicho elemento contiene las
características, atributos que el individuo o fenómeno puede poseer.
Ejemplo:

1. Para un ingeniero que verifica la calidad de productos elaborados por una empresa, la unidad
estadística son los productos terminados.

2. Para un auditor que verifica los estados financieros de una empresa en el balance general, cuentas
clientes, la unidad estadística son las facturas por cobrar.

1.1.6. Dato estadístico

Son números o medidas que han sido recopilados como resultado de observaciones que pueden ser
comparados, analizados e interpretados.

Ejemplo:

1. Si la característica de estudio es la variable X: edad de un grupo de 5 estudiantes. El conjunto de


datos estadísticos serían los siguientes:
x1 = 17, x2 = 18, x3 = 21, x4 = 22, x5 = 19

2. Si la característica de estudio es la variable X: nº de errores ubicados en 5 facturas. El conjunto de


datos estadísticos serían los siguientes:
x1 = 2, x2 = 5 , x3 = 0, x4 = 4, x5 = 2

1.1.7. Parámetro

Es una medida de resumen que describe alguna característica de toda la población objeto de estudio.

Para determinar el valor del parámetro se requiere información de toda la población.

17
Mg. María Vallejos Atalaya

Las más usadas son:

i) Media poblacional ()


ii) Varianza poblacional (2)
iii) Desviación estándar poblacional ()
iv) Proporción poblacional (P)

1.1.8. Estadístico o estadígrafo

Es una medida de resumen que describe alguna característica de la muestra.

Las más usadas son:


i) Media Muestral ( x )
ii) Varianza muestral (s2)
iii) Desviación estándar muestral (s)
iv) Proporción muestral (p)

1.1.9. Variable estadística

Es una característica de la población que interesa al investigador y que toma diferentes valores.
Se denota con las letras: X, Y, Z, etc.

Ejemplo:

1. Edad 2. Profesión
3. Ingreso familiar 4. Estado Civil
5. Estatura 6. Nivel socioeconómico

Las variables se pueden clasificar de la siguiente manera:

a. Variables cualitativas

Son aquellas características que no se expresan cuantitativamente, constituidas por atributos.

Ejemplo:
- Lugar de procedencia (norte, centro sur, oriente)
- Estado civil (soltero, casado, viudo, divorciado, conviviente).
Estas variables a su vez pueden clasificarse según la escala de medición en:

i) Variable cualitativa nominal

Es aquella que no lleva ninguna ordenación en sus posibles modalidades (datos estadísticos).

Ejemplo:
- Estado civil: soltero, casado, viudo divorciado, conviviente (en estas clasificaciones no hay
ordenación jerárquica, si quisiéramos forzar la ordenación y pondríamos al soltero en primer lugar,
quién iría segundo, el casado o el conviviente y luego el viudo o el divorciado).
- Filiación religiosa: católico, adventista, mormón, …

ii) Variable cualitativa ordinal

Es aquella que busca ordenar sus casos en términos del grado que posee una determinada
característica.

Ejemplo:
- Nivel socio-económico: alto, medio, bajo
- Rendimiento: excelente, bueno regular malo, pésimo.

b. Variables cuantitativas

18
Mg. María Vallejos Atalaya

Es aquella cuyos datos estadísticos son numéricos y se obtiene como resultado de mediciones o
conteos.
Ejemplo:
- Sueldos: 800, 1500, 935, 450, …
- Notas: 12, 19, 16, 08, 10, …

Las variables cuantitativas según la escala de medición pueden ser:

i) Variable cuantitativa de intervalo

Es aquella que se presenta en intervalos y no necesariamente empieza del cero racional.

Ejemplo:
- Temperatura corporal: 36º, 37º, 38º (una persona no puede tener 0º de temperatura, porque estaría
muerta).
- Peso: 20kg, 35kg, 58kg.

Todos los signos vitales son variables cuantitativas de intervalo.

ii) Variable cuantitativa de razón

Es aquella que necesariamente empieza del cero racional.

Ejemplo:
- Notas: 0, 1, 2, 3, …, 20 (empieza desde cero)
- Edad: 0, 1, 2, …

Las variables cuantitativas según su naturaleza pueden ser:

i) Variable discreta

Son aquellas que toman valores numéricos aislados y no pueden tomar ningún valor entre dos
números consecutivos fijados (sólo asume números enteros).

Ejemplo:
- Nº de hijos: 0, 1, 2, 3, … (no puede existir 2.5 porque sería ilógico pensar en 2 hijos y medio)
- Nº de facturas que presentan errores: 0, 1, 2, 3,…

ii) Variable continua


Son aquellas que pueden tomar infinitos valores entre dos números, por muy próximos que los fijemos,
es decir, se presentan valores enteros así como decimales.
Ejemplo:
- Peso: 62.55 kg, 72.40 kg, 56.35 kg,...
- Talla: 1.50 mt, 1.65 mt, 1.85 mt, …

19
Mg. María Vallejos Atalaya

Sesión Nº 2

ETAPAS DEL MÉTODO ESTADÍSTICO

2.1. ETAPAS DEL MÉTODO ESTADÍSTICO

De acuerdo con el orden de aplicaciones de la estadística a un problema determinado, los métodos


estadísticos se dividen en cuatro etapas:

1. Planificación del estudio.


2. Recolección de la información.
3. Presentación u organización de la información.
4. Análisis e interpretación de los resultados.

2.1.1. Planificación del estudio

Estudia los detalles concernientes a la recolección, clasificación y análisis de la información. En base a


lo cual se definirán características de la población o se negarán o confirmarán una hipótesis de trabajo.

En esta etapa se pueden considerar los siguientes aspectos:

- Planteamiento del problema.


- Búsqueda y evaluación de la información existente.
- Formulación de hipótesis.
- Verificación de la hipótesis.
- Análisis y presentación de los resultados.

2.1.2. Recolección de la información

Los principales puntos que deben considerarse al recoger la información son:


- Los errores que puedan cometerse en la recolección de los datos y la manera de controlarlos.
- Las ventajas y limitaciones de los diversos métodos empleados en la recolección de la información.
- Las condiciones que deben reunir los individuos que se estudian y los procedimientos más
convenientes para su elección.
- El diseño de los formularios que servirán para registrar la información que se recoja.

2.1.2.1. Método de recolección de la observación

a. Directa.- Cuando los datos son recolectados directamente de la fuente de origen. Ésta puede ser
mediante la observación o el interrogatorio.

b. Indirecta.- Cuando los datos provienen de datos recogidos por otros individuos en este caso se
habla de fuentes secundarias.

En cuanto al tiempo, la recolección de datos puede clasificarse en:

Continuas: Cuando son registradas a medida que ocurren.

Ejemplo:

20
Mg. María Vallejos Atalaya

Registro civil de hechos vitales (nacimientos, defunciones y casamientos).

Periódicas: Cuando está hecho en determinados intervalos de tiempo (forma cíclica).

Ejemplo:
Censos hechos en el Perú cada 10 años.

Ocasionales: Cuando se efectúa en cualquier época.

Ejemplo:
Estudios de investigación realizados por algún investigador.

2.1.2.2. Muestreo
Es la técnica mediante la cual se obtiene la muestra representativa y adecuada.

VENTAJAS Y LIMITACIONES DEL MUESTREO

a. Permite conocer con relativa aproximación determinada característica de una población de gran
tamaño, dentro de un costo razonable y en menor tiempo.
b. Permite mayor exactitud de los resultados, puesto que los factores artificiales de variación pueden
controlarse.
c. Cuando la población es infinita o muy grande, entonces, el estudio sólo podrá realizarse a través de
una muestra.
d. Cuando se trata de ensayos destructivos o no recuperables, necesariamente se tendrá que utilizar
una muestra.
e. Una limitación de la muestra, es que, por buena que pueda ser la muestra y los cuidados puestos
en ella, siempre existe el sesgo debido a factores aleatorios. Dicho riesgo debe ser establecido a
priori por el investigador de modo que se tenga suficiente garantía de la muestra seleccionada.

2.1.2.3. Determinación del tamaño de muestra

Se determina el tamaño de muestra utilizando la fórmula siguiente, para una muestra sacada de una
población finita cuya fuente es Arkin y Colton.

N
n
 N  1 k 2  1
NOTAS

Donde:

n = tamaño de la muestra (número de elementos de la muestra)


N = tamaño de la población (número de elementos de la población)
k = error de muestreo.

Ejemplo:

Seleccionar el tamaño de la muestra para la población que está constituida por 1500 estudiantes de la
UPeU, utilizando un error de muestreo del 25% y 5%.

Solución:

si: k = 25%, para reemplazar este valor en la fórmula, primero debemos convertir a real, es decir, k =
25/100 = 0.25

1500
n  15.84  16 alumnos
1500  1 0.25 1
2

21
Mg. María Vallejos Atalaya

si: k = 5%, para reemplazar este valor en la fórmula, primero debemos convertir a real, es decir, k =
5/100 = 0.05.

1500
n  315.96  316 alumnos
1500  1 0.05 1
2

2.1.3. Presentación u organización de la información

Se consideran los tres pasos siguientes:

1. Revisión y corrección de la información recogida.


2. Presentación de la información mediante cuadros.
3. Presentación de la información mediante gráficos.

2.1.3.1. Revisión y corrección de la información recogida

Se debe revisar y corregir:

a) La escritura.
b) Las respuestas inconsistentes.
c) Las respuestas incompletas.
d) Las unidades en las cifras son diferentes.

2.1.3.2. Presentación de la información mediante cuadros

Después de la revisión de los datos recopilados, es conveniente presentar la información, de acuerdo a


algún sistema de ordenación, a fin de describirlos y analizarlos.

2.1.3.3. Presentación de la información mediante gráficos

Los gráficos más usados son:

a. Histograma de frecuencias
b. Polígono de frecuencias
c. Polígono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo

2.1.4. Análisis e interpretación de los resultados

Para el análisis e interpretación de los resultados nos basamos en los cuadros y gráficos, y en las
medidas de resumen de la serie de datos.

EJERCICIOS PROPUESTOS

1. Indique cuáles de los términos u operaciones siguientes se relacionan con una muestra o con una
población:

a) grupo de medidas llamados parámetros


b) uso de inferencia estadística
c) hacer un censo
d) juzgar la calidad de un embarque de fruta inspeccionando varios de los bultos incluidos en el

22
Mg. María Vallejos Atalaya

embarque.

2. En los siguientes enunciados, indicar si se trata de una Muestra (M) o una Población (P):

a) Número de estudiantes egresados del Instituto “YI” en el año 2004


b) Estudio de personas con proceso judicial por tráfico de drogas en el año 2000
c) Números de niños nacidos vivos en el hospital “X”
d) Estudio del 25% de pacientes con tuberculosis del distrito “DF”

3. Elabore una lista de 10 variables. Luego:

a. Identifique la población objeto.


b. Identifique la población objetivo.
c. Determine la unidad estadística.
d. Mencione algunos datos estadísticos.

4. Clasificar las siguientes variables en cualitativas (nominal y ordinal) y cuantitativas (discreta y


continua).

a. rendimiento académico
b. velocidad de lectura
c. peso contenido en un paquete de cereales
d. categoría de docente
e. número de artículos defectuosos producidos
f. número de unidades de un artículo en existencia
g. grado de desnutrición
h. asistencia a los cultos devocionales
i. patrón conductual
j. cultura organizacional
k. tipo de alimentación
l. número de hermanos
m. grado de instrucción
n. estado civil.

5. Clasifique las variables e indique el tipo de escala en que están medidas las siguientes
características:

a) Profesión
b) Año de nacimiento
c) Nacionalidad
d) Grado de instrucción
e) ingreso mensual familiar promedio
f) Número de teléfono
g) Grado de instrucción
h) Número de hijos

6. Utilizando la fórmula determine el tamaño de la muestra, considerando los datos que se mencionan
a continuación.

a). N = 1 500 k = 3%
b) N = 2 000 k = 10%
c) N = 5 000 k = 2%
d) N = 500 k = 10%
e) N = 1 000 k = 5%

7. En el siguiente enunciado identifique: población, muestra, unidad estadística, parámetro,


estadístico, variable(s), tipo de variable(s) y dé 2 ejemplos de dato estadístico.

“Con la finalidad de mejorar el servicio de la Biblioteca de la UPeU" se decidió realizar un estudio


de investigación, para lo cual se seleccionó aleatoriamente a 45 estudiantes usuarios de la
biblioteca obteniéndose los siguientes resultados:

- En promedio un alumno dedica 1 hora a la lectura en sala.

23
Mg. María Vallejos Atalaya

- El 80% afirma que la atención es buena.


- El 10% de los usuarios son recién ingresantes a la UPeU.
- En promedio un alumno se lleva 1.5 libros a su casa.

8. Identifique en cada caso: unidad elemental, variable, tipo de variable

a) consumo mensual de electricidad


b) opinión acerca de la gestión de un ministro
c) peso de niños de 5 años
d) estado civil
e) número de artículos defectuosos producidos por las máquinas de una fábrica
f) nacionalidad de personas que asisten a un congreso.

24
Mg. María Vallejos Atalaya

Autoevaluación

CONCEPTUAL

1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:

a) ( ) Una muestra es representativa si ésta contiene todas las


características de la muestra.
b) ( ) La variable es una característica que asume diferentes valores.
c) ( ) Para que una población esté bien definida, debe contener la
característica, unidad estadística y extensión.
d) ( ) Las ramas de la estadística son: estadística descriptiva e inferencial.
e) ( ) Las variables cualitativas son aquellas que son numéricas y se
obtiene como resultado del conteo

PROCEDIMENTAL

2. Los métodos de recolección de la información son: directa e indirecta. ¿Cuál


es la diferencia entre ambas?

3. Dadas las siguientes variables, colocar en la tabla en el lugar donde le


corresponde de acuerdo a su naturaleza y escala de medición.

a. Estudios diarios e. Grado de instrucción


b. Lugar de procedencia f. Sueldos
c. Velocidad de lectura g. Gastos
d. Idiomas h. Rendimiento
i. Estado civil j. Edad
k. Estatura l. Categoría de docente

Variable cualitativa Variable cuantitativa


Nominal Ordinal Discreta Continua

4. Utilizando la fórmula determine el tamaño de la muestra, considerando los


datos que se mencionan a continuación.

a) N = 500 k = 10% b) N = 1 000 k = 5%


c) N = 1 500 k = 3% d) N = 2 000 k = 10%

ACTITUDINAL

5. Considerando los conocimientos adquiridos en esta tutoría identificar las


clases de variables estadística, su naturaleza, y de esta manera poder realizar
un estudio estadístico.

28
Mg. María Vallejos Atalaya

Sesión Nº 3

ORGANIZACIÓN DE LA INFORMACIÓN:
TABLAS Y GRÁFICOS ESTADÍSTICOS

3.1. TABLAS DE FRECUENCIAS O DISTRIBUCIÓN DE FRECUENCIAS

Una distribución de frecuencias (o tabla de distribución de frecuencias) es una representación de una


serie de datos. En ella se muestra cómo se distribuyen los valores de la variable estadística junto a sus
frecuencias correspondientes a cada uno de ellos.

En estas tablas de distribución de frecuencias, como producto de la operación de tabulación (conteo),


se observa cuantos elementos (frecuencia o repetición) hay en cada categoría, valor o intervalo de la
variable.

Luego de la revisión de los datos recopilados, es conveniente presentar la información, de acuerdo a


algún sistema de ordenación, a fin de describirlos y analizarlos. A continuación se presenta algunos
conceptos y procedimientos comunes para la presentación de cuadros o tablas.

Frecuencia absoluta simple ( f i ): Se llama al número de veces que aparece repetido dicho valor, en
un conjunto de valores realizadas. La suma de todas las frecuencias es igual al total “ n ” de datos
observados.

Se denota mediante: fi
m
Propiedad: f1  f 2  ...  f m   f i  n
i 1

Frecuencia absoluta acumulada (Fi): Es igual a la suma de las frecuencias absolutas simples
inferiores o iguales a las frecuencias acumuladas que se desea encontrar.

Se denota mediante: Fi

Propiedad:
F1  f q
F2  f1  f 2
.
.
.
Fm  f1  f 2  ...  f m

Frecuencia relativa simple ( hi ): Es el cociente entre la frecuencia absoluta simple de su fila y el


número total de observaciones realizadas (n). La suma de todas las frecuencias relativas es igual a 1.
fi
Su fórmula es: hi 
n

Se denota mediante: hi

29
Mg. María Vallejos Atalaya

m
Propiedad: h1  h2  ...  hm  h
i 1
i 1

Frecuencia relativa acumulada ( H i ): Se llama al cociente entre la frecuencia absoluta acumulada de


su fila y el número de observaciones realizadas (n).
Fi
Su fórmula es: Hi 
n
Se denota mediante: Hi

Propiedad:
H1  hq
H 2  h1  h2
.
.
.
H m  f1  h2  ...  hm

Para presentación de la información mediante cuadros o tablas, es necesario construir la tabla de


distribución de frecuencias. La cual puede ser:

3.1.1. Distribución de frecuencias de una variable discreta

Una distribución de frecuencias es un arreglo de los valores observados x1,...xm de una variable X con
sus respectivas frecuencias, en una tabla de la forma:

Valores fi Fi hi Hi
de X
x1 f1 F1 h1 H1
x2 f2 F2 h2 H2
. . . . .
. . . . .
. . . . .
xk Fm F m= n Hm Hm = 1
Total fi=n hi=1

Ejemplo:

Dadas las edades de 12 estudiantes de la UPeU, construir la tabla de distribución de frecuencias.

EDAD (X): 19, 20, 23, 20, 18, 20, 25, 18, 18, 20, 25, 23.

Solución

EDAD fi Fi hi Hi
18 3 3 0.25 0.25
19 1 4 0.08 0.33
20 4 8 0.33 0.66
23 2 10 0.17 0.83
25 2 12 0.17 1.00
Total 12 1.00

La suma de las frecuencias relativas simples (hi) siempre debe ser igual a uno, en caso de error de
redondeo no diera 1, hay que ajustar, es decir, hay que sumar o restar 1 dígito a cualquier número para
conseguir la suma de 1.

f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al número 4.

30
Mg. María Vallejos Atalaya

F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al número 10.

h3: Indica la fecuencia relativa absoluta simple de la tercera fila y corresponde al número 0.33. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza
multiplicando el número por 100, así 0.33x100 = 33%.

H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al número 0.83. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando el número por 100, así 0.83x100 = 83%
Interpretación:

f3: Existen 4 alumnos que tienen 20 años de edad.

F4: Existen 10 alumnos cuyas edades varían de 18 a 23 años.

h3: El 33% de los alumnos que tienen 20 años de edad.

H4: El 83% de los alumnos tienen edades que varían de 18 a 23 años.

Las frecuencias absolutas interpretan la variable en su fila, en cambio las frecuencias acumuladas
interpretan desde el principio hasta su fila.

Observación:

Cuando se realiza una observación en una muestra o en una población, se puede presentar los
siguientes casos:
 Que se hayan hecho pocas observaciones y por lo tanto, la variable estadística tome pocos
valores.
 Que se hayan hecho muchas observaciones y sin embargo, la variable estadística toma muy pocos
valores diferentes.
 Que se hayan hecho muchas observaciones y la variable toma muchos valores distintos.

(*) Los dos primeros casos caerán dentro del estudio de variable discreta.
(*) El tercer caso se agrupará los valores de la variable en intervalos adecuadamente para no perder
mucha información.

2.1.2. Distribución de frecuencias para datos agrupados

Es una tabla en donde los datos originales se clasifican en intervalos de clase.

Para la elaboración de esta tabla se debe tener en cuenta las definiciones siguientes:
- Intervalos o límites de clase: se identifica por tener su límite superior y su límite inferior. Los
extremos de los intervalos no se repiten.

Ejemplo:
15-19 LCI=15 y LCS=19
20-24
25-29

- Amplitud interválica (c): Llamado también ancha de clase, es la cantidad de datos que están
comprendidos en un intervalo de clase.

- Marca de clase (Xi): Es el punto medio del intervalo de clase:

LCI  LCS
Xi 
2

31
Mg. María Vallejos Atalaya

Ejemplo:
La marca de clase para el primer intervalo será:

Xi 
15  19   17
2
REGLA GENERAL PARA LA CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS DE
UNA VARIABLE CONTINUA AGRUPADA EN INTERVALOS

Dado “ n ” valores de una variable cuantitativa X continua, o discreta con más de 20 valores
distintos, uno de los métodos para construir la distribución de frecuencias es:

1) Determinar el Rango: “ R ”

El rango de variación de los datos se define por:


R  X máx  X mín

2) Determinar el Número de intervalos: “k”

Utilizando la regla de Sturges:


k  1  3.322log(n)
n: Número total de datos.

Observación: El resultado que se obtenga de “k” será redondeado al entero inmediato mayor.

Ejemplo:
Si k  6.32 entonces, k  7 (Número de intervalos igual a 7).
Si k  6.84 entonces, k  7 (Número de intervalos igual a 7).
3) Determinar la Amplitud del intervalo: “c”

La amplitud del intervalo se obtiene dividiendo el rango entre el número de intervalos.


R
c
k
4) Determinar los extremos de los intervalos

Ejemplo:
Los siguientes datos son puntajes del cociente de inteligencia (CI) de 50 alumnos de la UPeU. Con
base en estos puntajes, preparar la tabla de distribución de frecuencias.

PUNTAJES DEL COCIENTE DE INTELIGENCIA (CI)


DE 50 ESTUDIANTES DE LA UPeU

91 104 113 125 101


114 105 101 89 126
118 100 111 125 109
119 95 106 120 129
89 113 118 127 129
128 107 89 122 89
114 106 105 115 98
112 103 92 125 107
97 104 105 95 91
106 93 89 100 115

32
Mg. María Vallejos Atalaya

1) Determinar el Rango: “ R ”

El rango de variación de los datos se define por:


R  X máx  X mín

2) Determinar el Número de intervalos: “k”

Utilizando la regla de Sturges:

k  1  3.322log(n)
n: Número total de datos.

Observación: El resultado que se obtenga de “k” será redondeado al entero inmediato mayor.

Ejemplo:
Si k  6.32 entonces, k  7 (Número de intervalos igual a 7).
Si k  6.84 entonces, k  7 (Número de intervalos igual a 7).

3) Determinar la Amplitud del intervalo: “c”

La amplitud del intervalo se obtiene dividiendo el rango entre el número de intervalos.


R
c
k
4) Determinar los extremos de los intervalos

Tabla Nº 1

DISTRIBUCIÓN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA


UPeU

Límite de Yi fi Fi hi Hi
clase
88 – 94 91 9 9 0.18 0.18
94 – 100 97 6 15 0.12 0.3
100 – 106 103 11 26 0.22 0.52
106 – 112 109 5 31 0.1 0.62
112 – 118 115 8 39 0.16 0.78
118 – 124 121 3 42 0.06 0.84
124 – 130 127 8 50 0.16 1.00
50 1.00

f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al número 11.

F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al número 31.

h3: Indica la relativa absoluta simple de la tercera fila y corresponde al número 0.22. Para interpretar se
debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza multiplicando
al número por 100, así 0.22x100 = 22% .

H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al número 0.62. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando al número por 100, así 0.62x100 = 62%

Interpretación:

f3: Existen 11 estudiantes de la Universidad Peruana Unión que tienen un cociente intelectual que
varía de 100 a 106 puntos.

33
Mg. María Vallejos Atalaya

F4: Existen 31 estudiantes de la Universidad Peruana Unión que tienen un cociente intelectual que
varía de 106 a 112 puntos

h3: El 20% de estudiantes de la Universidad Peruana Unión tienen un cociente intelectual que varía de
100 a 106 puntos

H4: El 62% de estudiantes de la Universidad Peruana Unión tienen un cociente intelectual que varía de
106 a 112 puntos

Las frecuencias relativas interpretan la variable en su fila, en cambio, las frecuencias acumuladas
interpretan la variable desde el principio hasta su fila.

CUIDADOS EN LA PRESENTACIÓN DE CUADROS ESTADÍSTICOS

A continuación señalamos los elementos necesarios que deben tenerse en cuenta para la presentación
de información estadística mediante cuadros.

1. Nº de cuadro
2. Título: Debe responder las siguientes preguntas:
a. ¿Qué información contiene el cuerpo del cuadro?

Ej. Cociente de inteligencia de 50 alumnos

b. ¿Dónde fue tomada la información?


Ej. ...en la UPeU – Lima

c. ¿Cuándo fue tomada la información?


Ej. ...Enero, 1995

3. Los encabezados: Corresponde a la identificación de la variable y las frecuencias.

4. Columna matriz: corresponde a las categorías de clasificación de la variable.

5. Cuerpo del cuadro: Corresponde a la información numérica, generalmente frecuencias absolutas y


relativas.

6. Fuente: Señalar el medio de información que condujo al conjunto de datos.


Ej. Test aplicado por los investigadores

7. Notas: son colocadas para esclarecimiento.

8. Comentarios: sirve para aclarar minucias en relación a cada celda.

Para nuestro ejemplo visto anteriormente el cuadro será:

CUADRO Nº 1

COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIÓN - LIMA, 2004

COCIENTE DE Nº DE %
INTELIGENCIA ALUMNOS
88 – 94 9 18
94 – 100 6 12
100 – 106 11 22
106 – 112 5 10
112 – 118 8 16
118 – 124 3 6
124 – 130 8 16
TOTAL 50 100
Fuente: Test aplicado por los investigadores.

34
Mg. María Vallejos Atalaya

Sesión Nº 4

REPRESENTACIÓN DE LA INFORMACIÓN
4.1. PRESENTACIÓN DE LA INFORMACIÓN MEDIANTE GRÁFICOS

Los gráficos más usados son:

a. Histograma de frecuencias
b. Polígono de frecuencias
c. Polígono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo

a. Histograma de frecuencias

Es una representación gráfica de una distribución de frecuencias agrupadas en intervalos de clase,


mediante una serie de intervalos continuos.

Se usa:

Cuando se tiene una variable cuantitativa continua

Se construye:

1. Se coloca los intervalo de clase en el eje horizontal (eje de las abscisas o eje x).

2. Se levanta cada intervalo a la altura de la frecuencia absoluta simple o relativa simple.

Ejemplo:
Considere el ejemplo de tabla de distribución de frecuencia para datos agrupados del “Puntajes del
Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU”.

35
Mg. María Vallejos Atalaya

b. Polígono de frecuencias

Se usa:

Cuando se tiene una variable cuantitativa continua y económica.

Se construye:

1. Se ubica en el eje x la marca de clase y se considera el punto medio,

2. Se levanta el punto de la marca de clase a la altura de la frecuencia absoluta simple o relativa


simple,

3. Luego de marcar los puntos, unirlos,

4. Finalmente, unir los extremos al eje de las abscisas.

Ejemplo:
Considerando el ejemplo de la tabla de distribución de frecuencias para datos agrupados, en el cual
estudiamos el “Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU”.

fi

10 11
8
9
9 5
8
7
3
6 6
5 8
4
3
2
1
x
91 97 103 109 115 121 127

c. Polígono de frecuencias acumuladas u ojivas

Se usa:

Cuando la frecuencia acumulada es de interés.

Se construye:

1. Se ubica en el eje x la marca de clase.

2. Se levanta el punto del extremo superior de cada límite de intervalo de clase a la altura de la
frecuencia absoluta acumulada o relativa acumulada.

3. Luego de marcar los puntos, unirlos

4. Finalmente, unir los extremos al eje de las abscisas.

Ejemplo:
Considerando el ejemplo de la tabla de distribución de frecuencias para datos agrupados, en el cual
estudiamos el “Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU”

36
Mg. María Vallejos Atalaya

fi
50
50 42
45 39
40
35
31
30
25
26
20
15 15
10 9
5
x
88 94 100 106 112 118 124 130

d. Barras

Se representa mediante una serie de rectángulos separados

Se usa:
Para representar variables cualitativas.

Se construye:
1. Se ubica en el eje x las categorías de la variable, utilizando intervalos y separando
aproximadamente la mitad del intervalo entre una categoría y otra.

2. Se levanta cada intervalo de la categoría que corresponde a la variable, a la altura de la frecuencia


absoluta simple o relativa,

Ejemplo:

Facultad Nº de alumnos
1. Ciencias Contables y Administrativas 500
2. Teología 200
3. Ciencias de la Salud 250
4. Educación y Ciencias Humanas 250
5. Ingeniería 300
Total 1500
fi
50
50 0
045
040
035
030
30
025 25 25 0
020 20 0 0
0 0
15
100
0 50
x
1 2 3 4 5

e. Bastones

Tiene la forma de alfileres.

Se usa:

37
Mg. María Vallejos Atalaya

Para representar una variable cuantitativa discreta.

Se construye:
1. Se ubica en el eje x los valores de la variable, separando equitativamente entre uno y otro valor,

2. Se levanta utilizando una línea recta para cada valor de la variable, a la altura de la frecuencia
absoluta simple o relativa y se termina con un punto, en forma de alfiler.

Ejemplo:

No de Hijos (xi) 0 1 2 3 4 5
Nº de familias (fi) 3 7 12 20 15 5
NOTAS

fi

20
20

15
15
12
10 7
5
5
3
x
1 2 3 4 5

f. Sectores

Se representa mediante un círculo particionado.

Se usa:
Para representar una variable cualitativa cuyo principal interés es conocer su frecuencia relativa.

Se construye:
1. Se particiona a una circunferencia equitativamente, considerando que ésta constituye el 100%,

2. Se efectúa la partición, según la frecuencia relativa simple lo considere y se ubican las categorías
de la variable en cada partición.

Ejemplo:

VIVIENDA
20% ALIMENTA
OTROS
Rubro hi % CIÓN
5%
30%
Diezmo 10 VESTIDO
10%
Vivienda 20 EDUCACIÓ
N
Alimentación 30 20%
Vestido 10
DIEZMO
Educación 20 10% RECREAC.
Recreación 5 5%
Otros 5
Total 100

38
Mg. María Vallejos Atalaya

g. Series de tiempo

Son curvas idénticas al del polígono de frecuencias pero sus extremos no tocan el eje de las abscisas.

Se usa:
Cuando la variable de interés es el tiempo.

Ejemplo:

Nº DE ALUMNOS INGRESANTES A LA UPeU DE TRES


COLEGIOS DIFERENTES 1991-1995

AÑOS Nº DE ALUMNOS INGRESANTES


COLEGIO 1 COLEGIO 2 COLEGIO 3
1991 10 20 15
1992 15 25 20
1993 20 20 25
1994 25 25 20
1995 35 25 25

fi
40
35
30
COLEGIO 1
25
20 COLEGIO 2
15 COLEGIO 3
10
5
0 X
1991 1992 1993 1994 1995 AÑOS

CUIDADOS EN LA PRESENTACIÓN DE GRÁFICOS ESTADÍSTICOS

A continuación señalamos los elementos necesarios que deben tenerse en cuenta para la presentación
de información estadística mediante gráficos.

1. Nº de gráfico
2. Título: Debe responder las siguientes preguntas:

a. ¿Qué información contiene el cuerpo del cuadro?


Ej. Cociente de inteligencia de 50 alumnos

b. ¿Dónde fue tomada la información?


Ej. ...en la UPeU – Lima

c. ¿Cuándo fue tomada la información?


Ej. ...Setiembre, 1994

3. Representación gráfica (señalar escalas).


4. Leyenda (si fuere necesario).
5. Fuente.
6. Nota (en caso de ser necesario).

39
Mg. María Vallejos Atalaya

Ejemplo:

La representación gráfica para el ejemplo de datos agrupados de los datos del “Puntajes del Cociente
de Inteligencia (CI) de 50 Estudiantes de la UPeU”.

GRÁFICO Nº 1
COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIÓN - LIMA,
2001

Fuente: Test aplicado por los investigadores.

EJERCICIOS PROPUESTOS

1. En una encuesta de opinión acerca de las preferencias de una marca de bebida gaseosa por sus
colores: Amarillo (A), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas:

B, R, R, B, R, A, A, B, B, A
B, A, A, R, B, A, B, R, B, A

a) Construir la distribución de frecuencias


b) Graficar la distribución

2. La tabla muestra la distribución del ingreso familiar correspondiente a 80 familias:

Ingresos fi Fi hi
160  170
170  180 48 60

180  190 0,125


190  200 0,075
 200  210
a) Determinar el número de familias que ganan menos de 200 nuevos soles

3. Para cada uno de los siguientes ejercicios construir:

a) La tabla de distribución de frecuencias


b) El gráfico adecuado
c) Interpretación

3.1. Los siguientes datos proporcionan las remuneraciones de 50 obreros.

730 470 672 820 670 610 800 670


600 700 650 700 570 850 590 700

40
Mg. María Vallejos Atalaya

570 730 770 580 609 700 574 578


730 663 569 720 860 766 456 258
378 930 848 860 748 777 640 560
730 640 708 461 685 630 720 840
650 740

3.2. Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en
cm)

151 152 154 155 159 159 160 161


161 161 161 162 163 163 164 165
166 165 166 166 166 166 166 167
167 167 167 168 168 168 168 168
168 168 168 168 168 169 169 169
169 169 169 169 169 170 170 170
170 170 170 170 171 171 171 172
172 172 173 173 173 173 174 174
174 175 175 175 176 176 176 176
176 177 177 177 177 178 178 178
179 179 180 180 180 181 181 181
181 182 182 182 183 184 185 186
187 188 189 190

3.3 El gerente de una compañía registra el número de cierto trabajo, completados por los
empleados. Cincuenta empleados realizan el mismo trabajo, divididos en dos grupos de 25
y en salones diferentes.

En el salón A, el gerente registra el siguiente número de unidades completadas por día:


21 22 20 15 25 30 28
29 28 30 24 29 27 34
38 24 35 36 31 41 32
43 44 53 50

En el salón B los datos son los siguientes:


16 21 13 36 18 24 32
16 18 20 28 25 33 26
30 26 20 35 45 59 32
31 30 40 30

a) Combinar todos los puntajes y obtener la distribución de frecuencias con tamaño de clase
k=10.
b) Obtener la distribución de frecuencias por cada salón y realice la gráfica adecuada.

4. Se tiene la siguiente tabla de frecuencias relativas de 300 empleados según su edad.


EDADES hi
19-21 0.15
22-24 0.25
25-27 0.40
28-30 0.10
31-33 0.10

a) ¿Cuántos empleados tienen edades entre 22 y 30 años?


b) ¿Qué porcentaje de empleados tienen 25 años o más?
c) ¿Qué porcentaje de empleados tienen 24 años o menos?
d) Una empresa que se dedica a preparar dietas, proyecta lanzar al mercado una dieta rigurosa.
Los empleados de una compañía se presentaron como voluntarios para dicha promoción. Se
realizó un muestreo con 80 empleados elegidos aleatoriamente. Los resultados del chequeo
de los pesos (en Kg), fueron los siguientes:

80.6 65.8 49.6 79.1 84.4 66.2 79.3 59.4 72.9 73.6
53.2 60.2 91.2 74.8 78.6 81.4 58.6 68.2 67.4 55.6
76.9 77.4 67.9 63.7 49.9 46.4 68.8 67.3 72.3 75.8

41
Mg. María Vallejos Atalaya

88.3 94.6 57.3 87.3 74.3 73.2 90.4 76.3 52.7 71.7
75.6 41.8 73.6 71.4 83.2 67.4 99.3 62.3 89.2 86.8
65.2 62.1 44.8 82.9 81.7 70.4 74.6 76.9 85.7 40.9
54.2 75.3 50.1 61.1 42.3 68.6 56.2 70.8 47.3 66.9
80.2 60.2 71.6 77.1 94.9 61.4 82.1 78.3 51.2 79.3

a) Elaborar la distribución de frecuencias


b) ¿Cuántos empleados tienen pesos entre 45 y 60 kg?
c) ¿Qué porcentaje de empleados tienen pesos mayores que 75.5 Kg?

42
Mg. María Vallejos Atalaya

Autoevaluación

CONCEPTUAL

1. Señale con una V si es verdadero o F si es falso en los siguientes enunciados:

a) ( ) Una tabla estadística representa a la información en forma organizada.


b) ( ) La marca de clase es el punto medio de los intervalos de clases.
c) ( ) F3 indica la frecuencia acumulada relativa simple de la tercera fila.
d) ( ) La suma de las frecuencias relativas simples debe ser igual a uno.
e) ( ) El histograma de frecuencia se utiliza para una distribución de frecuencias
agrupadas en intervalos de clase.

PROCEDIMENTAL

2. A continuación se presentan las notas de 50 alumnos:

60 53 85 77 33 45 52 65 77 84
65 41 74 55 57 78 50 35 64 74
71 39 35 60 81 76 91 55 73 59
47 94 54 98 68 66 48 69 85 67
80 94 61 88 41 89 66 73 42 65

Se pide:

a) Determinar el rango.
b) Número de clases o filas.
c) Amplitud de las clases o filas.
d) Frecuencias absolutas y relativas simples, absolutas y relativas acumuladas.
Interpretar por lo menos 2 de cada fila.

3. Al investigar el nivel socioeconómico en los valores: Bajo (B), medio (M), alto (A), 20
familias dieron las siguientes respuestas:

M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B

Construir la distribución de frecuencia y trazar su gráfica.

4. Dibujar un diagrama de sectores para mostrar los gastos de un hospital de una gran
ciudad, siendo éstos los siguientes: 73% en sueldos, honorarios profesionales
médicos y bonificaciones a los empleados; 13% en suministros, equipo médico y
quirúrgico; 8% en mantenimiento, alimentación y energía; y 6% en costos
administrativos.

ACTITUDINAL

5. Considerando los conocimientos adquiridos en la primera unidad, ¿qué aconsejarías


a un empresario que necesita tomar decisiones acertadas para el buen
funcionamiento de su negocio?

42
Mg. María Vallejos Atalaya

UNIDAD II:
MEDIDAS ESTADÍSTICAS
Sesión Nº5:
Medidas de resumen
Sesión Nº6:
Medidas de posición
Sesión Nº7:
Medidas de dispersión
Sesión Nº8:
Medidas de forma

43
Mg. María Vallejos Atalaya

COMPETENCIAS

CONCEPTUAL PROCEDIMENTAL ACTITUDINAL

Reconoce los conceptos Calcular las diversas Identifican y reconocen


de las medidas de medidas de resumen qué medidas de resumen
resumen, como las de para una serie de datos. son adecuadas para el
tendencia central, de análisis de una serie de
posición, de dispersión y datos.
de forma, de una serie
de datos.

44
Mg. María Vallejos Atalaya

Sesión Nº 5

MEDIDAS DE RESUMEN

5.1. Análisis e interpretación de los resultados

Se estudió los cuadros y gráficos estadísticos en la unidad anterior como formas para ordenar y
describir un conjunto de datos para tomar decisiones. Sin embargo, el análisis resulta incompleto, para
esto se utiliza ciertos indicadores.

Estos indicadores llamados medidas de resumen o ESTADÍGRAFOS permiten hallar un solo valor
numérico, el mismo que representa a toda la población o muestra en estudio.

Los estadígrafos o medidas de resumen más importante son:

De tendencia central: media, mediana y la moda.


De posición: cuartiles, deciles y percentiles.
De dispersión: varianza, desviación estándar, y coeficiente de variación.
De forma: asimetría y el coeficiente de kurtosis.

5.2. MEDIDAS DE TENDENCIA CENTRAL

Son estadísticos que permiten hallar el valor numérico que indica el "centro" de un conjunto de datos;
señalando la característica que destaca en la información.

5.2.1. La media o promedio aritmético ( x )

Es la más estable y se obtiene de acuerdo a lo siguiente:

a) Media aritmética para datos simples (en serie):

Proceso: Sumar todos los valores de la variable y dividir entre el número de datos que se han sumado.

_
x
x n
b) Media aritmética para datos agrupados (en tablas):

Proceso: Sumar todos los valores de la variable o marca de clase multiplicados por la frecuencia
absoluta simple y dividir entre el número de datos o la suma de las frecuencias absolutas simples.

x
xf
f
Ventajas de la media aritmética:

- Es útil cuando los datos están distribuidos en forma normal o simétrica.


- Es de gran estabilidad porque toma en cuenta todos los datos.
- Nos permite probar parámetros en inferencia estadística.
Desventajas de la media aritmética:

67
Mg. María Vallejos Atalaya

- Puede ser afectado por valores extremos.


- Cuando los datos agrupados tienen clases abiertas en los extremos, no es recomendable calcular
el promedio.

5.2.2. Mediana (Me)

Es el estadístico que representa el punto medio de los datos en el cual cae el 50% de puntuaciones. Se
obtiene de acuerdo a lo siguiente:
a) Mediana para datos simples (en serie):

Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la serie
es par); del conjunto de datos previamente ordenados en forma creciente.

(*) La mediana se utiliza también en variables ordinales


Ej: Se tiene la siguiente información sobre el número de alumnos repitentes por años de estudios de la
carrera de contabilidad en la UPeU.

AÑOS fi 1 Fi 2
Primero 25 25
Segundo 14 39 Clase
Tercero 6 45 mediana.
Cuarto 9 54
Quinto 2 56
Total 56

Proceso:

1. Se calcula la suma de las frecuencias absolutas simples entre 2 así:

n
=
f 
56
 28
2 2 2
2. El valor inmediatamente superior o igual a 28 se busca en la columna de la tabla que corresponde
a la frecuencia absoluta acumulada Fi (en este ejemplo corresponde a 39, porque 25 es menor
que 28).

3. Luego se observa la primera columna donde se encuentra la variable, en la fila donde se observó el
número 39, el valor de la variable que se encuentra en esa fila corresponde a la mediana.
Me = Segundo.

Interpretación: La mitad de los estudiantes repitentes lo hacen como máximo hasta segundo año,
aproximadamente la otra mitad repiten categorías superiores al segundo año.

b) Mediana para datos agrupados:

Cuando los datos se encuentran agrupados en una tabla de distribución de frecuencias, la mediana se
encuentra utilizando la siguiente fórmula:

n 
  Fi 1 
Me  Linf  c  
2
fi

Donde

1
fi : frecuencia absoluta simple
2
Fi : frecuencia absoluta acumulada.
68
Mg. María Vallejos Atalaya

Linf : Límite inferior del intervalo que contiene a la mediana


c : Amplitud del intervalo
n : Número total de datos
Fi 1 : Frecuencia absoluta acumulada anterior a la clase mediana
f i : Frecuencia (o frecuencia absoluta) de la clase mediana.
n
Lugar de la Mediana, Me : .
2
Ventajas de la mediana:

- No está afectada por valores extremos, y por lo tanto es más representativa que el promedio,
cuando las series son poco simétricas.
- Es útil cuando los datos agrupados tienen clases abiertas en los extremos (es decir, no tiene límite
inferior en la primera clase ni límite superior en la última clase).
- Se aplica a variables que pertenecen a la escala ordinal.

5.2.3. La moda (Mo)


Nos indica el valor o cualidad que se repite con mayor frecuencia dentro de una información. Se
obtiene de acuerdo a lo siguiente:

a) Moda para datos simples (en serie):

Es el valor que más se repite en una serie.

(*) Es útil cuando la variable en estudio pertenece a la escala nominal.

Ejemplo:
Hallar la moda para la siguiente información que consiste en una muestra de 100 consumidores según
preferencia por tipos de panes Unión.

TIPOS DE CONSUMIDORES
PANES (fi)
Integral 25
Americano 20
Fibra 40
Hamburguesa 15
Total 100

Clase modal,
por ser el valor más frecuente (f =40)

Entonces, la moda será el valor que corresponde a la categoría de la variable, en la clase o fila modal.
Mo = Fibra

Interpretación:
La mayoría de los consumidores de Productos Unión prefiere pan fibra.

b) Moda para datos agrupados:

En este caso la moda se halla mediante la fórmula:

 1 
Mo  Linf  c 
 1   2 
Donde
Linf : Límite inferior del intervalo que contiene a la moda

69
Mg. María Vallejos Atalaya

c : Amplitud del intervalo


con 1  fi  fi 1 ; 2  fi  fi 1

Ventajas de la moda:

- No está afectada por valores extremos.


- Puede usarse cuando los datos agrupados tienen clases abiertas en los extremos.
- Se usa para variables que pertenecen a la escala nominal.

Desventajas de la moda:

- No es representativa a menos que la distribución contenga un gran número de datos y exista


significativa repetición de alguno de ellos.
- Muchas veces la serie no tiene moda porque ningún valor se repite, en ese caso se dice que la
información es unimodal.
- Cuando la serie tiene 2 modas, se dice que la información es bimodal, y si tiene más de 2 modas,
la información es multimodal. En estos casos se hace difícil su interpretación y comparación, por lo
tanto, no se considera una medida representativa

Ejemplo:
Correspondiente a datos simple (información en serie):

Los datos presentados corresponden a las edades de 8 alumnos del 1er año de la Facultad de
Ciencias Contables y Administrativas:

Edad :
Xi: 18, 20, 23, 17, 18, 19, 23, 18

Calcular la media, mediana y moda e interpretar sus resultados.

Solución:

Media

x
 x  18  20  23  17  18  19  23  18  156  19.5  20
n 8 8

Interpretación

La edad promedio de los alumnos del 1er año de la Facultad de Ciencias Contables y Administrativas
es de 20 años.

Mediana

Me: Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la
serie es par); del conjunto de datos previamente ordenados en forma creciente.

En este caso la serie es par, por lo tanto, se procede del siguiente modo:

1º Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23

2º Se particiona la serie por la mitad

17, 18, 18, 18, 19, 20, 23, 23

70
Mg. María Vallejos Atalaya

3º la mediana será la semisuma de los dos valores centrales, por ser la serie par, es decir 8 datos.

18  19
Me   18.5  19
2

Interpretación:

La mitad de los de los alumnos del 1er año de la Facultad de Ciencias Contables y Administrativas
tiene como máximo 19 años, aproximadamente la otra mitad tienen más de 19 años.

Moda

Es el valor que más se repite.

Así, en nuestra base de datos.

1º Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23

2º Se toma el valor que más se repite.

En nuestro ejemplo el 18 se repite 3 veces.

Mo = 18

Interpretación:

La mayoría de los alumnos del 1er año de la Facultad de Ciencias Contables y Administrativas tiene de
20 años de edad.

Ejemplo:

Correspondiente a datos agrupados (información en tablas):


Considerando el ejemplo de distribución de frecuencias para datos agrupados, en el cual estudiamos el
“Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU”.

Hallaremos la media, mediana y moda para datos agrupados.

Tabla Nº 1

DISTRIBUCIÓN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA


UPeU
Límites de Xi fi Fi Xi fi Xi 2fi
clases
[88 – 94> 91 9 9 819 74529
[94 – 100> 97 6 15 582 56454
[100 – 106> 103 Mo 11 Me 26 1133 116699
[106 – 112> 109 5 31 545 59405
[112 – 118> 115 8 39 920 105800
[118 – 124> 121 3 42 363 43923
[124 – 130> 127 8 50 1016 129032
Total 50 5378 585842

Solución:

La columna de las marcas de clase denotada por Xi, se obtiene por la formula dada anteriormente en la
Unidad 1.

71
Mg. María Vallejos Atalaya

LCI  LCS
Xi 
2

88  94
X1   91
2
94  100
X2   97
2
100  106
X3   103
2
.
.
124  130
X7   127
2

La columna de Xi fi : se obtiene multiplicando valor por valor la columna de las marcas de clase
denotada por Xi por las frecuencias absolutas simple denotada por fi:

Así:
X1 f1 = 91 x 9 = 819
X2f2 = 97 x 6 = 582
X3 f3 = 103 x 11 = 1133

X7 f7 = 127 x 8 = 1016

Observación: Las sumas de cada columna se encuentran en la fila que corresponde al total (al final de
las columnas).

La clase mediana se ubica con las frecuencias absolutas acumuladas.

La clase modal se ubica con las frecuencias absolutas simples.


Media:

x 
x fi i

819  582  1133  545  920  363  1016
f i 9  6  11  5  8  3  8
5378
  107.56  107
50

Interpretación:

El cociente de inteligencia promedio de los alumnos de la Universidad Peruana Unión es de


aproximadamente 107 puntos.

Mediana:

Proceso:

1. Ubicamos la clase o fila mediana (intervalo que contenga la mediana):

Lugar de Me: n/2= 50/2= 25 (25 avo. lugar)


Analizando, la mediana se encuentra en la 4ta. Clase.

Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 25.

72
Mg. María Vallejos Atalaya

En nuestro ejemplo corresponde a la cuarta fila, pues su frecuencia acumulada es F4 = 31 y es el


inmediatamente superior a 25.

La cuarta fila es la clase mediana y de allí se considera los datos que van a ser reemplazados en la
fórmula.

2. Utilizando la fórmula:
n 
  Fi 1 
Me  Linf  c  
2
fi

Linf : Límite inferior del intervalo de la clase mediana = 100

n : Número total de datos = 50

Fi-1 : Frecuencia absoluta acumulada anterior a la clase mediana = 15

fi : Frecuencia absoluta simple de la clase mediana = 11

c : Amplitud interválica: 6

La mediana será:

 50 
  15 
Me  100  6   = 105.45
2
11

Interpretación:

La mitad de los estudiantes de la Universidad Peruana Unión tiene un coeficiente de inteligencia


máximo de 105 puntos, aproximadamente la otra mitad tienen más de 105 puntos.

Moda

Proceso:
1. Se ubica la clase o fila modal (donde se encuentra la moda), ubicando en la columna de las
frecuencias absolutas simples (fi) el mayor valor.

En nuestro ejemplo el mayor valor de las frecuencias absolutas simples es f3 = 11,

En nuestro ejemplo, la clase modal o fila donde se encuentra la moda es la tercera fila porque en
ella se encuentra el mayor valor de las frecuencias absolutas simples.

2. Utilizando la fórmula:

 1 
Mo  Linf  c 
 1   2 

hallando:
1  fi  fi 1 = 11- 6= 5
2  fi  fi 1 = 11-5= 6

73
Mg. María Vallejos Atalaya

 5 
Mo  100  6   = 102.72
 56

Interpretación:

La mayoría de los estudiantes de la Universidad Peruana Unión tiene un coeficiente de inteligencia de


103 puntos.

74
Mg. María Vallejos Atalaya

Sesión Nº 6

MEDIDAS DE POSICIÓN

6.1. MEDIDAS DE POSICIÓN

Son estadígrafos que dividen a una serie de datos en cuatro, diez o cien partes iguales.

Estas medidas son:

- Cuartiles
- Deciles
- Percentiles

6.1.1. Cuartiles (Qi )

Son estadígrafos que dividen a la información en cuatro partes iguales, donde cada uno de ellos es el
25% de la información.

Esquemáticamente se tiene:

Q1 25%
Q2
25% Q3
25%
25%
total 100%

Los cuartiles se calculan con la fórmula siguiente:

 ( j )n 
 4  Fi 1 
Q j  Linf  c  
 fi 
 

Donde:
j : 1,2 ó 3
Linf : Límite inferior del intervalo de la clase cuartílica.
n : Número total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartílica.
fi : Frecuencia absoluta simple de la clase cuartílica.
c : Amplitud interválica.

6.1.2. Deciles (Di )

Son estadígrafos que dividen a la información en diez partes iguales, donde cada uno de ellos es el
10% de la información.

75
Mg. María Vallejos Atalaya

Esquemáticamente se tiene:

D1 10%
D2
10% D9
. . .
10%

10%

Total 100%

Los deciles se calculan con la fórmula siguiente:

 ( j )n 
 10  Fi 1 
D j  Linf  c  
 fi 
 

Donde:
j : 1,2, 3, … ó 9
Linf : Límite inferior del intervalo de la clase decílica.
n : Número total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase decílica.
fi : Frecuencia absoluta simple de la clase decílica.
c : Amplitud interválica.

6.1.3. Percentiles (Pi )

Son estadígrafos que dividen a la información en cien partes iguales, donde cada uno de ellos es el 1%
de la información.

Esquemáticamente se tiene:

P1 1%
P2
1% P99
. . .
1%

1%
total 100%

Los percentiles se calculan con la fórmula siguiente:

 ( j )n 
 100  Fi 1 
Pj  Linf  c  
 fi 
 

Donde:

76
Mg. María Vallejos Atalaya

j : 1,2, 3, … ó 99
Linf : Límite inferior del intervalo de la clase percentílica.
n : Número total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase Percentílica.
fi : Frecuencia absoluta simple de la clase percentílica.
c : Amplitud interválica.

Observación:

Generalmente se calculan las medidas de posición para datos agrupados, pues se tiene una gran
cantidad de información.

Ejemplo:

Correspondiente a datos agrupados (información en tablas)


Considerando el ejemplo de distribución de frecuencias para datos agrupados, en el cual estudiamos el
“Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU”.

Hallaremos los cuartiles 1 y 3, los deciles 2 y 8 y los percentiles 10 y 90.

Tabla Nº 1

DISTRIBUCIÓN DE FRECUENCIAS DE LOS PUNTAJES


DEL CI DE 50 ESTUDIANTES DE LA UPeU

Intervalo de clase Xi fi Fi
[88 – 94> 91 9 9 P10
[94 – 100> 97 6 15 Q1,D2
[100 – 106> 103 11 26
[106 – 112> 109 5 31
[112 – 118> 115 8 39 Q3,D8
[118 – 124> 121 3 42 P90
[124 – 130> 127 8 50
Total 50

Solución

Cuartil 1 (Q1)

Proceso
1. Se ubica la clase o fila cuartílica (donde se encuentra el primer cuartil), utilizando la siguiente
fórmula, el valor i, se reemplaza de acuerdo a qué cuartil se desea encontrar; ya sea el 1, 2 ó 3.

i f (1)50
  12.5
4 4

2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 12.5.

En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F2 = 15 y es el


inmediatamente superior a 12.5.

3. La segunda fila es la clase cuartílica y de allí se considera los datos que van a ser reemplazados en
la fórmula.

 ( j )n 
 4  Fi 1 
Q j  Linf  c  
 fi 
 
77
Mg. María Vallejos Atalaya

Linf : Límite inferior del intervalo de la clase cuartílica = 94


n : número total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartílica = 9
fi : Frecuencia absoluta simple de la clase cuartílica = 6
c : amplitud interválica: = 6

Cuartil 1 será:

 (1)50 
 4 9
Q1  94  6    97.5
 6 
 

Interpretación:

El 25% de los estudiantes de la Universidad Peruana Unión tiene un coeficiente de inteligencia


máximo de 98 puntos, aproximadamente el 75% restante tienen más de 98 puntos.

Cuartil 3 (Q3)

Proceso

1. Se ubica la clase o fila cuartílica (donde se encuentra el tercer cuartil), utilizando la siguiente
fórmula, el valor i, se reemplaza de acuerdo a qué cuartil se desea encontrar; ya sea el 1, 2 ó 3.

j (n) (3)50
  37.5
4 4

2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 37.5.

En nuestro ejemplo corresponde a la quinta fila, pues su frecuencia acumulada es F5 = 39 y es el


inmediatamente superior a 37.5.

3. La quinta fila es la clase cuartílica y de allí se considera los datos que van a ser reemplazados en la
fórmula.

Linf : Límite inferior del intervalo de la clase cuartílica = 112


n : número total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartílica = 31
fi : Frecuencia absoluta simple de la clase cuartílica = 8
c : Amplitud interválica: = 6

El cuartil 3 será:

 (3)(50) 
 4  31 
Q3  112  6    116.87
 8 
 

Interpretación:

El 75% de los estudiantes de la Universidad Peruana Unión tiene un coeficiente de inteligencia


máximo de 117 puntos, aproximadamente el 25% restante tienen más de 117 puntos.

78
Mg. María Vallejos Atalaya

Decil 2 (D2)

Proceso:
1. Se ubica la clase o fila decílica (donde se encuentra el segundo decil), utilizando la siguiente
fórmula, el valor i, se reemplaza de acuerdo a qué decil se desea encontrar; ya sea el 1, 2, … , ó 9.

j (n) (2)50
  10
10 10

2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 15.

En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F2 = 15 y es el


inmediatamente superior a 10.

3. La segunda fila es la clase decílica y de allí se considera los datos que van a ser reemplazados en
la fórmula.

Li : Límite inferior del intervalo de la clase decílica = 94


n : Número total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase decílica = 9
fi : Frecuencia absoluta simple de la clase decílica = 6
c : Amplitud interválica: = 6

El decil 2 será:

 (2)(50) 
 10  9 
D2  94  6    95
 6 
 

Interpretación:

El 20% de los estudiantes de la Universidad Peruana Unión tiene un coeficiente de inteligencia


máximo de 95 puntos, aproximadamente el 80% restante tienen más de 95 puntos.

Percentil 10 (P10)

Proceso

a. Se ubica la clase o fila percentílica (donde se encuentra el percentil 10), utilizando la siguiente
fórmula, el valor i, se reemplaza de acuerdo a qué cuartil se desea encontrar; ya sea el 1, 2, …, ó
99.

j (n) (10)50
 5
100 100

b. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 5.

En nuestro ejemplo corresponde a la primera fila, pues su frecuencia acumulada es F2 = 9 y es el


inmediatamente superior a 5.

c. La primera fila es la clase percentílica y de allí se considera los datos que van a ser remplazados

79
Mg. María Vallejos Atalaya

en la fórmula.

Li : Límite inferior del intervalo de la clase percentílica = 88


n : Número total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase Percentílica = 0
fi : Frecuencia absoluta simple de la clase percentílica = 9
c : Amplitud interválica: = 6

El percentil 10 será:

 (10)(50) 
 100  0 
P10  88  6    91.3
 9 
 

Interpretación:

El 10% de los estudiantes de la Universidad Peruana Unión tiene un coeficiente de inteligencia


máximo de 91.3 puntos, aproximadamente el 90% restante tienen más de 91.3 puntos.

EJERCICIOS PROPUESTOS

1) Los datos siguientes corresponden al peso en Kg. de 10 alumnos.


40.8 52.5 49.2 40.8 62.2
52.5 58.0 60.0 40.8 52.5
Calcular:
a) La media, la mediana y la moda.
b) ¿Cuál de los 3 indicadores (en (a)) miden con mayor precisión el centro de los datos?

2) El número de autos vendidos por cada uno de 10 vendedores de una distribuidora de


automóviles en un mes particular, dispuestos en orden ascendente es: 2, 4, 7, 10, 10, 10,
12, 12, 14, 15.

Determine e interprete:

a) La media b) La mediana c) La moda

3) La media mínima para aprobar una asignatura es 11. Si un estudiante obtiene la notas 13.5, 14,
9.5, 12, 8.5, 8, 11.5, 10 en los trabajos mensuales de la asignatura en cuestión, ¿el estudiante
fue aprobado?

4) A Continuación se dan las notas de 50 alumnos.


60 85 33 52 65
77 84 65 74 57
71 35 81 50 35
64 74 47 54 68
80 61 41 91 55
73 59 53 77 45
41 55 78 48 69
85 67 39 60 76
94 98 66 66 73
42 65 94 88 89

Se pide:

80
Mg. María Vallejos Atalaya

a) Obtener la distribución de frecuencias


b) Determinar: la media, mediana y moda
c) Determinar el 3er cuartil, 7mo decil y 55avo percentil.

5) A continuación tenemos la distribución del número de accidentes por día durante 43 días, en
cierta autopista.

Nº de accidentes 0 1 2 3 4
Nº de días 10 15 10 5 3

a) Determinar: la media, mediana y moda

b) ¿Cuál es el porcentaje de días en que se tuvo dos o más accidentes por día?

6) Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en cm)
151 152 154 155 159 159 160 161 161 161 161 162
163 163 164 165 166 165 166 166 166 166 166 167
167 167 167 168 168 168 168 168 168 168 168 168
168 169 169 169 169 169 169 169 169 170 170 170
170 170 170 170 171 171 171 172 172 172 173 173
173 173 174 174 174 175 175 175 176 176 176 176
176 177 177 177 177 178 178 178 179 179 180 180
180 181 181 181 181 182 182 182 183 184 185 186
187 188 189 190

Calcular las medidas de tendencia central, posición, dispersión y de forma. Interpretar los
resultados.

7) Obtenga la media y la mediana para cada uno de los siguientes conjuntos de números:
1) 1, 5, 9, 13, 17 2) 1, 3, 9, 27, 81 3) 1, 4, 9, 16, 25

a) ¿Para cuál de estos conjuntos de datos son iguales la media y la mediana?


b) ¿Cuál medida es la misma para los 3 conjuntos?
c) ¿Cuál de estos conjuntos tiene una moda?

8) Los siguientes datos representan el número de obreros ausentes en cierta empresa


manufacturera, en 10 días consecutivos de trabajo:
5, 3, 0, 4, 3, 1, 4, 2, 20, 0

a) Encontrar la media, la mediana y la moda.


b) Interpretar sus resultados.

9) El siguiente cuadro muestra la distribución de edades de casos de una cierta enfermedad


reportada durante un año en una ciudad del estado.

EDAD Número de casos

5 - 14 5
15 - 24 10
25 - 34 20
35 - 44 22
45 - 54 13
55 - 64 5
Total 75

a) Determinar e interpretar las medidas de tendencia central: media, mediana, moda.


b) Determinar e interpretar las medidas de Posición: Cuartiles (Q1 y Q3) Deciles (D3 y D4) y
Percentil (P14 y P94).

81
Mg. María Vallejos Atalaya

10) En la tabla siguiente se muestra los puntajes obtenidos por 36 alumnos en una prueba de
razonamiento matemático:

Yi-1´ - Yi´ fi hi Fi Hi
Yi
42 - 51 11 0.35
51 - 60 10 0.28
60 - 69 2 0.055
69 - 78 5 0.14
78 – 87 3 0.08
87 - 96 5 0.14

a) Calcular la media aritmética, mediana y moda e interprete los datos


b) Calcular Q1, P90, D9 e interprete
c) Graficar el histograma y polígono de frecuencia

82
Mg. María Vallejos Atalaya

Autoevaluación

CONCEPTUAL

1. Señale con una V si es verdadero o F si es falso en los siguientes


enunciados:

a) ( ) La mediana es una medida de tendencia central.


b) ( ) La moda indica el valor que se repite con mayor frecuencia.
c) ( ) Los cuartiles dividen a la información en 10 partes iguales.
d) ( ) La media se calcula sumando todos los valores de la variable.
e) ( ) Los percentiles dividen la información en cien partes iguales.

PROCEDIMENTAL

2. Establezca las diferencias entre las medidas de tendencia central: media,


mediana y moda.

3. El número de autos vendidos por cada uno de 10 vendedores de una


distribuidora de automóviles en un mes particular, dispuestos en orden
ascendente es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15.

Determine e interprete:

a) La media b) La mediana c) La moda

4. La siguiente tabla muestra la distribución de edades de casos de una cierta


enfermedad informados durante un año en una provincia.

Edad Número de casos


[5 - 15> 5
[15 - 25> 10
[25 - 35> 20
[35 - 45> 22
[45 - 55> 13
[55 - 65> 5
total 75

a) Calcular la media, la mediana, la moda. Interprete.


b) Calcular el Q1, Q3, D2, D5, P8, P10

ACTITUDINAL

5. Para conocer la edad más frecuente de tus compañeros de clase, ¿qué


medida de tendencia central utilizarías?, ¿qué procedimiento efectuarías
para su cálculo? y ¿cómo enseñarías a tus subordinados para conocer la
edad más frecuente de los que siempre llegan tarde?

83
Mg. María Vallejos Atalaya

Sesión Nº 7

MEDIDAS DE DISPERSIÓN
7.1. Medidas de dispersión

Son estadígrafos que cuantifican el grado de concentración o de dispersión de los valores de la


variable en torno a un promedio o valor central de la distribución. Las medidas de dispersión se
necesitan para dos propósitos básicos:

a) Para verificar la confiabilidad de los promedios y


b) Para que sirva como base para el control de la variación de la misma.

Las principales medidas de dispersión o variabilidad son:


- Varianza
- Desviación estándar
- Coeficiente de variación

7.1.1. Varianza (s2 )


Es una medida que cuantifica el grado de dispersión o de variación de los valores de una variable
cuantitativa con respecto a su media aritmética.

Es el promedio de la suma de los cuadrados de las desviaciones de la variable respecto a su media.

Cuando el resultado de la varianza es un valor grande, se dice que los datos se encuentran bastantes
dispersos o alejados de la media aritmética; si el resultado es bastante pequeño los datos estarán
bastante cercanos o concentrados alrededor de la media aritmética.

Se obtiene de acuerdo a lo siguiente:

a) Varianza para datos simples (en serie):

s 2

x 2
 n( x ) 2
n 1

Donde:
x 2
 Cada valor de la muestra se eleva al cuadrado luego se suma todos los valores.
n = Tamaño de la muestra. (número de datos).
x = Media para datos simples.

b) Varianza para datos agrupados:

s 2

Y 2
f  n(Y )2
n 1

Donde:

Y 2
f = Cada marca de clase elevado al cuadrado y multiplicado por su frecuencia absoluta simple,
luego se suman todos los valores.
n = Tamaño de la muestra.

84
Mg. María Vallejos Atalaya

Y = Media para datos agrupados.


Observación: La varianza es una medida teórica; no tiene interpretación práctica.

7.1.2. Desviación estándar (s )

Es la raíz cuadrada de la varianza. Esta medida tiene interpretación práctica.

s  s2

Es uno de los estadísticos de mayor uso en el cual las unidades de la variable ya no están elevados al
cuadrado sino están en unidades originales.

7.1.3. Coeficiente de variación (c.v. % )

Es el cociente de la desviación estándar y la media aritmética, expresado en porcentaje. Así:

s
cv %  .100
x

- El coeficiente de variación se usa para saber si un conjunto de datos es homogéneo o heterogéneo


(concentrados o dispersos). Para esto se utiliza el siguiente criterio:

Si C.V. < 0.33 Datos HOMOGÉNEOS


Si C.V. ≥ 0.33 Datos HETEROGÉNEOS

- El coeficiente de variación también se utiliza para comparar la variabilidad de 2 ó más series de


datos que tengan unidades de medidas diferentes (por ejemplo, peso en kgs. y edad en años).

Si C.V.A < C.V.B Los datos de la serie A presentan una menor variabilidad con respecto a los
datos de la serie B

Ejemplo:

Correspondiente a datos simples (información en serie):

Los datos presentados corresponden a las edades de 8 alumnos del 1er año de la Facultad de
Ciencias Contables y Administrativas:

Edad:

Xi: 18, 20, 23, 17, 18, 19, 23, 18

Calcular la varianza, desviación estándar y coeficiente de variación e interpretar sus resultados.

Solución:

La varianza (s2) :

Proceso:

x
 x  18  20  23  17  18  19  23  18  156  19.5
n 8 8

x 2
182  202  232  172  182  192  232  182  3080

n = 8, pues hay 8 datos.

85
Mg. María Vallejos Atalaya

Entonces, la varianza es:

s2 
x 2
 n( x ) 2

3080  8(19.5) 2
 5.43
n 1 8 1

 No tiene interpretación práctica, sólo se calcula para poder determinar la desviación estándar.

La desviación estándar (s):

s  s 2  5.43  2.33  2

Interpretación:

Las edades de los alumnos del 1er año de la Facultad de Ciencias Contables y Administrativas se
dispersan respecto al valor central en aproximadamente 2 años.

El coeficiente de variación (cv%):

s 2.33
cv%  .100  .100  11.95%  12%
x 19.5

Interpretación:

Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.

Ejemplo:

Correspondiente a datos agrupados (información en tablas):

Considerando el ejemplo de distribución de frecuencias para datos agrupados, en el cual estudiamos el


“Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU”.

Hallaremos la varianza, desviación estándar y coeficiente de variación para datos agrupados.

Tabla Nº 1

DISTRIBUCIÓN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA


UPeU

Límites de Xi fi Fi Xi fi Xi 2fi
clases
[88 – 94> 91 9 9 819 74529
[94 – 100> 97 6 15 582 56454
[100 – 106> 103 11 26 1133 116699
[106 – 112> 109 5 31 545 59405
[112 – 118> 115 8 39 920 105800
[118 – 124> 121 3 42 363 43923
[124 – 130> 127 8 50 1016 129032
Total 50 5378 585842

Solución:

La varianza (s2) :

Proceso:

86
Mg. María Vallejos Atalaya

Media

x
x f
i i

819  582  1133  545  920  363  1016
f i 9  6  11  5  8  3  8
5378
  107.56  107
50

x 2
f 912 (9)  97 2 (6)  1032 (11)  1092 (5)  1152 (8)
1212 (3)  127 2 (8)  585842

Entonces, la varianza es:

s 2

x 2
f  n( x ) 2

585842-50(107.56) 2
 150.70
n 1 50  1

 No tiene interpretación práctica, sólo se calcula para poder determinar la desviación estándar.

La desviación estándar (s):

s  s 2  150.70  12.27

Interpretación:

El cociente de inteligencia de los alumnos de la Universidad Peruana Unión se dispersa respecto al


valor central en aproximadamente 13 puntos.

El coeficiente de variación (cv%):

s 12.27
cv%  .100  .100  11.40%  12%
x 107.56

Interpretación:

Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.

87
Mg. María Vallejos Atalaya

Sesión Nº 8

MEDIDAS DE FORMA

8.1. Medidas de forma

Son aquellos que permiten identificar la distribución de la información.

8.1.1. Asimetría (As)

Permite identificar hacia dónde se acumula la información. Se obtiene mediante la siguiente fórmula:

x  Mo Q3  Q1  2Q2
As  o As 
s Q3  Q1

Sí: As = 0 La distribución es simétrica


As > 0 La distribución es positiva
As < 0 La distribución es negativa

8.1.2. Coeficiente de Kurtosis o apuntamiento (K)

Indica el grado de aplastamiento que tiene la distribución. De acuerdo a ello se clasifican en:
distribuciones platicúrticas (Fig.1), mesocúrticas (Fig.2) y leptocúrticas (Fig.3).

PLATICÚRTICA MESOCÚRTICA
Fig.1 Fig.2

LEPTOCÚRTICA
Fig.3

Para el grado de apuntamiento (deformación vertical) utilizaremos el coeficiente denotado por:

Q3  Q1
k
2( P90  P10 )

Donde: P90 = percentil 90; Q1 = primer cuartil

88
Mg. María Vallejos Atalaya

P10 = percentil 10; Q3 = tercer cuartil

Si k = 0,263, diremos que la curva correspondiente a la distribución de frecuencias es mesocúrtica


(tiene igual apuntamiento que la normal o campana de Gauss).

si k < 0,263, diremos que la curva correspondiente a la distribución de frecuencias es platicúrtica.

si k > 0,263, diremos que la curva correspondiente a la distribución de frecuencias es leptocúrtica.

Ejemplo:
Correspondiente a datos agrupados (información en tablas):

Considerando el ejemplo de distribución de frecuencias para datos agrupados, en el cual estudiamos el


cociente intelectual de 50 alumnos. [“Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la
UPeU”].

Hallaremos la asimetría y el coeficiente de Kurtosis para datos agrupados.

Tabla Nº 1

DISTRIBUCIÓN DE FRECUENCIAS DE LOS PUNTAJES


DEL CI DE 50 ESTUDIANTES DE LA UPeU

Intervalo de clase Xi fi Fi
[88 – 94> 91 9 9 P10
[94 – 100> 97 6 15 Q1,D2
[100 – 106> 103 11 26 Q2
[106 – 112> 109 5 31
[112 – 118> 115 8 39 Q3
[118 – 124> 121 3 42 D8
[124 – 130> 127 8 50 P90

Total 50

Solución

La Asimetría (As):

Proceso:

Calcular los cuartiles 1, 2 y 3, como se hizo en el ejemplo de las medidas de posición.

 (1)50 
 4 9
Q1  94  6    97.5
 6 
 

 (2)(50) 
 4  15 
Q2  100  6    105.45
 11 
 

89
Mg. María Vallejos Atalaya

 (3)(50) 
 4  31
Q3  112  6    116.87
 8 
 

Reemplazar en la fórmula de la asimetría, entonces, la Asimetría es:

Q3  Q1  2Q2 116.87  97.5  2(105.45)


As    0.17
Q3  Q1 116.87  97.5

Interpretación:

Como la asimetría tiende a cero, la información es simétrica.

El coeficiente de Kurtosis (k):

Proceso:

Calcular los cuartiles 1 y 3 y los percentiles 10 y 90, como se hizo en el ejemplo de las medidas de
posición

 (1)50 
 4 9
Q1  94  6    97.5
 6 
 

 (3)(50) 
 4  31
Q3  112  6    116.87
 8 
 

 (10)(50) 
 100  0 
P10  88  6    91.3
 9 
 

 (90)(50) 
 100  42 
P90  124  6    126.25
 8 
 

Reemplazar en la fórmula de la asimetría, entonces el coeficiente de Kurtosis es:

Q3  Q1 116.87  97.5
k   0.27
2( P90  P10 ) 2(126.25  91.3)

Interpretación

Como k es igual 0.27 y este número es mayor que 0.263, entonces, la información es leptocúrtica.

90
Mg. María Vallejos Atalaya

EJERCICIOS PROPUESTOS

1) Analizar comparativamente la distribución de los sueldos de los 45 trabajadores de la empresa


metal mecánica.

s x C.V C.V%
Directivos 70 700 0,10 10%
Empleados 60 300 0,20 20%
Obreros 90 250 0,36 36%

2) En una empresa, el salario medio de los hombres es de S/. 4000 con una desviación estándar de
s/. 1500 y el de las mujeres es un promedio de s/. 3000 con desviación estándar de s/. 1200.
Hallará el Coeficiente de Variación de los salarios de los hombres y mujeres. Interprete.

3) Determinar cuál de las dos distribuciones A y B, tiene un mayor grado de dispersión

DISTRIBUCIÓN A

y´j-1 y´j (0-2 (2-4 (4-6 (6-8


nj 4 6 5 3

DISTRIBUCION B

y´j-1 y´j (4-8 (8-12 (12-16 (16-20 (20-24


nj 10 12 14 20 21

4) Una prueba de conocimiento, A, se calificó sobre 20 puntos dando una media de 12 y una
desviación estándar de 2 puntos. Mientras que una prueba de aptitud, B, se calificó sobre 100
puntos, dando una media de 70 y una desviación estándar de 5.

a) ¿En cuál de las dos pruebas los puntajes son más homogéneos?
b) Si Juan tiene 14 en A y Luis 73 en B, ¿quién tiene mejor puntuación estándar.

5) Multiplicando por 2 cada uno de los valores de la variable X: 3, 2, 0, 5, se obtiene la serie y: 6,


4, 0, 10. Comprobar que ambas series tienen el mismo coeficiente de variación.

6) Se toman las medidas de 80 personas, las que tiene estatura media de 1,70mt. y desviación
estándar de 3.4cm. Posteriormente se verificó que la medida usada en la medición tenía 4 cm.
menos. Rectifique los estadígrafos mencionados.

7) Conteste lo siguiente:
a) Si la varianza de una distribución de edades es 19.9809, entonces la desviación estándar de
dicha distribución es:
a1) 399.23636 a2) 9.99045
a3) –19.9809 a4) 4.47

b) Calcular el C.V. de: y=5x + 4 sabiendo x =240, V(x)=64


b1) 4.0% b2) 3.2% b3) 5.1% b4) 3.0%

8) Si la nota promedio en el curso de matemática Básica de la sección A es 12 puntos y la


desviación estándar es de 3 puntos y en la sección B se tiene una nota promedio de 12 punto y
una desviación estándar de 4 puntos podemos afirmar que:

a) La sección B tiene mejor promedio


b) La sección A tiene mejor promedio
c) Las notas de la sección A son más homogéneas
d) Las notas de la sección B son más homogéneas

91
Mg. María Vallejos Atalaya

Autoevaluación

CONCEPTUAL

1. Señale con una V si es verdadero o F si es falso en los siguientes


enunciados:

a) ( ) La asimetría es una medida de forma.


b) ( ) El C.V. permite determinar si la información es homogénea.
c) ( ) Kurtosis indica el grado de aplastamiento que tiene la
distribución.
d) ( ) La varianza no tiene interpretación práctica.

PROCEDIMENTAL

2. Un alumno obtuvo como promedio en estadística 68.70 puntos con una


desviación estándar de 15.40, y otro alumno obtuvo 50.90 puntos con
una desviación estándar de 19.60. Diga Ud. cuál de los dos alumnos
tiene un rendimiento homogéneo.

3. En la siguiente tabla se presenta la distribución de los salarios en


dólares. De 50 trabajadores de una empresa. La longitud de los
intervalos de clase es constante e igual a 20.

( y´j-1 - y´j ] yj nj Nj yjnj


300
400
23 350
17
( 100 - 120] 440
50

a) Completar la tabla de distribución de frecuencia y los datos que faltan


b) Determine la varianza, la desviación estándar, el coeficiente de variación

4. Los siguientes datos muestran los calificativos de 20 personas


sometidos a una prueba de aptitud. Los 20 estudiantes fueron divididos
en dos grupos, al grupo 1 se calificó de 0 a 100 y al grupo 2 se calificó
de 0 a 20:

Grupo 1: 86, 81, 79, 73, 95, 86, 94, 90, 86, 88
Grupo 2: 16, 19, 13, 20, 14, 16, 19, 18, 17, 15

a) Calcule la media y la desviación en cada grupo, ¿cuál de los grupos


es más homogéneo?

ACTITUDINAL

92
Mg. María Vallejos Atalaya

5. En una empresa deseas saber cómo están dispersos los valores de las
edades, con respecto a la media aritmética, de todos los trabajadores,
¿qué medida de resumen utilizarías y porqué?

93
Mg. María Vallejos Atalaya

94

También podría gustarte