Está en la página 1de 72

ESTADISTICA Y PROBABILIDADES

CAPITULO I. INTRODUCCIÓN A LA ESTADISTICA

1.1 DEFINICIÓN DE ESTADÍSTICA

La Estadística es la ciencia que recopila, clasifica, presenta, describe e interpreta conjuntos de datos.
Generalmente se ocupa de estudiar fenómenos aleatorios.

Comprende los métodos usados para recolectar la muestra, la organización y presentación de los
datos recolectados y la extracción de conclusiones mediante la aplicación de técnicas adecuadas a
los datos de la muestra.

La estadística puede dividirse en dos ramas: descriptiva e inferencial

ESTADÍSTICA DESCRIPTIVA; es el conjunto de métodos estadísticos que se relacionan con el


resumen y descripción de los datos, como tablas, gráficos, y el análisis mediante algunos cálculos.

Ejemplos 1.1 Un director de escuela desea conocer las aptitudes de cinco secretarias que trabajan
en dicha institución.

Se aplica una prueba de aptitudes a las cinco secretarias y las calificaciones son 70, 75, 90,85 y 80.

La medida estadística que emplea el director es la aptitud promedio o media aritmética, la cual es la
suma de los valores obtenidos dividida por el número de observaciones.

El resultado se limita a los datos obtenidos en este caso particular y no implica ninguna inferencia o
generalización acerca de las aptitudes de otras secretarias.

Este método es de naturaleza descriptiva, debido a que el promedio condensa y describe la


información obtenida, por ejemplo en el caso de las secretarias significa que el promedio de las
aptitudes de las cinco secretarias es 80.

Estadística inferencial: Es una técnica mediante la cual se obtienen generalizaciones o se toman


decisiones en base a una información parcial o completa obtenida mediante técnicas descriptivas.

Ejemplo 1.2 podría desear conocer la aptitud promedio de las demás secretarias, se podría utilizar
la calificación promedio de las cinco secretarias como base para realizar una inferencia o estimación
acerca de la aptitud promedio de todas las secretarias.

1 RVR-2007
1.2 DEFINICIÓN DE TÉRMINOS ESTADÍSTICOS BÁSICOS

a. Población o Universo: Población estadística es un conjunto de personas, entidades u objetos del


cual se quiere saber algo que nos interesa para tomar una determinación acertada.
En un sentido más estadístico, una población es el conjunto de mediciones de una cierta
característica en todos los individuos u objetos que poseen dicha característica.

Ejemplo 1.3 que proporción de la población de Huanuco toma cerveza .podría definirse
correctamente el universo diciendo, por ejemplo. Que lo conforman todas las personas que tienen
18 años cumplidos que viven en Huanuco.

En este ejemplo el universo esta conformado por personas, pero el universo podría estar
conformado por objetos, animales o mediciones.
La población puede ser finita o infinita, dependiendo del número de elementos que la forman.

Población finita; es aquella que tiene un número determinado de elementos.

Población infinita; es aquella que tiene un numero infinito de elementos. En la práctica una
población finita con un número grande de elementos se considera una población infinita.

b) Unidad de análisis: es el objeto del cual se desea obtener información. Muchas veces nos
referimos a las unidades de análisis con el nombre de elementos. En estadística, un elemento o
unidad de análisis puede ser algo con existencia real, como un automóvil o una casa, o algo más
abstracto como la temperatura o un intervalo de tiempo. Dada esta definición, puede redefinirse
población como el conjunto de unidades de análisis.

c) Muestra: Es un conjunto de datos seleccionados de un universo, de tal forma que refleje las
características de este .Se dice entonces que una muestra es representativa del universo.

La extracción de la muestra es un paso bien importante porque es a partir de ella que se sacan
conclusiones a acerca de la población. Si el diseño es sencillo la muestra tiene que ser relativamente
grande, alrededor de un 10% del tamaño de la población.

Se suelen tomar muestras cuando es difícil o costosa la observación de todos los elementos de la
población estadística. Al número de elementos de la muestra se le llama n (tamaño de la muestra)

Ejemplo. Si queremos hacer un estudio sobre la opinión sobre algún hecho en específico de los
residentes de Huanuco: Población- todos los residentes de Huánuco., Muestra- los residentes de la
urbanización X de Huanuco.

d) Muestra aleatoria: observación disponible en la población, tiene la misma probabilidad de ser


seleccionada. Es una muestra bien representativa de la población. Se considera que cada elemento
de la población ha tenido la misma oportunidad de formar parte de la muestra .Las conclusiones
basadas en una muestra aleatoria son confiables.

e) Variable: Es la característica que se desea estudiar

Ejemplo 1.4 variables


 Un grupo de psicólogos desea conocer el Coeficiente intelectual de un grupo de niños
(variable “Coeficiente intelectual ¨).

2 RVR-2007
 El director de un hospital desea conocer el color de ojos de un grupo de pacientes (variable
“color de ojos”).
 El gerente de una fabrica desea conocer el salario de sus empleados(variable “salario de
empleados”).
 El director de un colegio desea conocer el índice de aprovechamiento de alumnos de un
plantel, en la materia de matemática (variable “índice de aprovechamiento en matemáticas”)

f) Dato: es un valor particular de la variable

g) Parámetro: Es un valor particular que caracteriza a una población. El valor del parámetro es
constante y por lo general es desconocido. Se usan letras griegas para nombrarlos

h) Estadístico : Es un valor que se calcula en base a los datos que se toman en la muestra y el cual
es usado para estimar el valor del parámetro El valor del estadístico es conocido y varia con la
muestra tomada.
 Se usa para estimar los parámetros.
 Se usan letras latinas para nombrarlos.

i) Censo: Es un listado de una o más características de todos los elementos de una población. Los
censos poblacionales se hacen cada 10 años a nivel mundial.

j) Encuesta: Es un listado de una o más características de todos los elementos de una muestra.

k) Escalas de medición; es un instrumento de medida, con el que se asigna valores (números o


cualidades) a las unidades elementales para una variable definida.

Los tipos de escalas de medición son:

 Escala nominal: “Son aquellas que clasifican una población en dos o, las clases o grupos a
partir de una categoría” Ejemplo la variable sexo, con la modalidades femenino y
masculino. El método estadístico para esta escala, consiste en establecer básicamente en
obtener el número de casos o porcentaje en cada modalidad.
 Escala Ordinal: “Son escalas nominales donde existe una relacion de orden “.Por ejemplo,
la variable estatus socioeconómico, con las modalidades: clase baja, media y alta. El
método estadístico para esta escala, consiste básicamente en obtener la mediana, percentiles
y coeficiente de correlación por rangos
 Escala de intervalo:”Es una escala ordinal con una distancia definida entre sus valores“.
Por ejemplo, las escalas centígradas, el tiempo del calendario, calificación de un test.
 Escala de razones de proporciones:”Es una escala de intervalo que posee un cero
absoluto”.Por ejemplo, la variable estatura, peso, edad, etc.

1.3 TIPOS DE VARIABLES

De acuerdo con el tipo de datos que describe cada una de las variables, estas se clasifican en dos
tipos que son:

A. Variables cualitativas. Aquellas que no aparecen en forma numérica, sino como categorías o
atributos (sexo, profesión, color de pelo).

3 RVR-2007
Las variables cualitativas se subdividen en: Nominales y ordinales.

 Variables Nominales: Variable cualitativa nominal es aquella que agrupa los elementos en
categorías sin tener un orden. Ejemplo. Facultades (Psicología, Ingeniería, Medicina,
contabilidad); equipos de fútbol (Alianza, Universitario, Cristal), color de cabello (negro,
castaño, rubio), etc .En todos estos ejemplos no interesa el orden.

 Variables Ordinales: Variable cualitativa ordinal es cuando las categorías en que se agrupan
los elementos, pueden ser ordenados. Ejemplo. grado de estudios (primero, segundo, tercero);
orden de merito (1º, 2º.3º, etc); nivel social (alto, medio, bajo); en estos ejemplos interesa saber
el orden.

B. Variables cuantitativas

 Variable cuantitativa; Son aquellas variables cuyos valores son números .Por ejemplo. La
variable “peso del niño”, “temperatura”, “coeficiente intelectual”, “el numero de estudiantes de
un colegio”, etc.
Las variables cuantitativas se clasifican en:

 Variable Cuantitativa Discreta; son aquellas variables que toman valores numéricos
aislados y no pueden tomar ningún valor entre dos consecutivos fijados. Por ejemplo.
numero de alumnos en una facultad, numero de computadoras en una oficina, numero de
hijos por familia, etc.

 Variable Cuantitativa Continúa; son aquellas variables que pueden tomar infinitos
valores entre dos números, por muy próximos que los fijemos. Por ejemplo: peso de los
alumnos de una facultad; Coeficiente intelectual de niños, talla de los pacientes en un
hospital, etc.

1.4 TÉCNICAS DE MUESTREO

a) Muestreo Aleatorio: Se usa cuando a cada elemento de la población se le quiere dar la misma
oportunidad de ser elegido en la muestra.

b) Muestreo Estratificado: Se usa cuando se conoce de antemano que la población esta dividida
en estratos, que son equivalentes a categorías y los cuales por lo general no son de igual
tamaño .Luego de cada estrato se saca una muestra aleatoria, usualmente proporcional al tamaño del
estrato

c) Muestreo por conglomerados (¨Clusters¨): En este caso la población se divide en grupos


llamados conglomerados .Luego se elige. Luego se elige al azar un cierto número de ellos y todos
los elementos de los conglomerados elegidos forman la muestra.

d) Muestreo Sistemático: Se usa cuando los datos de la población estan ordenados en forma
numérica .La primera observación es elegida al azar de entre los primeros elementos de la población
y las siguientes observaciones son elegidas guardando la misma distancia entre si.

4 RVR-2007
1.5 MANERAS DE RECOLECTAR DATOS

a) Haciendo entrevistas personales. Puede ser el método mas efectivo en muchas ocasiones pero es
el costoso y requiere bastante tiempo para ser ejecutado.
b) Haciendo entrevistas por teléfono. Tiene la desventaja de que el entrevistado puede no ser
sincero en sus contestaciones.
c) Mediante cuestionarios emitidos por correo. Es costoso y por lo general no más del 30% de los
entrevistados retornan el cuestionario.
d) Por observación directa.
e) A través de Internet.
f) Usando simulación por computadoras.

1.6 EJERCICIOS PROPUESTOS

Ejercicio 1. ¿Cual es la definición de la Estadística?


Ejercicio 2. Comente brevemente los tipos o ramas de las que se compone la estadística.

Ejercicio 3. ¿En que se diferencian los conceptos de Población y Muestra?

Ejercicio 4. Indique que tipo de variable (cuantitativa o cualitativa) serian los siguientes conceptos
Sexo, Tensión Arterial, Grupo Sanguíneo.

Ejercicio 5. ¿En que consiste la inferencia estadística, de ejemplos?

Ejercicio 6. Si tuviera que realizar un estudio sobre la incidencia de una determinada patología
¿Que seria más recomendable? Un estudio sobre el total de la población estimada en 10 millones de
posibles afectados, o estudiar una muestra de la misma

Ejercicio 7. Comente brevemente los errores que se pueden producir al estudiar una muestra en
lugar de la población.

Ejercicio 8. Señale los tipos de muestreo que recuerde y de ejemplos en su área.

Ejercicio 9. ¿Que ventajas poseen los muestreos estratificado y por conglomerados frente al resto de
muestreos existentes?

Ejercicio 10. La siguiente lista de calificaciones se refiere a un examen psicológico aplicado a los
estudiantes de una escuela de ingeniería de una universidad junto con el sexo y la edad de cada uno,
para detectar si hay diferencia en la calificación según el sexo y la edad.
Los datos fueron redondeados a la unidad más próxima
370 362 363 400 345 389 363 372 380 402 372 370 330 366 369 364 370 353 377 408 369 360 338
379 371 376 387 362 405 381 420 359 391 399 343 411 408 355 370 358
a) ¿Cual es la unidad estadística elemental?
b) ¿Cual es la población de estudió? ¿Es finita o infinita?
c) Diga cual es la característica principal de estudio e indique si es cualitativa o cuantitativa
d) Elabore dos preguntas relacionadas con el tema.
e) De un ejemplo de observación para cada uno de las preguntas elaboradas.

5 RVR-2007
Ejercicio 11. El hospital Madre Teresa atendió 1050 pacientes por cáncer con edades entre 40 y 80
años, de 1993 a 2003, como en todos los servicios de salud, para cada uno se tiene un expediente en
el cual se nota información sobre sexo, edad en la que se diagnostico (inicial, intermedio, avanzado)
localización anatómica del tumor, tratamiento y numero de hospitalizaciones durante el periodo.
a) Defina la unidad estadística elemental.
b) Defina la población de interés.
c) Elabore dos preguntas relacionadas con el tema
d) Compete la siguiente lista.

Variable Tipo Observación


1. Sexo
2. Estadio
3. Localización anatómica
4. Hospitalizaciones
5. Edad

Ejercicio 12. En los servicios de salud, a cada paciente se le abre un expediente que se archiva
numéricamente y cada vez es atendido se nota en el nueva información. Con base en esta
información, el área de Salud de Amarilis va a hacer un estudio de los pacientes atendidos durante
el año 2003. En este estudio interesa investigar, entre otras cosas, ciertas características como edad,
sexo, profesión, así como el número de consultas al año, el número de citas que ha dejado pasar, el
motivo de consulta y la distancia de la vivienda a la unidad de atención.
a) Defina la unidad estadística elemental.
b) Defina la población de interés
c) Utilizando las características mencionadas en el texto anterior, por cada tipo indicando,
mencione el nombre de un ejemplo concreto en este caso y de un ejemplo de observación.
Tipo Nombre de variable Ej.de observación
Cualitativa
Discreta
Continua

d) Indique que método de recolección de datos se utiliza .Ventajas y desventajas en este caso
concreto.
e) Elabore dos preguntas relacionadas con el tema.

Ejercicio 13. ¿Cuál de las siguientes variables es del tipo cuantitativa continua?
A. Estado civil. B. Cifra de leucocitos por campo.
C. Grupo sanguíneo del Sistema ABO. D. Altura de una persona.

Ejercicio 14. ¿Cuál de las siguientes variables es del tipo cualitativa?


A. Edad en años. B. Presión arterial diastólica.
C. Tener caries dental. D. Partos asistidos en un año.

Ejercicio 15. Para conocer la prevalencia de personas vacunadas de hepatitis B, se ha seleccionado


aleatoriamente 5 de los 25 Centros de salud de los que se compone un área. De estos se ha
seleccionado aleatoriamente al 25 % de los cupos médicos y de estos se han revisado a totalidad de
las historias clínicas. Al tipo de muestreo empleado se le denomina:
A. Estratificado B. Por conglomerados C. Elemental D. Aleatorio Simple

6 RVR-2007
CAPITULO II: ORGANIZACIÓN Y REPRESENTACION DE DATOS

En este capítulo se verán las técnicas que se usan para la organización y presentación de datos en
tablas y gráficas.

2.1 DISTRIBUCION DE FRECUENCIAS

Se llama distribución de frecuencias a una tabla que divide un conjunto de datos en un número
adecuado de clases.
Con la distribución de frecuencias se tiene una idea mejor de como es la población (o muestra), y
además se puede trabajar de una forma mas sistemática y simplificada.

2.1.1 TIPOS DE DISTRIBUCIONES.


Existen dos tipos de distribución:

 Distribución categórica; es aquella que se aplica a la variable cualitativa, en donde sus valores
son cualidades o categorías.
 Distribución numérica; es aquella que se aplica a la variable cuantitativa, en donde sus valores
son números.

Veamos sus formas genéricas

DISTRIBUCIÓN DE FRECUENCIAS: Variable cualitativa

Categoría de Frecuencias Frecuencias


la variable X absolutas relativas

total N 1

7 RVR-2007
Ejemplo 1: En una encuesta de opinión acerca de las preferencias de una tipo de platos de comida
en un pueblito de Perú dieron las siguientes respuestas:

P: Pachamanca; L: lomo saltado; C: cebiche

P, P, P, P, P, P, P, P, L, L, L, L, L, L, L, L, L, C, C, C

Construir la distribución de frecuencias. Graficar la distribución

Solución

Distribución de personas por su preferencia en platos de comida

Plato de comida Nº de personas Porcentaje de


Personas
Pachamanca (P) 8 40.0
Lomo saltado(L) 9 45.0
Cebiche(C) 3 15.0
Total 20 100.0

DISTRIBUCION DE FRECUENCIAS: Variable Cuantitativa discreta

Valores de la Frecuencias Frecuencias Frecuencias Frecuencias


variable x absolutas relativas absoluta relativas
acumulada acumulada
Fi =
Ni =

n 100
Total n 1

Ejemplo 2 Ante la pregunta del número de hijos por familia (variable x) una muestra de 20 hogares,
marco las siguientes respuestas: 0, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4
Construir la distribución de la variable X. Graficar.

Solución:

Distribución del número de familias según número de hijos

Número Número Porcentaje Número de Porcentaje


de hijos de familias de familias familias de familias
acumuladas Acumuladas
0 1 5,0 1 5,0

8 RVR-2007
1 4 20,0 5 25,0
2 7 35,0 12 60,0
3 6 30,0 18 90,0
4 2 10,0 20 100,0
Total 20 100,0

DISTRIBUCION DE FRECUENCIAS: Variable cuantitativa continua

Intervalos Frecuencias Frecuencias Frecuencias Frecuencias


absolutas relativas absoluta relativas
acumuladas acumuladas
Li-1 - Li Fi =
Ni =

L0 – L1
L1 - L2

Lk-1 –Lk n 100


Total n 1

Denominaremos por ( );los distintos valores que toma la variable X


Frecuencia absoluta ( ); es el numero de veces que aparece cada valor de la variable, en
conjunto de observaciones.
Frecuencia absoluta acumulada ( ); es la suma de las frecuencias absolutas hasta cada punto
de la variable. Por ejemplo:

Frecuencia relativa ; es la razón que hay entre la frecuencia absoluta (n i) y el número total de
observaciones (n):

Es importante saber que la suma de todas las frecuencias relativas es siempre igual a uno:

Frecuencia relativa acumulada ; es la suma de las frecuencias relativas hasta cada punto de
la variable. Por ejemplo:

9 RVR-2007
Se puede deducir también que la frecuencia relativa acumulada es la razón entre la frecuencia
absoluta acumulada y el tamaño de la muestra:

Ejemplo 3. Los ingresos semanales en dólares (variable X) de 50 empleados son:

46 47 52 54 56 57 57 58 58 59 60 61 63 63 64 65 66 67 67 67 67 67 68 68 69 69 70 70 70 70
72 72 73 73 73 74 76 76 77 77 77 79 80 82 84 85 86 88 93 94
Construir una distribución de frecuencias.

Solución:

Tenemos:

1. Decidir cuantos intervalos usar, para eso usaremos la regla de Sturges;

K=1+ 3,322 Log(n) = 1+ 3,322 Log (50) = 1+ 3,322 (1,69897) = 6.644≈7

Por lo tanto el número de intervalos es K =7

NOTA: la aproximación es al entero inmediatamente superior; se recomienda que el número de


intervalos debe ser entero y entre 5 y 20.

2. Calcular el rango o recorrido de los datos

R = Valor máximo – Valor mínimo = 94-46+1 = 49

3. Calcular la amplitud común del intervalo, usaremos un indicador:

Por lo tanto la amplitud común es: A= 7

4. Determinamos el exceso: E = AK-R = 7x7-49=0

10 RVR-2007
6. Construimos la tabla de frecuencia

Distribución de 50 empleados según sueldo semanal (en dólares)

Sueldos Nº de Nº de Porcentaje Porcentaje de


(en dólares) empleados empleados de empleados
acumulados empleados acumulados
ni Ni fix100 x100

46 ; 53 3 3 6 6
53 ; 60 8 11 16 22
60 : 67 11 22 22 44
67 : 74 14 36 28 72
74 : 81 7 43 14 86
81 ; 88 5 48 10 96
88 ; 95 2 50 4 100
50 100

Interpretación.
 = 11, significa que existen 11 empleados que ganan entre 46 y 53 dólares semanales
 existen 14 empleados que ganan semanalmente entre 67 y 74 dólares por semana.
F6 = 96, el 96% de los empelados ganan entre 46 y 88 dólares por semana.
f5 = 14, el 14% de los empleados ganan entre 74 y 81 dólares semanales

PROPIEDADES DE LAS FRECUENCIAS.

Sean el número total de observaciones realizadas de la variable X que toma los valores distintos
,...,? entonces, tenemos las siguientes propiedades:

1. …+ 2. …+

3. 4.
5. 0  n  ni ; i = 1, 2, 3,..., k 6. 0  fi  1; i= 1,2, 3, ...,k
7.
8. El porcentaje correspondiente a un valor de la variable X se obtiene multiplicado la frecuencia
relativa por 100 esto es (%) = 100

2.2 REPRESENTACIONES GRAFICAS

La representación gráfica de una distribución de frecuencias depende del tipo de variable.

2.2.1 VARIABLES CUALITATIVAS

La representación gráfica de este tipo de datos está basada en la proporcionalidad de las áreas a las
frecuencias absolutas o relativas. Veremos dos tipos de representaciones:

11 RVR-2007
A. Diagrama de sectores (tarta):

Está representación gráfica consiste en dividir un círculo en tantos sectores circulares como
modalidades presente el carácter cualitativo, asignando un ángulo central a cada sector circular
proporcional a la frecuencia absoluta ni, consiguiendo de esta manera un sector con área
proporcional también a ni.
El ángulo central se determina así

Ejemplo 4 Hacer el diagrama de sectores para tabla siguiente.

Causas Número de casos


Mala atención 26
Productos inconformes 3
Reclamos 10
Otras causas 1
Total 40

Solución
Para determinar los ángulos del sector aplicamos los siguientes cálculos

360x26/40=234º Causas Número de casos Ángulo(grados)


360x3/4=27º Mala atención 26 234°
360x10/40=90º Productos inconformes 3 27°
360x1/40=9º Reclamos 10 90°
Otras causas 1 9°
Total 40 360º

Y su representación en un diagrama de sectores será:

Reclamos, Otros, 1
10

Productos
Mala
Inconformes
atención, 26
,3

B. Diagrama de rectángulos:

Esta representación gráfica consiste en construir tantos rectángulos como categorías presente la
variable cualitativa en estudio, todo ellos con base de igual amplitud. La altura se toma igual a la
frecuencia absoluta o relativa (según la distribución de frecuencias que estemos representando),
consiguiendo de esta manera rectángulos con áreas proporcionales a las frecuencias que se quieren
representar.

12 RVR-2007
Ejemplo 2.5 Hacer el diagrama de rectángulos para tabla siguiente.

=234º Causas Número de casos


7º Mala atención 26
=90º Productos inconformes 3
9º Reclamos 10
Otras causas 1
Total 40

Solución

La representación gráfica del diagrama de rectángulos del ejemplo anterior será de la forma:

2.2.2 VARIABLES CUANTITATIVAS: DATOS SIN AGRUPAR

Estudiaremos dos tipos de representaciones gráficas, correspondientes a distribuciones de


frecuencias (absolutas o relativas) no acumuladas y acumuladas.

A. Diagrama de barras:

Consiste en levantar, para cada valor de la variable, una barra cuya altura sea su frecuencia absoluta
o relativa, dependiendo de la distribución de frecuencias que estemos representando.

Ejemplo 6 La tabla expresa el número de hijos de 25 familias, construya el diagrama de barras de


las frecuencias relativas simples (fi)

Nº de hijos(Xi) 0 1 2 3 4 Total
Nº de familias(ni) 5 6 8 4 2 25

Solución.
Primero hallamos las frecuencias relativas
(fi), luego graficamos

13 RVR-2007
Xi ni fi
0 5 0.20
1 6 0.24 f
2 8 0.32 i
3 4 0.16
4 2 0.08
25 1.00

B. Diagrama de frecuencias acumuladas:


Numero de hijos
Esta representación gráfica se corresponde con la de una función constante entre cada dos valores
de la variable a representar, e igual en cada tramo a la frecuencia relativa acumulada (o absoluta
acumulada si se trata de representar una distribución de frecuencias absolutas) hasta el menor de los
dos valores de la variable que construyen el tramo en el que es constante.

Ejemplo 6 Graficar el diagrama de frecuencias relativas acumuladas del ejemplo anterior.

Solución.
Hallamos las frecuencias relativas acumuladas

Fi
Xi ni fi Ni Fi
0 5 0.20 5 0.20
1 6 0.24 11 0.44
2 8 0.32 19 0.76
3 4 0.16 23 0.92
4 2 0.08 25 1.00
25 1.00

Número de Hijos

2.2.3 VARIABLES CUANTITATIVAS: DATOS AGRUPADOS EN INTERVALOS

Al igual que antes, existen también dos tipos de representaciones gráficas dependiendo de si la
distribución de frecuencias en estudio es de datos acumulados o de datos sin acumular.

A. Histograma. Al ser esta representación una representación por áreas, hay que distinguir si los
intervalos en los que aparecen agrupados los datos son de igual amplitud o no.
Si la amplitud de los intervalos es constante, dicha amplitud puede tomarse como unidad y al ser

Frecuencia (área) = amplitud del intervalo · altura,

la altura correspondiente a cada intervalo puede tomarse igual a la frecuencia.

14 RVR-2007
Si los intervalos tienen diferente amplitud, se toma alguna de ellas como unidad (generalmente la
menor) y se levantan alturas para cada intervalo de forma que la ecuación anterior se cumpla.

Ejemplo 7 Se midieron los niveles de colinesterasa en un recuento de eritrocitos en μmol/min/ml de


55 agricultores expuestos a insecticidas agrícolas, obteniéndose los siguientes datos:

Individu Nivel Individuo Nivel Individuo Nivel Individuo Nivel Individuo Nivel
o
1 10.6 13 12.2 25 11.8 37 12.8 49 12.8
2 12.5 14 10.8 26 12.7 38 14.7 50 15.7
3 11.1 15 16.5 27 11.4 39 15.4 51 13.4
4 9.2 16 15.0 28 9.3 40 10.3 52 10.3
5 11.5 17 10.3 29 8.6 41 9.6 53 14.6
6 9.9 18 12.4 30 8.5 42 8.5 54 8.5
7 11.9 19 9.1 31 10.1 43 12.1 55 10.1
8 11.6 20 7.8 32 12.4 44 11.4
9 14.9 21 11.3 33 11.1 45 14.1
10 12.5 22 12.3 34 10.2 46 10.2
11 12.5 23 9.7 35 9 47 8
12 12.3 24 12.0 36 8.9 48 9.9

Grafique el histograma de frecuencias relativa

Solución.

Primero hallamos la tabla de frecuencias.


k = 1 + 3.322 log 55 = 6.78 = 7
Como el mayor valor es xmax = 16.5 y el menor xmin = 7.8, el rango es R= 16.5-7.8+0.1=8.8, luego
=1.26
E=(7x1.26-8.8)/2=0.01
Luego Xmin=Xmin-E; Xmax=Xmax+E; Xmin=7.80-0.01=7.79; Xmax=16.50+0.01=16.51
Los datos agrupados en los intervalos obtenidos, proporcionan las cuatro siguientes
distribuciones de frecuencias:
Ii ni fi
7.79 9.05 8 0.145
9.05 10.31 14 0.255
10.31 11.57 8 0.145
11.57 12.83 16 0.291
12.83 14.09 1 0.018
14.09 15.35 5 0.091
15.35 16.61 3 0.055
55 1.000

Al tener los intervalos igual amplitud, la representación gráfica de su histograma será:

Ejemplo 8. Si tuviéramos una distribución de frecuencias como la siguiente, correspondiente a


puntuaciones obtenidas en un test psicológico y en la que los intervalos son de diferente amplitud

Ii ni fi

15 RVR-2007
0-20 8 8/70
20-30 9 9/70
30-40 12 12/70
40-45 10 10/70
45-50 9 9/70
50-60 10 10/70
60-80 8 8/70
80-100 4 4/70
n= 70 1

Tomando la amplitud 5 como unidad, deberemos levantar para el primer intervalo una altura de
2/70 para que el área sea la frecuencia relativa 8/70. Procediendo de la misma manera con el resto
de los intervalos obtendríamos como representación gráfica la figura siguiente:

Obsérvese que la suma de todas las áreas debe ser 1, tanto si los intervalos de la distribución de
frecuencias relativas son o no de igual amplitud.

B. Polígono de frecuencias acumuladas:


Se utiliza para representar distribuciones de frecuencias (relativas o absolutas) acumuladas.
Consiste en representar la gráfica de una función que una por segmentos las alturas
correspondientes a los extremos superiores de cada intervalo, tengan o no todos igual amplitud,
siendo dicha altura igual a la frecuencia acumulada, dando una altura cero al extremo inferior del
primer intervalo y siendo constante a partir del extremo superior del último.

Ejemplo 9. Así, para el ejemplo de los Niveles de Colinesterasa, el polígono de frecuencias


relativas acumuladas tendrá una representación gráfica de la forma:

Ii ni fi Ni Fi
07.65 - 09.15 4 0.118 4 0.118
09.15 - 10.65 8 0.235 12 0.353
10.65 - 12.15 10 0.294 22 0.647
12.15 - 13.65 9 0.265 31 0.912
13.65 - 15.15 2 0.059 33 0.971
15.15 - 16.65 1 0.029 34 1 7.65 9.15 10.65 12.15 13.65 15.15 16.65
34 1

16 RVR-2007
2.3 OTRAS REPRESENTACIONES GRAFICAS

2.3.1 DIAGRAMA TALLO- HOJA (STEM & LEAL)

 Mantiene todos los datos originales pero en una forma compactada.


 Una vez construido el diagrama además de haber resumido los datos, tenemos algo parecido
a un histograma.
 No se pierde información.
 Divide el dato (número) en dos partes; tallo y hoja
 Puede haber 1, 2 o 5 líneas por tallo (el tallo se puede dividir en dos partes iguales o en 5
partes iguales)

De manera similar al histograma permite ver el lote como un todo y advertir aspectos como:
 Cuan aproximadamente simétricos son los datos.
 Cuan diversos están los valores.
 La aparición de los valores inesperadamente mas frecuentes,
 Si algunos valores están alejados del resto.
 Si hay concentraciones de valores.
 Si hay grupos separados.

Al utilizar los dígitos de los valores de los mismos datos, en vez de simplemente encerrando áreas,
ofrece ventajas.
 Es más fácil de construir a mano.
 Facilita el ordenamiento de los datos.
 Permite ver lo distribución de los datos dentro de cada intervalo como patrones dentro de
los datos.

Observaciones:

 Se recomienda que el número de tallos esté entre 5 y 20.


 A veces, de acuerdo con la información que se tenga, pueden resultar muy pocos tallos, con
lo cual las ramas quedan muy concentradas, y realmente no se obtiene mucha información.
En estos casos, puede ser conveniente partir los tallos en dos: Un tallo inferior (que tenga,
por ejemplo, las ramas menores que 5), y un tallo superior (que tenga las ramas mayores o
iguales a cinco). Así, por ejemplo, el tallo 6 puede dividirse en 6I, para los valores entre 60
y 64, y el tallo 6S, para los valores entre 65 y 69.
 Cuando se parten los tallos en dos, todos los tallos deben partirse en dos. Solamente el
primero y el último tallo podrían dejarse sin partir, en caso de que en el primer tallo sólo
haya información para el tallo superior, y cuando para el último tallo sólo haya información
para el tallo inferior.

Ejemplo 10 Suponga que los siguientes datos representan el salario anual de los obreros de la
compañía X
20 14 21 29 43 17 15 26 08 14 39 23 16 46 28 11 26 35 26 28 30 22 23 07 32 19 22 18 27 09

Construya el diagrama tallo-hoja

Solución:

Ordenamos los datos

17 RVR-2007
07 08 09 11 14 14 15 16 17 18 19 20 21 22 23 23 26 26 26 27 28 28 29 30 32 35 39 43 46
Y separamos los datos en dos fracciones (dígitos), ejemplo el 07 se separa (0 y 7 ), el 08 (0 y 8) el
21(2 y 1) el 39(3 y 9)

En este caso el tallo es el primer digito (decenas) y la hoja el ultimo (unidades)


0 789
1 14456789
2 0122336667889
3 0259
4 36

Los datos que más se repiten son los que tienen como tallo el 2, la distribución de los datos es
aproximadamente simétrica.
Nota: se recomienda que el número de tallos este entre 5 y 20

Ejemplo 11 Construya el diagrama tallo-hoja para los siguientes salarios.


107 111 115 118 121 123 126 128 130 139 108 114 116 119 122 123 126 128 132 143 109 114 117
120 122 126 127 129 135 146

Solución
10 789
11 14456789
12 0122336667889
13 0259
14 36

Ejemplo 12. Considere la siguiente información sobre duración de baterías de carro, en años. Se
pide:
 Construir el diagrama de tallos y hojas usando como tallos la parte entera.
 Construir el diagrama de tallos y hojas partiendo cada tallo en dos.

Duración de baterías (en años)


2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5

Solución
 Usando como tallos la parte entera
Tallos: Dígitos principales (Parte entera)
Ramas: Dígitos secundarios (Parte decimal)

Tallo Ramas Frecuencia


1 9 1
2 26596 5
3 5270413817463913172482905 25
4 156734172 9
Total 40
 Partiendo cada tallo en dos

18 RVR-2007
En este caso el tallo 1 únicamente tendría la parte superior, y el tallo 4 tendría tanto la parte inferior
como la superior

Tallo Ramas Frecuencia


1S 9 1
2I 2 1
2S 6596 4
3I 204131431312420 15
3S 5787697895 10
4I 13412 5
4S 5677 4
Total 40

Analice la diferencia entre los dos diagramas.

2.3.2 DIAGRAMA DE CAJA (BOX-PLOT)

A diferencia de los otros gráficos ya vistos, los diagramas de caja hacen énfasis en las medidas de
posición. Es muy útil para hacer comparaciones entre muestras de distintas poblaciones.

Un diagrama de caja consiste en un rectángulo cuya longitud es el rango intercuartílico (IQR),


dividido por un segmento a la altura de la mediana y complementado por dos líneas (llamadas
bigotes) que parten de los extremos del rectángulo, cuya longitud no supera 1,5 veces el rango
intercuartílico y que intentan alcanzar los valores mínimo y máximo observados.

En un simple gráfico se suministra información sobre la mediana (o media), sobre el 50% y 90% de
los datos, sobre la existencia de situaciones con datos atípicos, así como de la simetría de la
distribución.

Un diagrama de caja se construye como sigue:

1) Ordenar los datos de la muestra y obtener el valor mínimo, el máximo, y los tres cuartiles Q1,
Q2 y Q3.
2) Dibujar un rectángulo cuyos extremos son Q1 y Q3 e indicar la posición de la mediana, Q2,
mediante una línea.
3) Calcular con cualquiera de los procedimientos descritos anteriormente unos límites admisibles
superior e inferior, Li y Ls, que identifiquen a los valores atípicos.
Li = min – 1.5 IQR: Ls= max+1.5 IQR, IQR = Q3-Q1
4) Considerar como valores atípicos los situados fuera del intervalo (Li, Ls).
5) Dibujar una línea que va desde cada extremo del rectángulo central hasta el valor más alejado
no atípico, es decir, que está dentro del intervalo (Li, Ls).
6) Identificar todos los datos que están fuera del intervalo (Li, Ls), marcándolos como atípicos.

19 RVR-2007
Ls

Q3
Q2
Q1

Li

Ejemplo 14 Con base en una muestra de 20 entregas, Marco’s Pizza determinó la siguiente
información:
Valor mínimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos, Q3 = 22 minutos,
Valor máximo = 30 minutos.

Desarrolle un diagrama de caja para los tiempos de entrega.

Solución.
Ls=22+1.5 x IQR

Q2
Min Q1 Q3
max

12 13 15 18 20 22 24 28 30 32

Li = q1 - 1.5 IQR = 15 - 1.5 (22-15) = 15- 1.5(7) = 4.5, como min=13, el Li=13 y no 4.5
Ls = q3 + 1.5 IQR = 22 + 1.5 (22-15) = 22 + 1.5(7) = 32.5, como el máximo es 30 entonces Ls=30
y no 32.5

2.3.3 DIAGRAMA DE PUNTOS (DOT-PLOT)

Un Dotplot es una alternativa informal al Histograma para mostrar datos continuos. En el dotplot
cada valor de los datos mostrado como un punto en el eje horizontal. Cuando dos valores se separan
por menos de un cierto espacio se apilan en una columna. Si el incremento es muy pequeño es
imposible ver la forma de la distribución. Sin embargo, si el incremento es muy grande entonces
sólo se obtiene una columna de puntos.

Ejemplo 14. Los siguiente datos presenta los resultados observados del número de plántulas de
malezas por m2 en una muestra de tamaño n=20. 5 3 4 7 5 9 8 4 7 4 5 1 4 5 8 4 7 5 3 5
Garfique el diagrama de punto o dot plot

Solución

La Figura, presenta el dot-plot para estos datos.

20 RVR-2007

0 1 2 3 4 5 6 7 8 9 10
2.3.4 DIAGRAMA DE PARETO

Se ordenan las categorías de mayor a menor frecuencia y se dibujan los rectángulos


correspondientes. Es muy utilizado en controles de la calidad, donde cada clase representa un tipo
de disconformidad o problema de producción.

Ejemplo 16 Durante una jornada laboral el equipo de control de calidad decidió hacer un conteo de
los defectos que se presentaban en los elementos estructurales para puertas que se manufacturaban
dentro de la empresa recabando los siguientes datos. Construir el diagrama de
Pareto de los defectos en elementos estructurales en puertas.

Defecto Cantidad Porcentaje


del total
Fuera de perfil 30 37
Piezas desordenadas 21 26
Agujeros/ranuras 6 7
perdidos
Fuera de secuencia 6 7
Partes no lubricadas 5 6
Piezas con rebabas 5 6
Abolladuras/Picadur as 4 5
Otros 4 5
81 100

Solución

Subsecuentemente se realiza el diagrama de barras antes citado:


Obsérvese cómo el diagrama de Pareto pone de relieve que relativamente pocos defectos son
responsables de la mayor parte de los defectos observados en la pieza.

2.4 EJERCICIOS RESUELTOS

Ejercicio 1 Algunos estudiantes en un picnic de la clase reunieron datos acerca de cuántas uvas
cada uno tenía en su plato. Los resultados aparecen aquí en una gráfica de puntos.
a. grafique el diagrama de puntos (dot – plot)
b. ¿Cuántos estudiantes tenían más de seis uvas en su plato?
c. ¿Cuál es el rango de los datos y cual es la media?

21 RVR-2007
0 2 4 6 8 10 12 14
Solución.

a. Diagrama dot-plot

b. Sumamos el número de puntos sobre cada número mayor de seis; 6 + 2 + 1 = 9 estudiantes.

c. rango R=12 - 0 = 12.

Media:

Ejercicio 2 Las puntuaciones en un examen de medio semestre en una clase de historia fueron 98,
65, 77, 83, 77, 79, 92, 41, 84, 71, 73, 90, 77, 92, 64 y 83.
a. Crea una gráfica de tallos y hojas para los datos.
b. Crea un histograma para las puntuaciones del examen de medio semestre.
c. Da un resumen de cinco números para las puntuaciones del examen de medio semestre y dibuja
una gráfica de caja.
d. ¿Cuál es el rango intercuartil (IQR) de las puntuaciones del examen de medio semestre?

Solución
a. Colocamos los dígitos de las décimas en el “tallo” y los dígitos de las unidades en las
“hojas”. Creamos una clave que muestra cómo interpretar una de las entradas.
4 1
5
6 4 5
7 137779 Frecuencia de
8 334 puntuaciones
9 0228

Clave
7 1 significa 71

b. Histograma
Puntuaciones

c. Comienza con los datos en orden ascendente. La mediana es el valor central. Si hay un número
par de puntos de datos, la mediana es el promedio de los dos valores centrales. Q1 es la mediana de
todos los datos por debajo de la mediana y Q3 es la mediana de todos los datos por encima de la
mediana.

El resumen de cinco números es: mínimo, Q1, mediana, Q3, máximo.


Min Q2 Med Q3 Max
41 72 78 87 98

22 RVR-2007
41 64 65 71 73 77 77 77 79 83 83 84 90 92 92 98
Por lo tanto, el resumen de cinco números es 41, 72, 78, 87, 98.

0 20 40 60 80 100
Puntuaciones

d. IQR = Q3 - Q1= 87 - 72 = 15

Ejercicio 3 Las notas de Matemáticas de una clase han sido las siguientes: 3, 4, 1, 2, 8, 9, 8, 7,
6, 6, 7, 9, 8, 7, 7, 1, 0, 1, 5, 9, 9, 8, 0, 8, 8, 8, 9, 5, 7, 5, 6
Construir una tabla de frecuencias.
Solución
Frecuencias
Frecuencias Frecuencias Frecuencias
Calificaciones acumuladas
absolutas acumuladas relativas
xi relativas
fi Fi hi
Hi
0 2 2 2/30 2/30
1 3 5 3/30 5/30
2 1 6 1/30 6/30
3 1 7 1/30 7/30
4 1 8 1/30 8/30
5 3 11 3/30 11/30
6 2 13 2/30 13/30
7 5 18 5/30 18/30
8 7 25 7/30 25/30
9 5 30 5/30 30/30
30 1

Ejercicio 4. Las calificaciones finales en un curso de matemáticas de 80 estudiantes son


presentadas en la siguiente tabla, determine la amplitud de variación, número de clases y la
amplitud de clase.

8.3 6.6 7.5 7.9 8.2 7.8 8.5 7.9 7.9 8.5 7.2 6.6 8.8 6.6 8.3 7.7
7.9 7.8 8.4 9.3 6.6 7.6 7.5 8.6 7.9 7.4 7.9 7.8 7.9 9.0 7.4 7.5
7.0 7.1 7.7 7.3 8.5 8.2 6.6 7.5 6.7 7.7 6.7 6.6 8.4 6.8 7.9 8.0
7.8 9.0 8.7 8.7 8.2 6.7 8.3 7.3 7.9 6.7 8.5 9.1 9.0 9.3 8.4 6.6
7.2 6.6 7.2 7.5 7.9 9.8 10 8.7 7.2 9.6 7.4 8.5 7.9 7.8 8.5 8.5

Solución.

23 RVR-2007
Analicemos el problema utilizando la fórmula de Sturges. En ese caso en número de clases esta
determinado como: k= 1+3.322 log 80 =7.32≈8 clases.
El intervalo de variación o rango es R=10-6.6+0.1=3.5 por lo que la amplitud de clase es igual a
. E=(8x0.44-3.5)/2=0.01; Xmin=Xmin-0.01=6.59; Xmax=Xmax+0.01=10.01
De lo que obtenemos la siguiente tabla:

Frecuencias Frecuencias Relativas Frecuencia Relativa


Marcas Absolutas (en por ciento) Frecuencia Acumulada
Clases de Absoluta
clase En por Decimal Acumulada En por Decimal
ciento ciento
<6.59 7.03] 6.81 14 17.50 % 0.175 14 17.50% 0.175
<7.03 7.47] 7.25 10 12.50 % 0.125 24 30.00% 0.300
<7.47 7.91] 7.69 25 31.25 % 0.3125 49 61.25% 0.6125
<7.91 8.35] 8.13 7 08.75% 0.0875 56 70.00% 0.700
<8.35 8.79] 8.57 14 01.75 % 0.175 70 8.75% 0.875
<8.79 9.23] 9.01 5 06.25 % 0.0625 75 93.75% 0.9375
<9.23 9.67] 9.45 3 03.75 % 0.0375 78 97.50% 0.975
<9.67 10.11] 9.89 2 02.50% 0.025 80 100.00 1.000

Ejercicio 5 Se han medido el grupo sanguíneo de 40 individuos y se han observado las siguientes
frecuencias absolutas para cada categoría:12 para x1 = A, 11 para x2 = B, 8 para x3 = AB y 9 para
x4 = O.
a) ¿De qué tipo es la variable estudiada? Construir la tabla de frecuencias correspondiente.
b) ¿Qué porcentaje de individuos son del grupo A?
c) ¿Qué porcentaje de individuos no son del grupo O?
d) ¿Cuántos individuos no son del grupo B?
e) construya el diagrama de sectores

Solución
a) variable cualitativa

xi ni fi Ni Fi
A 12 0.300 12 0.300
B 11 0.275 23 0.575
AB 8 0.200 31 0.775
O 9 0.225 40 1.000
Total 40 1.000

b) del grupo A son el 30% de los individuos


c) no son del grupo O el 77.5% de los individuos
d) no son del grupo B, (40-11) = 29 individuos
e) diagrama de sectores

24 RVR-2007
Ejercicio 6. Se quiere estudiar la eficacia de un nuevo insecticida para plantas de interior. Se
seleccionan 50 plantas y se cuenta el número de hojas que han sido atacadas después de haber
tratado la planta con el nuevo producto. Los resultados son:

Hojas atacadas ni
0 6
1 10
2 12
3 8
4 5
5 4
6 3
8 1
10 1

a) ¿De qué tipo es la variable de estudio? Construir la tabla de frecuencias correspondiente.


b) ¿Qué porcentaje de plantas tienen sólo 3 hojas atacadas?
c) ¿Cuántas plantas tienen como máximo 3 hojas atacadas?
d) ¿Cuántas plantas tienen como mínimo 6 hojas atacadas?
e) ¿Qué porcentaje de plantas tienen entre 3 y 5 hojas atacadas?
f ) ¿Qué porcentaje de plantas tienen al menos 8 hojas atacadas?
g) ¿Qué porcentaje de plantas tienen a lo sumo 2 hojas atacadas?
h) construya el diagrama de barras y el polígono de frecuencia

Solución
a) Cuantitativa discreta,
Hojas atacadas ni fi Ni Fi
0 6 0,12 6 0,12
1 10 0,20 16 0,32
2 12 0,24 28 0,56
3 8 0,16 36 0,72
4 5 0,10 41 0,82
5 4 0,08 45 0,90
6 3 0,06 48 0,96
8 1 0,02 49 0,98
10 1 0,02 50 1

b) el 16%, c) 36, d) 3+1+1 = 5 o bien 50−45 = 5, e) el 16+10+8 = 34% o bien (8 + 5 + 4)/50


· 100 = 34%, f ) el 2 + 2 = 4% o bien 100 − 96 = 4%, g) el 56%.

h) diagrama de barras y polígono de frecuencia 12

0 0 1 2 3 4 5 6 7 8 9 10

25 RVR-2007
Ejercicio 7. En veinte vuelos de avión se han contado el número de asientos vacíos en cada vuelo.
Se han agrupado los datos en intervalos de longitud 4.

asientos ni
vacíos
0−3 9
4−7 5
8 − 11 4
12 − 16 2

a) ¿De qué tipo es la variable estudiada? Construir la tabla de frecuencias correspondiente.


b) ¿En cuántos vuelos hay menos de 8 asientos vacíos? ¿Qué porcentaje representan?
c) ¿En cuántos vuelos hay como mínimo 10 asientos vacíos? ¿Qué porcentaje representan?
d) construya el histograma y polígono de frecuencia

Solución
a) Cuantitativa discreta,
intervalos xi ni fi Ni Fi
[0, 4) 2 9 0,45 9 0,45
[4, 8) 6 5 0,25 14 0,70
[8, 12) 10 4 0,20 18 0,90
[12, 16] 14 2 0,10 20 1,00
Total 20 1

b) En 14 vuelos, y representan el 70% de los vuelos,


c) Aproximadamente en 2 + 4 · (10 − 8)/(12 − 8) = 4 vuelos, que representan el 4/20 · 100 =
20% de los vuelos.
d. Histograma y polígono de frecuencia

Ejercicio 8. Se tiene una urna con 50 esferas numeradas progresivamente. El experimento consiste
en sacar una esfera, anotar su número y devolverla a la urna.
a) ¿Cuál es la variable?
b) ¿La variable es cualitativa o cuantitativa?
c) Si podemos sacar una esfera por tiempo indefinido, entonces ¿cómo es la población?
d) Si únicamente podemos hacer 100 extracciones, entonces, ¿cómo es la población?

Solución
a) La variable es el número de la esfera.
b) Es cuantitativa.
c) La población es infinita.

26 RVR-2007
d) La población es finita.

Ejercicio 9 En un Colegio de secundarios ingresaron 8000 estudiantes. De estos se seleccionaron


500 para estudiar las características que indican. Determine si la variable asociada está definida por
una expresión o un número; determina si es cualitativa o cuantitativa e indica el tipo de escala.
a) Estado de salud de cada alumno.
b) Estatura de cada uno.
c) Número de estudiantes que ingresan.
d) Sexo de cada estudiante.
e) ¿Cuál es y cómo es la población?
f) ¿Cuál es la muestra?
g) Se escogen los 10 primeros lugares en puntuación.

Solución
a) Se define por una expresión (estado de salud) es de tipo cualitativo, es nominal, es una variable
discreta y la escala con que se cuantifica es nominal.
b) Se define por un número (número de centímetros), es de tipo cuantitativo, es una variable
continua y su escala con que se cuantifica es por intervalos.
c) Se define por un número, es de tipo cualitativo, es una variable discreta y su escala de medición
es por intervalos.
d) Se define por una expresión (sexo) es de tipo cualitativo nominal, es discreta: su escala de
medición es nominal.
e) La población está constituida por 8000 estudiantes, por lo tanto es una población finita.
f) La muestra está constituida por 500 alumnos.
g) La variable está definida por una expresión (lugar que ocupó), es de tipo cualitativo ordinal, la
escala con que se cuantifica es ordinal y es una variable discreta.

Ejercicio 10 En la Fuerza Aérea de un determinado país, los aviadores toman un examen médico
general en cada 150 horas de vuelo, por lo que se analizan los expedientes de cada piloto para
citarlos a su examen. Los resultados obtenidos se muestran en la siguiente tabla correspondiente a
las horas de vuelo.
222, 220, 199, 212, 201, 217, 214, 213, 212, 215, 214, 196, 192, 208, 207, 212, 214, 209, 202, 206,
196, 202, 219, 194, 206, 204, 194, 211, 216, 209, 212, 216, 206, 201, 201, 210, 200, 206, 201, 205,
217, 219, 212, 207, 211, 204, 212, 212, 205, 207, 214, 211, 220, 205, 201, 218, 193, 199, 206, 209,
205, 205, 221, 216, 211, 204, 215, 203, 213, 207, 209, 197, 197, 199, 208, 209, 218, 204, 207, 202,
209, 195, 207, 209, 205, 210, 197, 209, 211, 208, 211, 198, 217, 209, 199, 192, 218, 193, 208, 209,
194, 211,

a) Ordena los datos en una tabla de frecuencias.


b) Calcula el rango de los datos.
c) Calcula el número de clase mediante la aplicación de la fórmula de Sturges K= 1 + 3.322 log n
d) Calcula la amplitud del intervalo
e) Determina los límites de clase. f) Determina los puntos medios de clase Mi
g) Determina la frecuencia ni h) Determina la frecuencia relativa fi
i) Determina la frecuencia acumulada Ni j) Determina la frecuencia acumulada relativa Fi.
k) Traza el histograma y el polígono de frecuencia.
l) Traza el polígono de frecuencia acumulada relativa (ojiva).
m) Traza el polígono de frecuencia acumulada menos que.
n) Traza el polígono de frecuencia acumulada más que.

27 RVR-2007
Solución.

a) Datos ordenados

19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 20 20
2 2 3 3 4 4 4 5 6 6 7 7 7 8 9 9 9 9 0 1
20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20
1 1 1 1 2 2 2 3 4 4 4 4 5 5 5 5 5 5 6 6
20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20
6 6 6 7 7 7 7 7 7 8 8 8 8 8 9 9 9 9 9 9
20 20 20 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21
9 9 9 0 0 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3
21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 22 22
3 4 4 4 4 5 5 6 6 6 7 7 7 8 8 8 9 9 0 0
22 22
1 2

b) Rango; R = Xn – X1+1 = 222-192+1 = 31 R = Rango

c) Clases, K = 1 + 3.322 log(102) = 1 + 3.322(2.008) = 1 + 6.67 = 8.67 ≈ 8


K=8 K = Número de clases
d) Amplitud, A = Amplitud de clase
E= (8x4-30)/2 = 2/2 =0.01; Xmin=Xmin-1=192-0.1=191.9; Xmax=Xmax+0.1= 222+0.1=222.1

e) f) g) h) i) j)
Límite de Punto Medio Frecuencia Frecuenci Frecuencia Frecuencia
Clase de clase Absoluta ni a Acumulada Relativa
Relativa fi Ni Acumul. Fi
<191.9 195.8] 193.85 8 0.078 8 0.078
<195.8 199.7] 197.75 10 0.098 18 0.176
<199.7 203.6] 201.65 10 0.098 28 0.274
<203.6 207.5] 205.55 21 0.21 49 0.484
<207.5 211.4] 209.45 23 0.23 72 0.714
<211.4 215.3] 213.35 15 0.15 87 0.864
<215.3 219.2] 217.25 11 0.11 98 0.964
<219.2 223.1] 221.15 4 0.04 102 1.00
Total 102 1.00

k. Histograma y polígono de frecuencias

193.9 197.8 201.7 205.6 209.5 213.4 217.3 221.2

28 RVR-2007
l. Polígono de frecuencia acumulada relativa

PUNTO MEDIO FRECUENCIA FRECUENCIA


DE CLASE ABSOLUTA RELATIVA
ACUMULADA Ni ACUMULADA Fi
193.85 8 0.078
197.75 18 0.176
201.65 28 0.274
205.55 49 0.484
209.45 72 0.714
213.35 87 0.864
217.25 98 0.964
221.15 102 1.00

1.00

0.50

m) Ojiva menos que

Punto medio Frecuenci Frecuencia


de clase a absoluta
absoluta acumulada Ni
ni
193 8 8
197 10 18
201 10 28
205 21 49
209 23 72
213 15 87
217 11 98
221 4 102

n) Ojiva más que

punto medio de frecuenci frecuencia


clase a acumulada
absoluta más que
ni

29 RVR-2007
193 8 102
197 10 94
201 10 84
205 21 74
209 23 53
213 15 30
217 11 15
221 4 4
Ejercicio 11 En cierta ciudad se entrevisto a 50 mujeres nacidas entre 1935 y 1944, la edad en que
contrajeron matrimonio, la tabla expresa sus respuestas
15 17 25 15 16 11 15 13 12 10 15 14 16 14 17 13 14 20 29 19 16 18 10 18 12
11 20 34 13 22 19 14 17 16 16 15 12 24 25 9 21 15 13 23 24 10 10 16 14 18
a. construya el diagrama de dot – plot b. construya el diagrama de box-plot
c. construya el diagrama de Stem-and-Leaf

Solución

a. Dot - plot

8 12 16 20 24 28 32
b. Box – plot

c. Stem-and-Leaf

1 0 9
(38) 1 00001122233334444455555566666677788899
11 2 001234455

Ejercicio 12. Las estaturas de la población femenina de un país en metros es:


1,59 1,60 1,62 1,65 1,61 1,59 1,51 1,60 1,62 1,53 1,49 1,57 1,54 1,53 1,59 1,58 1,57 1,47 1,64 1,54
1,53 1,59 1,58 1,57 1,49 1,57 1,60 1,54 1,56 1,50 1,62 1,59 1,62 1,54 1,68 1,52 1,62 1,62 1,49 1,65
1,53 1,59 1,56 1,54 1,52 1,63 1,56 1,62 1,35 1,66 1,60 1,58 1,62 1,54 1,64 1,70 1,66
Se pide: Preparar una tabla de frecuencias agrupando en intervalos de igual amplitud, interprete la
tabla

Solución
K=1+3.322log(57)= 1+3.322=6.8= 7 R= Xmax-Xmin+0.01=1.70-1.35+0.01=0.36
C= 0.36/7=0.051=0.05 E=(7x0.05-0.35)=0;

Tabla de frecuencia

Li Ls ni fi Ni Fi Interpretación. Hay 1 persona que mide


entre 1.35 y 1.40m ; el 8.8% de las personas
miden entre 1.45 y 1.50 m.
30 RVR-2007
<1.35 1.40] 1 0.018 1 0.01754
<1.40 1.45] 0 0 1 0.01754
<1.45 1.50] 5 0.088 6 0.10526
<1.50 1.55] 13 0.228 19 0.33333
<1.55 1.60] 20 0.351 39 0.68421
<1.60 1.65] 14 0.246 53 0.92982
<1.65 1.70] 4 0.07 57 1
57
Ejercicio 13. Nos interesa conocer la antigüedad de los docentes en una determinada Universidad,
por lo que le encarga a un investigador que realice un estudio sobre esta característica, el
Investigador recibió de los expedientes la siguiente información en años de antigüedad:
13, 19, 22, 14, 13, 16, 19, 21, 23, 11, 27, 25, 17, 17, 13, 20, 23, 17, 26, 20, 24, 15, 20, 21, 23,
17, 29, 17, 19, 14, 20, 20, 10, 22, 18, 25, 16, 23, 19, 20, 21, 17, 18, 24, 21, 20, 19, 26, 22, 16
a) ¿De qué tipo es la variable de estudio? b) Ordena los datos en una tabla de frecuencias.
c) Determina los puntos medios de clase (marca de clase)
d) Determina las frecuencias n5 f4, N3, F2 e interprete.
e) Traza el histograma y el polígono de frecuencias.
f) Traza un gráfico circular.
Solución

a) variable continua cuantitativa

b) Tabla de frecuencias
N =50 Tabla de frecuencias
Max =29 Li-1 Li ni fi Ni Fi
Min =10 <9.5 12.5] 2 0.04 2 0.04
K =1+3,322*log(50)= 6,643978354=7 <12.5 15.5] 6 0.12 8 0.16
r =max-min=29-10+1=20 <15.5 18.5] 11 0.22 19 0.38
A =r/k=2.86=3 <18.5 21.5] 16 0.32 35 0.70
e =kx-r=21-20=1 <21.5 24.5] 9 0.18 44 0.88
xmin =10-0.5=9.5 <24.5 27.5] 5 0.10 49 0.98
xmax =29+0.5=29.5 <27.5 30.5] 1 0.02 50 1
50 1

c) marca de clase d) frecuencias n5, f4, N3, F2


Li-1 Li Xi ni fi Ni Fi n5=9 (existen 9 docentes que tienen una antigüedad
<9.5 12.5] 11 2 0.04 2 0.04 entre 21.5 y 24.5 años inclusive).
<12.5 15.5] 14 6 0.12 8 0.16 f4=32% (el 32% de los docentes tienen una
<15.5 18.5] 17 11 0.22 19 0.38 antigüedad entre 18.5 y 21.5 años inclusive).
<18.5 21.5] 20 16 0.32 35 0.7 N3=19 (existen 19 docentes que tienen una
<21.5 24.5] 23 9 0.18 44 0.88
antigüedad entre 9.5 y 18.5 años).
<24.5 27.5] 26 5 0.10 49 0.98
<27.5 30.5] 29 1 0.02 50 1
F2=16% (el 16% de los docentes tienen una
50 1 antigüedad entre 9.5 y 15.5 años).

e) Histograma y polígono de frecuencias


Histograma de frecuencia 2.00%
4.00%
10.00% 12.00%
20
18.00%
15
22.00%
10

5 31 RVR-2007
32.00%
0
11 14 17 20 23 26 29
30
f. Gráfico Circular

2.5 EJERCICIOS PROPUESTOS

Ejercicio 1. La siguiente tabla muestra la clasificación de 901 individuos según la variable


satisfacción en el trabajo
Xi ni
Muy insatisfecho 62
Moderadamente insatisfecho 108
Moderadamente satisfecho 319
Muy satisfecho 412
Total 901

a) ¿De qué tipo es la variable de estudio? Calcular la tabla de frecuencias correspondiente.


b) ¿Qué porcentaje de individuos están moderadamente satisfechos?
c) ¿Cuántos individuos están a lo sumo moderadamente insatisfechos?
d) ¿Qué porcentaje representan?
e) ¿Cuántos individuos están por lo menos moderadamente satisfechos?
f) Construya todos los gráficos que sean posibles

Ejercicio 2 Al gerente general de una empresa le interesa conocer la antigüedad de sus


trabajadores, por lo que le indica al gerente de personal que realice un análisis del problema.
El gerente de personal recabó de los expedientes la siguiente información sobre los años de
antigüedad:
13, 19, 22, 14, 13, 16, 19, 21 23, 11, 27, 25, 17, 17, 13, 20 23, 17, 26, 20, 24, 15, 20, 21
23, 17, 29, 17, 19, 14, 20, 20 10, 22, 18, 25, 16, 23, 19, 20 21, 17, 18, 24, 21, 20, 19, 26
a) ¿De qué tipo es la variable de estudio? Calcular la tabla de frecuencias correspondiente.
b) Ordena los datos en una tabla de frecuencias, interprete.
c) Calcula el rango de los datos.
d) Calcula el número de clase mediante la aplicación de la fórmula de Sturges K= 1 + 3.322 log n
e) Calcula la amplitud del intervalo f) Determina los límites de clase.
g) Determina los límites reales de clase. h) Determina los puntos medios de clase Mi
i) Determina la frecuencia ni j) Determina la frecuencia relativa fi
k) Determina la frecuencia acumulada Ni l) Determina la frecuencia acumulada relativa Fi.
m) Traza el histograma y el polígono de frecuencia.
n) Traza el polígono de frecuencia acumulada relativa (ojiva).
o) Traza el polígono de frecuencia acumulada menos que.
p) Traza el polígono de frecuencia acumulada más que.
q) Traza un gráfico circular. r) construya los demás gráficos que sea posible

Ejercicio 3. La venta de libros de una librería de los 5 años anteriores fueron los que se
muestran en la siguiente tabla.
1988 1989 1990 1991 1992

32 RVR-2007
Matemática 500 1000 1500 2000 3000
s
Física 1000 500 2500 2000 1500
Química 500 1500 500 500 2000
Filosofía 500 500 1000 500 500
Leyes 1000 1500 2000 1000 500

a. construya la tabla de frecuencia y todos los gráficos necesarios

Ejercicio 4. Los datos siguientes corresponden a ciertas longitudes (en cm). Construir un diagrama
de tallo y hojas, box – plot, dot – plot, Pareto. 11.357, 12.542, 11.384, 12.431, 14.212, 15.213,
13.300, 11.300, 17.206, 12.710, 13.455, 16.143, 12.162, 12.721, 13.420, 14.698.

Ejercicio 5. Con los datos del Ejercicio 2.4 trazar la curva de frecuencias relativas acumuladas.
Determinar el número de vuelos que tienen como máximo 10 asientos vacíos.

Ejercicio 6. Clasificadas las provincias de un país por su número de habitantes en 2001, se


obtuvieron los siguientes datos:

Num. habitantes Num.


provincias
de 1 a 100 000 3
de 100 000 a 250 000 8
de 250 000 a 500 000 13
de 500 000 a 750 000 10
de 750 000 a 1 000 000 7
de 1 000 000 a 2 000 000 8
de 2 000 000 a 3 000 000 1
de 3 000 000 a 4 000 000 0
de 4 000 000 a 6 000 000 2

a) Construir una tabla estadística con las marcas de clase, las frecuencias absolutas y las frecuencias
relativas.
b) ¿Cuántas provincias tienen menos de 500 000 habitantes? ¿Qué porcentaje representan?
c) ¿Cuántas provincias tienen entre 800 000 y 1 300 000 habitantes?
d) Construir el histograma de frecuencias absolutas. Interprete
e) Construya todo los gráficos que sean necesarios

Ejercicio 7 Los siguientes datos corresponden a las medidas de 15 individuos sobre la variable
cuantitativa peso (en kg): 62, 74, 86, 53, 49, 71, 68, 67, 69, 70, 58, 59, 73, 74, 78.
a) Construir una tabla de frecuencias absolutas, relativas, absolutas acumuladas y relativas
acumuladas.
b) Realizar un diagrama de tallo y hojas y un polígono de frecuencias acumuladas.
c) ¿Qué porcentaje de individuos pesan entre 50 y 60 kg?
d) ¿Cuántos individuos pesan por lo menos 70 kg?
e) construya todo los gráficos que sean necesarios

Ejercicio 8 Una empresa inmobiliaria ofrece apartamentos en régimen de alquiler con los siguientes
precios (en euros):
precio alquiler número de

33 RVR-2007
(mensual) apartamento
s
700-1000 21
1000-1100 27
1100-1300 34
1300-1500 14
1500-1800 8
1800-2000 11
2000-2100 10

a) Obtener el alquiler medio por apartamento, el precio más frecuente y el precio que se sitúa en
medio de la oferta.
b) Si una persona está dispuesta a gastarse en alquiler entre 1250 y 1350 euros al mes, a qué
porcentaje de apartamentos tiene opción?
c) Por debajo de qué precio están el 80% de los apartamentos?
d) Entre qué precios están el 50% central de los apartamentos?

Ejercicio 9 El número de días que 9 trabajadores escogidos al azar de una empresa han estado de
baja son los siguientes: 15 7 8 85 19 12 8 22 14
a) Representa este conjunto de datos mediante un diagrama de caja (box-plot). ¿Se detecta algún
valor atípico?
b) ¿Qué se puede decir de la simetría de estos datos?
c) ¿Qué transformaciones conoces que creas que pueden ser útiles para simetrizar estos datos?

Ejercicio 10. El consumo en miles de litros de agua de una industria durante los primeros 10 meses
del año de 1993 son los que se muestran en la siguiente tabla.

MES No. DE LITROS EN MILES


Enero 50
Febrero 58
Marzo 62
Abril 70
Mayo 80
Junio 85
Julio 80
Agosto 70
Septiembr 65
e
octubre 60

a. Determine la tabla de frecuencias, interprete la tabla


b. Represente los datos de la tabla en un diagrama de rectángulos,
c. Diagrama de sectores,
d. Diagrama de pareto, interprete la información

Ejercicio 11 Las calificaciones finales obtenidas por los 80 alumnos de un primer curso de
Estadística. Se muestra a continuación.
68 84 75 82 68 90 62 88 76 93 73 79 88 73 60 93 71 59 85 75 61 65 75 87 74 62 95 78 63 72 66 78
82 75 94 77 69 74 68 60 96 78 89 61 75 95 60 79 83 71 79 62 67 97 78 85 76 65 71 75 65 80 73 57
88, 78 62 76 53 74 86 67 73 81 72 63 76 75 85 77

34 RVR-2007
Se pide:
a. Preparar una tabla de frecuencias, interprete.
b. Representar gráficamente los datos.
c. El número de estudiantes con calificaciones de 75 ó más.

Ejercicio 2.12 Estaturas de la población femenina Venezolana, en metros:


1,56 1,59 1,63 1,62 1,65 1,61 1,59 1,51 1,62 1,62 1,53 1,49 1,57 1,54 1,53 1,59 1,58 1,57 1,47 1,64
1,54 1,53 1,59 1,58 1,57 1,47 1,57 1,60 1,54 1,56 1,50 1,62 1,59 1,62 1,54 1,68 1,52 1,62 1,62 1,49
1,65 1,53 1,59 1,56 1,54 1,52 1,63 1,56 1,62 1,35 1,66 1,54
Se pide:
a. Preparar una tabla de frecuencias agrupando en intervalos de igual amplitud, interprete.
b. Construir todos los gráficos necesarios para el caso.

Ejercicio 13 Los valores del ph.sanguíneo en 40 individuos3 son los siguientes:


7,32 7,34 7,40 7,28 7,29 7,35 7,33 7,34 7,28 7,31 7,35 7,32 7,33 7,36 7,32 7,34 7,31 7,35 7,36 7,26
7,39 7,29 7,32 7,34 7,30 7,34 7,32 7,30 7,33 7,33 7,35 7,34 7,33 7,36 7,33 7,35 7,31 7,26 7,39 7,35
Se pide:
a. Preparar una tabla de frecuencias agrupando en intervalos de igual amplitud, interprete.
b. Construir todos los gráficos necesarios para el caso.
c. ¿Qué valor de ph. tiene exactamente un 33% de observaciones menores que dicho valor?

Ejercicio 14 La Edad promedio de las personas que presentaron dolor toráxico ( N =1184 ) en
urgencias durante un año fueron:
Edad i ni
0 – 20 8
20 – 30 94
30 – 40 220
40 – 45 236
45 – 50 260
50 – 55 154
55 – 65 198
65 – 80 14

Se pide:
a. Completar la tabla de distribución de frecuencias, interprete.
b. Dibujar el histograma, polígono de frecuencias y la ojiva.
c. ¿Qué % de personas tenían una edad inferior a 50 años? ¿E inferior a 28 años? ¿Y entre 37 y 54?
d. Construya los demás gráficos que sean posibles

Ejercicio 15. El primer día de clases del semestre pasado se les preguntó a 70 estudiantes, acerca del
tiempo (en minutos) que tardan para ir de su casa a la universidad.
20 35 25 15 5 20 25 30 20 20 30 15 15 20 20 25 25 20 20 10 20 25 45 20 5 25 40 25 25 20 30 25
35 20 30 15 30 25 20 10 10 5 10 15 25 40 25 10 20 15 20 35 25 15 5 20 25 30 20 20 30 15 15 20
20 25 25 20 20 10
Se pide:
a. Ordenar los datos en una tabla de frecuencias agrupándolos en clases de igual amplitud,
interprete.
b. Construya un histograma de frecuencias relativas
c. Construya un polígono de frecuencias relativas
d. Construya un ojiva Diagrama de frecuencia relativa acumulada

35 RVR-2007
e. Construya el diagrama de caja (box-plot), interprete
f. Construya el diagrama de pareto, interprete
g. Construya el diagrama de tallo hoja (Stem-and-Leaf)

36 RVR-2007
CAPITULO III. MEDIDAS DE POSICION Y DE TENDENCIA
CENTRAL

Las medidas de tendencia central se utilizan para representar a través de un solo valor a una serie de
datos agrupados o no agrupados y son valores alrededor de los cuáles tienden a agruparse las
observaciones.

Las tres medidas más usuales de tendencia central son:


La media,
La mediana,
La moda.

3.1 MEDIA ARITMÉTICA

La media aritmética de una variable estadística es la suma de todos sus posibles valores dividido por
el total de las observaciones.

Datos no agrupados Datos Agrupados

Población

MEDIA
ARITMÉTICA

Muestra

K: número de intervalos

Ejemplo 1 El peso neto del contenido de cinco botellas de perfume seleccionadas de forma
aleatoria de la línea de producción son (en gramos): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la media
aritmética de las observaciones muestreadas?

Solución.

37 RVR-2007
Ejemplo 2 Calcular la media aritmética de la siguiente distribución de frecuencia del número de
meses de duración de una muestra de 40 baterías para coche.

duración de las Número de


baterías (meses) baterías
15 - 19 2
20 - 24 1
25 - 29 4
30 - 34 15
35 - 39 10
40 - 44 5
45 - 49 3

Solución.

Primeramente, calculamos la marca de clase (x), para después calcular el producto n ixi y proceder
finalmente a calcular la media.

Li-1 Li x ni xini
15 19 17 2 34
20 24 22 1 22
25 29 27 4 108
30 34 32 15 480
35 39 37 10 370
40 44 42 5 210
45 49 47 3 141
n =40

Ejemplo 3 Calcular la media aritmética de los datos expresados en la tabla.

Numero de hijos(xi) 0 1 2 3 4 5 Total


Número de familias(ni) 3 11 22 17 23 4 80

Solución

38 RVR-2007
xi ni xini
0 3 0
1 11 11
2 22 44
3 17 51
4 23 92
5 4 20
total 80 218

3.2 MEDIANA.

Es el punto medio de los valores de una serie de datos después de haber sido ordenados de acuerdo
a su magnitud. La mediana divide al total de los datos en dos partes iguales (50% para cada lado).

Datos no agrupados Datos Agrupados


Con intervalo
Si n impar

MEDIANA
Si n par
Sin intervalos
Los datos se ordenan antes

Nj-1: frecuencia acumulada mediana


nj: frecuencia simple mediana
aj: amplitud de clase mediana
lj-1: limite inferior del intervalo mediano
n: numero total de observaciones

Ejemplo 4 Encontrar la mediana de : 19, 15 , 13 , 11 , 14 , 16 , 10 , 12 , 18

Solución.

Primero ordenamos los datos.


Datos ordenados 10, 11 , 12 , 13 , 14 , 15 , 16, 18, 19
Posición 1 2 3 4 5 6 7 8 9

Como el número de elementos (n es impar)


Ejemplo 5 Encontrar la mediana de: 15 , 12 , 11 , 14 , 17 , 9 , 13 , 18

Solución.
Datos ordenado 9, 11, 12, 13, 14, 15, 17, 18

39 RVR-2007
Posición 1 2 3 4 5 6 7 8

Como el número de elementos (n es par)

Ejemplo 6a Calcular la mediana de la siguiente distribución de frecuencia del número de meses de


duración de una muestra de 40 baterías para coche.

duración de las Número de


baterías (meses) baterías
15 - 19 2
20 - 24 1
25 - 29 4
30 - 34 15
35 – 39 10
40 – 44 5
45 – 49 3

Solución.

Hallamos la frecuencia acumulada, luego n/2=20 y determinamos N j-1=7

Li-1- Li ni Ni
15 - 19 2 2
Nj-1
20 - 24 1 3
25 - 29 4 7 n 40
lj-1 30 - 34 15 22   20
2 2
35 - 39 10 32 Nj
40 - 44 5 37 nj
45 - 49 3 40
40

lj-1=30; Nj-1=7; nj =15; aj = 34-30=4

Ejemplo 6c. Hallar la mediana de los datos siguientes

40 RVR-2007
Li-1 Li ni Ni
0 – 10 2 2
10 – 20 3 5
20 – 30 5 10
Lj-1 30 – 40 6 16
40 – 50 10 26
50 – 60 4 30
60 – 70 2 32 Nj-1
Total 32

3.3 MODA

La moda se define como aquel valor de la variable al que corresponde máxima frecuencia (absoluta
o relativa).
La moda puede no existir, e incluso no ser única en el caso de existir.

Datos no agrupados Datos Agrupados

nj-1: frecuencia pre modal


MODA nj+1: frecuencia simple post modal
nj: frecuencia simple modal
Puede ser mono, bi, tri modal
aj: amplitud de clase modal
lj-1: limite inferior del intervalo modal
n: numero total de observaciones

Ejemplo 7 Dado el siguiente conjunto de datos: 2, 2, 5, 7, 9, 9, 9, 10, 10, 12 y 18.


La moda es igual a 9. En este caso se dice que la distribución es unimodal.

Ejemplo 8 Dado el siguiente conjunto de datos: 3, 5, 8, 10, 12, 15 y 16.


Esta distribución no tiene moda.

Ejemplo 9 Dado el siguiente conjunto de datos: 2, 3, 4, 4, 4, 5, 5, 7, 7, 7 , 9.


La moda es igual a 4 y 7. En este caso se dice que la distribución es bimodal

Ejemplo 10 Observados los alquileres de un conjunto de despachos se ha obtenido:


Calcula la moda y la mediana.

Solución:

Como los datos son agrupados tenemos: para la moda la fórmula:

Alquileres en
miles de ni

41 RVR-2007
pesetas
[0,15) 17
[15,30) 130
[30,45) 180
[45,60) 30
[60,75) 10
[75,90) 5

Hallamos la frecuencia mayor ni=180 (frecuencia modal)

Ejemplo 11 Calcular la moda de los datos expresados en la tabla.

Numero de hijos (xi) ni(número de familias)


0 3
1 11
2 22
3 17
4 23
5 4
Total 80

Solución
La frecuencia mayor es ni=23, luego la moda es Mo=4

Ejemplo 12 Determinar a partir de la tabla siguiente, cual es la moda:

Clases Punto medio Frecuencias de


(Datos en años) de cada clase cada clase
Li-1 Li xi ni
15 8
25 20
35 14
45 8
55 2
65 2
75 1
55 enfermos
atendidos

Identificamos la maxima frecuencia que es 20, luego li-1=20, ni=20 ni-1=8, ni+1=14, ai= 10

42 RVR-2007
3.4 CUANTILES: DECILES, CUARTILES Y PERCENTILES

Son medidas de posición, basadas en la ordenación de los datos. Dividen al conjunto de datos
ordenado en partes iguales. Según el número de partes, hablamos de:

3.4.1 CUARTILES.
Dividen al conjunto de datos en 4 partes iguales, cada una de las cuales engloba un 25% de datos.
Hay por tanto 3 cuartiles, Q1, Q2, Q3.

3.4.2 DECILES.

Dividen al conjunto de datos en 10 partes iguales, cada una de las cuales engloba un 10% de datos.
Hay por tanto 9 deciles, D1, ..., D9.

3.4.3 PERCENTILES.

Dividen al conjunto de datos en 100 partes iguales, cada una de las cuales engloba un 1% de datos.
Hay por tanto 99 percentiles, P1, ..., P99.

La mediana, al dejar por debajo a un 50% de los datos, coincide con el D 5, Q2 y P50. La forma de
cálculo es similar a la de la mediana.

Una franja de interés es [P25- P75], que contiene al 50% de los datos centrales.

Por debajo del P25 quedan el 25% de los datos más pequeños, y por encima del P75 quedan el 25%
de los datos más grandes.

Datos no agrupados Datos Agrupados

CUANTILES Ver ejemplos


:

Cuartiles Los datos se ordenan antes Ni-1: frecuencia acumulada cuantiíico


Deciles ni: frecuencia simple cuantílica
percentiles ai: amplitud de clase cuantílica
li-1: limite inferior del intervalo cuantílico
n: numero total de observaciones
r: número del cuantil
k: cuartil k=4; decil k=10, percentil k=100

Ejemplo 13. 20 alumnos de la asignatura de Estadística presentan las siguientes edades:


18 18 21 19 20 19 19 18 18 22 19 21 21 19 19 19 18 19 19 21, determine los cuartiles 1 y 3, y los
percentiles 25 , 75, 90

Solución.
Ordenamos los datos

43 RVR-2007
Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 21, 21, 21, 21, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Cuartil 1 (q1)

Determinamos la posición del cuartil 1 (q1)

Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 ↓ 21, 21, 21, 21, 22
Posición 1 2 3 4 5  6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
5.25
q1=18+0.25 (19-18)=18.25

Cuartil 3 (q3)

Determinamos la posición del cuartil 3 (q3)

Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 21, 21, 21, 21, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15  16 17 18 19 20
15.75
q3=20+0.75 (21-20)=20.75

Percentil 25 (P25)

Determinamos la posición del percentil 25 (p25)

Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 ↓ 21, 21, 21, 21, 22
Posición 1 2 3 4 5  6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
5.25
P25=18+0.25 (19-18)=18.25

Percentil 75 (p75)

Determinamos la posición del percentil 75 (p75)

Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 21, 21, 21, 21, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15  16 17 18 19 20
15.75
P75=20+0.75 (21-20)=20.75

Percentil 90 (p90)

44 RVR-2007
Determinamos la posición del percentil 90 (p90)

Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 21, 21, 21, 21, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18  19 20
15.9
P90=21+0.9 (21-21)=21

Ejemplo 14 Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente


tabla:

Salarios No. De
Li-1 Li Empleados (ni) Ni

200-300 85 85
300-400 90 175
400-500 120 295
500-600 70 365
600-700 62 427
700-800 36 463

Solución

Cuartil 1(q1). Como son datos agrupados, se utiliza la fórmula

Decil 7 (d7)

Percentil 30 (p30)

Posición:

45 RVR-2007
3.5 EJERCICIOS RESUELTOS

Ejercicio 1 Cálculo de la media de las edades de los ingresantes a una universidad


18 19 19 18 19 18 18 18 20 18 20 19 19 21 19 21 19 22 20 19.

A partir de la tabla de frecuencias,

xi ni nixi
18 6 108
19 8 152
20 3 60
21 2 42
22 1 22
n = 20 384

Ejercicio 2 Cálcular la media de los datos de la siguiente tabla

X : Altura xi ni nixi
(1.55-1.65] 1.60 4 6.4
(1.65-1.75] 1.70 9 15.3
(1.75-1.85] 1.80 6 10.8
(1.85-1.95] 1.90 1 1.9
n = 20 34.4

Ejercicio 3 Determinar la media aritmética, la mediana


y la moda en la siguiente tabla: Media aritmética

Clases xi ni xini
Tabla
Clases ni Ni 10 – 20 15 10 150
10 – 20 10 10 20 – 30 25 14 350
20 – 30 14 24 30 – 40 35 21 735
30 – 40 21 45
40 – 50 45 31 1395
40 – 50 31 76
50 – 60 55 18 990
50 – 60 18 94
60 – 70 15 109 60 – 70 65 15 975
70 – 80 7 116 70 – 80 75 7 525
80 – 90 4 120 80 – 90 85 4 340
120 5460

La mediana
Hallamos n/2 = 120/2=60,
Li-1 Li ni Ni 60 esta entre 45 y 76 en la columna Ni
10 – 20 10 10 Ni-1

46 RVR-2007

ni
20 – 30 14 24
30 – 40 21 45
40 – 50 31 76 120/20=60
50 – 60 18 94
60 – 70 15 110
70 – 80 7 117
80 – 90 4 121

La moda

Li-1 Li ni
10 – 20 10
20 – 30 14
30 – 40 21
40 – 50 31
50 – 60 18
60 – 70 15
70 – 80 7
80 – 90 4

Ejercicio 4 Determinar los cuartiles, percentil 20, percentil 45 de los siguientes datos

31 8 5 14 92 5 7 9 10 12 14 9 15 18 25 89 30 64 72 88 17 90 98 9

Solución

Ordenamos los datos

Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Determinamos la posición del cuartil 1 (q1)

Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

6.25
q1= 9+0.25 (9-9)=9

Determinamos la posición del cuartil 2 (q2)

Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

12.5
q2= 15+0.5 (17-15)=16

47 RVR-2007
Determinamos la posición del cuartil 3 (q3)

Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

18.75
q3= 64+0.75 (72-64)=70

Determinamos la posición del percentil 20 (p20)

Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

5.0
p20= 9+0.0 (9-9)=9

Determinamos la posición del percentil 45 (p45)

Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

11.25
p45= 14+0.25 (15-14)=14.25

Ejercicio 3.5 En un grupo de psicología se han obtenidos las siguientes puntuaciones en un test de
razonamiento lógico:

Se pide:
a) Representar gráficamente la distribución.
b) Calcular el valor de la moda.
c) ¿A partir de qué valor se encuentra el 60% de los alumnos que han obtenido mejor puntuación.

Solución

Intervalos marcas ni Ni
clase
[10-20) 15 26 26
[20-30) 25 19 45
[30-40) 35 17 62

48 RVR-2007
[40-50) 45 16 78
[50-60) 55 7 85
[60-70) 65 14 99
[70-80) 75 21 120
120

a. Como sabemos, los histogramas se utilizan generalmente para distribuciones de variable


estadística continua, o bien para distribuciones de variable estadística discreta con gran número de
datos, es decir cuando se trata de datos agrupados en clases. Por ello vamos a representar esta
distribución utilizando un histograma:

10 20 30 40 50 60 70 89

b) La moda, por tratarse de datos agrupados, la calculamos así

c) Tenemos que calcular el percentil 40, P40, que deja a su derecha el 60% de las observaciones.

3.6 EJERCICIOS PROPUESTOS

Ejercicio 1 Un inversor tiene ahorros repartidos en 3 depósitos con 2000, 5000 y 10000 euros,
respectivamente. Si el primero le rinde un 5% anual, el segundo un 4% anual y el tercero un 2%
anual, ¿cuál es el tipo de interés medio que recibe?

Ejercicio 2 Calcular la media, mediana, moda de los conjuntos de datos siguientes:


a) 18, 18, 19, 17, 23, 20, 21, 18 b) 20, 21, 18, 19, 18, 17, 18

Ejercicio 3. Obtener la media, mediana, moda y cuartiles en la siguiente distribución.

intervalo frecuencia
0-10 1
10-20 2
20-30 4
30-40 3

Ejercicio 4 Dada la siguiente distribución en el número de hijos de cien familias, calcular


sus cuartiles.

49 RVR-2007
xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100

Ejercicio 5. Calcular los cuartiles 1, 2 y 3 y percentil 25, percentil 50 y percentil 75 de las siguientes
cantidades en metros: 3, 3, 4, 4, 5.

Ejercicio 6. Considere la siguiente muestra de la resistencia de 50 lotes de algodón (libra necesarias


para romper una madeja)
74 90 99 97 89 94 87 79 90 83
91 96 81 98 81 98 91 99 94 98
98 82 90 86 96 88 97 85 92 97
96 76 96 81 93 100 108 101 105 105
110 101 106 103 106 115 101 102 100 101
a) construya la tabla de frecuencias, b) grafique el histograma, polígono de frecuencias
c) interprete los datos en la tabla d) determine la media aritmética
e) determine la mediana y el terecer cuartel f) determine la moda

Ejercicio 7. Considere la siguiente muestra de la resistencia de 50 lotes de algodón (libra necesarias


para romper una madeja)
78 90 99 97 89 94 87 79 90 83
118 96 81 88 88 98 90 85 94 98
98 71 90 110 96 100 97 85 92 97
96 76 96 81 93 100 108 110 105 105
110 101 106 103 106 115 101 102 100 101

a) construya la tabla de frecuencias, b) grafique el histograma, polígono de frecuencias


c) interprete los datos en la tabla d) determine la media aritmética
e) determine la mediana f) determine la moda
g) determine la varianza, coeficiente variación h) determine el coeficiente de variación

Ejercicio 8. Considere la siguiente muestra de la resistencia de 50 lotes de algodón (libra


necesarias para romper una madeja)
114 120 99 97 89 94 87 79 90 83
97 78 81 125 98 98 90 85 94 98
98 71 90 110 103 102 97 85 92 97
96 76 96 81 80 100 108 110 108 105
110 101 106 103 106 115 101 102 100 110
a) construya la tabla de frecuencias,
b) grafique el histograma, polígono de frecuencias
c) interprete los datos en la tabla
d) determine la media aritmética
e) determine la mediana
f) determine la moda

Ejercicio 9. Considere la siguiente muestra de la resistencia de 50 lotes de algodón (libra


necesarias para romper una madeja)

50 RVR-2007
90 120 99 97 89 94 87 79 90 83
97 78 81 125 98 98 90 85 94 98
98 72 90 110 103 102 97 85 92 97
115 76 118 124 110 100 108 110 108 105
110 101 106 103 106 115 101 102 100 110
a) construya la tabla de frecuencias, b) grafique el histograma, polígono de frecuencias
c) interprete los datos en la tabla d) determine la media aritmética
e) determine la mediana f) determine la moda

Ejercicio 10. Los siguientes datos corresponden a las lecturas de la presión sanguínea sistólica que
se hicieron a 58 adultos que presentaron un examen físico:
104 112 139 118 132 132 112 106 126 126 118 117 116 113 122 123 116 114 117 106 124 115 118
123 105 120 121 120 102 138 106 113 114 122 108 122 112 112 123 116 124 111 111 114 123 107
120 120 124 122 131
a) Construir tabla de frecuencias con 8 clases.
b) Que porcentaje de personas tiene una presión mayor a 117.
c) Ordene los datos en un histograma y ojiva de frecuencias.
d) Estime las medidas de tendencia central aprendidas.

Ejercicio 11 Los pesos, en Kg,. de 20 alumnos de cierto centro son:


51,47, 55, 53, 49, 47, 48, 50, 43, 60, 45, 54, 62, 57, 46, 49, 52, 42, 38, 61.
a) Calcular la media y moda de los datos.
b) Agrupar los datos en clases. Dibujar el correspondiente histograma y calcular la media de los
datos agrupados.
c) ¿Qué diferencias existen entre la media de los datos agrupados o no agrupados?
d) Calcular mediana y cuartiles, de los datos sin agrupar.
e) Representar los datos mediante un diagrama de caja.

Ejercicio 12. Las edades, en años, de los asistentes a cierto curso fueron 30, 28, 31, 29, 30, 33, 31,
19, 31.
a) ¿Cual es la edad media de los asistentes? ¿Es representativa esta medida para los datos
anteriores? En caso negativo, proponer una medida de centralización más adecuada.

Ejercicio 13 Dada la siguiente tabla de frecuencias calcular cuartiles, moda, media, mediana

xi ni
12 1
13 1
14 2
15 3
16 2
17 1

Ejercicio 14 Las cifras dadas en la tabla adjunta corresponden a miligramos de hidroxiprolina


absorbidos por 1 gramo de masa intestinal analizados en distintos pacientes.
mg 77.3 61.2 82.4 75.9 61 70.2 65 80
hidroxiprolina
núm. pacientes 3 10 15 13 8 5 2 0
Se pide:
a) ¿Cuántos pacientes fueron examinados?

51 RVR-2007
b) Representar el diagrama de frecuencias relativas acumuladas.
c) ¿Cuál es la moda?, ¿Cuál es la mediana?

Ejercicio 15. Se ha realizado un estudio de las rentas de alquiler de 390 viviendas (donde la renta
viene dada en miles de pesetas), en una población de tamaño medio, obteniéndose

Tipos de alquiler 0-25 25-50 50-100 100-150 150-200


número de 20 140 180 40 10
viviendas

a) ¿Qué porcentaje de alquileres es superior a 100.000 pts? ¿Cuál es el alquiler más


frecuente?
b) ¿En qué intervalo se encuentra el 50% de los alquileres más bajos? ¿Y el 30% de los
más altos?
c) El propietario de la vivienda debe pagar el 10% del precio que establece como alquiler,
más una cantidad fija de 3.000 ptas., al Ayuntamiento, en concepto de impuestos. ¿cuál es
el impuesto medio que se ha de pagar?

Ejercicio 16 La distribución de la superficie de los 90 despachos que se han construido en un nuevo


edificio comercial es:

Superficie (m2) 40-60 60-80 80-120 120-200 200-400


Nº oficinas 12 16 20 32 10

a) ¿Cuál es la superficie media de un despacho? ¿Y el tamaño de despacho más común?


b) ¿Se puede considerar el tamaño medio que acabamos de calcular como representativo
de la superficie total de los despachos?
c) ¿Qué tamaño mínimo debe tener una oficina para poder ser considerada en el grupo del
15% de las más grandes? ¿Qué porcentaje de oficinas tienen más de 80 metros cuadrados
de superficie?

Ejercicio 17 En un barrio de una gran ciudad se ha constatado que las familias residentes se han
distribuido, según su composición, de la siguiente forma:
Composición 0–2 2–4 4-6 6-8 8-10
Familias 110 200 90 75 25

a) ¿Cuál es el número medio de personas por familia?


b) ¿Cuál es el tipo de familia más usual?
c) Si sólo hubiera plazas de aparcamiento para el 50% de las familias, y éstas se atendieran
de mayor a menor número de miembros, ¿Cuántos componentes debería tener una familia
para entrar en el cupo?
d) Número de miembros que tienen como máximo el 85% de las familias menos
numerosas.

Ejercicio 18 La distribución de acciones de una sociedad es:

acciones accionistas
0-50 23
50-100 72
100-150 62

52 RVR-2007
150-200 48
200-250 19
250-300 8
300-350 14
350-400 7
400-500 7

a) Calcular el número medio de acciones que posee un accionista.


b) Número de acciones que más frecuentemente posee un accionista.
c) Número de acciones que debe poseer un accionista para que la mitad de los restantes
accionistas tengan menos acciones que él.

Ejercicio 19 La siguiente tabla muestra los precios por persona y noche en hoteles y pensiones del
área metropolitana de una ciudad española en pts:
6500 3800 5450 2795 2500 3200 8400 4700 4500 3295 7000 3700 6400 2600 4000 4500 3400
4700 6100 6600 4300 4600 6200 5600 4700 5200 2800 2800 2600 3200 9400 4000 5700 3600
3000 5400 6000 2395 2395 2395 2395 2525 5000 6500 3495 6000 3200 3200 2600 2500 3300
10000
a) Realizar el diagrama de árbol y hojas (stem-and-leaf ) de los datos anteriores (con profundidad),
en cientos de pesetas (despreciando decimales).
b) Calcular la distribución de frecuencias (agrupando de forma oportuna) de los precios.
c) Dibujar el histograma de frecuencias absolutas y absolutas acumuladas y sus polígonos
asociados.
d) Dibujar el histograma de frecuencias relativas y relativas acumuladas y sus polígonos asociados.
e) Dibujar el diagrama de caja asociado a los datos.
f) Dibujar el diagrama de tarta de los precios.
g) Comentar todos los gráficos.
h) Calcular las medidas de tendencia central

53 RVR-2007
54 RVR-2007
CAPITULO IV. MEDIDAS DE DISPERSIÓN Y DE FORMA

4.1 MEDIDAS DE DISPERSION

Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la
variable a un cierto valor central, o que permiten identificar la concentración de los datos en un
cierto sector del recorrido de la variable.

4.1.1 RANGO O AMPLITUD ( R )

Es la diferencia entre las medidas mayor y menor de un conjunto de datos.

Datos no agrupados Datos agrupados


R = Xmax-Xmin R = Ls – Li
Xmax: dato mayor Xmin: dato menor Ls: límite mayor y Li: límite menor

PROPIEDADES DEL RANGO

 Es fácil de calcular y sus unidades son las mismas que las de la variable.
 No utiliza todas las observaciones (sólo dos de ellas);
 Se puede ver muy afectada por alguna observación extrema;
 El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso
nunca disminuye.

Ejemplo 1 Si se tiene el siguiente conjunto de datos: 72 78 63 47 86 52 57 64 72 52 71 81 81 69


91, determine el rango.

Solución.

Hallamos xmin=47 y xmax=91


Luego R = xmax - xmin = 91-47= 44

4.1.2 RANGO INTERCUARTÍLICO (RIQ).

55 RVR-2007
Lo calculamos como la diferencia entre el tercero y el primero de los cuartiles.
RIQ = q3 - q1, el intervalo [q1,q3] contiene al 50% central de los valores muestrales.

Ejemplo 2 Si se tiene el siguiente conjunto de datos: 72 78 63 47 86 52 57 64 72 52 71 81 81 69


91, determine el rango intercuartil.

Solución.

Ordenamos los datos de menor a mayor.

Datos 47 52 52 57 63 64 69 71 72 72 78 81 81 86 91,
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Calculamos q1 y q3

Posición de luego el valor q1=57.

Posición de luego el valor q3=81


RIQ= q3 - q1 = 81 – 57 = 25

4.1.3 DESVIACIÓN MEDIA (Dm)

Es la media aritmética de todas las diferencias absolutas entre cada observación individual y la
media aritmética del conjunto de datos.

Datos no agrupados Datos agrupados

Población
: media de la población ni: frecuencia de clase i
N: total de observaciones xi: punto medio de clase i

Muestra

n : total de observaciones : media de la muestra

Ejemplo 3 Calcule la Dm de los datos 2, 3, 6, 8, 11.

Solución.

56 RVR-2007
4.1.4 VARIANZA (s2)

Es la media aritmética del cuadrado de las desviaciones de cada uno de los valores respecto a la
media.

Datos no agrupados Datos agrupados

Población

Muestra

K: número de intervalos

4.1.5 LA DESVIACIÓN ESTÁNDAR O DESVIACIÓN TÍPICA (s)

La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o


población). Es decir es una medida de dispersión que nos dice cuánto tienden a alejarse los valores
puntuales del promedio en una distribución. De hecho específicamente la desviación estándar es "el
promedio de lejanía de los puntajes respecto del promedio".

Mientras mayor es la desviación estándar, mayor es la dispersión de la población

La desviación estándar es la raíz cuadrada positiva de la varianza.

PROPIEDADES DE LA VARIANZA Y DESVIACIÓN TÍPICA

 Ambas son sensibles a la variación de cada una de las puntuaciones, es decir, si una
puntuación cambia, cambia con ella la varianza. La razón es que si miramos su definición, la
varianza es función de cada una de las puntuaciones.

 La desviación típica tiene la propiedad de que en el intervalo

se encuentra, al menos, el 75% de las observaciones. Incluso si tenemos muchos datos y estos
provienen de una distribución normal, podremos llegar al 95 %.

57 RVR-2007
 No es recomendable el uso de ellas, cuando tampoco lo sea el de la media como medida de
tendencia central.

 Si transformamos una variable x en ax+b, la desviación típica de la nueva variable será:

donde representa el valor absoluto de a, es decir a siempre con signo positivo.

Ejemplo 4 Calcular el rango, varianza y desviación típica de las siguientes cantidades medidas en
metros:
3, 3, 4, 4, 5

Solución:

Rango R = 5−3 = 2.

Varianza

O también

Desviación estándar

Ejemplo 5 Calcula la varianza, desviación típica de esta distribución.

Sea x el número de habitaciones que tienen los 8 pisos que forman un bloque de vecinos

xi 2 3 5 6
ni 2 2 1 3

Solución.

Xi ni xini xi2ni
2 2 4 8
3 2 6 18

Me
58 dia RVR-2007
5 1 5 25
6 3 18 108
8 33 159

Varianza

Desviación típica

4.1.6 COEFICIENTE DE VARIACIÓN (CV)

Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o
que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida
de variabilidad que no dependa de las unidades o del tamaño de los datos.

A menor coeficiente de variación consideraremos que la distribución de la variable medida es más


homogénea.

Población

Muestra

Ejemplo 6 Calcular el coeficiente de variación para los siguientes datos: 3, 3, 4, 4, 5


Como en el ejemplo anterior se determinó la media y desviación estándar s=0.8366

Entonces de variabilidad

PROPIEDADES DEL COEFICIENTE DE VARIACIÓN

 Sólo se debe calcular para variables con todos los valores positivos. Todo índice de
variabilidad es esencialmente no negativo. Las observaciones pueden ser positivas o nulas, pero
su variabilidad debe ser siempre positiva. De ahí que sólo debemos trabajar con variables
positivas, para la que tenemos con seguridad que
 No es invariante ante cambios de origen. Es decir, si a los resultados de una medida le
sumamos una cantidad positiva, b > 0, para tener Y = X + b, entonces CVY < CVX.
 Es invariante a cambios de escala. Así por ejemplo el coeficiente de variación de una
variable medida en metros es una cantidad adimensional que no cambia si la medición se realiza
en centímetros.

59 RVR-2007
4.2 MEDIDAS DE FORMA

La forma de una distribución de frecuencias se puede describir por su simetría o falta de ella
(asimetría) y por su agudeza (curtosis).

4.2.1 ASIMETRÍA

Otro rasgo interesante en una distribución de frecuencias es si los datos aparecen ubicados
simétricamente o no respecto de la media. Si queremos cuantificar la simetría, es necesario
conservar la información acerca tanto del signo como de la distancia de cada dato a la media (centro
de simetría).

En el caso en que el coeficiente valga cero la distribución es simétrica alrededor de la media.

Los valores positivos, indicarán distribuciones con mayor sesgo a la derecha y los valores negativos
indicarán un mayor sesgo a la izquierda.

Datos no agrupados Datos agrupados


Coeficiente de Fisher

Población

Coeficiente de Pearson

Coeficiente de Fisher

Muestra

Coeficiente de Pearson

De acuerdo al valor del coeficiente se tiene:

Fishe Pearson
r
Simetría f=0 Sk = 0
Sesgo negativo f < 0 Sk < 0
Sesgo positivo f > 0 Sk > 0

60 RVR-2007
Curva sesgada a la izquierda o Curva simétrica f = 0, Sk = 0 Curva sesgada a la derecha o
sesgo negativo f < 0; Sk < 0 sesgo positivo f > 0; Sk > 0
4.2.2 CURTOSIS

Miden la mayor o menos concentración de datos alrededor de la media. Se suele medir con el
coeficiente de curtosis, que describe lo picuda o plana que es la distribución, es decir si los datos se
concentran demasiado o no, comparados con un modelo de distribución llamado distribución
normal.

Datos no agrupados Datos agrupados


N

 (x i  )4
Población k i 1

N 4

Muestra

De acuerdo al valor del coeficiente, las curvas tienen diferentes denominaciones:

K=3 Mesocúrtica Normal


k>3 Lepticúrtica Más agudas que la normal
k<3 Platicúrtica Más planas que la normal

Platicúrtica Mesocúrtica Leptocúrtica

4.3 EJERCICIOS RESUELTOS

61 RVR-2007
Ejercicio 1 El número de días necesarios por 10 equipos de psicólogos para terminar 10 trabajos de
consultoría de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular
la media, mediana, moda, varianza, desviación típica, rango, coeficiente de variación, asimetría y
curtosis.

Solución
La media: suma de todos los valores de una variable dividida entre el número total de datos de los
que se dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad
por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos
valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos
valores nos dará a su vez 60, que es el valor de la mediana.

La moda: el valor de la variable que presenta una mayor frecuencia es 60 días

La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la
media aritmética de la distribución.

días2

La desviación típica S: es la raíz cuadrada de la varianza.

días

El rango: diferencia entre el valor de las observaciones mayor y el menor

R = 80 - 15 = 65 días

El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media


aritmética

Utilizando Minitab

Ingresamos los datos el la columna Días luego hacemos clic en Stat/Basic Statistics/Display
Descriptive Statistics…/active las opciones Mean, Standard deviation, etc, como se muestra en la
figura. Y finalmente haga clic en Ok/Ok.

62 RVR-2007
Los resultados son los siguientes:

Descriptive Statistics: Días


Media s s2 CV xmin Q1 Me Q3
Variable Mean StDev Variance CoefVar Minimum Q1 Median Q3
Días 52,30 21,80 475,12 41,68 15,00 29,25 60,00 65,75
xmax R RIQ
Variable Maximum Range IQR
Días 80,00 65,00 36,50

Ejercicio 2 Cantidad de hemoglobina en g/dl encontrados en 30 pacientes entre 2 y 12 años que


acudieron a un laboratorio universitario.
4 3 8 1 4 2 8 12 2 1 10 12 6 9 3 2 4 1 2 6 12 1 7 2 6 8 2 11 11 11

Construya el diagrama de caja

Solución.
Tenemos:
Xmin 1
Xmax 12
Q1 2
Q2 5
Q3 9.25

LI = q1 – f(q3-q1) = 2-1.5(9.25-2) = -8.875  1


LS = q3 + f(q3-q1) = 9.25+1.5(9.25-2) = 20.125  12

La caja representa el 50% central de las observaciones, de manera que una caja pequeña indica
poca variabilidad entre el 50% central de las observaciones, mientras que una caja grande
representa alta variabilidad en el 50% de las observaciones centrales. Al "tamaño de la caja" se le
denomina "Amplitud del Intercuartil", y se calcula de la siguiente manera:
RIQ = Q3 - Q1 = 9.25 - 2 = 7.25

63 RVR-2007
Utilizando Minitab

Ingrese los datos y haga clic en Grap/Boxplot../simple/Ok/hemoglobina/Ok

Ejercicio 3 Las edades de un grupo de personas se reflejan en la tabla siguiente:

Intervalos ni
7 -- 9 4
9 -- 11 18
11 -- 12 14
12 -- 13 27
13 -- 14 42
14 -- 15 31
15 -- 17 20
17 -- 19 1

Determinar la variabilidad de la edad mediante los estadísticos varianza, desviación típica,


coeficiente de variación y rango intercuartílico. Estudie la simetría y curtosis de la variable.

Solución:

64 RVR-2007
En primer lugar realizamos los cálculos necesarios a partir de la tabla de frecuencias:

Intervalos ni xi Ni xi ni xi2 ni
7 -- 9 4 8 4 32 256
9 -- 11 18 10 22 180 1.800
11 -- 12 14 11.5 36 161 1851.5
12 -- 13 27 12.5 63 337.5 4218.75
13 -- 14 42 13.5 105 567 7654.5
14 -- 15 31 14.5 136 449.5 6.517.75
15 -- 17 20 16 156 320 5120
17 -- 19 1 18 157 18 324
157 2065 27742.5

La media es años.

La varianza la calculamos a partir de la columna de la xi2 ni como sigue:

Desviación estándar

años

El coeficiente de variación no posee unidades y es:

de variabilidad

Rango intercuartílico.

RIQ= 14.41 – 12.12 = 2.29

Lo que nos dice que aproximadamente en un rango de 2.29 años se encuentra el 50% central del
total de observaciones

Asimetría.

Utilizaremos el coeficiente de Fisher

65 RVR-2007
Intervalos ni xi
7 -- 9 4 8 -546,3635
9 -- 11 18 10 -562,60575
11 -- 12 14 11.5 -62,88975
12 -- 13 27 12.5 -7,414875
13 -- 14 42 13.5 1,80075
14 -- 15 31 14.5 76,271625
15 -- 17 20 16 462,9825
17 -- 19 1 18 114,084125
157 -524,134875

Significa que la distribución presenta una ligera asimetría a la izquierda (negativa)

En lo que concierne a la simetría podemos utilizar el coeficiente de asimetría de Fisher:

Curtosis

Intervalos ni xi
7–9 4 8 2813,77203
9 – 11 18 10 1772,20811
11 -- 12 14 11.5 103,768088
12 -- 13 27 12.5 4,81966875
13 -- 14 42 13.5 0,6302625
14 -- 15 31 14.5 102,966694
15 -- 17 20 16 1319,50013
17 -- 19 1 18 553,308006
157 6670,97298

Como k=3.06 se considera casi normal

Ejercicio 4 La cantidad de hemoglobina en g/dl encontrados en 30 pacientes entre 2 y 12 años que


acudieron a un laboratorio universitario fueron.
4 3 8 1 4 2 8 12 2 1 10 12 6 9 3 2 4 1 2 6 12 1 7 2
6 8 2 11 11 11

Utilice minitab para determinar las medidas de tendencia central, medidas de dispersión, medidas
de asimetría y medidas de curtosis

Solución.

Ingrese los datos como en la figura y haga clic en Stat/Basic Statistics/Graphical Summary…

66 RVR-2007
Resultados

Interpretación.

Ingles Español Símbolo Valor


Mean Media 5.7000
StDev Desviación estándar s 3.9142
Variance varianza s2 15.3207
Skewness Asimetría f 0.35591
Kurtosis Apuntamiento k -1.37684
N Tamaño muestra n 30
Minimum Mínimo Xmin 1
1st Quartile Primer Cuartil Q1 2
Median Mediana Me 5
3rd Quartile Tercer Cuartil Q3 9.25
Maximun Máximo Xmax 12

4.4 EJERCICIOS PROPUESTOS

Ejercicio 1 En un almacén de recepción de mercancías han anotado el número de camiones pesados


que han descargado en 19 días y los resultados han sido:
1, 1, 4, 5, 1, 3, 0, 1, 4, 1, 5, 4, 2, 1, 3, 2, 4, 4 y 0. Calcula e interpreta la desviación típica.

67 RVR-2007
Ejercicio 2. Según los datos de una encuesta realizada entre estudiantes de cierta universidad, la
estatura media de dichos estudiantes es de 167,67 cm. con una desviación de 8,49 cm. y el peso
medio es de 61,61 kg. Con una desviación de 11,27 kg. ¿Cual de las 2 variables presenta mayor
dispersión en torno a su media?

Ejercicio 3 Según los datos de una encuesta realizada entre estudiantes de cierta universidad, el
numero medio de horas que ven la tv. En cierto fin de semana fue de 3,64 con una desviación de
3,35, mientras que el número medio de horas de estudio en el mismo fin de semana fue de 16,68
con una desviación de 5,70. ¿En que variable representa mejor la media a toda la población?

Ejercicio 4 Un restaurante ofrece los sábados y los domingos un menú del día 7.5 soles, uno
especial a 10 soles y uno ejecutivo a 12 soles. Cierto fin de semana obtuvieron una recaudación de
112.5 soles por menús del día, 120 soles por menús especiales y 84 soles por menús ejecutivos.
¿Cuanto pago en media cada cliente de menú ese fin de semana?, ¿con que dispersión? Interpreta
los resultados.

Ejercicio 5 En cierto distrito de un país, se entrevistó a un cierto número de mujeres casadas nacidas
entre los años 1935 y 1944 y se les pregunto a qué edad contrajeron matrimonio. En la tabla se
muestran los datos correspondientes a 50 de estas mujeres.
15 17 25 15 16 11 15 13 12 10 15 14 16 14 17 13 14
20 29 19 16 18 10 18 12 11 20 34 13 22 19 14 17 16
16 15 12 24 25 9 21 15 13 23 24 10 10 16 14 18
Construya el diagrama de caja, determine las medidas estadísticas estudiadas.

Ejercicio 6 Una cadena de franquicias de restaurantes de 1991 a 1995 tuvo 4, 8, 16, 26 y 82


restaurantes respectivamente. Un modelo estadístico estima que el número de restaurantes entre
1991 y 1997 es 4, 8, 16, 33, 140, 280, y 586. Representar los datos en un diagrama de barras,
determine si el diagrama es simétrico.

Ejercicio 7 Determinar la media (aritmética) la mediana, la moda y medidas de dispersión del


siguiente conjunto de datos:
3, 5, 7, 8, 8, 8, 10, 11, 12, 12, 13, 14, 14, 15, 16, 18, 19, 21, 23, 25

Ejercicio 8 Estimar la media la mediana, la moda, varianza, coeficiente de variación, de los


siguientes datos continuos agrupados en intervalos:

Intervalo de clase Frecuenci


a
de 0 a 9 50
de 10 a 19 150
de 20 a 29 100
de 30 a 40 50

Ejercicio 9 Idem que en el anterior para la tabla:

Intervalo de clase Frecuenci


a
[0.5; 9.5) 50
[9.5; 19.5) 150
[19.5; 29.5) 100

68 RVR-2007
[29.5; 40.5) 50

Ejercicio 10 ¿Son diferentes los resultados de los dos ejercicios anteriores, por qué?

Ejercicio 11 Una editorial tiene 4000 títulos en catálogo. Podemos clasificar los distintos libros en
novelas, biografías y otros tipos de libros de venta más preferente en librerías. De los siguientes
datos de número de copias vendidas, estimar las ventas medias por título.

Intervalo de Frecuencia
Unidades vendidas
0 - 999 500
1000 - 4999 800
5000 - 24999 700
25000 - 49999 1500
50000 o más 500

Ejercicio 12 Con los datos del ejercicio anterior. Si el título de mayores ventas vendió 1000000 de
copias en el año en que se recogieron los datos ¿cuál es la desviación estándar estimada para las
ventas por título?

Ejercicio 13 A 50 aspirantes a un determinado puesto de trabajo se les sometió a una prueba. Las
puntuaciones obtenidas fueron:

4 4 2 10 1 9 5 3 4 5 6 6 7 6 8 7 6 8 7 6 5 4 4 4 5 6 6 7 5 6 6 7 5 6 6 7 5 6 4 3 2 6 6 7 7 8 8 9 8 7

a) Construir la tabla de frecuencias y la representación gráfica correspondiente.


b) Encontrar la puntuación que seleccione al 20% de los mejores candidatos.
c) Encuentre la varianza y el coeficiente de asimetría de Pearson y Fisher

Ejercicio 14 En la población de estudiantes de la facultad, se seleccionó una muestra de 20 alumnos


y se obtuvieron las siguientes tallas en cm.:
162,168,174,168,166,170,168,166,170,172, 188,182,178,180,176, 168,164, 166,164,172

Se pide:
a) Descripción numérica y representación gráfica.
b) Media aritmética, mediana, moda, Coeficiente de variación, rango intercuartil.

Ejercicio 15. Agrupando los datos del ejercicio anterior en intervalos de amplitud 10 cm., se pide:
a) Descripción numérica y representación gráfica.
b) Media aritmética, mediana, moda, coeficiente de Fisher.
c) Analizar los cálculos hechos y los errores de agregación comparándolos con el ejercicio anterior.

Ejercicio 16 Las tres factorías de una industria han producido en el último año el siguiente número
de motocicletas por trimestre:

factoría 1 factoría 2 factoría 3


1o. 600 650 550
trimestre
2o. 750 1200 900
trimestre

69 RVR-2007
3o. 850 1250 1050
trimestre
4o. 400 800 650
trimestre

Obtener:
a) Producción media trimestral de cada factoría y de toda la industria.
b) Producción media diaria de cada factoría y de toda la industria teniendo en cuenta que durante el
primer trimestre hubieron 68 días laborables, el segundo, 78, el tercero, 54 y el cuarto, 74.
c) determine el coeficiente de curtosis

Ejercicio 17 Una empresa ha pagado por un cierto articulo: 225, 250, 300 y 200 Pts. de precio.
Determinar el precio medio en las siguientes hipótesis y el coeficiente de variación:
a) Compraba por valor de 38250, 47500, 49500 y 42000 Pts... respectivamente.
b) Compraba cada vez un mismo importe global.
c) Compraba 174, 186, 192 y 214 unidades respectivamente.

Ejercicio 18 Sobre una muestra de 56 tiendas distintas, se obtuvieron los siguientes precios de
venta de un determinado artículo:
3260 3510 3410 3180 3300 3540 3320 3450 3840 3760 3340 3260 3720 3430 3320 3460 3600
3700 3670 3610 3910 3610 3610 3620 3150 3520 3430 3330 3370 3620 3750 3220 3400 3520
3360 3300 3340 3410 3600 3320 3670 3420 3320 3290 3550 3750 3710 3530 3500 3290 3410
3100 3860 3560 3440 3620

Se pide:
a) Agrupar la información en seis intervalos de igual amplitud y hacer la representación gráfica
correspondiente
b) Media aritmética y desviación típica
c) Desviación media respecto de la media aritmética y la mediana.

Ejercicio 19 La siguiente distribución corresponde al capital pagado por las 420 empresas de la
construcción con domicilio fiscal en una región determinada:

Capital (millones de Pts..) Número de empresas


Menos de 5 12
De 5 a 13 66
De 13 a 20 212
De 20 a 30 84
De 30 a 50 30
De 50 a 100 14
Más de 100 2

a) Haciendo servir como marcas de clase del primer y ultimo intervalo 4 y 165 respectivamente,
encontrar la media aritmética y la desviación típica
b) Calcular la moda y la mediana
c) Estudiar gráficamente su simetría

Ejercicio 20 La siguiente tabla muestra la distribución de les cargas máximas que soportan los hilos
producidos en una cierta fábrica:

70 RVR-2007
Carga máxima(TM) Número de hilos
9.25-9.75 2
9.75-10.25 5
10.25-10.75 12
10.75-11.25 17
11.25-11.75 14
11.75-12.25 6
12.25-12.75 3
12.75-13.25 1

Encontrar la media y la varianza. Dar un intervalo donde estén al menos el 90% de los datos.

Ejercicio 21 Las calificaciones finales de 20 estudiantes de estadística son:


59; 60; 62; 68; 68; 71; 73; 73; 75; 75; 76; 79; 82; 84; 85; 88; 88; 90; 93; 93:
Hacer la distribución de frecuencias, y los histogramas de frecuencias relativas y relativas
acumuladas en tantos por cien.

Ejercicio 22 Consideremos la siguiente variable discreta que nos da el número de veces que la gente
se examina para aprobar el examen de conducir. Los resultados, dada una muestra de 30 aspirantes,
son:

4, 3, 1, 1, 1, 1, 2, 2, 2, 3, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 2, 3, 1, 3, 3, 3, 2, 1, 4, 1,
Encontrar , s2, los coeficientes k, f

Ejercicio 23 Para evaluar la viabilidad de un proyecto de reforestación de una zona sometida a una
fuerte actividad turística, se analiza la composición en mg por cm 3 de desechos orgánicos del
territorio.
Los datos que se obtienen son:

10.87 9.01 22.50 12.35 17.39 31.05 17.19 16.74 20.33 19.32 23.18 25.15 15.49 20.30 2.38 13.55
9.33 22.72 10.96 25.90 27.66 9.74 18.65 9.31 24.60 17.41 24.86 15.34 23.34 22.81 17.86 30.72
32.60 8.96 32.71 15.86 16.71 5.48 8.25 20.57 4.57 2.30 32.56 7.92 4.84 4.57 26.45 23.58
19.27 9.79 3.03 19.40 23.92 22.45 22.05 21.18 18.85 8.38 15.01 18.12 4.24 3.39 7.17 22.71
22.44 15.89 24.20 24.75 28.08 19.73 13.22 17.69 5.53 11.42 5.58 3.15 14.06 5.83 19.42
21.13 18.32 23.31 11.89 23.95 19.30 12.22 21.45 9.84 4.78 38.63 12.65 13.89 23.82 16.91
28.09 15.73 12.53 16.52 9.48 4.08

Efectuar un estudio descriptivo. ¿Qué conclusiones se pueden obtener acerca de la dispersión y la


forma de la distribución de los datos?

Ejercicio 24. Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del
agua para consumo en términos de colonias de bacterias tróficas en un acuífero próximo a la ciudad.
Se consideran dos zonas diferentes del acuífero y se obtienen los siguientes resultados (numero de
colonias por 1000 mm de agua):

zona 1 194 199 191 202 215 214 197


204 199 202 230 193 194 209
zona 2 158 161 143 174 220 156 156
156 198 161 188 139 147 116

71 RVR-2007
Realizar un estudio comparativo de la calidad del agua en ambas zonas, utilizando resúmenes
numéricos y diagramas de cajas. ¿Se puede considerar que ambas zonas son similares?

Ejercicio 25. Se tienen dos métodos, A y B, para determinar el calor latente de fusión del hielo. La
siguiente tabla da los resultados obtenidos (en calorías por gramo de masa para pasar de -
0.72ºC a 0ºC) utilizando ambos métodos independientemente:

Método A 79.98 80.04 80.02 80.04 80.03 80.03 80.04 79.97 80.05 80.03 80.02 80.00 80.02
Método B 80.02 79.94 79.98 79.97 79.97 80.03 79.95 79.97

a) Hacer una comparación descriptiva de los dos métodos.


b) Si por un error al transcribir los datos, se modifica el primer dato de cada método y se escribe
799.8 y 800.2, ¿como varían la media y la mediana?

Ejercicio 26. En 1978, H. Cavendish realizó una serie de 29 experimentos con objeto de medir la
densidad de la tierra. Sus resultados, tomando como unidad la densidad del agua, fueron:
5.50 5.61 4.88 5.07 5.26 5.55 5.36 5.29 5.58 5.65 5.57 5.53 5.62 5.29 5.44 5.34 5.79
5.10 5.27 5.39 5.42 5.47 5.63 5.34 5.46 5.30 5.75 5.68 5.85
a) Representa los datos por medio de un diagrama de tallos y hojas.
b) Representa los datos por medio de un diagrama de caja y bigotes.
c) Halla la media y la desviación típica.
d) ¿Es la distribución aproximadamente normal?

Ejercicio 27. Dada la siguiente distribución de frecuencias:

x 0 10 20 30 40
n 2 4 7 5 2

a) Calcula la media, moda, mediana, primer y tercer cuartil y cuadragésimoquinto centil.


b) Varianza, desviación típica, coeficiente de variación, desviación media respecto de la
mediana, recorrido y recorrido intercuartílico.
c) Coeficiente de asimetría y de curtosis.
d) Índice de concentración de Gini y curva de Lorenz.

Ejercicio 28. Las ayudas concedidas, en millones de pesetas, por el Fondo Europeo para el
Desarrollo Regional (FEDER) a 62 proyectos españoles vienen reflejadas en la siguiente tabla:

importe de ayuda 0–100 100–250 250–500 500-1000


nº de proyectos 12 15 20 15

a) Calcula la ayuda media y la desviación típica.


b) Representa el histograma pertinente.
c) Calcula la ayuda máxima concedida al 60% de los proyectos menos favorecidos en el
reparto.
d) Estudia la concentración de las ayudas.
e) Calcula la asimetría y la curtosis de esta distribución.

72 RVR-2007

También podría gustarte