Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La Estadística es la ciencia que recopila, clasifica, presenta, describe e interpreta conjuntos de datos.
Generalmente se ocupa de estudiar fenómenos aleatorios.
Comprende los métodos usados para recolectar la muestra, la organización y presentación de los
datos recolectados y la extracción de conclusiones mediante la aplicación de técnicas adecuadas a
los datos de la muestra.
Ejemplos 1.1 Un director de escuela desea conocer las aptitudes de cinco secretarias que trabajan
en dicha institución.
Se aplica una prueba de aptitudes a las cinco secretarias y las calificaciones son 70, 75, 90,85 y 80.
La medida estadística que emplea el director es la aptitud promedio o media aritmética, la cual es la
suma de los valores obtenidos dividida por el número de observaciones.
El resultado se limita a los datos obtenidos en este caso particular y no implica ninguna inferencia o
generalización acerca de las aptitudes de otras secretarias.
Ejemplo 1.2 podría desear conocer la aptitud promedio de las demás secretarias, se podría utilizar
la calificación promedio de las cinco secretarias como base para realizar una inferencia o estimación
acerca de la aptitud promedio de todas las secretarias.
1 RVR-2007
1.2 DEFINICIÓN DE TÉRMINOS ESTADÍSTICOS BÁSICOS
Ejemplo 1.3 que proporción de la población de Huanuco toma cerveza .podría definirse
correctamente el universo diciendo, por ejemplo. Que lo conforman todas las personas que tienen
18 años cumplidos que viven en Huanuco.
En este ejemplo el universo esta conformado por personas, pero el universo podría estar
conformado por objetos, animales o mediciones.
La población puede ser finita o infinita, dependiendo del número de elementos que la forman.
Población infinita; es aquella que tiene un numero infinito de elementos. En la práctica una
población finita con un número grande de elementos se considera una población infinita.
b) Unidad de análisis: es el objeto del cual se desea obtener información. Muchas veces nos
referimos a las unidades de análisis con el nombre de elementos. En estadística, un elemento o
unidad de análisis puede ser algo con existencia real, como un automóvil o una casa, o algo más
abstracto como la temperatura o un intervalo de tiempo. Dada esta definición, puede redefinirse
población como el conjunto de unidades de análisis.
c) Muestra: Es un conjunto de datos seleccionados de un universo, de tal forma que refleje las
características de este .Se dice entonces que una muestra es representativa del universo.
La extracción de la muestra es un paso bien importante porque es a partir de ella que se sacan
conclusiones a acerca de la población. Si el diseño es sencillo la muestra tiene que ser relativamente
grande, alrededor de un 10% del tamaño de la población.
Se suelen tomar muestras cuando es difícil o costosa la observación de todos los elementos de la
población estadística. Al número de elementos de la muestra se le llama n (tamaño de la muestra)
Ejemplo. Si queremos hacer un estudio sobre la opinión sobre algún hecho en específico de los
residentes de Huanuco: Población- todos los residentes de Huánuco., Muestra- los residentes de la
urbanización X de Huanuco.
2 RVR-2007
El director de un hospital desea conocer el color de ojos de un grupo de pacientes (variable
“color de ojos”).
El gerente de una fabrica desea conocer el salario de sus empleados(variable “salario de
empleados”).
El director de un colegio desea conocer el índice de aprovechamiento de alumnos de un
plantel, en la materia de matemática (variable “índice de aprovechamiento en matemáticas”)
g) Parámetro: Es un valor particular que caracteriza a una población. El valor del parámetro es
constante y por lo general es desconocido. Se usan letras griegas para nombrarlos
h) Estadístico : Es un valor que se calcula en base a los datos que se toman en la muestra y el cual
es usado para estimar el valor del parámetro El valor del estadístico es conocido y varia con la
muestra tomada.
Se usa para estimar los parámetros.
Se usan letras latinas para nombrarlos.
i) Censo: Es un listado de una o más características de todos los elementos de una población. Los
censos poblacionales se hacen cada 10 años a nivel mundial.
j) Encuesta: Es un listado de una o más características de todos los elementos de una muestra.
Escala nominal: “Son aquellas que clasifican una población en dos o, las clases o grupos a
partir de una categoría” Ejemplo la variable sexo, con la modalidades femenino y
masculino. El método estadístico para esta escala, consiste en establecer básicamente en
obtener el número de casos o porcentaje en cada modalidad.
Escala Ordinal: “Son escalas nominales donde existe una relacion de orden “.Por ejemplo,
la variable estatus socioeconómico, con las modalidades: clase baja, media y alta. El
método estadístico para esta escala, consiste básicamente en obtener la mediana, percentiles
y coeficiente de correlación por rangos
Escala de intervalo:”Es una escala ordinal con una distancia definida entre sus valores“.
Por ejemplo, las escalas centígradas, el tiempo del calendario, calificación de un test.
Escala de razones de proporciones:”Es una escala de intervalo que posee un cero
absoluto”.Por ejemplo, la variable estatura, peso, edad, etc.
De acuerdo con el tipo de datos que describe cada una de las variables, estas se clasifican en dos
tipos que son:
A. Variables cualitativas. Aquellas que no aparecen en forma numérica, sino como categorías o
atributos (sexo, profesión, color de pelo).
3 RVR-2007
Las variables cualitativas se subdividen en: Nominales y ordinales.
Variables Nominales: Variable cualitativa nominal es aquella que agrupa los elementos en
categorías sin tener un orden. Ejemplo. Facultades (Psicología, Ingeniería, Medicina,
contabilidad); equipos de fútbol (Alianza, Universitario, Cristal), color de cabello (negro,
castaño, rubio), etc .En todos estos ejemplos no interesa el orden.
Variables Ordinales: Variable cualitativa ordinal es cuando las categorías en que se agrupan
los elementos, pueden ser ordenados. Ejemplo. grado de estudios (primero, segundo, tercero);
orden de merito (1º, 2º.3º, etc); nivel social (alto, medio, bajo); en estos ejemplos interesa saber
el orden.
B. Variables cuantitativas
Variable cuantitativa; Son aquellas variables cuyos valores son números .Por ejemplo. La
variable “peso del niño”, “temperatura”, “coeficiente intelectual”, “el numero de estudiantes de
un colegio”, etc.
Las variables cuantitativas se clasifican en:
Variable Cuantitativa Discreta; son aquellas variables que toman valores numéricos
aislados y no pueden tomar ningún valor entre dos consecutivos fijados. Por ejemplo.
numero de alumnos en una facultad, numero de computadoras en una oficina, numero de
hijos por familia, etc.
Variable Cuantitativa Continúa; son aquellas variables que pueden tomar infinitos
valores entre dos números, por muy próximos que los fijemos. Por ejemplo: peso de los
alumnos de una facultad; Coeficiente intelectual de niños, talla de los pacientes en un
hospital, etc.
a) Muestreo Aleatorio: Se usa cuando a cada elemento de la población se le quiere dar la misma
oportunidad de ser elegido en la muestra.
b) Muestreo Estratificado: Se usa cuando se conoce de antemano que la población esta dividida
en estratos, que son equivalentes a categorías y los cuales por lo general no son de igual
tamaño .Luego de cada estrato se saca una muestra aleatoria, usualmente proporcional al tamaño del
estrato
d) Muestreo Sistemático: Se usa cuando los datos de la población estan ordenados en forma
numérica .La primera observación es elegida al azar de entre los primeros elementos de la población
y las siguientes observaciones son elegidas guardando la misma distancia entre si.
4 RVR-2007
1.5 MANERAS DE RECOLECTAR DATOS
a) Haciendo entrevistas personales. Puede ser el método mas efectivo en muchas ocasiones pero es
el costoso y requiere bastante tiempo para ser ejecutado.
b) Haciendo entrevistas por teléfono. Tiene la desventaja de que el entrevistado puede no ser
sincero en sus contestaciones.
c) Mediante cuestionarios emitidos por correo. Es costoso y por lo general no más del 30% de los
entrevistados retornan el cuestionario.
d) Por observación directa.
e) A través de Internet.
f) Usando simulación por computadoras.
Ejercicio 4. Indique que tipo de variable (cuantitativa o cualitativa) serian los siguientes conceptos
Sexo, Tensión Arterial, Grupo Sanguíneo.
Ejercicio 6. Si tuviera que realizar un estudio sobre la incidencia de una determinada patología
¿Que seria más recomendable? Un estudio sobre el total de la población estimada en 10 millones de
posibles afectados, o estudiar una muestra de la misma
Ejercicio 7. Comente brevemente los errores que se pueden producir al estudiar una muestra en
lugar de la población.
Ejercicio 9. ¿Que ventajas poseen los muestreos estratificado y por conglomerados frente al resto de
muestreos existentes?
Ejercicio 10. La siguiente lista de calificaciones se refiere a un examen psicológico aplicado a los
estudiantes de una escuela de ingeniería de una universidad junto con el sexo y la edad de cada uno,
para detectar si hay diferencia en la calificación según el sexo y la edad.
Los datos fueron redondeados a la unidad más próxima
370 362 363 400 345 389 363 372 380 402 372 370 330 366 369 364 370 353 377 408 369 360 338
379 371 376 387 362 405 381 420 359 391 399 343 411 408 355 370 358
a) ¿Cual es la unidad estadística elemental?
b) ¿Cual es la población de estudió? ¿Es finita o infinita?
c) Diga cual es la característica principal de estudio e indique si es cualitativa o cuantitativa
d) Elabore dos preguntas relacionadas con el tema.
e) De un ejemplo de observación para cada uno de las preguntas elaboradas.
5 RVR-2007
Ejercicio 11. El hospital Madre Teresa atendió 1050 pacientes por cáncer con edades entre 40 y 80
años, de 1993 a 2003, como en todos los servicios de salud, para cada uno se tiene un expediente en
el cual se nota información sobre sexo, edad en la que se diagnostico (inicial, intermedio, avanzado)
localización anatómica del tumor, tratamiento y numero de hospitalizaciones durante el periodo.
a) Defina la unidad estadística elemental.
b) Defina la población de interés.
c) Elabore dos preguntas relacionadas con el tema
d) Compete la siguiente lista.
Ejercicio 12. En los servicios de salud, a cada paciente se le abre un expediente que se archiva
numéricamente y cada vez es atendido se nota en el nueva información. Con base en esta
información, el área de Salud de Amarilis va a hacer un estudio de los pacientes atendidos durante
el año 2003. En este estudio interesa investigar, entre otras cosas, ciertas características como edad,
sexo, profesión, así como el número de consultas al año, el número de citas que ha dejado pasar, el
motivo de consulta y la distancia de la vivienda a la unidad de atención.
a) Defina la unidad estadística elemental.
b) Defina la población de interés
c) Utilizando las características mencionadas en el texto anterior, por cada tipo indicando,
mencione el nombre de un ejemplo concreto en este caso y de un ejemplo de observación.
Tipo Nombre de variable Ej.de observación
Cualitativa
Discreta
Continua
d) Indique que método de recolección de datos se utiliza .Ventajas y desventajas en este caso
concreto.
e) Elabore dos preguntas relacionadas con el tema.
Ejercicio 13. ¿Cuál de las siguientes variables es del tipo cuantitativa continua?
A. Estado civil. B. Cifra de leucocitos por campo.
C. Grupo sanguíneo del Sistema ABO. D. Altura de una persona.
6 RVR-2007
CAPITULO II: ORGANIZACIÓN Y REPRESENTACION DE DATOS
En este capítulo se verán las técnicas que se usan para la organización y presentación de datos en
tablas y gráficas.
Se llama distribución de frecuencias a una tabla que divide un conjunto de datos en un número
adecuado de clases.
Con la distribución de frecuencias se tiene una idea mejor de como es la población (o muestra), y
además se puede trabajar de una forma mas sistemática y simplificada.
Distribución categórica; es aquella que se aplica a la variable cualitativa, en donde sus valores
son cualidades o categorías.
Distribución numérica; es aquella que se aplica a la variable cuantitativa, en donde sus valores
son números.
total N 1
7 RVR-2007
Ejemplo 1: En una encuesta de opinión acerca de las preferencias de una tipo de platos de comida
en un pueblito de Perú dieron las siguientes respuestas:
P, P, P, P, P, P, P, P, L, L, L, L, L, L, L, L, L, C, C, C
Solución
n 100
Total n 1
Ejemplo 2 Ante la pregunta del número de hijos por familia (variable x) una muestra de 20 hogares,
marco las siguientes respuestas: 0, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4
Construir la distribución de la variable X. Graficar.
Solución:
8 RVR-2007
1 4 20,0 5 25,0
2 7 35,0 12 60,0
3 6 30,0 18 90,0
4 2 10,0 20 100,0
Total 20 100,0
L0 – L1
L1 - L2
Frecuencia relativa ; es la razón que hay entre la frecuencia absoluta (n i) y el número total de
observaciones (n):
Es importante saber que la suma de todas las frecuencias relativas es siempre igual a uno:
Frecuencia relativa acumulada ; es la suma de las frecuencias relativas hasta cada punto de
la variable. Por ejemplo:
9 RVR-2007
Se puede deducir también que la frecuencia relativa acumulada es la razón entre la frecuencia
absoluta acumulada y el tamaño de la muestra:
46 47 52 54 56 57 57 58 58 59 60 61 63 63 64 65 66 67 67 67 67 67 68 68 69 69 70 70 70 70
72 72 73 73 73 74 76 76 77 77 77 79 80 82 84 85 86 88 93 94
Construir una distribución de frecuencias.
Solución:
Tenemos:
10 RVR-2007
6. Construimos la tabla de frecuencia
46 ; 53 3 3 6 6
53 ; 60 8 11 16 22
60 : 67 11 22 22 44
67 : 74 14 36 28 72
74 : 81 7 43 14 86
81 ; 88 5 48 10 96
88 ; 95 2 50 4 100
50 100
Interpretación.
= 11, significa que existen 11 empleados que ganan entre 46 y 53 dólares semanales
existen 14 empleados que ganan semanalmente entre 67 y 74 dólares por semana.
F6 = 96, el 96% de los empelados ganan entre 46 y 88 dólares por semana.
f5 = 14, el 14% de los empleados ganan entre 74 y 81 dólares semanales
Sean el número total de observaciones realizadas de la variable X que toma los valores distintos
,...,? entonces, tenemos las siguientes propiedades:
1. …+ 2. …+
3. 4.
5. 0 n ni ; i = 1, 2, 3,..., k 6. 0 fi 1; i= 1,2, 3, ...,k
7.
8. El porcentaje correspondiente a un valor de la variable X se obtiene multiplicado la frecuencia
relativa por 100 esto es (%) = 100
La representación gráfica de este tipo de datos está basada en la proporcionalidad de las áreas a las
frecuencias absolutas o relativas. Veremos dos tipos de representaciones:
11 RVR-2007
A. Diagrama de sectores (tarta):
Está representación gráfica consiste en dividir un círculo en tantos sectores circulares como
modalidades presente el carácter cualitativo, asignando un ángulo central a cada sector circular
proporcional a la frecuencia absoluta ni, consiguiendo de esta manera un sector con área
proporcional también a ni.
El ángulo central se determina así
Solución
Para determinar los ángulos del sector aplicamos los siguientes cálculos
Reclamos, Otros, 1
10
Productos
Mala
Inconformes
atención, 26
,3
B. Diagrama de rectángulos:
Esta representación gráfica consiste en construir tantos rectángulos como categorías presente la
variable cualitativa en estudio, todo ellos con base de igual amplitud. La altura se toma igual a la
frecuencia absoluta o relativa (según la distribución de frecuencias que estemos representando),
consiguiendo de esta manera rectángulos con áreas proporcionales a las frecuencias que se quieren
representar.
12 RVR-2007
Ejemplo 2.5 Hacer el diagrama de rectángulos para tabla siguiente.
Solución
La representación gráfica del diagrama de rectángulos del ejemplo anterior será de la forma:
A. Diagrama de barras:
Consiste en levantar, para cada valor de la variable, una barra cuya altura sea su frecuencia absoluta
o relativa, dependiendo de la distribución de frecuencias que estemos representando.
Nº de hijos(Xi) 0 1 2 3 4 Total
Nº de familias(ni) 5 6 8 4 2 25
Solución.
Primero hallamos las frecuencias relativas
(fi), luego graficamos
13 RVR-2007
Xi ni fi
0 5 0.20
1 6 0.24 f
2 8 0.32 i
3 4 0.16
4 2 0.08
25 1.00
Solución.
Hallamos las frecuencias relativas acumuladas
Fi
Xi ni fi Ni Fi
0 5 0.20 5 0.20
1 6 0.24 11 0.44
2 8 0.32 19 0.76
3 4 0.16 23 0.92
4 2 0.08 25 1.00
25 1.00
Número de Hijos
Al igual que antes, existen también dos tipos de representaciones gráficas dependiendo de si la
distribución de frecuencias en estudio es de datos acumulados o de datos sin acumular.
A. Histograma. Al ser esta representación una representación por áreas, hay que distinguir si los
intervalos en los que aparecen agrupados los datos son de igual amplitud o no.
Si la amplitud de los intervalos es constante, dicha amplitud puede tomarse como unidad y al ser
14 RVR-2007
Si los intervalos tienen diferente amplitud, se toma alguna de ellas como unidad (generalmente la
menor) y se levantan alturas para cada intervalo de forma que la ecuación anterior se cumpla.
Individu Nivel Individuo Nivel Individuo Nivel Individuo Nivel Individuo Nivel
o
1 10.6 13 12.2 25 11.8 37 12.8 49 12.8
2 12.5 14 10.8 26 12.7 38 14.7 50 15.7
3 11.1 15 16.5 27 11.4 39 15.4 51 13.4
4 9.2 16 15.0 28 9.3 40 10.3 52 10.3
5 11.5 17 10.3 29 8.6 41 9.6 53 14.6
6 9.9 18 12.4 30 8.5 42 8.5 54 8.5
7 11.9 19 9.1 31 10.1 43 12.1 55 10.1
8 11.6 20 7.8 32 12.4 44 11.4
9 14.9 21 11.3 33 11.1 45 14.1
10 12.5 22 12.3 34 10.2 46 10.2
11 12.5 23 9.7 35 9 47 8
12 12.3 24 12.0 36 8.9 48 9.9
Solución.
Ii ni fi
15 RVR-2007
0-20 8 8/70
20-30 9 9/70
30-40 12 12/70
40-45 10 10/70
45-50 9 9/70
50-60 10 10/70
60-80 8 8/70
80-100 4 4/70
n= 70 1
Tomando la amplitud 5 como unidad, deberemos levantar para el primer intervalo una altura de
2/70 para que el área sea la frecuencia relativa 8/70. Procediendo de la misma manera con el resto
de los intervalos obtendríamos como representación gráfica la figura siguiente:
Obsérvese que la suma de todas las áreas debe ser 1, tanto si los intervalos de la distribución de
frecuencias relativas son o no de igual amplitud.
Ii ni fi Ni Fi
07.65 - 09.15 4 0.118 4 0.118
09.15 - 10.65 8 0.235 12 0.353
10.65 - 12.15 10 0.294 22 0.647
12.15 - 13.65 9 0.265 31 0.912
13.65 - 15.15 2 0.059 33 0.971
15.15 - 16.65 1 0.029 34 1 7.65 9.15 10.65 12.15 13.65 15.15 16.65
34 1
16 RVR-2007
2.3 OTRAS REPRESENTACIONES GRAFICAS
De manera similar al histograma permite ver el lote como un todo y advertir aspectos como:
Cuan aproximadamente simétricos son los datos.
Cuan diversos están los valores.
La aparición de los valores inesperadamente mas frecuentes,
Si algunos valores están alejados del resto.
Si hay concentraciones de valores.
Si hay grupos separados.
Al utilizar los dígitos de los valores de los mismos datos, en vez de simplemente encerrando áreas,
ofrece ventajas.
Es más fácil de construir a mano.
Facilita el ordenamiento de los datos.
Permite ver lo distribución de los datos dentro de cada intervalo como patrones dentro de
los datos.
Observaciones:
Ejemplo 10 Suponga que los siguientes datos representan el salario anual de los obreros de la
compañía X
20 14 21 29 43 17 15 26 08 14 39 23 16 46 28 11 26 35 26 28 30 22 23 07 32 19 22 18 27 09
Solución:
17 RVR-2007
07 08 09 11 14 14 15 16 17 18 19 20 21 22 23 23 26 26 26 27 28 28 29 30 32 35 39 43 46
Y separamos los datos en dos fracciones (dígitos), ejemplo el 07 se separa (0 y 7 ), el 08 (0 y 8) el
21(2 y 1) el 39(3 y 9)
Los datos que más se repiten son los que tienen como tallo el 2, la distribución de los datos es
aproximadamente simétrica.
Nota: se recomienda que el número de tallos este entre 5 y 20
Solución
10 789
11 14456789
12 0122336667889
13 0259
14 36
Ejemplo 12. Considere la siguiente información sobre duración de baterías de carro, en años. Se
pide:
Construir el diagrama de tallos y hojas usando como tallos la parte entera.
Construir el diagrama de tallos y hojas partiendo cada tallo en dos.
Solución
Usando como tallos la parte entera
Tallos: Dígitos principales (Parte entera)
Ramas: Dígitos secundarios (Parte decimal)
18 RVR-2007
En este caso el tallo 1 únicamente tendría la parte superior, y el tallo 4 tendría tanto la parte inferior
como la superior
A diferencia de los otros gráficos ya vistos, los diagramas de caja hacen énfasis en las medidas de
posición. Es muy útil para hacer comparaciones entre muestras de distintas poblaciones.
En un simple gráfico se suministra información sobre la mediana (o media), sobre el 50% y 90% de
los datos, sobre la existencia de situaciones con datos atípicos, así como de la simetría de la
distribución.
1) Ordenar los datos de la muestra y obtener el valor mínimo, el máximo, y los tres cuartiles Q1,
Q2 y Q3.
2) Dibujar un rectángulo cuyos extremos son Q1 y Q3 e indicar la posición de la mediana, Q2,
mediante una línea.
3) Calcular con cualquiera de los procedimientos descritos anteriormente unos límites admisibles
superior e inferior, Li y Ls, que identifiquen a los valores atípicos.
Li = min – 1.5 IQR: Ls= max+1.5 IQR, IQR = Q3-Q1
4) Considerar como valores atípicos los situados fuera del intervalo (Li, Ls).
5) Dibujar una línea que va desde cada extremo del rectángulo central hasta el valor más alejado
no atípico, es decir, que está dentro del intervalo (Li, Ls).
6) Identificar todos los datos que están fuera del intervalo (Li, Ls), marcándolos como atípicos.
19 RVR-2007
Ls
Q3
Q2
Q1
Li
Ejemplo 14 Con base en una muestra de 20 entregas, Marco’s Pizza determinó la siguiente
información:
Valor mínimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos, Q3 = 22 minutos,
Valor máximo = 30 minutos.
Solución.
Ls=22+1.5 x IQR
Q2
Min Q1 Q3
max
12 13 15 18 20 22 24 28 30 32
Li = q1 - 1.5 IQR = 15 - 1.5 (22-15) = 15- 1.5(7) = 4.5, como min=13, el Li=13 y no 4.5
Ls = q3 + 1.5 IQR = 22 + 1.5 (22-15) = 22 + 1.5(7) = 32.5, como el máximo es 30 entonces Ls=30
y no 32.5
Un Dotplot es una alternativa informal al Histograma para mostrar datos continuos. En el dotplot
cada valor de los datos mostrado como un punto en el eje horizontal. Cuando dos valores se separan
por menos de un cierto espacio se apilan en una columna. Si el incremento es muy pequeño es
imposible ver la forma de la distribución. Sin embargo, si el incremento es muy grande entonces
sólo se obtiene una columna de puntos.
Ejemplo 14. Los siguiente datos presenta los resultados observados del número de plántulas de
malezas por m2 en una muestra de tamaño n=20. 5 3 4 7 5 9 8 4 7 4 5 1 4 5 8 4 7 5 3 5
Garfique el diagrama de punto o dot plot
Solución
20 RVR-2007
0 1 2 3 4 5 6 7 8 9 10
2.3.4 DIAGRAMA DE PARETO
Ejemplo 16 Durante una jornada laboral el equipo de control de calidad decidió hacer un conteo de
los defectos que se presentaban en los elementos estructurales para puertas que se manufacturaban
dentro de la empresa recabando los siguientes datos. Construir el diagrama de
Pareto de los defectos en elementos estructurales en puertas.
Solución
Ejercicio 1 Algunos estudiantes en un picnic de la clase reunieron datos acerca de cuántas uvas
cada uno tenía en su plato. Los resultados aparecen aquí en una gráfica de puntos.
a. grafique el diagrama de puntos (dot – plot)
b. ¿Cuántos estudiantes tenían más de seis uvas en su plato?
c. ¿Cuál es el rango de los datos y cual es la media?
21 RVR-2007
0 2 4 6 8 10 12 14
Solución.
a. Diagrama dot-plot
Media:
Ejercicio 2 Las puntuaciones en un examen de medio semestre en una clase de historia fueron 98,
65, 77, 83, 77, 79, 92, 41, 84, 71, 73, 90, 77, 92, 64 y 83.
a. Crea una gráfica de tallos y hojas para los datos.
b. Crea un histograma para las puntuaciones del examen de medio semestre.
c. Da un resumen de cinco números para las puntuaciones del examen de medio semestre y dibuja
una gráfica de caja.
d. ¿Cuál es el rango intercuartil (IQR) de las puntuaciones del examen de medio semestre?
Solución
a. Colocamos los dígitos de las décimas en el “tallo” y los dígitos de las unidades en las
“hojas”. Creamos una clave que muestra cómo interpretar una de las entradas.
4 1
5
6 4 5
7 137779 Frecuencia de
8 334 puntuaciones
9 0228
Clave
7 1 significa 71
b. Histograma
Puntuaciones
c. Comienza con los datos en orden ascendente. La mediana es el valor central. Si hay un número
par de puntos de datos, la mediana es el promedio de los dos valores centrales. Q1 es la mediana de
todos los datos por debajo de la mediana y Q3 es la mediana de todos los datos por encima de la
mediana.
22 RVR-2007
41 64 65 71 73 77 77 77 79 83 83 84 90 92 92 98
Por lo tanto, el resumen de cinco números es 41, 72, 78, 87, 98.
0 20 40 60 80 100
Puntuaciones
d. IQR = Q3 - Q1= 87 - 72 = 15
Ejercicio 3 Las notas de Matemáticas de una clase han sido las siguientes: 3, 4, 1, 2, 8, 9, 8, 7,
6, 6, 7, 9, 8, 7, 7, 1, 0, 1, 5, 9, 9, 8, 0, 8, 8, 8, 9, 5, 7, 5, 6
Construir una tabla de frecuencias.
Solución
Frecuencias
Frecuencias Frecuencias Frecuencias
Calificaciones acumuladas
absolutas acumuladas relativas
xi relativas
fi Fi hi
Hi
0 2 2 2/30 2/30
1 3 5 3/30 5/30
2 1 6 1/30 6/30
3 1 7 1/30 7/30
4 1 8 1/30 8/30
5 3 11 3/30 11/30
6 2 13 2/30 13/30
7 5 18 5/30 18/30
8 7 25 7/30 25/30
9 5 30 5/30 30/30
30 1
8.3 6.6 7.5 7.9 8.2 7.8 8.5 7.9 7.9 8.5 7.2 6.6 8.8 6.6 8.3 7.7
7.9 7.8 8.4 9.3 6.6 7.6 7.5 8.6 7.9 7.4 7.9 7.8 7.9 9.0 7.4 7.5
7.0 7.1 7.7 7.3 8.5 8.2 6.6 7.5 6.7 7.7 6.7 6.6 8.4 6.8 7.9 8.0
7.8 9.0 8.7 8.7 8.2 6.7 8.3 7.3 7.9 6.7 8.5 9.1 9.0 9.3 8.4 6.6
7.2 6.6 7.2 7.5 7.9 9.8 10 8.7 7.2 9.6 7.4 8.5 7.9 7.8 8.5 8.5
Solución.
23 RVR-2007
Analicemos el problema utilizando la fórmula de Sturges. En ese caso en número de clases esta
determinado como: k= 1+3.322 log 80 =7.32≈8 clases.
El intervalo de variación o rango es R=10-6.6+0.1=3.5 por lo que la amplitud de clase es igual a
. E=(8x0.44-3.5)/2=0.01; Xmin=Xmin-0.01=6.59; Xmax=Xmax+0.01=10.01
De lo que obtenemos la siguiente tabla:
Ejercicio 5 Se han medido el grupo sanguíneo de 40 individuos y se han observado las siguientes
frecuencias absolutas para cada categoría:12 para x1 = A, 11 para x2 = B, 8 para x3 = AB y 9 para
x4 = O.
a) ¿De qué tipo es la variable estudiada? Construir la tabla de frecuencias correspondiente.
b) ¿Qué porcentaje de individuos son del grupo A?
c) ¿Qué porcentaje de individuos no son del grupo O?
d) ¿Cuántos individuos no son del grupo B?
e) construya el diagrama de sectores
Solución
a) variable cualitativa
xi ni fi Ni Fi
A 12 0.300 12 0.300
B 11 0.275 23 0.575
AB 8 0.200 31 0.775
O 9 0.225 40 1.000
Total 40 1.000
24 RVR-2007
Ejercicio 6. Se quiere estudiar la eficacia de un nuevo insecticida para plantas de interior. Se
seleccionan 50 plantas y se cuenta el número de hojas que han sido atacadas después de haber
tratado la planta con el nuevo producto. Los resultados son:
Hojas atacadas ni
0 6
1 10
2 12
3 8
4 5
5 4
6 3
8 1
10 1
Solución
a) Cuantitativa discreta,
Hojas atacadas ni fi Ni Fi
0 6 0,12 6 0,12
1 10 0,20 16 0,32
2 12 0,24 28 0,56
3 8 0,16 36 0,72
4 5 0,10 41 0,82
5 4 0,08 45 0,90
6 3 0,06 48 0,96
8 1 0,02 49 0,98
10 1 0,02 50 1
0 0 1 2 3 4 5 6 7 8 9 10
25 RVR-2007
Ejercicio 7. En veinte vuelos de avión se han contado el número de asientos vacíos en cada vuelo.
Se han agrupado los datos en intervalos de longitud 4.
asientos ni
vacíos
0−3 9
4−7 5
8 − 11 4
12 − 16 2
Solución
a) Cuantitativa discreta,
intervalos xi ni fi Ni Fi
[0, 4) 2 9 0,45 9 0,45
[4, 8) 6 5 0,25 14 0,70
[8, 12) 10 4 0,20 18 0,90
[12, 16] 14 2 0,10 20 1,00
Total 20 1
Ejercicio 8. Se tiene una urna con 50 esferas numeradas progresivamente. El experimento consiste
en sacar una esfera, anotar su número y devolverla a la urna.
a) ¿Cuál es la variable?
b) ¿La variable es cualitativa o cuantitativa?
c) Si podemos sacar una esfera por tiempo indefinido, entonces ¿cómo es la población?
d) Si únicamente podemos hacer 100 extracciones, entonces, ¿cómo es la población?
Solución
a) La variable es el número de la esfera.
b) Es cuantitativa.
c) La población es infinita.
26 RVR-2007
d) La población es finita.
Solución
a) Se define por una expresión (estado de salud) es de tipo cualitativo, es nominal, es una variable
discreta y la escala con que se cuantifica es nominal.
b) Se define por un número (número de centímetros), es de tipo cuantitativo, es una variable
continua y su escala con que se cuantifica es por intervalos.
c) Se define por un número, es de tipo cualitativo, es una variable discreta y su escala de medición
es por intervalos.
d) Se define por una expresión (sexo) es de tipo cualitativo nominal, es discreta: su escala de
medición es nominal.
e) La población está constituida por 8000 estudiantes, por lo tanto es una población finita.
f) La muestra está constituida por 500 alumnos.
g) La variable está definida por una expresión (lugar que ocupó), es de tipo cualitativo ordinal, la
escala con que se cuantifica es ordinal y es una variable discreta.
Ejercicio 10 En la Fuerza Aérea de un determinado país, los aviadores toman un examen médico
general en cada 150 horas de vuelo, por lo que se analizan los expedientes de cada piloto para
citarlos a su examen. Los resultados obtenidos se muestran en la siguiente tabla correspondiente a
las horas de vuelo.
222, 220, 199, 212, 201, 217, 214, 213, 212, 215, 214, 196, 192, 208, 207, 212, 214, 209, 202, 206,
196, 202, 219, 194, 206, 204, 194, 211, 216, 209, 212, 216, 206, 201, 201, 210, 200, 206, 201, 205,
217, 219, 212, 207, 211, 204, 212, 212, 205, 207, 214, 211, 220, 205, 201, 218, 193, 199, 206, 209,
205, 205, 221, 216, 211, 204, 215, 203, 213, 207, 209, 197, 197, 199, 208, 209, 218, 204, 207, 202,
209, 195, 207, 209, 205, 210, 197, 209, 211, 208, 211, 198, 217, 209, 199, 192, 218, 193, 208, 209,
194, 211,
27 RVR-2007
Solución.
a) Datos ordenados
19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 20 20
2 2 3 3 4 4 4 5 6 6 7 7 7 8 9 9 9 9 0 1
20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20
1 1 1 1 2 2 2 3 4 4 4 4 5 5 5 5 5 5 6 6
20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20
6 6 6 7 7 7 7 7 7 8 8 8 8 8 9 9 9 9 9 9
20 20 20 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21
9 9 9 0 0 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3
21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 22 22
3 4 4 4 4 5 5 6 6 6 7 7 7 8 8 8 9 9 0 0
22 22
1 2
e) f) g) h) i) j)
Límite de Punto Medio Frecuencia Frecuenci Frecuencia Frecuencia
Clase de clase Absoluta ni a Acumulada Relativa
Relativa fi Ni Acumul. Fi
<191.9 195.8] 193.85 8 0.078 8 0.078
<195.8 199.7] 197.75 10 0.098 18 0.176
<199.7 203.6] 201.65 10 0.098 28 0.274
<203.6 207.5] 205.55 21 0.21 49 0.484
<207.5 211.4] 209.45 23 0.23 72 0.714
<211.4 215.3] 213.35 15 0.15 87 0.864
<215.3 219.2] 217.25 11 0.11 98 0.964
<219.2 223.1] 221.15 4 0.04 102 1.00
Total 102 1.00
28 RVR-2007
l. Polígono de frecuencia acumulada relativa
1.00
0.50
29 RVR-2007
193 8 102
197 10 94
201 10 84
205 21 74
209 23 53
213 15 30
217 11 15
221 4 4
Ejercicio 11 En cierta ciudad se entrevisto a 50 mujeres nacidas entre 1935 y 1944, la edad en que
contrajeron matrimonio, la tabla expresa sus respuestas
15 17 25 15 16 11 15 13 12 10 15 14 16 14 17 13 14 20 29 19 16 18 10 18 12
11 20 34 13 22 19 14 17 16 16 15 12 24 25 9 21 15 13 23 24 10 10 16 14 18
a. construya el diagrama de dot – plot b. construya el diagrama de box-plot
c. construya el diagrama de Stem-and-Leaf
Solución
a. Dot - plot
8 12 16 20 24 28 32
b. Box – plot
c. Stem-and-Leaf
1 0 9
(38) 1 00001122233334444455555566666677788899
11 2 001234455
Solución
K=1+3.322log(57)= 1+3.322=6.8= 7 R= Xmax-Xmin+0.01=1.70-1.35+0.01=0.36
C= 0.36/7=0.051=0.05 E=(7x0.05-0.35)=0;
Tabla de frecuencia
b) Tabla de frecuencias
N =50 Tabla de frecuencias
Max =29 Li-1 Li ni fi Ni Fi
Min =10 <9.5 12.5] 2 0.04 2 0.04
K =1+3,322*log(50)= 6,643978354=7 <12.5 15.5] 6 0.12 8 0.16
r =max-min=29-10+1=20 <15.5 18.5] 11 0.22 19 0.38
A =r/k=2.86=3 <18.5 21.5] 16 0.32 35 0.70
e =kx-r=21-20=1 <21.5 24.5] 9 0.18 44 0.88
xmin =10-0.5=9.5 <24.5 27.5] 5 0.10 49 0.98
xmax =29+0.5=29.5 <27.5 30.5] 1 0.02 50 1
50 1
5 31 RVR-2007
32.00%
0
11 14 17 20 23 26 29
30
f. Gráfico Circular
Ejercicio 3. La venta de libros de una librería de los 5 años anteriores fueron los que se
muestran en la siguiente tabla.
1988 1989 1990 1991 1992
32 RVR-2007
Matemática 500 1000 1500 2000 3000
s
Física 1000 500 2500 2000 1500
Química 500 1500 500 500 2000
Filosofía 500 500 1000 500 500
Leyes 1000 1500 2000 1000 500
Ejercicio 4. Los datos siguientes corresponden a ciertas longitudes (en cm). Construir un diagrama
de tallo y hojas, box – plot, dot – plot, Pareto. 11.357, 12.542, 11.384, 12.431, 14.212, 15.213,
13.300, 11.300, 17.206, 12.710, 13.455, 16.143, 12.162, 12.721, 13.420, 14.698.
Ejercicio 5. Con los datos del Ejercicio 2.4 trazar la curva de frecuencias relativas acumuladas.
Determinar el número de vuelos que tienen como máximo 10 asientos vacíos.
a) Construir una tabla estadística con las marcas de clase, las frecuencias absolutas y las frecuencias
relativas.
b) ¿Cuántas provincias tienen menos de 500 000 habitantes? ¿Qué porcentaje representan?
c) ¿Cuántas provincias tienen entre 800 000 y 1 300 000 habitantes?
d) Construir el histograma de frecuencias absolutas. Interprete
e) Construya todo los gráficos que sean necesarios
Ejercicio 7 Los siguientes datos corresponden a las medidas de 15 individuos sobre la variable
cuantitativa peso (en kg): 62, 74, 86, 53, 49, 71, 68, 67, 69, 70, 58, 59, 73, 74, 78.
a) Construir una tabla de frecuencias absolutas, relativas, absolutas acumuladas y relativas
acumuladas.
b) Realizar un diagrama de tallo y hojas y un polígono de frecuencias acumuladas.
c) ¿Qué porcentaje de individuos pesan entre 50 y 60 kg?
d) ¿Cuántos individuos pesan por lo menos 70 kg?
e) construya todo los gráficos que sean necesarios
Ejercicio 8 Una empresa inmobiliaria ofrece apartamentos en régimen de alquiler con los siguientes
precios (en euros):
precio alquiler número de
33 RVR-2007
(mensual) apartamento
s
700-1000 21
1000-1100 27
1100-1300 34
1300-1500 14
1500-1800 8
1800-2000 11
2000-2100 10
a) Obtener el alquiler medio por apartamento, el precio más frecuente y el precio que se sitúa en
medio de la oferta.
b) Si una persona está dispuesta a gastarse en alquiler entre 1250 y 1350 euros al mes, a qué
porcentaje de apartamentos tiene opción?
c) Por debajo de qué precio están el 80% de los apartamentos?
d) Entre qué precios están el 50% central de los apartamentos?
Ejercicio 9 El número de días que 9 trabajadores escogidos al azar de una empresa han estado de
baja son los siguientes: 15 7 8 85 19 12 8 22 14
a) Representa este conjunto de datos mediante un diagrama de caja (box-plot). ¿Se detecta algún
valor atípico?
b) ¿Qué se puede decir de la simetría de estos datos?
c) ¿Qué transformaciones conoces que creas que pueden ser útiles para simetrizar estos datos?
Ejercicio 10. El consumo en miles de litros de agua de una industria durante los primeros 10 meses
del año de 1993 son los que se muestran en la siguiente tabla.
Ejercicio 11 Las calificaciones finales obtenidas por los 80 alumnos de un primer curso de
Estadística. Se muestra a continuación.
68 84 75 82 68 90 62 88 76 93 73 79 88 73 60 93 71 59 85 75 61 65 75 87 74 62 95 78 63 72 66 78
82 75 94 77 69 74 68 60 96 78 89 61 75 95 60 79 83 71 79 62 67 97 78 85 76 65 71 75 65 80 73 57
88, 78 62 76 53 74 86 67 73 81 72 63 76 75 85 77
34 RVR-2007
Se pide:
a. Preparar una tabla de frecuencias, interprete.
b. Representar gráficamente los datos.
c. El número de estudiantes con calificaciones de 75 ó más.
Ejercicio 14 La Edad promedio de las personas que presentaron dolor toráxico ( N =1184 ) en
urgencias durante un año fueron:
Edad i ni
0 – 20 8
20 – 30 94
30 – 40 220
40 – 45 236
45 – 50 260
50 – 55 154
55 – 65 198
65 – 80 14
Se pide:
a. Completar la tabla de distribución de frecuencias, interprete.
b. Dibujar el histograma, polígono de frecuencias y la ojiva.
c. ¿Qué % de personas tenían una edad inferior a 50 años? ¿E inferior a 28 años? ¿Y entre 37 y 54?
d. Construya los demás gráficos que sean posibles
Ejercicio 15. El primer día de clases del semestre pasado se les preguntó a 70 estudiantes, acerca del
tiempo (en minutos) que tardan para ir de su casa a la universidad.
20 35 25 15 5 20 25 30 20 20 30 15 15 20 20 25 25 20 20 10 20 25 45 20 5 25 40 25 25 20 30 25
35 20 30 15 30 25 20 10 10 5 10 15 25 40 25 10 20 15 20 35 25 15 5 20 25 30 20 20 30 15 15 20
20 25 25 20 20 10
Se pide:
a. Ordenar los datos en una tabla de frecuencias agrupándolos en clases de igual amplitud,
interprete.
b. Construya un histograma de frecuencias relativas
c. Construya un polígono de frecuencias relativas
d. Construya un ojiva Diagrama de frecuencia relativa acumulada
35 RVR-2007
e. Construya el diagrama de caja (box-plot), interprete
f. Construya el diagrama de pareto, interprete
g. Construya el diagrama de tallo hoja (Stem-and-Leaf)
36 RVR-2007
CAPITULO III. MEDIDAS DE POSICION Y DE TENDENCIA
CENTRAL
Las medidas de tendencia central se utilizan para representar a través de un solo valor a una serie de
datos agrupados o no agrupados y son valores alrededor de los cuáles tienden a agruparse las
observaciones.
La media aritmética de una variable estadística es la suma de todos sus posibles valores dividido por
el total de las observaciones.
Población
MEDIA
ARITMÉTICA
Muestra
K: número de intervalos
Ejemplo 1 El peso neto del contenido de cinco botellas de perfume seleccionadas de forma
aleatoria de la línea de producción son (en gramos): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la media
aritmética de las observaciones muestreadas?
Solución.
37 RVR-2007
Ejemplo 2 Calcular la media aritmética de la siguiente distribución de frecuencia del número de
meses de duración de una muestra de 40 baterías para coche.
Solución.
Primeramente, calculamos la marca de clase (x), para después calcular el producto n ixi y proceder
finalmente a calcular la media.
Li-1 Li x ni xini
15 19 17 2 34
20 24 22 1 22
25 29 27 4 108
30 34 32 15 480
35 39 37 10 370
40 44 42 5 210
45 49 47 3 141
n =40
Solución
38 RVR-2007
xi ni xini
0 3 0
1 11 11
2 22 44
3 17 51
4 23 92
5 4 20
total 80 218
3.2 MEDIANA.
Es el punto medio de los valores de una serie de datos después de haber sido ordenados de acuerdo
a su magnitud. La mediana divide al total de los datos en dos partes iguales (50% para cada lado).
MEDIANA
Si n par
Sin intervalos
Los datos se ordenan antes
Solución.
Solución.
Datos ordenado 9, 11, 12, 13, 14, 15, 17, 18
39 RVR-2007
Posición 1 2 3 4 5 6 7 8
Solución.
Li-1- Li ni Ni
15 - 19 2 2
Nj-1
20 - 24 1 3
25 - 29 4 7 n 40
lj-1 30 - 34 15 22 20
2 2
35 - 39 10 32 Nj
40 - 44 5 37 nj
45 - 49 3 40
40
40 RVR-2007
Li-1 Li ni Ni
0 – 10 2 2
10 – 20 3 5
20 – 30 5 10
Lj-1 30 – 40 6 16
40 – 50 10 26
50 – 60 4 30
60 – 70 2 32 Nj-1
Total 32
3.3 MODA
La moda se define como aquel valor de la variable al que corresponde máxima frecuencia (absoluta
o relativa).
La moda puede no existir, e incluso no ser única en el caso de existir.
Solución:
Alquileres en
miles de ni
41 RVR-2007
pesetas
[0,15) 17
[15,30) 130
[30,45) 180
[45,60) 30
[60,75) 10
[75,90) 5
Solución
La frecuencia mayor es ni=23, luego la moda es Mo=4
Identificamos la maxima frecuencia que es 20, luego li-1=20, ni=20 ni-1=8, ni+1=14, ai= 10
42 RVR-2007
3.4 CUANTILES: DECILES, CUARTILES Y PERCENTILES
Son medidas de posición, basadas en la ordenación de los datos. Dividen al conjunto de datos
ordenado en partes iguales. Según el número de partes, hablamos de:
3.4.1 CUARTILES.
Dividen al conjunto de datos en 4 partes iguales, cada una de las cuales engloba un 25% de datos.
Hay por tanto 3 cuartiles, Q1, Q2, Q3.
3.4.2 DECILES.
Dividen al conjunto de datos en 10 partes iguales, cada una de las cuales engloba un 10% de datos.
Hay por tanto 9 deciles, D1, ..., D9.
3.4.3 PERCENTILES.
Dividen al conjunto de datos en 100 partes iguales, cada una de las cuales engloba un 1% de datos.
Hay por tanto 99 percentiles, P1, ..., P99.
La mediana, al dejar por debajo a un 50% de los datos, coincide con el D 5, Q2 y P50. La forma de
cálculo es similar a la de la mediana.
Una franja de interés es [P25- P75], que contiene al 50% de los datos centrales.
Por debajo del P25 quedan el 25% de los datos más pequeños, y por encima del P75 quedan el 25%
de los datos más grandes.
Solución.
Ordenamos los datos
43 RVR-2007
Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 21, 21, 21, 21, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Cuartil 1 (q1)
Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 ↓ 21, 21, 21, 21, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
5.25
q1=18+0.25 (19-18)=18.25
Cuartil 3 (q3)
Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 21, 21, 21, 21, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
15.75
q3=20+0.75 (21-20)=20.75
Percentil 25 (P25)
Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 ↓ 21, 21, 21, 21, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
5.25
P25=18+0.25 (19-18)=18.25
Percentil 75 (p75)
Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 21, 21, 21, 21, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
15.75
P75=20+0.75 (21-20)=20.75
Percentil 90 (p90)
44 RVR-2007
Determinamos la posición del percentil 90 (p90)
Datos ordenados 18, 18, 18, 18, 18 19, 19, 19, 19, 19, 19, 19, 19, 19, 20 21, 21, 21, 21, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
15.9
P90=21+0.9 (21-21)=21
Salarios No. De
Li-1 Li Empleados (ni) Ni
200-300 85 85
300-400 90 175
400-500 120 295
500-600 70 365
600-700 62 427
700-800 36 463
Solución
Decil 7 (d7)
Percentil 30 (p30)
Posición:
45 RVR-2007
3.5 EJERCICIOS RESUELTOS
xi ni nixi
18 6 108
19 8 152
20 3 60
21 2 42
22 1 22
n = 20 384
X : Altura xi ni nixi
(1.55-1.65] 1.60 4 6.4
(1.65-1.75] 1.70 9 15.3
(1.75-1.85] 1.80 6 10.8
(1.85-1.95] 1.90 1 1.9
n = 20 34.4
Clases xi ni xini
Tabla
Clases ni Ni 10 – 20 15 10 150
10 – 20 10 10 20 – 30 25 14 350
20 – 30 14 24 30 – 40 35 21 735
30 – 40 21 45
40 – 50 45 31 1395
40 – 50 31 76
50 – 60 55 18 990
50 – 60 18 94
60 – 70 15 109 60 – 70 65 15 975
70 – 80 7 116 70 – 80 75 7 525
80 – 90 4 120 80 – 90 85 4 340
120 5460
La mediana
Hallamos n/2 = 120/2=60,
Li-1 Li ni Ni 60 esta entre 45 y 76 en la columna Ni
10 – 20 10 10 Ni-1
46 RVR-2007
ni
20 – 30 14 24
30 – 40 21 45
40 – 50 31 76 120/20=60
50 – 60 18 94
60 – 70 15 110
70 – 80 7 117
80 – 90 4 121
La moda
Li-1 Li ni
10 – 20 10
20 – 30 14
30 – 40 21
40 – 50 31
50 – 60 18
60 – 70 15
70 – 80 7
80 – 90 4
Ejercicio 4 Determinar los cuartiles, percentil 20, percentil 45 de los siguientes datos
31 8 5 14 92 5 7 9 10 12 14 9 15 18 25 89 30 64 72 88 17 90 98 9
Solución
Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
6.25
q1= 9+0.25 (9-9)=9
Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
12.5
q2= 15+0.5 (17-15)=16
47 RVR-2007
Determinamos la posición del cuartil 3 (q3)
Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
18.75
q3= 64+0.75 (72-64)=70
Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
5.0
p20= 9+0.0 (9-9)=9
Datos 5 5 7 8 9 9 9 10 12 14 14 15 17 18 25 30 31 64 72 88 89 90 92 98
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
11.25
p45= 14+0.25 (15-14)=14.25
Ejercicio 3.5 En un grupo de psicología se han obtenidos las siguientes puntuaciones en un test de
razonamiento lógico:
Se pide:
a) Representar gráficamente la distribución.
b) Calcular el valor de la moda.
c) ¿A partir de qué valor se encuentra el 60% de los alumnos que han obtenido mejor puntuación.
Solución
Intervalos marcas ni Ni
clase
[10-20) 15 26 26
[20-30) 25 19 45
[30-40) 35 17 62
48 RVR-2007
[40-50) 45 16 78
[50-60) 55 7 85
[60-70) 65 14 99
[70-80) 75 21 120
120
10 20 30 40 50 60 70 89
c) Tenemos que calcular el percentil 40, P40, que deja a su derecha el 60% de las observaciones.
Ejercicio 1 Un inversor tiene ahorros repartidos en 3 depósitos con 2000, 5000 y 10000 euros,
respectivamente. Si el primero le rinde un 5% anual, el segundo un 4% anual y el tercero un 2%
anual, ¿cuál es el tipo de interés medio que recibe?
intervalo frecuencia
0-10 1
10-20 2
20-30 4
30-40 3
49 RVR-2007
xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
Ejercicio 5. Calcular los cuartiles 1, 2 y 3 y percentil 25, percentil 50 y percentil 75 de las siguientes
cantidades en metros: 3, 3, 4, 4, 5.
50 RVR-2007
90 120 99 97 89 94 87 79 90 83
97 78 81 125 98 98 90 85 94 98
98 72 90 110 103 102 97 85 92 97
115 76 118 124 110 100 108 110 108 105
110 101 106 103 106 115 101 102 100 110
a) construya la tabla de frecuencias, b) grafique el histograma, polígono de frecuencias
c) interprete los datos en la tabla d) determine la media aritmética
e) determine la mediana f) determine la moda
Ejercicio 10. Los siguientes datos corresponden a las lecturas de la presión sanguínea sistólica que
se hicieron a 58 adultos que presentaron un examen físico:
104 112 139 118 132 132 112 106 126 126 118 117 116 113 122 123 116 114 117 106 124 115 118
123 105 120 121 120 102 138 106 113 114 122 108 122 112 112 123 116 124 111 111 114 123 107
120 120 124 122 131
a) Construir tabla de frecuencias con 8 clases.
b) Que porcentaje de personas tiene una presión mayor a 117.
c) Ordene los datos en un histograma y ojiva de frecuencias.
d) Estime las medidas de tendencia central aprendidas.
Ejercicio 12. Las edades, en años, de los asistentes a cierto curso fueron 30, 28, 31, 29, 30, 33, 31,
19, 31.
a) ¿Cual es la edad media de los asistentes? ¿Es representativa esta medida para los datos
anteriores? En caso negativo, proponer una medida de centralización más adecuada.
Ejercicio 13 Dada la siguiente tabla de frecuencias calcular cuartiles, moda, media, mediana
xi ni
12 1
13 1
14 2
15 3
16 2
17 1
51 RVR-2007
b) Representar el diagrama de frecuencias relativas acumuladas.
c) ¿Cuál es la moda?, ¿Cuál es la mediana?
Ejercicio 15. Se ha realizado un estudio de las rentas de alquiler de 390 viviendas (donde la renta
viene dada en miles de pesetas), en una población de tamaño medio, obteniéndose
Ejercicio 17 En un barrio de una gran ciudad se ha constatado que las familias residentes se han
distribuido, según su composición, de la siguiente forma:
Composición 0–2 2–4 4-6 6-8 8-10
Familias 110 200 90 75 25
acciones accionistas
0-50 23
50-100 72
100-150 62
52 RVR-2007
150-200 48
200-250 19
250-300 8
300-350 14
350-400 7
400-500 7
Ejercicio 19 La siguiente tabla muestra los precios por persona y noche en hoteles y pensiones del
área metropolitana de una ciudad española en pts:
6500 3800 5450 2795 2500 3200 8400 4700 4500 3295 7000 3700 6400 2600 4000 4500 3400
4700 6100 6600 4300 4600 6200 5600 4700 5200 2800 2800 2600 3200 9400 4000 5700 3600
3000 5400 6000 2395 2395 2395 2395 2525 5000 6500 3495 6000 3200 3200 2600 2500 3300
10000
a) Realizar el diagrama de árbol y hojas (stem-and-leaf ) de los datos anteriores (con profundidad),
en cientos de pesetas (despreciando decimales).
b) Calcular la distribución de frecuencias (agrupando de forma oportuna) de los precios.
c) Dibujar el histograma de frecuencias absolutas y absolutas acumuladas y sus polígonos
asociados.
d) Dibujar el histograma de frecuencias relativas y relativas acumuladas y sus polígonos asociados.
e) Dibujar el diagrama de caja asociado a los datos.
f) Dibujar el diagrama de tarta de los precios.
g) Comentar todos los gráficos.
h) Calcular las medidas de tendencia central
53 RVR-2007
54 RVR-2007
CAPITULO IV. MEDIDAS DE DISPERSIÓN Y DE FORMA
Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la
variable a un cierto valor central, o que permiten identificar la concentración de los datos en un
cierto sector del recorrido de la variable.
Es fácil de calcular y sus unidades son las mismas que las de la variable.
No utiliza todas las observaciones (sólo dos de ellas);
Se puede ver muy afectada por alguna observación extrema;
El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso
nunca disminuye.
Solución.
55 RVR-2007
Lo calculamos como la diferencia entre el tercero y el primero de los cuartiles.
RIQ = q3 - q1, el intervalo [q1,q3] contiene al 50% central de los valores muestrales.
Solución.
Datos 47 52 52 57 63 64 69 71 72 72 78 81 81 86 91,
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Calculamos q1 y q3
Es la media aritmética de todas las diferencias absolutas entre cada observación individual y la
media aritmética del conjunto de datos.
Población
: media de la población ni: frecuencia de clase i
N: total de observaciones xi: punto medio de clase i
Muestra
Solución.
56 RVR-2007
4.1.4 VARIANZA (s2)
Es la media aritmética del cuadrado de las desviaciones de cada uno de los valores respecto a la
media.
Población
Muestra
K: número de intervalos
Ambas son sensibles a la variación de cada una de las puntuaciones, es decir, si una
puntuación cambia, cambia con ella la varianza. La razón es que si miramos su definición, la
varianza es función de cada una de las puntuaciones.
se encuentra, al menos, el 75% de las observaciones. Incluso si tenemos muchos datos y estos
provienen de una distribución normal, podremos llegar al 95 %.
57 RVR-2007
No es recomendable el uso de ellas, cuando tampoco lo sea el de la media como medida de
tendencia central.
Ejemplo 4 Calcular el rango, varianza y desviación típica de las siguientes cantidades medidas en
metros:
3, 3, 4, 4, 5
Solución:
Rango R = 5−3 = 2.
Varianza
O también
Desviación estándar
Sea x el número de habitaciones que tienen los 8 pisos que forman un bloque de vecinos
xi 2 3 5 6
ni 2 2 1 3
Solución.
Xi ni xini xi2ni
2 2 4 8
3 2 6 18
Me
58 dia RVR-2007
5 1 5 25
6 3 18 108
8 33 159
Varianza
Desviación típica
Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o
que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida
de variabilidad que no dependa de las unidades o del tamaño de los datos.
Población
Muestra
Entonces de variabilidad
Sólo se debe calcular para variables con todos los valores positivos. Todo índice de
variabilidad es esencialmente no negativo. Las observaciones pueden ser positivas o nulas, pero
su variabilidad debe ser siempre positiva. De ahí que sólo debemos trabajar con variables
positivas, para la que tenemos con seguridad que
No es invariante ante cambios de origen. Es decir, si a los resultados de una medida le
sumamos una cantidad positiva, b > 0, para tener Y = X + b, entonces CVY < CVX.
Es invariante a cambios de escala. Así por ejemplo el coeficiente de variación de una
variable medida en metros es una cantidad adimensional que no cambia si la medición se realiza
en centímetros.
59 RVR-2007
4.2 MEDIDAS DE FORMA
La forma de una distribución de frecuencias se puede describir por su simetría o falta de ella
(asimetría) y por su agudeza (curtosis).
4.2.1 ASIMETRÍA
Otro rasgo interesante en una distribución de frecuencias es si los datos aparecen ubicados
simétricamente o no respecto de la media. Si queremos cuantificar la simetría, es necesario
conservar la información acerca tanto del signo como de la distancia de cada dato a la media (centro
de simetría).
Los valores positivos, indicarán distribuciones con mayor sesgo a la derecha y los valores negativos
indicarán un mayor sesgo a la izquierda.
Población
Coeficiente de Pearson
Coeficiente de Fisher
Muestra
Coeficiente de Pearson
Fishe Pearson
r
Simetría f=0 Sk = 0
Sesgo negativo f < 0 Sk < 0
Sesgo positivo f > 0 Sk > 0
60 RVR-2007
Curva sesgada a la izquierda o Curva simétrica f = 0, Sk = 0 Curva sesgada a la derecha o
sesgo negativo f < 0; Sk < 0 sesgo positivo f > 0; Sk > 0
4.2.2 CURTOSIS
Miden la mayor o menos concentración de datos alrededor de la media. Se suele medir con el
coeficiente de curtosis, que describe lo picuda o plana que es la distribución, es decir si los datos se
concentran demasiado o no, comparados con un modelo de distribución llamado distribución
normal.
(x i )4
Población k i 1
N 4
Muestra
61 RVR-2007
Ejercicio 1 El número de días necesarios por 10 equipos de psicólogos para terminar 10 trabajos de
consultoría de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular
la media, mediana, moda, varianza, desviación típica, rango, coeficiente de variación, asimetría y
curtosis.
Solución
La media: suma de todos los valores de una variable dividida entre el número total de datos de los
que se dispone:
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad
por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos
valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos
valores nos dará a su vez 60, que es el valor de la mediana.
La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la
media aritmética de la distribución.
días2
días
R = 80 - 15 = 65 días
Utilizando Minitab
Ingresamos los datos el la columna Días luego hacemos clic en Stat/Basic Statistics/Display
Descriptive Statistics…/active las opciones Mean, Standard deviation, etc, como se muestra en la
figura. Y finalmente haga clic en Ok/Ok.
62 RVR-2007
Los resultados son los siguientes:
Solución.
Tenemos:
Xmin 1
Xmax 12
Q1 2
Q2 5
Q3 9.25
La caja representa el 50% central de las observaciones, de manera que una caja pequeña indica
poca variabilidad entre el 50% central de las observaciones, mientras que una caja grande
representa alta variabilidad en el 50% de las observaciones centrales. Al "tamaño de la caja" se le
denomina "Amplitud del Intercuartil", y se calcula de la siguiente manera:
RIQ = Q3 - Q1 = 9.25 - 2 = 7.25
63 RVR-2007
Utilizando Minitab
Intervalos ni
7 -- 9 4
9 -- 11 18
11 -- 12 14
12 -- 13 27
13 -- 14 42
14 -- 15 31
15 -- 17 20
17 -- 19 1
Solución:
64 RVR-2007
En primer lugar realizamos los cálculos necesarios a partir de la tabla de frecuencias:
Intervalos ni xi Ni xi ni xi2 ni
7 -- 9 4 8 4 32 256
9 -- 11 18 10 22 180 1.800
11 -- 12 14 11.5 36 161 1851.5
12 -- 13 27 12.5 63 337.5 4218.75
13 -- 14 42 13.5 105 567 7654.5
14 -- 15 31 14.5 136 449.5 6.517.75
15 -- 17 20 16 156 320 5120
17 -- 19 1 18 157 18 324
157 2065 27742.5
La media es años.
Desviación estándar
años
de variabilidad
Rango intercuartílico.
Lo que nos dice que aproximadamente en un rango de 2.29 años se encuentra el 50% central del
total de observaciones
Asimetría.
65 RVR-2007
Intervalos ni xi
7 -- 9 4 8 -546,3635
9 -- 11 18 10 -562,60575
11 -- 12 14 11.5 -62,88975
12 -- 13 27 12.5 -7,414875
13 -- 14 42 13.5 1,80075
14 -- 15 31 14.5 76,271625
15 -- 17 20 16 462,9825
17 -- 19 1 18 114,084125
157 -524,134875
Curtosis
Intervalos ni xi
7–9 4 8 2813,77203
9 – 11 18 10 1772,20811
11 -- 12 14 11.5 103,768088
12 -- 13 27 12.5 4,81966875
13 -- 14 42 13.5 0,6302625
14 -- 15 31 14.5 102,966694
15 -- 17 20 16 1319,50013
17 -- 19 1 18 553,308006
157 6670,97298
Utilice minitab para determinar las medidas de tendencia central, medidas de dispersión, medidas
de asimetría y medidas de curtosis
Solución.
Ingrese los datos como en la figura y haga clic en Stat/Basic Statistics/Graphical Summary…
66 RVR-2007
Resultados
Interpretación.
67 RVR-2007
Ejercicio 2. Según los datos de una encuesta realizada entre estudiantes de cierta universidad, la
estatura media de dichos estudiantes es de 167,67 cm. con una desviación de 8,49 cm. y el peso
medio es de 61,61 kg. Con una desviación de 11,27 kg. ¿Cual de las 2 variables presenta mayor
dispersión en torno a su media?
Ejercicio 3 Según los datos de una encuesta realizada entre estudiantes de cierta universidad, el
numero medio de horas que ven la tv. En cierto fin de semana fue de 3,64 con una desviación de
3,35, mientras que el número medio de horas de estudio en el mismo fin de semana fue de 16,68
con una desviación de 5,70. ¿En que variable representa mejor la media a toda la población?
Ejercicio 4 Un restaurante ofrece los sábados y los domingos un menú del día 7.5 soles, uno
especial a 10 soles y uno ejecutivo a 12 soles. Cierto fin de semana obtuvieron una recaudación de
112.5 soles por menús del día, 120 soles por menús especiales y 84 soles por menús ejecutivos.
¿Cuanto pago en media cada cliente de menú ese fin de semana?, ¿con que dispersión? Interpreta
los resultados.
Ejercicio 5 En cierto distrito de un país, se entrevistó a un cierto número de mujeres casadas nacidas
entre los años 1935 y 1944 y se les pregunto a qué edad contrajeron matrimonio. En la tabla se
muestran los datos correspondientes a 50 de estas mujeres.
15 17 25 15 16 11 15 13 12 10 15 14 16 14 17 13 14
20 29 19 16 18 10 18 12 11 20 34 13 22 19 14 17 16
16 15 12 24 25 9 21 15 13 23 24 10 10 16 14 18
Construya el diagrama de caja, determine las medidas estadísticas estudiadas.
68 RVR-2007
[29.5; 40.5) 50
Ejercicio 10 ¿Son diferentes los resultados de los dos ejercicios anteriores, por qué?
Ejercicio 11 Una editorial tiene 4000 títulos en catálogo. Podemos clasificar los distintos libros en
novelas, biografías y otros tipos de libros de venta más preferente en librerías. De los siguientes
datos de número de copias vendidas, estimar las ventas medias por título.
Intervalo de Frecuencia
Unidades vendidas
0 - 999 500
1000 - 4999 800
5000 - 24999 700
25000 - 49999 1500
50000 o más 500
Ejercicio 12 Con los datos del ejercicio anterior. Si el título de mayores ventas vendió 1000000 de
copias en el año en que se recogieron los datos ¿cuál es la desviación estándar estimada para las
ventas por título?
Ejercicio 13 A 50 aspirantes a un determinado puesto de trabajo se les sometió a una prueba. Las
puntuaciones obtenidas fueron:
4 4 2 10 1 9 5 3 4 5 6 6 7 6 8 7 6 8 7 6 5 4 4 4 5 6 6 7 5 6 6 7 5 6 6 7 5 6 4 3 2 6 6 7 7 8 8 9 8 7
Se pide:
a) Descripción numérica y representación gráfica.
b) Media aritmética, mediana, moda, Coeficiente de variación, rango intercuartil.
Ejercicio 15. Agrupando los datos del ejercicio anterior en intervalos de amplitud 10 cm., se pide:
a) Descripción numérica y representación gráfica.
b) Media aritmética, mediana, moda, coeficiente de Fisher.
c) Analizar los cálculos hechos y los errores de agregación comparándolos con el ejercicio anterior.
Ejercicio 16 Las tres factorías de una industria han producido en el último año el siguiente número
de motocicletas por trimestre:
69 RVR-2007
3o. 850 1250 1050
trimestre
4o. 400 800 650
trimestre
Obtener:
a) Producción media trimestral de cada factoría y de toda la industria.
b) Producción media diaria de cada factoría y de toda la industria teniendo en cuenta que durante el
primer trimestre hubieron 68 días laborables, el segundo, 78, el tercero, 54 y el cuarto, 74.
c) determine el coeficiente de curtosis
Ejercicio 17 Una empresa ha pagado por un cierto articulo: 225, 250, 300 y 200 Pts. de precio.
Determinar el precio medio en las siguientes hipótesis y el coeficiente de variación:
a) Compraba por valor de 38250, 47500, 49500 y 42000 Pts... respectivamente.
b) Compraba cada vez un mismo importe global.
c) Compraba 174, 186, 192 y 214 unidades respectivamente.
Ejercicio 18 Sobre una muestra de 56 tiendas distintas, se obtuvieron los siguientes precios de
venta de un determinado artículo:
3260 3510 3410 3180 3300 3540 3320 3450 3840 3760 3340 3260 3720 3430 3320 3460 3600
3700 3670 3610 3910 3610 3610 3620 3150 3520 3430 3330 3370 3620 3750 3220 3400 3520
3360 3300 3340 3410 3600 3320 3670 3420 3320 3290 3550 3750 3710 3530 3500 3290 3410
3100 3860 3560 3440 3620
Se pide:
a) Agrupar la información en seis intervalos de igual amplitud y hacer la representación gráfica
correspondiente
b) Media aritmética y desviación típica
c) Desviación media respecto de la media aritmética y la mediana.
Ejercicio 19 La siguiente distribución corresponde al capital pagado por las 420 empresas de la
construcción con domicilio fiscal en una región determinada:
a) Haciendo servir como marcas de clase del primer y ultimo intervalo 4 y 165 respectivamente,
encontrar la media aritmética y la desviación típica
b) Calcular la moda y la mediana
c) Estudiar gráficamente su simetría
Ejercicio 20 La siguiente tabla muestra la distribución de les cargas máximas que soportan los hilos
producidos en una cierta fábrica:
70 RVR-2007
Carga máxima(TM) Número de hilos
9.25-9.75 2
9.75-10.25 5
10.25-10.75 12
10.75-11.25 17
11.25-11.75 14
11.75-12.25 6
12.25-12.75 3
12.75-13.25 1
Encontrar la media y la varianza. Dar un intervalo donde estén al menos el 90% de los datos.
Ejercicio 22 Consideremos la siguiente variable discreta que nos da el número de veces que la gente
se examina para aprobar el examen de conducir. Los resultados, dada una muestra de 30 aspirantes,
son:
4, 3, 1, 1, 1, 1, 2, 2, 2, 3, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 2, 3, 1, 3, 3, 3, 2, 1, 4, 1,
Encontrar , s2, los coeficientes k, f
Ejercicio 23 Para evaluar la viabilidad de un proyecto de reforestación de una zona sometida a una
fuerte actividad turística, se analiza la composición en mg por cm 3 de desechos orgánicos del
territorio.
Los datos que se obtienen son:
10.87 9.01 22.50 12.35 17.39 31.05 17.19 16.74 20.33 19.32 23.18 25.15 15.49 20.30 2.38 13.55
9.33 22.72 10.96 25.90 27.66 9.74 18.65 9.31 24.60 17.41 24.86 15.34 23.34 22.81 17.86 30.72
32.60 8.96 32.71 15.86 16.71 5.48 8.25 20.57 4.57 2.30 32.56 7.92 4.84 4.57 26.45 23.58
19.27 9.79 3.03 19.40 23.92 22.45 22.05 21.18 18.85 8.38 15.01 18.12 4.24 3.39 7.17 22.71
22.44 15.89 24.20 24.75 28.08 19.73 13.22 17.69 5.53 11.42 5.58 3.15 14.06 5.83 19.42
21.13 18.32 23.31 11.89 23.95 19.30 12.22 21.45 9.84 4.78 38.63 12.65 13.89 23.82 16.91
28.09 15.73 12.53 16.52 9.48 4.08
Ejercicio 24. Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del
agua para consumo en términos de colonias de bacterias tróficas en un acuífero próximo a la ciudad.
Se consideran dos zonas diferentes del acuífero y se obtienen los siguientes resultados (numero de
colonias por 1000 mm de agua):
71 RVR-2007
Realizar un estudio comparativo de la calidad del agua en ambas zonas, utilizando resúmenes
numéricos y diagramas de cajas. ¿Se puede considerar que ambas zonas son similares?
Ejercicio 25. Se tienen dos métodos, A y B, para determinar el calor latente de fusión del hielo. La
siguiente tabla da los resultados obtenidos (en calorías por gramo de masa para pasar de -
0.72ºC a 0ºC) utilizando ambos métodos independientemente:
Método A 79.98 80.04 80.02 80.04 80.03 80.03 80.04 79.97 80.05 80.03 80.02 80.00 80.02
Método B 80.02 79.94 79.98 79.97 79.97 80.03 79.95 79.97
Ejercicio 26. En 1978, H. Cavendish realizó una serie de 29 experimentos con objeto de medir la
densidad de la tierra. Sus resultados, tomando como unidad la densidad del agua, fueron:
5.50 5.61 4.88 5.07 5.26 5.55 5.36 5.29 5.58 5.65 5.57 5.53 5.62 5.29 5.44 5.34 5.79
5.10 5.27 5.39 5.42 5.47 5.63 5.34 5.46 5.30 5.75 5.68 5.85
a) Representa los datos por medio de un diagrama de tallos y hojas.
b) Representa los datos por medio de un diagrama de caja y bigotes.
c) Halla la media y la desviación típica.
d) ¿Es la distribución aproximadamente normal?
x 0 10 20 30 40
n 2 4 7 5 2
Ejercicio 28. Las ayudas concedidas, en millones de pesetas, por el Fondo Europeo para el
Desarrollo Regional (FEDER) a 62 proyectos españoles vienen reflejadas en la siguiente tabla:
72 RVR-2007