Está en la página 1de 75

Introducción a la

Estadística Descriptiva

(Para ser usado por alumnos y docentes de la Educación Media)

AUTORES
M.Sc. Francisco E Rodríguez Meneses
Lic. Emma García Enis
Dra. Marta Álvarez Pérez
M.Sc. Aurelio Quintana Valdés

Primera Versión digital


La Habana, 2007
ÍNDICE

Contenido Pág.
INTRODUCCIÓN 3

1. LA IMPORTANCIA DEL TRABAJO CON DATOS PARA LA SOCIEDAD. ESTADÍSTICA 4


INFERENCIAL Y ESTADÍSTICA DESCRIPTIVA

2. VARIABLES ESTADÍSTICAS. ESCALAS DE MEDICIÓN DE LA VARIABLE 8

2.1) Variables estadísticas 8

2.2) Escalas de medición de la variable 10

3. REPRESENTACIÓN DE DATOS SIMPLES MEDIANTE TABLAS Y GRÁFICOS 14

3.1) Distribución de frecuencias 14

3.2) Gráficos de barras 17

3.3) Pictogramas 20

3.4) Gráficos circulares 21

4. REPRESENTACIÓN DE DATOS AGRUPADOS MEDIANTE TABLAS Y GRÁFICOS 25

4.1) Representación de datos agrupados mediante tablas 25

4.2) Histogramas de frecuencias 31

4.3) Polígonos de frecuencias 32

5. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS SIMPLES 35

5.1) Media aritmética 36

5.2) Media aritmética ponderada 36

5.3) Mediana 38

5.4) Modas 39

6. MEDIDAS DE DISPERSIÓN PARA DATOS SIMPLES 40

6.1) Recorrido, amplitud o rango 42

6.2) Desviación media 42

6.3) Variancia 43

6.4) Desviación típica o estándar 45

6.5) Coeficiente de variación de Pearson 45

7. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS 46

1
7.1) Media aritmética 46

7.2) Mediana 48

7.3) Modas 50

8. EJERCICIOS PARA LA PRÁCTICA Y EL REPASO 53

9. RESPUESTAS DE LOS EJERCICIOS PROPUESTOS PARA LA PRÁCTICA Y EL REPASO 65

10. APÉNDICE: Uso del Signo de sumatoria. 72

11. BIBLIOGRAFÍA 73

2
INTRODUCCIÓN

La Estadística, en su forma más simple, tuvo sus orígenes en las civilizaciones


antiguas. Se tiene conocimiento de hallazgos que expresan cantidad de personas,
animales y cosas, a través de representaciones en rocas, pieles, maderas, paredes de
cuevas y otros medios. Alrededor del año 3000 (a.n.e), los babilonios usaban pequeñas
tablillas de arcilla donde recopilaban datos relacionados con la producción agrícola, las
ventas, cambios o trueques propios de la época.

Por su parte, los egipcios del siglo XXXI (a.n.e) – anterior a la construcción de las
pirámides– representaron datos sobre la población y los índices de renta en el país.
Antes del año 2000 (a.n.e), los chinos realizaron estudios sobre la población y las
posibilidades materiales de sus habitantes. En tanto, los griegos –con el propósito de
cobrar los impuestos– llevaron a cabo un censo de población cuyos resultados fueron
utilizados hasta los alrededores del año 594 (a.n.e) y el gran imperio romano fue el
primero que con un interés gubernamental, recopiló numerosos datos sobre población,
superficies y rentas en todos los territorios bajo su control.

En la Europa de la Edad Media se realizaron, bajo la orientación de diferentes reinados,


censos exhaustivos de población, estudios sobre las propiedades de la Iglesia e
innumerables recopilaciones de datos con fines económicos, sociales y militares. Y es
en las proximidades del año 1086, después de la conquista de Inglaterra por los
normandos, que en este país se realizó un censo cuyos resultados fueron publicados.

En Inglaterra, un pequeño comerciante llamado John Graunt (1620-1674), comenzó a


estudiar – probablemente motivado por la curiosidad – los registros de fallecimientos.
Así descubrió que el porcentaje de muertes por accidentes, suicidios y enfermedades
era aproximadamente el mismo en las localidades estudiadas, variando muy poco de un
año para otro.

Muchos fueron los continuadores de Graunt y es en la segunda mitad del siglo XIX en
que se produjo el desarrollo matemático de la Estadística. Francis Galton (1822-1911) y
Karl Pearson (1857-1936) fueron dos matemáticos que contribuyeron mucho a su

3
evolución. Las técnicas estadísticas comenzaron a tener marcada importancia en la
Astronomía y en la teoría de los Gases. Es por eso que las Ciencias Sociales y la
Físicas aceleraron la creación y aplicación de los métodos estadísticos.

El desarrollo de la Estadística está muy ligado a la Teoría de Probabilidades, y fue la


tentativa de crear una teoría sobre los juegos de azar (Cardano, Huygens, Pascal,
Fermat y otros matemáticos de los siglos XVI – XVII), la que dio origen a los conceptos
fundamentales de ambas ramas de la Matemática. La Teoría de las Probabilidades y la
Estadística están ligadas a los nombres de Jacobo Bernoullí, Abraham de Moivre,
Laplace, Gauss, Poisson, etc. En el período de mayor esplendor encontramos a
destacados matemáticos como P. L. Chevishev (1821 – 1894) y sus alumnos A.
Markov (1856 – 1822) y A. M. Liapunov (1857 – 1918) y posteriormente a A. N.
Kolmogorov, entre otros.

En la actualidad la Estadística está muy difundida, su uso es inevitable y se manifiesta


en la recopilación, procesamiento y análisis de la información relacionada con datos
económicos, políticos, sociales, biológicos, psicológicos, físicos, químicos, etc. El
desarrollo de la Informática y las posibilidades crecientes de comunicación beneficia
sustancialmente la aplicación de la Estadística en todas las esferas de la vida.

En nuestros tiempos es relativamente fácil acceder a múltiples datos de alcance local,


nacional o mundial, relacionados con los temas que trabajamos cotidianamente o en
cualquier gestión investigativa que estemos abordando, a la vez que se dispone de
eficaces sistemas, tabuladores electrónicos y asistentes matemáticos para el
procesamiento estadístico. Todo esto significa que la preparación del hombre en el uso
de la Estadística y de las nuevas tecnologías es el principal reto de hoy, al cual no
podemos renunciar.

1. LA IMPORTANCIA DEL TRABAJO CON DATOS PARA LA SOCIEDAD.


ESTADÍSTICA INFERENCIAL Y ESTADÍSTICA DESCRIPTIVA.

Los que habitamos la sociedad de hoy no podemos actuar como en los tiempos de los
babilonios hace más de 5000 años. En la actualidad es necesario realizar estudios
profundos sobre todos los procesos que garantizan la vida en el planeta, los que dan
continuidad al desarrollo y preservación de las diferentes especies de animales y

4
plantas que lo habitan y al mismo tiempo salvar y enriquecer el patrimonio que el propio
hombre ha construido.

Muchos ejemplos pueden ilustrar con absoluta claridad la importancia que tiene el
conocimiento, la recopilación, el procesamiento y el análisis de los datos que describen
determinados eventos:

Hacer un pronóstico y tomar decisiones sobre las temperaturas, las lluvias, los períodos
de sequías, la erosión y la degradación de los suelos o cualquier fenómeno atmosférico
o climatológico, implica – sin lugar a dudas – el estudio profundo y continuado de los
resultados históricos, físicos, químicos, biológicos que han influido y que resultan de
interés para los especialistas.

Las investigaciones biomédicas reclaman cada vez más de la fiabilidad de la


información que permita aplicar o medir la eficacia de un medicamento sin riesgo para
los pacientes. La necesidad de poner en práctica un tratamiento médico, diagnosticar
enfermedades (en los humanos, animales o plantas) o suministrar una vacuna, no
admite otra cosa que no sea un estudio profundo del volumen de datos necesarios
obtenidos a través de rigurosos procesos de investigación.

Lo planteado en el párrafo anterior, se evidencia en múltiples ejemplos en el desarrollo


de las ciencias médicas en nuestro país, uno de ellos pudiera ser el estudio genético
que se realizó recientemente de los segmentos de la población afectados por ciertas
enfermedades como la Ataxia1, para tomar medidas en aquellas zonas del país donde
esta enfermedad genética es más frecuente.

Al concebir un programa radial o televisivo, al publicar un artículo, abrir una sección en


un periódico, elaborar un guión para una novela – por citar algunos ejemplos – es
importante pensar en cómo elevar los niveles de aceptación; para ello es necesario
tener en cuenta los intereses, necesidades y preferencias más representativas del
público al cual van dirigidos.

1
Ataxia, alteración, parcial o total, de la coordinación muscular. Puede manifestarse como temblor
involuntario de partes del cuerpo durante la realización de movimientos voluntarios (típicamente en las manos),
como dificultad para realizar movimientos precisos, o como dificultad para mantener el equilibrio de la postura
corporal.

5
Para el diseño y producción de artículos de vestir es muy bueno considerar el estudio
de índices tan cambiantes como la preferencia, las necesidades de uso, la moda
predominante, la época del año en que saldrá al mercado; no solo para obtener
mayores resultados económicos, sino también, para lograr un impacto social positivo.

Estamos convencidos que poco se puede hacer en el desarrollo de las ciencias si no se


toma en cuenta, con máxima prioridad, la experiencia acumulada por los hombres hasta
nuestros días. El avance de los procesos tecnológicos, el perfeccionamiento de la vida
social o el propósito de elevar los índices económicos, reclaman el desarrollo de las
investigaciones científicas y por tanto la aplicación de los métodos estadísticos.

Sin el empleo de la Estadística, tampoco se conocería el comportamiento de


indicadores del desarrollo económico-social a nivel local, nacional, regional y global; sin
los cual, no se pudiera trabajar en función de mejorar la dirección de diferentes
procesos.

La ESTADÍSTICA es una rama de la Matemática Aplicada; es la ciencia que


proporciona los métodos para obtener, organizar, clasificar, procesar, resumir, presentar
y analizar datos relativos a un conjunto de individuos u observaciones. A través de la
realización de estudios estadísticos es posible resolver problemas como el diseño de
experimentos y la toma de decisiones.

Al estudiar – por ejemplo – el crecimiento de determinado tipo de peces, la acción de un


fertilizante en las plantaciones de arroz o la calidad de las piezas producidas por una
fábrica durante un año de trabajo, es prácticamente imposible observar todo el grupo;
entonces es necesario seleccionar una parte de este que permita realizar
generalizaciones al grupo completo, tal es el objeto de la ESTADÍSTICA
INFERENCIAL, es decir, el estudio de una población a partir de una muestra
seleccionada de ella.

Otro ejemplo que puede ilustrar con claridad el objeto de la Estadística Inferencial es el
siguiente:

Cuando asistimos a un cuerpo de guardia con fiebre, generalmente el médico indica un


LEUCOGRAMA. Esta prueba permite determinar la concentración de leucocitos o
glóbulos blancos en la sangre. Un aumento de la proporción de estos en el organismo
humano indica la posible presencia de un agente infeccioso. Para obtener esta

6
información necesaria se extrae una pequeña muestra de sangre y de esta forma se
puede inferir sobre la concentración de leucocitos en los 5 ó 6 litros, de este líquido
circulante, que posee el cuerpo humano.

Por otro lado, la parte de la Estadística que estudia una población a partir de considerar
todos los elementos que la integran, sin derivar conclusiones sobre un grupo mayor, se
denomina ESTADÍSTICA DESCRIPTIVA.

Las siguientes proposiciones corresponden a estudios realizados dentro de la


estadística descriptiva:

• En agosto hubo 56 personas que ingresaron por esa enfermedad en el hospital.

• La nota promedio del grupo en la asignatura Matemática es de 8.

• 12 bateadores de los que participaron en la Serie Nacional de Baseball se


mantuvieron sobre los 300 de average.

• Todos los estudiantes del grupo participaron en la limpieza del aula.

• La temperatura promedio en los meses de inviernos alcanzó este año los 16º C.

• Durante este año los índices de reforestación superaron en un 25% a los logrados el
pasado año.

Ejemplo 1

En una fábrica de helados se producen 10500 unidades diariamente, para efectuar un


control de calidad se analizan (seleccionadas de manera aleatoria, es decir, al azar) 100
unidades de la producción registrada en un día. El estudio consistió en, en primera
instancia, comprobar la masa del helado, la consistencia y la cantidad de unidades con
problemas en las etiquetas.

En este caso podemos identificar los siguientes valores estadísticos:

Población: La producción diaria. Tamaño de la población: 10500 unidades.

Muestra: Las unidades seleccionadas. Tamaño de la muestra: 100

Unidad estadística o individuos: Cada una de las unidades (helados).

Variables estadística que se estudian:

• Masa de cada helado.

7
• Consistencia del helado.

• Número de etiquetas con problemas.

2. VARIABLES ESTADÍSTICAS. ESCALAS DE MEDICIÓN DE LA VARIABLE.

2.1) Variables estadísticas

Las variables estadísticas son cada una de las características que se estudian en los
elementos (individuos) de una población. Estas son de diferentes tipos y toman valores
numéricos o no.

Tipos de variables

 Cualitativas

 Cuantitativas  discretas
 continuas

Variables cualitativas: Se refieren a características o atributos que expresan una


cualidad que no puede tomar valores numéricos.

En los ejemplos que se proponen a continuación se presentan las variables y, entre


paréntesis, los valores o categorías que estas pueden tomar.

Ejemplo 2: Son variables cualitativas las siguientes:

 El sexo de un grupo de personas (masculino-femenino).

 la preferencia por un determinado tipo de música (alto, mediano y bajo).

 Los colores de las flores (rojo, rosado. Amarillo, lila,…).

 La profesión de un grupo de personas (periodista, profesor, estomatólogo,


científico, investigador, etc.)

Variables cuantitativas: Se refieren a atributos que expresan una cantidad o cantidad


de magnitud y por tanto toma valores numéricos.

Ejemplo 3: Son variables cuantitativas las siguientes:

 La edad de una persona (5 años, 12 años, 20 años,…).

 Número de habitantes en determinada región o en un país (34150; 10345678;…).

8
 Tiempo de duración de un suceso o evento (2 minutos, 3 horas, 1,5 horas,…).

 Temperaturas registradas en una región (12o C, – 5o C, 0o C, 40o C, …)

Variable estadística discreta: Cuando solo pueden tomar un número finito o a lo sumo
numerable de valores, con los cuales es posible establecer una correspondencia
biunívoca con el conjunto de los números enteros o subconjuntos propios de éste.
Ejemplo 4: Son variables cuantitativas discretas las siguientes:

 Cantidad de alumnos de un grupo, de un grado o de una escuela (30; 218;


500;…).

 Cantidad de libros de de una biblioteca (10000; 345678; 2342098;…;).

 Número de viajes realizados por un ómnibus (0; 1; 3; 10;…;).

 Cantidad de vértices de un polígono de n-lados (3; 4; 5; 6;…; n).

Variable estadística continua: Cuando puede, teóricamente, tomar cualquier valor de


un intervalo real.

Ejemplo 5: Son variables cuantitativas continuas las siguientes:

 Estatura de un grupo de personas (todos los valores reales no negativos del


intervalo [0; xi], donde i es la persona que tiene la mayor estatura en el grupo).

 Cantidad de lluvia caída en una región en una época o un tiempo determinado.


(cualquier valor real no negativo).

 Volumen de agua en una presa en metros cúbicos (todos los valores reales no
negativos del intervalo)

 Tiempo que puede durar cualquier proceso. (cualquier valor real no negativo).

 Magnitud de un terremoto en la escala de Richter (valores reales mayores que


cero)

La escala de Richter se utiliza para evaluar y comparar la intensidad de los terremotos:


mide la energía de un temblor en su centro. La intensidad crece de forma exponencial
de un número al siguiente (un terremoto de 0 a 2,5 no es sentido pero es registrado por
los sismógrafos). De esta forma, un temblor de magnitud 7 es diez veces más fuerte
que uno de magnitud 6, cien veces más que otro de magnitud 5, mil veces más que uno
de magnitud 4 y así en casos análogos. En teoría, la escala de Richter no tiene cota
9
máxima, pero hasta 1979 se creía que el sismo más poderoso posible tendría magnitud
8,5. Sin embargo, desde entonces, los progresos en las técnicas de medidas sísmicas
han permitido a los sismólogos redefinir la escala; hoy se considera 9,5 el límite
práctico.

Ahora, retomando el ejemplo 1 podemos identificar las variables que se estudian, el tipo
y las categorías medibles o valores que puede tomar en cada caso.

Categorías o valores que puede tomar la


Variable Tipo de variable
variable.
Masa Cuantitativa – continua Cualquier número real no negativo
Consistencia Cualitativa Alta, mediana, baja
Etiquetas
Cuantitativa – discreta Cualquier número natural de 0 al 100.
defectuosas

Tabla 1

2.2) Escalas de medición de la variable

Para aplicar los métodos de la Estadística se necesita cuantificar las características,


propiedades o atributos de la variable que es objeto de estudio. Hasta las primeras
décadas del siglo XX muchos investigadores dudaban que se pudieran cuantificar las
propiedades de un fenómeno social, y se cometía el error de quererlo hacer como en
los fenómenos físicos, químicos, matemáticos, etc. En la actualidad se han logrado
avances en la medición de las propiedades de los fenómenos que se estudian, y dentro
de ellos los correspondientes a las ciencias sociales

Es posible diferenciar cuatro escalas de medición, y la aplicación de cualquiera de ellas


depende del tipo de atributo que se está midiendo, es decir: depende de las categorías
o valores que toma la variable que se quiere medir. Estas escalas son las siguientes:

 Nominal

 Ordinal

 De intervalos

 De razones

Escala nominal: La variable que se estudia se puede dividir en categorías o clases


mutuamente excluyentes y exhaustivas que cumplen las siguientes propiedades:

10
 La igualdad se obtiene entre elementos de una misma categoría o clase.

 La desigualdad se obtiene entre elementos de clases diferentes.

 No existe una relación de orden entre los elementos ni entre las clases.

 La variable no toma valores numéricos.

Se dice que las clases son excluyentes cuando un elemento o individuo cualquiera de
una de ellas no puede ser considerado en otra, y son exhaustivas, porque la unión de
todas las clases es igual a la población que se estudia.

Ejemplo 6: Clasificación de los 30 alumnos de un grupo de 10mo grado de acuerdo con


el sexo.

SEXO
NÚMERO DE Tabla 2
ALUMNOS
En este ejemplo dos elementos de la misma
MASCULINO 11
clase son iguales en virtud de la variable que
FEMENINO 19
se mide (el sexo) y diferentes a uno cualquiera
TOTAL 30
de la otra clase.

Escala ordinal: La variable que se mide se puede dividir en categorías o clases


mutuamente excluyentes y exhaustivas que cumplen las siguientes propiedades:

 La igualdad se obtiene entre elementos de una misma categoría o clase.

 La desigualdad se obtiene entre elementos de clases diferentes.

 Existe una relación de orden entre los elementos de dos clases diferentes.

 La variable no toma valores numéricos.

Ejemplo 7: Clasificación de los 30 alumnos de acuerdo con el rendimiento académico.

RENDIMIENTO NÚMERO DE Tabla 3


ACADÉMICO ALUMNOS
En muy importante notar que se establece
ALTO 15
una cierta ordenación entre los elementos
MEDIANO 12
de una clase y los de otra, de esta forma, el
BAJO 3
rendimiento académico de un alumno
incluido en la clase alto, por ejemplo, es superior a cualquiera que esté incluido en las
otras dos clases.

11
En las variables que se miden mediante una escala nominal u ordinal, la cuantificación
se realiza mediante el conteo de los elementos de cada clase, es decir, determinando la
frecuencia de la clase.

Escala de intervalos: La variable que se estudia se puede dividir en categorías o


clases mutuamente excluyentes y exhaustivas que cumplen las siguientes propiedades:

 Relación de orden bien definida internamente en cada una de las clases y entre
las clases.

 La distancia o diferencia entre las clases o categorías consecutivas es la misma.

 Existe una unidad de medida común para todas las categorías.

 El valor cero no es absoluto (no significa ausencia del atributo que se mide)

Ejemplo 8: Temperatura en grado Celsius, en una región templada, registrada en 10


mediciones, en la época que comenzaban descender.

8,3oC 6oC 5oC 2,3oC 0 oC – 2 oC – 2,5 oC – 7 oC – 7 oC – 10,1 oC

Tabla 4

Escala de razones o proporciones: La variable que se estudia se puede dividir en


categorías o clases mutuamente excluyentes y exhaustivas que cumplen las siguientes
propiedades:

 Relación de orden bien definida internamente en cada una de las clases y entre
las clases.

 La razón entre valores de la variable adquiere significado.

 Existe una unidad de medida común para todas las categorías.

 El valor cero es absoluto, indica la ausencia total del atributo que se mide.

Ejemplo 9: Cantidad de líquido que contienen dos recipientes A y B.

En este caso si el recipiente A contiene 10 L y el recipiente B, 30 L, entonces podemos


decir que el primero contiene un tercio de lo que contiene el segundo, es decir, se
X 1
puede establecer la siguiente proporción: = (donde X es la cantidad de líquido que
Y 3
contiene el recipiente A e Y , la del recipiente B). Por otro lado, cero litros significa la

12
ausencia total de líquido en el recipiente – esto quiere decir que el valor cero es
absoluto –. Luego, la variable capacidad en este ejemplo, se mide mediante una escala
de razones o proporciones.

Ejemplo 10: Un grupo de pacientes de un hospital se clasifica atendiendo a los


siguientes aspectos:

a) Tipo de enfermedad.

b) Grado en que se manifiesta la enfermedad.

c) La temperatura en grados Celsius.

d) Peso en kilogramos.

En este caso la escala de medición de la variable es:

a) Nominal b) Ordinal c) De intervalos d) De razones

ESCALAS NO MÉTRICAS: Nominal y Ordinal. Los números utilizados no se


acompañan de una unidad de medida y solo indican la clase o la categoría, como
puede ser: turno 1, turno 2, turno 3, aula 8, sala 10, etc.

ESCALAS MÉTRICAS: De intervalos y de razones. Están caracterizadas por una


unidad de medida común para todas las clases.

Ejemplo 11: La fábrica del ejemplo 1 cuenta con 85 trabajadores y se quiere realizar un
estudio basado en los siguientes índices:

a) Nivel cultural de los trabajadores.

b) Cantidad de ausencias de cada trabajador durante el año.

c) Tiempo, en horas, que invierte cada trabajador para llegar a la fábrica.

d) Turnos de trabajo.

e) Calidad de los helados fabricados en una jornada laboral.

f) Temperatura del lugar donde se almacenan las materias primas.

En este caso podemos confeccionar la siguiente tabla:

Escala de
Tipo de
Variable Valores de la variable medición de la
variable
variable

13
a) Nivel cultural de Primario, Medio básico, Medio Ordinal
Cualitativa
cada trabajador superior y Universitario

b) Cantidad de Cuantitativa
0; 1; 2; 3; 4; 5;… De razones
discreta
ausencias

c) Tiempo que invierte Cuantitativa 1; 0,5; 2; 0; 3; 4,23;… De razones


continua horas.
cada trabajador

d) Turnos de trabajo Cualitativa Turno A, Turno B, Turno C, ... Nominal

e) Calidad de los
Cualitativa Baja, media, alta Ordinal
helados.

f) Temperatura del Cuantitativa


Cualquier valor real intervalos
almacén continua

Tabla 5

3. REPRESENTACIÓN DE DATOS SIMPLES MEDIANTE TABLAS Y GRÁFICOS

3.1) Distribución de frecuencias

Cuando se conoce la cantidad de elementos correspondientes a cada valor de una


variable se tiene una distribución de frecuencias. Una forma cómoda de organizar los
datos en una distribución de frecuencias es mediante la confección de una tabla.

Ejemplo 12:

Al analizar los índices de la emulación por la sede del acto en conmemoración del
asalto al Cuartel Moncada el 26 de julio de 1953, una zona de los Comités de Defensa
de la Revolución (CDR) evaluó el cumplimiento de los compromisos de donaciones de
sangre mediante la siguiente información. En esta se muestra la cantidad de
donaciones de cada uno de las 22 organizaciones de bases de los CDR de la zona
durante el mes de enero:

4 7 12 18 12 7 17 17 12 2 4 Tabla 6

4 2 12 9 4 12 12 7 2 4 12

14
En este ejemplo podemos identificar los siguientes valores estadísticos:

Población: Todas las organizaciones de base de los CDR de la zona.

Tamaño de la población: N = 22

Individuos: cada una de las 22 organizaciones de base de los CDR de la zona.

Variable estadística: X = Cantidad de donaciones de sangre. (Cuantitativa discreta)

Valores de la variable: xi ∈{2; 4; 7; 9; 12; 17; 18}

Los datos anteriores, los cuales no han sido organizados reciben el nombre de datos
primarios. Estos valores pueden ponerse en orden (ascendente o descendente) para
facilitar su análisis y conteo. Un arreglo ordenado de estos datos primarios (que pudiera
contener un número mucho mayor de datos) es el siguiente:

2 2 2 4 4 4 4 4 7 7 7

9 12 12 12 12 12 12 12 17 17 18

Tabla 7

Ahora, aprovechando la existencia de valores repetidos se puede construir una tabla, la


cual consiste en asignar a cada categoría o valor distinto de la variable el número no
negativo Fi que indica las veces que se repite dicha categoría o valor. De esta manera
se puede resumir la información mediante una tabla de frecuencias como la siguiente:

xi CONTEO O Fi Fi se llama frecuencia absoluta


TARJADO
La frecuencia absoluta (Fi) de un dato es el número de
2 ///=3 3 veces que aparece el mismo en la población que se
estudia.
4 ////=5 5 En este ejemplo xi es el número de donaciones
7 /// =3 3
(valores de la variable X) y Fi es la cantidad de CDR
(número de veces que aparece el dato xi).
9 /=1 1

12 / / / / / / = 7 7

17 / / = 2 2

18 / = 1 1 Tabla 8

15
Con el objetivo de mejorar la descripción de los datos las tablas de frecuencias
contienen otras columnas, esto se ilustra en la que se presenta a continuación:

Fai fai

xi Fi fi fi fi(%) Fai ↓ Fai ↑ fai ↓ fai ↑

3
2 3 0,136 13,6 3 22 0,136 1,000
22

5
4 5 0,227 22,7 8 19 0,363 0,864
22

3
7 3 0,136 13,6 11 14 0,449 0,637
22

1
9 1 0,046 4,6 12 11 0,545 0,501
22

7
12 7 0,318 31,8 19 10 0,863 0,455
22

2
17 2 0,091 9,1 21 3 0,964 0,137
22

1
18 1 0,046 4,6 22 1 1,000 0,046
22

22
------- 22 =1 1 100 ----- ------ ------- ------
22

Tabla 9

F
Frecuencia relativa fi: es el cociente f i = i , entre la frecuencia absoluta y el tamaño
N
de la población que se estudia. Esta se puede expresar en fracciones simples, en
notación decimal y en forma porcentual como se muestra en las columnas 3, 4 y 5
respectivamente, en la tabla 9.

Es importante comprender que la suma de las frecuencias absolutas es igual a la


cantidad de datos, es decir, igual al tamaño de la población que se estudia (en este

16
caso N = 22).

La suma de las frecuencias relativas es la unidad cuando se expresa en fracciones


simples o en notación decimal y 100% cuando está expresada en porcentajes.

La frecuencia absoluta acumulada Fai (columnas 6 y 7) y a la frecuencia relativa

acumulada fai (columnas 8 y 9) se obtienen sumando de manera acumulativa los

valores de las frecuencias, esto se puede realizar acumulando de arriba hacia abajo o
viceversa, según sea el interés del estudio que se pretende realizar.

Ejemplo 13:

Responder las siguientes preguntas a través de la interpretación de la tabla 9.

1) ¿Qué tanto por ciento de los CDR lograron realizar 12 donaciones de sangre?

2) ¿Cuántos CDR estuvieron por encima de las 7 donaciones de sangre?

3) ¿Qué tanto por ciento de los CDR de la zona realizaron más de 9 donaciones de
sangre?

4) ¿Qué porcentaje de los CDR estuvo por debajo de las 12 donaciones de sangre?

Respuestas: 1) El 31,8% 2) 11 CDR 3) El 45,5% 4) El 54,5% de los CDR.

Las distribuciones de frecuencias se confeccionan con el propósito de condensar


grandes grupos de datos y mostrarlo de una manera fácil de asimilar, pero a veces, es
conveniente presentarlos gráficamente, es decir, de forma tal que permita una fácil e
inmediata captación visual. Los gráficos que se estudiarán son los pictogramas, de
barras, de sectores y los histogramas y poligonales, los cuales se construyen de
acuerdo al tipo de variable que se estudia y a los objetivos de la descripción que se
quiere realizar.

3.2) Gráficos de barra

Para construir una gráfica de barras, las diferentes categorías de la característica


medible se sitúan en el eje de las abscisas y se trazan barras perpendiculares, todas de
igual ancho, cuya altura sea igual al valor de la frecuencia absoluta. La disposición de
los ejes puede variar de acuerdo con la posición que se elija para las barras (vertical u

17
horizontal).

En el gráfico de la figura 1 se ilustra la cantidad de CDR (frecuencia absoluta) por cada


una de las 7 categorías que aparecieron en el estudio realizado. En este caso la
variable es la cantidad de donaciones de sangre la cual toma valores en el siguiente
conjunto {2; 4; 7; 9; 12; 17; 18}.

La cantidad de donaciones de sangre se ha cuantificado mediante una escala nominal,


es decir el número 12 por ejemplo, indica una categoría: Organizaciones de bases de
los CDR con 12 donaciones de sangre durante el mes, a la cual corresponde una
frecuencia absoluta de 7.

Es fácil visualizar que una de las barra es mayor que


todas, análogamente otra se diferencia de las demás por
ser la de menor altura, ¿Qué información nos brinda este
hecho?

Está claro que 12 es la cantidad de donaciones de


sangre que realizó el mayor número de organizaciones
Fig. Fig1
1
de base de los CDR en esta zona durante el mes, en
tanto 9 y 18 son las que corresponden al menor número de CDR.

Ejemplo 14

La siguiente tabla muestra los resultados de una encuesta realizada a los 980
estudiantes de un centro universitario, con el objetivo de conocer su opinión sobre la
transmisión televisiva de la Serie Nacional de Baseball en el horario de la telenovela.

Hombres Mujeres Total 572 408

A favor (F) 510 132 Tabla 1

En contra (C) 42 204

Indiferentes (I) 18 58

No respondieron (NR) 2 14

18
El gráfico de la Fig.2 permite, en cada una
de las categorías evaluadas, establecer
una comparación entre la opinión de los
hombres y la de las mujeres, para ello se
utilizaron dos barras unidas; la de la
izquierda corresponde a la cantidad de
hombres y, por supuesto, la de la derecha
al número de mujeres incluidas en cada
categoría. (xi) categorías Fig. 2

Para la construcción de grá-


ficos también se puede utilizar
el Generador de Gráficos de
la Enciclopedia Encarta, un
ejemplo de ellos se evidencia
en la figura 3, el cual muestra el
número de mujeres en cada
Fig. 3
unas de las categorías
estudiadas en la encuesta.

Para usar este sencillo asistente se deben realizar los siguientes pasos:

a) Escribir Generador de Gráficos en la opción BUSCAR de la página principal de la


Enciclopedia Encarta.

b) Elegir el tipo de gráfico que se quiere construir de acuerdo con las tres opciones que
brinda: gráfico de sectores, gráfico de barras y gráfico de líneas.

c) Describir con una etiqueta el contenido del gráfico (por ejemplo: cantidad de mujeres)

d) Elige el tipo de color a utilizar (Estándar, pastel, brillante o grises) y completar la tabla
con el nombre de los ítems (variables) y la frecuencia correspondiente.

e) Finalmente escribir el título del gráfico y los comentarios que se consideren


necesarios. Al ejecutar el botón SIGUIENTE se obtiene el gráfico, el cual permite las
opciones: copiar, imprimir, guardar, entre otras.

19
Nota: para ir de un paso a otro se usan las opciones Atrás y Siguiente de cada página.

3.3) Pictogramas

Otro tipo de gráfico muy utilizado es el pictograma que como su nombre lo indica
requiere de cierta creatividad y de arte. En el se sustituyen las barras por dibujos que
representan la frecuencia correspondiente a cada valor de la variable que se estudia.

Ejemplos de pictogramas:

Fig. 4

El pictograma corresponde a los datos


presentados en el ejemplo 12, cada gotita
de sangre representa 2 CDR, esto quiere
decir que 12 donaciones, por ejemplo, la
realizaron 2 + 2+ 2+1= 7 CDR.

Cuba es un ejemplo para el mundo por el


sistema de salud posee, y las donaciones
voluntarias de sangre es una práctica que los cubanos realizan con plena conciencia
del valor humano y la significación que esto representa.

Si se describen mediante un pictograma como este, las cantidades de donaciones de


sangre durante un año en Cuba, este símbolo pudiera significar miles de CDR.

Ejemplo 15
Acumulado máximo
La tabla 11 y la figura 5 muestran el mayor Año
(millones de m3)
acumulado de agua, en millones de metros
cúbicos, alcanzado por una presa durante el año 2000 900

(registrado durante cinco años).


2001 1000
Tabla 11
2002 700

2003 850

2004 500

20
En esta modalidad de pictograma (Fig. 5) se recibe información por dos vías diferentes;
por el tamaño de la gota de agua –algo que llama la atención a simple vista– y por el
cartel interior en cada una de ellas. (

Fig. 5

3.4) Gráficos circulares

Los gráficos circulares, de pastel o diagramas de sectores, como ya conoces, se


representan sobre un círculo. La superficie del círculo se reparte en proporción a las
frecuencias de los valores que toma la variable, esto significa, que es necesario conocer
el sector que corresponde a cada valor de la frecuencia. El círculo completo tiene 360O,
Fi αO
por lo que no hay más que establecer la proporción = para saber cuántos
N 360O
Fi ⋅ 360
grados corresponde a cada frecuencia. Ahora, despejando obtenemos α O = .
N
Otra vía es reconociendo que el 1% de 360O es 3,6O entonces el cálculo de αO se

reduce a una simple fórmula: αO = 3,6O ⋅ f i (%) donde f i (%) es la frecuencia relativa

expresada en porcentaje y αO es la amplitud del ángulo correspondiente a esta


frecuencia.

Los gráficos circulares son de mucha utilidad para representar distribuciones que tienen
pocos valores diferentes, pues, la comparación de los sectores de acuerdo a la
amplitud, ofrece una imagen visual fácil de comprender, y se gana en información
cuando además aparecen los valores de las frecuencias correspondientes.

Ejemplo 16

Los 40 peloteros preseleccionados para conformar el equipo de 25 que participará en


un campeonato, se ha podido agrupar en tres categorías de acuerdo a su formación
como atleta de este deporte. Las categorías son las siguientes:

21
A: Peloteros formados completamente en escuelas de deporte.

B: Peloteros formados parcialmente en escuelas de deportes.

C: Peloteros que no fueron formados en escuelas de deportes.

De acuerdo con estas categorías se pudo realizar la siguiente distribución:

xi Fi fi (%)

A 28 70

B 8 20

C 4 10

Tabla 12

Estos datos se pueden representar mediante un gráfico circular o de pastel como se


muestra en las figuras 6 y 7 respectivamente.

Fig. 6
Fig. 7

Ejemplo 17

La Resolución A/RES/60/L.9 "Necesidad de poner fin al bloqueo económico, comercial


y financiero impuesto por los Estados Unidos de América contra Cuba" (aprobada por
182 votos a favor, 4 en contra y 1 abstención, el 8 de noviembre de 2005), constituye
una victoria política para el pueblo cubano y para el mundo.

En la siguiente tabla se registran los 182 votos de los países distribuidos por regiones

22
geográficas que, desafiando al imperio, apoyaron la resolución presentada por Cuba.2

Regiones geográficas Votos a favor % en relación con el total de


votos

(A) África del Norte y Medio Oriente 16 8,79

(B) África Subsahariana 47 25,82

(C) Asia y Oceanía 33 18,13

(D) América Latina y El Caribe 31 17,03

(E) Europa Occidental y otros 28 15,38

(F) Europa Oriental 27 14,85

TOTAL 182 100

Tabla 13

Ahora, para mayor comprensión se construirá una tabla de frecuencia absoluta y


relativa porcentual en la cual se aumentará una columna para expresar los grados de
los sectores circulares correspondiente a cada valor de fi(%).

Xi Fi fi(%) αo
Cálculo de αo

A 16 8,79 32O 3,6o ⋅ 8,79 ≈ 32o

B 47 25,82 93O 3,6o ⋅ 25,82 ≈ 93o

C 33 18,13 65O 3,6o ⋅ 18,13 ≈ 65o

D 31 17,03 61O 3,6o ⋅ 17,03 ≈ 61o

2
Datos tomados del periódico juventud rebelde. 9-11-2005. p.5

23
E 28 15,38 55O 3,6o ⋅ 15,38 ≈ 55o

F 27 14,85 54O 3,6o ⋅ 14,85 ≈ 54o

TOTAL 182 100 360o -------------------------

Tabla 14

Ahora, usando regla y compás, el


generador de gráficos de la encarta o
una HEC, se puede construir un
gráfico circular como el de la figura 8.

En este gráfico es notable, a simple


vista, que el mayor número de votos a
favor corresponde a la región B (África
Subsahariana), en la cual, al igual que Fig. 8
en Europa Oriental, apoyaron la
resolución cubana el 100% de los países que la integran.

Los gráficos de sectores (circulares, de pastel, de


anillos, etc), al igual que los gráficos de barras, se
pueden realizar fácilmente utilizando una HEC del
Excel. Los gráficos circulares tienen una sola serie de
datos, luego es suficiente marcar los valores
correspondientes a las frecuencias (absolutas o
relativas), activar el asistente para gráficos en la barra Fig.9
de Estándar del Excel y elegir el tipo de gráfico que se
quiere construir de acuerdo a las opciones que se
muestran en la figura 9.

24
4. REPRESENTACIÓN DE DATOS AGRUPADOS MEDIANTE TABLAS Y GRÁFICOS

4.1) Representación de datos agrupados mediante tablas

Para describir una cantidad grande de datos o para estudiar una variable a partir de
determinadas categorías, es conveniente organizarlos en clases y definir el número de
individuos (u observaciones de la variable) que pertenecen a cada una de ellas.

Una clase es el conjunto de todos los individuos u observaciones de la variable, que se


encuentran entre determinados límites. Los límites de clase están constituidos por el
mayor y el menor valor de una clase.

Ejemplo 18

La empresa de recursos hidráulicos hace el máximo de esfuerzos para mejorar el


abastecimiento de agua en un asentamiento poblacional, que además de las viviendas,
posee un grupo de pequeñas fábricas y otras instalaciones sociales. Un equipo de
investigación, para realizar un estudio sobre la demanda de este preciado líquido,
registró el consumo (en metros cúbicos) semanal de los 3360 usuarios de dicha zona.

Los datos primarios fueron registrado en una tabla utilizando una hoja electrónica de
cálculo del EXCEL, en ella se puede expresar el nombre de las 3360 observaciones
(mayores consumidores de agua) realizadas en la zona que se estudia y el consumo
semanal, en metros cúbicos, correspondiente a cada una.

A continuación se presenta una sección de una tabla (que completa tiene 240 filas y 14
columnas) donde es posible observar un ejemplo de algunos de los consumos
registrado:

4,17 21,3 2,05 15,17 33,4 12,3 1,1 3,2 17 34,2 39 12 6,01 24

33 1,16 24,1 13.2 15 1,08 20 12,78 33,1 28 27,2 17 2,06 21

11,5 38 19,3 17 5 13 21.6 37,4 23,1 8 7,3 16,1 19 32,3

… … … … … … … … … … … … … …

… … … … … … … … … … … … … …

25
12.5 31,7 23 4,02 12 21 21 3,02 13 33,4 21 39 12 15

33 22,5 16,9 14 24 10,1 15 1,98 23 9,34 12 15 29,5 38,7

Tabla 15

Es fácil comprender que en la forma en que aparecen representados los datos primarios
en la tabla 15, se dificulta el procesamiento, y más aun, si aumenta el volumen de ellos.
Se tienen muchos valores diferentes de la variable, si se hace directamente la tabla de
frecuencias sería muy larga con muchos valores de frecuencia muy baja. Luego, para
resolver esta problemática se puede distribuir los diferentes valores del consumo en
clases o categorías, como se muestra en la tabla 16.

Para ello es necesario determinar, a partir de los datos primarios de la variable que se
investiga, cuál es el dato menor y el dato mayor que se llamarán, Xmín y Xmáx
respectivamente. De esta forma, los N datos de la muestra están incluidos en el
intervalo [Xmín, Xmáx]. Organizar los datos primarios en clase, consiste en construir h
"intervalos más pequeños" mutuamente excluyentes, el los cuales estén distribuidos los
N datos que contiene la muestra que se estudia. Esta idea se ilustra en la figura 10.

Fig. 10

Clases Fi (Cantidad [26 ; 31) 210 En este


(consumo en m3) de usuarios) caso los
[31 ; 36) 84
valores de
[1; 6) 301
[36 ; 41) 41 la variable
[6 ; 11) 690 estadística
Tabla 16 3360
(consumo
[11 ; 16) 1024
de agua en m3) puede tomar cualquier valor de los
[16 ; 21) 720 intervalos de clases que aparecen en la primera
columna de la tabla, en la segunda columna se
[21 ; 26) 290
registra el número de usuarios en cada categoría

26
(frecuencia absoluta Fi)

Es importante destacar que para una mayor comprensión las clases han representado
mediante la notación habitual de intervalos numéricos, más adelante se introducirán
otras formas de notación.

Cuando se agrupa un conjunto de datos mediante clases de frecuencias es importante


el dominio de un grupo de conceptos y términos como los siguientes:

Clase de frecuencias: conjunto de todos los individuos u observaciones de la variable,


que se encuentran entre determinados límites.

Límites de clases: mayor y menor valor de una clase, los cuales se denotan por Li y Ls
para indicar el límite inferior y el superior respectivamente.

Amplitud de clases: es la amplitud del intervalo de clase la cual se obtiene mediante la


diferencia: Ls – Li

Marca de clase: es el punto medio de cada intervalo de clase, el cual es un valor


representativo en esta de la variable que se estudia. La marca de clase es la media
aritmética de los valores correspondiente al límite inferior y superior de cada clase. Así,
Ls + Ll
la marca de la clase i es: xi = .
2

Estos valores expresados en forma general se pueden ejemplificar a partir de los datos
agrupados en la tabla 17.

Amplitud de
Clases Fi Li Ls Marca de clase
clase

[1; 6) 301 5 1 6 3,5

[6 ; 11) 690 5 6 11 8,5

[11 ; 16) 1024 5 11 16 13,5

[16 ; 21) 720 5 16 21 18,5

[21 ; 26) 290 5 21 26 23,5

27
[26 ; 31) 210 5 26 31 28,5

[31 ; 36) 84 5 31 36 33,5

[36 ; 41) 41 5 36 41 38,5

Tabla 17

Para el trabajo con datos agrupados en clases de frecuencias es importante tener en


cuenta las siguientes consideraciones:

 Las clases deben ser exhaustivas- abarcar todas las mediciones- y mutuamente
excluyentes.

 El número de clases no puede ser muy pequeño ni excesivamente grande.


Cuando el número de clases es pequeño se puede producir concentración de los
datos, y dispersión cuando es muy grande. En ambos casos puede haber
pérdida de la información y para tener cierta norma la mayoría de los estadísticos
concuerdan con que el número de clase debe oscilar de diez a veinte. Esto no
significa que en determinadas situaciones deje de ser útil un número menor de
clases. En los ejemplos que se presentarán a continuación se puede discutir al
respecto.

 Deben evitarse las clases de frecuencia nula. La amplitud de las clases se debe
elegir de modo que en el núcleo o centro de la tabla estén ocupadas todas las
clases.

 Deben tener la misma amplitud (siempre que sea posible).

 La marca de clase (punto medio) debe calcularse con facilidad.

El ejemplo 18 corresponde a una variable continua (volumen de agua en metros


cúbicos), a continuación se presentará el ejemplo 19 en el cual la variable que se
estudia es discreta.

Ejemplo 19

En una pizarra telefónica se registra el número de llamadas que se realizan


diariamente. A continuación se presenta como se comportó este índice durante los
primeros 100 días de funcionamiento.

28
20 60 27 50 21 71 40 58 39 28

37 29 15 66 55 17 50 53 30 39

51 36 41 58 35 38 48 19 37 40

42 56 34 37 79 18 54 39 61 22

52 23 41 33 32 43 64 37 49 40

57 43 24 67 44 75 41 55 25 59

21 31 53 45 30 15 62 40 50 45

43 29 28 47 58 79 40 56 46 69

54 45 68 17 27 51 40 63 49 37

47 57 26 55 47 26 39 22 52 39

Tabla 18

En los 100 valores registrados en la tabla 18, el mínimo es 15 y el máximo es 79,


significa, que el número de llamadas por día se mueven en un rango 79 – 15 + 1 = 65
valores, por tanto los datos se pudieran agrupar en 6 clases de frecuencias de amplitud
11, como se muestra en la tabla 19.

Clases Fi 70 – 80 4

(cantidad de llamadas (Cantidad de días) Tabla 19


telefónicas en un día)
Es importante destacar que en este caso las
15 – 25 15 clases no constituyen intervalos reales.
Ahora se ha utilizado una notación que es
26 – 36 15
muy apropiada para variables discretas. De
37– 47 32 esta forma la clase 15 – 25 está constituida
por los números naturales desde el 15 al 25
48 – 58 24
(en total 11 números naturales).
59 – 69 10

29
Luego, a partir de los datos de la tabla 19, se pueden diferenciar los siguientes valores:

Amplitud de clases: 11

Límites inferiores: 15, 26, 37, 48, 59 y 70

Límites superiores: 25, 36, 47, 58, 60 y 80

Marca de clase: 20, 31, 42, 53, 64 y 75

Una variante de la notación anterior, que es utilizada en algunos textos de Estadística


para datos continuos, es la que se ilustra en la tabla 20 del ejemplos 16. En este caso
para dos clases contiguas "A" y " B" denotadas de la forma X – Y e Y – Z
respectivamente, se adopta el convenio (para evitar confusiones al determinar los
elementos que integran una clase) de considerar a X en la clase "A" e Y en la "B”, y así
sucesivamente hasta distribuir todos los elementos de la muestra.

Clases Fi (Cantidad de
(consumo en m3) usuarios)

1–6 301

6 – 11 690

11 – 16 1024

16 – 21 720

21 – 26 290

26 – 31 210

31 – 36 84

36 – 41 41

Tabla 20 3360

Es bueno aclarar que los límites presentados no son los límites de clase reales.

Los límites de clase reales se obtienen sumando media unidad (0,5) al límite superior y

30
restando media unidad al inferior. Luego en el caso presentado (tabla 20), para el
intervalo 16 – 21 serían 15,5 y 21,5 los limites de clase reales inferior y superior,
respectivamente.

En lo adelante, para datos discretos se trabajará como en la tabla 19 y para datos


continuos se tomará el convenio de representar las clases mediante la notación que se
utilizó en la tabla 20. De esta forma los límites de clases coinciden con los extremos de
los intervalos y los límites reales de cada clase se obtienen sustrayendo y adicionando
a los límites inferiores y superiores, respectivamente, en la forma que se explicó
anteriormente.

4.2) Histogramas de frecuencias

Este tipo de gráfico se construye mediante columnas o rectángulos unidos. Así, sobre
cada intervalo de clases representado en una escala continua del eje real, se levanta un
rectángulo que tiene como base la amplitud del intervalo de clases y como altura, el
cociente entre frecuencia absoluta (o relativa) y la amplitud de la clase correspondiente,
Fi
es decir, hi = (ó h i = f i , si se trata de frecuencia relativa) es la altura del rectángulo
li li

que se levanta sobre la clase "li". De esta manera el área de cada rectángulo es igual a
la frecuencia absoluta (o relativa) de la clase correspondiente.

Ejemplo 20

Construir un histograma de frecuencias con los datos correspondientes al consumo de


agua, en metro cúbicos, registrados en la tabla 20.

Para construir este tipo de gráfico, sobre el eje horizontal se colocan, de forma
consecutiva, los valores de los límites de clases, en este caso se trata de situar los
números: 1, 6, 11, 16, 21, 26, 31, 36 y 41.

Para obtener la escala del eje vertical es necesario tener en cuenta que el área de cada
rectángulo es igual, a la frecuencia correspondiente (en este ejemplo a la frecuencia
absoluta). Lo anterior significa que es necesario dividir cada valor de la frecuencia
absoluta por 5, de esta forma se obtiene los siguientes resultados:

301 : 5 = 60,8 390 : 5 = 138 1024 : 5 = 204,8 720 : 5 = 144

31
290 : 5 = 58 210 : 5 = 42 84 : 5 = 16,8 41 : 5 = 8,2

Tabla 21

Así, los valores de la escala en el eje vertical es: 8,2; 16,8; 42; 58; 60,8; 138; 144 y
204, 8

En este caso se puede


comprobar que la base de
cada rectángulo es l = 5,
entonces el área del más
alto, por ejemplo, es
A = 5 ⋅ 202,8 = 1024 que es
la frecuencia absoluta de la
tercera clase.

Fig. 11

4.3) Polígonos de frecuencias

Es un gráfico poligonal de frecuencia de clase dibujado en función del punto medio


(marca de clase). Puede obtenerse uniendo los puntos medios de la base superior de
los rectángulos. Esta forma de representar los datos permite analizar tendencias, es
decir cuál es el comportamiento de la frecuencia (absoluta o relativa) alrededor, anterior
o a partir de determinados valores de la variable. Estos gráficos responden, por
ejemplo, a interrogantes como: ¿Cómo es el comportamiento de y antes del valor x1 o,
a partir del valor x2? ¿Cuál fue la tendencia de y hasta el valor x3 o, después del valor
x4?

Ejemplo 21

Construir un polígono de frecuencias con los datos correspondientes al consumo de


agua, en metro cúbicos, registrados en la tabla 20.

Es importante notar que el origen de la poligonal se toma en el límite real inferior de la


primera clase y el extremo coincide con el límite real superior de la última clase.

32
Fig. 12

Para graficar la frecuencia acumulada (absoluta o relativa) mediante un polígono, se


representan los intervalos de clases sobre el eje horizontal y se levanta en el extremo
superior de cada intervalo un segmento vertical de longitud igual a la frecuencia
acumulada (Fai ó fai ) correspondiente, uniendo luego con segmentos rectilíneos los
extremos de cada segmento vertical tal como se muestra en ejemplo 21 .Esto es
cuando se acumula por abajo, porque cuando se hace por arriba se levanta el
segmento vertical sobre el límite inferior de la clase.

Ejemplo 22

Representar en un polígono la frecuencia absoluta acumulada relacionada con el


consumo de agua, en metros cúbicos semanales, de los 3360 usuarios de una zona
(datos presentados en el ejemplo 18).

Para dar respuesta a este problema es conveniente incorporar dos columnas a la tabla
20, y de esta forma representar la frecuencia absoluta acumulada de arriba hacia abajo
y viceversa.

33
Clases Fi

(consumo en (Cantidad de Fi ↓ Fi ↑
m3) usuarios)

1–6 301 301 3360

6 –11 690 991 3059

11 –16 1024 2015 2369

16 – 21 720 2735 1345

21 –26 290 3025 625

26 – 31 210 3235 335

31–36 84 3319 125

36 – 41 41 3360 41

Tabla 22

Fig.13 Fig.14
10
Este tipo de polígono, que muestra la frecuencia acumulada (absoluta o relativa) se
denomina ojiva . Las figuras 13 y 14 describen , respectivamente, la frecuencia

34
absotuta acumulada de arriba hacia abajo (acumulado por abajo) y de abajo hacia
arriba (acumulado por arriba).

A partir de la figura 13 que es una ojiva que expresa el acumulado por abajo, se puden
formular preguntas como:

¿Cuántos usuarios tienen un gasto igual o inferior a los 16 m3 de agua en una semana?

En tanto, a partir de la oiva de la figura 14 (acumulado por arriba), la pregunta pudiera


ser: ¿Cuántos usuarios tienen un gasto igual o isuperior a los 16 m3 de agua en una
semana?

Las respuestas a las interrogantes planteadas son: 2015 y 1345 usuarios,


respectivamente.

El histograma es apropiado para representar las características de una sola


distribuion.Cuando se comparan distribuciones de frecuencia y sobre todo cuando las
muestras son de tamaño diferente, se debe utilizar el polígono de frecuencias relativas
acumuladas o de frecuencia relativa porcentual acumulada.

5. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS SIMPLES

Estas medidas permiten expresar un conjunto de datos por determinados valores


descriptivos, a los cuales se les llaman Estadígrafos o Estadísticos.

Las medidas de tendencia central son estadígrafos de posición y dentro de estas


podemos diferenciar las siguientes:

 La Media (Media aritmética, Media geométrica, Media armónica, Media cuadrática,


entre otras).

 La Mediana

 Las modas

Muchos son los problemas en los cuales es importante representar un grupo de datos
por un solo valor que es, por decirlo así, descriptivo del grupo entero. Las medidas de
tendencia central, que como su nombre lo indica, son valores que tienden a ocupar una
posición alrededor del cual se agrupan el mayor número de datos. Estos permiten la
descripción de la variable (o variables) que es objeto de estudio.

35
5.1) Media aritmética

Usualmente calculamos el promedio de un grupo de datos, un ejemplo pudiera ser el


promedio de las puntuaciones alcanzadas por un estudiante en una o varias de las
asignaturas que está cursando. El promedio se calcula adicionando todos los datos y
dividiendo la suma obtenida por la cantidad de datos. La media aritmética es un
promedio y se define, para datos simples, de la siguiente manera:

Definición: Sean x1, x2, x3,…, xn, n valores medidos. La Media Aritmética x se calcula
x1 + x2 + x3 + ... + xn
mediante la fórmula: x = y de manera abreviada, usando el símbolo
n
n
∑ xi 1 n
de sumatoria, la fórmula es: x= i =1
n
= ∑ xi
n i =1
(ver el apéndice)

Ejemplo 23

Cantidad de trenes que arribaron diariamente a una estación durante la última semana
de octubre del presente año.

Día Lunes Marte Merc. Jueves Vier. Sáb. Dom.

Cantidad de trenes 18 14 25 21 13 18 23

Tabla 23

18 + 14 + 25 + 21 + 13 + 18 + 23 132
x= = ≈ 18,86 Así x ≈ 19 trenes
7 7

Entonces, a esta estación arribó un promedio de 19 trenes aproximadamente durante la


última semana de octubre.

De manera general, para un conjunto de datos cuantitativos, la media aritmética,

• siempre existe, es única y fácil de calcular.

• es una función algebraica de los datos individuales. Esto significa que la modificación
de cualquiera de los datos hace variar el valor de la media.

5.2) Media aritmética ponderada

Hay algunos problemas en los cuales es imposible promediar cantidades sin tomar en

36
cuenta, de alguna manera, su importancia relativa dentro de la situación global que se
está tratando de describir. Por ejemplo, si en un agromercado se venden tres tipos de
granos a $3,50, $4,60 y $5,75 es imposible determinar el precio global de lo que se
vende si no se considera el número de libras vendidas de cada tipo de granos. Si la
mayoría de las libras vendidas son del tipo más barato la media estará más cerca de
$3,50.

Supongamos que el mercado vendió durante una semana 300 libras del tipo de granos
más barato, 220 de las del precio medio y 96 del más caro. Por un simple cálculo
aritmético el mercado recibió 300($3,50) + 220($4,60) + 96($5,75) = $ 2614 al vender

300 + 220 + 96 = 616 libras de estos granos. Luego el precio promedio por libras es
$ 2614
≈ $ 4 ,24 .
616

Este promedio se denomina media ponderada, en este caso representa el precio


promedio obtenido al vender 616 libras de granos teniendo en cuenta la importancia
relativa de cada uno de los datos (diferencia de los precios de acuerdo al tipo de granos
y cuántas libras se vendió de cada uno).

De manera general en una distribución de la forma siguiente:

pi p1 p2 p3 p4 … pn Donde pi es la ponderación de xi (xi es el valor i-ésimo


de la variable X) y ni es la frecuencia absoluta
ni n1 n2 n3 n4 … nn
correspondiente, la media aritmética (media ponderada)
se calcula mediante la siguiente fórmula:

xp =
∑ pi ⋅ ni
∑ ni
En el ejemplo presentado, la ponderación pi es el, precio de cada grano (refleja la
importancia relativa de cada tipo de grano) y ni es la cantidad vendida de cada tipo.
Luego aplicando a fórmula tenemos:

3
∑ pi ⋅ ni 3 ,50 ⋅ 300 + 4 ,60 ⋅ 220 + 5 ,75 ⋅ 96 2614
i =1
xp = = = ≈ 4 ,24 Así, el precio medio por
ni 300 + 220 + 96 616
de las 616 libras de grano vendidas es de $4,24 por libras.

37
5.3) Mediana

Definición: La Mediana M de un conjunto de valores x , x , x ,…, x dispuestos en


e 1 2 3 n
orden creciente (o decreciente) es:

• El valor que equidista de los extremos, si n es impar.

• La media aritmética de los valores centrales, si n es par.

Ejemplo 24 A

22 23 25 28 30

En este caso n = 5 (impar) luego, la mediana del conjunto de datos A es Me = 25

Ejemplo 25 B

40 43 45 46 48 51

En este ejemplo n = 6 (par) luego, la mediana del conjunto de datos B es


45 + 46
Me = = 45,5
2

De manera general, la mediana;

• es aplicable a cualquier tipo de datos que puedan ser ordenados, es decir, tiene
sentido cuando los datos pueden ser medidos por escalas métricas y ordinales.

• siempre existe y es única.

• no es una función algebraica de los datos individuales, esto significa que no varía
fácilmente al modificar los valores extremos. Se recomienda para distribuciones
asimétricas (es decir, aquellas distribuciones donde los datos se concentran
mayoritariamente a un solo lado de la media aritmética).

• es apropiada para un grupo pequeño de datos.

38
5.4) Modas

Definición: La Moda M de un conjunto de valores x , x , x ,…, x es el valor (o los


o 1 2 3 n
valores) que se presenta (presentan) con más frecuencia en ese conjunto.

Ejemplo 26

Cantidad de trenes que arribaron diariamente a una estación durante el mes de febrero

18 16 25 21 23 17 18 21 18 17 15 12 18 18

22 20 20 21 12 15 18 17 20 22 23 20 18 15

Tabla 24

En este caso la moda es MO = 18, es decir, la llegada de 18 trenes diariamente durante


el mes de febrero a esta estación. Esto es fácil de comprender si los datos se organizan
en una tabla de frecuencias como la siguiente, donde se aprecia con claridad que 18 es
el dato de mayor frecuencia:

# de trenes (xi) 12 15 16 17 18 20 21 22 23 25

# de días (Fi) 2 3 1 3 7 4 3 2 2 1

Tabla 25

En una distribución, no siempre aparece un dato que es el de mayor frecuencia, de


manera, que la determinación del valor modal varía en los ejemplos que aparecen a
continuación:

Ejemplo 27

(xi) 0 2 3 4 5 6 7

(Fi) 1 1 6 6 3 4 1

Tabla 26

Existen dos datos con la misma frecuencia, uno a continuación de otro, en este caso la
3+4
moda es la media aritmética de estos valores, así: M O = 3,5
2

39
Ejemplo 28

(xi) 1 2 3 4 6 9 10

(Fi) 3 7 6 8 3 7 1

Tabla 27

Existen dos datos con la misma frecuencia (7), pero no están a continuación uno del
otro, en este caso existen dos valores modales: M O1 = 2 y M O 2 = 9 . Luego estamos

en presencia de una distribución bimodal.

Ejemplo 29

(xi) 1 2 3 4 6 9 10

(Fi) 5 5 5 5 5 5 5

Tabla 28

En este ejemplo, todos los datos aparecen con la misma frecuencia, es decir, no existe
un valor que posea una frecuencia mayor que los demás. Luego en esta distribución no
existe un valor modal.

De manera general la moda,

• es aplicable a cualquier tipo de datos. Es muy útil para datos cualitativos,

• no es única y puede no existir cuando todos los valores tienen la misma frecuencia,

• no es una función algebraica de los datos individuales,

• es apropiada para caracterizar distribuciones con varias cimas o valores donde se


concentra la frecuencia de individuos o los resultados de las mediciones.

6. MEDIDAS DE DISPERSIÓN PARA DATOS SIMPLES

La determinación de las medidas de tendencia central: la media, la mediana y la moda,


aunque permiten describir una distribución, no dan la idea completa del problema que
se estudia. Es necesario que estas medidas estén acompañadas de otras que indiquen

40
la variabilidad de la información de acuerdo con estos valores de descripción, es decir,
la dispersión o concentración de los datos alrededor de determinados valores.

Las medidas de variabilidad son estadígrafos de dispersión y dentro de ellas se


encuentran las siguientes:

 Recorrido o rango

 Desviación media

 Varianza

 Desviación típica o estándar

 Coeficiente de variación

Para ilustrar lo expresado anteriormente consideraremos el siguiente ejemplo:

Ejemplo 30

La tabla siguiente corresponde a la distribución de las puntuaciones alcanzadas por dos


grupos de estudiantes (A y B) en un examen de Matemática.

GRUPO A GRUPO B

ALUMNOS PUNTUACIONES ALUMNOS PUNTUACIONES

A1 3 B1 5

A2 4 B2 5

A3 5 B3 6

A4 9 B4 8

A5 10 B5 8

A6 10 B6 9

∑ xI 41 ∑ yI 41

Media x 6,83 Media y 6,83

Mediana Me 7 Mediana Me 7

Tabla 29

41
En este caso los dos grupos de datos tienen igual media aritmética e igual mediana, sin
embargo, a simple vista se puede comprobar que el grupo A es más heterogéneo que el
B. Las puntuaciones en el primer grupo varían mucho, hay una marcada diferencia
entre las notas bajas y altas, en tanto, en el segundo grupo hay menor variación entre
las puntuaciones altas y las bajas, luego, el grupo B es más homogéneo que el A.

6.1) Recorrido, amplitud o rango

Es una medida simple de dispersión que se puede utilizar para una comparación
primaria de un grupo de distribuciones. Es poco confiable, pues considera sólo las dos
observaciones extremas, con independencia de la forma de la distribución y de las
frecuencias de las variables individualmente.

El rango, amplitud o recorrido se calcula de la siguiente forma:

R = xM – xm Donde xM es el mayor de los datos y xm, el menor.

Así en el grupo “A”se tiene que el rango es RA = 10 – 3 = 7 y por otro lado en el grupo
“B” RB = 9 – 5 = 4, es decir, existe mayor diferencia entre las puntuaciones altas y
bajas en el grupo “A”. Esto indica mayor dispersión de los datos en el grupo “A” en
relación con el “B”.

El rango es alterado por valores extremos que ocurren de manera casual, por lo que no
es estable y se recomienda su uso solo para muestras no mayores de 12.

6.2) Desviación media

Es una medida de dispersión que en la actualidad tiene poco uso, pero es bueno
conocerla para comprender mejor las otras, esta se define como la media aritmética de
los valores absolutos de las diferencias entre los datos y su media aritmética. Esto se
expresa mediante la siguiente fórmula:
n

x1 − x + x2 − x + ... + xn − x ∑ xi − x
i =1
Dx = = Donde x es la media aritmética de
n n

los datos de la distribución y x i − x es el valor absoluto de la desviación del dato xi en

relación con x . Consideremos los grupos A y B del ejemplo anterior en la siguiente


tabla:

42
GRUPO A GRUPO B

xi xi − x yi yi − y

3 |3 – 6,83| = 3,83 5 |5 – 6,83| = 1,83

4 |4 – 6,83| = 2,83 5 |5 – 6,83| = 1,83

5 |5 – 6,83| = 1,83 6 |6 – 6,83| = 0,83

9 |9 – 6,83| = 2,17 8 |8 – 6,83| = 1,17

10 |10 – 6,83| = 3,17 8 |8 – 6,83| = 1,17

10 |10 – 6,83| = 3,17 9 |9 – 6,83| = 2,17

Tabla 30

3 ,83 + 2 ,83 + 1,83 + 2 ,17 + 3 ,17 + 3 ,17 17


Dx = = ≈ 2 ,83
6 6

1,83 + 1,83 + 0 ,83 + 1,17 + 1,17 + 2,17 9


Dy = = ≈ 1,5 Así, la desviación media del grupo A
6 6
es superior que la del grupo B, lo cual verifica los resultados obtenidos anteriormente en
relación con la dispersión de los datos y la fiabilidad de la media aritmética en
determinados tipos de distribuciones. Dado que esta medida representa lo que se
aparta cada dato como promedio de la media aritmética, a mayor desviación media
resulta que la media aritmética es menos representativa de los datos.

La desviación media puede tener sus atractivos como medida de variación, pero no es
la más utilizada, por lo que se necesita estudiar otras medidas de variación de mayor
alcance.

6.3) Variancia

La varianza de un conjunto de datos x1, x2, x3,…, xn, se define como la media de los
cuadrados de las desviaciones de los datos la variable respecto a la media.
Comúnmente, se utilizan diferentes notaciones para representar la varianza cuando se
trata de una población finita o de una muestra seleccionada, pero de manera general se
puede utilizar el símbolo V para su referencia y cálculo. Esto se expresa mediante la
siguiente fórmula:

43
( x1 − x )2 + ( x − x ) 2 + ... + ( x n − x )2 1 n
V(X) = = ∑ ( xi − x )2
n n i =1

Retomando el ejemplo 29 tenemos:

3,83 2 + 2,832 + 1,83 2 + 2,172 + 3 ,17 2 + 3 ,172 50 ,84


V(X) = ≈ = 8 ,47
6 6

1,83 2 + 1,83 2 + 0 ,83 2 + 1,17 2 + 1,17 2 + 2 ,17 2 14 ,84


V (Y ) = ≈ = 2,47
6 6

Luego, la varianza del grupo A es superior a la del grupo B.

Generalmente se utiliza la notación s2, incluso en EXCEL.

Los estudios estadísticos han demostrado que para el cálculo de la varianza muestral
de una muestra de tamaño N, es más conveniente modificar la fórmula anterior
dividiendo por N – 1 en lugar de dividir por N. En lo adelante, para el trabajo con la
Estadística Descriptiva que es a la cual está dirigido este material, utilizaremos la
fórmula como la hemos presentado en la definición de Varianza.

Propiedades de la Varianza

1) La varianza es siempre un número no negativo.

2) No es influenciada por valores extremos, depende de todos los valores de la


distribución y no sólo de los extremos, es una función algebraica de todos los
valores, es apropiada para tareas de la Estadística Inferencial.

3) La varianza de una variable que toma valores constantes es igual a cero, es decir,
V(k) = 0, siendo k una constante. Significa que si todos los valores de la variable X
son iguales a una constante k, entonces X = k , luego la desviación de cada uno de
los datos respecto a la media es cero.

4) La varianza de una constante por una variable es igual al cuadrado de la constante


por la varianza de la variable, es decir: V (kX ) = k 2V ( X )

5) La varianza de una suma de una variable y una constante es igual a la varianza de


la variable, es decir: V ( X + k ) = V ( X )

Las demostraciones de estas propiedades son realmente sencillas; basta aplicar la

44
fórmula para el cálculo de la varianza y las propiedades del signo de sumatoria y las de
la varianza en sí.

6.4) Desviación típica o estándar

La desviación típica o estándar varía menos que otros estadígrafos cuando se calcula
para varias muestras extraídas de una misma población. Esto hace que sea la medida
de dispersión más usada y de mayor confianza para los estadísticos.

Se define como la raíz aritmética de la varianza y se denota por la letra s.

∑ (x i )
n 2
− x
i =1
s = V =
n

Utilizando nuevamente el ejemplo 30, tenemos:

s( X ) = V ( X ) = 8 ,47 = 2,9 y s( Y ) = V ( Y ) = 2,47 = 1,57

Con la desviación típica o estándar se tiene una idea del grado de desviación promedio
en la distribución, en nuestro caso se puede afirmar que con respecto a la variable
calificaciones existe mayor concentración de la notas en el grupo B, mientras que con
respecto a esa misma variable, el grupo A es más heterogéneo.

6.5) Coeficiente de variación de Pearson

El coeficiente de variación es una medida de dispersión relativa, pues establece una


relación entre el valor de la desviación típica y el valor de la media. Dado que la
desviación típica y la media están dadas en la misma unidad de medida, hace que el
coeficiente de variación no se exprese en unidad de medida alguna. Esta última
propiedad permite utilizar al coeficiente de variación para comparar la dispersión de una
característica en dos o más poblaciones, sobre todo cuando las medias aritméticas
difieren significativamente.

El coeficiente de variación se define mediante el cociente entre el valor de la desviación


típica y el valor de la media y lo denotaremos con el símbolo CV, Así tenemos la
desviación típica s
siguiente fórmula: CV = = (El coeficiente de variación se
media aritmética X
acostumbra dar en por cientos), y solo se debe aplicar para datos cuantificados en una
escala de proporciones, aunque se acepta que se utilice para datos medidos en una
45
escala de intervalos.

Ejemplo 31

En un experimento se mide la cantidad de individuos de un total de 100 que dan una


respuesta acertada ante un estímulo, lo que indica la calidad de reacción de los
mismos. En la tabla se da el número medio de respuestas acertadas y la desviación
típica "s" para los experimentos primero, quinto y décimo. Se pregunta si la dispersión
de los resultados individuales se modifica durante el entrenamiento.

Experimento x s V

1 13,85 4,75 34,3

5 22,60 4,65 20,6

10 24,50 3,90 15,9

Se pudiera pensar que la dispersión disminuye poco, pero esto no se corresponde con
la realidad. La variabilidad de los resultados individuales disminuye con el tiempo. En el
primer experimento la dispersión representa el 34 % de la media y en el décimo solo el
16% de esta.

7. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

Hay algunos problemas en los cuales es necesario determinar las medidas de


tendencia central directamente de los datos agrupados. Esto puede suceder, por
ejemplo, cuando los datos necesarios de un estudio son suministrados por una fuente
que no puede proporcionar los datos primarios o porque la masa de datos hace que el
proceso sea complejo. Ahora se presenta cómo calcular las medidas de tendencia
central para datos agrupados.

7.1) Media aritmética

La media aritmética para un conjunto de de datos agrupados en n-clases se calcula

46
n

F ⋅ x + F2 ⋅ x2 + ... + Fn ⋅ xn
∑ Fi ⋅ xi
i =1
mediante la fórmula: x= 1 1 =
F1 + F2 + ... + Fn n
∑ Fi
i =1

Donde:

xi : es el valor medio de cada intervalo de clase, es decir la marca de la clase “i”.

Fi : La frecuencia correspondiente a la clase “i”.


Ejemplo 32

Hallar el consumo semanal promedio de agua en la zona del ejemplo 18, cuyos datos
aparecen en la siguiente tabla:

Marca de clase Fi ⋅ x i
Clases Fi
xi

1–6 301 3,5 301⋅ 3,5 = 1053,5

6 –11 690 8,5 690⋅ 8,5 = 5865

11 –16 1024 13,5 1024 ⋅ 13,5 = 13824

16 – 21 720 18,5 720 ⋅ 18,5 = 13320

21 –26 290 23,5 290 ⋅ 23,5 = 6815

26 – 31 210 28,5 210 ⋅ 28,5 = 5985

31–36 84 33,5 84⋅ 33,5 = 2814

36 – 41 41 38,5 41⋅ 38,5 = 1578,5

…………….. ∑ Fi =3360 …………. ∑ Fi ⋅ xi = 51255

Tabla 31

Para resolver este problema se puede sustituir directamente en la fórmula, pero es


conveniente (siempre que sea posible) incorporar una columna a la derecha y una fila
inferior de la tabla, tal como se realizó en este caso. Ahora la media aritmética para este

47
volumen de datos agrupados es:

n
∑ Fi ⋅ xi 51255
i =1
x= n
= ≈ 15,25
3360
∑ Fi
i =1

Lo anterior significa, que los 3360 usuarios de la zona estudiada en el ejemplo 18


consumen un promedio de 15,25 m3 de agua semanalmente.

La media aritmética para un grupo de datos agrupados en clases, como el ejemplo


anterior, no difiere una cantidad significativa de la media aritmética calculada a partir de
los datos simples.

7.2) Mediana

La mediana para un conjunto de de datos agrupados en n-clases se calcula mediante la


siguiente fórmula:

n 
 − Fa m −1 
M e = L i + 2  ⋅ l Donde:
 Fm 
 
 

n : Número de observaciones. F m: Frecuencia de la clase mediana.

Li : Límite inferior real de la clase mediana.

Fam −1 : Frecuencia acumulada hasta la clase anterior a la clase mediana, es decir:


m −1
Fam −1 = ∑F
k =1
k

l : Amplitud del intervalo de la clase mediana.

Ejemplo 33

Hallar la mediana del consumo semanal de agua en la zona del ejemplo 18, utilizando
los datos registrado en las tres primeras columnas de la tabla 31.

48
Para responder este problema es necesario identificar los valores de cada una de las
variables que intervienen en la fórmula:

La mediana en un conjunto de datos ordenados es el valor que equidista de los


extremos. En este caso n = 3360 que es un número par, entonces, como:
n 3360
= = 1680 entonces la mediana está entre los valores que ocupa el orden 1680
2 2
y el 1681 de la lista ordenada de datos, así, la clase mediana es la tercera, es decir:
11-16, lo que se puede observar más fácilmente en la columna de frecuencias
absolutas acumuladas de la tabla 22.

Li = 10,5 (Límite real inferior de la clase mediana)

Fm = 1024 (Frecuencia absoluta de la clase mediana)

Fam −1 = 991 (Frecuencia absoluta acumulada hasta la clase anterior a la clase mediana

(columna 3 de la tabla 22))

l = 5 (Amplitud del intervalo de la clase mediana)

Ahora podemos sustituir en la fórmula y calcular la mediana.

 3360 
 − 991 
M e = 10 ,5 +  2  ⋅ 5 = 10 ,5 +  1680 − 991  ⋅ 5 = 10 ,5 + 689 ⋅ 5 ≈ 10 ,5 + 0 ,673 ⋅ 5
 1024   1024  1024
 
 

M e ≈ 10 ,5 + 3 ,37 = 13 ,9

Como se puede observar, la mediana obtenida es un valor relativamente próximo a la


media aritmética. Ambos estadígrafos se pueden calcular utilizando el EXCEL. Los
3360 valores de consumo se registran en una HEC y utilizando la función estadística
MEDIANA, por ejemplo, este devuelve la mediana de los argumentos de una referencia
de celdas.

Significado geométrico de la mediana en un conjunto de datos agrupados.

Al construir un histograma de frecuencia absoluta, como el de la figura 15 que


corresponde a los datos de la la tabla 16, se pude comprobar que la recta perpendicular

49
al eje horizontal, trazada por el punto que contiene a la mediana (15,3 en este caso),
divide al área total que ocupan los rectángulos, en dos regiones de igual área; una a la
izquierda del valor de la mediana y la otra a la derecha. en dos parte iguales. Esto se
cumple de manera general, por tanto se considera el significado geométrico de la
mediana de un conjunto de datos agrupados

13,9 Fig.15

7.3) Modas

La moda(s) para un conjunto de de datos agrupados en n-clases se calcula mediante la


siguiente fórmula:

 n1 
MO = L i +   ⋅ l Donde:
 n1 + n2 

Li : Límite inferior real de la clase modal.

n1: Exceso de la frecuencia modal sobre la frecuencia de la clase anterior más próxima.

n2 : Exceso de la frecuencia modal sobre la frecuencia de la clase posterior más


próxima.

l : Amplitud del intervalo de clase modal.

Esta fórmula se puede comprender mejor a partir del significado geométrico de la moda

50
en un conjunto de datos agrupados.

Fig.16
Supongamos que la figura corresponde a
una sección de un histograma de
frecuencias donde aparecen
representados el rectángulo de la clase
modal, el de la anterior y el de la posterior
a esta.

Los segmentos trazados desde los


vértices de los rectángulos determinan los triángulos semejantes RPQ y SPT, en los
cuales se tiene:

EP PF
= , en virtud de la proporcionalidad entre elementos homólogos. Luego,
RQ ST
M O − Li L S − M O
sustituyendo se tiene: = y aplicando la propiedad fundamental de las
n1 n2

n1LS + n2 LS
proporciones y transformaciones algebraicas equivalentes se obtiene M O =
n1 + n2

n1( L i +l ) + n2 Li
pero LS = Li + l (l es la amplitud de la clase modal) entonces, M O = ,
n1 + n2

(n1 + n2 )Li + n1 l
MO = , ahora aplicando la propiedad distributiva de la división respecto
n1 + n2

 n1 
a la suma se obtiene M O = Li +   ⋅ l que es la fórmula empírica que hemos
 n1 + n2 
utilizado para el cálculo algebraico de la mediana.

Ejemplo 34

Hallar la moda del consumo semanal de agua en la zona del ejemplo 18, utilizando los
datos registrado en las tres primeras columnas de la tabla 31.

En este caso la clase de mayor frecuencia es la 11-16 que tiene frecuencia Fi = 1024.

Así:

n1 = 1024 – 690 = 334 n2 = 1024 – 720 = 304


51
Li = 11 – 0,5 = 10,5 y l=5

 n1   334 
Ahora aplicando la formula MO = L i +   ⋅ l tenemos: M O = 10,5 +   ⋅5
 n1 + n2   334 + 304 

334
M O = 1o,5 + ⋅ 5 ≈ 10,5 + 0,52 ⋅ 5 = 10,5 + 2,6 = 13,1
638

Entonces la moda es M O ≈ 13,1 metros cúbicos de agua en una semana

52
8. EJERCICIOS PARA LA PRÁCTICA Y EL REPASO

1) En un taller de costuras, que cuenta con un total de 27 trabajadores entre sastres y


costureras, se confeccionan pantalones para los uniformes escolares. Con el
objetivo de hacer una reforma salarial se realiza un estudio basado en los datos
siguientes:

• Sexo

• Nivel cultural.

• Calificación técnica.

• Tiempo en horas que invierte un trabajador para confeccionar un pantalón.

• Cantidad de pantalones que confecciona un trabajador en una jornada de trabajo.

• Calidad de la costura determinada por el número de piezas que no son


rechazadas.

Identifica la variable que se evalúa, clasifícala, plantea ejemplos de los valores que
puede tomar e indica la escala de medición en cada caso.

2) Las notas finales en Matemática de 80 estudiantes de una escuela están registradas


en la tabla siguiente:

68 84 75 82 68 90 62 88

73 79 88 73 60 93 71 59

61 65 75 87 74 62 95 78

66 78 82 75 94 77 69 74

96 78 89 61 75 95 60 79

79 62 67 97 78 85 76 65

65 80 73 57 88 78 62 76

53
86 67 73 81 72 63 76 75

76 85 63 68 83 71 53 85

93 75 72 60 71 73 74 77

Determina:

a) La calificación más alta.

b) La calificación más baja.

c) Las notas de los 5 estudiantes de más alta calificación

d) Las notas de los 5 estudiantes de más baja calificación.

e) La calificación del estudiante que ocupa el décimo lugar.

f) ¿Cuántos estudiantes tuvieron notas iguales o más altas que 75?

g) ¿Cuántos obtuvieron notas por debajo de 85 puntos?

3) En una escuela se seleccionaron al azar 20 alumnos para hacer una investigación


sobre la edad de los alumnos que con más frecuencia participan en competencias
deportivas. Para ello se seleccionaron como muestra alumnos de diferentes grados,
recogiéndose sus edades de la siguiente forma:

11 15 14 12 11 14 14 13 15 16

12 12 14 14 15 15 13 14 15 13

a) Ordene los datos de menor a mayor.

b) Construya la tabla de frecuencias absolutas.

c) Determine la cantidad de alumnos que tienen 15 años.

d) ¿Qué por ciento de alumnos tienen 11 años?

e) ¿Cuál es la edad más frecuente de los alumnos seleccionados?

f) Diga la cantidad de alumnos que tienen edad superior a 13 años.

4) En un estudio sobre el número de conejos recién nacidos en 60 camadas se

54
obtuvieron los siguientes datos por camada:

5 6 7 4 2 5 1 3 4 6

5 2 3 4 2 5 4 5 7 6

5 3 1 2 6 5 6 4 5 2

1 7 9 7 6 6 4 3 8 1

3 2 8 4 1 7 2 2 4 3

4 5 6 2 3 3 1 2 8 7

a) Ordene los datos de menor a mayor.

b) Elabore una tabla de frecuencias absolutas y relativas.

c) Determine cuántas conejas tuvieron camadas de 5 crías.

d) Determine la camada que se presentó con mayor frecuencia.

e) Calcular el número total de crías en las 60 camadas de conejos.

5) En una escuela con matrícula de 800 estudiantes se realizó una encuesta sobre la
preferencia de programas de televisión, obteniéndose los siguientes resultados:

Programas Alumnos

Deportivos 80

Musicales 120

Infantiles 240

Noticieros 200

Culturales 160

Represente los resultados de esta encuesta en un:

a) Gráfico de barras y circular.

b) Pictograma

6) Al lanzar 100 veces un dado se han obtenido los resultados siguientes.

55
n 1 2 3 4 5 6

Cantidad de veces que sale n 13 20 25 18 18 6

6.1) Completa las afirmaciones siguientes:

a) La frecuencia absoluta de obtener un 5, al lanzar el dado 100 veces, es: ___

b) El 20% de las veces se obtuvo como resultado ___

c) La frecuencia relativa de obtener 6, cuando se lanza el dado 100 veces es: ___

d) La frecuencia relativa porcentual de obtener 3, al lanzar el dado 100 veces es: ___

6.2) Valora críticamente la siguiente afirmación:

"Al lanzar un dado 100 veces la mayor posibilidad es obtener un tres y la menor,
obtener seis".

7) La siguiente tabla muestra la temperatura mensual promedio, en grados Celsius,


registrada en una región.

Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic

24 20 18 19 17 20 23 18 20 18 21 23

a) ¿Cuál es la temperatura promedio anual?

b) ¿Cuál es el valor central de temperatura en dicha región?

c) ¿Cuál es la temperatura más común?

8) A continuación aparecen representados una tabla y dos gráficos que expresan los
datos (en milímetros), de la cantidad de agua caída (como promedio), en un
municipio durante los doce meses del año 2003

Ene. Feb. Mar. Abr. May Jun. Jul. Ago. Sep. Oct. Nov. Dic.
.

101 43 41 20 22 193 130 264 220 270 225 14

56
300
300
250 250
200 200
150 150
100 100
50 50

0 0
Ene. Mar. May. Jul. Sep. Nov.

.
e.

l.

p.
.
.

ov
ay
ar

Ju
En

Se
M

N
M
a) Identifique cada uno de los gráficos representados

b) ¿En qué meses cayó mayor y menor cantidad de lluvia?

c) ¿En qué meses cayó menos de 120 milímetros de lluvia?

d) ¿En qué meses se alcanzó mayores niveles de precipitaciones? ¿Por qué?

e) ¿Cuál fue el promedio de lluvia caída en el año?

f) ¿Qué importancia tiene para usted estos gráficos?

9) Los siguientes datos corresponden a la superficie aproximada, dadas en millones de


kilómetros cuadrados, de 6 grandes regiones de muestro planeta.

REGIONES SUPERFICIE REGIONES SUPERFICIE

África 30 Asia 44

Australia y
América 42 9
Oceanía

Antártica 14 Europa 10

a) Con estos datos construye un pictograma, una gráfica de barras y un gráfico


circular o de sectores.

b) ¿Cuáles de las representaciones gráficas, según tu criterio, ilustra mejor la


comparación de las superficies de estas regiones?

10) La siguiente tabla muestra la distribución de los 297 clubes de computación "Joven
club " del país hasta el año 2002.

57
Pinar del Río 18 Ciego de Ávila 15

La Habana 28 Camaguey 20

Ciudad de la Habana 47 Las Tunas 13

Matanzas 23 Holguín 23

Villa Clara 25 Granma 19

Cienfuegos 13 Santiago de Cuba 21

Sancti Spíritus 13 Guantánamo 15

Isla de la Juventud 4 TOTAL 297

a) Construye una tabla de frecuencia haciendo una distribución de los datos por
regiones (occidental, central y oriental).

b) Halla la cantidad media de estos clubes por provincias en cada región del país.

c) Representa estos datos, distribuidos por regiones, en un gráfico de pastel.

d) Construye una tabla como la anterior donde muestres la cantidad actual de estos
clubes en cada uno de los municipios de tu provincia.

Los Joven Club de Computación y Electrónica (JCCE) constituyen un programa de la Unión de


Jóvenes Comunistas de Cuba, que abarca todo el país para alcanzar el objetivo principal de
proporcionar la cultura informática a la comunidad con prioridad hacia niños y jóvenes,
representando un papel activo, creativo y de formación de valores
en el proceso de informatización de la sociedad cubana.

Surgen el 8 de septiembre de 1987 por iniciativa del Comandante


en Jefe Fidel Castro, después de evaluarse como positiva la
experiencia del Joven Club radicado en el Pabellón Cuba durante el
período vacacional.

11) En la siguiente distribución la media aritmética es 2.

58
Selecciona la alternativa correcta
xi 0 1 2 3 4
a) ___ El valor de F5 es 6.
Fi 4 3 4 5 F5
b) ___ No se puede conocer el valor de
F5.

c) ___ La tabla se completa para F5= 3.

d) ___ F5 se puede sustituir por cualquier dígito.

12) A continuación te ofrecemos los datos correspondientes al peso en kilogramos


(redondeado a cantidades enteras) de una raza de gallinas en estudio, que se
pretenden destinar al consumo.

2 3 4 3 5 3 2 4 3 5 3 2 5 3 4 2 5 5 4 3 5 4 3 2 2

12.1) Sobre la información anterior responde:

a) ¿De cuántos ejemplares consta la población que se está estudiando?

b) ¿Qué tipo de variable se estudia?

c) ¿Qué valores toma la variable?

d) ¿Qué escala se debe utilizar para medir la variable?

e) ¿Qué valores toma la variable?

12.2) Construye una tabla de frecuencias y responde:

a) ¿Qué porcentaje representa el número de ejemplares en el peso de mayor


(menor) frecuencia?

b) ¿Qué cantidad de ejemplares no sobrepasan los 4 kg de peso?

c) ¿Qué porcentaje de los ejemplares sobrepasan los 3 kg de peso?

12.3) Compara el número de ejemplares por peso mediante un gráfico.

12.4) Determina el peso medio en kilogramos de los ejemplares estudiados, la


mediana y la moda.

13) En una encuesta a 16 alumnos sobre la asignatura que prefieren se obtuvieron los
resultados siguientes: Computación, Estadística, Biología, Química, Biología ,
Estadística , Computación , Biología , Computación , Estadística, Biología ,Química,

59
Biología , Estadística ,Computación, Biología.

a) Confeccione la tabla de distribución de frecuencias.

b) Calcule las medidas descriptivas que correspondan.

14) La siguiente tabla corresponde a la producción aproximada de cierta variedad de


café, en toneladas por hectáreas, obtenida en 100 plantaciones estudiadas.

6 7 6 8 5 5 7 6 5 4 6 8 6 6 5 4 7 5 5 6

7 5 7 5 6 5 6 5 6 5 7 7 7 6 5 5 6 7 5 6

5 6 6 7 7 6 7 4 7 7 4 5 4 4 5 8 8 3 4 6

5 4 3 5 6 3 7 5 7 8 8 8 5 6 5 3 4 6 4 5

5 2 7 6 4 4 6 7 5 5 5 8 8 5 6 6 7 4 6 7

14.1) Representa estos datos en una tabla de frecuencia y realiza las siguientes
actividades:

a) Determina el porcentaje de las plantaciones que tienen una producción de 5


toneladas por hectáreas.

b) Halla la cantidad de plantaciones cuya producción está por encima (debajo) de


la producción media por hectáreas.

14.2) Representa la distribución de frecuencia relativa porcentual en un gráfico de


barras.

15) Se observan 25 personas y se clasifican según su aspecto en: Obesa (O), Gruesa
(G), Buen Peso (BP), Delgada (D) y Muy Delgado (MD), obteniéndose los
resultados siguientes:

BP,D,D,MD,O,D,G,G,G,O,BP,BP,D,D,D,O,O,G,G,BP,MD,BP,G,D,MD

a) Construya la tabla de distribución de frecuencias.

b) Calcule las medidas descriptivas que correspondan.

16) Los alumnos de un centro deportivo han hecho estadísticas acerca de los resultados
históricos de dos equipos de baseball A y B. En relación con la cantidad de juegos
ganados durante cinco temporadas se registraron los siguientes datos:

60
PROMEDIO DE JUEGOS GANADOS
DESVIACIÓN ESTANDAR
POR TEMPORADAS

Equipo A 45 2,5

Equipo B 45 0,8

Marca la alternativa correcta considerando que los estudiantes tienen la posibilidad


de elegir el equipo de su preferencia para realizar el entrenamiento.

a) __ Los alumnos que aspiran a formar parte de un equipo con marcada


estabilidad en la cantidad de juegos ganados por temporadas les conviene
entrenar con el equipo A.

b) __ Los alumnos que aspiran a formar parte de un equipo con marcada


estabilidad en la cantidad de juegos ganados por temporadas les conviene
entrenar con el equipo B.

c) __ Los alumnos deciden matricular en cualquiera de los dos equipos porque los
consideran igualmente estables en relación con la cantidad de juegos ganados
por temporadas.

d) __Son insuficiente los datos aportados para seleccionar el equipo más estable.

17) En un tramo de carretera la velocidad está limitada a 100km/h. Se quiere estudiar si


los automóviles respetan eficientemente estas limitaciones. Para ello, se mide la
velocidad de los autos que pasan durante cierto período de tiempo y se obtiene los
datos que se han registrado en la tabla siguiente:

Velocidad (en km/h) de los automóviles Cantidad de autos


al pasar por la zona limitada. (Fi)
(clases de frecuencias)

84 – 90 5

90 – 96 15

96 – 102 38

61
102 – 108 24

108 – 114 10

114 – 120 5

120 – 126 3

a) Determina la velocidad promedio, con la cuál transitan los autos registrados en


la zona limitada.

b) Determina el porcentaje de los autos que sobrepasan los 102 km/h.

c) Construye un polígono de frecuencia absoluta con los datos de la tabla.

18) En una investigación antropométrica se midieron los pesos de 40 alumnos


universitarios (peso en libras):

138 164 150 132 144 125 149 157

146 158 140 147 136 148 152 144

168 126 138 176 163 119 154 165

146 173 142 147 135 153 140 135

161 145 135 142 150 156 145 128

a) Realiza una distribución de frecuencias con 10 clases.

b) Determina las marcas de clase.

c) Determina las frecuencias absolutas, relativas y relativas acumuladas.

d) Construye histograma y el polígono de frecuencias de esa distribución.

19) Halla la desviación típica o estándar en relación con el peso promedio de la pobla-
ción de gallinas estudiada en el ejercicio 12.

20) Halla la desviación típica o estándar en relación con la producción media de café
(en toneladas por hectáreas) de las 100 plantaciones estudiadas en el ejercicio 14.

21) Los gráficos corresponden a dos distribuciones relativas a las distancias de las
casas al empleo de los trabajadores de dos empresas (A y B). Sin efectuar cálculos

62
determina en cuál de los dos casos la desviación típica es mayor. Justifica.

22) Resultados de un examen en un grupo de 50 alumnos:

8,0 7,5 7,3 9,1 1,8 2,7 8,3 6,3 8,8 7,4

6,8 4,4 7,8 4,3 7,1 9,9 8,4 7,5 7,3 8,7

0,3 5,5 9,5 9,3 6,2 7,6 6,5 3,9 7,5 3,2

7,7 7,2 8,5 8,6 7,8 4,7 2,7 7,9 7,3 10,0

6,9 7,5 8,7 8,4 7,7 7,8 7,1 8,8 9,3 7,0

Determina:

a) La calificación más frecuente.

b) El intervalo donde hay más calificaciones.

c) Cantidad de aprobados.

d) La nota, a partir de la cual se encuentra la mitad de los estudiantes.

e) La mejor y la peor nota.

f) Las 10 mejores y las 10 peores notas.

23) Un profesor de Educación Física midió las pulsaciones de los 30 alumnos de un


grupo "A" de 10mo grado al terminar una carrera de velocidad. Los resultados
fueron los siguientes:

63
PULSACIONES CANTIDAD DE
a) ¿Cuál es el intervalo de pulsaciones por
POR MINUTO ALUMNOS minuto donde se concentra el mayor
(xI) (FI) número de alumnos del grupo "A" al
[80 ; 90) 2 terminar una carrera de velocidad?

[90 ; 100) 8 b) ¿Cuál es la media de las pulsaciones por

[100 ; 110) 13 minuto después de la carrera?

[110 ;120) 4 c) Construye un polígono de frecuencia


absoluta acumulativa (expresada en
[120 ; 130] 3
porcentaje) y determina el valor debajo del
cual está el 50% de los alumnos.

d) Halla la mediana y la moda utilizando las fórmulas empíricas estudiadas.

24) Realiza un estudio de tu grupo, procesando los datos en una HEC, basado en los
siguientes aspectos:

a) Puntuaciones alcanzadas por los estudiantes en cada una de las evaluaciones


realizadas.

b) Cantidad de ausencias mensuales a clases de cada estudiante en las diferentes


asignaturas que se imparten.

c) Nota promedio alcanzada por cada estudiante en las evaluaciones aplicadas (en
cada evaluación aplicada y en cada asignatura en general).

d) Clasificación de los estudiantes según el rendimiento escolar (bajo, mediano o


alto) de acuerdo con determinado rango en las calificaciones alcanzadas.

e) Promedio de ausencias mensuales a clases de cada estudiante en las diferentes


asignaturas que se imparten.

f) Varianza de las puntuaciones alcanzadas en las evaluaciones y del número de


ausencias a clases en cada una de las asignaturas.

g) Comparación entre coeficiente de variabilidad de las puntuaciones alcanzadas en


determinada asignatura y el del número de ausencias clases de los estudiantes a
la misma durante el período que se estudia.

h) Otros datos que consideres sean de interés para el estudio

64
9. RESPUESTAS DE LOS EJERCICIOS PROPUESTOS PARA LA PRÁCTICA Y EL
REPASO

1) (Taller de costuras)

ESCALA DE
VARIABLES TIPO DE VALORES QUE PUEDE
MEDICIÓN DE
ESTADÍSTICAS VARIABLE TOMAR LA VARIABLE
LA VARIABLE

Sexo Cualitativa masculino, femenino Nominal

Primario, Medio, Universitario,


Nivel cultural Cualitativa Ordinal
otros.

Aprendiz, Técnico, Ingeniero,


Calif. técnica Cualitativa Ordinal
otros

Cuantitativa
Tiempo 0:30 h, 1:00 h. 2:00 h, otros. Razones
continua

Cant. de Cuantitativa
0, 1, 2, 3, 4, ... Razones
pantalones discreta

Calidad Cualitativa Baja, media, alta Ordinal

2) a) 97 b) 53 c) 94, 95, 95, 96 y 97 d) 53, 57, 59, 60 y 60 e) 62 f) 43 g) 63

3) (Edad de un grupo de estudiantes)

a) Datos en orden ascendente :

11 11 12 12 12 13 13 13 14 14 14 14 14 14 15 15 15 15 15 16

b) Tabla de frecuencia absoluta

(xi) 11 12 13 14 15 16

(Fi) 2 3 3 6 5 1

c) 5 alumnos d) 10% e) 14 años f) 12 alumnos

4) (Camadas de conejos)

xi Fi fi x i ⋅ Fi 2 10 0,17 20

3 8 0,13 24
1 6 0,1 6

65
4 9 0,15 36

c) 9 camadas.
5 9 0,15 45
d) La camada de 2 crías.
6 8 0,13 48
e) 254 crías.
7 6 0,1 42

8 3 0,05 24

9 1 0,02 9

60 1 254

5) (Encuesta sobre preferencia)

Preferencia de programas de televisión


Cantidad de alumnos

Deportivos 300
250
Musicales 200
150
Infantiles 100
50
Noticieros 0
Culturales
s
s

s
es

s
vo

le
ile

ro
al

ra
ie
nt
ti

ic
or

tu
ic
fa
us
ep

ot

ul
In
M

C
D

6) (Lanzar un dado 100 veces)

6.1) a) 18 b) 2 c) 0,06 d) 25%

6.2) En el experimento realizado se cumple la afirmación, pero no se puede


generalizar.

7) a) 20º C b) 20º C c) 18º C ó 20º C

8) (Precipitaciones)

a) Gráfica de barra y poligonal

b) Mayor cantidad de precipitaciones: octubre y menor, en diciembre

c) Enero, febrero, marzo, abril, mayo y diciembre.

66
d) Agosto, septiembre, octubre y noviembre.

e) Promedio mensual de lluvia caídas en el año: 129

9) (Superficies de grandes regiones)

SUPERFICIE DE GRANDES REGIONES

50

Europa
a

ea
Millones de km2

40

O c
África

y
30

A
20
Asia
10 América

Antártica
A y Oceanía

Europa
África

América

Antártica

Asia

10) (297 Joven Club de Computación y


electrónica)

En el promedio (media aritmética) de


JCCE por provincia en cada región del
país, no se incluyó a la Isla de la Juventud.

Región (Fi) fi(%) x


Cantidad de JCCE

Occidental 120 40,4 30

Central 86 29,0 17

Oriental 91 30,6 18

Total 297 100 …

11) Alternativa c)

12) (Población de gallinas)

12.1) a) 25 b) Cuantitativa-discreta c)2, 3,

67
4 y 5 d) razones

12.2) a) Mayor 24%, menor 24%. b)19 c) 44%

12.3) Ver gráfico correspondiente

12.4) x = 3,4 Me = 3 Mo = 3

13) (Preferencia por las asignaturas)

Moda: Preferencia por la Computación (La variable


(xi) (Fi)
preferencia está medida en una escala nominal)
Computación 4
La mediana sólo deba aplicarse a datos medidos en

Estadística 4 escala métricas u ordinales, La media aritmética sólo


tiene aplicación práctica cuando se le aplica a variables
Química 2 que estén medidas en escala métricas (De intervalos o de
razones)
Biología 6
14) (Producción de café)

14.1) a) 28% b) La producción media es 5t por


hectárea. Luego, hay 18 plantaciones por
debajo de la producción media y 82 por
encima.

14.2) Ver el gráfico de barras correspondiente.

15) (Distribución de frecuencia absoluta)

(xi) (Fi) D 7 Moda: Persona


delgada
O 4 MD 3
La mediana sólo
G 6 deba aplicarse a datos medidos en escala métricas u
ordinales, La media aritmética sólo tiene aplicación
BP 5
práctica cuando se le aplica a variables que estén
medidas en escala métricas (De intervalos o de razones)

68
16) (Dos equipos de pelota)

Los alumnos que aspiran a formar parte de un equipo con marcada estabilidad en la
cantidad de juegos ganados por temporadas les convienen entrenar con el equipo B.

17) a) 101 km/h b) 42% c) La tercera clase

d) Para completar la respuesta escribe en el


gráfico el título del polígono y los valores
correspondientes en los ejes de coordenadas.

18) (Investigación antropométrica)

Marca de
CLASES clase (xi) Fi fi(%) Fi(acumulada) fi(acumulada)
118 -124 121 1 2,5 1 40 2,5 100

124 - 130 127 3 7,5 4 39 10 97,5

130 -136 133 4 10 8 36 20 90

136 -142 139 5 12,5 13 32 32,5 80

142 -148 145 10 25 23 27 57,5 67,5

148 -154 151 6 15 29 17 72,5 42,5

154 160 157 4 10 33 11 82,5 27,5

160 -166 163 4 10 37 7 92,5 17,5

166-172 169 1 2,5 38 3 95 7,5

172-178 175 2 5 40 2 100 5

69
19) (Población de gallinas) Media: x = 3,4 Desviación típica: s = 1,1

20) (Producción de café) Media: x = 5,7 Desviación típica: s = 1,3

21) El gráfico B presenta mayor desviación típica o estándar. Esto se aprecia porque la
diferencia entre las alturas de las barras altas y bajas es más notable que en el
gráfico A. Significa que hay trabajadores que viven muy cerca de la Empresa y otros
muy lejos.

22) (Resultados de un examen)

a) 7,5 b) [6; 8) c) 40 alumnos (60 ó más puntos) d) 7,5 e) Peor nota: 0.3 puntos.
Mejor nota: 10 puntos. f) Las 10 notas peores son: 0,3; 1,8; 2,7; 2,7; 3,2; 3,9;
4,3; 4,4; 4,7; 5,5 y lasa 10 mejores: 8,7; 8,7; 8,8; 8,8; 9,1; 9,3; 9,3; 9,5;
9,9; 10

23) (pulsaciones por minuto)

a) [100;110 )

70
b) x = 104

c) Ver el gráfico correspondiente.

d) Mediana: Me = 103,3 Moda: Mo = 103,1

71
10. APÉNDICE : USO DEL SIGNO DE SUMATORIA

Si quisiéramos – por ejemplo – escribir de forma simplificada la suma S de los diez


primeros números naturales que son cuadrados perfectos, podemos proceder de la
siguiente forma:
10
S = 1 + 4 + 9 + 16 + 25 + 36 + 49 + 64 + 81 + 100 S = ∑ n 2 donde ∑ es la letra griega
n =1

sigma mayúscula que representa la letra S.


10

∑n
n =1
2
se lee: suma de los valores de n2 desde n = 1 hasta 10.

Ejemplo

Escribir las siguientes sumas utilizando el signo de sumatoria:


n
a) S = 1 + 2 + 3 + 4 + 5 + ... + n Respuesta: S = ∑ i
i =1

21
b) S = 2 + 4 + 6 + 8 + ... + 42 Respuesta: S = ∑ 2k
k =1

n
1 1 1 1 1
c) S = + + + ... + Respuesta: S = ∑
2 3 4 n k =1 k

n
d) S = X1 + X 2 + X 3 + ... + X n Respuesta S = ∑ X k
k =1

n
e) S = X1F1 + X 2 F2 + ... + X n Fn Respuesta S = ∑ X i Fi
i =1

Actividad independiente para desarrollar habilidades en el uso del signo de


sumatoria.

Escribir usando el signo de sumatoria las sumas que se plantean en el epígrafe 10,
(ejercicios 1,2 y 3) de la página 10 del libro Matemática 12º grado. Parte 1.

72
11) BIBLIOGRAFÍA

ÁLVAREZ HERRERO, FERNANDO. et al. Matemática. BUP 1o. CIDEAD. Madrid. 1995

ÁLVAREZ HERRERO, FERNANDO. et al. Matemáticas pruebas objetivas. BUP 1o.


CIDEAD. Madrid. 1995

BRUNHEIRA, LINA. Et al. La Solución. Matemática 10. Texto Editora. Portugal.1997.

CUÉ MUÑIZ, JUAN L. et al. ESTADÍSTICA. Impreso por la Facultad de Matemática


Cibernética de la Universidad de la Habana. La Habana. 1987.

FREUND, JOHN E. Estadística Elemental Moderna. Editorial Pueblo y Educación.


Ciudad de la Habana. 1977.

GENER NAVARRO, ENRIQUE J. et al. Elementos de la Informática Básica. Editorial


Pueblo y Educación. La Habana. 2001.

GMURMAN, V. E. Problemas sobre la teoría de las probabilidades e Estadística


Matemática. Editorial Mir. 1975.

GMURMAN, V. E. Teoría de las probabilidades e Estadística Matemática. Editorial Mir.


1974.

GONZÄLEZ DE MESA, PAZ. et al. Matemática 3. Ministerio de Educación y Cultura.


Material elaborado por Acción educativa, España, 1997.

KAROLIUK, V. S. Manual de la teoría de las probabilidades y Estadística Matemática. .


Editorial Mir. 1986.

MICROSOFT ® ENCARTA ® 2006. © 1993-2005 Microsoft Corporation.

MONTOJO, ROSINA. Matemática lll. Ediciones Educativas. Madrid.1997.

MURRAY R. SPIEGEL. Teorías y problemas de ESTADÍSTICA. Ediciones de Ciencia y


Técnica. Instituto cubano del libro. La Habana. 1981.

OFICINA NACIONAL DE ESTADÍSTICA. ONE. Anuario Estadístico de Cuba 2002.


Ciudad de la Habana. 2003.

VIEIRA LÓPEZ, ANA. et al. Matemática 10. Volumen 1. Ediciones contrapunto.


Portugal. 1998.

73
74

También podría gustarte