Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Descriptiva
AUTORES
M.Sc. Francisco E Rodríguez Meneses
Lic. Emma García Enis
Dra. Marta Álvarez Pérez
M.Sc. Aurelio Quintana Valdés
Contenido Pág.
INTRODUCCIÓN 3
3.3) Pictogramas 20
5.3) Mediana 38
5.4) Modas 39
6.3) Variancia 43
1
7.1) Media aritmética 46
7.2) Mediana 48
7.3) Modas 50
11. BIBLIOGRAFÍA 73
2
INTRODUCCIÓN
Por su parte, los egipcios del siglo XXXI (a.n.e) – anterior a la construcción de las
pirámides– representaron datos sobre la población y los índices de renta en el país.
Antes del año 2000 (a.n.e), los chinos realizaron estudios sobre la población y las
posibilidades materiales de sus habitantes. En tanto, los griegos –con el propósito de
cobrar los impuestos– llevaron a cabo un censo de población cuyos resultados fueron
utilizados hasta los alrededores del año 594 (a.n.e) y el gran imperio romano fue el
primero que con un interés gubernamental, recopiló numerosos datos sobre población,
superficies y rentas en todos los territorios bajo su control.
Muchos fueron los continuadores de Graunt y es en la segunda mitad del siglo XIX en
que se produjo el desarrollo matemático de la Estadística. Francis Galton (1822-1911) y
Karl Pearson (1857-1936) fueron dos matemáticos que contribuyeron mucho a su
3
evolución. Las técnicas estadísticas comenzaron a tener marcada importancia en la
Astronomía y en la teoría de los Gases. Es por eso que las Ciencias Sociales y la
Físicas aceleraron la creación y aplicación de los métodos estadísticos.
Los que habitamos la sociedad de hoy no podemos actuar como en los tiempos de los
babilonios hace más de 5000 años. En la actualidad es necesario realizar estudios
profundos sobre todos los procesos que garantizan la vida en el planeta, los que dan
continuidad al desarrollo y preservación de las diferentes especies de animales y
4
plantas que lo habitan y al mismo tiempo salvar y enriquecer el patrimonio que el propio
hombre ha construido.
Muchos ejemplos pueden ilustrar con absoluta claridad la importancia que tiene el
conocimiento, la recopilación, el procesamiento y el análisis de los datos que describen
determinados eventos:
Hacer un pronóstico y tomar decisiones sobre las temperaturas, las lluvias, los períodos
de sequías, la erosión y la degradación de los suelos o cualquier fenómeno atmosférico
o climatológico, implica – sin lugar a dudas – el estudio profundo y continuado de los
resultados históricos, físicos, químicos, biológicos que han influido y que resultan de
interés para los especialistas.
1
Ataxia, alteración, parcial o total, de la coordinación muscular. Puede manifestarse como temblor
involuntario de partes del cuerpo durante la realización de movimientos voluntarios (típicamente en las manos),
como dificultad para realizar movimientos precisos, o como dificultad para mantener el equilibrio de la postura
corporal.
5
Para el diseño y producción de artículos de vestir es muy bueno considerar el estudio
de índices tan cambiantes como la preferencia, las necesidades de uso, la moda
predominante, la época del año en que saldrá al mercado; no solo para obtener
mayores resultados económicos, sino también, para lograr un impacto social positivo.
Otro ejemplo que puede ilustrar con claridad el objeto de la Estadística Inferencial es el
siguiente:
6
información necesaria se extrae una pequeña muestra de sangre y de esta forma se
puede inferir sobre la concentración de leucocitos en los 5 ó 6 litros, de este líquido
circulante, que posee el cuerpo humano.
Por otro lado, la parte de la Estadística que estudia una población a partir de considerar
todos los elementos que la integran, sin derivar conclusiones sobre un grupo mayor, se
denomina ESTADÍSTICA DESCRIPTIVA.
• La temperatura promedio en los meses de inviernos alcanzó este año los 16º C.
• Durante este año los índices de reforestación superaron en un 25% a los logrados el
pasado año.
Ejemplo 1
7
• Consistencia del helado.
Las variables estadísticas son cada una de las características que se estudian en los
elementos (individuos) de una población. Estas son de diferentes tipos y toman valores
numéricos o no.
Tipos de variables
Cualitativas
Cuantitativas discretas
continuas
8
Tiempo de duración de un suceso o evento (2 minutos, 3 horas, 1,5 horas,…).
Variable estadística discreta: Cuando solo pueden tomar un número finito o a lo sumo
numerable de valores, con los cuales es posible establecer una correspondencia
biunívoca con el conjunto de los números enteros o subconjuntos propios de éste.
Ejemplo 4: Son variables cuantitativas discretas las siguientes:
Volumen de agua en una presa en metros cúbicos (todos los valores reales no
negativos del intervalo)
Tiempo que puede durar cualquier proceso. (cualquier valor real no negativo).
Ahora, retomando el ejemplo 1 podemos identificar las variables que se estudian, el tipo
y las categorías medibles o valores que puede tomar en cada caso.
Tabla 1
Nominal
Ordinal
De intervalos
De razones
10
La igualdad se obtiene entre elementos de una misma categoría o clase.
No existe una relación de orden entre los elementos ni entre las clases.
Se dice que las clases son excluyentes cuando un elemento o individuo cualquiera de
una de ellas no puede ser considerado en otra, y son exhaustivas, porque la unión de
todas las clases es igual a la población que se estudia.
SEXO
NÚMERO DE Tabla 2
ALUMNOS
En este ejemplo dos elementos de la misma
MASCULINO 11
clase son iguales en virtud de la variable que
FEMENINO 19
se mide (el sexo) y diferentes a uno cualquiera
TOTAL 30
de la otra clase.
Existe una relación de orden entre los elementos de dos clases diferentes.
11
En las variables que se miden mediante una escala nominal u ordinal, la cuantificación
se realiza mediante el conteo de los elementos de cada clase, es decir, determinando la
frecuencia de la clase.
Relación de orden bien definida internamente en cada una de las clases y entre
las clases.
El valor cero no es absoluto (no significa ausencia del atributo que se mide)
Tabla 4
Relación de orden bien definida internamente en cada una de las clases y entre
las clases.
El valor cero es absoluto, indica la ausencia total del atributo que se mide.
12
ausencia total de líquido en el recipiente – esto quiere decir que el valor cero es
absoluto –. Luego, la variable capacidad en este ejemplo, se mide mediante una escala
de razones o proporciones.
a) Tipo de enfermedad.
d) Peso en kilogramos.
Ejemplo 11: La fábrica del ejemplo 1 cuenta con 85 trabajadores y se quiere realizar un
estudio basado en los siguientes índices:
d) Turnos de trabajo.
Escala de
Tipo de
Variable Valores de la variable medición de la
variable
variable
13
a) Nivel cultural de Primario, Medio básico, Medio Ordinal
Cualitativa
cada trabajador superior y Universitario
b) Cantidad de Cuantitativa
0; 1; 2; 3; 4; 5;… De razones
discreta
ausencias
e) Calidad de los
Cualitativa Baja, media, alta Ordinal
helados.
Tabla 5
Ejemplo 12:
Al analizar los índices de la emulación por la sede del acto en conmemoración del
asalto al Cuartel Moncada el 26 de julio de 1953, una zona de los Comités de Defensa
de la Revolución (CDR) evaluó el cumplimiento de los compromisos de donaciones de
sangre mediante la siguiente información. En esta se muestra la cantidad de
donaciones de cada uno de las 22 organizaciones de bases de los CDR de la zona
durante el mes de enero:
4 7 12 18 12 7 17 17 12 2 4 Tabla 6
4 2 12 9 4 12 12 7 2 4 12
14
En este ejemplo podemos identificar los siguientes valores estadísticos:
Tamaño de la población: N = 22
Los datos anteriores, los cuales no han sido organizados reciben el nombre de datos
primarios. Estos valores pueden ponerse en orden (ascendente o descendente) para
facilitar su análisis y conteo. Un arreglo ordenado de estos datos primarios (que pudiera
contener un número mucho mayor de datos) es el siguiente:
2 2 2 4 4 4 4 4 7 7 7
9 12 12 12 12 12 12 12 17 17 18
Tabla 7
12 / / / / / / = 7 7
17 / / = 2 2
18 / = 1 1 Tabla 8
15
Con el objetivo de mejorar la descripción de los datos las tablas de frecuencias
contienen otras columnas, esto se ilustra en la que se presenta a continuación:
Fai fai
3
2 3 0,136 13,6 3 22 0,136 1,000
22
5
4 5 0,227 22,7 8 19 0,363 0,864
22
3
7 3 0,136 13,6 11 14 0,449 0,637
22
1
9 1 0,046 4,6 12 11 0,545 0,501
22
7
12 7 0,318 31,8 19 10 0,863 0,455
22
2
17 2 0,091 9,1 21 3 0,964 0,137
22
1
18 1 0,046 4,6 22 1 1,000 0,046
22
22
------- 22 =1 1 100 ----- ------ ------- ------
22
Tabla 9
F
Frecuencia relativa fi: es el cociente f i = i , entre la frecuencia absoluta y el tamaño
N
de la población que se estudia. Esta se puede expresar en fracciones simples, en
notación decimal y en forma porcentual como se muestra en las columnas 3, 4 y 5
respectivamente, en la tabla 9.
16
caso N = 22).
valores de las frecuencias, esto se puede realizar acumulando de arriba hacia abajo o
viceversa, según sea el interés del estudio que se pretende realizar.
Ejemplo 13:
1) ¿Qué tanto por ciento de los CDR lograron realizar 12 donaciones de sangre?
3) ¿Qué tanto por ciento de los CDR de la zona realizaron más de 9 donaciones de
sangre?
4) ¿Qué porcentaje de los CDR estuvo por debajo de las 12 donaciones de sangre?
17
horizontal).
Ejemplo 14
La siguiente tabla muestra los resultados de una encuesta realizada a los 980
estudiantes de un centro universitario, con el objetivo de conocer su opinión sobre la
transmisión televisiva de la Serie Nacional de Baseball en el horario de la telenovela.
Indiferentes (I) 18 58
No respondieron (NR) 2 14
18
El gráfico de la Fig.2 permite, en cada una
de las categorías evaluadas, establecer
una comparación entre la opinión de los
hombres y la de las mujeres, para ello se
utilizaron dos barras unidas; la de la
izquierda corresponde a la cantidad de
hombres y, por supuesto, la de la derecha
al número de mujeres incluidas en cada
categoría. (xi) categorías Fig. 2
Para usar este sencillo asistente se deben realizar los siguientes pasos:
b) Elegir el tipo de gráfico que se quiere construir de acuerdo con las tres opciones que
brinda: gráfico de sectores, gráfico de barras y gráfico de líneas.
c) Describir con una etiqueta el contenido del gráfico (por ejemplo: cantidad de mujeres)
d) Elige el tipo de color a utilizar (Estándar, pastel, brillante o grises) y completar la tabla
con el nombre de los ítems (variables) y la frecuencia correspondiente.
19
Nota: para ir de un paso a otro se usan las opciones Atrás y Siguiente de cada página.
3.3) Pictogramas
Otro tipo de gráfico muy utilizado es el pictograma que como su nombre lo indica
requiere de cierta creatividad y de arte. En el se sustituyen las barras por dibujos que
representan la frecuencia correspondiente a cada valor de la variable que se estudia.
Ejemplos de pictogramas:
Fig. 4
Ejemplo 15
Acumulado máximo
La tabla 11 y la figura 5 muestran el mayor Año
(millones de m3)
acumulado de agua, en millones de metros
cúbicos, alcanzado por una presa durante el año 2000 900
2003 850
2004 500
20
En esta modalidad de pictograma (Fig. 5) se recibe información por dos vías diferentes;
por el tamaño de la gota de agua –algo que llama la atención a simple vista– y por el
cartel interior en cada una de ellas. (
Fig. 5
reduce a una simple fórmula: αO = 3,6O ⋅ f i (%) donde f i (%) es la frecuencia relativa
Los gráficos circulares son de mucha utilidad para representar distribuciones que tienen
pocos valores diferentes, pues, la comparación de los sectores de acuerdo a la
amplitud, ofrece una imagen visual fácil de comprender, y se gana en información
cuando además aparecen los valores de las frecuencias correspondientes.
Ejemplo 16
21
A: Peloteros formados completamente en escuelas de deporte.
xi Fi fi (%)
A 28 70
B 8 20
C 4 10
Tabla 12
Fig. 6
Fig. 7
Ejemplo 17
En la siguiente tabla se registran los 182 votos de los países distribuidos por regiones
22
geográficas que, desafiando al imperio, apoyaron la resolución presentada por Cuba.2
Tabla 13
Xi Fi fi(%) αo
Cálculo de αo
2
Datos tomados del periódico juventud rebelde. 9-11-2005. p.5
23
E 28 15,38 55O 3,6o ⋅ 15,38 ≈ 55o
Tabla 14
24
4. REPRESENTACIÓN DE DATOS AGRUPADOS MEDIANTE TABLAS Y GRÁFICOS
Para describir una cantidad grande de datos o para estudiar una variable a partir de
determinadas categorías, es conveniente organizarlos en clases y definir el número de
individuos (u observaciones de la variable) que pertenecen a cada una de ellas.
Ejemplo 18
Los datos primarios fueron registrado en una tabla utilizando una hoja electrónica de
cálculo del EXCEL, en ella se puede expresar el nombre de las 3360 observaciones
(mayores consumidores de agua) realizadas en la zona que se estudia y el consumo
semanal, en metros cúbicos, correspondiente a cada una.
A continuación se presenta una sección de una tabla (que completa tiene 240 filas y 14
columnas) donde es posible observar un ejemplo de algunos de los consumos
registrado:
4,17 21,3 2,05 15,17 33,4 12,3 1,1 3,2 17 34,2 39 12 6,01 24
… … … … … … … … … … … … … …
… … … … … … … … … … … … … …
25
12.5 31,7 23 4,02 12 21 21 3,02 13 33,4 21 39 12 15
Tabla 15
Es fácil comprender que en la forma en que aparecen representados los datos primarios
en la tabla 15, se dificulta el procesamiento, y más aun, si aumenta el volumen de ellos.
Se tienen muchos valores diferentes de la variable, si se hace directamente la tabla de
frecuencias sería muy larga con muchos valores de frecuencia muy baja. Luego, para
resolver esta problemática se puede distribuir los diferentes valores del consumo en
clases o categorías, como se muestra en la tabla 16.
Para ello es necesario determinar, a partir de los datos primarios de la variable que se
investiga, cuál es el dato menor y el dato mayor que se llamarán, Xmín y Xmáx
respectivamente. De esta forma, los N datos de la muestra están incluidos en el
intervalo [Xmín, Xmáx]. Organizar los datos primarios en clase, consiste en construir h
"intervalos más pequeños" mutuamente excluyentes, el los cuales estén distribuidos los
N datos que contiene la muestra que se estudia. Esta idea se ilustra en la figura 10.
Fig. 10
26
(frecuencia absoluta Fi)
Es importante destacar que para una mayor comprensión las clases han representado
mediante la notación habitual de intervalos numéricos, más adelante se introducirán
otras formas de notación.
Límites de clases: mayor y menor valor de una clase, los cuales se denotan por Li y Ls
para indicar el límite inferior y el superior respectivamente.
Estos valores expresados en forma general se pueden ejemplificar a partir de los datos
agrupados en la tabla 17.
Amplitud de
Clases Fi Li Ls Marca de clase
clase
27
[26 ; 31) 210 5 26 31 28,5
Tabla 17
Las clases deben ser exhaustivas- abarcar todas las mediciones- y mutuamente
excluyentes.
Deben evitarse las clases de frecuencia nula. La amplitud de las clases se debe
elegir de modo que en el núcleo o centro de la tabla estén ocupadas todas las
clases.
Ejemplo 19
28
20 60 27 50 21 71 40 58 39 28
37 29 15 66 55 17 50 53 30 39
51 36 41 58 35 38 48 19 37 40
42 56 34 37 79 18 54 39 61 22
52 23 41 33 32 43 64 37 49 40
57 43 24 67 44 75 41 55 25 59
21 31 53 45 30 15 62 40 50 45
43 29 28 47 58 79 40 56 46 69
54 45 68 17 27 51 40 63 49 37
47 57 26 55 47 26 39 22 52 39
Tabla 18
Clases Fi 70 – 80 4
29
Luego, a partir de los datos de la tabla 19, se pueden diferenciar los siguientes valores:
Amplitud de clases: 11
Clases Fi (Cantidad de
(consumo en m3) usuarios)
1–6 301
6 – 11 690
11 – 16 1024
16 – 21 720
21 – 26 290
26 – 31 210
31 – 36 84
36 – 41 41
Tabla 20 3360
Es bueno aclarar que los límites presentados no son los límites de clase reales.
Los límites de clase reales se obtienen sumando media unidad (0,5) al límite superior y
30
restando media unidad al inferior. Luego en el caso presentado (tabla 20), para el
intervalo 16 – 21 serían 15,5 y 21,5 los limites de clase reales inferior y superior,
respectivamente.
Este tipo de gráfico se construye mediante columnas o rectángulos unidos. Así, sobre
cada intervalo de clases representado en una escala continua del eje real, se levanta un
rectángulo que tiene como base la amplitud del intervalo de clases y como altura, el
cociente entre frecuencia absoluta (o relativa) y la amplitud de la clase correspondiente,
Fi
es decir, hi = (ó h i = f i , si se trata de frecuencia relativa) es la altura del rectángulo
li li
que se levanta sobre la clase "li". De esta manera el área de cada rectángulo es igual a
la frecuencia absoluta (o relativa) de la clase correspondiente.
Ejemplo 20
Para construir este tipo de gráfico, sobre el eje horizontal se colocan, de forma
consecutiva, los valores de los límites de clases, en este caso se trata de situar los
números: 1, 6, 11, 16, 21, 26, 31, 36 y 41.
Para obtener la escala del eje vertical es necesario tener en cuenta que el área de cada
rectángulo es igual, a la frecuencia correspondiente (en este ejemplo a la frecuencia
absoluta). Lo anterior significa que es necesario dividir cada valor de la frecuencia
absoluta por 5, de esta forma se obtiene los siguientes resultados:
31
290 : 5 = 58 210 : 5 = 42 84 : 5 = 16,8 41 : 5 = 8,2
Tabla 21
Así, los valores de la escala en el eje vertical es: 8,2; 16,8; 42; 58; 60,8; 138; 144 y
204, 8
Fig. 11
Ejemplo 21
32
Fig. 12
Ejemplo 22
Para dar respuesta a este problema es conveniente incorporar dos columnas a la tabla
20, y de esta forma representar la frecuencia absoluta acumulada de arriba hacia abajo
y viceversa.
33
Clases Fi
(consumo en (Cantidad de Fi ↓ Fi ↑
m3) usuarios)
36 – 41 41 3360 41
Tabla 22
Fig.13 Fig.14
10
Este tipo de polígono, que muestra la frecuencia acumulada (absoluta o relativa) se
denomina ojiva . Las figuras 13 y 14 describen , respectivamente, la frecuencia
34
absotuta acumulada de arriba hacia abajo (acumulado por abajo) y de abajo hacia
arriba (acumulado por arriba).
A partir de la figura 13 que es una ojiva que expresa el acumulado por abajo, se puden
formular preguntas como:
¿Cuántos usuarios tienen un gasto igual o inferior a los 16 m3 de agua en una semana?
La Mediana
Las modas
Muchos son los problemas en los cuales es importante representar un grupo de datos
por un solo valor que es, por decirlo así, descriptivo del grupo entero. Las medidas de
tendencia central, que como su nombre lo indica, son valores que tienden a ocupar una
posición alrededor del cual se agrupan el mayor número de datos. Estos permiten la
descripción de la variable (o variables) que es objeto de estudio.
35
5.1) Media aritmética
Definición: Sean x1, x2, x3,…, xn, n valores medidos. La Media Aritmética x se calcula
x1 + x2 + x3 + ... + xn
mediante la fórmula: x = y de manera abreviada, usando el símbolo
n
n
∑ xi 1 n
de sumatoria, la fórmula es: x= i =1
n
= ∑ xi
n i =1
(ver el apéndice)
Ejemplo 23
Cantidad de trenes que arribaron diariamente a una estación durante la última semana
de octubre del presente año.
Cantidad de trenes 18 14 25 21 13 18 23
Tabla 23
18 + 14 + 25 + 21 + 13 + 18 + 23 132
x= = ≈ 18,86 Así x ≈ 19 trenes
7 7
• es una función algebraica de los datos individuales. Esto significa que la modificación
de cualquiera de los datos hace variar el valor de la media.
Hay algunos problemas en los cuales es imposible promediar cantidades sin tomar en
36
cuenta, de alguna manera, su importancia relativa dentro de la situación global que se
está tratando de describir. Por ejemplo, si en un agromercado se venden tres tipos de
granos a $3,50, $4,60 y $5,75 es imposible determinar el precio global de lo que se
vende si no se considera el número de libras vendidas de cada tipo de granos. Si la
mayoría de las libras vendidas son del tipo más barato la media estará más cerca de
$3,50.
Supongamos que el mercado vendió durante una semana 300 libras del tipo de granos
más barato, 220 de las del precio medio y 96 del más caro. Por un simple cálculo
aritmético el mercado recibió 300($3,50) + 220($4,60) + 96($5,75) = $ 2614 al vender
300 + 220 + 96 = 616 libras de estos granos. Luego el precio promedio por libras es
$ 2614
≈ $ 4 ,24 .
616
xp =
∑ pi ⋅ ni
∑ ni
En el ejemplo presentado, la ponderación pi es el, precio de cada grano (refleja la
importancia relativa de cada tipo de grano) y ni es la cantidad vendida de cada tipo.
Luego aplicando a fórmula tenemos:
3
∑ pi ⋅ ni 3 ,50 ⋅ 300 + 4 ,60 ⋅ 220 + 5 ,75 ⋅ 96 2614
i =1
xp = = = ≈ 4 ,24 Así, el precio medio por
ni 300 + 220 + 96 616
de las 616 libras de grano vendidas es de $4,24 por libras.
37
5.3) Mediana
Ejemplo 24 A
22 23 25 28 30
Ejemplo 25 B
40 43 45 46 48 51
• es aplicable a cualquier tipo de datos que puedan ser ordenados, es decir, tiene
sentido cuando los datos pueden ser medidos por escalas métricas y ordinales.
• no es una función algebraica de los datos individuales, esto significa que no varía
fácilmente al modificar los valores extremos. Se recomienda para distribuciones
asimétricas (es decir, aquellas distribuciones donde los datos se concentran
mayoritariamente a un solo lado de la media aritmética).
38
5.4) Modas
Ejemplo 26
Cantidad de trenes que arribaron diariamente a una estación durante el mes de febrero
18 16 25 21 23 17 18 21 18 17 15 12 18 18
22 20 20 21 12 15 18 17 20 22 23 20 18 15
Tabla 24
# de trenes (xi) 12 15 16 17 18 20 21 22 23 25
# de días (Fi) 2 3 1 3 7 4 3 2 2 1
Tabla 25
Ejemplo 27
(xi) 0 2 3 4 5 6 7
(Fi) 1 1 6 6 3 4 1
Tabla 26
Existen dos datos con la misma frecuencia, uno a continuación de otro, en este caso la
3+4
moda es la media aritmética de estos valores, así: M O = 3,5
2
39
Ejemplo 28
(xi) 1 2 3 4 6 9 10
(Fi) 3 7 6 8 3 7 1
Tabla 27
Existen dos datos con la misma frecuencia (7), pero no están a continuación uno del
otro, en este caso existen dos valores modales: M O1 = 2 y M O 2 = 9 . Luego estamos
Ejemplo 29
(xi) 1 2 3 4 6 9 10
(Fi) 5 5 5 5 5 5 5
Tabla 28
En este ejemplo, todos los datos aparecen con la misma frecuencia, es decir, no existe
un valor que posea una frecuencia mayor que los demás. Luego en esta distribución no
existe un valor modal.
• no es única y puede no existir cuando todos los valores tienen la misma frecuencia,
40
la variabilidad de la información de acuerdo con estos valores de descripción, es decir,
la dispersión o concentración de los datos alrededor de determinados valores.
Recorrido o rango
Desviación media
Varianza
Coeficiente de variación
Ejemplo 30
GRUPO A GRUPO B
A1 3 B1 5
A2 4 B2 5
A3 5 B3 6
A4 9 B4 8
A5 10 B5 8
A6 10 B6 9
∑ xI 41 ∑ yI 41
Mediana Me 7 Mediana Me 7
Tabla 29
41
En este caso los dos grupos de datos tienen igual media aritmética e igual mediana, sin
embargo, a simple vista se puede comprobar que el grupo A es más heterogéneo que el
B. Las puntuaciones en el primer grupo varían mucho, hay una marcada diferencia
entre las notas bajas y altas, en tanto, en el segundo grupo hay menor variación entre
las puntuaciones altas y las bajas, luego, el grupo B es más homogéneo que el A.
Es una medida simple de dispersión que se puede utilizar para una comparación
primaria de un grupo de distribuciones. Es poco confiable, pues considera sólo las dos
observaciones extremas, con independencia de la forma de la distribución y de las
frecuencias de las variables individualmente.
Así en el grupo “A”se tiene que el rango es RA = 10 – 3 = 7 y por otro lado en el grupo
“B” RB = 9 – 5 = 4, es decir, existe mayor diferencia entre las puntuaciones altas y
bajas en el grupo “A”. Esto indica mayor dispersión de los datos en el grupo “A” en
relación con el “B”.
El rango es alterado por valores extremos que ocurren de manera casual, por lo que no
es estable y se recomienda su uso solo para muestras no mayores de 12.
Es una medida de dispersión que en la actualidad tiene poco uso, pero es bueno
conocerla para comprender mejor las otras, esta se define como la media aritmética de
los valores absolutos de las diferencias entre los datos y su media aritmética. Esto se
expresa mediante la siguiente fórmula:
n
x1 − x + x2 − x + ... + xn − x ∑ xi − x
i =1
Dx = = Donde x es la media aritmética de
n n
42
GRUPO A GRUPO B
xi xi − x yi yi − y
Tabla 30
La desviación media puede tener sus atractivos como medida de variación, pero no es
la más utilizada, por lo que se necesita estudiar otras medidas de variación de mayor
alcance.
6.3) Variancia
La varianza de un conjunto de datos x1, x2, x3,…, xn, se define como la media de los
cuadrados de las desviaciones de los datos la variable respecto a la media.
Comúnmente, se utilizan diferentes notaciones para representar la varianza cuando se
trata de una población finita o de una muestra seleccionada, pero de manera general se
puede utilizar el símbolo V para su referencia y cálculo. Esto se expresa mediante la
siguiente fórmula:
43
( x1 − x )2 + ( x − x ) 2 + ... + ( x n − x )2 1 n
V(X) = = ∑ ( xi − x )2
n n i =1
Los estudios estadísticos han demostrado que para el cálculo de la varianza muestral
de una muestra de tamaño N, es más conveniente modificar la fórmula anterior
dividiendo por N – 1 en lugar de dividir por N. En lo adelante, para el trabajo con la
Estadística Descriptiva que es a la cual está dirigido este material, utilizaremos la
fórmula como la hemos presentado en la definición de Varianza.
Propiedades de la Varianza
3) La varianza de una variable que toma valores constantes es igual a cero, es decir,
V(k) = 0, siendo k una constante. Significa que si todos los valores de la variable X
son iguales a una constante k, entonces X = k , luego la desviación de cada uno de
los datos respecto a la media es cero.
44
fórmula para el cálculo de la varianza y las propiedades del signo de sumatoria y las de
la varianza en sí.
La desviación típica o estándar varía menos que otros estadígrafos cuando se calcula
para varias muestras extraídas de una misma población. Esto hace que sea la medida
de dispersión más usada y de mayor confianza para los estadísticos.
∑ (x i )
n 2
− x
i =1
s = V =
n
Con la desviación típica o estándar se tiene una idea del grado de desviación promedio
en la distribución, en nuestro caso se puede afirmar que con respecto a la variable
calificaciones existe mayor concentración de la notas en el grupo B, mientras que con
respecto a esa misma variable, el grupo A es más heterogéneo.
Ejemplo 31
Experimento x s V
Se pudiera pensar que la dispersión disminuye poco, pero esto no se corresponde con
la realidad. La variabilidad de los resultados individuales disminuye con el tiempo. En el
primer experimento la dispersión representa el 34 % de la media y en el décimo solo el
16% de esta.
46
n
F ⋅ x + F2 ⋅ x2 + ... + Fn ⋅ xn
∑ Fi ⋅ xi
i =1
mediante la fórmula: x= 1 1 =
F1 + F2 + ... + Fn n
∑ Fi
i =1
Donde:
Hallar el consumo semanal promedio de agua en la zona del ejemplo 18, cuyos datos
aparecen en la siguiente tabla:
Marca de clase Fi ⋅ x i
Clases Fi
xi
Tabla 31
47
volumen de datos agrupados es:
n
∑ Fi ⋅ xi 51255
i =1
x= n
= ≈ 15,25
3360
∑ Fi
i =1
7.2) Mediana
n
− Fa m −1
M e = L i + 2 ⋅ l Donde:
Fm
Ejemplo 33
Hallar la mediana del consumo semanal de agua en la zona del ejemplo 18, utilizando
los datos registrado en las tres primeras columnas de la tabla 31.
48
Para responder este problema es necesario identificar los valores de cada una de las
variables que intervienen en la fórmula:
Fam −1 = 991 (Frecuencia absoluta acumulada hasta la clase anterior a la clase mediana
3360
− 991
M e = 10 ,5 + 2 ⋅ 5 = 10 ,5 + 1680 − 991 ⋅ 5 = 10 ,5 + 689 ⋅ 5 ≈ 10 ,5 + 0 ,673 ⋅ 5
1024 1024 1024
M e ≈ 10 ,5 + 3 ,37 = 13 ,9
49
al eje horizontal, trazada por el punto que contiene a la mediana (15,3 en este caso),
divide al área total que ocupan los rectángulos, en dos regiones de igual área; una a la
izquierda del valor de la mediana y la otra a la derecha. en dos parte iguales. Esto se
cumple de manera general, por tanto se considera el significado geométrico de la
mediana de un conjunto de datos agrupados
13,9 Fig.15
7.3) Modas
n1
MO = L i + ⋅ l Donde:
n1 + n2
n1: Exceso de la frecuencia modal sobre la frecuencia de la clase anterior más próxima.
Esta fórmula se puede comprender mejor a partir del significado geométrico de la moda
50
en un conjunto de datos agrupados.
Fig.16
Supongamos que la figura corresponde a
una sección de un histograma de
frecuencias donde aparecen
representados el rectángulo de la clase
modal, el de la anterior y el de la posterior
a esta.
EP PF
= , en virtud de la proporcionalidad entre elementos homólogos. Luego,
RQ ST
M O − Li L S − M O
sustituyendo se tiene: = y aplicando la propiedad fundamental de las
n1 n2
n1LS + n2 LS
proporciones y transformaciones algebraicas equivalentes se obtiene M O =
n1 + n2
n1( L i +l ) + n2 Li
pero LS = Li + l (l es la amplitud de la clase modal) entonces, M O = ,
n1 + n2
(n1 + n2 )Li + n1 l
MO = , ahora aplicando la propiedad distributiva de la división respecto
n1 + n2
n1
a la suma se obtiene M O = Li + ⋅ l que es la fórmula empírica que hemos
n1 + n2
utilizado para el cálculo algebraico de la mediana.
Ejemplo 34
Hallar la moda del consumo semanal de agua en la zona del ejemplo 18, utilizando los
datos registrado en las tres primeras columnas de la tabla 31.
En este caso la clase de mayor frecuencia es la 11-16 que tiene frecuencia Fi = 1024.
Así:
n1 334
Ahora aplicando la formula MO = L i + ⋅ l tenemos: M O = 10,5 + ⋅5
n1 + n2 334 + 304
334
M O = 1o,5 + ⋅ 5 ≈ 10,5 + 0,52 ⋅ 5 = 10,5 + 2,6 = 13,1
638
52
8. EJERCICIOS PARA LA PRÁCTICA Y EL REPASO
• Sexo
• Nivel cultural.
• Calificación técnica.
Identifica la variable que se evalúa, clasifícala, plantea ejemplos de los valores que
puede tomar e indica la escala de medición en cada caso.
68 84 75 82 68 90 62 88
73 79 88 73 60 93 71 59
61 65 75 87 74 62 95 78
66 78 82 75 94 77 69 74
96 78 89 61 75 95 60 79
79 62 67 97 78 85 76 65
65 80 73 57 88 78 62 76
53
86 67 73 81 72 63 76 75
76 85 63 68 83 71 53 85
93 75 72 60 71 73 74 77
Determina:
11 15 14 12 11 14 14 13 15 16
12 12 14 14 15 15 13 14 15 13
54
obtuvieron los siguientes datos por camada:
5 6 7 4 2 5 1 3 4 6
5 2 3 4 2 5 4 5 7 6
5 3 1 2 6 5 6 4 5 2
1 7 9 7 6 6 4 3 8 1
3 2 8 4 1 7 2 2 4 3
4 5 6 2 3 3 1 2 8 7
5) En una escuela con matrícula de 800 estudiantes se realizó una encuesta sobre la
preferencia de programas de televisión, obteniéndose los siguientes resultados:
Programas Alumnos
Deportivos 80
Musicales 120
Infantiles 240
Noticieros 200
Culturales 160
b) Pictograma
55
n 1 2 3 4 5 6
c) La frecuencia relativa de obtener 6, cuando se lanza el dado 100 veces es: ___
d) La frecuencia relativa porcentual de obtener 3, al lanzar el dado 100 veces es: ___
"Al lanzar un dado 100 veces la mayor posibilidad es obtener un tres y la menor,
obtener seis".
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
24 20 18 19 17 20 23 18 20 18 21 23
8) A continuación aparecen representados una tabla y dos gráficos que expresan los
datos (en milímetros), de la cantidad de agua caída (como promedio), en un
municipio durante los doce meses del año 2003
Ene. Feb. Mar. Abr. May Jun. Jul. Ago. Sep. Oct. Nov. Dic.
.
56
300
300
250 250
200 200
150 150
100 100
50 50
0 0
Ene. Mar. May. Jul. Sep. Nov.
.
e.
l.
p.
.
.
ov
ay
ar
Ju
En
Se
M
N
M
a) Identifique cada uno de los gráficos representados
África 30 Asia 44
Australia y
América 42 9
Oceanía
Antártica 14 Europa 10
10) La siguiente tabla muestra la distribución de los 297 clubes de computación "Joven
club " del país hasta el año 2002.
57
Pinar del Río 18 Ciego de Ávila 15
La Habana 28 Camaguey 20
Matanzas 23 Holguín 23
a) Construye una tabla de frecuencia haciendo una distribución de los datos por
regiones (occidental, central y oriental).
b) Halla la cantidad media de estos clubes por provincias en cada región del país.
d) Construye una tabla como la anterior donde muestres la cantidad actual de estos
clubes en cada uno de los municipios de tu provincia.
58
Selecciona la alternativa correcta
xi 0 1 2 3 4
a) ___ El valor de F5 es 6.
Fi 4 3 4 5 F5
b) ___ No se puede conocer el valor de
F5.
2 3 4 3 5 3 2 4 3 5 3 2 5 3 4 2 5 5 4 3 5 4 3 2 2
13) En una encuesta a 16 alumnos sobre la asignatura que prefieren se obtuvieron los
resultados siguientes: Computación, Estadística, Biología, Química, Biología ,
Estadística , Computación , Biología , Computación , Estadística, Biología ,Química,
59
Biología , Estadística ,Computación, Biología.
6 7 6 8 5 5 7 6 5 4 6 8 6 6 5 4 7 5 5 6
7 5 7 5 6 5 6 5 6 5 7 7 7 6 5 5 6 7 5 6
5 6 6 7 7 6 7 4 7 7 4 5 4 4 5 8 8 3 4 6
5 4 3 5 6 3 7 5 7 8 8 8 5 6 5 3 4 6 4 5
5 2 7 6 4 4 6 7 5 5 5 8 8 5 6 6 7 4 6 7
14.1) Representa estos datos en una tabla de frecuencia y realiza las siguientes
actividades:
15) Se observan 25 personas y se clasifican según su aspecto en: Obesa (O), Gruesa
(G), Buen Peso (BP), Delgada (D) y Muy Delgado (MD), obteniéndose los
resultados siguientes:
BP,D,D,MD,O,D,G,G,G,O,BP,BP,D,D,D,O,O,G,G,BP,MD,BP,G,D,MD
16) Los alumnos de un centro deportivo han hecho estadísticas acerca de los resultados
históricos de dos equipos de baseball A y B. En relación con la cantidad de juegos
ganados durante cinco temporadas se registraron los siguientes datos:
60
PROMEDIO DE JUEGOS GANADOS
DESVIACIÓN ESTANDAR
POR TEMPORADAS
Equipo A 45 2,5
Equipo B 45 0,8
c) __ Los alumnos deciden matricular en cualquiera de los dos equipos porque los
consideran igualmente estables en relación con la cantidad de juegos ganados
por temporadas.
d) __Son insuficiente los datos aportados para seleccionar el equipo más estable.
84 – 90 5
90 – 96 15
96 – 102 38
61
102 – 108 24
108 – 114 10
114 – 120 5
120 – 126 3
19) Halla la desviación típica o estándar en relación con el peso promedio de la pobla-
ción de gallinas estudiada en el ejercicio 12.
20) Halla la desviación típica o estándar en relación con la producción media de café
(en toneladas por hectáreas) de las 100 plantaciones estudiadas en el ejercicio 14.
21) Los gráficos corresponden a dos distribuciones relativas a las distancias de las
casas al empleo de los trabajadores de dos empresas (A y B). Sin efectuar cálculos
62
determina en cuál de los dos casos la desviación típica es mayor. Justifica.
8,0 7,5 7,3 9,1 1,8 2,7 8,3 6,3 8,8 7,4
6,8 4,4 7,8 4,3 7,1 9,9 8,4 7,5 7,3 8,7
0,3 5,5 9,5 9,3 6,2 7,6 6,5 3,9 7,5 3,2
7,7 7,2 8,5 8,6 7,8 4,7 2,7 7,9 7,3 10,0
6,9 7,5 8,7 8,4 7,7 7,8 7,1 8,8 9,3 7,0
Determina:
c) Cantidad de aprobados.
63
PULSACIONES CANTIDAD DE
a) ¿Cuál es el intervalo de pulsaciones por
POR MINUTO ALUMNOS minuto donde se concentra el mayor
(xI) (FI) número de alumnos del grupo "A" al
[80 ; 90) 2 terminar una carrera de velocidad?
24) Realiza un estudio de tu grupo, procesando los datos en una HEC, basado en los
siguientes aspectos:
c) Nota promedio alcanzada por cada estudiante en las evaluaciones aplicadas (en
cada evaluación aplicada y en cada asignatura en general).
64
9. RESPUESTAS DE LOS EJERCICIOS PROPUESTOS PARA LA PRÁCTICA Y EL
REPASO
1) (Taller de costuras)
ESCALA DE
VARIABLES TIPO DE VALORES QUE PUEDE
MEDICIÓN DE
ESTADÍSTICAS VARIABLE TOMAR LA VARIABLE
LA VARIABLE
Cuantitativa
Tiempo 0:30 h, 1:00 h. 2:00 h, otros. Razones
continua
Cant. de Cuantitativa
0, 1, 2, 3, 4, ... Razones
pantalones discreta
11 11 12 12 12 13 13 13 14 14 14 14 14 14 15 15 15 15 15 16
(xi) 11 12 13 14 15 16
(Fi) 2 3 3 6 5 1
4) (Camadas de conejos)
xi Fi fi x i ⋅ Fi 2 10 0,17 20
3 8 0,13 24
1 6 0,1 6
65
4 9 0,15 36
c) 9 camadas.
5 9 0,15 45
d) La camada de 2 crías.
6 8 0,13 48
e) 254 crías.
7 6 0,1 42
8 3 0,05 24
9 1 0,02 9
60 1 254
Deportivos 300
250
Musicales 200
150
Infantiles 100
50
Noticieros 0
Culturales
s
s
s
es
s
vo
le
ile
ro
al
ra
ie
nt
ti
ic
or
tu
ic
fa
us
ep
ot
ul
In
M
C
D
8) (Precipitaciones)
66
d) Agosto, septiembre, octubre y noviembre.
50
Europa
a
ní
ea
Millones de km2
40
O c
África
y
30
A
20
Asia
10 América
Antártica
A y Oceanía
Europa
África
América
Antártica
Asia
Central 86 29,0 17
Oriental 91 30,6 18
11) Alternativa c)
67
4 y 5 d) razones
12.4) x = 3,4 Me = 3 Mo = 3
68
16) (Dos equipos de pelota)
Los alumnos que aspiran a formar parte de un equipo con marcada estabilidad en la
cantidad de juegos ganados por temporadas les convienen entrenar con el equipo B.
Marca de
CLASES clase (xi) Fi fi(%) Fi(acumulada) fi(acumulada)
118 -124 121 1 2,5 1 40 2,5 100
69
19) (Población de gallinas) Media: x = 3,4 Desviación típica: s = 1,1
21) El gráfico B presenta mayor desviación típica o estándar. Esto se aprecia porque la
diferencia entre las alturas de las barras altas y bajas es más notable que en el
gráfico A. Significa que hay trabajadores que viven muy cerca de la Empresa y otros
muy lejos.
a) 7,5 b) [6; 8) c) 40 alumnos (60 ó más puntos) d) 7,5 e) Peor nota: 0.3 puntos.
Mejor nota: 10 puntos. f) Las 10 notas peores son: 0,3; 1,8; 2,7; 2,7; 3,2; 3,9;
4,3; 4,4; 4,7; 5,5 y lasa 10 mejores: 8,7; 8,7; 8,8; 8,8; 9,1; 9,3; 9,3; 9,5;
9,9; 10
a) [100;110 )
70
b) x = 104
71
10. APÉNDICE : USO DEL SIGNO DE SUMATORIA
∑n
n =1
2
se lee: suma de los valores de n2 desde n = 1 hasta 10.
Ejemplo
21
b) S = 2 + 4 + 6 + 8 + ... + 42 Respuesta: S = ∑ 2k
k =1
n
1 1 1 1 1
c) S = + + + ... + Respuesta: S = ∑
2 3 4 n k =1 k
n
d) S = X1 + X 2 + X 3 + ... + X n Respuesta S = ∑ X k
k =1
n
e) S = X1F1 + X 2 F2 + ... + X n Fn Respuesta S = ∑ X i Fi
i =1
Escribir usando el signo de sumatoria las sumas que se plantean en el epígrafe 10,
(ejercicios 1,2 y 3) de la página 10 del libro Matemática 12º grado. Parte 1.
72
11) BIBLIOGRAFÍA
ÁLVAREZ HERRERO, FERNANDO. et al. Matemática. BUP 1o. CIDEAD. Madrid. 1995
73
74