Importancia de los datos estadísticos

ELEMENTOS DE LA
ESTADÍSTICA DESCRIPTIVA
PARA LA ENSEÑANZA
PREUNIVERSITARIA
Francisco E Rodríguez Meneses

Emma Garcías Enis
–2005 –
Este material está dirigido a los estudiantes y profesores de la Enseñanza
media Superior como apoyo a la Unidad 3 "Estadística Descriptiva" del
programa de Matemática para el 10mo grado. En el mismo se presentan
los conceptos básicos que se trabajan en este nivel los cuales se ilustran
mediante ejemplos y ejercicios resueltos. Contiene además un grupo de
ejercicios propuestos para la práctica y el repaso.
En cada uno de los epígrafes se indica las video-clases donde se trata este
contenido. Para ello se utiliza el símbolo ( c-A) donde el lugar de A
está ocupado por los números de las clases correspondientes.
Sería muy interesante que los usuarios de este material lo enriquecieran

tanto cono sea posible, que cualquier sugerencia o recomendación con
relación al mismo llegue a los autores, pues todo esto beneficiará, sin lugar
a dudas, el desarrollo de la enseñanza y el aprendizaje de la Estadística en
este nivel.
1
ÍNDICE
Contenido página
Breve reseña histórica………………………………………………

3
1. Tipos de Estadísticas. Importancia que tiene para la Sociedad
el trabajo con datos………………………………………………… 5
2. Variables, datos y escalas…………………………………………

7
3. Distribución de frecuencias………………………………………..
12
4. Representación gráfica de datos simples……………………….. 14
4.1 Gráficos de barras y pictogramas………………………….... 15
4.2 Gráficos circulares…………………………………………….. 17
5. Datos agrupados…………………………………………………… 19
5.1 Representación gráfica de datos agrupados. Histogramas y
polígonos de frecuencias………………………………………………. 23
Proceso de reducción de la información 25
6. Medidas de tendencia central…………………………………….. 26
 Uso del signo de sumatoria…………………………….. 26
6.1 Medidas de tendencia central para datos simples……………… 27
6.1.1 Media aritmética……………………………………………… 27
6.1.1.1 Media aritmética ponderada……………………… 28
6.1.2 Mediana………………………………………………………. 29
6.1.3 Moda…………………………………………………………… 29
 Uso del EXEL……………………………………………. 30
6.2 Medidas de tendencia central para datos agrupados………….. 32
6.2.1 Media aritmética……………………………………………. 33

6.2.2 Mediana……………………………………………………… 34
6.2.3 Moda…………………………………………………………. 36
7. Medidas de dispersión para datos simples……………………… 37
7.1 Recorrido, amplitud o rango……………………………………… 38
7.2 Desviación media………………………………………………….. 39
7.3 Varianza…………………………………………………………….. 40
7.4 Desviación típica o estándar……………………………………… 41
7.5 Coeficiente de variación…………………………………………. 42
8. Ejercicios y problemas para la práctica y el repaso……….. 43
Bibliografía……………………………………………………………. 50
2
BREVE RESEÑA HISTÓRICA
La Estadística, en su forma más simple, tuvo sus orígenes en las civilizaciones

antiguas. Se tiene conocimiento de hallazgos que expresan cantidad de personas,
animales y cosas, a través de representaciones en rocas, pieles, maderas, paredes de
cuevas y otros medios. Alrededor del año 3000 (a.n.e), los babilonios usaban pequeñas
tablillas de arcilla donde recopilaban datos relacionados con la producción agrícola, las
ventas, cambios o trueques propios de la época.
Por otra parte, los egipcios del siglo XXXI (a.n.e) – anterior a la construcción de las
pirámides– representaban datos sobre la población y los índices de renta en el país.
Antes del año 2000 (a.n.e), los chinos realizaban estudios sobre la población y las
posibilidades materiales de sus habitantes. En tanto, los griegos –con el propósito de
cobrar los impuestos– llevaron a cabo un censo de población cuyos resultados fueron
utilizados hasta los alrededores del año 594 (a.n.e).
En el desarrollo de la Estadística no es posible ignorar que el gran imperio romano fue

el primero, que con un interés gubernamental, recopiló numerosos datos sobre
población, superficies y rentas en todos los territorios bajo su control.
En la Europa de la edad media se realizaron, bajo la orientación de diferentes reinados,

censos exhaustivos de población, estudios sobre las propiedades de la Iglesia e
innumerables recopilaciones de datos con fines económicos, sociales y militares. Y es
en las proximidades del año 1086, después de la conquista de Inglaterra por los
normandos, que en este país se realizó un censo, cuyos resultados se publicaron en el
Domesday Book.
Fue en el siglo XVII, en Inglaterra cuando John Graunt (1620-1674) comenzó a estudiar
los registros de fallecimientos; este pequeño comerciante estuvo probablemente
motivado por la curiosidad. Y así fue que descubrió que el porcentaje de muertes por
accidentes, suicidios y enfermedades era aproximadamente el mismo en las localidades
estudiadas, variando muy poco de un año para otro. Graunt realizó numerosos estudios
sobre los nacimientos y otros aspectos de carácter social. En el año 1962 publicó el
libro Natural and Political Observations…upon the Bills of Mortality el cual puede ser
3
considerado como el inicio de la utilización del método científico en las ciencias
sociales.
Muchos fueron los continuadores de Graunt y es en la segundad mitad del siglo XIX en
que se produjo el desarrollo matemático de la Estadística. Francis Galton (1822-1911) y
Kart Pearson (1857-1936) fueron dos matemáticos que contribuyeron mucho a su
evolución. Las técnicas estadísticas comenzaron a tener marcada importancia en la
Astronomía y en la teoría de los Gases. Es por eso que las Ciencias Sociales y la
Físicas aceleraron la creación y aplicación de los métodos estadísticos.
El desarrollo de la Estadística está muy ligado a la teoría de las probabilidades, y fue la

tentativa de crear una teoría sobre los juegos de azar (Cardano, Huygens, Pascal,
Fermat y otros matemáticos de los siglos XVI – XVII) la que dio origen a los conceptos
fundamentales de ambas ramas de la Matemática. La teoría de las probabilidades y la
Estadística está vinculada a los nombres de Jacobo Bernoullí, Moivre, Laplace, Gauss,
Poisson, etc. En el período de mayor esplendor encontramos a destacados
matemáticos como P. L. Chevishev (1821 – 1894) y sus alumnos A. Markov (1856 –
1822) y A. M. Liapunov (1857 – 11918) y posteriormente a A. N. Kolmogorov, entre
otros.
En la actualidad la Estadística está muy difundida, su uso es inevitable y se manifiesta

en la recopilación, procesamiento y análisis de la información relacionada con datos
económicos, políticos, sociales, biológicos, psicológicos, físicos, químicos, etc. El
desarrollo de la Informática y las posibilidades crecientes de comunicación beneficia
sustancialmente la aplicación de la Estadística en todas las esferas de la vida.
En nuestros tiempos es relativamente fácil acceder a múltiples datos de alcance local,

nacional o mundial, relacionados con los temas que trabajamos cotidianamente o en
cualquier gestión investigativa que estemos abordando, a la vez que se dispone de
eficaces sistemas, tabuladores electrónicos y asistentes matemáticos para el
procesamiento estadístico. Todo esto significa que la preparación del hombre en el uso
de las nuevas tecnologías es el principal reto de hoy al cual no podemos renunciar.
4
1. Tipos de Estadísticas. Importancia que tiene para la sociedad el trabajo con
datos. C-128)
Los que habitamos la sociedad de hoy no podemos actuar como en los tiempos de los
babilonios hace más de 5000 años. En la actualidad es necesario realizar estudios
profundos sobre todos los procesos que garantizan la vida en el planeta, los que dan
continuidad al desarrollo y preservación de las diferentes especies de animales y
plantas que lo habitan y al mismo tiempo salvar y enriquecer el patrimonio que el propio
hombre ha construido.
Muchos ejemplos pueden ilustrar con absoluta claridad la importancia que tiene el
conocimiento, la recopilación, el procesamiento y el análisis de los datos que describen
determinados eventos; por el momento queremos referirnos a los siguientes:
 Hacer un pronóstico y tomar decisiones sobre las temperaturas, las lluvias, los
períodos de sequías, la erosión y la degradación de los suelos o cualquier
fenómeno atmosférico o climatológico, implica – sin lugar a dudas– el estudio
profundo y continuado de los resultados históricos, físicos, químicos, biológicos
que han influido y que resultan de interés para los especialistas.
 Las ciencias médicas reclaman cada vez más de la fiabilidad de la información

que permita aplicar o medir la eficacia de un medicamento sin riesgo para los
pacientes. La necesidad de poner en práctica un tratamiento médico,
diagnosticar enfermedades (en los humanos, animales o plantas) o suministrar
una vacuna, no admite otra cosa que no sea un estudio profundo del volumen de
datos necesarios obtenidos a través de rigurosos procesos de investigación.
 Al concebir un programa radial o televisivo, al publicar un artículo, abrir una

sección en un periódico, elaborar un guión para una novela –por citar algunos
ejemplos– es importante pensar en cómo elevar los niveles de aceptación; para
ello es necesario tener en cuenta los intereses, necesidades y preferencias más
representativas del público al cual van dirigidos.
 Para el diseño y producción de artículos de vestir es muy bueno considerar el

estudio de índices tan cambiantes como la preferencia, las necesidades de uso,
5
la moda predominante, la época del año en que saldrá al mercado; no solo para
obtener mayores resultados económicos, sino también, para lograr un impacto
social positivo.
Estamos convencidos que poco se puede hacer en el desarrollo de la Ciencia si no

se toma en cuenta, con máxima prioridad, la experiencia acumulada por los hombres
hasta nuestros días. El avance de los procesos tecnológicos, el perfeccionamiento
de la vida social o el propósito de elevar los índices económicos, reclaman el
desarrollo de las investigaciones científicas y por tanto la aplicación de los métodos
estadísticos.
La Estadística es una rama de la Matemática Aplicada, es la ciencia que proporciona

los métodos para obtener, organizar, clasificar, resumir, presentar y analizar datos
relativos a un conjunto de individuos u observaciones. Esto permite extraer
conclusiones válidas y tomar decisiones lógicas basadas en dicho análisis.
Al estudiar –por ejemplo– el crecimiento de determinado tipo de peces, la acción de

un fertilizante en las plantaciones de arroz o la calidad de las piezas producidas por
una fábrica durante un año de trabajo, es prácticamente imposible observar todo el
grupo; entonces es necesario seleccionar una parte del mismo que permita realizar
generalizaciones al grupo completo, tal es el objeto de la ESTADÍSTICA
INFERENCIAL O INDUCTIVA, es decir, la descripción de una población a partir de
una muestra seleccionada de ella.
Por otro lado, la parte de la Estadística que estudia una población a partir de
considerar todos los elementos que la integran, sin derivar conclusiones sobre un
grupo mayor, se denomina ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA.
Ejemplo 1
De una escuela de 970 alumnos se han elegido, de manera aleatoria, 200 de estos
para realizar un estudio relacionado con el número de hermanos.
En este caso podemos identificar los siguientes valores estadísticos:
Población: Los 970 alumnos de la escuela. Tamaño de la población: 970
Muestra: Los 200 estudiantes que fueron elegidos. Tamaño de la muestra: 200
6
Unidad estadística o individuos: Cada uno de los estudiantes.
Variable estadística que se estudia: Número de hermanos.
2. Variables estadísticas, datos y escalas de medición de la variable.
(C-129 y 130)
Las variables estadísticas son cada una de las características que se estudian en los
elementos (individuos) de una población. Estas son de diferentes tipos y toman, tanto
valores numéricos como no numéricos. En los ejemplos que se proponen a
continuación se presenta la variable y los valores que esta toma dentro de paréntesis.
TIPOS DE VARIABLES
 Cualitativas
 discretas
 Cuantitativas 
 continuas
Cualitativas: Se refieren a características que no se pueden cuantificar.
Ejemplo 2: son variables cualitativas las siguientes:
 El sexo de un grupo de personas (masculino-femenino).
 El rendimiento académico medido en alto, mediano y bajo.
 Los colores de las flores (rojo, rosado. Amarillo, lila,…).
 La preferencia por determinados tipos de música(alta, mediana, baja)
Cuantitativas: Cuando pueden ser medidas numéricamente.
Ejemplo 3: son variables cuantitativas las siguientes:
 La edad de una persona (5 años, 12 años, 20 años,…).
 El rendimiento académico medido en puntos (notas obtenidas en los exámenes)
 Número de habitantes en determinada región o en un país (34150; 10345678;…).
 Tiempo de duración de un suceso o evento (2 minutos, 3 horas, 1,5 horas,…).
Discretas: Cuando solo pueden tomar un número finito o a lo sumo numerable

de valores.
7
Nota: Un conjunto es numerable cuando todos sus elementos se pueden poner en
correspondencia uno a uno con un subconjunto de los números naturales.
Ejemplo 4: son variables cuantitativas discretas las siguientes:
 Cantidad de alumnos de un grupo, de un grado o de una escuela (30; 218;

500;…).
 Cantidad de libros de de una biblioteca (10000; 345678; 2342098;…;).
 Número de viajes dados por un ómnibus (0; 1; 3; 10;…;).
 Cantidad de vértices de un polígono de n-lados (3; 4; 5; 6;…; n).
Continuas: Cuando pueden tomar todos los valores de un intervalo de

números reales.
Ejemplo 5: son variables cuantitativas continuas las siguientes:
 Estatura de un grupo de personas (todos los valores reales no negativos del

intervalo [0; a], donde a es la altura máxima conocida que puede alcanzar una
persona).
 Cantidad de lluvia caída en una región en una época, dada en función del tiempo
(cualquier valor real no negativo).
 Volumen de agua en una presa en metros cúbicos (todos los valores reales no
negativos del intervalo [0; a], donde a es el volumen máximo de la presa).
ESCALAS DE MEDICIÓN DE LA VARIABLE:
Para aplicar los métodos de la Estadística se necesita cuantificar las características,

propiedades o atributos del evento que es objeto de estudio. Hasta las primeras
décadas del siglo XX muchos investigadores dudaban que se pudiera cuantificar las
propiedades de un fenómeno social o natural, y se cometía el error de quererlo hacer
como en los fenómenos físicos, químicos, matemáticos, etc. En la actualidad se han
logrado avances en la medición de las propiedades de los fenómenos que se estudian
en las Ciencias Sociales.
8
Existen cuatro escalas de medición y la aplicación de cualquiera de ella depende del
tipo de atributo que se está midiendo, es decir: depende de los valores que toma la
variable que se quiere medir. Estas escalas son las siguientes:
 Nominal  De intervalos
 Ordinal  De razones
Escala nominal: La variable que se mide se puede dividir en categorías o clases

mutuamente excluyentes y exhaustivas que cumplen las siguientes propiedades:
 La igualdad se obtiene entre elementos de una misma categoría o clase.
 La desigualdad se obtiene entre elementos de clases diferentes.
 No existe una relación de orden entre los elementos ni entre las clases.
 La variable no toma valores numéricos
Ejemplo 6: Clasificación de los 30 alumnos de un grupo de 10mo grado de

acuerdo con el sexo.
SEXO
NÚMERO DE (Tabla 1)
ALUMNOS
En este ejemplo dos elementos de la misma clase
MASCULINO 11
son iguales en virtud de la variable que se mide y
FEMENINO 19 diferentes a uno cualquiera de la otra clase.
TOTAL 30
Escala ordinal: La variable que se mide se puede dividir en categorías o clases

 La igualdad se obtiene entre elementos de una misma categoría o clase.
 La desigualdad se obtiene entre elementos de clases diferentes.
 Existe una relación de orden entre los elementos de dos clases diferentes.
 La variable no toma valores numéricos.
Ejemplo 7: Clasificación de los 30 alumnos de acuerdo con el rendimiento

académico (Tabla 2).
9
RENDIMIENTO ACADÉMICO
NÚMERO DE (Tabla 2)
ALUMNOS
Ahora es importante notar que un elemento
ALTO 15
de la clase alto – por ejemplo – es superior
MEDIANO 12 a cualquier elemento de las otras dos
clases, en virtud de la variable que se mide.
BAJO 3
Escala de intervalos: La variable que se mide se puede dividir en categorías o clases

 Relación de orden bien definida entre las clases.
 La distancia o diferencia entre las clases o categorías consecutivas es la misma.
 Existe una unidad de medida común para todas las categorías.
 El valor cero no es absoluto (no significa ausencia del atributo que se mide)
Ejemplo 8: Clasificación de los 30 alumnos de acuerdo con el rendimiento

académico medido por las notas alcanzadas en los exámenes.
Notas 0 1 2 3 4 5 6 7 8 9 10
Cantidad de alumnos 1 1 0 1 0 2 5 6 4 4 6
(Tabla 3)
Escala de razones o proporciones: La variable que se mide se puede dividir en

categorías o clases mutuamente excluyentes y exhaustivas que cumplen las siguientes
propiedades:
 Relación de orden bien definida entre las clases.
 La razón entre valores de la variable adquiere significado.
 Existe una unidad de medida común para todas las categorías.
 El valor cero es absoluto, indica la ausencia total del atributo que se mide.
10
Ejemplo 9: Cantidad de líquido que contienen dos recipientes A y B.
En este caso si el recipiente A contiene 10 L y el recipiente B, 30 L; entonces podemos

decir que el primero contiene un tercio de lo que el segundo, es decir, se puede
X 1
establecer la siguiente proporción:  (donde X es la cantidad de líquido que
Y 3
contiene el recipiente A e Y , la del recipiente B). Por otro lado cero litros significa la
ausencia total de líquido en el recipiente – esto quiere decir que el valor cero es
absoluto –. Luego, la variable capacidad en este ejemplo se mide mediante una escala
de razones o proporciones.
Ejercicio 1: Un grupo de pacientes de un hospital se clasifica atendiendo a los siguientes

aspectos:
a) Tipo de enfermedad
b) Grado en que se manifiesta la enfermedad
c) La temperatura en grados Celsius
d) Peso en kilogramos
Indica la escala de medición de la variable en cada caso.
Respuesta: a) Nominal b) Ordinal c) De intervalos d) De razones
ESCALAS NO MÉTRICAS: Nominal y Ordinal. Los números utilizados no se

acompañan de una unidad de medida y solo indican la clase o la categoría, como
puede ser: turno 1, turno 2, turno 3, aula 8, sala 10, etc.
ESCALAS MÉTRICAS: De intervalos y de razones. Están caracterizadas por una

unidad de medida común para todas las categorías.
Ejercicio 2: En un taller que cuenta con 20 trabajadores, que se dedican al ensamblado

de un cierto equipo electrónico, se necesita realizar un estudio basado en los siguientes
aspectos:
a) Nivel cultural de los trabajadores.

b) Cantidad de equipos ensamblados por trabajador en cada jornada de trabajo.
c) Tiempo, en horas, que invierte cada trabajador para ensamblar uno de estos
equipos.
11
d) Calidad de equipos ensamblados en una jornada de trabajo.
e) Clasificación de los trabajadores por turnos de trabajo.
Identifica la variable estadística, describe los valores que puede tomar y determina cuál
es la escala de medición en cada caso.
Respuesta:
Escala de medición
Variable Tipo de variable Valores de la variable
de la variable
a) Nivel cultural de cada Primario, Medio básico, Medio Ordinal
Cualitativa
trabajador superior y Universitario
b) Cantidad de equipos Cuantitativa
0; 1; 2; 3; 4; 5;… De razones
ensamblados discreta
c) Tiempo que invierte cada Cuantitativa De razones
1; 0,5; 2; 0; 3; 4,23;… horas.
trabajador continua
d) Calidad de los equipos Ordinal
Cualitativa Buena, regular y mala
ensamblados.
e) Turnos de trabajo Cualitativa Turno A, Turno B, Turno C, ... Nominal
(Tabla 4)
3. Distribución de frecuencias (C-131 y 132)
Una forma de organizar los datos consiste en la confección de una distribución de

frecuencias mediante una tabla, para ilustrar esta idea presentamos el siguiente
ejemplo:
Ejemplo 10:
Al analizar los índices de la emulación por la cede del acto en conmemoración del
asalto al Cuartel Moncada el 26 de julio de 1953, una zona de los CDR evaluó el
cumplimiento de los compromisos de donaciones de sangre, a través de la
siguiente información, donde se muestra la cantidad de donaciones de cada uno
de los 22 CDR de la zona:
4 7 12 18 12 7 17 17 12 2 4
4 2 12 9 4 12 12 7 2 4 12
En este ejemplo podemos identificar los siguientes valores estadísticos:
Población: Todos los CDR de la zona. Tamaño de la población: n = 22
12
Individuos: cada uno de los 22 CDR.
Variable estadística: X = Cantidad de donaciones de sangre. (Cuantitativa discreta)
Valores de la variable: Xi {2; 4; 7; 9; 12; 17; 18}
Los datos anteriores, los cuales no han sido organizados reciben el nombre de datos
primarios. Estos valores pueden ponerse en orden (ascendente o descendente) para
facilitar su análisis y conteo. Un arreglo ordenado de estos datos primarios (que pudiera
contener un número mucho mayor de datos) sería el siguiente:
2 2 2 4 4 4 4 4 7 7 7
9 12 12 12 12 12 12 12 17 17 18
Ahora, aprovechando la existencia de valores repetidos se puede formar una

distribución de frecuencias, la cual consiste en asignar a cada valor distinto de la
variable el número no negativo Fi que indica las veces que se repite dicho valor. De
esta manera se puede resumir la información mediante una tabla de frecuencias como
la siguiente:
Xi CONTEO O Fi (Tabla 5)
TARJADO
2 ///=3 3 Fi se llama frecuencia absoluta
4 ////=5 5
La frecuencia absoluta (Fi) de un dato cuantitativo es el número
7 /// =3 3
de veces que aparece este en la población que se estudia.
9 /=1 1
12 //// //=7 7 En este ejemplo Xi es el número de donaciones (valores de la
variable X) y Fi es la cantidad de CDR (número de veces que
17 //=2 2
aparece el dato Xi).
18 /=1 1
Con el objetivo de mejorar la descripción de los datos las tablas de frecuencias
contienen otras columnas, así en la que presentaremos a continuación (Tabla 6) vamos
a incorporar las siguientes:
Tercera columna: para la frecuencia relativa fi que es el cociente entre la frecuencia

Fi
absoluta y el tamaño de la población que se estudia. Así: f i 
n
13
La cuarta y la quinta columna: corresponden a la frecuencia absoluta acumulada Fai
y a la frecuencia relativa acumulada fai respectivamente, las cuales se pueden
obtener acumulando de arriba hacia abajo o viceversa, según sea el interés del estudio.
Es importante comprender que la suma de las frecuencias absolutas es igual a la

cantidad de datos, es decir, igual al tamaño de la población que se estudia (en este
caso n = 22).
La frecuencia relativa se puede expresar mediante fracciones simples, mediante

números decimales y en porcentajes, entonces su suma es igual a la unidad en los dos
primeros casos e igual al 100% en el último caso.
Xi Fi fi Fai fai (Tabla 6)
2 3 0,136 3 22 0,136 1,000

4 5 0,227 8 19 0,363 0,864
7 3 0,136 11 14 0,449 0,637
9 1 0,046 12 11 0,545 0,501
12 7 0,318 19 10 0,863 0,455
17 2 0,091 21 3 0,964 0,137
18 1 0,046 22 1 1,000 0,046
Ejercicio 3:
Responde las siguientes preguntas a través de la interpretación de la tabla 6.
1) ¿Qué porcentaje de los CDR lograron realizar 12 donaciones de sangre?
2) ¿Cuántos CDR estuvieron por encima de las 7 donaciones de sangre?
3) ¿Qué porcentaje de los CDR de la zona realizaron más de 9 donaciones de sangre?
4) ¿Qué porcentaje de los CDR estuvo por debajo de las 12 donaciones de sangre?
Respuestas: 1) El 31,8% 2) 11 CDR 3) El 45,5% 4) El 54,5% de los CDR.
4. Representación gráfica de datos simples. (C-133 y 134)
Es muy difícil percibir a simple vista – y a veces con mayor detenimiento– toda la
información que hay en una tabla, y si esta ocupa más de media hoja será casi
14
imposible; para conseguirlo una manera es representar los datos en diferentes tipos de
gráficos, de los cuales mostraremos algunos a continuación.
Un gráfico es una representación en el plano de dos o más variables interrelacionadas.

En general colocamos los valores que toma la variable en el eje de las abscisas y sobre
el eje de las ordenadas los valores de la frecuencia correspondiente.
4.1. Gráficas de barras y pictogramas.
Para ilustrar estos tipos de gráficas o diagramas vamos a presentar el siguiente

ejemplo.
Ejemplo 11
Los 2055 alumnos de un centro universitario expresaron su preferencia por uno

de los géneros cinematográficos que se presentan en la taba 7.
Género Hombres Mujeres (Tabla 7)
En la grafica de barras siguiente se ha reprensado

Policiaco 150 75
la preferencia de los hombres de este centro
Aventuras 180 120 universitario por uno de los seis géneros
cinematográficos consultados.
Comedia 120 90
Suspenso 240 180
C. Ficción 225 210
Dramático 180 285
TOTAL 1095 960
Para construir una gráfica de barra, los valores de las variables se sitúan en el eje de
las abscisas y se trazan barras perpendiculares, todas de igual ancho, cuya altura sea
igual al valor de la frecuencia absoluta. La disposición de los ejes puede variar de
acuerdo con la posición que se elija para las barras (vertical u horizontal).
15
El gráfico de barras anterior corresponde a la preferencia de las mujeres por los
géneros cinematográficos estudiados en este centro universitario. Para su construcción
se utilizó el Generador de Gráficos de la Enciclopedia Encarta.
Cuando usamos este sencillo asistente para graficar los datos de una tabla de
frecuencias se realizan los siguientes pasos:
a) Escribir Generador de Gráficos en la opción BUSCAR de la página principal de la

Enciclopedia Encarta.
b) Elegir el tipo de gráfico que se quiere construir de acuerdo con las tres opciones que brinda:
gráfico de sectores, gráfico de barras y gráfico de líneas.
c) Describir con una etiqueta el contenido del gráfico (por ejemplo Géneros cinematográficos).
d) Elige el tipo de color a utilizar (Estándar, pastel, brillante o grises) y completar la tabla con el
nombre de los ítems (variables) y la frecuencia correspondiente.
e) Finalmente escribir el título del gráfico y los comentarios que se consideren. Al oprimir el
botón SIGUIENTE se obtiene el gráfico, el cual permite las opciones: copiar, imprimir,
guardar, entre otras.
Nota: para ir de un paso a otro se usan las opciones Atrás y Siguiente de cada página.
Otro tipo de gráfico muy utilizado es el pictograma que como su nombre lo indica
requiere de cierta creatividad y de arte. En el se sustituyen las barras por dibujos que
representan la frecuencia correspondiente a cada valor de la variable que se estudia.
Así utilizando los datos del ejemplo 11, tenemos:
16
Donde:
Así, en el género de C. Ficción en el caso de los hombres, por ejemplo, se describe

la suma 60 + 60 + 60 + 45  225 y para las mujeres 60 + 60 + 60 + 30  210, de
acuerdo al significado de los dibujos, los cuales admiten la representación de la cuarta
parte, la mitad y las tres cuartas partes de 60.
Ejercicio 3:
Utilizando los datos, las tablas y los gráficos relacionados con el ejemplo 11, responde
las siguientes preguntas:
a) ¿Cuál es el género de mayor preferencia por los hombres?
b) ¿Cuál es el género de menor preferencia por las mujeres?
c) ¿Qué cantidad de personas prefieren las comedias?
d) ¿Es cierto que las películas de C. Ficción son preferidas por los hombres más que por
las mujeres?
Respuestas: a) El suspenso b) El policiaco c) 210 personas c) Para responder la pregunta

se necesita de la frecuencia relativa, así el 21,8% de las mujeres estudiadas prefieren este
género, mientras que en los hombres la preferencia es del 20,5%. Esto indica que la preferencia
de ambos sexo por las películas de Ciencia Ficción no se diferencia mucho en este centro.
4.2. Gráficos circulares (C-136 y 137)
Los gráficos circulares, de pastel o diagramas de sectores se representan sobre un

círculo. La superficie del círculo se reparte en proporción a las frecuencias de los
valores que toma la variable. El círculo completo tiene 360O, por lo que no hay más que
fi αO
establecer la proporción  para saber cuántos grados corresponde a cada
n 360 O
17
frecuencia. De esta manera, como el 1% de 360O es 3,6O entonces el cálculo de O se
reduce a una simple fórmula: αO  3,6O  f i % donde f i % es la frecuencia relativa
expresada en porcentaje y αO es la amplitud del ángulo correspondiente a esta

frecuencia.
Los gráficos circulares son de mucha utilidad para comparar distintas distribuciones.
Para ilustrar la construcción de un gráfico circular vamos a retomar el ejemplo 10 de las
donaciones de sangre. Esta vez mediante una tabla de frecuencias (absoluta y relativa
porcentual) con una columna para representar la amplitud del ángulo correspondiente
en cada caso.
(Tabla 7)
Xi Fi fi(%) α O
Así, podemos hallar αO , por ejemplo:

2 3 13,6 49O 3,6O  13,6  49O
4 5 22,7 81O 3,6O  22,7  81O
7 3 13,6 49O
………………..
………………..
9 1 4,6 17O
………………..
12 7 31,8 114O
3,6O  31,8  114 O .
17 2 9,1 33O …………………
…………………
18 1 4,6 17O
La construcción del gráfico se puede realizar manualmente utilizando un semicírculo

graduado, mediante el Generador de gráficos de la Enciclopedia Encarta o a través de
otros asistentes que estudiarás más adelante.
En la siguiente (construida mediante el Generador de Gráfico de la Enciclopedia Encarta)

se puede comprobar a simple vista que 12 es el número de donaciones de mayor
frecuenta entre los CDR de la zona estudiada.
18
5. Datos agrupados. (C-139 y 140)
Para describir una cantidad grande de datos o para estudiar una variable a partir de
determinadas categorías, es conveniente organizarlos en clases y definir el número de
individuos (u observaciones de la variable) que pertenecen a cada una de ellas.
Ejemplo 12
Se necesita organizar y procesar la información correspondiente al número de

intervenciones que realizaron 100 estudiantes de la Enseñanza Media que
participaron en un evento relacionado con las técnicas para la resolución de
problemas aritméticos.
Los participantes del evento están dispuestos en un arreglo de 10 filas (1, 2, 3, 4,…, 10)
y 10 columnas(A, B, C, …, J), como se muestra en la siguiente tabla (tabla 8).
De esta manera podemos identificar, mediante una simple observación, que el

estudiante (1; A) – por ejemplo – realizó 5 intervenciones mientras que el estudiante
(5; G) intervino 10 veces.
19
(Tabla 8)
5 4 3 8 6 6 7 5 1 8
8 8 3 2 1 8 8 9 7 6
4 5 4 5 3 8 4 2 6 6
3 5 8 8 7 6 5 9 4 8
2 4 3 2 8 4 10 5 5 5
8 3 6 6 5 4 4 3 5 4
12 3 11 5 11 4 3 4 5 5
6 2 7 6 8 5 4 3 2 2
7 9 8 9 7 4 3 5 5 4
8 9 7 8 8 4 5 3 4 2
Estos datos primarios – aunque presentan cierta organización – no responden a los

intereses del estudio que se quiere realizar: evaluar la participación de los
estudiantes de acuerdo a 4 categorías (R, B, MB, E), para ello se construyó la
siguiente tabla:
INTERVENCIONES CATEGORÍAS DE CANTIDAD DE ESTUDIANTES

EVALUACIÓN (FI) (Tabla 9)
1–3 Regular ( R) 22
4–6 Buena ( B ) 45
7–9 Muy Buena (M B ) 29
10 – 12 Excelente (E ) 4
Para resolver el problema planteado los datos han sido agrupados mediante cuatro
clases: 1 – 3, 4 – 6, 7 – 9 y 10 – 12 donde (Fi) la frecuencia absoluta (frecuencia de
clases) de la clase "i".
1, 4, 7, y 10 son los límites inferiores de clases y 3, 6, 9, y 12, son los superiores.
La amplitud de cada clase es l = 3, y como se trata de una variable discreta en la clase

(Xm – Xn) la amplitud es l = Xm – Xn + 1, que es la cantidad de números naturales
comprendidos entre Xm y Xn, ambos inclusive.
20
La marca de clase es el punto medio de cada intervalo de clase la cual es un valor
representativo en esta de la variable que se mide. En la tabla 9, las marcas de clases
son 2, 5, 8 y 11 las cuales se obtienen mediante la semisuma de los extremos de los
intervalos de clases.
Ejemplo 13
Estudiar los índices de las precipitaciones de una región "R”, mediante el

registro de la lluvias caídas (en milímetros) por semanas.
En este ejemplo la variable que se estudia (cantidad de precipitaciones) es continua, y

la fuente no suministró los datos primarios, tal como se muestra en la tabla 10.
En este caso la variable puede tomar valores para los cuales existe cierta ambigüedad
con relación a qué clase pertenecen. Por ejemplo un valor entre 28 y 29 se discute si
pertenece a la segunda o a la tercera clase. Existen varios criterios para resolver este
problema, pero en clases de igual amplitud– en este ejemplo l = 14 – es muy práctico
sustraer 0,5 al límite inferior y adicionar esta misma cantidad al límite superior de cada
clase. Así obtenemos – por ejemplo – para la tercera clase:
Límite inferior: 29 y Límite inferior real: 28,5
Límite superior: 42 Límite superior real: 42,5
RANGO DE CANTIDAD DE SEMANAS PUNTOS MEDIOS (Tabla 10)

PRECIPITACIONES
(FI) (MARCAS DE
(CLASES) CLASES)
1 – 14 8 7,5
15 – 28 12 21,5
29 – 42 6 35,5
43 – 56 5 49,5
57 – 70 3 63,5
71 – 84 2 77,5
21
Por otro lado, aprovechando los conocimientos sobre la notación de intervalos reales
(usando corchetes y paréntesis), las clases se pueden expresar como en la tabla 11
que presentaremos a continuación. En este caso es importante notar que no existe
ambigüedad para decidir la ubicación de un elemento. Así las clases se pueden
representar de forma continua sobre la recta real, entonces los límites reales coinciden
con los de cada clase.
RANGO DE PRECIPITACIONES CANTIDAD DE SEMANAS PUNTOS MEDIOS (Tabla 11)

(CLASES) (FI) (MARCAS DE CLASES)
0 ;14 ) 8 7,5
14 ;28) 12 21,5
28 ;42 ) 6 35,5
42 ;56 ) 5 49,5
56 ;70 ) 3 63,5
70 ;84 ] 2 77,5
Para el trabajo con datos agrupados en clases de frecuencias es importante tener en

cuenta las siguientes consideraciones:
 Las clases deben ser exhaustivas y mutuamente excluyentes.
 El número de clases no puede ser muy pequeño ni excesivamente grande.

Cuando el número de clases es pequeño se puede producir concentración de los datos,
y dispersión cuando es muy grande. En ambos casos puede haber pérdida de la
información y para tener cierta norma la mayoría de los estadísticos concuerdan con
que el número de clase debe oscilar de cinco a quince.
 Deben evitarse las clases de frecuencia nula.
 Deben tener la misma amplitud (siempre que sea posible).
 La marca de clase (punto medio) debe calcularse con facilidad.
22
5.1 Representación gráfica de datos agrupados. (C-141 a C-145)
Histogramas: Este tipo de gráfico se construye mediante columnas o rectángulos

unidos. Así, sobre cada intervalo de clases representado en una escala continua
del eje real, se levanta un rectángulo que tiene como base la amplitud del intervalo
de clases y como altura, el cociente entre frecuencia absoluta (o relativa) y la
Fi
amplitud de la clase correspondiente, es decir, hi  es la altura del rectángulo
li
que se levanta sobre la clase "i". De esta manera el área de cada rectángulo es
igual a la frecuencia absoluta (o relativa) de la clase correspondiente.
Ejemplo 14
Construir un histograma de frecuencias con los datos correspondientes a los

índices de precipitaciones registrados en la tabla 11.
En este caso se puede comprobar

que la base de cada rectángulo es
l = 14, entonces el área del más alto
(por ejemplo) es A  14  0,86  12
que es la frecuencia absoluta de la
segunda clase.
Polígono de frecuencia. Es un gráfico poligonal de frecuencia de clase dibujado en

función del punto medio (marca de clase). Puede obtenerse uniendo los puntos medios
de la base superior de los rectángulos. Esta forma de representar los datos permite
analizar tendencia, es decir cual es el comportamiento de la frecuencia (absoluta o
relativa) alrededor, anteriores o a partir de determinados valores de la variable. Estos
gráficos responde a preguntas como: ¿Cómo es el comportamiento de___antes del
valor___ o a partir del valor___? o ¿Cuál fue la tendencia de___hasta el valor___o
después del valor___?
23
Ejemplo 15
Construir un polígono de frecuencias con los datos correspondientes a los

índices de precipitaciones registrados en la tabla 11.
Es importante notar que el origen de la poligonal se toma en el límite inferior de la

primera clase y el extremo coincide con el límite superior de la última clase.
Para graficar la frecuencia acumulada

(absoluta o relativa) mediante un
polígono, se representa los intervalos
de clases sobre el eje horizontal y se
levanta en el extremo superior de cada
intervalo un segmento vertical de
longitud igual a la frecuencia
acumulada (Fi ó fi) correspondiente,
uniendo luego con segmentos
rectilíneos los extremos de cada segmento vertical tal como se muestra en el siguiente
ejemplo:
Ejemplo 16
Representar en un polígono la frecuencia absoluta acumulada de los índices de

las precipitaciones de una región "R”, mediante el registro de la lluvias caídas (en
milímetros) por semanas.
Este tipo de polígono, que muestra la

frecuencia acumulada (absoluta o
relativa) se denomina ojiva y responde a
preguntas como:
¿Durante cuántas semanas las lluvias

caídas fueron iguales o inferiores a los
56 mm?
24
Análogamente se procede cuando la frecuencia es acumulada en forma descenderte
(de abajo hacia arriba en la tabla de frecuencia). Entonces la pregunta anterior pudiera
ser ¿Durante cuántas semanas las lluvias caídas fueron iguales o superiores a los 56
mm?
Proceso de reducción de la información
En este proceso el objetivo es resumir el volumen de los datos primarios, o los de una
distribución de frecuencias por determinados valores descriptivos, a los cuales se les
llama Estadígrafos o Estadísticos.
Como Estadígrafos o Estadísticos podemos diferenciar los siguientes;
 Estadígrafos de posición
Como estadígrafos de posición tenemos las siguientes medidas de tendencia central:
 La Media (Media aritmética, Media geométrica, Media armónica, Media cuadrática,

entre otras).
 La Mediana
 La moda
 Los cuartiles, deciles, percentiles y fractiles (las cuales son medidas de posición
relativas que no se estudiarán en este material)
 Estadígrafos de dispersión:
Son estadígrafos de dispersión las medidas de variabilidad dentro de las cuales

estudiaremos las siguientes:
 Recorrido o rango
 Desviación media
 Varianza
 Desviación típica o estándar
 Coeficiente de variación
 Estadígrafos de simetría y apuntamiento (que no se estudiarán en este material)
25
6. Medidas de tendencia central
Muchos son los problemas en los cuales es importante representar un grupo de datos
por un solo valor que es, por decirlo así, descriptivo del grupo entero. Las medidas de
tendencia central, que como su nombre lo indica tienden a ser un valor medio, permiten
la descripción de la variable (o variables) que es objeto de estudio.
Antes de definir las medidas de tendencia central es importante tratar, de forma breve,
el uso del signo de sumatoria el cual permitirá simplificar en algunos casos la escritura
de las fórmulas que serán utilizadas.
Uso del signo de sumatoria.
Si quisiéramos – por ejemplo – escribir de manera simplificada la suma S de los diez

primeros números naturales que son cuadrados perfectos podemos proceder de la
siguiente forma:
10
S  1  4  9  16  25  36  49  64  81  100 S   n 2 donde  es la letra griega
n 1
sigma mayúscula que representa la letra S.

10
n
n 1
2
se lee: suma de los valores de n2 desde n = 1 hasta 10.
Ejemplo 17
Escribe utilizando el signo de sumatoria cada una de las siguientes sumas:
n
a) S  1  2  3  4  5  ...  n Respuesta: S   i
i 1
21
b) S  2  4  6  8  ...  42 Respuesta: S   2k
k 1
n
1 1 1 1 1
c) S     ...  Respuesta: S  
2 3 4 n k 1 k
26
n
d) S  X1  X 2  X 3  ...  X n Respuesta S   X k
k 1
n
e) S  X1F1  X 2 F2  ...  X n Fn Respuesta S   X i Fi
i 1
6.1) Medidas de tendencia central para datos simples (C-149)
6.1.1) Media aritmética
Usualmente calculamos el promedio de un grupo de datos, un ejemplo pudiera ser el

promedio de las puntuaciones alcanzadas por un estudiante en una o varias de las
asignaturas que está cursando. El promedio se calcula adicionando todos los datos y
dividiendo la suma obtenida por la cantidad de datos. La media aritmética es un
promedio y se define, para datos simples, de la siguiente manera:
Definición: Sean X1, X2, X3,…, Xn, n valores medidos. La Media Aritmética X se
X1  X 2  X 3  ...  X n
calcula mediante la fórmula: X  y de manera abreviada,
n
n
X i
1 n
usando el símbolo de sumatoria, la fórmula es: X i 1
n
  Xi
n i 1
Ejemplo 18
Vida en horas de trabajo de siete dispositivos electrónicos.
820 940 940 952 964 970 972
820  940  940  952  964  970  972 6558

X   936,86 Así X  937 horas
7 7
Entonces, la vida media de estos dispositivos electrónicos es de 937 horas de trabajo

aproximadamente.
De manera general la media aritmética:
 Se aplica cuando la variable está medida en escalas métricas.

 Siempre existe, es única y fácil de calcular.
27
 Es una función algebraica de los datos individuales. Esto significa que la
modificación de cualquiera de los datos hace variar el valor de la media.
6.1.1.1) Media aritmética ponderada
Hay algunos problemas en los cuales es imposible promediar cantidades sin tomar en
cuenta, de alguna manera, su importancia relativa dentro de la situación global que se
está tratando de describir. Por ejemplo, si en un agromercado se venden tres tipos de
granos a $3,50, $4,60 y $5,75 es imposible determinar el precio global que se recibe
por libras si no se considera el número de libras vendidas de cada tipo de granos. Si la
mayoría de las libras vendidas son del tipo más barato la media estará más cerca de
$3,50.
Supongamos que el mercado vendió durante una semana 300 libras del tipo de granos
más barato, 220 de las del precio medio y 96 del más caro. Por un simple cálculo
aritmético el mercado recibió 300($3,50) + 220($4,60) + 96($5,75) = $ 2614 al vender
300 + 220 + 96 = 616 libras de estos granos. Luego el precio promedio por libras es
$ 2614
 $ 4,24 .
616
Este promedio se denomina media ponderada, en este caso representa el precio

promedio obtenido al vender 616 libras de granos teniendo en cuenta la importancia
relativa de cada uno de los datos (diferencia de los precios de acuerdo al tipo de granos
y cuantas libras se vendió de cada uno).
De manera general en una distribución de la forma siguiente:
Xi X1 X2 X3 X4 … Xn Donde Xi es el i-ésimo valor de la variable X y Fi es la

frecuencia absoluta correspondiente, la media aritmética (media
Fi F1 F2 F3 F4 … Fn ponderada) se calcula mediante la siguiente fórmula:
n
F  X  F2  X 2  ...  Fn  X n F  X i i
X  i i  i 1
(Análogamente
F1  F2  ...  Fn n
 Fi
i 1
se procede cuando se trabaja con la frecuencia relativa fi)
28
6.1.2) Mediana
Definición: La Mediana M de un conjunto de valores X , X , X ,…, X dispuestos

e 1 2 3 n
en orden creciente (o decreciente) es:
El valor que equidista de los extremos, si n es impar.
La media aritmética de los valores centrales, si n es par.
Ejemplo 19 A
22 23 25 28 30
En este caso n = 5 (impar) luego, la mediana del conjunto e datos A es Me = 25
Ejemplo 20 40 43 45 46 48 51
En este ejemplo n = 6 (par) luego, la mediana del conjunto de datos B es
45  46
Me   45,5
2
De manera general la mediana para datos simples:
 Es aplicable a cualquier tipo de datos que puedan ser ordenados, es decir,

tiene sentido cuando los datos pueden ser medidos por escalas métricas y
ordinales.
 Siempre existe y es única.
 No es una función algebraica de los datos individuales, esto significa que no
varía fácilmente al modificar los valores extremos.
 Es apropiada para un grupo pequeño de datos.
6.1.3) Moda
Definición: La Moda M de un conjunto de valores X , X , X ,…, X es el valor que

o 1 2 3 n
se presenta con más frecuencia en ese conjunto.
Ejemplo 21
Vida en horas de trabajo de siete dispositivos electrónicos.
29
820 940 940 952 964 970 972 MO= 940 horas
Ejemplo 22
Calificaciones otorgadas a 30 alumnos en una evaluación escrita.
Calificaciones 2 3 4 5 MO = 3 puntos
# de alumnos 5 10 8 7
Ejemplo 23
0 2 3 3 3 4 4 4 5 6 7 34
MO  3,5
2
Ejemplo 24
0 2 3 3 3 4 4 5 5 5 6 7 M O(1)  3 y M O ( 2)  5 en
este caso la distribución tiene

dos valores modales ( es una distribución bimodal).
De manera general la moda para datos simples:
 Es aplicable a cualquier tipo de datos. Es muy útil para datos cualitativos.

 No es única y puede no existir cuando todos los valores tienen la misma
frecuencia.
 No es una función algebraica de los datos individuales.
Sobre el uso del EXEL
Hasta el momento, para concentrar la atención en la comprensión de los conceptos

primarios de la Estadística, los ejemplos presentados han sido tratados de forma
"manual", es decir, sin el uso de asistentes matemáticos (a no ser el Generador de
Gráfico de la Enciclopedia Encarta). Ahora vamos a incorporar al trabajo las Hojas
Electrónica de Cálculo (HEC) EXEL del paquete Microsoft Office.
30
En una HEC podemos realizar entre otros, cálculos matemáticos generales,
estadísticos, cotidianos; unido a grandes posibilidades de diseño y manipulación de la
información. Las HEC son sistemas (Tabuladores electrónicos) que tienen como
propósito fundamental el tratamiento de datos, la elaboración de gráficos y la gestión de
archivos organizados en forma de tablas. En principio una HEC es la representación
informática sobre una inmensa hoja cuadriculada (16777216 celdas) en blanco
dispuesta a recibir la información que deseamos escribir, un lápiz, una goma de borrar y
una potente calculadora.
La comunicación del usuario con una HEC no resulta algo muy complejo y constituye
uno de los contenidos que los estudiantes del preuniversitario deben aprender a través
del programa de informática básica incluido en plan de estudio. Por el momento solo
presentaremos algunos ejemplos del empleo del EXEL en la Estadística Descriptiva en
este nivel de enseñanza.
Ejemplo 25
Se quiere organizar y procesar la información, correspondiente a los resultados

docentes de un grupo de estudiantes de 10mo grado en la asignatura de
Matemática, mediante una HEC.
1) Para realizar este trabajo se confeccionará una tabla con los siguientes datos:
a) Nombres y dos apellidos de los estudiantes del grupo.
b) Calificación obtenida en cada trabajo de control.
c) Nota obtenida en la Prueba Final (PF)
2) Calcular para cada estudiante – utilizando la función PROMEDIO del EXEL – la

NPC (nota promedio obtenida en los trabajos de control) y la NF (nota final)
otorgada que es la media aritmética entre NPC y la PF
3) Hallar la nota promedio del grupo (NPG) en cada uno de los exámenes
aplicados.
31
4) Representar en un gráfico circular la distribución de los estudiantes por los
siguientes rangos de notas obtenidas en el primer trabajo de control: 85 – 89;
90 –94 y 95 – 100.
El EXEL nos permite el uso de numerosas funciones matemáticas, estadísticas,

financieras y lógicas – entre otras –, las cuales el usuario podrá utilizar de acuerdo
con el estudio que realiza y el conocimiento que posea de este asistente. En una
HEC, los datos que se estudian en el ejemplo 25 presentan la siguiente apariencia:
6.2) Medidas de tendencia central para datos agrupados
Hay algunos problemas en los cuales es necesario determinar las medidas de

tendencia central directamente de los datos agrupados. Esto puede suceder, por
ejemplo, cuando los datos necesarios de un estudio son suministrados por una fuente
32
que no puede proporcionar los datos primarios o porque la masa de datos hace que el
proceso sea complejo.
6.2.1) Media aritmética (C-150 y 151)
La media aritmética para un conjunto de de datos agrupados en n-clases se calcula

mediante la siguiente fórmula:
n
F1  X  F 2  X 2  F 3  X 3  ...  F n  X  Fi  X i
X  1 n
 i 1
F 1  F 2  F 3  ...  F n n

i 1
Fi
Donde:
X i : es el valor medio de cada intervalo de clase, es decir la marca de la clase “i”.

Fi : La frecuencia correspondiente a la clase “i”.
Ejemplo 26
La tabla muestra la distribución de las notas obtenidas por 103 estudiantes en la tercera
pregunta de un examen de Matemática, calificada con una escala de de 0 a 10 puntos.
INTERVALOS CANTIDAD DE ALUMNOS Fai MARCA DE CLASE
Fi
[0 ; 2,5) 5 5 1.25
[2,5 ; 5) 9 14 3.75
[5 ; 7,5) 33 47 6,25
[7,5 ; 10] 56 103 8,75
5  1,25  9  3,75  33  6,25  56  8,75 6,25  33,75  206,25  490 736,25

X    7,15
5  9  33  56 103 103
X  7,15 significa la nota promedio alcanzada en la tercera pregunta del examen de

Matemática por el grupo de estudiantes evaluados. Si todos los estudiantes hubieran
alcanzado la misma calificación, entonces la nota sería aproximadamente 7,15 puntos.
33
La media aritmética para un grupo de datos agrupados en clases, como el ejemplo
anterior, no difiere una cantidad significativa de la media aritmética calculada a partir de
los datos simples.
Las 103 calificaciones pueden ser consideradas en una HEC y calcular la nota promedio
utilizando la función estadística PROMEDIO del EXEL la cual devuelve el promedio (media
aritmética) de los argumentos de una referencia de celdas.
6.2.2) Mediana (C-152)
La mediana para un conjunto de de datos agrupados en n-clases se calcula mediante la

siguiente fórmula:
n 
  Fa m 1 
M e  L i  2   l Donde:
 Fm 
 
 
n : Número de observaciones. F m: Frecuencia de la clase mediana.
Li : Límite inferior real de la clase mediana.
Fam 1 : Frecuencia acumulada hasta la clase anterior a la clase mediana, se decir:

m 1
Fam 1  F
k 1
k
l : Amplitud del intervalo de clase mediana.
Ahora es necesario determinar el valor de cada una de las variables que aparecen en el
miembro izquierdo de la fórmula.
Consideremos el ejemplo anterior para ilustrar el cálculo de la mediana a partir de esta

fórmula.
La mediana en un conjunto de datos ordenados es el valor que equidista de los

extremos. En este caso n = 103 que es un número impar, entonces para determinar la
n 1
posición de la mediana podemos utilizar la siguiente fórmula: PM e  . En el
2
34
103  1 104
ejemplo tenemos que PM e    52 . Así la mediana buscada ocupa el
2 2
lugar 52 en la lista, entonces la clase mediana es la cuarta, es decir: 7,5 ; 10
F1  7,5 Pues en este ejemplo las clases pueden ser colocadas sobre una escala
continua desde 0 hasta 10, entonces los límites reales coinciden con los extremos de
los intervalos de clases.
Por otro lado, Fm  56 , Fam 1  47 y l  2,5 entonces podemos sustituir en la fórmula y
calcular la mediana.
 103 
  47 
M e  7,5   2   2,5  7,5   51,5  47   2,5  7,5  4,5  2,5  7,5  0,08  2,5
 56   56  56
 
 
M e  7,5  0,2  7,7
Análogamente a lo explicado para la media aritmética, las 103 calificaciones pueden ser
consideradas en una HEC y calcular la mediana utilizando la función estadística MEDIANA del
EXEL la cual devuelve la mediana (o valor central) de los argumentos de una referencia de
celdas.
Significado geométrico de la mediana en un

conjunto de datos agrupados.
Al construir un histograma de frecuencia

absoluta con los datos de la tabla anterior – por
ejemplo– se pude comprobar que la recta
perpendicular al eje horizontal, trazada por el
punto que contiene a la mediana, divide al área en dos parte iguales. Esto se cumple de
manera general, por tanto se considera el significado geométrico de la mediana de un
conjunto de datos agrupados.
35
6.2.3) Moda (C-153)
La moda para un conjunto de de datos agrupados en n-clases se calcula mediante la

siguiente fórmula:
 n1 
MO  L i     l Donde:
 n1  n2 
Li : Límite inferior real de la clase modal.
n1: Exceso de la frecuencia modal sobre la frecuencia de la clase anterior más próxima.
n2 : Exceso de la frecuencia modal sobre la frecuencia de la clase posterior más

próxima.
l : Amplitud del intervalo de clase modal.
Ejemplo27
La siguiente tabla corresponde a las edades de 206 docentes que participaron en

un evento por la calidad de la educación.
Clases Fi Fai Fai Marcas
En este caso la clase de mayor frecuencia es

40-44 que tiene frecuencia Fi = 56.
25-29 8 8 206 27
Así:
30-34 17 25 198 32 n1= 56 – 38 = 18 n2= 56 – 45 = 11
Li = 40 – 0,5 = 39,5 y l  44  40  1= 5
35-39 38 63 181 37
 n1 
40-44 56 119 143 42 Ahora aplicando la formula MO  L i    l
 n1  n2 
 18 
45-49 45 164 87 47 tenemos: M O  39,5    5
18  11
50-54 18 182 42 52
18
M O  39,5   5  39,5  0,62  5  39,5  3,1
55-59 18 200 24 57
29
M O  42,6 Entonces la moda es M O  43 años
60-64 6 206 6 62
36
Significado geométrico de la moda en un conjunto de datos agrupados.
Supongamos que la figura corresponde a una

sección de un histograma de frecuencias donde
aparecen representado el rectángulo de la clase
modal, el de la anterior y el de la posterior a
esta.
Los segmentos trazados desde los vértices de

los rectángulos determinan los triángulos
semejantes RPQ y SPT, en los cuales se tiene:
EP PF
 , en virtud de la proporcionalidad entre elementos homólogos. Luego,
RQ ST
M O  Li L S  M O
sustituyendo se tiene:  y aplicando la propiedad fundamental de las
n1 n2
n1LS  n2 LS
proporciones y transformaciones algebraicas equivalente se obtiene M O 
n1  n2
n1( L i l )  n2 Li
pero LS  Li  l (l es la amplitud de la clase modal) entonces, M O  ,
n1  n2
(n1  n2 )Li  n1 l
MO  , ahora aplicando la propiedad distributiva de la división respecto
n1  n2
 n1 
a la suma se obtiene M O  Li     l que es la fórmula empírica que hemos
 n1  n2 
utilizado para el cálculo algebraico de la mediana.
7. Medidas de dispersión para datos simples (C-155)
La determinación de las medidas de tendencia central: la media, la mediana y la moda,

aunque permiten describir una distribución, no dan la idea completa del problema que
se estudia. Es necesario que estas medidas estén acompañadas de otras que indique
37
la variabilidad de la información de acuerdo con estos valores de descripción, es decir,
la dispersión o concentración de los datos alrededor de determinados valores.
Ejemplo 1
La tabla siguiente corresponde a la distribución de las puntuaciones alcanzadas por dos

grupos de estudiantes (A y B) en un examen de Matemática.
GRUPO A GRUPO B
ALUMNOS PUNTUACIONES ALUMNOS PUNTUACIONES
x1 3 y1 5
x2 4 y2 5
x3 5 y3 6
x4 9 y4 8
x5 10 y5 8
x6 10 y6 9
X I 41 Y I 41
Media X 6,83 Media Y 6,83

Mediana Me 7 Mediana Me 7
En este caso los dos grupos de datos tienen igual media aritmética e igual mediana, sin
embargo, a simple vista se puede comprobar que el grupo A es más heterogéneo que
el B. Las puntuaciones en el primer grupo varían mucho con una marcada diferencia
entre las notas bajas y altas, en tanto, en el segundo grupo hay menor variación entre
las puntuaciones contiguas y entre las altas y las bajas, luego, el grupo B es más
homogéneo que el A.
7.1) Recorrido, amplitud o rango
Es una medida simple de dispersión que se puede utilizar para una comparación
primaria de un grupo de distribuciones. Es poco confiable, pues considera sólo las dos
observaciones extremas, con independencia de la forma de la distribución y de las
frecuencias de las variables individualmente.
El rango, amplitud o recorrido se calcula de la siguiente forma:
R = XM – Xm Donde XM es el mayor de los datos y Xm, el menor.
38
Así en el grupo “A”se tiene que el rango es R(A) = 10 – 3 = 7 y por otro lado en el
grupo “B” R(B) = 9 – 5 = 4, es decir, existe mayor diferencia entre las puntuaciones
altas y bajas en el grupo “A”. Esto indica mayor dispersión de los datos en el grupo
“A” en relación con el “B”.
7.2) Desviación media
Se define como la media aritmética de los valores absolutos de las diferencias entre los
datos y su media aritmética. Esto se expresa mediante la siguiente fórmula:
n
X1  X  X 2  X  ...  X n  X X i X
DX   i 1
Donde X es la media aritmética
n n
de los datos de la distribución y X i  X es el valor absoluto de la desviación del dato
X i con relación a X .
Consideremos los grupos A y B del ejemplo anterior en la siguiente tabla:
GRUPO A GRUPO B
Xi Yi
Xi  X Yi  Y
3 |3 – 6,83| = 3,83 5 |5 – 6,83| = 1,83
4 |4 – 6,83| = 2,83 5 |5 – 6,83| = 1,83
5 |5 – 6,83| = 1,83 6 |6 – 6,83| = 0,83
9 |9 – 6,83| = 2,17 8 |8 – 6,83| = 1,17
10 |10 – 6,83| = 3,17 8 |8 – 6,83| = 1,17
10 |10 – 6,83| = 3,17 9 |9 – 6,83| = 2,17
3,83  2,83  1,83  2,17  3,17  3,17 17

DX    2,83
6 6
39
1,83  1,83  0,83  1,17  1,17  2,17 9
DY    1,5 Así, la desviación media del grupo A
6 6
es superior que la del grupo B, lo cual verifica los resultados obtenidos anteriormente
con relación a la dispersión de los datos y a la fiabilidad de la media aritmética y la
mediana en determinado tipos de distribuciones.
La desviación media puede tener sus atractivos como medida de variación, pero no es
la más utilizada, es por eso que estudiaremos otras medidas de variación de mayor
alcance.
7.3) Varianza
La varianza de un conjunto de datos x1, x2, x3,…, xn, se define como la media del
cuadrado de las desviaciones de la variable respecto a la media.
Comúnmente, se utilizan diferentes notaciones para representar la varianza cuando se

trata de una población finita o de una muestra seleccionada, pero de manera general se
puede utilizar el símbolo V para su referencia y cálculo. Esto se expresa mediante la
siguiente fórmula:
V(X) 
X  X  X
1
2
2 
2

 X  ... Xn  X 1n 2
  Xi  X
2
 
n n i1
Retomando el ejemplo 1, tenemos:
3,83 2  2,83 2  1,83 2  2,17 2  3,17 2  3,17 2 50,84

V( X )    8,47
6 6
1,83 2  1,83 2  0,83 2  1,17 2  1,17 2  2,17 2 14,84

V( Y )    2,47
6 6
Luego, la varianza del grupo A es superior a la del grupo B.
Los estudios estadísticos han demostrado que para el cálculo de la varianza muestral
de una muestra de tamaño N, es más conveniente modificar la fórmula anterior
dividiendo por N – 1 en lugar de dividir por N. En lo adelante, para el trabajo con la
40
Estadística Descriptiva que es a la cual está dirigido este material, utilizaremos la
fórmula como la hemos presentado en la definición de Varianza.
Propiedades de la Varianza
1) La varianza es siempre un número no negativo.
2) La varianza de una constante es igual a cero, es decir, V(k) = 0, siendo k una

constante. Significa que si todos los valores de la variable X son iguales a una
constante k, entonces X  k , luego la desviación de cada uno de los datos respecto
a la media es cero.
3) La varianza de una constante por una variable es igual al cuadrado de la constante

por la varianza de la variable, es decir: V (kX )  k 2V ( X )
4) La varianza de una suma de una variable y una constante es igual a la varianza de

la variable, es decir: V ( X  k )  V ( X )
Las demostraciones de estas propiedades son realmente sencillas; basta aplicar la

fórmula para el cálculo de la varianza y las propiedades del signo de sumatoria y las de
la varianza en sí.
7.4) Desviación típica o estándar
La desviación típica o estándar varía menos que otros estadígrafos cuando se calcula
para varias muestras extraídas de una misma población. Esto hace que sea la medida
de dispersión más usada y de mayor confianza para los estadísticos.
Se define como la raíz aritmética de la varianza y se nenota por la letra S.
 X 
n 2
i  X
S  V  i 1
Utilizando nuevamente el ejemplo 1, tenemos:
S ( X )  V ( X )  8,47  2,9 y S (Y )  V (Y )  2,47  1,57
41
Con la desviación típica o estándar se tiene una idea del grado de desviación promedio
en la distribución, en nuestro caso se puede afirmar que con respecto a la variable
calificaciones existe homogeneidad en el grupo B, mientras que con respecto a esa
misma variable, el grupo A es más heterogéneo.
7.5) Coeficiente de variación
El coeficiente de variación se define mediante el cociente entre el valor de la

desviación típica y el valor de la media y lo denotaremos con el símbolo CV, Así
desviación típica S
tenemos la siguiente fórmula: C V  
media aritmética X
El coeficiente de variación es una medida de dispersión relativa, pues establece una

relación entre el valor de la desviación típica y el valor de la media. Dado que la
desviación típica y la media están dadas en la misma unidad de medida, hace que el
coeficiente de variación no se exprese en unidad de medida alguna. Esta última
propiedad permite utilizar al coeficiente de variación para comparar la variación entre
dos o más conjuntos medidos en diferentes unidades, Un ejemplo puede ser el
resultado, medido en puntos, de un grupo de estudiantes en un examen de Matemática
y la participación de los estudiantes de este grupo en las clases de dicha asignatura.
42
8. Ejercicios y problemas para la práctica y el repaso.
1) En un taller de costura, que cuenta con un total de 27 trabajadores entre sastres y

costureras, se confeccionan pantalones de uniforme escolar. Con el objetivo de
hacer una reforma salarial se realiza un estudio basado en los datos siguientes:
 Sexo
 Nivel cultural.
 Calificación técnica.
 Tiempo en horas que invierte un trabajador para confeccionar un pantalón.
 Cantidad de pantalones que confecciona un trabajador en una jornada de
trabajo.
 Calidad de la costura determinada por el número de piezas que no son
rechazadas.
a) Identifica la variable que se evalúa, clasifícala y presenta ejemplos de los
valores que puede tomar en caca caso.
b) Determina la escala de medición de cada una de estas variables.
2) Al lanzar 100 veces un dado se han obtenido los resultados siguientes.
No de 2.1) Completa las afirmaciones siguientes:

n
veces
1 13 a) La frecuencia absoluta de 5 es _______.
b) El 20% de las veces se obtuvo como resultado _______.

2 20
c) La frecuencia relativa de 6 es _______.
3 25
d) La frecuencia relativa porcentual de 3 es _______.
4 18
e) La frecuencia absoluta de 5 es _______.
5 18 2.2) Valora críticamente la siguiente afirmación:
6 6 "Al lanzar un dado 100 veces la mayor posibilidad es obtener un

tres y la menor, obtener seis".
43
3) Los siguientes datos corresponden a la superficie aproximada, dadas en millones de
kilómetros cuadrados, de 6 grandes regiones de muestro planeta.
REGIONES SUPERFICIE
África 30 a) Con estos datos construye un pictograma,

América 42 una gráfica de barras y un gráfico circular
o de sectores.
Antártica 14
b) ¿Cuáles de las representaciones gráficas,
Asia 44
según tu criterio, ilustra mejor la
Australia y Oceanía 9
comparación de las superficies de estas
Europa 10 regiones?
4) La siguiente tabla muestra la distribución de los 297 clubes de computación "Joven

club " del país hasta el año 2002.
Pinar del Río 18 Ciego de Ávila 15
La Habana 28 Camaguey 20
Ciudad de la Habana 47 Las Tunas 13
Matanzas 23 Holguín 23
Villa Clara 25 Granma 19
Cienfuegos 13 Santiago de Cuba 21
Sancti Spíritus 13 Guantánamo 15
Isla de la Juventud 4 TOTAL 297
a) Construye una tabla de frecuencia haciendo una distribución de los datos por
regiones (occidental, central y oriental).
b) Halla la cantidad media de estos clubes en cada región del país.
44
c) Representa estos datos, distribuidos por regiones, en un gráfico de pastel.
d) Construye una tabla como la anterior donde muestres la cantidad actual de estos
clubes en cada uno de los municipios de tu provincia.
Los Joven Club de Computación y Electrónica (JCCE) constituyen un

programa de la Unión de Jóvenes Comunistas de Cuba, que abarca
todo el país para alcanzar el objetivo principal de proporcionar la
cultura informática a la comunidad con prioridad hacia niños y
jóvenes, representando un papel activo, creativo y de formación de
valores en el proceso de informatización de la sociedad cubana.
Surgen el 8 de septiembre de 1987 por iniciativa del Comandante en Jefe Fidel Castro, después de
evaluarse como positiva la experiencia del Joven Club radicado en el Pabellón Cuba durante el
período vacacional del verano de 1987, de forma experimental, con carácter promocional y
recreativo.
5) A partir de los resultados del ejemplo 11 construye una tabla de frecuencia relativa,
expresada en porcentajes, sobre la preferencia de los hombres y las mujeres por
los géneros cinematográficos estudiados en un centro universitario. Representa la
frecuencia hallada para los hombres y las mujeres en una misma gráfica de barras.
6) En la siguiente distribución la media aritmética es 2.
Xi 0 1 2 3 4 Selecciona la alternativa correcta
a) ___ El valor de F5 es 6.
Fi 4 3 4 5 F5
b) ___ No se puede conocer el valor de F5.
c) ___ La tabla se completa para F5= 3.
d) ___ F5 se puede sustituir por cualquier dígito.
7) A continuación te ofrecemos los datos correspondientes al peso en kilogramos de

una raza de gallinas en estudio, que se pretenden destinar al consumo.
2 3 4 3 5 3 2 4 3 5 3 2 5 3 4 2 5 5 4 3 5 4 3 2 2
6.1) Sobre la información anterior responde:
45
a) ¿De cuántos ejemplares consta la población estudiada?
b) ¿Qué tipo de variable se estudia?
c) ¿Qué escala de medición le corresponde?
d) ¿Qué valores toma la variable?
6.2) Construye una tabla de frecuencias y responde:

a) ¿Qué porcentaje representa el número de ejemplares en el peso de mayor
(menor) frecuencia?
b) ¿Qué cantidad de ejemplares no sobrepasan los 4 kg de peso?
c) ¿Qué porcentaje de los ejemplares sobrepasan los 3 kg de peso?
6.3) Compara el número de ejemplares por peso mediante un gráfico.
6.4) Determina el peso medio en kilogramos de los ejemplares estudiados, la
mediana y la moda.
8) La siguiente tabla corresponde a la producción aproximada de cierta variedad de

café, en toneladas por hectáreas, obtenida en 100 plantaciones estudiadas.
6 7 6 8 5 5 7 6 5 4 6 8 6 6 5 4 7 5 5 6
7 5 7 5 6 5 6 5 6 5 7 7 7 6 5 5 6 7 5 6
5 6 6 7 7 6 7 4 7 7 4 5 4 4 5 8 8 3 4 6
5 4 3 5 6 3 7 5 7 8 8 8 5 6 5 3 4 6 4 5
5 2 7 6 4 4 6 7 5 5 5 8 8 5 6 6 7 4 6 7
8.1) Representa estos datos en una tabla de frecuencia y realiza las siguientes
actividades:
a) Determina el porcentaje de las plantaciones que tienen una producción de 5
toneladas por hectáreas.
b) Halla la cantidad de plantaciones cuya producción está por encima (debajo)
de la producción media por hectáreas.
8.2) Representa la distribución de frecuencia relativa porcentual en un gráfico de
barras.
46
9) Los alumnos de un centro deportivo han hecho estadísticas acerca de los
resultados históricos de dos equipos de baseball A y B. En relación con la cantidad
de juegos ganados durante cinco temporadas se registraron los siguientes datos:
PROMEDIO DE JUEGOS
GANADOS POR DESVIACIÓN ESTANDAR
TEMPORADAS
Equipo A 45 2,5
Equipo B 45 0,8
Marca la alternativa correcta considerando que los estudiantes tienen la posibilidad de

elegir el equipo de su preferencia para realizar el entrenamiento.
a) __ Los alumnos que aspiran a formar parte de un equipo con marcada

estabilidad en la cantidad de juegos ganados por temporadas les conviene
entrenar con el equipo A.
b) __ Los alumnos que aspiran a formar parte de un equipo con marcada

estabilidad en la cantidad de juegos ganados por temporadas les conviene
entrenar con el equipo B.
c) __ Los alumnos deciden matricular en cualquiera de los dos equipos porque los
consideran igualmente estables en relación con la cantidad de juegos ganados
por temporadas.
d) __Son insuficiente los datos aportados para seleccionar el equipo más estable.
10) Halla la desviación típica o estándar en relación con el peso promedio de la

población de gallinas estudiada en el ejercicio 7.
11) Halla la desviación típica o estándar en relación con la producción media de café
(en toneladas por hectáreas) de las 100 plantaciones estudiadas en el ejercicio 8.
12) Los gráficos corresponden a dos distribuciones relativas a las distancias de las
casas al empleo de los trabajadores de dos empresas (A y B). Sin efectuar cálculos
determina en cuál de los dos casos la desviación típica es mayor. Justifica
47
13) Un profesor de Educación Física midió las pulsaciones de los 30 alumnos de un
grupo "A" de 10mo grado al terminar una carrera de velocidad. Los resultados
fueron los siguientes:
PULSACIONES CANTIDAD a) ¿Cuál es el intervalo de pulsaciones por

POR MINUTO DE ALUMNOS minuto donde se concentra el mayor número
(XI) (FI)
de alumnos del grupo "A" al terminar una
[80 ; 90) 2 carrera de velocidad?
[90 ; 100) 8 b) ¿Cuál es la media de las pulsaciones por

minuto después de la carrera?
[100 ; 110) 13
c) Construye un polígono de frecuencia relativa
[110 ;120) 4 acumulativa (expresada en porcentaje) y
[120 ; 130] 3 determina el valor debajo del cual está el 50%

de los alumnos.
d) Halla la mediana y la moda utilizando las fórmulas empíricas estudiadas.
14) Realiza un estudio de tu grupo, procesando los datos en una HEC, basado en los
siguientes aspectos:
14.1) Puntuaciones alcanzadas por los estudiantes en cada una de las evaluaciones
realizadas.
48
14.2) Cantidad de ausencias mensuales a clases de cada estudiante en las diferentes
asignaturas que se imparten.
14.3) Nota promedio alcanzada por cada estudiante en las evaluaciones aplicadas (en
cada evaluación aplicada y en cada asignatura en general).
14.4) Clasificación de los estudiantes según el rendimiento escolar (bajo, mediano o

alto) de acuerdo con determinado rango en las calificaciones alcanzadas.
14.5) Promedio de ausencias mensuales a clases de cada estudiante en las diferentes

asignaturas que se imparten.
14.6) Varianza de las puntuaciones alcanzadas en las evaluaciones y del número de

ausencias a clases en cada una de las asignaturas.
14.7) Comparación entre coeficiente de variabilidad de las puntuaciones alcanzadas

en determinada asignatura y el del número de ausencias clases de los
estudiantes a la misma durante el período que se estudia.
14.8) Otros datos que consideres sean de interés para el estudio.
49
BIBLIOGRAFIA
ÁLVAREZ HERRERO, FERNANDO. et al. Matemática. BUP 1o. CIDEAD. Madrid. 1995
ÁLVAREZ HERRERO, FERNANDO. et al. Matemáticas pruebas objetivas. BUP 1o.

CIDEAD. Madrid. 1995
BRUNHEIRA, LINA. Et al. La Solución. Matemática 10. Texto Editora. Portugal.1997.
CUÉ MUÑIZ, JUAN L. et al. ESTADÍSTICA. Impreso por la Facultad de Matemática

Cibernética de la Universidad de la Habana. Ciudad de la Habana. 1987.
FREUND, JOHN E. Estadística Elemental Moderna. Editorial Pueblo y Educación.

Ciudad de la Habana. 1977.
GENER NAVARRO, ENRIQUE J. et al. Elementos de la Informática Básica. Editorial

Pueblo y Educación. Ciudad de la Habana. 2001.
GMURMAN, V. E. Problemas sobre la teoría de las probabilidades e Estadística

Matemática. Editorial Mir. 1975.
GMURMAN, V. E. Teoría de las probabilidades e Estadística Matemática. Editorial Mir.

1974.
KAROLIUK, V. S. Manual de la teoría de las probabilidades y Estadística Matemática. .

Editorial Mir. 1986.
MONTOJO, ROSINA. Matemática lll. Ediciones Educativas. Madrid.1997.
MURRAY R. SPIEGEL. Teorías y problemas de ESTADÍSTICA. Ediciones de Ciencia y

Técnica. Instituto cubano del libro. La Habana. 1981.
OFICINA NACIONAL DE ESTADÍSTICA. ONE. Anuario Estadístico de Cuba 2002.

Ciudad de la Habana. 2003.
VIEIRA LÓPEZ, ANA. et al. Matemática 10. Volumen 1. Ediciones contrapunto.

Portugal. 1998.
50

Importancia de los datos estadísticos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Importancia de los datos estadísticos

Cargado por

Copyright:

Formatos disponibles

ELEMENTOS DE LA

Francisco E Rodríguez Meneses

Sería muy interesante que los usuarios de este material lo enriquecieran

Breve reseña histórica………………………………………………

2. Variables, datos y escalas…………………………………………

6.2.1 Media aritmética……………………………………………. 33

8. Ejercicios y problemas para la práctica y el repaso……….. 43

La Estadística, en su forma más simple, tuvo sus orígenes en las civilizaciones

En el desarrollo de la Estadística no es posible ignorar que el gran imperio romano fue

En la Europa de la edad media se realizaron, bajo la orientación de diferentes reinados,

El desarrollo de la Estadística está muy ligado a la teoría de las probabilidades, y fue la

En la actualidad la Estadística está muy difundida, su uso es inevitable y se manifiesta

En nuestros tiempos es relativamente fácil acceder a múltiples datos de alcance local,

 Las ciencias médicas reclaman cada vez más de la fiabilidad de la información

 Al concebir un programa radial o televisivo, al publicar un artículo, abrir una

 Para el diseño y producción de artículos de vestir es muy bueno considerar el

Estamos convencidos que poco se puede hacer en el desarrollo de la Ciencia si no

La Estadística es una rama de la Matemática Aplicada, es la ciencia que proporciona

Al estudiar –por ejemplo– el crecimiento de determinado tipo de peces, la acción de

En este caso podemos identificar los siguientes valores estadísticos:

Población: Los 970 alumnos de la escuela. Tamaño de la población: 970

Variable estadística que se estudia: Número de hermanos.

2. Variables estadísticas, datos y escalas de medición de la variable.

Ejemplo 2: son variables cualitativas las siguientes:

 El sexo de un grupo de personas (masculino-femenino).

 El rendimiento académico medido en alto, mediano y bajo.

 Los colores de las flores (rojo, rosado. Amarillo, lila,…).

 La preferencia por determinados tipos de música(alta, mediana, baja)

Cuantitativas: Cuando pueden ser medidas numéricamente.

Ejemplo 3: son variables cuantitativas las siguientes:

 La edad de una persona (5 años, 12 años, 20 años,…).

 El rendimiento académico medido en puntos (notas obtenidas en los exámenes)

 Número de habitantes en determinada región o en un país (34150; 10345678;…).

 Tiempo de duración de un suceso o evento (2 minutos, 3 horas, 1,5 horas,…).

Discretas: Cuando solo pueden tomar un número finito o a lo sumo numerable

Ejemplo 4: son variables cuantitativas discretas las siguientes:

 Cantidad de alumnos de un grupo, de un grado o de una escuela (30; 218;

 Cantidad de libros de de una biblioteca (10000; 345678; 2342098;…;).

 Número de viajes dados por un ómnibus (0; 1; 3; 10;…;).

 Cantidad de vértices de un polígono de n-lados (3; 4; 5; 6;…; n).

Continuas: Cuando pueden tomar todos los valores de un intervalo de

Ejemplo 5: son variables cuantitativas continuas las siguientes:

 Estatura de un grupo de personas (todos los valores reales no negativos del

ESCALAS DE MEDICIÓN DE LA VARIABLE:

Para aplicar los métodos de la Estadística se necesita cuantificar las características,

Escala nominal: La variable que se mide se puede dividir en categorías o clases

 La igualdad se obtiene entre elementos de una misma categoría o clase.

 La desigualdad se obtiene entre elementos de clases diferentes.

 La variable no toma valores numéricos

Ejemplo 6: Clasificación de los 30 alumnos de un grupo de 10mo grado de

Escala ordinal: La variable que se mide se puede dividir en categorías o clases

 La igualdad se obtiene entre elementos de una misma categoría o clase.

 La desigualdad se obtiene entre elementos de clases diferentes.

 La variable no toma valores numéricos.

Ejemplo 7: Clasificación de los 30 alumnos de acuerdo con el rendimiento

Escala de intervalos: La variable que se mide se puede dividir en categorías o clases

 Relación de orden bien definida entre las clases.

 La distancia o diferencia entre las clases o categorías consecutivas es la misma.

 Existe una unidad de medida común para todas las categorías.

Ejemplo 8: Clasificación de los 30 alumnos de acuerdo con el rendimiento

Escala de razones o proporciones: La variable que se mide se puede dividir en

 Relación de orden bien definida entre las clases.

 La razón entre valores de la variable adquiere significado.