Estadistica Descriptiva

Jorge Luis Bustos Galindo
Autor
Profesional en Matemáticas y Estadística
Copyright 2016 - Editorial – COLOMBIA

Sello Editorial
Todos los derechos reservados. Ninguna parte de esta publicación puede ser reproducida, almacenada
en sistema alguno de tarjetas perforadas o trasmitida por otro medio – electrónico, mecánico,
fotocopiador, registrador, etcétera sin permiso previo por escrito del autor.
All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or
transmitted in any form by any means, electronic, mechanical, photocopying, recording or otherwise,
without the prior writing permission from author.
Tabla de contenido
ESTADÍSTICA.......................................................................................................................................4
POBLACIÓN Y MUESTRA......................................................................................................................5
VARIABLE Y TIPO DE VARIABLE...........................................................................................................5
Según la medición..........................................................................................................................5
Variables cualitativas..................................................................................................................5
Variables cuantitativas.................................................................................................................5
Según la influencia..........................................................................................................................6
Variables independientes............................................................................................................6
Variables dependientes...............................................................................................................6
ESCALAS DE MEDIDAS.........................................................................................................................6
DISTRIBUCIONES DE FRECUENCIAS.....................................................................................................7
Tablas y gráficas de frecuencias para variables cuantitativas..........................................................7
Variables discretas..........................................................................................................................7
Distribución de frecuencias agrupadas........................................................................................8
Variable continua...........................................................................................................................9
Graficas para variables cuantitativas.............................................................................................10
Gráfico de barras de frecuencias.................................................................................................11
Histograma de frecuencias........................................................................................................12
Polígono de frecuencias............................................................................................................13
Ojiva de frecuencias....................................................................................................................13
Tablas y gráficas de frecuencias para variables cualitativas................................................................14
GUÍA DE CLASE N° 1............................................................................................................................17
MEDIDAS DE TENDENCIA CENTRAL.....................................................................................................19
La Media Aritmética (o simplemente Media)...................................................................................19
Media geométrica...........................................................................................................................21
Media armónica.............................................................................................................................22
Mediana.........................................................................................................................................22
Moda............................................................................................................................................24
Relación entre las medidas de tendencia central..................................................................................26
OTRAS MEDIDAS DE POSICIÓN...........................................................................................................27
Cuartiles.........................................................................................................................................27
Estadística Descriptiva Jorge Luis Bustos Galindo Página 2

Deciles...........................................................................................................................................28
Percentiles......................................................................................................................................29
GUÍA DE TRABAJO Nº 2.......................................................................................................................31
MEDIDAS DE VARIABILIDAD................................................................................................................33
Varianza y Desviación estándar.........................................................................................................33
Coeficiente de variación..................................................................................................................35
Valores estandarizados....................................................................................................................35
GUÍA DE TRABAJO Nº 3.....................................................................................................................37
Estadística Descriptiva Jorge Luis Bustos Galindo Página 3

ESTADÍSTICA
La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos, la
cual ayuda en la toma de decisiones o para explicar condiciones o sucesos de algún fenómeno o
estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, estadística es más
que eso, en otras palabras, es el vehículo que permite llevar a cabo un proceso relacionado con
una investigación científica.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en
áreas de negocios, investigaciones científicas, educación, entre otras.
La estadística se divide en dos grandes áreas:
La estadística descriptiva , se dedica a la descripción, visualización y resumen de datos

originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o
gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar.
Algunos ejemplos gráficos son: histograma, polígono, pirámide poblacional entre otros.
La estadística Inferencial, se dedica a la generación de modelos, inferencias y predicciones

asociados a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones.
Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo
estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de
hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras
observaciones, descripciones de asociación (correlación) o modelación de relaciones entre
variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo
y minería de datos.
Al reseñar las dos áreas de la estadística, se puede resumir como sigue el significado de
estadística:
“La estadística es la ciencia pura y aplicada, que crea, desarrolla y aplica técnicas o modelos de
modo que pueda evaluarse los dilemas derivados de las inferencias inductivas que nos permite
llegar a la generalización y contrastación de resultados”
POBLACIÓN Y MUESTRA
Una Población es el conjunto de todos los elementos que estamos estudiando, acerca de los
cuales intentamos sacar conclusiones y se denota: N. Levin & Rubin (1996). Una población finita
es aquella que está formada por un limitado número de elementos o individuos y una población es
infinita cuando no se conoce el número de elementos o individuos, o también se puede considerar
población infinita cuando una población finita es muy grande.
Una Muestra es una representación significativa de las características de una población y se

denota: n.
VARIABLE Y TIPO DE VARIABLE
Una variable es una característica que al ser medida en diferentes individuos es susceptible de
adoptar diferentes valores. Las variables se denotan generalmente con letras mayúsculas X, Y, Z,
por ejemplo, X: Estaturas de las personas.
Existen diferentes tipos de variables:
Según la medición
Variables cualitativas
Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad
que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de
dichos atributos. Las variables cualitativas no pueden ser medida por ningún instrumento de
medición, por ejemplo: Color de los ojos. Dentro de ellas podemos distinguir:
 Variable cualitativa nominal o categórica: En esta variable los valores no pueden ser
sometidos a un criterio de orden, es decir, no sigue ningún orden, como ejemplo: los colores,
género, estado civil.
 Variable cualitativa ordinal o variable cuasi cuantitativa: La variable puede tomar distintos
valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo
entre mediciones sea uniforme, por ejemplo: los grados o rangos de los oficiales del ejército:
General, Coronel, Mayor, Capitán, Teniente.
Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas, por ejemplo: Estatura de las
personas. Las variables cuantitativas pueden ser:
 Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de
valores que puede tomar. Es decir, los valores que se toma son de números enteros. Ejemplo:
El número de hijos {1, 2, 3 hijos…}.
 Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores, o sea, puede tomar cualquier valor real. Ejemplo: La estatura {1.65m,
1.68m, 1.70m…}. Solamente se está limitado por la precisión del instrumento de medición, en
teoría permiten que siempre exista un valor entre dos variables.
Según la influencia
Según la influencia que asignemos a unas variables sobre otras, podrán ser:
Variables independientes
Una variable independiente también conocida como la variable manipulada, es
aquella cuyo valor no depende de otra variable. Es aquella característica o propiedad
que se supone la causa del fenómeno estudiado. En investigación experimental se llama así a la
variable que el investigador manipula. Ejemplo: Genero.
Variables dependientes
Son las variables de respuesta que se observan en el estudio y que podría estar influenciadas por
los valores de las variables independientes. Ejemplo: Preferencia de los colores.
La variable dependiente es el factor que es observado y medido para determinar el efecto de la
variable independiente.
ESCALAS DE MEDIDAS
Escalas de medición son una sucesión de medidas que permiten organizar datos en orden
jerárquico. Las escalas de medición pueden ser clasificadas de acuerdo a una degradación de las
características de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales.
Según pasa de una escala de otra el atributo o la cualidad aumenta. Las escalas de medición
ofrecen información sobre la clasificación de variables discretas o continuas, también más
conocidas como escalas grandes o pequeñas. Toda vez que dicha clasificación determina la
selección de la gráfica adecuada.
Escala nominal: Es aquella en que los números sólo se emplean para diferenciar un lugar, objeto
o persona. Esta escala de medición es exclusivamente cualitativa y sus variables son por lo tanto
cualitativas. Ejemplos de números con esta característica son los que se usan en las camisetas de
los jugadores de fútbol, los que aparecen en el código de barras de un producto, etc. La escala
nominal es la escala de medición más débil.
Escala ordinal: Es aquella en que los números se utilizan para diferenciar en orden de supremacía
de acuerdo con cierto criterio jerárquico. En esta escala las variables no sólo se asignan a grupos,
sino que además pueden establecerse relaciones de mayor que, menor que o igual que, entre los
elementos. Ejemplo: Los estratos socioeconómicos.
Escala de intervalos: Es una escala más especializada que la nominal y la ordinal en sentido de
que es posible ordenar las mediciones y decir también en cuánto difiere una situación de otra. Esta
escala está caracterizada porque tiene una unidad de medida y un origen (cero) arbitrario y así la
distancia entre dos mediciones tiene un significado preciso. Las variables medidas al nivel de
intervalo se llaman variables de intervalo o variables de escala. Ejemplos de este tipo de variables
son la fecha, la temperatura.
Escala de razón: La escala de razón tiene una unidad de medida y un punto de origen no
arbitrario (un cero verdadero). La mayoría de las cantidades físicas, tales como la masa, longitud,
energía, se miden en la escala de razón. Ejemplos: La edad, estatura, peso corporal, etc.
DISTRIBUCIONES DE FRECUENCIAS
Un conjunto de observaciones puede hacerse más comprensible y adquirir significado mediante un

arreglo ordenado. Sin embargo, al agrupar los datos se logra una mayor síntesis. Se le
llama distribución de frecuencias a la agrupación de datos en categorías mutuamente
excluyentes que indican el número de observaciones en cada categoría. La distribución de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número
existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.
Tablas y gráficas de frecuencias para variables cuantitativas
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla
de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el
número de veces que aparece, es decir, su frecuencia. Se puede complementar la frecuencia
absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el
total de datos. La tabla de frecuencias puede representarse gráficamente.
Variables discretas
Distribución de frecuencias no agrupadas

La distribución de frecuencias no agrupadas en una tabla de frecuencias, se emplea en variables
discretas y/o cuando la amplitud de los datos es pequeña, como se ilustra a continuación.
Ejemplo 1. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.
Para la construcción de la tabla de frecuencias la ordenaremos de la siguiente manera:
 La primera columna de la tabla colocamos la variable de estudio ordenada de menor a mayor.
 La segunda columna la llamaremos frecuencia absoluta (𝒇𝒊 ) y es el recuento de los datos.
La suma de las frecuencias es el número total de observaciones (n).
 La tercera columna la llamaremos frecuencia porcentual o porcentaje (%) y es cada frecuencia
absoluta (𝒇𝒊 ), dividido en el número total de observaciones (n) multiplicado por cien.
 La cuarta columna la llamaremos frecuencia absoluta acumulada (𝑭𝒊 ) y es la suma de
las frecuencias absolutas.
 La quinta columna la llamaremos frecuencia porcentual acumulada o porcentaje acumulado
(% acum.) y es cada frecuencia absoluta acumulada (𝑭𝒊 ), dividido en el número total
de observaciones (n) multiplicado por cien.
Tabla 1. Tabla de frecuencias de las temperaturas máximas registradas durante el mes de julio.
Temperaturas 𝒇𝒊 % 𝑭𝒊 % acum.
27 1 3.22 1 3.22
28 2 6.45 3 9.68
29 6 19.35 9 29.03
30 7 22.58 16 51.61
31 8 25.81 24 77.42
32 3 9.68 27 87.10
33 3 9.68 30 96.77
34 1 3.22 31 100
Total 31 100
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables
toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos
que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente. Cada clase está delimitada por el límite inferior de la clase y el límite superior de
la clase. La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Para la construcción de una tabla de frecuencias con datos agrupados, se aconseja utilizar la
Fórmula de Sturges, para encontrar el número de intervalos y la longitud del intervalo. El número
de intervalos se halla por la siguiente fórmula:
𝐾 = 1 + 3.322 log(𝑛 )
El valor de 𝑲 se aproxima normalmente a un número entero y donde n es el número de
datos.
La longitud que deben tener los intervalos, se obtiene por la fórmula:
𝑥 𝑖 𝑚á𝑥 − 𝑥 𝑖 𝑚í𝑛
𝐶= 𝑘
donde, 𝑥 𝑖 𝑚á𝑥: es el dato mayor, 𝑥 𝑖 𝑚í𝑛: el dato menor y K: el número de intervalos.
El valor de C se toma con un grado de aproximación (por encima) no mayor a aquel con el
que se registran los datos.
El primer intervalo, tomamos como límite inferior al dato menor y se hace el conteo del valor que
arrojó la longitud, teniendo en cuenta que el número del límite inferior también se cuenta y así,
obtendremos el límite superior del primer intervalo. Para el siguiente intervalo, se toma el límite
superior anterior más una unidad y nuevamente se hace el conteo de la longitud y así
sucesivamente, hasta completar el número K de intervalos, o cuando en un intervalo contenga al
mayor de los datos.
Ejemplo 2. Suponga que los siguientes datos corresponden a las puntuaciones del examen de
admisión de los aspirantes a una carrera profesional de una universidad. Se toma una muestra de
50 aspirantes y estos son los resultados:
65, 63, 65, 63, 69, 67, 53, 58, 60, 61, 64, 65, 64, 72, 68, 66, 55, 57, 60, 62, 64, 65, 64, 71, 68, 66,
56, 59, 61, 62, 63, 65, 63, 70, 67, 66, 57, 59, 61, 62, 64, 64, 63, 69, 67, 66, 58, 60, 61, 62.
Solución
Fórmula de Sturges:
 Número de intervalos:
𝐾 = 1 + 3.322 log(50) = 6.6
𝐾 = 7 intervalos
 Longitud de intervalo:
72 − 53
𝐶= = 2.7
7
𝐶=3
Una vez determinados los intervalos y la longitud, procedemos a precisar el número de datos (la
frecuencia) que caen dentro de cada intervalo. Para ello existe varios métodos de conteo, uno de
ellos es hacer una marca, ejemplo / por cada dato que encontremos que cae dentro del intervalo,
para otro intervalo se procede de manera similar realizando una marca por cada dato
contabilizado.
Otra alternativa para determinar la frecuencia de cada intervalo es construyendo un arreglo de
tronco y hoja, que consiste en arreglar los números en columnas, y colocar en la primera el primer
dígito y a continuación el segundo dígito como se ilustra enseguida:
5385769798
653539701454860245486123537612443976012
7210
A partir de este arreglo se puede realizar de manera sencilla el conteo de los datos que quedan en
cada intervalo.
Ahora podremos hacer la tabla de frecuencias completa (todas las columnas):
Tabla 2. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒙𝒊 𝒇𝒊 % 𝑭𝒊 % acum.

1 53 – 55 54 2 4 2 4
2 56 – 58 57 5 10 7 14
3 59 – 61 60 9 18 16 32
4 62 – 64 63 15 30 31 62
5 65 – 67 66 12 24 43 86
6 68 – 70 69 5 10 48 96
7 71 – 73 72 2 4 50 100
Total 50 100
La clase es la escala nominal de los intervalos y la marca de clase (𝒙𝒊) es el punto medio de cada
intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
Variable continua
Para hacer una tabla de frecuencias con variables continua, se procede de manera similar al de las
variables discretas, pero difiere en la construcción de los intervalos. Al primer intervalo se toma el
dato menor (límite inferior) y se suma el valor que arrojó la longitud y así, obtendremos el límite
superior del primer intervalo. Para el siguiente intervalo, se toma el límite superior anterior y se
suma la longitud y así sucesivamente, hasta completar el número de intervalos obtenidos en la
fórmula K, o cuando en un intervalo contenga al mayor de los datos. Hay que tener en cuenta que
el límite inferior de una clase pertenece al intervalo (intervalo cerrado), pero el límite superior no
pertenece al intervalo (intervalo abierto), se cuenta en el siguiente intervalo. Ejemplo [3.1, 3.4) los
números que pertenecen a este intervalo son {3.1, 3.2, 3.3}.
Ejemplo 3. Los siguientes datos corresponden al tiempo que han necesitado 30 clientes de un
banco para llevar a cabo una transacción bancaria:
4.1, 3.1, 0.1, 6.5, 5.0, 2.5, 7.4, 10.0, 3.3, 8.0, 2.0, 0.4, 6.4, 1.1, 9.5, 2.8, 1.2, 1.3, 4.1, 9.5, 4.6, 4.3,
3.6, 5.5, 1.4, 2.8, 1.5, 1.6, 7.3, 7.0.
Fórmula de Sturges:
 Número de intervalos:
𝐾 = 1 + 3.322 log(30) = 5.9
𝐾 = 6 intervalos
 Longitud de intervalo:
10.0 − 0.1
𝐶 = 1.65
= 6
𝐶 = 1.7
La longitud de 1.65 se aproxima a 1.7, debido a que los datos provienen de una variable continua y
con un solo decimal.
La tabla de frecuencias completa queda:
Tabla 3. Tiempo que han necesitado 30 clientes de un banco para llevar a cabo una transacción
bancaria.
Clase Tiempo 𝒙𝒊 𝒇𝒊 % 𝑭𝒊 % acum.

1 [0.1, 1.8)
2 [1.8, 3.5)
3 [3.5, 5.2)
4 [5.2, 6.9)
5 [6.9, 8.6)
6 [8.6, 10.3]
Total 30 100
Completar la anterior tabla.
Algunas tablas de frecuencias, los intervalos que se han tomado están separados entre sí por una
unidad esto es debido a que los datos son de una variable discreta. A estas tablas, es conveniente
darle una condición de continuidad, para efectos del cálculo de algunos parámetros o para realizar
algunas gráficas. A cada intervalo, al límite inferior se le resta 0.5 y al límite superior se le suma la
misma cantidad 0.5. Haciendo estas operaciones a la tabla 2, toma la forma:
universidad.
Clase Puntajes 𝒇𝒊
1 52.5 – 55.5 2
2 55.5 – 58.5 5
3 58.5 – 61.5 9
4 61.5 – 64.5 15
5 64.5 – 67.5 12
6 67.5 – 70.5 5
7 70.5 – 73.5 2
Total 50
Gráficas para variables cuantitativas
En la guía hemos visto cómo organizar una tabla de frecuencias, de un conjunto de datos que
contiene la información sobre alguna variable. Esas tablas permiten una lectura más rápida que el
listado completo. Ahora veremos cómo presentar esos conjuntos de datos gráficamente. Las
gráficas nos permiten visualizar globalmente cómo se distribuyen las frecuencias entre los distintos
datos. Hay gráficas de distinto tipo; nosotros podemos ver algunas de ellas en tv, revistas,
periódicos, etc. En esta guía aprenderemos a construir y a leer algunas gráficas.
Las gráficas de una variable discreta, son las mismas realizadas con la variable continua (véase
figuras 4 y 5), excepto que en una variable discreta se realiza un gráfico de barras de frecuencias
(figura 1) y en una variable continua se realiza un histograma de frecuencias (figura 2 y 3).
Para ilustrar los diferentes tipos de gráficas tomaremos la tabla de frecuencias (Tabla 2) con la
marca de clase y la frecuencia absoluta y absoluta acumulada.
Gráfico de barras de frecuencias
Para construir una gráfica de barras con estos valores tomamos dos ejes perpendiculares; en el eje
horizontal señalamos los valores de la variable (puntuaciones) y en el eje vertical señalamos los
valores de la frecuencia (número de aspirantes). Como en ambos casos trabajamos con números,
para ubicar los valores en cada eje tenemos que considerar una unidad, aunque las unidades del
eje horizontal pueden ser distintas a las del eje vertical, como se ilustra a continuación:
Figura 1. Gráfica de barras de frecuencias absoluta.
El gráfico de barras se usa cuando los intervalos están separados entre sí (no existe continuidad
entre los intervalos), como lo ilustra la gráfica anterior.
Histograma de frecuencias
El histograma de frecuencias es una representación visual de los datos continuos (intervalos sin
interrupción). Los histogramas pueden estar referidos a las frecuencias absolutas, relativas
(porcentajes) y las frecuencias acumuladas.
La figura 2, es el histograma de frecuencias absolutas correspondiente a la distribución de los

puntajes del examen de admisión de 50 aspirantes a una carrera profesional en una universidad
(véase tabla 4).
Figura 2. Histograma de frecuencias absolutas
Otra ilustración del histograma de frecuencias para variables continuas, la podemos

observar en la figura 3, correspondiente a los tiempos que han necesitado 30 clientes de un
banco para llevar a cabo una transacción bancaria (véase tabla 3).
Figura 3. Histograma de frecuencias absolutas
Polígono de frecuencias
El polígono de frecuencia se construye sobre el sistema de coordenadas cartesianas, al colocar
sobre cada marca de clase un punto a una altura igual a la frecuencia asociada a esa clase; luego
se unen dichos puntos por segmento de recta. La figura 4, es el polígono de frecuencias de los
datos de la tabla 2.
Figura 4. Polígono de frecuencia absoluta.
Ojiva de frecuencias
La ojiva es el polígono que se obtiene al unir por segmentos de rectas los puntos situados a una
altura igual a la frecuencia acumulada a partir de la marca de clase como se hizo con el polígono
de frecuencia (véase figura 2). La figura 5 es la ojiva de frecuencia de los datos de la tabla 2.
Figura 5. Ojiva de frecuencia absoluta.

Tablas y gráficas de frecuencias para variables cualitativas
La construcción de una tabla de frecuencias para datos cualitativos requiere sólo del conteo del
número de elementos o individuos que caen dentro de cierta clase o tienen determinada
característica. En una tabla de frecuencias para datos cualitativos no se dan intervalos de clase por
carecer éstos de sentido. Como tampoco existe la frecuencia acumulada.
A continuación, se muestran tablas y gráficas para datos cualitativos.
Ejemplo 4. Los siguientes datos corresponden al número de estudiantes de cierta universidad de

acuerdo con su lugar de origen.
Tabla 5. Lugar de origen de los estudiantes de una universidad.
Lugar de origen N° Estudiantes

Antioquia 40
Atlántico 20
Cundinamarca 50
Tolima 70
Total 180
Figura 6. Gráfico de barras para datos cualitativos.
En algunos casos es conveniente para propósitos comparativos representar mediante un mismo

gráfico dos características que están relacionadas, como se muestra a continuación.
Ejemplo 5. En la tabla que sigue se da el número y sexo de los empleados de una empresa en los
años comprendidos entre 2009 y 2012.
Tabla 6. Número y sexo de los empleados de una empresa.
Año
Sexo 2009 2010 2011 2012
Masculino 150 180 200 300
Femenino 50 70 100 100
Total 200 250 300 400
Figura 7. Histograma doble.
En otros casos lo que nos interesa no es mostrar el número de veces que se da una característica
o atributo, sino más bien resaltar la proporción (porcentaje) en que aparece una característica
respecto del total. Así, por ejemplo, para ilustrar de manera gráfica una situación como la que se
presenta en seguida.
Ejemplo 6. El número de empleados de una empresa se distribuye porcentualmente de acuerdo

con su tiempo de vinculación, como se indica en seguida:
Tabla 7. Tiempo de vinculación de los empleados de una empresa.
Tiempo de vinculación Porcentaje

Menos de cinco años 20%
Entre cinco y diez años 50%
Entre diez y quince años 15%
Entre quince y veinte años 10%
Más de veinte años 5%
Para construir el diagrama circular partimos del hecho de que un círculo tiene un total de 360°.
Luego, mediante una regla de tres simple, repartiremos los 360° en distintos sectores circulares, de
acuerdo con cada porcentaje; tenemos así que para determinar el sector circular correspondiente
al 20% realizamos la conversión:
20 × 360°
20% = = 72°
100
Esto es, el 20% corresponde a un sector circular de 72° de medida. A continuación, con ayuda de
un transportador, señalaremos el sector circular correspondiente. Igualmente, para 50° se tienen
180°, 15% se tienen 54°, 10% se tienen 36° y finalmente para 5% se tienen 18°. La figura 7,
muestra la representación gráfica.
Grafica 8. Diagrama circular.
A diferencia de otros tipos de gráficos, el grafico circular no tiene ejes x o y.

GUÍA DE TRABAJO N° 1
1. En la tabla que sigue, determine la variable y la escala de medida que corresponde a la

medición de cada una de las siguientes características:
a. Nivel de ruido.
b. La ocupación de una persona en el lugar de trabajo.
c. Número de habitantes por población.
d. Estatura de un estudiante.
e. Tiempo de congelación del agua.
f. Las notas de una materia en la universidad.
g. El número de piso de un edificio.
Ítem Variable Escala de medida

a
b
c
d
e
f
g
2. Determine el número de intervalos "K" (Fórmula de Sturges) para las siguientes cantidades
de datos:
a. 42 b. 55 c. 70 d. 103 e. 200
3. Teniendo en cuenta el dato menor (𝑥𝑖 𝑚í𝑛 ) y el dato mayor ( 𝑥 𝑖 𝑚á𝑥 ), encuentre la
longitud de intervalo "C", para K= 5, 6 y 7 intervalos.
a. (15, 63)
b. (17.2, 78.9)
c. (9.18, 20.76)
d. (0.123, 6.054)
4. Teniendo en cuenta la construcción de una tabla de frecuencias agrupadas, haga un cuadro

comparativo cuando ésta se hace para una variable discreta y para una variable continua.
5. Estatura en centímetros de 30 estudiantes de un curso de un colegio.

154, 158, 162, 148, 163, 153, 159, 180, 165, 168, 156, 148, 162, 157, 153, 158, 147, 165, 166,
175, 172, 172, 167, 160, 155, 147, 156, 161, 159, 178.
a. Construya una tabla de frecuencias agrupadas.

b. De la tabla de frecuencias que puede decir de los siguientes datos: f 3, % (1), F2 y % (4) acum.
c. Construya el gráfico de barras y un polígono.
6. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes:

5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6,
5, 6, 7, 3, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
a. Construya una tabla de frecuencias agrupadas completa.

b. De la tabla de frecuencias que puede decir de los siguientes datos: f 2, % (3), F4 y % (5) acum.
c. Construya el gráfico de barras y un polígono.
d. Construya una ojiva.
7. Se mide el coeficiente intelectual (CI) de veinticinco estudiantes para determinar el rango
que se encuentran los estudiantes para un posterior rendimiento académico. Los resultados
de la de las puntuaciones son las siguientes:
Puntuaciones de CI Número de estudiantes
105 2
106 1
107 3
108 4
109 5
110 4
111 2
112 3
113 1
Total 25
a. Obtenga las distribuciones de frecuencias porcentuales y las acumuladas.

b. Construya un histograma, un polígono y una ojiva.
8. Considérense los siguientes datos, los cuales representan a la distancia recorrida de cierto
animal de su morada en la búsqueda de alimento:
5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00
5.60 7.64 8.82 5.64 10.08 3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72 8.26
7.90 6.65 7.25 6.26 6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.67 6.25
7.63 6.73 7.60 8.14 6.91 7.82 6.76 7.75 4.00
a. Construya una tabla de frecuencias completa.

b. Construya un histograma y un polígono.
c. Construya un histograma de frecuencia acumulada y una ojiva.
9. En una empresa el personal se distribuye de acuerdo con su actividad desarrollada en la

misma, como se indica a continuación:
Actividad Porcentaje
Profesional 8%
Técnico 10%
Operario 70%
Ayudante 10%
Aseo 2%
Construya un diagrama circular para ilustrar la situación.
10. Los siguientes son los colores de los automóviles de 36 profesores de la universidad. Construya
un gráfico de barras para ilustrar esta situación.
Negro, azul, rojo, rojo, blanco, amarillo, crema, rojo, azul, oro, negro, plateado, verde, verde,
blanco, negro, oro, azul, rojo, gris, gris, verde, blanco, negro, azul, café, naranja, crema, rojo,
negro, plateado, oro, amarillo, blanco, rojo, café.
MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un

solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de
datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se
hace referencia únicamente a la posición de estos parámetros dentro de la distribución,
independientemente de que ésta esté más o menos centrada, se habla de estas medidas
como medidas de posición. Se debe tener en cuenta que existen variables cualitativas y variables
cuantitativas, por lo que las medidas de posición o medidas de tendencia se usan de acuerdo al
tipo de variable que se está observando, en este caso se observan variables cuantitativas.
Entre las medidas más comunes de tendencia central tenemos:
 Media .
 Media geométrica.
 Media armónica.
 Mediana.
 Moda.
La Media Aritmética (o simplemente Media)
La media aritmética también llamada promedio de los datos, es el valor obtenido por la suma de
todos sus valores dividida entre el número de sumandos.
Definición formal
Dado un conjunto numérico de datos, 𝑥1, 𝑥2,… , 𝑥𝑛 , se define su media aritmética para datos no
agrupados como:
𝒙 𝒙𝟏 + 𝒙𝟐 + ⋯ + ∑𝒏 𝒙
̅𝒏
𝒊=𝟏 𝒊
𝑿= =
𝒏 𝒏
Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es,
también puede calcularse para variables agrupadas en intervalos.
PROPIEDADES
Las principales propiedades de la media aritmética son:
 Su cálculo es muy sencillo y en él intervienen todos los datos.
 Su valor es único para una serie de datos dado.
 Se usa con frecuencia para comparar poblaciones, aunque es más apropiado acompañarla de
una medida de dispersión.
Inconvenientes de su uso
Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en situaciones muy
diversas, tiene también algunos inconvenientes, como son:
 Para datos agrupados en intervalos (variables continuas) su valor oscila en función de la

cantidad y amplitud de los intervalos que se consideren.
La altura media de los pinos como resumen de una población homogénea ( arriba) o
heterogénea (abajo).
 Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto
menos homogéneos sean los datos, menos información proporciona. Dicho de otro modo,
poblaciones muy distintas en su composición pueden tener la misma media. Por ejemplo, un
jardín con cinco pinos de igual altura, 1,95 m, evidentemente, tendría una altura media de 1,95
m, valor que representa fielmente a esta población homogénea. Sin embargo, en un jardín de
pinos de alturas más heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo,
tendría también, como puede comprobarse, una altura media de 1,95 m, valor que no
representa a casi ninguno de sus componentes.
 En el cálculo de la media no todos los valores contribuyen de la misma manera. Los valores
altos tienen más peso que los valores cercanos a cero. Por ejemplo, en el cálculo del salario
medio de una empresa, el salario de un alto directivo que gane $5.000.000 tiene tanto peso
como el de cinco empleados "normales" que ganen $1.000.000. En otras palabras, se ve muy
afectada por valores extremos.
 No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.
Ejemplo 1. Los siguientes datos corresponden a las notas de 5 estudiantes en una prueba:
6.0, 5.4, 3.1, 7.0, 6.1
6.0 + 5.4 + 3.1 + 7.0 + 6.1

𝑿̅= 5
𝑿̅= 5.52
Como se interpreta esta medida, el promedio de las notas de los cinco estudiantes es de 5.5.
La media para datos agrupados (tablas de frecuencias) de define de la siguiente manera:
𝒙 𝒇𝟏 . 𝒙𝟏 + 𝒇𝟐 . 𝒙𝟐 + ⋯ + 𝒇𝒏 .
̅𝒏 ∑𝒏 𝒇 𝒙
𝒊=𝟏 𝒊 𝒊
𝑿= =
𝒏 𝒏
donde, 𝑓𝑖 : es la frecuencia absoluta, 𝑥 𝑖: la marca de clase y n el número de observaciones.
universidad.
Clase Puntajes 𝒙𝒊 𝒇𝒊
1 53 – 55 54 2
2 56 – 58 57 5
3 59 – 61 60 9
4 62 – 64 63 15
5 65 – 67 66 12
6 68 – 70 69 5
7 71 – 73 72 2
Total 50
2(54) + 5(57) + 9(60) + 15 (63) + 12 (66) + 5(69) + 2(72) 3159

𝑿̅= 50 = 50
𝑿̅= 63.18
Podemos concluir, que el puntaje promedio de los 50 aspirantes a una carrera profesional en una
universidad fue de 63.2.
Media geométrica
En matemáticas y estadística, la media geométrica de una cantidad arbitraria de números (por
decir n números) es la raíz n-ésima del producto de todos los números, es recomendada para
datos de progresión geométrica, para promediar razones, interés compuesto y números índices. La
media geométrica se denota y se define como sigue:
𝒏
𝒏
𝑮 = 𝒏√𝒙𝟏. 𝒙𝟐. 𝒙𝟑 … 𝒙𝒏 =
√∏𝒙𝒊
𝒊=𝟏
El signo π se lee como la productoría.
Ejemplo 2. La media geométrica de 2 y 18 es

𝐺 = √2 ∗ 18 = √36 = 6
Ejemplo 3. La media geométrica de 1, 3 y 9 sería
𝐺 = 3√1 ∗ 3 ∗ 9 = 3√27 = 3
Media armónica
La media armónica, denominada H, de una cantidad finita de números es igual al recíproco, o

inverso, de la media aritmética de los recíprocos de dichos valores y es recomendada para
promediar velocidades.
Así, dados n números𝑥1 , 𝑥 2 , … , 𝑥 𝑛 , la media armónica será igual a:
𝒏
𝑯= 𝒏
𝟏
+𝟏+⋯+𝟏 = 𝟏
∑𝒏
𝒙𝟏 𝒙𝟐 𝒙𝒏 𝒊=𝟏 𝒙
𝒊
La media armónica resulta poco influida por la existencia de determinados valores mucho más
grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños
que el conjunto.
La media armónica no está definida en el caso de que exista algún valor nulo.
Ejemplo 4. La media armónica de 1, 3 y 9 es:
3
𝑯= 3 27
= = = 2.07
1 1
1+ + 13
13
1 3 9 9
Mediana
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez
que éstos están ordenados de menor a mayor. Es decir, es el dato central.
Definición formal
Dado un conjunto numérico de datos ordenados, 𝑥 1 , 𝑥 2 , … , 𝑥 𝑛, se define su mediana para datos
no agrupados como:
𝒏+𝟏
𝒙( ) , 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐 𝒊𝒎𝒑𝒂𝒓
𝟐
𝑿̃=
𝒙 (𝟐𝒏) + 𝒙 ( 𝒏
+ 𝟏)
𝟐
, 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐 𝒑𝒂𝒓
{ 𝟐
Ejemplo 5. Encuentre la mediana del número de hijos de un conjunto de trece familias, cuyos
respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1.
Ordenados los datos tenemos:

1, 1, 1, 1, 1, 1,
2 , 2, 2, 2, 3, 3, 4, como 𝑛 =13 (un número impar), entonces la mediana es:
𝒏+𝟏
̃
Como el valor central es 2, entonces concluimos que el 50% de las trece familias tiene 2 hijos.
En caso de un número par de datos, puede ser que la mediana no corresponda a ningún valor de
la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos
valores centrales. Por ejemplo, tomando ahora a doce de hijos la mediana es:
1, 1, 1, 1, 1,
1, 2 , 2, 2, 3, 3, 4, como 𝑛 =12 (un número par), entonces tenemos:
𝒙 (𝟏𝟐) + 𝒙 (𝟏𝟐 + 𝟏)
𝟐 𝟐
𝑿̃= 𝟐
𝒙𝟔 + 𝒙𝟕
𝑿̃=𝟐
Lo que indica, que se debe tomar el sexto dato (𝒙𝟔) y el séptimo (𝒙𝟕 ) dato, sumarlo y dividirlo en
dos (2), siendo así:
𝟏+𝟐
𝑿̃= = 𝟏. 𝟓
𝟐
Entonces concluimos que el 50% de las doce familias tienen entre 1 y 2 hijos.
La mediana para datos agrupados (tablas de frecuencias) se define y se denota de la siguiente

forma:
𝒏
( ) − 𝑭𝒎−𝟏
𝑿̃= 𝑳𝒎 + [ 𝟐 ].𝒄
𝒇𝒎
Donde, 𝐿𝑚 : Límite (real) inferior de la clase mediana.

𝑛
: Clase mediana.
2
𝐹𝑚 −1: Frecuencia absoluta acumulada de la clase que le antecede a la de la clase mediana.

𝑓𝑚 : Frecuencia absoluta de la clase mediana.
c: Longitud del intervalo de la clase mediana.
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
4 62 – 64
Clase mediana 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
Para determinar la clase mediana, se toma aquella clase que sea igual a (𝑛) o se aproxime por
2
encima en la frecuencia absoluta acumulada (𝑭 𝒊). Calculando la clase mediana, tenemos: 𝑛
= 5 0
=
2 2
25, entonces la clase mediana es la cuarta. A partir de esta clase se tiene: 𝐿𝑚 = 61.5, 𝐹𝑚 −1 = 16,
𝑓𝑚 = 15 y 𝑐 = 3.
Calculando en la fórmula de la mediana se tiene
25 − 16
̃
𝑿 = 61.5 + ]×3
15
𝑿̃= 61.5 + 1.8
𝑿̃= 63.3
El 50% de los 50 aspirantes a una carrera profesional en una universidad tiene un puntaje de 63.3.
Propiedades e inconvenientes
Las principales propiedades de la mediana son:
 Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de

transcripción en la serie del ejemplo anterior en, pongamos por caso, el último número, deja a la
mediana inalterada.
 Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando
alguno de ellos no está acotado.
 No se ve afectada por la dispersión. De hecho, es más representativa que la media aritmética
cuando la población es bastante heterogénea. Suele darse esta circunstancia cuando se resume la
información sobre los salarios de un país o una empresa. Hay unos pocos salarios muy altos que
elevan la media aritmética haciendo que pierda representatividad respecto al grueso de la
población. Sin embargo, alguien con el salario "mediano" sabría que hay tanta gente que gana más
dinero que él, como que gana menos.
Sus principales inconvenientes son que, en el caso de datos agrupados en intervalos, su valor
varía en función de la amplitud de estos. Por otra parte, no se presta a cálculos algebraicos tan
bien como la media aritmética.
Moda
La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En cierto
sentido la definición matemática corresponde con la locución "estar de moda", esto es, ser lo que
más se lleva y se denota 𝑿̂
.
Ejemplo 6. El número de personas en distintos vehículos en una autopista son: 5, 7, 4, 6, 9, 5, 6, 1, 5, 3
y 7. El número que más se repite es 5, entonces la moda es 5 y se denota: 𝑿̂ = 5. Podemos
concluir, que el número más frecuente de personas es los vehículos en una autopista es de 5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos
se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen
la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados (tablas de frecuencias) está dada por la siguiente fórmula:
𝒅𝟏
𝑿̂= 𝑳𝒎 + [ ]. 𝒄
𝒅 𝟏 + 𝒅𝟐
Donde, 𝐿𝑚 : Límite (real) inferior de la clase modal.
𝑑1: Diferencia entre la frecuencia de la clase modal y de la clase que la antecede.
𝑑 2: Diferencia entre la frecuencia de la clase modal y de la clase que le sigue.
c: Longitud de intervalo de la clase modal.
Clase modal, es la clase con la mayor frecuencia absoluta (𝒇𝒊 ).
universidad.
Clase Puntajes 𝒇𝒊
1 53 – 55 2
2 56 – 58 5
3 59 – 61 9
Clase modal 4 62 – 64 15
5 65 – 67 12
6 68 – 70 5
7 71 – 73 2
Total 50
En la clase en donde hay la mayor frecuencia absoluta es la clase 4, por ende, es la clase modal.
Por tanto,
𝐿𝑚 = 61.5, 𝑑 1 = 15 − 9 = 6, 𝑑 2 = 15 − 12 = 3 y 𝑐 = 3.
Calculando en la fórmula de la moda se tiene
6
̂ 𝑿 = 61.5 + ] ×3
6+3
̂
𝑿 = 61.5 + 2
𝑿̂= 63.5
El puntaje más frecuente de los 50 aspirantes a una carrera profesional en una universidad fue de
63.5
Propiedades:
 Cálculo sencillo.
 Interpretación muy clara.
 Al depender sólo de las frecuencias, puede calcularse también para variables cualitativas. Es
por ello el parámetro más utilizado cuando al resumir una población no es posible realizar otros
cálculos, por ejemplo, cuando se enumeran en medios periodísticos las características más
frecuentes de determinado sector social. Esto se conoce informalmente como "retrato robot".
Inconvenientes:
 Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a
variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende
excesivamente del número de intervalos y de su amplitud.
 Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la
moda, no afectan en modo alguno a su valor.
 No siempre se sitúa hacia el centro de la distribución.
 Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la
misma frecuencia (distribuciones bimodales o multimodales).
Relación entre las medidas de tendencia central
La media, mediana y moda se consideran las medidas de posición más importantes por su
sencillez y utilidad. No obstante, no son aplicables a todos los casos.
A continuación, se muestra gráficamente las posiciones de la media, mediana y la moda en curvas

simétricas y sesgadas (asimétricas).
Caso I. Cuando las tres medidas coinciden, 𝑿̅= 𝑿̃= 𝑿̂

, la gráfica describe una curva normal
o simétrica.
Caso II. Cuando la media es mayor que la mediana, 𝑿̅> 𝑿̃

, la gráfica describe una curva
asimétrica o sesgada a la derecha.
Caso III. Cuando la mediana es mayor que la media, 𝑿̃> 𝑿̅

, la gráfica describe una curva
asimétrica o sesgada a la izquierda.
Ejemplo 7. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad, y tomando las medidas exactas tenemos que: 𝑿̅= 63.2, 𝑿̃ = 63.3 y 𝑿̂ = 63.5,
como la mediana es mayor que la media, entonces los puntajes están sesgados a la izquierda. Lo
que nos indica que hay algunos puntajes están dispersos a la izquierda (aspirantes con puntajes
bajos) que nos hace dar el sesgo.
OTRAS MEDIDAS DE POSICIÓN
Los cuartiles, deciles y percentiles son medidas que se utilizan para determinar los intervalos
dentro de los cuales quedan proporcionalmente repartidos los términos de la distribución.
Cuartiles
Los cua rtile s son los t res valores de la variable que divide n a un conjunto de datos
ordenados en c uat ro part es porc ent ualment e iguales . 𝑄 1 , 𝑄 2 𝑦, 𝑄 3 det erminan los
valores correspondientes al 25%, 50% y 75% de los datos. 𝑄2 coincide con la mediana.
Para calcular estas tres medidas se procede de manera semejante al cálculo de la mediana.
Los cuartiles para datos agrupados (tablas de frecuencias) se denota y define de la

siguiente manera:
𝒌 (𝒏) − 𝑭
𝒌−𝟏
𝟒
𝑸𝒌 = 𝑳𝒌 + [ ].𝒄; 𝒌 = 𝟏, 𝟐, 𝟑.
𝒇𝒌
Donde,
𝐿𝑘 : Límite (real) inferior de la clase cuartil.
𝑘 (𝑛): Clase cuartil.
4
𝐹𝑘 −1: Frecuencia absoluta acumulada de la clase que le antecede a la de la clase cuartil.
𝑓𝑘 : Frecuencia absoluta de la clase cuartil.
c: Longitud del intervalo.
universidad.
1 53 – 55 2 2
2 56 – 58 5 7
𝑄1 3 59 – 61 9 16
4 62 – 64 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
Si calculamos el primer cuartil 𝑄1, tenemos:
Clase cuartil: 𝑘 (𝑛) = 1 (50) = 12.5, cuyo valor aproximado en la frecuencia absoluta acumulada
4 4
(𝑭 𝒊) está en la case 3. A partir de esta clase se tiene:
𝐿𝑘 = 58.5, 𝐹𝑘 −1 = 7, 𝑓𝑘 = 9 y 𝑐 = 3.
Calculando en la fórmula de los cuartiles se tiene
𝑄1 12.5 − 7
= 58.5 + [ ]×3
9
𝑄1 = 58.5 + 1.8
𝑄1 = 60.3
Deciles
Los de cile s son los valores de la variable que dividen a un conjunto de datos ordenados en diez
partes porcentualmente iguales. 𝐷1, 𝐷2, 𝐷3 , … , 𝐷9, determinan los valores correspondientes al
10%, 20%, 30%, … y 90% de los datos. 𝐷5 coincide con la mediana.
Para calcular estas nueve medidas se procede de manera semejante al cálculo de la mediana.
Los deciles para datos agrupados (tablas de frecuencias) se denota y define de la siguiente
manera:
𝒌(𝒏)−𝑭
𝒌−𝟏
𝟏
𝑫𝒌 = 𝑳𝒌 + [ 𝟎 ] . 𝒄 ; 𝒌 = 𝟏, 𝟐, 𝟑, … , 𝟗.
𝒇𝒌
Donde,
𝐿𝑘 : Límite (real) inferior de la clase decil.
𝑘 ( 𝑛 ): Clase decil.
10
𝐹𝑘 −1: Frecuencia absoluta acumulada de la clase que le antecede a la de la clase decil.
𝑓𝑘 : Frecuencia absoluta de la clase decil.
universidad.
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
4 62 – 64 15 31
𝐷7 5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
Si calculamos el séptimo decil 𝐷7, tenemos:

Clase decil: 𝑘 ( 𝑛 ) = 7 (50 ) = 35, cuyo valor aproximado en la frecuencia absoluta acumulada ( 𝑭 𝒊)
10 10
está en la case 5. A partir de esta clase se tiene:
𝐿𝑘 = 64.5, 𝐹𝑘 −1 = 31, 𝑓𝑘 = 12 y 𝑐 = 3.
Calculando en la fórmula de los deciles se tiene
𝐷7 35 − 31
= 64.5 + [ ]×3
12
𝐷7 = 64.5 + 1
𝐷7 = 65.5
Percentiles
Los pe rce ntile s son los valores de la variable que dividen a un conjunto de datos
ordenados en cien partes porcentualmente iguales. 𝑃1 , 𝑃2 , 𝑃3 , … , 𝑃17 , … 𝑃50 , … , 𝑃98 𝑦
𝑃99 , determinan los valores correspondientes al 1%, 2%, 3%, …, 17%, …, 50%, …, 98%
y 99% de los datos. 𝑃50 coincide con la mediana.
Para calcular estas cien medidas se procede de manera semejante al cálculo de la mediana.
Los percentiles para datos agrupados (tablas de frecuencias) se denota y define de la

siguiente manera:
𝒌(𝒏 )−𝑭
𝒌−𝟏
𝑷𝒌 = 𝑳𝒌 + [ 𝟏𝟎𝟎 ] . 𝒄 ; 𝒌 = 𝟏, 𝟐, 𝟑, … , 𝟗𝟗.
𝒇𝒌
Donde,
𝐿𝑘 : Límite (real) inferior de la clase percentil.
𝑘 ( 𝑛 ): Clase percentil.
100
𝐹𝑘 −1: Frecuencia absoluta acumulada de la clase que le antecede a la de la clase percentil.
𝑓𝑘 : Frecuencia absoluta de la clase percentil.
universidad.
1 53 – 55 2 2
𝑃5 2 56 – 58 5
7
3 59 – 61 9 16
4 62 – 64 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
Si calculamos el quinto percentil 𝑃5 , tenemos:

Clase percentil: 𝑘 ( 𝑛 ) = 5 ( 50 ) = 2.5, cuyo valor aproximado en la frecuencia absoluta
100 100
acumulada (𝑭 𝒊) está en la case 2. A partir de esta clase se tiene:
𝐿𝑘 = 55.5, 𝐹𝑘 −1 = 2, 𝑓𝑘 = 5 y 𝑐 = 3.
Calculando en la fórmula de los deciles se tiene

2.5 − 2
𝑃5 = 55.5 + [ 5
]×3
𝑃5 = 55.5 +
0.3
𝑃5 = 55.8
Los cuartiles, deciles y percentiles para datos no agrupados, se define respectivamente como:
𝒙 (𝒌 (𝒏+𝟏 )) , 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐 𝒊𝒎𝒑𝒂𝒓

𝑸𝒌 = { 𝟒
( ( (𝒏) ) ; 𝒌 = 𝟏, 𝟐, 𝟑
(𝒏))
𝒙𝒌
𝟒 𝟒 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐 𝒑𝒂𝒓
+𝒙 𝒌 +𝟏 , 𝟐
𝒙 (𝒌 (𝒏+𝟏 )) , 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐
𝒊𝒎𝒑𝒂𝒓
𝟏𝟎
𝑫𝒌 = { 𝒏 𝒏 ; 𝒌 = 𝟏, 𝟐, … , 𝟗
𝒙(𝒌( ))+𝒙(𝒌( )+𝟏)
𝟏𝟎 𝟏𝟎
, 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐
𝒑𝒂𝒓
𝟐
𝒙 (𝒌 (𝒏+𝟏 )) , 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐 𝒊𝒎𝒑𝒂𝒓

𝑷𝒌 = { 𝟏𝟎𝟎 ; 𝒌 = 𝟏, 𝟐, … , 𝟗𝟗
𝒏 𝒏
𝒙(𝒌( ))+𝒙(𝒌( )+𝟏)
𝟏𝟎𝟎 𝟏𝟎𝟎
, 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐 𝒑𝒂𝒓
𝟐
Ejemplo 8. Encuentre 𝑄3, 𝐷2 y 𝑃40, de la siguiente sucesión de datos: 13, 24, 22, 45, 52, 11, 10,
42, 32, 43, 31, 21, 42, 41 y 61.
Para: 𝑄3
Ordenados los datos tenemos:
10, 11, 13, 21, 22, 24, 31, 32, 41, 42, 42, 43, 45, 52, 61; 𝑛 =15 (un número impar)
𝑸𝟑 = 𝒙 (𝒌 (𝒏+𝟏)) = 𝒙 (𝟑 (𝟏𝟓+𝟏)) = 𝒙𝟏𝟐 = 𝟒𝟑

𝟒 𝟒
Para: 𝐷2
𝑫𝟐 = 𝒙 (𝒌 ( 𝒏+𝟏 )) = 𝒙 (𝟐 (𝟏𝟓+𝟏 )) = 𝒙 𝟑.𝟐 ≅ 𝒙 𝟑 = 𝟏𝟑

𝟏𝟎 𝟏𝟎
Como la posición del 𝐷2 es 𝑥 3.2, entonces lo aproximamos a la posición 𝑥 3, que corresponde

al número 13.
Para: 𝑃40
(
𝒏+𝟏 )) ( 𝟏 𝟓 +))
𝟏
𝑷𝟒𝟎 = 𝒙 𝒌 ( = 𝒙 𝟒𝟎 = 𝒙 𝟔 .𝟒 ≅ 𝒙 𝟔 = 𝟐𝟒
𝟏𝟎𝟎 ( 𝟏𝟎𝟎
Como la posición del 𝑃40 es 𝑥6.4, entonces lo aproximamos a la posición 𝑥6, que corresponde al
número 24.
GUÍA DE TRABAJO Nº 2
1. Halle la media, mediana y moda para las siguientes sucesiones de datos:

(a) 2, 4, 5, 6, 6, 6, 9, 10, 13, 15
(b) 1, 3, 5, 7, 7, 7, 9, 9, 10, 10, 11, 12, 18
Compruebe la relación entre estas medidas, para cada una de las sucesiones anteriores.
2. Sean las observaciones: 1, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6

Construya una tabla de frecuencias agrupadas y calcule la media, mediana y moda por medio
de fórmulas de estas medidas para datos agrupados. ¿Qué relación encuentra entre estas
medidas?
3. Para un conjunto de observaciones dado, responda las siguientes preguntas:

(a) ¿Cuándo es mayor la media que la mediana?
(b) ¿Cuándo es menor la media que la mediana?
4. Halle 𝑄1, 𝐷7 y 𝑃65, de las siguientes sucesión de

datos: (a) 6, 9, 10, 8, 12, 7, 11, 13, 14
(b) 3, 1, 4, 4, 4, 5, 1, 6, 9, 14, 8, 13
5. En la tabla que sigue se da la distribución de frecuencia de los puntajes de un test practicado a

120 trabajadores de una empresa, donde se determina el grado de conocimiento que tenían
sobre la organización de la misma.
Clase Intervalo fi
1 76 – 80 4
2 81 – 85 7
3 86 – 90 10
4 91 – 95 13
5 96 – 100 25
6 101 – 105 29
7 106 – 110 12
8 111 – 115 11
9 116 - 120 9
Calcule e intérprete cada una de las siguientes medidas:

(a) La media (c) La mediana
(b) El 70o percentil (d) El tercer cuartil
6. Considérense los siguientes datos, los cuales representan la razón de precio - ganancia de una
emisión de acciones, de certificados de valores vendidos muy por arriba del precio promedio del
mercado:
5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00 5.60 7.64
8.82 5.64 10.08 3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72 8.26 7.90 6.65 7.25 6.26
6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.67 6.25 7.63 6.73 7.60 8.14 6.91 7.82
6.76 7.75 7.36 8.52 7.23 7.63 6.95 7.78 10.34 6.65 6.86 7.74 6.67 7.12 7.10 4.00
Construya una tabla de frecuencias y calcule:

(a) La mediana (c) La moda
(b) El 4o decil (d) El primer cuartil
7. Una de las ventajas de la mediana y de la moda sobre la media aritmética, es que la
mediana y la moda se pueden determinar aun en distribuciones de extremo abierto, las
cuales hacen difícil el cálculo de la media. Distribución de extremo abierto es aquella en la
cual no se especifica por lo menos un extremo de un intervalo. Como es el caso del
siguiente ejemplo:
Edades de las cabezas de familia de cierto país.

Clase Edades Nº
Personas
(millones)
1 Menos de 20 2.2
2 20 – 24 4.0
3 25 – 29 5.1
4 30 – 34 10.5
5 35 – 39 9.5
6 40 – 44 6.6
7 Mayor de 44 4.5
A partir de esta tabla calcule la mediana y la moda.
8. Hallar la media geométrica de los siguientes conjuntos de números:

(a) 2, 5, 8 (b) 4, 4, 4 (c) 1, 4, 5, 10, 2
9. Halle la media armónica de los siguientes conjuntos de números:

(c) 3, 3, 9 (b) 2, 4, 6 (c) 1, 3, 4, 5, 6
10. Suponga que la productividad de tres trabajadores A, B y C, es como sigue:
Trabajador Producción por hora

A 30 unidades
B 20 unidades
C 40 unidades
Si trabajan un día de 8 horas, ¿cuál es la producción promedio requerido por unidad de

producción en las 8 horas?
11. En la siguiente tabla se da la distribución de frecuencia de los pesos de 65 trabajadores de

una fábrica.
Clase Pesos fi
1 50 -59 8
2 60 – 69 10
3 70 – 79 16
4 80 – 89 14
5 90 – 99 10
6 100 – 109 5
7 110 – 119 2
Compruebe la relación de aproximación aritmética entre la media, mediana y moda.

MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad, también llamadas medidas de dispersión, muestran la variabilidad

o el grado de dispersión de una sucesión de datos, indicado por medio de un número, si este valor
es pequeño (respecto de la unidad de medida) entonces hay una gran uniformidad entre los datos.
Por el contrario, un gran valor nos indica poca uniformidad (un grado de dispersión). Cuando es
cero quiere decir que todos los datos son iguales.
Varianza y Desviación estándar

La varianza es una de las medidas más usadas en estadística, ella a su vez da origen a otra
mucho más significativa: la desviación típica o estándar. La varianza es una medida del grado de
concentración de los valores de una sucesión de datos alrededor de su media 𝒙̅ , mientras
más dispersos estén los valores respecto de la media, mayor será la varianza. Se define como la media
aritmética de los cuadrados de las desviaciones respecto a la media aritmética. Se denota y se
define para datos no agrupados:
∑𝒏 (𝒙 − 𝒙̅
)𝟐
𝒊=𝟏 𝒊
𝑺𝟐 = 𝒏−𝟏
y la desviación estándar
∑𝒏 (𝒙 − ̅
𝒙)𝟐
𝒊
𝑺= 𝒊= 𝟏
√ 𝒏−𝟏
Es decir, 𝑺 =
√𝑺𝟐.
Ejemplo 1. Las siguientes son las estaturas de un equipo de jugadores de basquetbol: 2.20 m,
2.15 m, 1.95 m, 1.75 m y 1.70 m.
La media,
2.20 + 2.15 + 1.95 + 1.75 + 1.70 9.75

𝑥̅
= 5 = 5
𝑥̅
= 1.95 𝑚.
La varianza,
(2.20 − 1.95) 2 + (2.15 − 1.95) 2 + (1.95 − 1.95) 2 + (1.75 − 1.95) 2 + (1.70 −
1.95) 2 0.205
𝑆2 = =
5−1 4
2 2
𝑆 = 0.05125 𝑚 .
Y la desviación estándar.
𝑆 = √0.05125 𝑚2
𝑆 = 0.226 𝑚.
Las estaturas son homogéneas con referente a la media.
Es importante tener en cuenta las siguientes propiedades de la desviación estándar:
 La desviación estándar es una medida de variación de todos los valores con respecto a la
media.
 El valor de la desviación estándar siempre es positivo y sólo es igual a cero cuando los valores
de los datos son iguales.
 Si el valor de la desviación estándar es muy grande, este indica mayor variación en el grupo de
datos.
 El valor de la desviación estándar puede incrementarse drásticamente cuando se incluye uno o
más datos distantes.
 Las unidades de la desviación estándar son las mismas de los datos originales (pulgadas,
centímetros, etc.)
La varianza para datos agrupados (Tablas de frecuencias) se define de la siguiente manera:

∑𝒏 𝒇 (𝒙 − ̅
𝒙)𝟐
𝟐 𝒊=𝟏 𝒊 𝒊
𝑺 = 𝒏−𝟏
y la desviación estándar
∑𝒏
𝒊=𝟏 𝒇𝒊
(𝒙𝒊 − ̅
𝒙 )𝟐
𝑺=√
𝒏−𝟏
Donde, 𝑓𝑖 : frecuencia absoluta y 𝑥 𝑖: marca de clase.
universidad.
Clase Puntajes 𝒙𝒊 𝒇𝒊
1 53 – 55 54 2
2 56 – 58 57 5
3 59 – 61 60 9
4 62 – 64 63 15
5 65 – 67 66 12
6 68 – 70 69 5
7 71 – 73 72 2
Total 50
Media,
2(54) + 5(57) + 9(60) + 15 (63) + 12 (66) + 5(69 ) + 2(72) 3159

𝑿̅= 50 = 50
𝑿̅= 63.18 ≈ 63.2
La varianza,
2(54 − 63.2) 2 + 5(57 − 63.2) 2 + 9(60 − 63.2) 2 + 15(63 − 63.2) 2
𝑆2 = +12 (66 − 63.2)2 + 5 (69 − 63.2)2 + 2(72 − 871.4

=
2
𝑆 = 17.78 63.2) 2 49
50 − 1
Desviación estándar,
𝑆 = √17.78
𝑆 = 4.21
Los puntajes de los 50 aspirantes a una carrera profesional en una universidad están relativamente
dispersos con referente a la media.
Coeficiente de variación
El coeficiente de variación es una medida que se emplea fundamentalmente para:

 Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades
de medidas (ejemplo: kilogramos y centímetros)
 Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas distintas.
 Comparar dos grupos de datos que tienen distintas medias.
 Determinar si cierta media es consistente con cierta varianza.
El coeficiente de variación se denota y define de la siguiente manera:
𝑆
𝐶. 𝑉 = × 100%
𝑋̅
Ejemplo 2. Los siguientes datos corresponden a los resultados finales de dos grupos que cursaron
estadística el semestre pasado con dos docentes distintos.
Estadísticos Grupo 1 Grupo 2

Promedio 3.8 4.5
Desviación estándar 0.5 0.5
Si sólo atendemos al valor de la desviación estándar de los dos grupos debemos aceptar que la
variabilidad de éstos en cuanto a las calificaciones obtenidas es la misma. Sin embargo, al obtener
promedios diferentes y si admitimos que tal diferencia distingue a los grupos, nuestra primera
apreciación debe ser revisada y hacer que esa diferencia quede manifiesta de alguna manera. Una
manera de hacerlo es mediante el cálculo del coeficiente de variación. Así, tenemos:
Grupo 1
0.5
𝐶.𝑉 = × 100% = 13.15%
3.8
Grupo 2
0.5
𝐶.𝑉 = × 100% = 11.11%
4.5
Como sucede con cualquier medida de variabilidad, a mayor valor más variabilidad, en este caso el
grupo 1 presenta una variabilidad relativa mayor que la del grupo 2. Siendo así, el grupo 2 fue
relativamente más homogéneo que el grupo 1 en cuanto su rendimiento en estadística.
Valores estandarizados
Los distintos conjuntos de datos están asociados por lo general a diferentes medias, ya sea porque
son de naturaleza diferente o porque al ser la misma característica medida, sus centros no son los
mismos.
Con el propósito de reducir los datos a un mismo punto de referencia y a una escala común, se
realiza entre ellos una trasformación llamada estandarización, que consiste en lo siguiente:
A cada dato 𝒙 𝒊 se le resta la madia 𝑿̅ , se divide entre la desviación estándar 𝑺 y se obtiene
un
número 𝒁𝒊 que se llama el valor estandarizado de 𝒙 𝒊 . Esto es,
𝒁𝒊 =
𝒙𝒊 − 𝑺
𝑿̅
Ejemplo 3. Un estudiante obtuvo una nota definitiva en la asignatura de estadística de 3.8, el

promedio del curso fue de 4.0 con una desviación estándar de 0.5. Éste mismo, en contabilidad
obtuvo una nota de 4.3, el promedio del curso fue 4.5 con una desviación estándar de 0.8. ¿En qué
asignatura obtuvo un puesto relativamente mejor?
Estandarizando las notas tenemos:
Estadística:
3.8 − 4.0
𝑍= = −0.4
0.5
Contabilidad:
4.3 − 4.5
𝑍= = −0.25
0.8
Como la nota estandarizada de contabilidad es superior a la de estadística (un valor más cercano al
cero), el estudiante obtuvo un puesto relativamente mejor en contabilidad que en estadística, debido
a que al estar las dos notas por debajo del promedio, en contabilidad está más cercano al promedio
del curso que en el de estadística. Cuando los puntajes se encuentren por encima del promedio, la
posición mejor es aquella que arroje un valor estandarizado más lejano del promedio, o sea, al
estandarizar los valores, el que ocupa una posición mejor es el que se aleja más del cero.
GUÍA DE TRABAJO Nº 3
1. Si las puntuaciones de 20 trabajadores nuevos de un test de aptitud son: 31, 39, 40, 43, 45, 50,
52, 58, 59, 60, 70, 71, 72, 78, 80, 85, 87, 90, 9 1 y 99. Halle la varianza y la desviación estándar
para datos no agrupados.
2. A partir de los datos del ejercicio anterior, construya una tabla de frecuencia y con base en ella
obtenga la varianza y la desviación estándar. ¿Hay diferencia entre el valor de la desviación
estándar para datos no agrupados con los datos agrupados? Si hay diferencia explique el
porqué de ésta.
3. ¿Cuándo es igual la varianza a la desviación estándar? ¿Puede ser la varianza menor que la
desviación estándar? ¿En qué caso será igual a 0 la varianza de determinados datos? Explique
por qué.
4. Halle la varianza y la desviación estándar para los datos del problema 6, de la guía de trabajo
N° 2.
5. Dados los 11 datos, X: 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 9.

(a) Halle la varianza y la desviación estándar de X.
(b) Aumente en 2 cada valor de X para obtener valores Y y calcule varianza y la desviación
estándar de Y.
(c) Compruebe la relación que existe entre la varianza y la desviación estándar de estas dos
sucesiones de números.
6. Dos vendedores que mercadean el mismo producto tienen los siguientes registros durante un
periodo:
Vendedor 1 Vendedor 2
Volumen de ventas por mes 30 000 000 35 000 000
Desviación estándar 2 500 000 3 600 000
¿Cuál de los vendedores parece más constante en el volumen de ventas?
7. Halle el coeficiente de variación para los siguientes datos: 2, 4, 5, 6, 6, 9, 10, 13.
8. Una persona tiene una estatura de 175 cm; la estatura promedio de la población es170 cm con
una desviación estándar de 5 cm. Esta misma persona pesa 70 Kg: el peso promedio de la
población es de 68 Kg con una desviación estándar de 5 Kg. ¿En qué caso esta persona ocupa
un puesto relativamente mayor?
FUENTES DE INFORMACION
Lincoln L., C. (1984). Estadística para las ciencias Administrativas. (Vol. Tercera edición).
Colombia: Editorial McGraw Hill.
Martínez, C., Levin, R., & David, R. (2011). Estadística Aplicada (Primera ed.). México: Pearson
Educación.
Ritchey, F. J. (2008). Estadística para las ciencias sociales. México, D.F.: Mc Graw Hill

Estadistica Descriptiva

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Descriptiva

Cargado por

Copyright:

Formatos disponibles

Jorge Luis Bustos Galindo

Copyright 2016 - Editorial – COLOMBIA

Estadística Descriptiva Jorge Luis Bustos Galindo Página 2

Estadística Descriptiva Jorge Luis Bustos Galindo Página 3

La estadística se divide en dos grandes áreas:

La estadística descriptiva , se dedica a la descripción, visualización y resumen de datos

La estadística Inferencial, se dedica a la generación de modelos, inferencias y predicciones

Una Muestra es una representación significativa de las características de una población y se

VARIABLE Y TIPO DE VARIABLE

Existen diferentes tipos de variables:

Un conjunto de observaciones puede hacerse más comprensible y adquirir significado mediante un

Tablas y gráficas de frecuencias para variables cuantitativas

Distribución de frecuencias no agrupadas

La longitud que deben tener los intervalos, se obtiene por la fórmula:

Clase Puntajes 𝒙𝒊 𝒇𝒊 % 𝑭𝒊 % acum.

La tabla de frecuencias completa queda:

Clase Tiempo 𝒙𝒊 𝒇𝒊 % 𝑭𝒊 % acum.

Completar la anterior tabla.

Gráficas para variables cuantitativas

Gráfico de barras de frecuencias

Figura 1. Gráfica de barras de frecuencias absoluta.

La figura 2, es el histograma de frecuencias absolutas correspondiente a la distribución de los

Otra ilustración del histograma de frecuencias para variables continuas, la podemos

Figura 3. Histograma de frecuencias absolutas

Figura 5. Ojiva de frecuencia absoluta.

A continuación, se muestran tablas y gráficas para datos cualitativos.

Ejemplo 4. Los siguientes datos corresponden al número de estudiantes de cierta universidad de

Tabla 5. Lugar de origen de los estudiantes de una universidad.

Lugar de origen N° Estudiantes

Figura 6. Gráfico de barras para datos cualitativos.

En algunos casos es conveniente para propósitos comparativos representar mediante un mismo

Tabla 6. Número y sexo de los empleados de una empresa.

Ejemplo 6. El número de empleados de una empresa se distribuye porcentualmente de acuerdo

Tabla 7. Tiempo de vinculación de los empleados de una empresa.

Tiempo de vinculación Porcentaje

A diferencia de otros tipos de gráficos, el grafico circular no tiene ejes x o y.

1. En la tabla que sigue, determine la variable y la escala de medida que corresponde a la

Ítem Variable Escala de medida

4. Teniendo en cuenta la construcción de una tabla de frecuencias agrupadas, haga un cuadro

5. Estatura en centímetros de 30 estudiantes de un curso de un colegio.

a. Construya una tabla de frecuencias agrupadas.

6. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes:

a. Construya una tabla de frecuencias agrupadas completa.

a. Obtenga las distribuciones de frecuencias porcentuales y las acumuladas.

a. Construya una tabla de frecuencias completa.

9. En una empresa el personal se distribuye de acuerdo con su actividad desarrollada en la

Construya un diagrama circular para ilustrar la situación.

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un

La Media Aritmética (o simplemente Media)

 Para datos agrupados en intervalos (variables continuas) su valor oscila en función de la

6.0 + 5.4 + 3.1 + 7.0 + 6.1

2(54) + 5(57) + 9(60) + 15 (63) + 12 (66) + 5(69) + 2(72) 3159

El signo π se lee como la productoría.

Ejemplo 2. La media geométrica de 2 y 18 es

La media armónica, denominada H, de una cantidad finita de números es igual al recíproco, o

Ordenados los datos tenemos:

La mediana para datos agrupados (tablas de frecuencias) se define y se denota de la siguiente

Donde, 𝐿𝑚 : Límite (real) inferior de la clase mediana.

𝐹𝑚 −1: Frecuencia absoluta acumulada de la clase que le antecede a la de la clase mediana.

Las principales propiedades de la mediana son:

 Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de

A continuación, se muestra gráficamente las posiciones de la media, mediana y la moda en curvas

Caso I. Cuando las tres medidas coinciden, 𝑿̅= 𝑿̃= 𝑿̂