Está en la página 1de 51

Jorge Luis Bustos Galindo

Autor
Profesional en Matemáticas y Estadística

Copyright 2016 - Editorial – COLOMBIA


Sello Editorial

Todos los derechos reservados. Ninguna parte de esta publicación puede ser reproducida, almacenada
en sistema alguno de tarjetas perforadas o trasmitida por otro medio – electrónico, mecánico,
fotocopiador, registrador, etcétera sin permiso previo por escrito del autor.

All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or
transmitted in any form by any means, electronic, mechanical, photocopying, recording or otherwise,
without the prior writing permission from author.
Tabla de contenido
ESTADÍSTICA..........................................................................................................................................................4
POBLACIÓN Y MUESTRA........................................................................................................................................5
VARIABLE Y TIPO DE VARIABLE.............................................................................................................................5
Según la medición.............................................................................................................................................5
Variables cualitativas....................................................................................................................................5
Variables cuantitativas.................................................................................................................................5
Según la influencia............................................................................................................................................6
Variables independientes.............................................................................................................................6
Variables dependientes................................................................................................................................6
ESCALAS DE MEDIDAS...........................................................................................................................................6
DISTRIBUCIONES DE FRECUENCIAS.......................................................................................................................7
Tablas y gráficas de frecuencias para variables cuantitativas..........................................................................7
Variables discretas............................................................................................................................................7
Distribución de frecuencias agrupadas........................................................................................................8
Graficas para variables discretas......................................................................................................................9
Gráfico de barras de frecuencias..................................................................................................................9
Polígono de frecuencias.............................................................................................................................10
Ojiva de frecuencias...................................................................................................................................11
Variable continua............................................................................................................................................11
Graficas para variables continúas...................................................................................................................12
Histograma de frecuencias.........................................................................................................................13
Tablas y gráficas de frecuencias para variables cualitativas..........................................................................14
GUÍA DE CLASE N° 1.............................................................................................................................................17
MEDIDAS DE TENDENCIA CENTRAL.....................................................................................................................19
La Media Aritmética (o simplemente Media).................................................................................................19
Media geométrica...........................................................................................................................................21
Media armónica..............................................................................................................................................22
Mediana..........................................................................................................................................................22
Moda...............................................................................................................................................................24
Relación entre las medidas de tendencia central...............................................................................................26
OTRAS MEDIDAS DE POSICIÓN...........................................................................................................................27
Cuartiles..........................................................................................................................................................27
Deciles.............................................................................................................................................................28
Percentiles.......................................................................................................................................................29

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 2


GUÍA DE TRABAJO Nº 2.......................................................................................................................................30
MEDIDAS DE VARIABILIDAD................................................................................................................................32
Varianza y Desviación estándar......................................................................................................................32
Coeficiente de variación.................................................................................................................................34
Valores estandarizados...................................................................................................................................34

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 3


ESTADÍSTICA

La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos,
la cual ayuda en la toma de decisiones o para explicar condiciones o sucesos de algún fenómeno o
estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, estadística es más
que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con
una investigación científica.

Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en
áreas de negocios, investigaciones científicas, educación, entre otras.

La estadística se divide en dos grandes áreas:

La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos


originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o
gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar.
Algunos ejemplos gráficos son: histograma, polígono, pirámide poblacional entre otros.

La estadística Inferencial, se dedica a la generación de modelos, inferencias y predicciones


asociados a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones.
Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo
estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de
hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras
observaciones, descripciones de asociación (correlación) o modelación de relaciones entre
variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo
y minería de datos.

Al reseñar las dos áreas de la estadística, se puede resumir como sigue el significado de
estadística:

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 4


“La estadística es la ciencia pura y aplicada, que crea, desarrolla y aplica técnicas o modelos de
modo que pueda evaluarse los dilemas derivados de las inferencias inductivas que nos permite
llegar a la generalización y contrastación de resultados”
POBLACIÓN Y MUESTRA

Una Población es el conjunto de todos los elementos que estamos estudiando, acerca de los
cuales intentamos sacar conclusiones y se denota: N. Levin & Rubin (1996). Una población finita
es aquella que está formada por un limitado número de elementos o individuos y una población es
infinita cuando no se conoce el número de elementos o individuos, o también se puede considerar
población infinita cuando una población finita es muy grande.

Una Muestra es una representación significativa de las características de una población y se


denota: n.

VARIABLE Y TIPO DE VARIABLE

Una variable es una característica que al ser medida en diferentes individuos es susceptible de
adoptar diferentes valores. Las variables se denotan generalmente con letras mayúsculas X, Y, Z,
por ejemplo, X: Estaturas de las personas.

Existen diferentes tipos de variables:

Según la medición

Variables cualitativas

Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad
que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de
dichos atributos. Las variables cualitativas no pueden ser medida por ningún instrumento de
medición, por ejemplo: Color de los ojos. Dentro de ellas podemos distinguir:
• Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos
valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo
entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.
• Variable cualitativa nominal o categórica: En esta variable los valores no pueden ser
sometidos a un criterio de orden, es decir, no sigue ningún orden, como ejemplo: los colores,
género, estado civil.

Variables cuantitativas

Son las variables que se expresan mediante cantidades numéricas, por ejemplo: Estatura de las
personas. Las variables cuantitativas pueden ser:

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 5


• Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de
valores que puede tomar. Es decir, los valores que se toma son de números enteros. Ejemplo:
El número de hijos {1, 2, 3 hijos,…}.
• Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores, o sea, puede tomar cualquier valor real. Ejemplo: La estatura {1.65m,
1.68m, 1.70m,…}. Solamente se está limitado por la precisión del instrumento de medición, en
teoría permiten que siempre exista un valor entre dos variables.

Según la influencia

Según la influencia que asignemos a unas variables sobre otras, podrán ser:

Variables independientes
Una variable independiente también conocida como la variable manipulada, es aquella cuyo valor
no depende de otra variable. Es aquella característica o propiedad que se supone la causa del
fenómeno estudiado. En investigación experimental se llama así a la variable que el investigador
manipula. Ejemplo: Genero.

Variables dependientes

Son las variables de respuesta que se observan en el estudio y que podría estar influenciadas por
los valores de las variables independientes. Ejemplo: Preferencia de los colores.
La variable dependiente es el factor que es observado y medido para determinar el efecto de la
variable independiente.

ESCALAS DE MEDIDAS

Escalas de medición son una sucesión de medidas que permiten organizar datos en orden
jerárquico. Las escalas de medición pueden ser clasificadas de acuerdo a una degradación de las
características de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales.
Según pasa de una escala de otra el atributo o la cualidad aumenta. Las escalas de medición
ofrecen información sobre la clasificación de variables discretas o continuas, también más
conocidas como escalas grandes o pequeñas. Toda vez que dicha clasificación determina la
selección de la gráfica adecuada.
Escala nominal: Es aquella en que los números sólo se emplean para diferenciar un lugar, objeto
o persona. Esta escala de medición es exclusivamente cualitativo y sus variables son por lo tanto
cualitativas. Ejemplos de números con esta característica son los que se usan en las camisetas de
los jugadores de fútbol, los que aparecen en el código de barras de un producto, etc. La escala
nominal es la escala de medición más débil.
Escala ordinal: Es aquella en que los números se utilizan para diferenciar en orden de supremacía
de acuerdo con cierto criterio jerárquico. En esta escala las variables no sólo se asignan a grupos
sino que además pueden establecerse relaciones de mayor que, menor que o igual que, entre los
elementos. Ejemplo: Los estratos socioeconómicos.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 6


Escala de intervalos: Es una escala más especializada que la nominal y la ordinal en sentido de
que es posible ordenar las mediciones y decir también en cuánto difiere una situación de otra. Esta
escala está caracterizada porque tiene una unidad de medida y un origen (cero) arbitrario y así la
distancia entre dos mediciones tiene un significado preciso. Las variables medidas al nivel de
intervalo se llaman variables de intervalo o variables de escala. Ejemplos de este tipo de variables
son la fecha, la temperatura.
Escala de razón: La escala de razón tiene una unidad de medida y un punto de origen no arbitrario
(un cero verdadero). La mayoría de las cantidades físicas, tales como la masa, longitud, energía,
se miden en la escala de razón. Ejemplos: La edad, estatura, peso corporal, etc.

DISTRIBUCIONES DE FRECUENCIAS

Un conjunto de observaciones puede hacerse más comprensible y adquirir significado mediante un


arreglo ordenado. Sin embargo, al agrupar los datos se logra una mayor síntesis. Se le llama
distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que
indican el número de observaciones en cada categoría. Esto proporciona un valor añadido a la
agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de
modo que se pueda ver el número existente en cada clase. Estas agrupaciones de datos suelen
estar agrupadas en forma de tablas.

Tablas y gráficas de frecuencias para variables cuantitativas

La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla
de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el
número de veces que aparece, es decir, su frecuencia. Se puede complementar la frecuencia
absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el
total de datos. La tabla de frecuencias puede representarse gráficamente.

Variables discretas

Distribución de frecuencias no agrupadas


La distribución de frecuencias no agrupadas en una tabla de frecuencias, se emplea en variables
discretas y/o cuando la amplitud de los datos es pequeña, como se ilustra a continuación.

Ejemplo 1. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.
Para la construcción de la tabla de frecuencias la ordenaremos de la siguiente manera:
• La primera columna de la tabla colocamos la variable de estudio ordenada de menor a mayor.
• La segunda columna la llamaremos frecuencia absoluta (𝒇𝒊) y es el recuento de los datos. La
suma de las frecuencias es el número total de observaciones (n).
• La tercera columna la llamaremos frecuencia porcentual o porcentaje (%) y es cada
frecuencia absoluta (𝒇𝒊), dividido en el número total de observaciones (n) multiplicado por cien.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 7


• La cuarta columna la llamaremos frecuencia absoluta acumulada (𝑭𝒊) y es la suma de las
frecuencias absolutas.
• La quinta columna la llamaremos frecuencia porcentual acumulada o porcentaje acumulado
(% acum.) y es cada frecuencia absoluta acumulada (𝑭𝒊), dividido en el número total de
observaciones (n) multiplicado por cien.
Tabla 1.Tabla de frecuencias de las temperaturas máximas registradas durante el mes de julio.
Temperaturas 𝒇𝒊 % 𝑭𝒊 % acum.
27 1 3.22 1 3.22
28 2 6.45 3 9.68
29 6 19.35 9 29.03
30 7 22.58 16 51.61
31 8 25.81 24 77.42
32 3 9.68 27 87.10
33 3 9.68 30 96.77
34 1 3.22 31 100
Total 31 100

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 8


Distribución de frecuencias agrupadas

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables
toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos
que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente. Cada clase está delimitada por el límite inferior de la clase y el límite superior de
la clase. La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Para la construcción de una tabla de frecuencias con datos agrupados, se aconseja utilizar la
Fórmula de Sturges, para encontrar el número de intervalos y la longitud del intervalo. El número
de intervalos se halla por la siguiente fórmula:

en donde n es el número de datos. La longitud que deben tener los intervalos, se obtiene por la
fórmula:

donde, : es el dato mayor, : el dato menor y K: el número de intervalos.


El valor de C se toma con un grado de aproximación no mayor a aquel con el que se
registran los datos.

El primer intervalo, tomamos como límite inferior al dato menor y se hace el conteo del valor que
arrojó la longitud, teniendo en cuenta que el número del límite inferior también se cuenta y así,
obtendremos el límite superior del primer intervalo. Para el siguiente intervalo, se toma el límite
superior anterior más una unidad y nuevamente se hace el conteo de la longitud y así
sucesivamente, hasta completar el número K de intervalos, o cuando en un intervalo contenga al
mayor de los datos.

Ejemplo 2. Suponga que los siguientes datos corresponden a las puntuaciones del examen de
admisión de los aspirantes a una carrera profesional de una universidad. Se toma una muestra de
50 aspirantes y estos son los resultados:

65, 63, 65, 63, 69, 67, 53, 58, 60, 61, 64, 65, 64, 72, 68, 66, 55, 57, 60, 62, 64, 65, 64, 71, 68, 66,
56, 59, 61, 62, 63, 65, 63, 70, 67, 66, 57, 59, 61, 62, 64, 64, 63, 69, 67, 66, 58, 60, 61, 62.

Solución

Fórmula de Sturges:
• Número de intervalos:

intervalos

• Longitud de intervalo:

Una vez determinados los intervalos y la longitud, procedemos a precisar el número de datos (la
frecuencia) que caen dentro de cada intervalo. Para ello existe varios métodos de conteo, uno de
ellos es hacer una marca, ejemplo / por cada dato que encontremos que cae dentro del intervalo,
para otro intervalo se procede de manera similar realizando una marca por cada dato
contabilizado.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 9


Otra alternativa para determinar la frecuencia de cada intervalo es construyendo un arreglo de
tronco y hoja, que consiste en arreglar los números en columnas, y colocar en la primera el primer
dígito y a continuación el segundo dígito como se ilustra enseguida:
5 3 8 5 7 6 9 7 9 8
6 5 3 5 3 9 7 0 1 4 5 4 8 6 0 2 4 5 4 8 6 1 2 3 5 3 7 6 1 2 4 4 3 9 7 6 0 1 27
2 1 0
A partir de este arreglo se puede realizar de manera sencilla el conteo de los datos que quedan en
cada intervalo.
Ahora podremos hacer la tabla de frecuencias completa (todas las columnas):

Tabla 2. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.

Clase Puntajes 𝒙𝒊 𝒇𝒊 % 𝑭𝒊 % acum.


1 53 – 55 54 2 4 2 4
2 56 – 58 57 5 10 7 14
3 59 – 61 60 9 18 16 32
4 62 – 64 63 15 30 31 62
5 65 – 67 66 12 24 43 86
6 68 – 70 69 5 10 48 96
7 71 – 73 72 2 4 50 100
Total 50 100

La clase es la escala nominal de los intervalos y la marca de clase (𝒙𝒊) es el punto medio de cada
intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Graficas para variables discretas

En la guía hemos visto cómo organizar una tabla de frecuencias, de un conjunto de datos que
contiene la información sobre alguna variable. Esas tablas permiten una lectura más rápida que el
listado completo. Ahora veremos cómo presentar esos conjuntos de datos gráficamente. Las
gráficas nos permiten visualizar globalmente cómo se distribuyen las frecuencias entre los distintos
datos. Hay gráficas de distinto tipo; nosotros podemos ver algunas de ellas en tv, revistas,
periódicos, etc. En esta guía aprenderemos a construir y a leer algunas gráficas.

Para ilustrar los diferentes tipos de gráficas tomaremos la tabla de frecuencias (Tabla 2) con la
marca de clase y la frecuencia absoluta y absoluta acumulada.

Gráfico de barras de frecuencias

Para construir una gráfica de barras con estos valores tomamos dos ejes perpendiculares; en el eje
horizontal señalamos los valores de la variable (puntuaciones) y en el eje vertical señalamos los
valores de la frecuencia (número de aspirantes). Como en ambos casos trabajamos con números,
para ubicar los valores en cada eje tenemos que considerar una unidad, aunque las unidades del
eje horizontal pueden ser distintas a las del eje vertical, como se ilustra a continuación:

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 10


Figura 1. Gráfica de barras de frecuencias absoluta.

El gráfico de barras se usa cuando los intervalos están separados entre sí (no existe continuidad
entre los intervalos), como lo ilustra la gráfica anterior.

Polígono de frecuencias

El polígono de frecuencia se construye sobre el sistema de coordenadas cartesianas, al colocar


sobre cada marca de clase un punto a una altura igual a la frecuencia asociada a esa clase; luego
se unen dichos puntos por segmento de recta. La figura 2, es el polígono de frecuencias de los
datos de la tabla 2.

Figura 2. Polígono de frecuencia absoluta.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 11


Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 12
Ojiva de frecuencias

La ojiva es el polígono que se obtiene al unir por segmentos de rectas los puntos situados a una
altura igual a la frecuencia acumulada a partir de la marca de clase como se hizo con el polígono
de frecuencia (véase figura 2). La figura 3 es la ojiva de frecuencia de los datos de la tabla 2.

Figura 3. Ojiva de frecuencia absoluta.

Variable continua

Para hacer una tabla de frecuencias con variables continua, se procede de manera similar al de las
variables discretas, pero difiere en la construcción de los intervalos. Al primer intervalo se toma el
dato menor (límite inferior) y se suma el valor que arrojó la longitud y así, obtendremos el límite
superior del primer intervalo. Para el siguiente intervalo, se toma el límite superior anterior y se
suma la longitud y así sucesivamente, hasta completar el número de intervalos obtenidos en la
fórmula K, o cuando en un intervalo contenga al mayor de los datos. Hay que tener en cuenta que
el límite inferior de una clase pertenece al intervalo (intervalo cerrado), pero el límite superior no
pertenece al intervalo (intervalo abierto), se cuenta en el siguiente intervalo. Ejemplo [3.1, 3.4) los
números que pertenecen a este intervalo son {3.1, 3.2, 3.3}.

Ejemplo 3. Los siguientes datos corresponden al tiempo que han necesitado 30 clientes de un
banco para llevar a cabo una transacción bancaria:
4.1, 3.1, 0.1, 6.5, 5.0, 2,5, 7.4, 10.0, 3.3, 8.0, 2.0, 0.4, 6.4, 1.1, 9.5, 2.8, 1.2, 1.3, 4.1, 9,5, 4.6, 4.3,
3.6, 5.5, 1.4, 2.8, 1.5, 1.6, 7.3, 7.0.

Solución

Fórmula de Sturges:
• Número de intervalos:

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 13


intervalos
• Longitud de intervalo:

La longitud de 1.65 se aproxima a 1.7, debido a que los datos provienen de una variable continua y
con un solo decimal.

La tabla de frecuencias completa queda:

Tabla 3. Tiempo que han necesitado 30 clientes de un banco para llevar a cabo una transacción
bancaria.

Clase Tiempo 𝒙𝒊 𝒇𝒊 % 𝑭𝒊 % acum.


1 [0.1, 1.8)
2 [1.8, 3.5)
3 [3.5, 5.2)
4 [5.2, 6.9)
5 [6.9, 8.6)
6 [8.6, 10.3]
Total 30 100

Completar la anterior tabla.

Algunas tablas de frecuencias, los intervalos que se han tomado están separados entre sí por una
unidad esto es debido a que los datos son de una variable discreta. A estas tablas, es conveniente
darle una condición de continuidad, para efectos del cálculo de algunos parámetros o para realizar
algunas gráficas. A cada intervalo, al límite inferior se le resta 0.5 y al límite superior se le suma la
misma cantidad 0.5. Haciendo estas operaciones a la tabla 2, toma la forma:

Tabla 4. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.

Clase Puntajes 𝒇𝒊
1 52.5 – 55.5 2
2 55.5 – 58.5 5
3 58.5 – 61.5 9
4 61.5 – 64.5 15
5 64.5 – 67.5 12
6 67.5 – 70.5 5
7 70.5 – 73.5 2
Total 50

Graficas para variables continúas

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 14


Las gráficas de una variable continua, son las mismas realizadas con la variable discreta (véase
figuras 2 y 3), excepto que no se realiza un gráfico de barras de frecuencias (figura 1), sino un
histograma de frecuencias, como se ilustra a continuación.

Histograma de frecuencias

El histograma de frecuencias es una representación visual de los datos continuos (intervalos sin
interrupción). Los histogramas pueden estar referidos a las frecuencias absolutas, relativas
(porcentajes) y las frecuencias acumuladas.

La figura 4, es el histograma de frecuencias absolutas correspondiente a los tiempos que han


necesitado 30 clientes de un banco para llevar a cabo una transacción bancaria (véase tabla 3).

Figura 4. Histograma de frecuencias absolutas

Otra ilustración del histograma de frecuencias para variables continuas, la podemos observar en la
figura 5, correspondiente a la distribución de los puntajes del examen de admisión de 50 aspirantes
a una carrera profesional en una universidad (véase tabla 4).

Figura 5. Histograma de frecuencias absolutas

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 15


Tablas y gráficas de frecuencias para variables cualitativas

La construcción de una tabla de frecuencias para datos cualitativos requiere sólo del conteo del
número de elementos o individuos que caen dentro de cierta clase o tienen determinada
característica. En una tabla de frecuencias para datos cualitativos no se dan intervalos de clase por
carecer éstos de sentido. Como tampoco existe la frecuencia acumulada.

A continuación se muestran tablas y gráficas para datos cualitativos.

Ejemplo 4. Los siguientes datos corresponden al número de estudiantes de cierta universidad de


acuerdo con su lugar de origen.

Tabla 5. Lugar de origen de los estudiantes de una universidad.

Lugar de origen N° Estudiantes


Antioquia 40
Atlántico 20
Cundinamarca 50
Tolima 70
Total 180

Figura 5. Gráfico de barras para datos cualitativos.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 16


En algunos casos es conveniente para propósitos comparativos representar mediante un mismo
gráfico dos características que están relacionadas, como se muestra a continuación.

Ejemplo 5. En la tabla que sigue se da el número y sexo de los empleados de una empresa en los
años comprendidos entre 2009 y 2012.

Tabla 6. Número y sexo de los empleados de una empresa.

Año
Sexo 2009 2010 2011 2012
Masculino 150 180 200 300
Femenino 50 70 100 100
Total 200 250 300 400
Figura 6. Histograma doble.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 17


En otros casos lo que nos interesa no es mostrar el número de veces que se da una característica
o atributo, sino más bien resaltar la proporción (porcentaje) en que aparece una característica
respecto del total. Así por ejemplo, para ilustrar de manera gráfica una situación como la que se
presenta en seguida.

Ejemplo 6. El número de empleados de una empresa se distribuye porcentualmente de acuerdo


con su tiempo de vinculación, como se indica en seguida:

Tabla 7. Tiempo de vinculación de los empleados de una empresa.

Tiempo de vinculación Porcentaje


Menos de cinco años 20%
Entre cinco y diez años 50%
Entre diez y quince años 15%
Entre quince y veinte años 10%
Más de veinte años 5%

Para construir el diagrama circular partimos del hecho de que un círculo tiene un total de 360°.
Luego, mediante una regla de tres simple, repartiremos los 360° en distintos sectores circulares, de
acuerdo con cada porcentaje; tenemos así que para determinar el sector circular correspondiente
al 20% realizamos la conversión:

Esto es, el 20% corresponde a un sector circular de 72° de medida. A continuación, con ayuda de
un transportador, señalaremos el sector circular correspondiente. Igualmente para 50° se tienen
180°, 15% se tienen 54°, 10% se tienen 36° y finalmente para 5% se tienen 18°. La figura 7,
muestra la representación gráfica.

Grafica 7. Diagrama circular.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 18


A diferencia de otros tipos de gráficos, el grafico circular no tiene ejes x o y.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 19


GUÍA DE TRABAJO N° 1

1. ¿Qué es la amplitud de una sucesión de datos?


R/ Es la diferencia entre el dato mayor y el dato menor en donde se distinguen sus valore
extremos.

2. En la organización de los datos recolectados en una distribución de frecuencias:


a. ¿Por qué el número de clases no debe ser muy grande ni muy pequeño?
R/ porque si son muy grandes o muy pequeñas habría que subdividirlas o agruparlas por esta
razón lo recomendable es que tenga la misma amplitud

b. ¿Por qué a veces es necesario tomar intervalos de longitudes diferentes?


R/ Es necesario para reducir la información a la hora de tabularla y ordenarla .

3. Determine el número de intervalos "K" (Fórmula de Sturges) para las siguientes cantidades de
datos:

a. 42
K=1+3.322 log (n)
K=1+3.322 log (42)
K=6.39 ≈6

b.55
K=1+3.322 log (55)
K=6.78 ≈ 7

c.70
K=1+3.322 log (70)
K=7.12 ≈ 7

d. 103
K=1+3.322 log (103)
K=7.68 ≈ 8

e. 200
K=1+3.322 log (200)
K=8.64 ≈ 9

c. Teniendo en cuenta el dato menor y el dato mayor (𝑑𝑚,𝐷𝑀), encuentre la longitud de


intervalo "C", para K= 5, 6 y 7 intervalos.

a. (15, 63)
Rango DM-Dm Longitud de Intervalo
63-15 C=Rango
48 N° Intervalos
C= 48
5
C=9.6 ≈ 10

b. (17.2, 78.9) Longitud de Intervalo

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 20


Rango DM – Dm C=Rango
78.9 – 17.2 C= 62
62 6
C= 10.3 ≈ 10

c. (9.18, 20.76)
Rango DM – Dm Longitud de Intervalo
20.76 – 9.18 C= 12
12 7
C=1.71 ≈ 2

d. (0.123, 6.054) Longitud de Intervalo


Rango DM – Dm C= 6
6.054 – 0.123 5
6 C=1.2≈1

d. Estatura en centímetros de 30 estudiantes de un curso de un colegio.

154, 158, 162, 148, 163, 153, 159, 180, 165, 168, 156, 148, 162, 157, 153, 158, 147, 165, 166,
175, 172, 172, 167, 160, 155, 147, 156, 161, 159, 178.

a. Construya una tabla de frecuencias agrupadas.

T H
14 7,7,8,8,
15 3,3,4,5,6,6,7,8,8,9,9
16 0,1,2,2,3,5,5,6,7,8
17 2,2,5,8
18 0

NO. INTERVALOS

K= 1+3.322 log (30)


K=5.9 ≈ 6

RANGO
DM – Dm
180 – 147 = 33

LONGITUD DE INTERVALO
C= 33
6
C= 5.5 =6

ESTATUR f Fr % F Fr % Xi
A
147 – 152 4 0.13 13 4 0.13 13 150
153 - 158 9 0.3 30 13 0.43 43 156
159 – 164 7 0.23 23 20 0.66 66 162
165 – 170 5 0.16 16 25 0.83 83 168

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 21


171 – 176 3 0.1 10 28 0.98 93 174
177 – 182 2 0.06 6 30 1 100 180
30

b. De la tabla de frecuencias que puede decir de los siguientes datos: f 3, % (1), F2 y % (4) acum.

*F 3: 7 estudiantes de un curso de un colegio tienen un rango de estatura entre 159 – 164 cm

*%(1): El 13% de los estudiantes del curso miden entre 147 – 152 cm

*F2: 13 estudiante de un curso de un colegio tiene un rango de estatura entre 153 – 158 cm

*%(4): El 83% de los estudiantes de un curso miden entre 165 – 170

c. Construya el gráfico de barras y un polígono.

GRAFICA DE BARRAS

ESTATURAS
10
9
8
7
6
N. PERSONAS
5
4
3
2
1
0
147-152 153-158 159-164 165-170 171-176 177-182

POLIGONO

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 22


MARCA DE CLASE
10
9
8
7
6
5
4
3
2
1
0
144 150 156 162 168 174 180 186

6. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes:

5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6,
5, 6, 7, 3, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.

a. Construya una tabla de frecuencias agrupadas completa

CALIFICACIONE fi fr % FI FR %
S

0 1 0.02 2 1 0.02 2
1 1 0.02 2 2 0.04 4
2 2 0.04 4 4 0.08 8
3 3 0.06 6 7 0.14 14
4 6 0.12 12 13 0.26 26
5 11 0.22 22 24 0.48 48
6 12 0.24 24 36 0.72 72
7 7 0.14 14 43 0.86 86
8 4 0.08 8 47 0.94 94
9 2 0.04 4 49 0.98 98
10 1 0.02 2 50 1 100

50

a. De la tabla de frecuencias que puede decir de los siguientes datos: f 2, % (3), F4 y % (5) acum.
f2: De los 50 alumnos de matemáticas solo 1 tuvo una calificación de 1
%(3): El 4% de los 50 alumnos de matemáticas obtuvieron una calificación de 2

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 23


F4: De los 50 alumnos de matemáticas 7 estudiantes obtuvieron una calificación de 3
%(5): El 26% de los 50 alumnos de matemáticas obtuvieron un promedio de 4

b. Construya el GRAFICA DE BARRAS

14

12

10
NO. DE ALUMNOS

0
0 1 2 3 4NOTAS
5 6 7 8 9 10

POLIGONO

14

12

10
NO. DE ALUMNOS

0
0 1 2 3 4 NOTAS
5 6 7 8 9 10

c. Construya una OJIVA

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 24


60

50
FRECUENCIA ACUMULADA

40

30

20

10

0
NOTAS
0 1 2 3 4 5 6 7 8 9 10

7. Se mide el coeficiente intelectual (CI) de veinticinco estudiantes para determinar el rango que
se encuentran los estudiantes para un posterior rendimiento académico. Los resultados de la
de las puntuaciones son las siguientes:

Puntuaciones de CI Número de estudiantes


105 2
106 1
107 3
108 4
109 5
110 4
111 2
112 3
113 1
Total 25

NO. INTERVALOS

K= 1+3.322 log (25)


K=5.6 ≈ 6

RANGO
DM – Dm
113 – 105 = 8

LONGITUD DE INTERVALO
C= 8
6

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 25


C= 1.3 =1
C.I f fr % F Fr % X
105 – 21 0.84 84 21 0.84 84 108
111
112 - 117 4 0.16 16 25 1 100 115

a. Obtenga las distribuciones de frecuencias porcentuales y las acumuladas.


b. Construya un histograma, un polígono y una ojiva.

HISTOGRAMA

HISTOGRAMA
25
NO. DE ESTUDIANTES

20
15
10
5
0
105-111 112-117
C.I

POLIGONO

POLIGONO
25
NO. DE ESTUDIANTES

20
15
10
5
0
102 108 115 121
C.I

OJIVA

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 26


OJIVA
30
FRECUENCIA ACUMULADA

25
20
15
10
5
0
102 108 115 121
MARCA DE CLASE

8. Considérense los siguientes datos, los cuales representan a la distancia recorrida de cierto
animal de su morada en la búsqueda de alimento:

5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00
5.60 7.64 8.82 5.64 10.08 3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72 8.26
7.90 6.65 7.25 6.26 6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.67 6.25
7.63 6.73 7.60 8.14 6.91 7.82 6.76 7.75 4.00

a. Construya una tabla de frecuencias completa.


DISTANCIA f fr % F Fr % X
381 – 473 4 0.06 6 4 0.06 6 427
474 – 565 4 0.06 6 8 0.13 13 757
566 – 658 8 0.13 13 16 0.26 26 895
659 – 751 16 0.26 26 32 0.53 53 1.035
752 – 844 15 0.25 25 47 0.78 78 1.174
845 – 937 11 0.18 18 58 0.96 96 1.314
938 – 1.030 2 0.03 3 60 1 100 1.453

60

b. Construya un histograma y un polígono.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 27


HISTOGRAMA
18
16
14
NO. DE ANIMALES

12
10
8
6
4
2
0
381-473 474-565 566-658 659-751 752-844 844-937 938-1030
DISTANCIA RECORRIDA

POLIGONO
18

16

14
FRECUENCIA ABSOLUTA

12

10

0
381-473 474-565 566-658 659-751 752-844 844-937 938-1030
DISTANCIA RECORRIDA

c. Construya un histograma de frecuencia acumulada y una ojiva.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 28


OJIVA
70

60
FRECUENCIA ACUMULADA

50

40

30

20

10

0
381 - 473 474 - 565 566 - 658 659 - 751 752 - 844 845 - 937 938 - 1.030
DISTANCIA RECORRIDA

HISTOGRAMA DE FRECUENCIA ACUMULADA

HISTOGRAMA
70
60
FRECUENCIA ACUMULADA

50
40
30
20
10
0
381-473 474-565 566-658 659-751 752-844 844-937 938-1030
DISTANCIA RECORRIDA

9. En una empresa el personal se distribuye de acuerdo con su actividad desarrollada en la


misma, como se indica a continuación:

Actividad Porcentaje
Profesional 8%
Técnico 10%
Operario 70%
Ayudante 10%
Aseo 2%

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 29


Construya un diagrama circular para ilustrar la situación.

10.Los siguientes son los colores de los automóviles de 36 profesores de la universidad. Construya
un gráfico de barras para ilustrar esta situación.

Negro, azul, rojo, rojo, blanco, amarillo, crema, rojo, azul, oro, negro, plateado, verde, verde,
blanco, negro, oro, azul, rojo, gris, gris, verde, blanco, negro, azul, café, naranja, crema, rojo,
negro, plateado, oro, amarillo, blanco, rojo, café.

COLORES DE AUTOMOVILES DE LOS PROFESORES DE LA UNIVERSIDAD


7
6
5
4
3 Serie 1
2
1
0
L DE IS FÉ NJA
GRO ZU OJO NCO ILLO EMA O O
OR EAD VER GR CA
A R RA
NE BL
A AR CR AT
A M PL NA

11.Determine la variable y la escala de medida que corresponde a la medición de cada una de las
siguientes características:

a. Nivel de ruido.
R/ Cuantitativa discreta porque se mide en decibeles
b. La ocupación de una persona en el lugar de trabajo.
R/ Cualitativa
c. Número de habitantes por población.
R/ Cuantitativa discreta porque se mide con números enteros

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 30


d. Estatura de un estudiante.
R/ Cuantitativa discreta por que se mide a partir de números enteros
e. Tiempo de congelación del agua.
R/ Cuantitativa discreta porque su medición es en °C
f. Las notas de una materia en la universidad.
R/ Cuantitativa continua por que las notas su escala es en decimales
g. El número de piso de un edificio.
R/ Cuantitativa discreta porque se puede medir.

MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un


solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de
datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se
hace referencia únicamente a la posición de estos parámetros dentro de la distribución,
independientemente de que ésta esté más o menos centrada, se habla de estas medidas como
medidas de posición. Se debe tener en cuenta que existen variables cualitativas y variables
cuantitativas, por lo que las medidas de posición o medidas de tendencia se usan de acuerdo al
tipo de variable que se está observando, en este caso se observan variables cuantitativas.
Entre las medidas más comunes de tendencia central tenemos:

 Media .
 Media geométrica.
 Media armónica.
 Mediana.
 Moda.

La Media Aritmética (o simplemente Media)

La media aritmética también llamada promedio de los datos, es el valor obtenido por la suma de
todos sus valores dividida entre el número de sumandos.
Definición formal
Dado un conjunto numérico de datos, , se define su media aritmética para datos no
agrupados como:

Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es,
también puede calcularse para variables agrupadas en intervalos.
PROPIEDADES
Las principales propiedades de la media aritmética son:

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 31


 Su cálculo es muy sencillo y en él intervienen todos los datos.
 Su valor es único para una serie de datos dada.
 Se usa con frecuencia para comparar poblaciones, aunque es más apropiado acompañarla de
una medida de dispersión.

Inconvenientes de su uso
Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en situaciones muy
diversas, tiene también algunos inconvenientes, como son:

 Para datos agrupados en intervalos (variables continuas) su valor oscila en función de la


cantidad y amplitud de los intervalos que se consideren.

La altura media de los pinos como resumen de una población homogénea (arriba) o
heterogénea (abajo).
 Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto
menos homogéneos sean los datos, menos información proporciona. Dicho de otro modo,
poblaciones muy distintas en su composición pueden tener la misma media. Por ejemplo, un
jardín con cinco pinos de igual altura, 1,95 m, evidentemente, tendría una altura media de 1,95
m, valor que representa fielmente a esta población homogénea. Sin embargo, en un jardín de
pinos de alturas más heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo,
tendría también, como puede comprobarse, una altura media de 1,95 m, valor que no
representa a casi ninguno de sus componentes.
 En el cálculo de la media no todos los valores contribuyen de la misma manera. Los valores
altos tienen más peso que los valores cercanos a cero. Por ejemplo, en el cálculo del salario

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 32


medio de un empresa, el salario de un alto directivo que gane $5.000.000 tiene tanto peso como
el de cinco empleados "normales" que ganen $1.000.000. En otras palabras, se ve muy
afectada por valores extremos.
 No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.

Ejemplo 1. Los siguientes datos corresponden a las notas de 5 estudiantes en una prueba: 6.0,
5.4, 3.1, 7.0, 6.1

Como se interpreta esta medida, el promedio de las notas de los cinco estudiantes es de 5.5.

La media para datos agrupados (tablas de frecuencias) de define de la siguiente manera:

donde, : es la frecuencia absoluta, : la marca de clase y n el número de observaciones.

Tabla 1. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes
1 53 – 55 54 2
2 56 – 58 57 5
3 59 – 61 60 9
4 62 – 64 63 15
5 65 – 67 66 12
6 68 – 70 69 5
7 71 – 73 72 2
Total 50

Podemos concluir, que el puntaje promedio de los 50 aspirantes a una carrera en una universidad
fue de 63.2.

Media geométrica

En matemáticas y estadística, la media geométrica de una cantidad arbitraria de números (por


decir n números) es la raíz n-ésima del producto de todos los números, es recomendada para
datos de progresión geométrica, para promediar razones, interés compuesto y números índices. La
media geométrica se denota y se define como sigue:

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 33


El signo π se lee como la productoría.

Ejemplo 2. La media geométrica de 2 y 18 es

Ejemplo 3. La media geométrica de 1, 3 y 9 sería

Media armónica

La media armónica, denominada H, de una cantidad finita de números es igual al recíproco, o


inverso, de la media aritmética de los recíprocos de dichos valores y es recomendada para
promediar velocidades.
Así, dados n números , la media armónica será igual a:

La media armónica resulta poco influida por la existencia de determinados valores mucho más
grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños
que el conjunto.
La media armónica no está definida en el caso de que exista algún valor nulo.
Ejemplo 4. La media armónica de 1, 3 y 9 es:

Mediana

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez
que éstos están ordenados de menor a mayor. Es decir, es el dato central.
Ejemplo 6. La mediana del número de hijos de un conjunto de trece familias, cuyos respectivos
hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1,
1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:

En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable,


por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales.
Por ejemplo, en el caso de doce datos como los anteriores:

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 34


Se toma como mediana

Definición formal
Dado un conjunto numérico de datos ordenados, , se define su mediana para datos no
agrupados como:

Tomando el ejemplo anterior del número de hijos de un conjunto de trece familias, cuyos
respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1, 1, ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2,
2, 3, 3, 4, como =13 (un número impar), entonces la mediana es:

,
Como el valor central es 2, entonces concluimos que el 50% de las familias tiene 2 hijos.

La mediana para datos agrupados (tablas de frecuencias) se define y se denota de la siguiente


forma:

Donde,
: Límite (real) inferior de la clase mediana.
: Clase mediana.
: Frecuencia absoluta acumulada de la case que le antecede a la de la clase mediana.
: Frecuencia absoluta de la clase mediana.
c: Longitud del intervalo.

Tabla 2. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.

Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
Clase 4 62 – 64 15 31
mediana 5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 35


Para determinar la clase mediana, se toma aquella clase que sea igual a o se aproxime por
encima en la frecuencia absoluta acumulada ( ). Calculando la clase mediana, tenemos:
, entonces la clase mediana es la cuarta. A partir de esta clase se tiene: , ,
y .
Calculando en la fórmula de la mediana se tiene

El 50% de los 50 aspirantes a una carrera en una universidad tiene un puntaje de 63.3.
Propiedades e inconvenientes

Las principales propiedades de la mediana son:

 Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de


transcripción en la serie del ejemplo anterior en, pongamos por caso, el último número, deja a la
mediana inalterada.
 Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso
cuando alguno de ellos no está acotado.
 No se ve afectada por la dispersión. De hecho, es más representativa que la media
aritmética cuando la población es bastante heterogénea. Suele darse esta circunstancia cuando se
resume la información sobre los salarios de un país o una empresa. Hay unos pocos salarios muy
altos que elevan la media aritmética haciendo que pierda representatividad respecto al grueso de la
población. Sin embargo, alguien con el salario "mediano" sabría que hay tanta gente que gana más
dinero que él, como que gana menos.
Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor varía
en función de la amplitud de estos. Por otra parte, no se presta a cálculos algebraicos tan bien
como la media aritmética.

Moda

La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En cierto
sentido la definición matemática corresponde con la locución "estar de moda", esto es, ser lo que
más se lleva y se denota .
Ejemplo 5. El número de personas en distintos vehículos en una autopista son: 5, 7, 4, 6, 9, 5, 6,
1, 5, 3 y 7. El número que más se repite es 5, entonces la moda es 5 y se denota: . Podemos
concluir, que el número más frecuente de personas es los vehículos en una autopista es de 5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos
se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen
la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados (tablas de frecuencias) está dada por la siguiente fórmula:

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 36


Donde,
: Límite (real) inferior de la clase modal.
: Diferencia entre la frecuencia de la clase modal y de la clase que la antecede.
: Diferencia entre la frecuencia de la clase modal y de la clase que le sigue.
c: Longitud de intervalo.
Clase modal, es la clase con la mayor frecuencia absoluta ( ).

Tabla 3. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊
1 53 – 55 2
2 56 – 58 5
3 59 – 61 9
Clase 4 62 – 64 15
modal 5 65 – 67 12
6 68 – 70 5
7 71 – 73 2
Total 50

En la clase en donde hay la mayor frecuencia absoluta es la clase 4, por ende es la clase modal.
Por tanto,
, , y .
Calculando en la fórmula de la moda se tiene

El puntaje más frecuente de los 50 aspirantes a una carrera en una universidad fue de 63.5

Propiedades

 Cálculo sencillo.
 Interpretación muy clara.
 Al depender sólo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el
parámetro más utilizado cuando al resumir una población no es posible realizar otros cálculos,
por ejemplo, cuando se enumeran en medios periodísticos las características más frecuentes de
determinado sector social. Esto se conoce informalmente como "retrato robot".

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 37


Inconvenientes

 Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a
variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende
excesivamente del número de intervalos y de su amplitud.
 Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la
moda, no afectan en modo alguno a su valor.
 No siempre se sitúa hacia el centro de la distribución.
 Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la
misma frecuencia (distribuciones bimodales o multimodales).

Relación entre las medidas de tendencia central

La media, mediana y moda se consideran las medidas de posición más importantes por su
sencillez y utilidad. No obstante, no son aplicables a todos los casos.

A continuación se muestra gráficamente las posiciones de la media, mediana y la moda en curvas


simétricas y sesgadas (asimétricas).

Caso I. Cuando las tres medidas coinciden, , la gráfica describe una curva normal o
simétrica.

Caso II. Cuando la media es mayor que la mediana, , la gráfica describe una curva
asimétrica o sesgada a la derecha.

Caso III. Cuando la mediana es mayor que la media, , la gráfica describe una curva
asimétrica o sesgada a la izquierda.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 38


Ejemplo 6. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en
una universidad, y tomando las medidas exactas tenemos que: , y ,
como la mediana es mayor que la media, entonces los puntajes están sesgados a la izquierda. Lo
que nos indica que hay algunos puntajes están dispersos a la izquierda (aspirantes con puntajes
bajos) que nos hace dar el sesgo.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 39


OTRAS MEDIDAS DE POSICIÓN

Los cuartiles, deciles y percentiles son medidas que se utilizan para determinar los intervalos
dentro de los cuales quedan proporcionalmente repartidos los términos de la distribución.

Cuartiles

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en
cuatro partes porcentualmente iguales. determinan los valores correspondientes al
25%, 50% y 75% de los datos. coincide con la mediana.

Para calcular estas tres medidas se procede de manera semejante al cálculo de la mediana.

Los cuartiles para datos agrupados (tablas de frecuencias) se denota y define de la siguiente
manera:

.
Donde,
: Límite (real) inferior de la clase cuartil.

: Clase cuartil.
: Frecuencia absoluta acumulada de la case que le antecede a la de la clase cuartil.
: Frecuencia absoluta de la clase cuartil. c:
Longitud del intervalo.

Tabla 4. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
4 62 – 64 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
Si calculamos el primer cuartil , tenemos:

Clase cuartil: , cuyo valor aproximado en la frecuencia absoluta acumulada


( ) está en la case 3. A partir de esta clase se tiene:
, , y .

Calculando en la fórmula de los cuartiles se tiene

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 40


El 25% de los 50 aspirantes a una carrera en una universidad tiene un puntaje de 60.3.
Deciles
Los deciles son los valores de la variable que dividen a un conjunto de datos ordenados en diez
partes porcentualmente iguales. , determinan los valores correspondientes al 10%,
20%, 30%, … y 90% de los datos. coincide con la mediana.

Para calcular estas nueve medidas se procede de manera semejante al cálculo de la mediana.

Los deciles para datos agrupados (tablas de frecuencias) se denota y define de la siguiente
manera:

.
Donde,
: Límite (real) inferior de la clase decil.

: Clase decil.
: Frecuencia absoluta acumulada de la case que le antecede a la de la clase decil.
: Frecuencia absoluta de la clase decil. c:
Longitud del intervalo.

Tabla 5. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.

Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
4 62 – 64 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50

Si calculamos el séptimo decil , tenemos:

Clase decil: , cuyo valor aproximado en la frecuencia absoluta acumulada ( )


está en la case 5. A partir de esta clase se tiene:
, , y .

Calculando en la fórmula de los deciles se tiene

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 41


El 70% de los 50 aspirantes a una carrera en una universidad tiene un puntaje de 65.5.

Percentiles
Los percentiles son los valores de la variable que dividen a un conjunto de datos ordenados en
cien partes porcentualmente iguales. , determinan los valores
correspondientes al 1%, 2%, 3%,…, 17%,…, 50%,…, 98% y 99% de los datos. coincide con la
mediana.

Para calcular estas cien medidas se procede de manera semejante al cálculo de la mediana.

Los percentiles para datos agrupados (tablas de frecuencias) se denota y define de la siguiente
manera:

.
Donde,
: Límite (real) inferior de la clase percentil.

: Clase percentil.
: Frecuencia absoluta acumulada de la case que le antecede a la de la clase percentil.
: Frecuencia absoluta de la clase percentil. c:
Longitud del intervalo.

Tabla 6. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
4 62 – 64 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50

Si calculamos el quinto percentil , tenemos:

Clase percentil: , cuyo valor aproximado en la frecuencia absoluta


acumulada ( ) está en la case 2. A partir de esta clase se tiene:

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 42


, , y .

Calculando en la fórmula de los deciles se tiene

El 5% de los 50 aspirantes a una carrera en una universidad tiene un puntaje de 55.8.

GUÍA DE TRABAJO Nº 2

1. Halle la media, mediana y moda para las siguientes sucesiones de datos:


(a) 2, 4, 5, 6, 6, 6, 9, 10, 13, 15
(b) 1, 3, 5, 7, 7, 7, 9, 9, 10, 10, 11, 12, 18
Compruebe la relación entre estas medidas, para cada una de las sucesiones anteriores.

2. (a) ¿En qué caso coinciden los valores de la media, mediana y moda?
(b) ¿Qué se entiende por curva (distribución) sesgada a la derecha o sesgada a la izquierda?

3. Sean las observaciones: 1, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6


Construya una tabla de frecuencias agrupadas y calcule la media, mediana y moda por medio de
fórmulas de estas medidas para datos agrupados. ¿Qué relación encuentra entre estas
medidas?

4. Para un conjunto de observaciones dado, responda las siguientes preguntas:


(a) ¿Cuándo es mayor la media que la mediana?
(b) ¿Cuándo es menor la media que la mediana?

5. En la tabla que sigue se da la distribución de frecuencia de los puntajes de un test practicado a


120 trabajadores de una empresa, donde se determina el grado de conocimiento que tenían
sobre la organización de la misma.

Clase Intervalo fi
1 76 – 80 4
2 81 – 85 7
3 86 – 90 10
4 91 – 95 13
5 96 – 100 25
6 101 – 105 29
7 106 – 110 12
8 111 – 115 11
9 116 - 120 9

Calcule e intérprete cada una de las siguientes medidas:


(a) La media (c) La mediana
(b) El 70o percentil (d) El tercer cuartil

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 43


6. Considérense los siguientes datos, los cuales representan la razón de precio - ganancia de una
emisión de acciones, de certificados de valores vendidos muy por arriba del precio promedio del
mercado:

5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00 5.60 7.64
8.82 5.64 10.08 3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72 8.26 7.90 6.65 7.25 6.26
6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.67 6.25 7.63 6.73 7.60 8.14 6.91 7.82
6.76 7.75 7.36 8.52 7.23 7.63 6.95 7.78 10.34 6.65 6.86 7.74 6.67 7.12 7.10 4.00

Construya una tabla de frecuencias y calcule:


(a) La mediana (c) La moda
(b) El 4o decil (d) El primer cuartil

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 44


7. Una de las ventajas de la mediana y de la moda sobre la media aritmética, es que la mediana y
la moda se pueden determinar aun en distribuciones de extremo abierto, las cuales hacen
difícil el cálculo de la media. Distribución de extremo abierto es aquella en la cual no se
especifica por lo menos un extremo de un intervalo. Como es el caso del siguiente ejemplo:

Edades de las cabezas de familia de cierto país.


Clase Edades Nº
Personas
(millones)
1 Menos de 20 2.2
2 20 – 24 4.0
3 25 – 29 5.1
4 30 – 34 10.5
5 35 – 39 9.5
6 40 – 44 6.6
7 Mayor de 44 4.5
A partir de esta tabla calcule la mediana y la moda.

8. Hallar la media geométrica de los siguientes conjuntos de números:


(a) 2, 5, 8 (b) 4, 4, 4 (c) 1, 4, 5, 10, 2
9. Halle la media armónica de los siguientes conjuntos de números:
(a) 3, 3, 9 (b) 2, 4, 6 (c) 1, 3, 4, 5, 6
10. Suponga que la productividad de tres trabajadores A, B y C, es como sigue:

Trabajador Producción por hora


A 30 unidades
B 20 unidades
C 40 unidades

Si trabajan un día de 8 horas, ¿cuál es la producción promedio requerido por unidad de


producción en las 8 horas?

11. En la siguiente tabla se da la distribución de frecuencia de los pesos de 65 trabajadores de una


fábrica.
Clas Pesos fi
e
1 50 -59 8
2 60 – 69 10
3 70 – 79 16
4 80 – 89 14
5 90 – 99 10
6 100 – 109 5
7 110 – 119
2

Compruebe la relación de aproximación aritmética entre la media, mediana y moda.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 45


MEDIDAS DE VARIABILIDAD

Las medidas de variabilidad, también llamadas medidas de dispersión, muestran la variabilidad


o el grado de dispersión de una sucesión de datos, indicado por medio de un número, si este valor
es pequeño (respecto de la unidad de medida) entonces hay una gran uniformidad entre los datos.
Por el contrario, un gran valor nos indica poca uniformidad (un grado de dispersión). Cuando es
cero quiere decir que todos los datos son iguales.

Varianza y Desviación estándar

La varianza es una de las medidas más usadas en estadística, ella a su vez da origen a otra
mucho más significativa: la desviación típica o estándar. La varianza es una medida del grado de
concentración de los valores de una sucesión de datos alrededor de su media , mientras más
dispersos estén los valores respecto de la media, mayor será la varianza. Se define como la media
aritmética de los cuadrados de las desviaciones respecto a la media aritmética. Se denota y se
define para datos no agrupados:

y la desviación estándar

Es decir, .

Ejemplo 1. Las siguientes son las estaturas de un equipo de jugadores de basquetbol: 2.20 m,
2.15 m, 1.95 m, 1.75 m y 1.70 m.

La media,

La varianza,

Y la desviación estándar.

Las estaturas son homogéneas con referente a la media.

Es importante tener en cuenta las siguientes propiedades de la desviación estándar:

• La desviación estándar es una medida de variación de todos los valores con respecto a la
media.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 46


• El valor de la desviación estándar siempre es positivo y sólo es igual a cero cuando los valores
de los datos son iguales.
• Si el valor de la desviación estándar es muy grande, este indica mayor variación en el grupo de
datos.
• El valor de la desviación estándar puede incrementarse drásticamente cuando se incluye uno o
más datos distantes.
• Las unidades de la desviación estándar son las mismas de los datos originales (pulgadas,
centímetros, etc.)

La varianza para datos agrupados (Tablas de frecuencias) se define de la siguiente manera:

y la desviación estándar

Donde, : frecuencia absoluta y : marca de clase.


Tabla 1. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes
1 53 – 55 54 2
2 56 – 58 57 5
3 59 – 61 60 9
4 62 – 64 63 15
5 65 – 67 66 12
6 68 – 70 69 5
7 71 – 73 72 2
Total 50

Media,

La varianza,

Desviación estándar,

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 47


Los puntajes de los 50 aspirantes a una carrera en una universidad están relativamente dispersos
con referente a la media.
Coeficiente de variación

El coeficiente de variación es una medida que se emplea fundamentalmente para:


• Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades
de medidas (ejemplo: kilogramos y centímetros)
• Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas distintas.
• Comparar dos grupos de datos que tienen distintas medias.
• Determinar si cierta media es consistente con cierta varianza.

El coeficiente de variación se denota y define de la siguiente manera:

Ejemplo 2. Los siguientes datos corresponden a los resultados finales de dos grupos que cursaron
estadística el semestre pasado con dos docentes distintos.

Estadísticos Grupo 1 Grupo 2


Promedio 3.8 4.5
Desviación estándar 0.5 0.5

Si sólo atendemos al valor de la desviación estándar de los dos grupos debemos aceptar que la
variabilidad de éstos en cuanto a las calificaciones obtenidas es la misma. Sin embargo, al obtener
promedios diferentes y si admitimos que tal diferencia distingue a los grupos, nuestra primera
apreciación debe ser revisada y hacer que esa diferencia quede manifiesta de alguna manera. Una
manera de hacerlo es mediante el cálculo del coeficiente de variación. Así, tenemos:

Grupo 1

Grupo 2

Como sucede con cualquier medida de variabilidad, a mayor valor más variabilidad, en este caso el
grupo 1 presenta una variabilidad relativa mayor que la del grupo 2. Siendo así, el grupo 2 fue
relativamente más homogéneo que el grupo 1 en cuanto su rendimiento en estadística.

Valores estandarizados

Los distintos conjuntos de datos están asociados por lo general a diferentes medias, ya sea porque
son de naturaleza diferente o porque al ser la misma característica medida, sus centros no son los
mismos.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 48


Con el propósito de reducir los datos a un mismo punto de referencia y a una escala común, se
realiza entre ellos una trasformación llamada estandarización, que consiste en lo siguiente:
A cada dato se le resta la madia , se divide entre la desviación estándar y se obtiene un
número que se llama el valor estandarizado de . Esto es,

Ejemplo 3. Un estudiante obtuvo una nota definitiva en la asignatura de estadística de 3.8, el


promedio del curso fue de 4.0 con una desviación estándar de 0.5. Éste mismo, en contabilidad
obtuvo una nota de 4.3, el promedio del curso fue 4.5 con una desviación estándar de 0.8. ¿En qué
asignatura obtuvo un puesto relativamente mejor?

Estandarizando las notas tenemos:

Estadística:

Contabilidad:

Como la nota estandarizada de contabilidad es superior a la de estadística (un valor más cercano
al cero), el estudiante obtuvo un puesto relativamente en contabilidad que en estadística, debido a
que al estar las dos notas por debajo del promedio, en contabilidad está más cercano al promedio
del curso que en el de estadística. Cuando los puntajes se encuentren por encima del promedio, la
posición mejor es aquella que arroje un valor estandarizado más lejano del promedio, o sea, al
estandarizar los valores, el que ocupa una posición mejor es el que se aleja más del cero.

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 49


GUÍA DE TRABAJO Nº 3

1. Si las puntuaciones de 20 trabajadores nuevos de un test de aptitud son: 31, 39, 40, 43, 45, 50,
52, 58, 59, 60, 70, 71, 72, 78, 80, 85, 87, 90, 9 1 y 99. Halle la varianza y la desviación estándar
para datos no agrupados.

2. A partir de los datos del ejercicio anterior, construya una tabla de frecuencia y con base en ella
obtenga la varianza y la desviación estándar. ¿Hay diferencia entre el valor de la desviación
estándar para datos no agrupados con los datos agrupados? Si hay diferencia explique el
porqué de ésta.

3. ¿Cuándo es igual la varianza a la desviación estándar?¿Puede ser la varianza menor que la


desviación estándar?¿En qué caso será igual a 0 la varianza de determinados datos? Explique
por qué.

4. Halle la varianza y la desviación estándar para los datos del problema 6, de la guía de trabajo
N° 2.

5. Dados los 11 datos, X: 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 9.


(a) Halle la varianza y la desviación estándar de X.
(b) Aumente en 2 cada valor de X para obtener valores Y y calcule varianza y la desviación
estándar de Y.
(c) Compruebe la relación que existe entre la varianza y la desviación estándar de estas dos
sucesiones de números.

6. Dos vendedores que mercadean el mismo producto tienen los siguientes registros durante un
periodo:
Vendedor 1 Vendedor 2
Volumen de ventas por mes 30 000 000 35 000 000
Desviación estándar 2 500 000 3 600 000
¿Cuál de los vendedores parece más constante en el volumen de ventas?

7. Halle el coeficiente de variación para los siguientes datos: 2, 4, 5, 6, 6, 9, 10, 13.

8. Una persona tiene una estatura de 175 cm; la estatura promedio de la población es170 cm con
una desviación estándar de 5 cm. Esta misma persona pesa 70 Kg: el peso promedio de la
población es de 68 Kg con una desviación estándar de 5 Kg. ¿En qué caso esta persona ocupa
un puesto relativamente mayor?

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 50


FUENTES DE INFORMACION

 TEXTO BÁSICO
Estadística para las ciencias Administrativas, Lincoln, L. Chao. Editorial MC GRAWH HILL.
Tercera edición.

 FUENTES DE INTERNET
http://es.wikipedia.org/wiki/Estad%C3%ADstica

Estadística Descriptiva Jorge Luis Bustos Galindo Pá gina 51

También podría gustarte