Está en la página 1de 25

Agrupación de Datos

Representación gráficas.
Medidas de Tendencia Central

CAPÍTULO I:
Descripción de Conjunto de Datos

Lcdo. Ing. M. Sc. Gustavo G. Borzellino C.

Universidad Yacambú

11 de octubre de 2019

Gustavo Borzellino Estadística I


Agrupación de Datos
Representación gráficas.
Medidas de Tendencia Central

Resumen
1 Agrupación de Datos
Distribución de frecuencias
Limites inferior y superior
Número de Clases
Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias
2 Representación gráficas.
Lineamientos para graficar
Gráfico de pastel
Gráfico de barras
Histogramas de frecuencias
Polígonos de frecuencias y Ojivas
3 Medidas de Tendencia Central
Datos Agrupados
Gustavo Borzellino Estadística I
Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Ejemplo

Como estadístico residente de Pigs and People (P&P) Airlines, el


director de la división de análisis estadístico le pide recolectar y
agrupar los datos sobre el número de pasajeros que han decidido
viajar con P&P. Tales datos correspondientes a los últimos 50 días
aparecen en la siguiente tabla:

68 71 77 83 79 72 74 57 67 69
50 60 70 66 76 70 84 59 75 94
65 72 85 79 71 83 84 74 82 97
77 73 78 93 95 78 81 79 90 83
80 84 91 101 86 93 92 102 80 69

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Una distribución de frecuencias (o tabla de frecuencias)


ordenará los datos si estos se dividen en clases y se registrará el
número de observaciones en cada clase, tal y como muestra la
siguiente tabla:

Clases Frecuencia Punto Medio


N◦ Conteo
(pasajeros) (días) (Mc )
1 50 a 59 ||| 3 54.5
2 60 a 69 ||||| || 7 64.5
3 70 a 79 ||||| ||||| ||||| ||| 18 74.5
4 80 a 89 ||||| ||||| || 12 84.5
5 90 a 99 ||||| ||| 8 94.5
6 100 a 109 || 2 104.5
50
Gustavo Borzellino Estadística I
Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Observe que cada clase tiene un límite inferior, li y un límite


superior, ls . Los valores reales de los límites son muy importantes,
éstos pueden se escritos como intervalos de la siguiente manera:

Clases
N◦ Intervalo
(pasajeros)
1 50 a 59 [50, 60)
2 60 a 69 [60, 70)
3 70 a 79 [70, 80)
4 80 a 89 [80, 90)
5 90 a 99 [90, 100)
6 100 a 109 [100, 110)

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

El Número de clases en una tabla de frecuencias es algo


arbitrario. En general la tabla debería tener entre 5 y 20 clases.
Muy pocas clases no revelarían ningún detalle sobre los datos y
demasiadas clases sería tan confuso como la misma lista de datos
originales.
Se puede seguir una regla simple para aproximar el número de
clases, c, a utilizar:

2c ≥ n (1)

c = 1 + 3,33 log n (2)

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

La Marca de clase, Mc , se calcula como el promedio de los


límites superior e inferior de dicha clase.

ls + li
Mc = (3)
2

El intervalo de clase es el rango de valores encontrados dentro de


una clase. El Ancho de clase, AC , se determina restando el límite
superior (o inferior) de una clase con el límite superior (o inferior)
de la clase anterior.

Vmax − Vmin
Ac = (4)
c

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Marca de Clase e Intervalo de Clase.

Volviendo a nuestro ejemplo:

2c ≥ 50 ⇒ c = 6 (5)

102 − 50
Ac = = 8.66 ≈ 9 (6)
6

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Quedándonos los intervalos de clases, del ejemplo, como sigue:


Ejemplo
Clases Frecuencia Punto Medio
N◦ Conteo
(pasajeros) (días) (Mc )
1 50 a 58
2 59 a 67
3 68 a 76
4 77 a 85
5 86 a 94
6 95 a 103

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Expresan la información escogida en la muestra, de forma que


no se pierda nada de información (o poca)
Frecuencias Absolutas: Contabilizan el número total de
individuos de cada clase.
Frecuencias Relativas: Es la proporción de individuos que
pertenecen a dicha clase sobre el total de indivuoas de la
muestra. Se obtiene dividiendo la anterior por el total.
Frecuencias Acumuladas: Sólo tienen sentido para variables
ordinales y numéricas. Se obtienen sumando las frecuencias de
las clases anteriores.

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Continuando con el ejemplo:


Ejemplo
N◦ Clases Mc fi Fi fr Fr %
1 50 a 58
2 59 a 67
3 68 a 76
4 77 a 85
5 86 a 94
6 95 a 103 50 1,00
50 1,00 100

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Ejemplo
Clases Frecuencia Punto Medio
N◦ Conteo
(pasajeros) (días) (Mc )
1 31 a 40
2 41 a 50
3 51 a 60
4 61 a 70
5 71 a 80
6 81 a 90

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Ejemplo
Los siguientes datos son los ingresos de 60 ejecutivos de marketing
para empresas de Estados Unidos. Los datos están expresados en
miles de dólares.
58 64 79 74 69 71 65 55 73 40
76 76 74 38 62 54 79 75 72 50
89 34 56 69 56 31 47 42 64 74
45 65 71 79 38 69 46 57 69 61
67 45 85 61 69 62 77 77 51 69
34 39 87 71 79 39 66 36 50 73

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Ejemplo
N◦ Clases Mc fi Fi fr Fr %
1 31 a 40 35,5 9
2 41 a 50 45,5 6
3 51 a 60 55,5 7
4 61 a 70 65,5 17
5 71 a 80 75,5 18
6 81 a 90 85,5 3 60 1,00
60 1,00 100

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Ejercicio

En la redacción de un periódico, se registró durante 50 días el


tiempo requerido para formar la primera plana. Los datos,
redondeados a la décima de minutos más cercana, se dan a
continuación:
20.8 22.8 21.9 22.0 20.7 20.9 25.0 22.2 22.8
20.1 25.3 20.7 22.5 21.2 23.8 23.3 20.9 22.9
23.5 19.5 23.7 20.3 23.6 19.0 25.1 25.0 19.5
24.1 24.2 21.8 21.3 21.5 23.1 19.9 24.2 24.1
19.8 23.9 22.8 23.9 19.7 24.2 23.8 20.7 23.8
24.3 21.1 20.9 21.6 22.7

Gustavo Borzellino Estadística I


Distribución de frecuencias
Agrupación de Datos Limites inferior y superior
Representación gráficas. Número de Clases
Medidas de Tendencia Central Marca de Clase e Intervalo de Clase.
Tablas de Frecuencias

Ejemplo
N◦ Clases Mc fi Fi fr Fr %
1 19,0 a 20,0
2 20,1 a 21,1
3 21,2 a 22,2
4 22,3 a 23,3
5 23,4 a 24,4
6 24,5 a 25,5 50 1,00
50 1,00 100

Gustavo Borzellino Estadística I


Lineamientos para graficar
Agrupación de Datos Gráfico de pastel
Representación gráficas. Gráfico de barras
Medidas de Tendencia Central Histogramas de frecuencias
Polígonos de frecuencias y Ojivas

Definición (Principio de Inclusividad)

El principio de inclusividad establece que para una variable dada


debe haber una puntuación o un código para cada observación
realizada.

Definición (Principio de Exclusividad)


El principio de exclusividad sostiene que para un variable dada
cada observación es asignada a una y sólo una puntuación.

Gustavo Borzellino Estadística I


Lineamientos para graficar
Agrupación de Datos Gráfico de pastel
Representación gráficas. Gráfico de barras
Medidas de Tendencia Central Histogramas de frecuencias
Polígonos de frecuencias y Ojivas

1. - Elija el diseño con base en: a) el nivel de medición de una


variable, b) los objetivos del estudio y c) el público a quien se
dirije.
2. - Ante todo, una buena presentación gráfica tiene que ser clara
y entendible. Debe simplificar, no complicar.
3. - Un gráfico o diagrama requiere explicarse por sí mismo y
transferir información, sin hacer refencia a un texto o a alguien
que lo explique. La selección cuidadosa de títulos, descripción
de la escala, subtítulos y otras leyendas contribuyen a lograr
este objetivo. Someta cada gráfico o tabla a la prueba de
“perdido en el estacionamiento”. Pregúntese: Si este gráfico
fuera abandonado en un estacionamiento, ¿podría tomarlo un
perfecto extraño e interpretarlo?

Gustavo Borzellino Estadística I


Lineamientos para graficar
Agrupación de Datos Gráfico de pastel
Representación gráficas. Gráfico de barras
Medidas de Tendencia Central Histogramas de frecuencias
Polígonos de frecuencias y Ojivas

4. - Antes de decidirse por el tipo de presentación pictórica (por


ejemplo, gráfico de pastel contra gráfico de barras), elabore
bosquejos con varias opciones. Los programas de cómputo
hacen esto relativamente fácil. Para ampliar las alternativas,
solicite opciones y consulte otros materiales, tales como
informes organizacionales.
5. - Adhiérase al principio de inclusividad y exclusividad. Anote al
pie de página cualquier excepción.
6. - Si los datos no son suyos, indique la fuente de los mismos al
final de la tabla

Gustavo Borzellino Estadística I


Lineamientos para graficar
Agrupación de Datos Gráfico de pastel
Representación gráficas. Gráfico de barras
Medidas de Tendencia Central Histogramas de frecuencias
Polígonos de frecuencias y Ojivas

Gráfico de Pastel o Torta

Círculo que se divide (o rebana) desde su punto central, en donde


cada rebanada representa la frecuencia proporcional de
determinada categoría de una variable nominal u ordinal. Es
especialmente útil para transmitir un sentido de equidad, tamaño
relativo o desigualdad entre las categorías.

Gustavo Borzellino Estadística I


Lineamientos para graficar
Agrupación de Datos Gráfico de pastel
Representación gráficas. Gráfico de barras
Medidas de Tendencia Central Histogramas de frecuencias
Polígonos de frecuencias y Ojivas

Gráfico de Barras

Serie de barras verticales u horizontales, donde la longitud de la


barra representa la frecuencia porcentual de una categoría de una
variable nominal u ordinal.
Los gráficos de barras son especialmente eficaces para ilustrar la
competencia entre categorías.

Gustavo Borzellino Estadística I


Lineamientos para graficar
Agrupación de Datos Gráfico de pastel
Representación gráficas. Gráfico de barras
Medidas de Tendencia Central Histogramas de frecuencias
Polígonos de frecuencias y Ojivas

Histogramas de Frecuencias

Diagrama de 90 grados que presenta las puntuaciones de un varible


de intervalo o razón a lo largo del eje horizontal, y la frecuencia de
cada puntuación en una columana paralela al eje vertical.

Gustavo Borzellino Estadística I


Lineamientos para graficar
Agrupación de Datos Gráfico de pastel
Representación gráficas. Gráfico de barras
Medidas de Tendencia Central Histogramas de frecuencias
Polígonos de frecuencias y Ojivas

Polígono de Frecuencias

Diagrama de 90 grados con puntuaciones de un varible de intervalo


o razón señaladas en el eje horizontal, y las frecuencias están
representadas por las alturas de puntos sobre las puntuaciones y
conectados mediante líneas rectas.

Los poligonos de frecuencias son especialmente útiles para


comparar dos o más muestras.

Ojivas

Polígono de frecuencias acumuladas

Gustavo Borzellino Estadística I


Agrupación de Datos
Representación gráficas. Datos Agrupados
Medidas de Tendencia Central

La Media
P P
fMc fMc
Xg = = P (7)
n f

La Mediana
 
n/2 − F
Mediana = Lmd + ·C (8)
fmd

La Moda
P P
fMc fMc
Xg = = P (9)
n f

Gustavo Borzellino Estadística I


Agrupación de Datos
Representación gráficas. Datos Agrupados
Medidas de Tendencia Central

Ejemplo
N◦ Clases Mc fi Fi
1 50 a 59 54.50 3 3
2 60 a 69 64.50 7 10
3 70 a 79 74.50 18 28
4 80 a 88 84.50 12 40
5 90 a 99 94.50 8 48
6 100 a 109 104.50 2 50
50

Gustavo Borzellino Estadística I

También podría gustarte