Está en la página 1de 18

Descripción de los

conjuntos de datos

23 de noviembre de 2021
Descripción de los conjuntos
de datos

Distribuciones de frecuencias Gráficos

Histograma
Distribución de
frecuencia acumulada
Diagrama de barras

Distribución de Diagrama circular


frecuencia relativa
Gráfico de máximos-
mínimos y al cierre
Tablas de contingencia
Diagrama de tallo y hoja
Introducción

Trabajos de estadística Conjunto de datos que se utilizará para el estudio

Organizar y describir tales datos de manera


Proceso de recolección de concisa y significativa
datos

Tablas de frecuencia que colocan todos los datos en


clases específicas

Diversos gráficos que pueden proporcionar una


representación visual de los datos

Tablas de contingencia y diagramas de “tallo y hoja”,


los cuales también permiten la presentación de un
conjunto grande de datos de manera concisa y
discernible
Método de agrupación de datos
Objetivo: describir y resumir un conjunto
Estadística Descriptiva grande de datos
Manera más simple: serie ordenada (orden ascendente y
Los datos analizados se descendente)
presentan por lo regular en
tres formas básicas: textos,
cuadros estadísticos y en
Distribución de frecuencias o tabla de frecuencias:
gráficos

Ordenará los datos si estos se dividen en clases y se


registrará el número de observaciones en casa clase

Variable cuantitativa Variable cuantitativa


continua discreta
Actividad en clase
Buscar un noticia, reportaje, etc., donde se incluya una tabla de frecuencia.
Distribución de frecuencias de variables
cuantitativas-continuas

Organizarlos en un cuadro de distribución de frecuencias con intervalos de clase

1 Es un elemento de la tabla que permite


Determinar el número condensar/sintetizar un conjunto de datos en mayor
de intervalos o clase grado, con el objetivo de hacer un resumen de ellos.

Está constituida por el número de casos o mediciones


Frecuencia del que queden dentro de un intervalo, se denota como 𝑓𝑓𝑖𝑖
intervalo de clase

Longitud o ancho del Es la diferencia entre el extremo mayor y el extremo


intervalo 𝑓𝑓𝑖𝑖 menor del intervalo de clase
Criterios de selección del número de intervalos o clase
a El investigador selecciona el número de intervalos o clases con base al número de datos

En el cuadro de El número de Para obtener una


distribución de intervalos no puede Ni mayor de 20 distribución
frecuencias ser menor de 4 óptima
Criterios de selección del número de intervalos o clase
b Se calcula el número aproximado de
Por medio de la fórmula
intervalos de clase 𝒌𝒌 del cuadro de
de Sturges
distribución de frecuencias.

𝑛𝑛 = representa el número de datos que hay que considerer


𝑘𝑘 = 1 + 3.322 log 𝑛𝑛 en el cuadro

El número de clases es el adecuado para contener todos


Mayoría de casos
los datos a condensar

Hay necesidad de aumentar un intervalo de clases para


Minoría de casos
contener los datos a condensar
Distribución de frecuencias de variables
cuantitativas-Continuas

Organizarlos en un cuadro de distribución de frecuencias con intervalos de clase

2 Se conoce el número
Se procede a calcular la longitud, ancho o
de intervalos o clase
tamaño que tendrá el intervalo de clase 𝑡𝑡𝑖𝑖
𝒌𝒌

La longitud es la misma para todos los intervalos de clase


que conforman el cuadro de frecuencia.

𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 − 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚


𝑡𝑡𝑖𝑖 =
𝑘𝑘
Importante
Se puede usar la fracción (redondear a decimales), o bien,
Cuando 𝑡𝑡𝑖𝑖 no es un número entero redondear al inmediato superior.

La diferencia entre el dato mayor y


el menor del conjunto que se analiza Se denomina rango o amplitud 𝑃𝑃

El siguiente paso consiste el fijar el límite inferior 𝑙𝑙𝑖𝑖𝑖𝑖𝑖𝑖 del


Al conocer el número de intervalo primer interval de clase, el cual puede ser un valor igual o
𝑘𝑘 y su tamaño 𝑡𝑡𝑖𝑖 ligeramente menor que el dato con el valor mínimo del
conjunto de datos.

Se pueden construir dos tipos de


No exactos (ficticios) Exactos (reales)
intervalos de clase
Importante
Se pueden construir dos tipos de intervalos de clase

La construcción del límite superior e inferior no considera el error


No exactos (ficticios) mínimo y máximo permitido del dato

La construcción del límite superior e inferior debe considerar el error


Exactos (reales) mínimo y máximo permitido del dato

Cuando la amplitud de la serie de datos es pequeña, se tendrán longitudes del intervalo


de clase menores a la unidad, por lo que el error mínimo y máximo permitido es de ±
0.05, es decir
Intervalos de clase Se le resta 0.05 al límite inferior y se le suma 0.05 al
límite superior

No exactos (ficticios) Exactos (reales)

Longitud de intervalo de clase=0.7 de unidad

No exactos (ficticios) Con longitud menor a la unidad 𝑙𝑙𝑠𝑠𝑠𝑠𝑠𝑠 = 𝑙𝑙𝑖𝑖𝑖𝑖𝑖𝑖 + 𝑡𝑡𝑖𝑖 − 0.1

Lsup=4.2+(0.7 - 0.1)=4.8 Lsup=4.9+(0.7 - 0.1)=5.5 Lsup=5.6+(0.7 - 0.1)=6.2


𝑙𝑙𝑠𝑠𝑠𝑠𝑠𝑠 +0.05
Exactos (reales) Con longitud mayores a la unidad 𝑙𝑙𝑖𝑖𝑖𝑖𝑖𝑖 - 0.05

Intervalos de clase
exactos
11.95-16.05
16.95-21.05
21.95-26.05

No exactos (ficticios) Con longitud mayor a la unidad

𝑙𝑙𝑠𝑠𝑠𝑠𝑠𝑠 = 𝑙𝑙𝑖𝑖𝑖𝑖𝑖𝑖 + 𝑡𝑡𝑖𝑖 − 1


Ejemplo:

Como pasante de estadística de Pigs and People (P&P) Airlines, el Director de la división de
análisis estadístico le pide recolectar y agrupar los datos sobre el número de pasajeros que
han decidido viajar con P&P. Tales datos correspondientes a los últimos 50 días aparecen en
la Tabla 1. Sin embargo, con estos datos en bruto, es improbable que el Director pueda
obtener información útil y significativa respecto a las operaciones de vuelo. Los datos no
están organizados y es difícil llegar a una conclusión significativa simplemente revisando una
serie de números anotados en una hoja de cálculo.

Es preciso agrupar y presentar los datos de manera concisa y reveladora para facilitar el
acceso a la información que contienen.

A. Distribución de frecuencia para organizar el conjunto de datos.


Clase
Especificar los valores exactos .

50 y menos de 60

Límite superior 60 y menos de 70

70 y menos de 80

Límite inferior
100 y menos de 110

El número de clases es algo arbitrario . Muy pocas clases no revelarían ningún detalle
sobre los datos y demasiadas clases serían tan confusas como la lista original
Regla
𝒄𝒄
𝟐𝟐 ≥ 𝒏𝒏
𝑛𝑛 número de observaciones

2𝑐𝑐 ≥ 50
6 clases
25 =32 26 =64

Esta regla sugiere que debería haber seis clases en la tabla de frecuencia
Importante
Punto medio de la clase Se calcula como promedio del 𝑙𝑙𝑠𝑠𝑠𝑠𝑠𝑠 + 𝑙𝑙𝑖𝑖𝑖𝑖𝑖𝑖
M límite superior e inferior de la clase 𝑀𝑀 =
2

Intervalo de clase

𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑚𝑚𝑚𝑚𝑚 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑚𝑚𝑚𝑚𝑚 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝


𝐼𝐼𝐼𝐼 =
𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
Rango de valores encontrados de
una clase.

Se determina restado el límite


superior de una clase del inferior de
la clase siguiente

Es deseable que todos los intervalos


de clase sean del mismo tamaño
Expresa la frecuencia
Distribución de de una clase como
frecuencia relativa porcentaje del número
total de observaciones

Distribución de
frecuencia acumulada

También podría gustarte