Está en la página 1de 26

UNIDAD I

ESTADÍSTICA DESCRIPTIVA

Tablas de Frecuencias y Gráficos


Variables Cuantitativas

M.Graciela Márquez B.
Objetivos de la clase:

 Realizarla agrupación de datos según tipo de


variables.
 Realizar gráficos de acuerdo al tipo de variables.
 Comprender el concepto de agrupación en tablas
de frecuencias.
 Interpretar valores desde una tabla de
frecuencias.
¿Qué es una Tabla de Frecuencias?

 Podemos entender por Tabla de Frecuencias,


aquella estructura que permite agrupar los
datos recolectados, de forma ordenada y
estructurada, permitiendo con ello realizar
análisis desde la información que arroja, para la
toma de decisiones.
Dos situaciones:
 Dependiendo del Tipo de variables, se presentan dos situaciones:
Variables Cuantitativas:
En variables Discretas:
 Si una variable es Discreta, la forma de resumir sus datos
dependerá del Recorrido de esta.
 Si el Recorrido es finito numerable y se cuenta con una cantidad
de datos adecuados, se puede considerar cada valor de la variable,
en forma equivalente a la agrupación de datos de las variables no
numéricas.
Ejemplo, en el caso de las variables:
 “Número de Hijos en las familias de cierta empresa”, con un
Recorrido que va de 0 a 5 hijos.
 “Cantidad de autos vendidos en una automotora en cierto
período”, con un Recorrido que vaya de 0 hasta 4 autos.
 “Número de alumnos ausentes en la sala por resfríos por semana
en Invierno”, con un recorrido de 0 a 5.
Variables Discretas y Continuas: con Intervalos

 Si el Recorrido de los valores de la variable es


superior al mencionado previamente, se procederá a
generar intervalos para agrupar los valores de esa
variable.

 En el caso de variables Continuas, necesariamente,


se deberán agrupar los valores en k rangos o
intervalos.
 También llamaremos a los intervalos, clases o rangos.
Criterios para realizar una Tabla con Intervalos
 ¿Qué entendemos por Intervalo?
 Es un espacio numérico que queda delimitado en sus extremos por un valor inicial o
límite inferior (𝐿𝐼𝑖 ) y un valor final o límite superior (𝐿𝑆𝑖 )
[ 𝐿𝐼𝑖 _______________𝐿𝑆𝑖 ) 𝑖=1,….,𝑘

 La distancia que hay entre los dos valores extremos que componen cada
intervalo, se conoce como Amplitud, Ancho o Longitud del Intervalo y
se puede determinar como la diferencia entre esos dos valores, cuando
ya está la tabla realizada:
𝐶𝑖 = 𝐿𝑆𝑖 − 𝐿𝐼𝑖 𝑖=1,….,𝑘

 Una tabla constará de k intervalos, que deberán contener al 100% de los


datos de la variable. Esto será lo que se debe definir al inicio, una vez
que se tiene claro que hay que realizar una tabla con intervalos.
Construcción de una Tabla con Intervalos
 La tabla deberá contener las siguientes columnas:

ℎ𝑖 %

Siendo:
 (1) : Nombre de la variable y sus valores en clases
 (2) : La marca de clase
 (3), (4), (5) : Las frecuencias absoluta, relativa y porcentual NO ACUMULADAS
 (6), (7), (8) : Las frecuencias absoluta, relativa y porcentual ACUMULADAS
Criterio para Construir una Tabla con Intervalos
Realizaremos una tabla de frecuencias con Intervalos, siguiendo los
siguientes pasos:

Paso 1) Identificar completamente la variable.


Paso 2) Determinar el Número de Intervalos.
Paso 3) Determinar la Amplitud de cada Intervalo.
Paso 4) Generar los Límites de los Intervalos.
Paso 5) Calcular la Marca de Clase
Paso 6) Ordenar los datos de menor a mayor (opcional, pero útil)
Paso 7) Completar la Tabla en sus Frecuencias.
Recordemos para el Paso 1:
 Antes de iniciar cualquier proceso de resumen y/o análisis de una
variable, debemos reconocer en ella lo siguiente:
 Cuál es la Variable :
 Se identifica qué es lo que se está analizando o estudiando

 Cuál es su Tipo y Escala de medida :


 Cualitativa (Nominal u Ordinal) o Cuantitativa (Discreta o Continua)

 Cuál es la Unidad Medida u Observada :


 De que elementos o individuos se toman los datos

 Cuál es el Recorrido de ella :


 Son todos los posibles valores que toma la variable en la población
en estudio.
Construcción de la Tabla => Paso 2
Determinación del número de intervalos: k
La cantidad de intervalos a usar se pueden determinar de varias
formas:
 Se puede elegir en forma arbitraria, dependiendo del número de datos,
pueden fluctuar entre 3 y 15 cómo máximo.

 Se puede obtener 𝐾 = 𝑁

 Se puede obtener con la fórmula de Sturges: 𝐾 = 1 + 3,322 ∗ log 𝑁

 Se puede obtener definiendo antes, la amplitud (ci) de cada intervalo,


𝑅𝑎𝑛𝑔𝑜 𝑉𝑎𝑙𝑜𝑟 𝑚á𝑥.−𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛.
quedando: 𝐾 = =
𝐶𝑖 𝐶𝑖
Construcción de la Tabla => Paso 3 y Paso 4
 De usar cualquiera de las tres primeras opciones, se debe proceder
a calcular la amplitud que tendrá cada intervalo:

𝑅𝑎𝑛𝑔𝑜 𝑉𝑎𝑙𝑜𝑟 𝑚á𝑥. −𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛.


𝐶𝑖 = =
𝐾 𝐾

Para generar los límites de cada Intervalo:


Se inicia con el menor valor observado y se le agrega a ese valor la
amplitud. Esto es:
Para i=1 : 𝐿𝐼1 = 𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛. 𝐿𝑆1 = 𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛. +𝐶𝑖

Para el resto : 𝐿𝐼𝑖 = 𝐿𝑆(𝑖−1) 𝐿𝑆𝑖 = 𝐿𝐼𝑖 + 𝐶𝑖 𝑖 = 2, 3, 4, … , 𝐾


Construcción de la Tabla => Paso 5, Paso 6 y Paso 7
 Determinación de la Marca de clase, que será el punto medio entre los
valores de cada intervalo:
𝐿𝐼𝑖 + 𝐿𝑆𝑖
𝑋𝑖 = 𝑝𝑎𝑟𝑎 𝑖 = 1, 2, … 𝐾
2

Luego, teniendo los datos ordenados, se comienza a completar la tabla


con las frecuencias absolutas 𝑛𝑖 , para lo cuál se cuenta cuantos datos
pertenecen a cada intervalo.
Se considerará a los límites inferiores “cerrados” y los límites superiores
“abiertos”, exceptuando el último límite superior, que se pondrá también
“cerrado”.

Observación: “cerrado” indica que si contiene exactamente a ese valor. “abierto”


indica que ese valor exacto, no está contenido y se asume el valor inmediatamente
inferior…
Construcción de una tabla con Intervalos:

Ejemplo:
 Se quiere analizar el perfil de los clientes de una empresa dedicada a las
inversiones. Para esto se ha realizado una encuesta a 30 clientes en
relación a sus ingresos mensuales en miles de pesos, obteniendo los
siguientes resultados:

 780 520 490 800 950 1200 960 790 500 850
 1300 890 750 560 1600 1250 750 1400 1150 450
 1350 1500 960 870 1100 1350 1200 1400 1100 950

En base a estos datos, procedemos a realizar la tabla de frecuencias:


Construcción de una tabla con Intervalos:
Paso 1) Identificación de la Variable:
Variable = Sueldo de clientes, en miles de $
Tipo/Escala de Medida = Cuantitativa / Continua
Unidad medida = Los clientes
Recorrido = Desde 450 hasta 1600
Rango = 1600 – 450 =1150

Siendo una variable continua, debemos proceder a realizar una


tabla con Intervalos.
Construcción de una tabla con Intervalos:
Paso2) Determinación del número de Intervalos K:
Usaremos la segunda opción: 𝐾 = 𝑁
Siendo N= 30 => 𝐾 = 30 = 5,4772 ≈ 6
Debemos usar 6 intervalos.

Paso3) Determinación de la Amplitud de los Intervalos:


𝑅𝑎𝑛𝑔𝑜 1150
𝐶𝑖 = = = 191,667 ≈ 192 𝑚𝑖𝑙 $
𝐾 6

Paso4) Comenzamos a llenar la tabla, disponiendo los Límites de los


intervalos:
𝐿𝐼1 = 450 𝐿𝑆1 = 450 + 192 = 642
𝐿𝐼2 = 642 𝐿𝑆2 = 642 + 192 = 834
𝐿𝐼3 = 834 𝐿𝑆3 = 834 + 192 = 1026 …..
Construcción de una tabla con Intervalos:
Variable: Marca de Número Proporción: Porcentaje:
Sueldos en M$ Clase: 𝑿𝒊 Clientes: 𝒏𝒊 𝒉𝒊 𝒉𝒊 % 𝑵𝒊 𝑯𝒊 𝑯𝒊 %
[ 450 -- 642 )
[ 642 -- 834 )
[ 834 –- 1026 )
[1026–- 1218 )
[1218–- 1410 )
[1410-- 1602 ]

Paso 4)
Construcción de una tabla con Intervalos:
Variable: Marca de Número Proporción: Porcentaje:
Sueldos en M$ Clase: 𝑿𝒊 Clientes: 𝒏𝒊 𝒉𝒊 𝒉𝒊 % 𝑵𝒊 𝑯𝒊 𝑯𝒊 %
[ 450 -- 642 ) 546
[ 642 -- 834 ) 738
[ 834 –- 1026 ) 930
[1026–- 1218 ) 1122
[1218–- 1410 ) 1314
[1410-- 1602 ] 1506

Paso 4)

Paso 5)

𝐿𝐼𝑖 +𝐿𝑆𝑖 450+642


Paso5) Marca de Clase: 𝑋𝑖 = . 𝐸𝑗𝑒𝑚𝑝𝑙𝑜: 𝑝𝑎𝑟𝑎 𝑖 = 1 𝑋1 = = 546,
2 2
642+834
𝑝𝑎𝑟𝑎 𝑖 = 2 𝑋2 = = 738, y así hasta K=6
2
Construcción de una tabla con Intervalos:
Variable: Marca de Número Proporción: Porcentaje:
Sueldos en M$ Clase: 𝑿𝒊 Clientes: 𝒏𝒊 𝒉𝒊 𝒉𝒊 % 𝑵𝒊 𝑯𝒊 𝑯𝒊 %
[ 450 -- 642 ) 546 5
[ 642 -- 834 ) 738 6
[ 834 –- 1026 ) 930 6
[1026–- 1218 ) 1122 7
[1218–- 1410 ) 1314 4
[1410-- 1602 ] 1506 2
N=30

Paso 4)
Paso 5)
Paso 6) Opcional: Ordenar los datos de menor a
mayor para realizar el conteo de casos en cada
intervalo = Frecuencia absoluta 𝒏𝒊

Paso 7) Iniciar completando la tabla con la información


que recoge en la frecuencia absoluta 𝒏𝒊
Construcción de una tabla con Intervalos:
Variable: Marca de Número Proporción: Porcentaje:
Sueldos en M$ Clase: 𝑿𝒊 Clientes: 𝒏𝒊 𝒉𝒊 𝒉𝒊 % 𝑵𝒊 𝑯𝒊 𝑯𝒊 %
[ 450 -- 642 ) 546 5 0,1667 16,67%
[ 642 -- 834 ) 738 6 0,2 20,00%
[ 834 –- 1026 ) 930 6 0,2 20,00%
[1026–- 1218 ) 1122 7 0,2333 23,33%
[1218–- 1410 ) 1314 4 0,1333 13,33%
[1410-- 1602 ] 1506 2 0,0667 6,67%
N=30 H=1 H%=100%

Paso 4)
Paso 5)

Paso 7) Se completa la Tabla igual que en el caso de variables cualitativas, calculando las
frecuencias NO acumuladas, para luego calcular las frecuencias ACUMULADAS
Construcción de una tabla con Intervalos:
Variable: Marca de Número Proporción: Porcentaje:
Sueldos en M$ Clase: 𝑿𝒊 Clientes: 𝒏𝒊 𝒉𝒊 𝒉𝒊 % 𝑵𝒊 𝑯𝒊 𝑯𝒊 %
[ 450 -- 642 ) 546 n1=5 0,1667 16,67% N1= 5 0,1667 16,67%
[ 642 -- 834 ) 738 n2=6 0,2 20,00% N2=11 0,3667 36,67%
[ 834 –- 1026 ) 930 n3=6 0,2 20,00% N3=17 0,5667 56,67%
[1026–- 1218 ) 1122 n4=7 0,2333 23,33% N4=24 0,8000 80,00%
[1218–- 1410 ) 1314 n5=4 0,1333 13,33% N5=28 0,9333 93,33%
[1410-- 1602 ] 1506 n6=2 0,0667 6,67% N6=30 1,000 100%
N=30 H=1 H%=100%

Paso 4) Paso 5) Frecuencias Acumuladas


Frecuencias NO Acumuladas

La 𝑁𝑖 es la frecuencia acumulada Absoluta, y corresponderá a la cantidad de


Paso 7) Se termina de casos Acumulados HASTA el Límite Superior del intervalo i. Esto es, desde
completar la Tabla 𝑳𝑰𝟏 𝒉𝒂𝒔𝒕𝒂 𝑳𝑺𝒊
calculando las Ejemplo:
Frecuencias ACUMULADAS N1 = n1=5, N2=N1+n2 =5+6=11, N3=N2+n3= 11+6=17, N4=N3+n4=17+7=24 ….

De igual forma se calculan las otras columnas.


Construcción de una tabla con Intervalos:
Variable: Marca de Número Proporción: Porcentaje:
Sueldos en M$ Clase: 𝑿𝒊 Clientes: 𝒏𝒊 𝒉𝒊 𝒉𝒊 % 𝑵𝒊 𝑯𝒊 𝑯𝒊 %
[ 450 -- 642 ) 546 5 0,1667 16,67% 5 0,1667 16,67%
[ 642 -- 834 ) 738 6 0,2 20,00% 11 0,3667 36,67%
[ 834 –- 1026 ) 930 6 0,2 20,00% 17 0,5667 56,67%
[1026–- 1218 ) 1122 7 0,2333 23,33% 24 0,8000 80,00%
[1218–- 1410 ) 1314 4 0,1333 13,33% 28 0,9333 93,33%
[1410-- 1602 ] 1506 2 0,0667 6,67% 30 1,000 100%
N=30 H=1 H%=100%

Paso 4) Paso 5) Frecuencias Acumuladas


Frecuencias NO Acumuladas

Paso 7) Tabla terminada.


Gráficos Estadísticos:

 Histograma : Es un gráfico de barras. Se usa para las frecuencias


NO Acumuladas.
 Polígono : Es un gráfico de líneas. Es equivalente al Histograma.
 Ojiva : Es un gráfico exclusivo para las frecuencias Acumuladas.
Puede realizarse con líneas o con barras.

 Histograma Polígono Ojiva


Tablas y Gráficos desde Excel:

 Para trabajar en Excel, vamos a realizar el proceso


compartiendo la pantalla, en directo….
Ejercicio Práctico:
 Se cuenta con los datos de kilómetros, en miles, recorridos por ciertos autos
en un período de 1 año, los que se registran en lo que sigue:

 56 78,3 120 34 89,5 103 74,5 68,4 95 125


89 45 86 54 39 78 102 206 200 115
73 58,9 68,3 97,5 104 185 174 128 163 87
85 43,6 48,5 125,1 147 139 185 47,2 49,4 55,3

1) Realice la tabla de frecuencias


2) Realice los gráficos estadísticos: Histograma, Polígono y Ojiva.
3) ¿Qué porcentaje de autos superan los 100.000 kilómetros de uso?

También podría gustarte