Está en la página 1de 32

EJEMPLOS CAPÍTULO 2 Estadística descriptiva: presentaciones tabulares

y gráficas Secciones 2.1 y 2.2


Contenido del Capítulo
2.1 RESUMEN DE DATOS
CUALITATIVOS
Distribución de frecuencia
Distribuciones de frecuencia
relativa y frecuencia porcentual
Gráficas de barras y circulares
2.2 RESUMEN DE DATOS
CUANTITATIVOS
Distribución de frecuencia
Distribuciones de frecuencia
relativa y frecuencia porcentual
Diagramas de puntos
Histograma
Distribuciones acumuladas
Ojiva
2.3 ANÁLISIS DE DATOS
EXPLORATORIOS: EL
DIAGRAMA DE TALLO
Y HOJA
2.4 TABULACIONES
CRUZADAS Y DIAGRAMAS
DE DISPERSIÓN
Tabulación cruzada
La paradoja de Simpson
Diagrama de dispersión y línea
de tendencia
2.1 RESUMEN DE DATOS
CUALITATIVOS
Distribución de frecuencia
Distribuciones de frecuencia relativa y porcentual
Gráficas de barras y circulares

Los datos se clasifican en cualitativos o cuantitativos.

Los datos cualitativos utilizan etiquetas o nombres para identificar las categorías de
elementos similares.

Los datos cuantitativos son valores numéricos que indican cuánto o cuántos.

DISTRIBUCIÓN DE FRECUENCIA
Una distribución de frecuencia es un resumen tabular de datos que muestra el número
(frecuencia) de elementos en cada una de varias clases que no se superponen.

FRECUENCIA RELATIVA

La frecuencia porcentual de una clase es la frecuencia relativa multiplicada por 100.

Ejemplo correspondiente al problema 5 de la página 37


5. En orden alfabético, los seis apellidos más comunes en Estados Unidos son Brown, Davis,
WEB archivo Johnson, Jones, Smith y Williams (The World Almanac, 2006). Suponga que una muestra de
Names 50 personas con uno de estos apellidos proporcionó los datos siguientes.

Resuma los datos mediante la elaboración de lo siguiente.


a) Distribuciones de frecuencia relativa y frecuencia porcentual.
b) Una gráfica de barras.
c) Una gráfica circular.
d) Con base en estos datos, ¿cuáles son los tres apellidos más comunes?

Conteo rápido del total de datos 50 Nota. Uso de la función CONTARA

Apellido Frecuencia Frec Rel Frec Porcentual


Brown 7 0.14 14 Nota. Uso de la función CONTAR.SI
Davis 6 0.12 12
Johnson 10 0.2 20
Jones 7 0.14 14
Smith 12 0.24 24
Williams 8 0.16 16
Total 50 1 100
Apellidos más comunes
Frecuencia

8 7
Frecuenci a
14

12 6
10

8 12
6
10
4

2 7
0 Brown Davi s Johns on Jones Smi th Wi l l i ams
Brown Davi s Johns on Jones Smi th Wi l l i ams

APELLIDOS MÁS COMUNES: Smith


Johnson
Williams

NOTAS Y COMENTARIOS DE LOS AUTORES (vienen al final de cada sección)


1. A menudo, el número de clases en una distribución de frecuencia es igual al número de
categorías encontradas en los datos, como ocurre con los de la compra de bebidas refrescantes
en esta sección.

Los datos se refieren sólo a cinco marcas, y para cada una se definió una clase de distribución
de frecuencia separada.

Si los datos hicieran referencia a todas las bebidas, se requerirían muchas categorías,
la mayoría de las cuales tendría un número pequeño de bebidas refrescantes adquiridas.
La mayoría de los expertos en estadística recomienda que las clases con frecuencias menores se
agrupen en una clase agregada llamada “otro”.
en esta sección.
Los datos se refieren sólo a cinco marcas, y para cada una se definió una clase de distribución
de frecuencia separada.

Si los datos hicieran referencia a todas las bebidas, se requerirían muchas categorías,
la mayoría de las cuales tendría un número pequeño de bebidas refrescantes adquiridas.
La mayoría de los expertos en estadística recomienda que las clases con frecuencias menores se
agrupen en una clase agregada llamada “otro”.
ASIGNACIÓN (TAREA)
Las que presentan frecuencias de 5% o menos se tratan de esta manera.

2. La suma de laslos
Resolver frecuencias en cualquier
cinco incisos distribución
del problema 10 de lade frecuencia
página 39 es siempre igual al número
de observaciones.
La sumaArchivo de datos a utilizar:
de las frecuencias relativas en cualquier distribución de frecuencia relativa
WEBigual
es siempre archivo
a 1.00, y la de los porcentajes en una distribución de frecuencia porcentual es
siempreFedBank
igual a 100.

ASIGNACIÓN (tarea)

Resolver problemas 10 y 40 del libro # 1


WEB archivo Problema 10 de página 39
FedBank

WEB archivo Problema 40 de página 66


GMSales

COMPARE SUS RESULTADOS CONTRA LOS QUE PROPORCIONAN


LOS AUTORES DEL LIBRO. HAGA SUS COMENTARIOS
Last Name WEB archivo
Brown Names
Smith
Davis
Johnson
Williams
Williams
Johnson
Jones
de Davis
Jones
Williams
Jones
Smith
Smith
mero Davis
Johnson
Smith
Jones
Jones
Johnson
00. Williams
Smith
Brown
Smith
Johnson
Jones
Smith
Smith
Williams
Brown
Williams
Johnson
Williams
Johnson
a función CONTARA 50 Williams
Smith
Brown
a función CONTAR.SI Smith
Davis
Johnson
Brown
Smith
Johnson
Brown
Johnson
Brown
Jones
Davis
Smith
Davis
Apellido Frecuencia Frec Rel Frec Porcentual
Brown 7 0.14 14
Davis 6 0.12 12
Johnson 10 0.2 20
Jones 7 0.14 14
Smith 12 0.24 24
Williams 8 0.16 16
Total 50 1 100
PROF HÉCTOR RODRÍGUEZ SOLÓRZANO

2.2 RESUMEN DE DATOS


CUANTITATIVOS
Distribución de frecuencia
Distribuciones de frecuencia
relativa y frecuencia porcentual
Diagramas de puntos
Histograma
Distribuciones acumuladas
Ojiva

El ejemplo que presenta el libro trata sobre la duración en días de 20


auditorias que se realizaron y cuya tabla de distribución de frecuencias se
muestra a continuación.

Los tres pasos necesarios para definir las clases o intervalos de una distribución de frecuencia con dato
cuantitativos son los siguientes:
1. Determine el número de clases que no se superponen.
2. Defina el ancho de cada clase.
3. Determine los límites de clase.

Número de clases:
Como regla general, se recomienda utilizar entre 5 y 20 clases. Cada quién elige.

En el caso de un número pequeño de elementos de datos se pueden utilizar cinco o seis clases para resum
datos.
Si se tienen muchos elementos, se requiere un número grande de clases.
La idea es utilizar suficientes clases para mostrar la variación en los datos, pero no demasiadas si sólo se
algunos elementos.
Otro criterio consiste en utilizar la fórmula: No. de clases = √(2&𝑛) , donde n es el número
total de datos.
Otro criterio consiste en utilizar la regla de sturges: No. de clases = 1 + 3.3 log n
La idea es utilizar suficientes clases para mostrar la variación en los datos, pero no demasiadas si sólo se
algunos elementos.
Otro criterio consiste en utilizar la fórmula: No. de clases = √(2&𝑛) , donde n es el número
total de datos.
Otro criterio consiste en utilizar la regla de sturges: No. de clases = 1 + 3.3 log n

Ancho de clase:
Ancho de clase aproximado = (valor de datos mayor - valor de datos menor) / número de clases

El ancho de clase aproximado que se obtiene con esta ecuación se redondea a un valor más
conveniente con base en la preferencia de la persona que elabora la distribución de frecuencia.

Asignar el mismo ancho a las clases reduce la posibilidad de interpretaciones inadecuadas


de los usuarios.

Límite de clase:
Deben elegirse de modo que cada elemento de datos pertenezca a una y
sólo una de las clases.
El límite de clase inferior identifica el valor de datos menor asignado a
la clase.
El límite de clase superior identifica el valor de datos mayor asignado a la clase.

Punto medio de clase:

El punto medio de clase es el valor medio (promedio) entre los límites de clase inferior y
superior.

Las distribuciones de frecuencia relativa y de frecuencia porcentual para los datos cuantitativos
se definen de la misma manera que para los datos cualitativos.

Diagrama de puntos
Uno de los resúmenes gráficos de datos más sencillos es el diagrama de puntos.
El eje horizontal muestra el rango de los datos. Cada valor se representa por medio de un
punto colocado sobre este eje.
Histograma
El histograma es una presentación gráfica común de los datos cuantitativos.

Este resumen gráfico se elabora para datos previamente resumidos, ya sea mediante una
distribución de frecuencia, de frecuencia relativa o de frecuencia porcentual.

Para elaborar un histograma, la variable de interés se coloca sobre el eje horizontal y la


frecuencia de que se trate, sobre el eje vertical.

La frecuencia, la frecuencia relativa o la frecuencia porcentual de cada clase se indica con el


trazo de un rectángulo, cuya base está determinada por los límites de clase sobre el eje
horizontal, y cuya altura es la frecuencia, la frecuencia relativa o la frecuencia porcentual
correspondiente.

Los rectángulos adyacentes de un histograma están en contacto uno con otro.


A diferencia de una gráfica de barras, no hay una separación natural entre los
rectángulos de las clases adyacentes. Este formato es la convención usual para los histogramas.
La eliminación de los espacios entre las clases de un histograma sirve para mostrar que todos los valores
entre el límite inferior de la primera clase y el límite superior de la última clase son posibles.
Uno de los usos más importantes del histograma es proporcionar información acerca de la
forma de una distribución. Esta puede ser sesgada hacia la izquierda, simétrica o sesgada hacia
la derecha.

Distribuciones acumuladas
Una variación de la distribución de frecuencia que proporciona otro resumen tabular de los datos
cuantitativos es la distribución de frecuencia acumulada.
Ésta utiliza el número, los anchos y los límites de clases desarrollados para la distribución de
frecuencia. Sin embargo, en vez de indicar la frecuencia de cada clase, la distribución de
Distribuciones acumuladas
Una variación de la distribución de frecuencia que proporciona otro resumen tabular de los datos
cuantitativos es la distribución de frecuencia acumulada.
Ésta utiliza el número, los anchos y los límites de clases desarrollados para la distribución de
frecuencia. Sin embargo, en vez de indicar la frecuencia de cada clase, la distribución de
frecuencia acumulada muestra el número de elementos de datos con valores menores o iguales que
el límite de clase superior de cada clase.

Ojiva
La gráfica de una distribución acumulada, llamada ojiva, muestra los valores de datos sobre el eje
horizontal, y ya sea las frecuencias acumuladas, las frecuencias relativas acumuladas o las
frecuencias porcentuales acumuladas, sobre el eje vertical.

Los puntos trazados se conectan por medio de líneas rectas para completar la ojiva.
NOTAS Y COMENTARIOS (de los autores)
1. Una gráfica de barras y un histograma son en esencia
lo mismo; ambos son representaciones gráficas
de los datos de una distribución de frecuencia. Un
histograma es sólo una gráfica de barras sin separación
entre éstas. Para algunos datos cuantitativos
discretos es apropiada una separación entre
las barras. Considere, por ejemplo, el número de
materias a las cuales se inscribe un estudiante universitario.
Los datos sólo pueden asumir valores
enteros. Los valores intermedios como 1.5, 2.73,
etc., no son posibles. No obstante, con datos cuantitativos
continuos, como la duración de la auditoría
de la tabla 2.4, una separación entre las barras
no es adecuada.
2. Los valores apropiados para los límites de clase
con datos cuantitativos dependen del nivel de precisión
de éstos. Por ejemplo, con los datos de duración
de la auditoría de la tabla 2.4 los límites
empleados fueron valores enteros. Si se redondean
a la décima más cercana de un día (p. ej., 12.3,
14.4, etc.), entonces los límites se establecerían en
décimas de días. Por ejemplo, la primera clase sería
10.0 –14.9. Si los datos se registraran a la centésima
más cercana de un día (p. ej., 12.34, 14.45,
etc.), los límites se fijarían en centésimas de días.
Por ejemplo, la primera clase sería 10.00 –14.99.
3. Una clase de extremo abierto requiere sólo un límite
de clase inferior o un límite de clase superior.
Por ejemplo, en los datos de la tabla 2.4, suponga
que dos de las auditorías han tardado 58 y 65 días.
En vez de continuar con las clases de ancho 5 con
las clases 35 – 39, 40 – 44, 45 – 49, etc., podríamos
simplificar la frecuencia de distribución para mostrar
una clase de extremo abierto de “35 o más”,
la cual tendría una frecuencia de 2. Con más frecuencia
la clase de extremo abierto aparece en el
extremo superior de la distribución; a veces en
el extremo inferior, y ocasionalmente en ambos
extremos.
4. La última entrada de una distribución de frecuencia
acumulada es siempre igual al número total de
simplificar la frecuencia de distribución para mostrar
una clase de extremo abierto de “35 o más”,
la cual tendría una frecuencia de 2. Con más frecuencia
la clase de extremo abierto aparece en el
extremo superior de la distribución; a veces en
el extremo inferior, y ocasionalmente en ambos
extremos.
4. La última entrada de una distribución de frecuencia
acumulada es siempre igual al número total de
observaciones, mientras que en una distribución
de frecuencia relativa acumulada siempre es igual
a 1.00, a la vez que la última entrada en una distribución
de frecuencia porcentual acumulada siempre
es igual a 100.

Ejemplo correspondiente al problema 18 de la página 47

18. La investigación de nrf/big proporcionó los resultados de una encuesta de gastos vacacionales
de los consumidores (USA Today, 20 de diciembre de 2005). Los datos siguientes indican
la cantidad en dólares de gastos vacacionales para una muestra de 25 consumidores.

WEB archivo
Holiday

a) ¿Cuál es el gasto vacacional más bajo? ¿Y el más alto?


b) Utilice un ancho de clase de $250 para preparar una distribución de frecuencia y una distribución
de frecuencia porcentual para los datos.
c) Elabore un histograma y comente la forma de la distribución.
d) ¿Qué observaciones puede plantear sobre los gastos vacacionales?

a) Gasto más alto = 2050 Uso de la Función MAX


Gasto más bajo = 180 Uso de la Función MIN

b)
Los tres pasos necesarios para definir las clases o intervalos de una distribución de frecuencia con datos
cuantitativos son los siguientes:
1. Determine el número de clases que no se superponen.
2. Defina el ancho de cada clase.
3. Determine los límites de clase.

No. de clases: uno lo decide


un criterio es √(2&25) "= 5 clases"
otro criterio es regla de sturges = 1 + 3.3log25 5.61320203

Sin embargo, como en el enunciado del problema se nos pide usar un ancho de
clase de $ 250, pues lo usaremos para obtener el número de clases NC
Sin embargo, como en el enunciado del problema se nos pide usar un ancho de
clase de $ 250, pues lo usaremos para obtener el número de clases NC

Ancho de clase: el enunciado pide usar $250

Límites de clase: nos apoyamos de la fórmula


Ancho de clase aproximado = (valor de datos mayor - valor de datos men
250 = (2050 - 180)/ NC
Despejamos
250 = 1870 / NC
NC = 1870/250
NC = 7.48, aprox 8, formaremos entonces 8 clases o interv

No olvidar que la primera clase o clase menor debe con


y de que la última clase o clase mayor deberá contener

Gastos $ CLASES
min 180 [180,430]
(430, 680]
(680, 930]
(930, 1180]
(1180, 1430]
(1430, 1680]
(1680, 1930]
(1930, 2180] max 2050

Para formar la tabla de Frecuencias porcentuales


copiamos las columnas de Gastos y de Frecuencias
Gastos $ Frecuencias Frec Porcentual
[180,430] 8 32
(430, 680] 5 20
(680, 930] 6 24
(930, 1180] 2 8
(1180, 1430] 1 4
(1430, 1680] 1 4
(1680, 1930] 1 4
(1930, 2180] 1 4
totales 25 100
c) HISTOGRAMA y forma que tiene

Histograma
9
8
7
6
5
4
3
2
1
0

Dado que la primera barra es la de mayor frecuencia y el resto están hacia su derecha
se concluye que la distribución de los datos es asimétrica positiva o sesgada hacia la derecha.

d) Observaciones sobre los gastos vacacionales


Gastos $ Frecuencias Frec Porcentual
[180,430] 8 32
El 76% de los vacacionistas
(430, 680] 5 20 consumió hasta $930
(680, 930] 6 24
(930, 1180] 2 8
(1180, 1430] 1 4
(1430, 1680] 1 4 El 24% de los vacacionistas
consumió más de $930 y
(1680, 1930] 1 4 hasta $2,050
(1930, 2180] 1 4
totales 25 100

COMPARE SUS RESULTADOS CONTRA LOS QUE PROPORCIONAN


LOS AUTORES DEL LIBRO. HAGA SUS COMENTARIOS

ASIGNACIÓN (tarea)

Resolver problemas 21 y 44 del libro # 1


WEB archivo Problema 21 de página 48
Computer
WEB archivo Problema 44 de página 68
Population

COMENTARIOS:

Para elaborar una Curva de Frecuencias hay que insertar una GRÁFICA DE LÍNEA

9 Gráfi ca de línea o Curva de Frecuencias


8
7
6
5
4
3
2
1
0
[180,430] (430, 680] (680, 930] (930, 1180] (1180, 1430] (1430, 1680] (1680, 1930] (1930, 2180]

¿Cómo sería la curva de frecuencia de una Distribución Simétrica?

Veamos un ejemplo:
Lím Superior Frecuencia Frecuencia
20
478 2
18 18
578 4
16
678 7 15 15
14
778 11
12
878 15 11
10
978 18
8
1078 15 7
6
1178 11
4 4
1278 7
22
1378 4
0
1478 2 478 578 678 778 878 978 1078

Nota:
Cuando la distribución de datos es simétrica
la curva de frecuencia forma una especie de
campana, conocida como Curva de Gauss, la cual
utilizaremos en la Distribución Normal Z
Nota:
Cuando la distribución de datos es simétrica
la curva de frecuencia forma una especie de
campana, conocida como Curva de Gauss, la cual
utilizaremos en la Distribución Normal Z

Aunque no se solicitaron en el ejemplo, veremos las Distribuciones acumuladas y grá

Recordando la definición de Ojiva


Una Ojiva es la gráfica de una distribución acumulada y muestra los valores de datos(límites
superiores) sobre el eje horizontal, y ya sea las frecuencias acumuladas, las frecuencias relativas
acumuladas o las frecuencias porcentuales acumuladas, sobre el eje vertical.
Los puntos trazados se conectan por medio de líneas rectas para completar la ojiva.

Retomando la tabla generada anteriormente, procedemos a generar las distribuciones


acumuladas, relativa y porcentual:

Limite Superior Frecuencias Frec Porcentual Frec. Acum Porc Acum


430 8 32 8 32
680 5 20 13 52
930 6 24 19 76
1180 2 8 21 84
1430 1 4 22 88
1680 1 4 23 92
1930 1 4 24 96
2180 1 4 25 100
totales 25 100

TENER PRESENTE QUE PARA GRAFICAR OJIVAS SE REQUIERE


CONSIDERAR UNA PRIMERA CLASE FICTICIA CON FRECUENCIA
DE "CERO" PARA QUE LA CURVA INICIE EN EL EJE HORIZONTAL
Por razones obvias el límite superior de esa clase ficticia deberá tener
el valor del límite inferior de la primera clase o clase menor, que en este
caso es 180
Una vez lista la tabla acumulativa, procedemos a generar una GRÁFICA DE LÍNEA

GASTOS No. acum de


$$$ VACACIONISTAS
Ojiva de Gastos contra No. acum
Limite Superior Frec. Acum de vacacionistas
180 0 30
430 8
25
680 13
930 19 20
1180 21
15
1430 22
1680 23 10
1930 24
5
2180 25
0
180 430 680 930 1180 1430 1680 1930

GASTOS % acum de
$$$ VACACIONISTAS
Ojiva de Gastos contra Porcentaje
Limite Superior Porc Acum
acumulado de vacacionistas
180 0 120

430 32 100
680 52
930 76 80

1180 84 60
1430 88
1680 92 40
1930 96
20
2180 100
0
180 430 680 930 1180 1430 1680 1930
ón de frecuencia con datos

ge.

nco o seis clases para resumir los

ro no demasiadas si sólo se tienen

n es el número

gn
ro no demasiadas si sólo se tienen

n es el número

gn

número de clases

a un valor más
ón de frecuencia.

inadecuadas

e.

se inferior y

atos cuantitativos

untos.
medio de un
ante una

ntal y la

indica con el
e el eje
orcentual

os histogramas.
e todos los valores
sibles.
acerca de la
o sesgada hacia

ar de los datos

ibución de
ión de
ar de los datos

ibución de
ión de
es o iguales que

os sobre el eje
s o las
Spending WEB archivo
astos vacacionales 1200 Holiday
tes indican 450
1780
800
1450
850
890
180
1090
cia y una distribución 280
740
260
850
510
1120
590
610
2050
520
ución de frecuencia con datos 200
340
350
770
220
350
conteo rápido 25 OK
aprox=6 clases

r un ancho de
es NC
r un ancho de
es NC

mayor - valor de datos menor) / número de clases

s entonces 8 clases o intervalos

se o clase menor debe contener al dato de menor valor


e mayor deberá contener al dato de mayor valor.

Limite Superior Frecuencias PROCEDIMIENTO DE USO FUNCIÓN FRECUENCIA (6


pasos)
430 8 1.- Escribir lista o columna de los límites
680 5 superiore de cada clase.
2.- En la celda donde irá el valor de la frecuencia
930 6 de la primera clase o clase menor hay que
1180 2 escribir la fórmula o función FRECUENCIA
1430 1 =FRECUENCIA(seleccionar los
datos,seleccionar las
1680 1 celdas que contienen los límites superiores
1930 1 de clase, más una celda adicional)
3.- Pulsar ENTER y aparecerá solamente el valor
2180 1 de la frecuencia de la primera clase.
0 4.- Seleccionar todas las celdas de la columna
Frecuencias, más una celda adicional.
25 5.- Pulsar la tecla F2
6.- Pulsar la combinación de teclas
ctrl + shift(o mayúsculas)+ ENTER
y entonces ya aparecerá el resto de los
valores de frecuencia.

Se podrá observar que con este último paso la


fórmula de la FRECUENCIA se coonvirtió en
tipo "matriz", porque queda entre llaves { }

NO OLVIDAR VERIFICAR QUE LA SUMA DE


FRECUENCIAS SEA IGUALAL NÚMERO DE DATOS
Para formar el histograma podemos intentar la opción de
insertar dicho diagrama, pero si nofunciona bien, entonces está
la opción de insertar una gráfica de barras y luego proceder a
eliminar la separación entre dichas barras, de la siguiente
manera
Dar doble clic en cualquiera de las barras y aparecerá una
ventana para darle Formato de Serie de Datos:
Hay que indicar 0% en las opciones: Superposición de series y
en Ancho de rango

cia la derecha.

de los vacacionistas
mió hasta $930

% de los vacacionistas
umió más de $930 y
a $2,050
GRÁFICA DE LÍNEA

Curva de Frecuencias
(con límites superiores)

6
5

2
1 1 1 1

430 680 930 1180 1430 1680 1930 2180

Frecuencia
18

15 15

11 11

4
2

778 878 978 1078 1178 1278 1378 1478


nes acumuladas y gráficas Ojivas

s de datos(límites
frecuencias relativas
l.
la ojiva.

nerar las distribuciones

ECUENCIA
RIZONTAL
GRÁFICA DE LÍNEA

s contra No. acumulado


vacacionistas Algunas interpretaciones sobre la gráfica:
DARLE CLIC SOBRE LA CURVA PARA QUE
SE MUESTRE INFORMACIÓN NUMÉRICA
Por ejemplo:
19 vacacionistas gastaron entre $180 y hasta $930;
22 vacacionistas gastaron entre $180 y $1430;..........
......los 25 vacacionistas gastaron entre $180 y $2180

0 1430 1680 1930 2180

Algunas interpretaciones sobre la gráfica:


ntra Porcentaje DARLE CLIC SOBRE LA CURVA PARA QUE
vacacionistas SE MUESTRE INFORMACIÓN NUMÉRICA
Por ejemplo:
el 84% de los vacacionistas gastaron entre $180 y
$1,180;
el 32% de los vacacionistas gastaron entre $180 y
$430;..................
........ningún vacacionista gastó más de $2,180

1430 1680 1930 2180

También podría gustarte