Está en la página 1de 53

BIENVENIDOS A LA CLASE DE ESTADÍSTICA

TEMAS ANTERIORES

-Conceptos de estadística
-Estadística descriptiva y estadística
-Aplicación de la estadística
-conceptos: población, muestra, parámetro, dato
-Escalas de medición
-Variables
Estadísti
ca

Tabulación de datos
TABULACIÓN DE DATOS
DATOS EN BRUTO

Los datos en bruto son los datos recolectados que aún no se han
organizado. Por ejemplo, las estaturas de 100 estudiantes tomados de la
lista alfabética de una universidad.

Los datos en bruto son el material a trabajar para establecer la


estadística. De un adecuado uso de los datos y el establecimiento de
parámetros es lo que nos determina los datos estadísticos que son el
resultado del proceso.
ORDENACIONES

Ordenación se le llama a los datos numéricos en bruto


dispuestos en orden creciente o decreciente de magnitud.

A la diferencia entre el número mayor y el número menor se


le conoce como el rango de los datos. Por ejemplo, si la
estatura mayor en los 100 estudiantes es 1,80 m y la menor
es 1,60 m, el rango es 1,80 − 1,60 = 0,20 m.

El rango siempre es un valor positivo, al restarle a la


cantidad mayor la cantidad menor, no es posible que el
resultado sea negativo.
Los datos que se obtienen de la industria, comercio, salud,
etc. Suele ser una información voluminosa. Con una sola
variable pueden obtenerse muchos datos.
Una gran cantidad de datos puede ser una gran ayuda o puede
generar una gran confusión.
Los datos sin clasificar suelen no brindar ningún panorama o
no hacerlo de forma clara.
Para hacer útiles los datos es necesario agruparlos, clasificarlos
de forma tal que se vuelvan útiles, dado que se puedan
interpretar.
Es importante tratar de establecer en que valor o valores tienden a
concentrarse y como se dispersan o extienden.
El histograma es la forma gráfica para hacer este compendio
de datos.
Esta es una imagen de la distribución de frecuencias que es un
resumen de cómo los datos se presentan dentro de cada
subdivisión de valores observados.

El diagrama de frecuencia o cualquier método de clasificar


los datos brutos u ordenados, siempre brinda una mejor
visualización de los datos, que es lo que permite hallar
resultados que son la esencia de la estadística.
Histograma
DISTRIBUCION DE FRECUENCIAS

DATOS SIN AGRUPAR

Los datos sin agrupar son una lista de valores


observados, mientras que los datos agrupados
representan una aglomeración de datos observados
semejantes. Los datos pueden ser discretos o
continuos.
Los datos desorganizados no tienen sentido, es
necesario un método para procesarlos.
Los siguientes datos corresponden a una
cantidad de defectuosos
0 130 100 10 15 41 2120
1 0 200 201 21 1 1 2 11
0 4 1 311 12 13 40000
1 30 1 2 2 3

En esta tabla no se puede comprender con


facilidad la información, dada la
desorganización, no porque un dato no
represente información.
Si llevamos la información a la frecuencia de cada valor

Defectuosos Frecuencia
0 15
1 20
2 8
3 5
4 3
5 1

TOTAL 52 DATOS

En esta tabla podemos apreciar la frecuencia de cada valor,


podemos decir que la cantidad de defectuosos que más se repite
es 1 y luego 0, que la cifra más alta de defectuosos que es 5, no
se encuentra sino 1 vez.
Para hacer la tabla tomamos los valores en orden ascendente y
tabulamos la frecuencia de cada resultado. Anotando en frente de
cada resultado una línea y tachando el valor en la lista original.

Aquí tenemos la información de una distribución de frecuencias,


se muestra la frecuencia de cada dato en cada categoría.

Este es un método sencillo para visualizar los datos y puede ser la


base para resolver problemas de calidad.

Estos mismos datos se presentan en una gráfica si se desean


visualizar más claramente.
EJERCICIOS PRACTICA

a)Disponer los números 17, 45, 38, 27, 6, 48, 11, 57, 34 y 22 en una
ordenación.
b) Determinar el rango de estos números

c) La siguiente es la tabla de calificaciones de 40 alumnos de una


universidad
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 73 82 87 62 59 65 82 73 60
66 57 88 71 78 63 79 65 86 61

a)Calificacion mas alta, b)calificacion mas baja, c)el rango, d)calificaciones de los 5
peores estudiantes, f)la calificación del alumno que tiene el decimo lugar entre las
mejores calificaciones, g)numero de estudiantes que obtuvieron 85 o menos
CONSTRUCCION DE UNA TABLA DE FRECUENCIAS

PASO 1:
Tener los datos tomados de una muestra, extraída de una
población
PASO 2:
Determinar el número n= número de datos
PASO 3:
Colocar verticalmente los datos referenciados como clase de
datos en un orden determinado (ascendente)
PASO 4:
Establecer las casillas de dato, frecuencia absoluta, frecuencia
acumulada, frecuencia relativa y frecuencia relativa acumulada
PASO 5:
Realizar el conteo o frecuencia de cada uno de estos datos de clase, esto
corresponde a lo que llamamos frecuencia absoluta
PASO 6:
Sumar el total de datos de las frecuencias absolutas y este debe coincidir
con el número n que es el total de los datos
PASO 7:
Calcular la frecuencia acumulada, que consiste en sumar las casillas
verticalmente, acumulando la suma
PASO 8:
Calcular la frecuencia relativa, que consiste en dividir el
número de la frecuencia relativa entre el total de datos n. Si
multiplicamos por 100 la frecuencia relativa obtenemos el
valor porcentual de esa frecuencia relativa. A esta se le suele
llamar frecuencia porcentual.
PASO 9:
Calcula la frecuencia relativa acumulada, que consiste
exactamente en la misma acumulación que se hizo para la
frecuencia. Si estuviéramos acumulando las frecuencias
porcentuales, el acumulado debe dar 100%, si estuviéramos
sumando las frecuencias relativas acumuladas este resultado
debe ser 1.
DISTRIBUCIONES DE FRECUENCIA

Al organizar una gran cantidad de datos en bruto, suele resultar


útil distribuirlos en clases o categorías y determinar la cantidad
de datos que pertenece a cada clase; esta cantidad se conoce
como la frecuencia de clase.
A la disposición tabular de los datos en clases con sus
respectivas frecuencias de clase se le conoce como
distribución de frecuencias o tabla de frecuencias.
La tabla 2.1 es una distribución de frecuencias de las estaturas
(registradas al cm. más cercano) de 100 estudiantes de la
universidad XYZ.
TABLA 2.1
Tabla de estaturas de 100 mujeres
estudiantes de la universidad XYZ

Estatura (m) Cantidad de


estudiantes

1,60-1,62 5
1,62-1,64 18
1,64-1,66 42
1,66-1,68 27
1,68-1,70 8

Total 100
La primera clase (o categoría), por ejemplo, consta de las
estaturas que van desde 1,60 hasta 1,62 m. y queda
identificada por el símbolo 60-62
Como hay cinco estudiantes cuyas estaturas pertenecen a
esta clase, la frecuencia de clase correspondiente es 5.
A los datos organizados y resumidos como en la distribución
de frecuencias anterior se les llama datos agrupados.
Aunque al agrupar los datos se pierden muchos de los
detalles originales de los datos, esto tiene la ventaja de que
se obtiene una visión general clara y se hacen evidentes las
relaciones.
INTERVALOS DE CLASE Y LÍMITES DE CLASE
Al símbolo que representa una clase, como 1,60-1,62 en la
tabla, se le conoce como intervalo de clase. A los números de
los extremos, 1,60 y 1,62, se les conoce como límites de clase;
el número menor (1,60) es el límite inferior de clase, y el
número mayor (1,62) es el límite superior de clase. Los
términos clase e intervalo de clase se suelen usar
indistintamente, aunque el intervalo de clase en realidad es un
símbolo para la clase.
Un intervalo de clase que, por lo menos teóricamente, no tenga
indicado el límite de clase superior o el límite de clase inferior,
se conoce como intervalo de clase abierto. Por ejemplo, al
considerar grupos de edades de personas, un intervalo que sea
“65 años o mayores” es un intervalo de clase abierto.
LÍMITES DE CLASE

Si las estaturas se registran al centímetro más cercano, el intervalo de


clase 1,60-1,62 comprende teóricamente todas las mediciones desde 1,60
hasta 1,6199 m. Estos números que se indican brevemente mediante los
números exactos, el 1,62 no se tomaría, dado que el límite superior es
común que se deje abierto.

El limite inferior es 1,60 cerrado, es decir, se toman lo valores que sean


1,60. El límite superior es 1,62 pero es abierto luego los valores de 1,62 no
se toma en este intervalo y se toman en el siguiente.
TAMAÑO O AMPLITUD DE UN INTERVALO DE CLASE
El tamaño, o la amplitud, de un intervalo de clase es la
diferencia entre sus fronteras superior e inferior y se le conoce
también como amplitud de clase, tamaño de clase o longitud
de clase.
Si en una distribución de frecuencia todos los intervalos de clase
tienen la misma amplitud, esta amplitud común se denota c. En
este caso, c es igual a la diferencia entre dos límites inferiores
de clases sucesivas o entre dos límites superiores de clases
sucesivas.
Por ejemplo, en los datos de la tabla, el intervalo de clase es c
= 1,62 − 1,60 = 2.
LA MARCA DE CLASE
La marca de clase es el punto medio del intervalo de
clase y se obtiene sumando los límites de clase inferior
y superior y dividiendo entre 2. Así, la marca de clase
del intervalo 1,60-1,62 es (1,60 + 1,62) /2 = 1,61. A la
marca de clase también se le conoce como punto
medio de clase.
Para los análisis matemáticos posteriores, se supone
que todas las observaciones que pertenecen a un
intervalo de clase dado coinciden con la marca de
clase. Así, se considera que todas las estaturas en el
intervalo de clase 1,60-1,62 m son de 1,61 m.
REGLAS GENERALES PARA FORMAR UNA DISTRIBUCIÓN DE FRECUENCIAS

1. En el conjunto de los datos en bruto, se determina el número mayor y


el número menor y se halla, así, el rango (la diferencia entre los números
mayor y menor).
2. Se halla el número de clases en que deseamos dividir ese rango, para
ese efecto se halla el número K (número de clases) por medio de hallar la
raíz cuadrada del número n de datos o por medio de la regla de Sturgess
Mediante la fórmula K = 1 + 3,322 (log n). Luego se halla la amplitud de
cada clase al dividir el rango entre el número de clases K
Amplitud = rango / K.
3. Se determinan los intervalos clases.
DATOS AGRUPADOS
TABLA DE FRECUENCIAS POR INTERVALOS

La tabla de frecuencias por intervalos no


contempla que la clase sea un número
específicamente, sino que contempla un
intervalo, es decir, va desde una cifra hasta otra
cifra y contempla los datos que se hallen en este
espacio.

Las clases aquí deben hallarse y el procedimiento


para hacerlo contempla varios pasos a saber.
CONSTRUCCION DE UNA TABLA DE FRECUENCIAS AGRUPADA

PASO 1:
Tener los datos tomados de una muestra, extraída de una
población
PASO 2:
Determinar el número n= número de datos
PASO 3:
Determinar R o rango de la muestra, para calcular este se debe
obtener el número mayor de la muestra y el número menor de
la muestra.

R = número mayor – número menor


PASO 4
Se debe calcula K que es el número de clases o de intervalos que debe
contener la tabla. Este se puede obtener de manera sencilla calculando la
raíz cuadrada del número n o el total de datos
Otra forma de calcular K es por el método de Sturges, cuya fórmula es
K = 1 + 3.322 * log (n)
PASO 5:
Debemos calcular A, este valor corresponde al tamaño de cada intervalo
de clase, se obtiene dividiendo el rango R entre el número de clases K
A=R/K
PASO 6:
Debemos proceder a construir la tabla, en la primera casilla debemos
ubicar las clases, que deben iniciar con el valor más bajo del rango, hasta
ese valor más la amplitud A. La segunda casilla debe contemplar desde el
valor final de la clase anterior y este más la amplitud A. Así
sucesivamente hasta el número total de clases.
PASO 7:
Posteriormente se debe diligenciar la siguiente casilla que
corresponde a la marca de clase, este valor es el promedio
entre el valor superior (límite inferior) y el mayor valor
(límite superior)
PASO 8:
Luego debemos hacer el conteo de la frecuencia, es decir, el
número de datos que se encuentran para cada intervalo de
clase. El intervalo es cerrado en el límite inferior y abierto en
el superior, quiere decir que el valor igual al límite superior
no se cuenta en esa clase y se contempla par la siguiente.
Deben quedar registrados los datos en cada clase acorde con
la frecuencia absoluta.
PASO 9:
Debemos calcular la frecuencia acumulada que es la suma
acumulada de las frecuencias relativas, el número final de la
acumulación debe ser igual a n.
PASO 11:
Si se requiere hacer cálculos de medidas de tendencia central
(media, mediana, moda) se debe hacer una casilla de la
multiplicación de la marca de clase por la frecuencia
absoluta.
PASO 12:
Si se desea hacer cálculos de medidas de dispersión
(desviación, varianza, coeficiente de variación) se debe
agregar otra casilla)
TIPOS DE CURVAS DE FRECUENCIAS
Las curvas de frecuencias que surgen en la práctica toman ciertas formas características, como
las que se muestran en la figura 2-3.
TIPOS DE CURVAS de FRECUENCIAS
1. Las curvas simétricas o en forma de campana se caracterizan porque las
observaciones equidistantes del máximo central tienen la misma
frecuencia. Las estaturas tanto de hombres como de mujeres adultos
tienen distribuciones en forma de campana.
2. Las curvas que tienen colas hacia la izquierda se dice que son sesgadas
a la izquierda. Las curvas de la cantidad de años que viven hombres y
mujeres son sesgadas a la izquierda. Pocos mueren jóvenes y la mayoría
muere entre los 60 y los 80 años. En general, las mujeres viven en
promedio diez años más que los hombres.
3. Las curvas que tienen colas hacia la derecha se dice que son sesgadas a
la derecha. Las curvas de las edades a las que se casan tanto hombres
como mujeres son sesgadas a la derecha. La mayoría se casa entre los
veinte y treinta años y pocos se casan alrededor de cuarenta, cincuenta,
sesenta o setenta años.
4. Las curvas que tienen aproximadamente las mismas
frecuencias para todos sus valores se dice que son curvas
distribuidas uniformemente. Por ejemplo, las máquinas
dispensadoras de gaseosa lo hacen de manera uniforme entre 15.9
y 16.1 onzas.
5. Las curvas de frecuencias en forma de J o en forma de J
inversa son curvas en las que el máximo se presenta en uno de sus
extremos.
6. Las curvas de frecuencias en forma de U son curvas que tienen
un máximo en cada extremo y un mínimo en medio.
7. Las curvas bimodales son curvas que tienen dos máximos.
8. Las curvas multimodales tienen más de dos máximos.
ORDENACIONES

2.1
a) Disponer los números 17, 45, 38, 27, 6, 48, 11, 57, 34 y 22 en una
ordenación.
b) Determinar el rango de estos números.

SOLUCIÓN

a) En orden ascendente de magnitud, la ordenación es: 6, 11, 17, 22, 27,


34, 38, 45, 48, 57. En orden descendente de magnitud, la ordenación es:
57, 48, 45, 38, 34, 27, 22, 17, 11, 6.
b) Como el número mayor es 57 y el número menor es 6, el rango es 57 −
6 = 51.
Ejercicio: En la tabla siguiente se presentan las calificaciones
finales que obtuvieron en matemática 80 alumnos de una
universidad. Tabla 2.4

68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
De acuerdo con esta tabla, encontrar:
a) La calificación más alta.
b) La calificación más baja.
c) El rango.
d) ) Las calificaciones de los cinco mejores estudiantes.
e) Las calificaciones de los cinco peores estudiantes.
f ) La calificación del alumno que tiene el décimo lugar entre las mejores
calificaciones.
g) El número de estudiantes que obtuvieron 75 o más.
h) El número de estudiantes que obtuvieron 85 o menos.
i) El porcentaje de los estudiantes que obtuvieron calificaciones mayores
a 65 pero no mayores a 85.
j) Las calificaciones que no aparecen en esta tabla.
SOLUCIÓN

Como algunas de estas preguntas son tan minuciosas, es mejor construir


primero una ordenación. Esto se hace dividiendo los datos, de manera
adecuada, en clases y colocando cada número de la tabla en su clase
correspondiente, como se ve en la tabla 2.3, llamada tabla de entradas.
Después, los números de cada clase se disponen en una ordenación,
como se muestra en la tabla 2.4, con lo que se obtiene la ordenación
deseada. Consultando la tabla 2.4 es relativamente fácil responder a las
preguntas anteriores.
a) La calificación más alta es 97.
b) La calificación más baja es 53.
c) El rango es 97 − 53 = 44
d) ) Las calificaciones de los cinco mejores estudiantes son 97, 96, 95,
95 y 94.
50-54 53
55-59 59, 57
60-64 62, 60, 61, 62, 63, 60, 61, 60, 62, 62, 63
65-69 68, 68, 65, 66, 69, 68, 67, 65, 65, 67
70-74 73, 73, 71, 74, 72, 74, 71, 71, 73, 74, 73, 72
75-79 75, 76, 79, 75, 75, 78, 78, 75, 77, 78, 75, 79, 79, 78, 76, 75, 78, 76, 76, 75, 77
80-84 84, 82, 82, 83, 80, 81
85-89 88, 88, 85, 87, 89, 85, 88, 86, 85
90-94 90, 93, 93, 94
95-99 95, 96, 95, 97
50-54 53
55-59 57, 59
60-64 60, 60, 60, 61, 61, 62, 62, 62, 62, 63, 63
65-69 65, 65, 65, 66, 67, 67, 68, 68, 68, 69
70-74 71, 71, 71, 72, 72, 73, 73, 73, 73, 74, 74, 74
75-79 75, 75, 75, 75, 75, 75, 75, 76, 76, 76, 76, 77, 77, 78, 78, 78, 78, 78, 79, 79, 79
80-84 80, 81, 82, 82, 83, 84
85-89 85, 85, 85, 86, 87, 88, 88, 88, 89
90-94 90, 93, 93, 94
95-99 95, 95, 96, 97
e) Las calificaciones de los cinco peores estudiantes son 53, 57,
59, 60 y 60.
f ) La calificación del alumno que tiene el décimo lugar entre
las mejores calificaciones es 88.
g) La cantidad de estudiantes que obtuvieron 75 o más es 44.
h) La cantidad de estudiantes que obtuvieron menos de 85 es
63.
i) El porcentaje de estudiantes que obtuvieron calificaciones
mayores a 65 pero no mayores a 85 es 49/80 = 61.2%.
j) Las calificaciones que no aparecen en esta tabla son desde 0
hasta 52, 54, 55, 56, 58, 64, 70, 91, 92, 98, 99 y 100.
DISTRIBUCIONES DE FRECUENCIAS, HISTOGRAMAS Y POLÍGONOS DE
FRECUENCIAS

2.3La tabla 2.5 muestra una distribución de frecuencias de los salarios


semanales de 65 empleados de la empresa PQR. Con los datos de esta tabla,
determinar:

a) El límite inferior de la sexta clase.


b) El límite superior de la cuarta clase.
c) La marca de clase (o punto medio de clase) de la tercera clase.
d ) La frecuencia de la tercera clase.
e) La frecuencia relativa de la tercera clase.
f) El intervalo de clase de mayor frecuencia. A este intervalo se le suele
llamar intervalo de clase modal y a su frecuencia se le conoce como
frecuencia de la clase modal.
g) El porcentaje de empleados que gana menos de $280.00 por semana.
h) El porcentaje de empleados que gana menos de $300.00 por semana,
pero por lo menos $260.00 por semana.

Salarios Número de empleados

$250.00-$259.99 8
$260.00-$269.99 10
$270.00-$279.99 16
$280.00-$289.99 14
$290.00-$299.99 10
$300.00-$309.99 5
$310.00-$319.99 2
Total 65
SOLUCIÓN

a) $300.00.
b) $289.99.
La marca de clase (o punto medio de clase) de la tercera clase =
($270.00 + $279.99) = $274.995. Para propósitos prácticos, esta cantidad
se redondea a $275.00.
d) 16.
e) 16/65 = 0.246 = 24.6%.
f) $270.00 − $279.99.
g) El número total de empleados que gana menos de $280 por
semana = 16 + 10 + 8 = 34. El porcentaje de empleados que
gana menos de $280 por semana = 34/65 = 52.3%.
h) El número de empleados que gana menos de $300 por
semana pero más de $260 por semana = 10 + 14 + 16 + 10
= 50. El porcentaje de empleados que gana menos de $300 por
semana, pero por lo menos $260 por semana = 50/65
= 76.9%.
En la tabla siguiente se presentan los pesos, dados a la
libra más cercana, de 40 estudiantes de una universidad.
Elaborar una distribución de frecuencias.

138 164 150 132 144 125 149 157


146 158 140 147 136 148 152 144
168 126 138 176 163 119 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 128

a) Cuáles son los pesos mayor, menor y el rango


b) Cuáles son los intervalos aconsejables
En la tabla se dan las distancias, en kilometros, que recorren 50 estudiantes del Metropolitan
College de su casa a la universidad

a) ¿Cuáles son los valores que pertenecen a la primera clase?


b) ¿Cuáles son los valores que pertenecen a la segunda clase?
c) ¿Cuáles son los valores que pertenecen a la tercera clase?
d ) ¿Cuáles son los valores que pertenecen a la cuarta clase?
e) ¿Cuáles son los valores que pertenecen a la quinta clase?
f ) ¿Cuáles son los valores que pertenecen a la sexta clase?
g) ¿Cuáles son los valores que pertenecen a la séptima clase?
h) ¿Cuáles son los valores que pertenecen a la octava clase?
SOLUCIÓN

a) 0.9, 0.9, 1.0, 1.1, 1.4, 1.6, 1.9


b) 2.0, 2.0, 2.2, 2.4, 2.6, 3.0, 3.2, 3.3, 3.7, 3.8, 3.8, 3.9, 3.9
c) 4.0, 4.2, 4.3, 4.3, 4.4, 4.4, 4.6, 4.8, 4.8, 4.9, 5.0
d) 6.2, 6.5, 6.6, 7.0, 7.2, 7.7, 7.8
e) 8.0, 8.0, 8.0, 8.4, 8.7, 8.8
f ) 10.0, 10.3, 10.3
g) 12.3, 12.6
h) 15.7
DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS Y OJIVAS

Las ojivas son representaciones gráficas basadas en la


frecuencia absoluta acumulada o la frecuencia relativa
acumulada.

Se pueden dibujar uniendo los puntos medios superiores de


cada una de las barras, si previamente se realizó un
diagrama de barra.
Curvas ojivas
En la tabla 2.14 se presenta una distribución de frecuencias de la cantidad de minutos por semana que
ven televisión 400
estudiantes. De acuerdo con esta tabla, determinar:
a) El límite superior de la quinta clase.
b) El límite inferior de la octava clase.
c) La marca de clase de la séptima clase.
d) El tamaño del intervalo de clase.
f) La frecuencia de la cuarta clase.
g) La frecuencia relativa de la sexta clase.
h) El porcentaje de estudiantes que no ven televisión más de 600 minutos por semana.
i) El porcentaje de estudiantes que ven televisión 900 o más minutos por semana.
j) El porcentaje de estudiantes que ven televisión por lo menos 500 minutos por semana, pero menos
de 1 000 minutos
por semana.

También podría gustarte