Está en la página 1de 43

Probabilidad y

Estadística
CLASE 3
PRESENTACIÓN DE DATOS
TABLA DE DISTRIBUCIÓN
Ing. Freddy Girón A. DE FRECUENCIAS
Presentación de Datos
◼ La presentación de datos es importante
ya que una vez que se han reunido los
valores, deben presentarse de forma tal
que pueda observarse cualquier patrón
significativo o desviaciones atípicas
◼ Esto se hace mediante el uso de
técnicas que presenten la información
de los conjuntos de datos en forma
resumida
Presentación de datos…
◼ Al analizar un conjunto de datos, primero
se debe determinar si se tiene una
muestra o una población completa

◼ Entre las herramientas estadísticas que


resultan de particular utilidad para
organizar los datos se incluyen:
Herramientas Estadísticas
◼ Tablas de frecuencia que colocan todos los
datos en clases específicas
◼ Diversos gráficos que pueden proporcionar
una representación visual de los datos
◼ Tablas de contingencia y diagramas de
“tallo y hoja”, los cuales también permiten
la presentación de un conjunto grande de
datos de manera concisa y discernible
Métodos de Agrupación de Datos

◼ Pueden utilizarse varias herramientas


básicas para describir y resumir un
conjunto grande de datos

◼ La manera más simple, pero quizá la


más significativa es la

SERIE ORDENADA
Métodos de Agrupación de Datos
Ejemplo de serie ordenada:
◼ Los punteos en los exámenes cortos de Luis
Castro fueron:
 75, 73, 91, 83, 80
 La serie ordenada sería: 73, 75, 80, 83 y 91

◼ Esta serie proporciona los valores extremos


pero posee una utilidad limitada

◼ La diferencia entre el valor menor y el mayor se


llama rango:
 91-73 = 18
Distribuciones de Frecuencia
◼ Una distribución es un conjunto, arreglo
o grupo de valores numéricos

◼ Al resumir grandes colecciones de


datos es útil distribuirlos en clases o
categorías, y determinar el número de
individuos que pertenecen a cada clase
(número de ocurrencias), llamado
frecuencia de clase
Distribución de frecuencias…

◼ Una distribución de frecuencias es una


lista de clases o categorías de datos
junto con el número de valores que
caen dentro de cada una de las
frecuencias
Distribución de frecuencias…
◼ Cuando van a representarse datos cualitativos,
las categorías se enumeran en orden de
magnitud: la categoría con la frecuencia mayor
se enumera primero, y así sucesivamente

◼ Ejemplo: Colores Favoritos (Nominales)


COLOR FRECUENCIAS
Rojo 12
Verde 8
Azul 8
Amarillo 4
32
Distribución de frecuencias…
◼ Cuando los datos que quieren representarse
son de carácter ordinal, la tabla se “ordena”
según la afirmación de interés

◼ Ejemplo: Hasta qué grado está de acuerdo


con…
REACCIÓN FRECUENCIAS
Completamente de acuerdo 12
De acuerdo 35
Neutral o no opina 27
En desacuerdo 10
Completamente en desacuerdo 2
86
8 PASOS
Tabla de Distribución de Frecuencias
PASO PREVIO: DISCRIMINACIÓN DE DATOS (*)
PASO 1: DECIDIR NÚMERO DE CLASES
PASO 2: ESTABLECER AMPLITUD E INTERVALO DE
CLASE
PASO 3: LÍMITES DE CLASE NOMINALES O APARENTES.
ESCOGER LÍMITE INFERIOR APARENTE DE LA 1ª CLASE
PASO 4: LÍMITES DE CLASE REALES O FRONTERAS
PASO 5: MARCAS DE CLASE
PASO 6: FRECUENCIAS ABSOLUTA Y %
PASO 7: FRECUENCIA ACUMULADA Y %
PASO 8: REVISAR,INTERPRETAR, CONCLUIR,
RECOMENDAR
Tabla de distribución de
frecuencias ya completada:
1 2 3 4 5 6 7 8
LÍMITES FRECUENCIAS
LÍMITES REALES MARCAS DE % FRECUENCIAS FRECUENCIAS % FRECUENCIAS
NO. CLASE APARENTES O DE CLASE O
O FRONTERAS CLASE ABSOLUTAS ACUMULADAS ACUMULADAS
NOMINALES ABSOLUTAS
1 50-59 49.5-59.5 54.5 2 5% 2 5%
2 60-69 59.5-69.5 64.5 6 14% 8 19%
3 70-79 69.5-79.5 74.5 8 19% 16 38%
4 80-89 79.5-89.5 84.5 12 29% 28 67%
5 90-99 89.5-99.5 94.5 9 21% 37 88%
6 100-109 99.5-109.5 104.5 5 12% 42 100%
42
Tabla de Distribución de Frecuencias
◼ Paso previo: discriminar los datos para
lo cual deben ordenarse en forma
ascendente para analizar especialmente
el valor menor y el mayor. También una
gráfica de los datos originales puede ser
de mucha ayuda o instrucciones
específicas que se proporcionen. Se
trata de identificar datos “atípicos”
porque se desvían mucho de los demás
y por lo tanto deben excluirse del
análisis
Tabla de Distribución de Frecuencias
◼El primer paso para
construir una distribución de
frecuencias para datos
cuantitativos es decidir el
número de clases
◼ Columna 1 en la tabla de frecuencias
Tabla de Distribución de Frecuencias

◼ Como regla práctica el número de clases


elegida puede variar desde 5 hasta 20
◼ Cuanto mayor sea la cantidad de datos,
tanto mayor será el número de clases
◼ Si hubieren indicaciones especiales
tendrán prioridad al determinar el
número de clases, ejemplo: nunca se
han elaborado tablas con más de 5 clases
Guía general para la determinación
del número de clases
Existen otros criterios:
Número de Número de a) Número de clases = (n)
observaciones, n clases
n < 30 5 b) Número de clases =
30 ≤ n < 60 6 1 + 3.32 log n
60 ≤ n < 130 7
130 ≤ n < 250 8 c) 2c ≥ n, c = número
250 ≤ n < 500 9 de clases
500 ≤ n < 1000 10
30 ≤ n < 2000 11 n = número de datos de la
30 ≤ n < 4000 12 muestra (después de la
discriminación)
30 ≤ n < 8000 13
8000 ≤ n 14 ** USAREMOS b) y c) ; escoger
el mayor número de clases que
se obtenga con esos cálculos
Tabla de distribución de frecuencias
◼ El segundo paso es establecer el tamaño o
amplitud de cada clase y el intervalo o
anchura de cada clase. En general, las
distribuciones de frecuencias se construyen
usando clases con amplitudes iguales

◼ La amplitud de la clase se puede determinar


encontrando la diferencia entre el dato* más
grande y el dato* más pequeño y dividiendo
entre el número de clases que se requiere

*Después de la discriminación
Tabla de distribución de frecuencias
◼ Elintervalo de clase o anchura de
clase es igual a la amplitud de la
clase pero ya redondeado

◼ Intervalo:
si al hacer la tabla no
pueden incluirse todos los datos,
se prefiere ampliar el intervalo para
no aumentar clases y redondear a
número entero
Tabla de distribución de frecuencias
El tercer paso
LÍMITES DE CLASE
NOMINALES O APARENTES
◼ Los límites de clase inferiores aparentes son
los números más pequeños que pueden
pertenecer a cada una de las diferentes clases
◼ Los límites de clase superiores aparentes son
los números más grandes que pueden
pertenecer a cada una de las diferentes clases
◼ Decimales: igual cantidad de decimales
que los datos originales
◼ Columna 2 en la tabla de frecuencias
Tabla de distribución de frecuencias
◼ Comenzamos con seleccionar el límite inferior
aparente de la primera clase y encontrar los otros
límites. Puede ser el valor más bajo (de los datos
discriminados) si es un dato usual o lógico, de lo
contrario escoger un valor conveniente que será un
poco menor (número entero y/ó múltiplo de 10 o
múltiplo de 5). Este valor servirá como punto de
partida
◼ EJEMPLOS:
❖ PROBAR APROXIMAR A UN NÚMERO MENOR AL
DATO ORIGINAL Y QUE SEA MÚLTIPLO DE 10 ó 5:
52 A 50, 5.3 A 5.0, 62.50 A 60.00
❖ SI CON LO ANTERIOR NO SE OBTIENE UN NÚMERO
LÓGICO, APROXIMAR A UN NÚMERO QUE TERMINE
ENTERO: 3.2 A 3.0, 3.24 A 3.00, 10.87 A 10.00
Tabla de distribución de frecuencias

◼ Luego sume el valor del intervalo de


clase al punto de partida para
obtener el límite inferior aparente de
la segunda clase. Sume el valor del
intervalo de clase al límite inferior
de la segunda clase para obtener el
de la tercera, y así sucesivamente.
Tabla de distribución de frecuencias
El cuarto paso:
LÍMITES DE CLASE
REALES,EXACTOS O FRONTERAS

◼ Las fronteras de clase son los números que se


usan para separar las clases, pero sin los
espacios creados por los límites de clase
(aparentes)

❑ Columna 3 en la tabla de frecuencias


Tabla de distribución de frecuencias
◼ Las fronteras se obtienen de la siguiente forma:
determine el tamaño del espacio entre el límite
superior aparente de una clase y el límite inferior
aparente de la siguiente clase. Sume la mitad de
esa cantidad a cada límite de clase superior
aparente para obtener las fronteras de clase
superiores; reste la mitad de esa cantidad a cada
límite de clase inferior aparente para obtener las
fronteras de clase inferiores.

Decimales: un decimal más que los datos originales


Tabla de distribución de frecuencias
◼ El quinto paso: marcas de clase
◼ MARCAS DE CLASE: son los puntos medios
de las clases:

◼ Se calculan sumando el límite de clase


inferior al límite de clase superior
correspondiente y dividiendo la suma entre 2
◼ Decimales: un decimal más que los datos
originales

◼ Columna 4 en la tabla de frecuencias


Tabla de distribución de frecuencias
◼ El sexto paso: Frecuencia de clase o
frecuencia absoluta y su %
◼ La frecuencia de clase o absoluta se refiere al
número de mediciones que caen en una clase
particular
◼ El % de frecuencia absoluta es la frecuencia
absoluta /(número de datos) x 100
◼ Columnas cinco y seis
◼ Decimales: sin decimales a menos
que sea necesario para
tomar decisiones
Tabla de distribución de frecuencias
◼ El séptimo paso: Frecuencia acumulada y
frecuencia acumulada en %
◼ La distribución de frecuencias acumuladas
muestra el número total de ocurrencias que son
menores o mayores que ciertos valores clave.
facumulada i = fi + fi anterior
% facumulada i = facumulada i *100 / n
❑ Columnas siete y ocho
❑ Decimales: sin decimales a menos
que sea necesario para tomar decisiones
Tabla de distribución de frecuencias
◼ El octavo paso:
❖ REVISAR LA TABLA: DEBE SER ÚTIL,
COMPRENSIBLE, “AMIGABLE”
❖ INTERPRETAR, CONCLUIR, RECOMENDAR
1 2 3 4 5 6 7 8
LÍMITES FRECUENCIAS
LÍMITES REALES MARCAS DE % FRECUENCIAS FRECUENCIAS % FRECUENCIAS
NO. CLASE APARENTES O DE CLASE O
O FRONTERAS CLASE ABSOLUTAS ACUMULADAS ACUMULADAS
NOMINALES ABSOLUTAS
1 50-59 49.5-59.5 54.5 2 5% 2 5%
2 60-69 59.5-69.5 64.5 6 14% 8 19%
3 70-79 69.5-79.5 74.5 8 19% 16 38%
4 80-89 79.5-89.5 84.5 12 29% 28 67%
5 90-99 89.5-99.5 94.5 9 21% 37 88%
6 100-109 99.5-109.5 104.5 5 12% 42 100%
42
Ejemplo:
◼ Dada la siguiente distribución de
salarios semanales, en dólares $,
construya una tabla de distribución
de frecuencias e identifique:
1. El valor menor del conjunto de datos
2. El valor mayor del conjunto de datos
3. El número de clases
4. La amplitud de la clase
5. El intervalo de clase
Ejemplo:
6. Límites de clase inferiores
7. Límites de clase superiores
8. Fronteras de clases
9. Marcas de clase
10. Determine las frecuencias absolutas de clase y
sus porcentajes
11. Determine las frecuencias acumuladas y sus
porcentajes
12. Conclusiones, recomendaciones
Ejemplo: Distribución de salarios
en $ semanales
80 52 92 75 82 96
70 90 69 83 94 67
61 96 88 63 78 83
85 75 81 73 97 109
100 85 95 88 98 78
98 76 100 58 108 89
88 64 81 70 105 64 203

SON LOS SALARIOS SEMANALES


DE 43 TRABAJADORES
Solución:
◼ ORDENANDO LOS DATOS (SOLO SE MUESTRAN
LOS PRIMEROS DATOS Y LOS ÚLTIMOS)
52 96
58 97
61 98
63 98
64 100
64 100
67 105
69 108
70 109
203
1. Valor menor: 52
2. Valor mayor: 109
Se discriminó 203 (explicar porqué)
Solución:
3. Número de clases: PRIMER PASO
◼ El total de datos es de 42

◼ Usaremos para decidir las fórmulas que aparecen en la


diapositiva 16:
 Número de clases = 1 + 3.32 log n
= 1 + 3.32 log 42
= 6.39, APROX. 6

❑ 2c ≥ n 26 = 64 25 = 32 26 ≥ 42

6 CLASES (si tuviéramos resultados diferentes,


escogeríamos el valor mayor)
Solución:
4. La amplitud de la clase: SEGUNDO PASO

“ diferencia entre el valor más grande y el más pequeño y


dividiéndolo entre el número de clases que se
requiere”

 (109-52)/6 = 9.5

Amplitud de la clase: 9.5

5. Intervalo de clase: SEGUNDO PASO. Es la amplitud de


la clase pero ya con el redondeo a número entero = 10
Solución:

6. Límites de clase inferiores:


7. Límites de clase superiores:
8. Fronteras de clase:
9. Marcas de clase:

◼ Para encontrar estos valores primero hay que


seleccionar el límite inferior de la primera
clase y después todos los demás límites
Solución:
◼ Para encontrar estos valores primero hay que
seleccionar el límite inferior de la primera clase y
después todos los demás límites
Tercer paso
◼ Seleccionar el límite inferior aparente de la primera
clase y encontrar los otros límites aparentes.
Puede ser el valor más bajo (de los datos discriminados)
si es un dato usual o lógico, de lo contario escoger un
valor conveniente que será un poco menor (número
entero y/ó múltiplo de 10 o múltiplo de 5). Este valor
servirá como punto de partida

El valor más bajo es 52 pero es más conveniente


escoger un valor “más usual” como el 50 (múltiplo de 10
y múltiplo de 5). SIEMPRE USAR ESTE CRITERIO
Solución:
◼ Luego sume el valor del intervalo de clase
al punto de partida para obtener el límite
inferior de la segunda clase. Sume el valor
del intervalo de clase al límite inferior de la
segunda clase para obtener el de la tercera, y
así sucesivamente

◼ Punto de partida: 50
◼ Intervalo de clase o anchura: 10
◼ La suma nos dará el límite inferior de la
segunda clase: 50 + 10 = 60
Solución:
◼ Luego sume el valor del intervalo de clase
al punto de partida para obtener el límite
inferior de la segunda clase. Sume el valor
del intervalo de clase al límite inferior de la
segunda clase para obtener el de la tercera, y
así sucesivamente Las clases deben estar
organizadas de manera que
sus límites no se traslapen
◼ PRIMERA CLASE: 50 A 59 (es decir, las clases son
mutuamente excluyentes).

◼ SEGUNDA CLASE: 60 A 69 y así


sucesivamente hasta llegar a la última clase:

◼ ÚLTIMA CLASE: 100 A 109


Solución:
6. Límites de clase inferiores aparentes:
“Los límites de clase inferiores son
1 2
los números más pequeños que pueden NO. CLASE
LÍMITES
APARENTES O

pertenecer a cada una de las diferentes clases” 1 NOMINALES


50-59
2 60-69
50, 60, 70, 80, 90, 100 3 70-79
4 80-89
5 90-99
6 100-109

7. Límites de clase superiores aparentes:


“Los límites de clase superiores son los números más
grandes que pueden pertenecer a cada una de las
diferentes clases
59, 69, 79, 89, 99, 109
Solución:
8. Fronteras de clase o límites reales:
Cuarto Paso
“Las fronteras se obtienen de la siguiente forma: determine el
tamaño del espacio entre el límite superior aparente de una
clase y el límite inferior aparente de la siguiente clase. 1
“ 2 3
PARA LA PRIMERA CLASE: LÍMITES
LÍMITES REALES
NO. CLASE APARENTES O
59 – 60 = - 1 (valor absoluto = 1) NOMINALES
O FRONTERAS

Sume la mitad de esa cantidad a cada límite 1 50-59 49.5-59.5


2 60-69 59.5-69.5
de clase superior aparente para obtener 3 70-79 69.5-79.5
las fronteras de clase superiores; 59 + ½ = 59.5 4 80-89 79.5-89.5
5 90-99 89.5-99.5
Reste la mitad de esa cantidad a cada límite 6 100-109 99.5-109.5
de clase inferior aparente para obtener
las fronteras de clase inferiores. 50 – ½ = 49.5

49.5, 59.5, 69.5, 79.5, 89.5, 99.5, 109.5


Solución:
9. Marcas de clase: Quinto Paso
“Se pueden calcular sumando el límite de clase
inferior al límite de clase superior correspondiente y
dividiendo la suma entre 2“
PARA LA PRIMERA CLASE: 50 A 59
(50 + 59 ) / 2 = 54.5 1
LÍMITES
2 3 4

LÍMITES REALES MARCAS DE


NO. CLASE APARENTES O
O FRONTERAS CLASE
NOMINALES
1 50-59 49.5-59.5 54.5
2 60-69 59.5-69.5 64.5
3 70-79 69.5-79.5 74.5
4 80-89 79.5-89.5 84.5
5 90-99 89.5-99.5 94.5

TODAS LAS MARCAS DE CLASE:


54.5, 64.5, 74.5, 84.5, 94.5, 104.5
Ejemplo:
LAS SIGUIENTES PREGUNTAS SE RESPONDEN
UTILIZANDO UNA TABLA (VER SIGUIENTE
DIAPOSITIVA) Sexto Y Séptimo Paso

10. Determine las frecuencias absolutas de clase y


sus porcentajes
11. Determine las frecuencias acumuladas y sus
porcentajes
Tabla de distribución de
frecuencias:
1 2 3 4 5 6 7 8
LÍMITES FRECUENCIAS
LÍMITES REALES MARCAS DE % FRECUENCIAS FRECUENCIAS % FRECUENCIAS
NO. CLASE APARENTES O DE CLASE O
O FRONTERAS CLASE ABSOLUTAS ACUMULADAS ACUMULADAS
NOMINALES ABSOLUTAS
1 50-59 49.5-59.5 54.5 2 5% 2 5%
2 60-69 59.5-69.5 64.5 6 14% 8 19%
3 70-79 69.5-79.5 74.5 8 19% 16 38%
4 80-89 79.5-89.5 84.5 12 29% 28 67%
5 90-99 89.5-99.5 94.5 9 21% 37 88%
6 100-109 99.5-109.5 104.5 5 12% 42 100%
Tabla de distribución de
frecuencias:
1 2 3 4 5 6 7 8
LÍMITES FRECUENCIAS
LÍMITES REALES MARCAS DE % FRECUENCIAS FRECUENCIAS % FRECUENCIAS
NO. CLASE APARENTES O DE CLASE O
O FRONTERAS CLASE ABSOLUTAS ACUMULADAS ACUMULADAS
NOMINALES ABSOLUTAS
1 50-59 49.5-59.5 54.5 2 5% 2 5%
2 60-69 59.5-69.5 64.5 6 14% 8 19%
3 70-79 69.5-79.5 74.5 8 19% 16 38%
4 80-89 79.5-89.5 84.5 12 29% 28 67%
5 90-99 89.5-99.5 94.5 9 21% 37 88%
6 100-109 99.5-109.5 104.5 5 12% 42 100%

Dada la siguiente distribución de salarios semanales, en dólares $,

OCTAVO PASO
Ing. Freddy Girón A.

También podría gustarte