Está en la página 1de 38

ESTADÍSTICA Y SU

CLASIFICACIÓN
ORDEN DE DATOS NUMÉRICOS

 La ordenación es el proceso mediante el cual los datos


están acomodados de tal manera que se establece un orden
(ascendente o descendente) entre ellos.

 Hay dos métodos comunes:


 Arreglo Ordenado.
 Método de Tallo y Hojas.

Cuando el número de datos es grande, es conveniente


organizar los datos numéricos
REDONDEO DE DATOS, NOTACIÓN CIENTÍFICA
Y CIFRAS SIGNIFICATIVAS.

Redondeo:
El redondeo de datos es un procedimiento
que consiste en escribir un número que
representa a una cantidad con menos cifras
de las que tiene realmente para tener una
idea rápida de la cantidad.
EJEMPLO

 Considera que la variable de estudio es el peso de 25


estudiantes. Los pesos se encuentran en la siguiente tabla:

Peso de 25 estudiantes (en kg)

40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
ARREGLO ORDENADO

 Un arreglo ordenado es una secuencia de datos ordenados


del menor al mayor valor.

Peso de 25 estudiantes (en kg) Peso de 25 estudiantes (en kg)

42 40 48 51 49 40 42 43 44 44
56 44 43 55 52
45 48 49 50 50
52 62 44 50 59
51 51 52 52 55
63 50 56 55 45 55 56 56 57 58
57 66 63 51 58
59 62 63 63 66
DIAGRAMA DE TALLO Y HOJAS

 Organiza los datos en grupos (llamados tallos), para que los


valores dentro de cada grupo (las hojas) ramifiquen hacia la
derecha de cada fila. El diagrama resultante permite ver cómo
se distribuyen y dónde están las concentraciones de datos.

 Para formar un diagrama de tallo y hojas se colocan los primeros


valores en orden ascendente. Se utiliza la columna de las
unidades como hojas.

 El ejemplo anterior queda:

4 0,2,3,4,4,5,8,9
5 0,0,1,1,2,2,5,5,6,6,7,8,9
6 2,3,3,6
DOBLE TALLO

 Una variante de este método es en lugar de dividir en un


grupo las decenas, se divide en dos grupos. El primero
abarcando los dígitos del 0 al 4 y el segundo del 5 al 9.

 El ejemplo anterior
queda:

4 0,2,3,4,4
4 5,8,9
5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6
TABLAS Y GRÁFICAS PARA DATOS
NUMÉRICOS
 Cuando tenemos un conjunto de datos muy grande, a menudo
se dificulta llegar a conclusiones con base en un arreglo
ordenado o en un diagrama de tallo y hojas. En tales
circunstancias es necesario usar tablas y gráficas.

 Entre ellas se incluyen:


 Distribuciones de frecuencia y de porcentaje
 Histograma
 Polígono de frecuencias
 Polígono de porcentaje acumulado (ojiva)
DISTRIBUCIÓN DE FRECUENCIAS

 Es una tabla de resumen en la que los datos están


organizados de manera simple o en clases o grupos
numéricamente ordenados.

 Si la muestra no pasa de 5 o 10 datos diferentes entonces es


conveniente realizar una distribución con datos simples.

 Si la muestra tiene más de 10 datos diferentes y su tamaño


es mayor a 25 entonces en conveniente realizar una
distribución con datos agrupados.
 Al construir una distribución de frecuencia, se debe prestar atención
al seleccionar el número apropiado de agrupaciones o clases para la
tabla, determinando una amplitud conveniente de las clases y
estableciendo los límites de cada una para evitar el traslape.
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS SIMPLES

La tabla es básicamente una tabla de valores


x-y, dónde “x” representa el dato y “y”
representa la frecuencia.

La frecuencia es el número de veces que


aparece cada dato.
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS SIMPLES

 Está formada por dos columnas: una para la variable “xi” y


la otra para su frecuencia “f”, a esta frecuencia se le llama
frecuencia absoluta o frecuencia observada .
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS SIMPLES
 Tabla de frecuencias de los pesos en kg de 25 alumnos.

xi f xi f
Peso de 25 estudiantes (en kg)
40 1 52 2
42 1 55 2
40 42 43 44 44 43 56
1 2
45 48 49 50 50 44 2 57 1
51 51 52 52 55 45 1 58 1
55 56 56 57 58 48 1 59 1
59 62 63 63 66 49 62
1 1
50 2 63 2
51 2 66 1
Total 25
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS SIMPLES
 Por lo regular, se agregan dos columnas: la de la frecuencia relativa
“fr” y la de la frecuencia acumulada “FA”.
 La frecuencia relativa se obtiene mediante el cociente de la
frecuencia y el número total de datos, esto es fr = f/n.
 La frecuencia acumulada se obtiene sumando las frecuencias
anteriores a las frecuencias de un dato dado.
EJEMPLO

1/25
xi f fr FA xi f fr FA
40 1 0.04 1 52 2 0.08 14
42 1 0.04 2 55 2 0.08 16
43 1 3 2/25 56 2 0.08 18
0.04
44 2 0.08 5 57 1 0.04 19
45 1 0.04 6 58 1 0.04 20
48 1 0.04 7 59 1 0.04 21 Siempre
49 1 0.04 8 62 1 0.04 22 es el
50 2 63 2 número
0.08 10 0.08 24
total
51 2 0.08 12 66 1 0.04 25
Total 25 1

Siempre es 1
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS SIMPLES

 Por último se agregan las columnas:


 Frecuencia porcentual, “f%” ó “%f”, se obtiene
multiplicando la frecuencia relativa “fr” x 100.

 Frecuencia relativa acumulada “fra”, se obtiene


sumando las frecuencias relativas anteriores a un
dato dado.

 Frecuencia porcentual acumulada, “f%a”, se


obtiene sumando las frecuencias porcentuales
acumuladas a un dato dado.
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS SIMPLES
xi fa fr f% FA fra f%a
40 1 0,04 4 1 0,04 4
42 1 0,04 4 2 0,08 8
43 1 0,04 4 3 0,12 12
44 2 0,08 8 5 0,2 20
45 1 0,04 4 6 0,24 24
48 1 0,04 4 7 0,28 28
49 1 0,04 4 8 0,32 32
50 2 0,08 8 10 0,4 40
51 2 0,08 8 12 0,48 48
52 2 0,08 8 14 0,56 56
55 2 0,08 8 16 0,64 64
56 2 0,08 8 18 0,72 72
57 1 0,04 4 19 0,76 76
58 1 0,04 4 20 0,8 80
59 1 0,04 4 21 0,84 84
62 1 0,04 4 22 0,88 88
63 2 0,08 8 24 0,96 96
66 1 0,04 4 25 1 100
Total 25 1 100
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS AGRUPADOS
 Cuando se elabora una distribución de frecuencias de datos
agrupados, se define cada clase con base en intervalos de
clase de la misma amplitud.

 Los tres pasos necesarios para definir las clases de una


distribución de frecuencia con datos cuantitativos son:
1. Determinar el número de clases disyuntas.
2. Determinar el amplitud de cada clase
3. Determinar los límites de clase.
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS AGRUPADOS
Determinar el número de clases disyuntas.
 Las clases se forman especificando los intervalos que se
usarán para agrupar los datos.
 Se recomienda emplear entre 5 y 20 clases. Cuando los datos son
pocos, cinco o seis clases bastan para resumirlos. Si son muchos, se
suele requerir más clases.

Peso de 25 estudiantes (en kg)

40 42 43 44 44 Com o par a e l e j e m plo e l núm e ro de datos


45 48 49 50 50 e s r e l ativamente pe que ña se e scoge r án 5
cl ase s
51 51 52 52 55
55 56 56 57 58
59 62 63 63 66
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS AGRUPADOS
Determinar el amplitud de cada clase
 Para determinar la amplitud de un intervalo de clase, se
divide el rango (el valor mayor menos el valor menor) de los
datos entre el número de los agrupamientos o clases que se
desea.

Peso de 25 estudiantes (en kg) P a r a e l e j e mp l o:

Rango= 66 – 40 = 26
Clases = 5
40 42 43 44 44 A m p l i t u d d e l i n t e r va lo = 2 6 / 5 = 5 , 2
45 48 49 50 50
Pe r o s e r e d o n d e a a u n va l o r m á s a d e c u a d o d e
51 51 52 52 55 a c u e r d o c o n l a s p r e fe r e nc i a s d e l a p e r s on a q u e
e l a b o ra l a d i s t ri b u c ió n d e f r e c u e n c ia .
55 56 56 57 58
59 62 63 63 66 Pa r a e l e j e m p lo a 6 k g .
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS AGRUPADOS
Determinar los límites de clase
 Los límites de clase deben elegirse de manera que cada dato
pertenezca a una y sólo una de las clases.

 El límite de clase inferior indica el menor valor de los datos a que


pertenece esa clase.
 El límite de clase superior indica el mayor valor de los datos a que
pertenece esa clase.

Clases Intervalos de Clases fa P a r a e l e j e mp l o:

1 [40 - 45] 6 S e e m p i e z a c o m o l í m i te i n fe r i o r a 4 0 y 4 5 c o m o
l í m i te s u p e r io r d e l a p r i m e r a c l a s e . Y a s í
2 [46 - 51] 6
s u c e s i va me nte .
3 [52 - 57] 7
4 [58 - 63] 5
5 [64 - 69] 1
25
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS AGRUPADOS
Puntos medios o Marca de Clases.
 Es el valor que queda a la mitad entre el límite inferior y el
límite superior de cada clase.

 Se obtienen sumando el límite superior más el límite inferior de


cada clase y esta suma la dividimos entre 2.

 Estos valores nos servirán para poder realizar las


representaciones de las gráficas de los datos numéricos.
Intervalos Punto Medio o P a r a e l e j e mp l o:
Clases
de Clases Marca de Clase
El Punto medio de la Clase 1 sería:
1 [40 - 45] 42,5
(40+45)/2 = 42,5
2 [46 - 51] 48,5
3 [52 - 57] 54,5 El Punto medio de la Clase 2 sería:
( 4 6 + 51 ) / 2 = 4 8 , 5
4 [58 - 63] 60,5
5 [64 - 69] 66,5 Y a s í s u c e s i va me nte c o n c a d a u n a d e l a s
clases.
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS AGRUPADOS
Intervalos Punto Medio o
Clases fa fr f% FA fra f%a
de Clases Marca de Clase

1 [40 - 45] 42,5 6 0,24 24 6 0,24 24

2 [46 - 51] 48,5 6 0,24 24 12 0,48 48

3 [52 - 57] 54,5 7 0,28 28 19 0,76 76

4 [58 - 63] 60,5 5 0,2 20 24 0,96 96

5 [64 - 69] 66,5 1 0,04 4 25 1 100

Total 25 1 100
Para el ejemplo:

Incrementamos a la tabla las frecuencias:

- Absoluta
- Relativa
- Porcentual
- Acumulada
- Relativa Acumulada
- Porcentual Acumulada
GRÁFICA DE DATOS NUMÉRICOS

Existen varias gráficas utilizadas para


datos numéricos como:
Histograma
Polígono de Frecuencias
Ojiva
HISTOGRAMA

14

 Es la representación gráfica de 12

10

los datos mediante una sucesión 8

de rectángulos. 4

0
0,95 2,95 4,95

 Está formado por rectángulos cuya anchura


representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.

 En el eje “x” estarán los límites verdaderos, los


puntos medios y en el eje “y” las frecuencias
absolutas, relativas y porcentual.
EJEMPLO

Intervalo de Punto medio “xi” f


clase
38 – 42 40 2

43 – 47 45 4
Histograma
9 48 – 52 50 8

8 53 – 57 55 5
7 58 – 62 60 3
6
63 - 68 65 3
5
f
4 Total 25
3
2
1
0
35 40 45 50 55 60 65
xi
 También podemos usar la frecuencia relativa y la frecuencia
porcentual.
Histograma con frecuencias relativas
0,35
0,3
0,25

fr 0,2
0,15
0,1
0,05
0
35 40 45 50 55 60 65
xi
Histograma con frecuencias porcentuales
35

30

25

20
%f
15

10

0
35 40 45 50 55 60 65
xi
PIRÁMIDE POBLACIONAL

 Una variante en el histograma es colocar de


manera horizontal los dato en el eje “x” de tal
manera que las columnas quedarán en forma
horizontal, es muy común en datos poblacionales.
POLÍGONO DE FRECUENCIAS

 Es la representación mediante un gráfico de línea. En


él se muestra la distribución de frecuencias y está
formado por segmentos de línea que unen los puntos
correspondientes a las frecuencias de cada una de
las clases.

 El eje “x” representa el dato “xi”


y el eje “y” las frecuencias.

Cuando hay dos o más grupos de datos, es conveniente utilizar


un polígono de frecuencias.
EJEMPLO

9 Polígono de Frecuencias
8
7
6
5
f 4
Intervalo de Punto medio “xi” f 3
clase 2
38 – 42 40 2 1
0
43 – 47 45 4
35 40 45 50 55 60 65 70
48 – 52 50 8 xi
53 – 57 55 5

58 – 62 60 3

63 - 68 65 3

Total 25
 El eje “y” puede ser sustituido por las frecuencias relativas
o porcentuales.

Polígono de Frecuencia Relativa


0,35

0,3

0,25
fr 0,2

0,15

0,1

0,05

0
35 40 45 50 55 60 65 70
xi
Polígono de Frecuencia Porcentual

35

30

25

% f 20

15

10

0
35 40 45 50 55 60 65
xi
OJIVA

Es la representación gráfica de las


frecuencias acumuladas mediante un gráfico
de línea. Se muestra la distribución de
frecuencias acumuladas de los datos.

En el eje “x” estarán los puntos medios y en


el eje “y” las frecuencias acumuladas.
EJEMPLO

Intervalo Punto f fr fa
de clase medio “xi”
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
Ojiva
30

25 25

22
20 19

fa 15 14

10
6
5
2
0 0
35 40 45 50 55 60 65
xi
 Usando la frecuencia acumulada y la frecuencia porcentual.

Intervalo de Punto medio f fr f% fa fra f%a


clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63 - 68 65 3 0.12 12 25 1 100
Total 25 1 100
Ojiva con frecuencia relativa acumulada
1
0,9 0,88

0,8 0,76
0,7
0,6 0,56
fra 0,5
0,4
0,3
0,24
0,2
0,1 0,08

0 0

35 40 45 50 55 60
xi
Ojiva con frecuencia porcentual acumulada
100
90 88

80 76
70
60 56
f%a 50
40
30
24
20
10 8

0 0

35 40 45 50 55 60
xi

También podría gustarte