Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISTRIBUCIONES DE FRECUENCIA
DEFINICION DE LA ESTADISTICA
UNIDAD I ESTADSTICA DESCRIPTIVA
El trmino Estadstica se deriva del latn status que significa estado. Aunque en
realidad la palabra estadstica tiene dos significados bsicos:
En primer lugar, el trmino se utiliza para referirse a nmero reales y
especficos derivados de datos. Por ejemplo, en una encuesta de 1000 personas
a las que se les pregunt que marca de pasta dental usaban, el 15% respondi que
ellas nunca iban al dentista.
Otro significado que se le da al del trmino estadstica, es el que la considera
como un mtodo de anlisis. Por ejemplo, cuando se trata de determinar si un
nuevo frmaco realmente es un elemento efectivo para el tratamiento de una
enfermedad.
Pero debemos de entender que la estadstica en realidad es mucho ms que
simplemente trazar grficas y calcular promedios. Por lo que es conveniente
analizar con detenimiento la siguiente definicin:
La Estadstica es una coleccin de mtodos para planear experimentos, obtener
datos y luego organizar, resumir, presentar, analizar, interpretar y llegar a
conclusiones con base en esos datos
Para comprender la definicin anterior analicemos el significado de cada trmino
relevante que interviene en ella.
Experimento:
Determinacin voluntaria de un fenmeno u observacin
del mismo en determinadas condiciones, como medio de
investigacin cientfica.
Datos:
Organizar:
Establecer o reformar algo, sujetando a reglas el nmero,
orden, armona y dependencia de sus partes.
Resumir:
Reducir a trminos breves y precisos lo esencial de un
asunto o material.
Presentar:
Poner una cosa en la presencia de uno, mostrarla.
Analizar:
Distinguir y separar las partes de un todo hasta llegar a
conocer los principios o elementos de ste.
Interpretar:
Explicar el sentido de una cosa especialmente el de los
textos faltos de claridad. Atribuir una accin a
determinado fin o causa.
Concluir:
Decidir, formar juicios sobre lo que se ha tratado. Dar
remate a una cosa, acabar, dar fin.
Ejemplos:
Proceso de manufactura:
- Propiedades de los materiales
- Forman en que trabajan los obreros
- Variables del proceso tales como temperatura, presin, tiempo,
Voltaje, amperaje.
- Sistemas de medicin
-El muestreo puede ser la causa de la variabilidad
- Se lanz una moneda tres veces; primero sali guila, luego sol y
despus tambin sol.
Ramas de la Estadstica
- Estadstica descriptiva: estudia las caractersticas de un grupo de
datos para conocer los valores que lo describen.
Medidas de tendencia central: Media, Mediana, Moda
Medidas de dispersin: Rango y variancia
Medidas de asociacin: Covarianza y coeficiente de correlacin
- Estadstica inferencial: analiza los datos de una muestra para que a
partir de stos, conocer las caractersticas de la poblacin.
COMPARACIN ENTRE PROBABILIDAD Y ESTADSTICA
La probabilidad y la estadstica son dos campos ajenos pero relacionados de las
matemticas. Se ha dicho que la probabilidad es el vehculo de la estadstica. Es
decir, que si no fuera por las leyes de la probabilidad, la teora de la estadstica no
sera posible.
A continuacin se ilustrar la relacin y la diferencia entre estas dos ramas de las
matemticas mediante la observacin de dos cajas. Se sabe que la caja de
probabilidad contiene fichas de pquer: cinco azules, cinco rojas y cinco blancas.
La probabilidad intenta responder preguntas como si se extrae una ficha de la
caja, cul es la posibilidad de que sea azul? En la caja de estadstica se ignora
cul es la combinacin de fichas. Se extrae una muestra y, con base en los
resultados obtenidos en sta, se hacen conjeturas sobre lo que se cree que hay
Clasificacin
Los datos en bruto conocidos tambin son los datos recopilados que no han sido
clasificados u organizados numricamente. Un ejemplo es la lista de estaturas de
100 alumnos obtenida de los registros alfabticos de la universidad.
Un arreglo o datos agrupados es una lista ordenada, donde se ha efectuado un
acomodo de los datos numricos en bruto tomando en cuenta algn orden
(ascendente o descendente) de sus magnitudes. La diferencia entre los nmeros
mayor y menor se llama rango de los datos. Por ejemplo, si la mayor estatura de
100 alumnos es 174 centmetros y la menor es 160 centmetros, el rango es 174 160 = 14 centmetros.
Cuando se recopilan grandes cantidades de datos en bruto, con frecuencia resulta
til distribuir los datos en clases o categoras y determinar el nmero de
individuos que pertenecen a cada clase, lo cual recibe el nombre de frecuencia
de clase. Una disposicin tabular de los datos reunidos por clases, con las
correspondientes frecuencias para cada clase, se denomina tabla de frecuencia o
distribucin de frecuencia. La siguiente tabla es una distribucin de frecuencia
para las estaturas (redondeadas al centmetro ms cercano) de 100 estudiantes
de la Universidad ABC.
Tabla 1
Estatura
(centmetros)
Nmero de
alumnos
160-162
163-165
166-168
169-171
172-174
5
18
42
27
8
Total
100
Ejercicio 1
Cul es la marca de clase del intervalo 64-66 de un conjunto de medidas de
peso, en kilogramos, de los alumnos de una universidad?
64
65
66
A los datos organizados y resumidos, como en la Tabla 1, se les conoce
comnmente como datos agrupados. Aunque el proceso de agrupamiento
destruye, por lo general, mucho del detalle original de los datos, una ventaja
importante es que se gana en claridad y en que se hacen evidentes algunas
relaciones en ellos.
Cuntas clases?
Mientras en el caso de tratamiento individual la tabla queda perfectamente
determinada por los posibles valores de los datos, en el caso de tratamiento por
clases est claro que no sucede as, pues hay libertad para elegir el nmero de
clases y los lmites de las mismas.
Para decidir el nmero de clases que se deben tomar conviene tener en cuenta
que si ste es excesivo con respecto al nmero de datos, pueden aparecer
irregularidades accidentales provenientes de pocas observaciones en algunas
clases. Sin embargo, si se toma el nmero de clases demasiado reducido se
producir una prdida importante de informacin.
Un criterio que ayuda a decidir cuntas clases se deben tomar lo proporciona la
siguiente frmula emprica, debida a Sturges:
182 a 362
363 a 724
725 a 1448
1449 a 2896
2897 a 5792
5793 a 11585
9
10
11
12
13
14
Ejercicio 2
Cuntas clases sera apropiado usar para agrupar un conjunto de 100 datos,
segn la frmula de Sturges?
25
8
10
Estatura
(centmetros)
Nmero de
alumnos
160-162
163-165
166-168
169-171
172-174
5
18
42
27
8
Total
100
Las frecuencias que indican el nmero de ocurrencias de una clase, como las
dadas en la Tabla 1, se denominan frecuencias absolutas. La frecuencia relativa
de una clase es su frecuencia absoluta dividida por la frecuencia total y
generalmente se expresa como un porcentaje. Por ejemplo, la frecuencia relativa
de la clase 166-168 de la Tabla 1 es 42/100 = 0.42 = 42%.
La frecuencia relativa de una clase representa la fraccin del total o
porcentaje de los datos que pertenecen a esa clase. La suma de las
frecuencias relativas es, obviamente 1, equivalente al 100%.
Si las frecuencias absolutas de la Tabla 1 se reemplazan con las frecuencias
relativas correspondientes, la tabla resultante se denomina una distribucin de
frecuencias relativas o tabla de frecuencias relativas.
Tabla 2
Estatura
(centmetros)
Frecuencia
relativa
160-162
163-165
166-168
169-171
172-174
0.05
0.18
0.42
0.27
0.08
Total
1.00
Ejercicio 1
En un examen de Estadstica, 15 alumnos, de un total de 30, obtuvieron
calificaciones en el intervalo 6-8. Cul es la frecuencia relativa de la clase 6-8?
15
0.15
0.5
Ejercicio 2
Cunto suman las frecuencias relativas de la distribucin de frecuencias del
Ejercicio 1?
1
15
30, el nmero total de datos
Tablas estadsticas
1.62
1.72
1.67
1.68
1.60
1.66
1.55
1.65
1.70
1.61
1.57
1.63
1.70
1.64
1.58
1.71
1.58
1.57
1.69
1.68
1.63
1.64
1.69
1.67
1.56
1.58
1.55
1.60
1.57
1.65
1.60
1.68
1.62
1.61
1.60
1.56
1.59
1.61
1.62
1.64
1.57
1.59
1.66
1.60
1.63
1.58
1.67
1.63
1.66
Estaturas
1.55
No. de
Repeticiones o
Frecuencia
Marcas
No.
II
Frecuencia Frecuencia
Relativa
Acumulada
0.04
Frecuencia
Relativa
Acumulada
0.04
1.56
II
0.04
0.08
1.57
IIII
0.08
0.16
1.58
IIII
0.08
12
0.24
1.59
II
0.04
14
0.28
1.6
IIIII
0.1
19
0.38
1.61
III
0.06
22
0.44
1.62
III
0.06
25
0.50
1.63
IIII
0.08
29
0.58
1.64
III
0.06
32
0.64
1.65
III
0.06
35
0.70
1.66
III
0.06
38
0.76
1.67
III
0.06
41
0.82
1.68
III
0.06
44
0.88
1.69
II
0.04
46
0.92
1.7
II
0.04
48
0.96
1.71
0.02
49
0.98
1.72
0.02
50
50
Sumatorias
65
43
88
59
35
76
21
45
62
41
36
78
50
48
62
60
35
53
65
74
49
37
60
76
52
48
61
34
55
82
84
40
56
74
63
55
45
67
61
58
79
68
57
70
32
51
33
42
73
26
56
72
46
51
80
54
61
69
50
35
28
55
39
40
64
45
77
52
53
47
43
62
57
75
53
44
60
68
59
50
67
22
73
56
74
35
85
52
41
38
Tabla Estadstica
No. de
Piezas
No. de
Frecuencia
Repeticiones
Frecuencia Frecuencia
Relativa
o Frecuencia
Relativa Acumulada
Acumulada
Marcas No.
21
0.01
0.01
22
0.01
0.02
26
0.01
0.03
28
0.01
0.04
32
0.01
0.05
33
0.01
0.06
34
II
0.02
0.08
35
IIII
0.04
12
0.12
36
II
0.02
14
0.14
37
0.01
15
0.15
38
0.01
16
0.16
39
0.01
17
0.17
40
II
0.02
19
0.19
36
82
65
45
34
51
68
47
54
70
41
II
0.02
21
0.21
42
0.01
22
0.22
43
II
0.02
24
0.24
44
0.01
25
0.25
45
IIII
0.04
29
0.29
46
0.01
30
0.30
47
II
0.02
32
0.32
48
II
0.02
34
0.34
49
0.01
35
0.35
50
III
0.03
38
0.38
51
III
0.03
41
0.41
52
III
0.03
44
0.44
53
III
0.03
47
0.47
54
II
0.02
49
0.49
55
III
0.03
52
0.52
56
III
0.03
55
0.55
57
II
0.02
57
0.57
58
0.01
58
0.58
59
II
0.02
60
0.60
60
III
0.03
63
0.63
61
III
0.03
66
0.66
62
III
0.03
69
0.69
63
0.01
70
0.70
64
0.01
71
0.71
65
III
0.03
74
0.74
67
II
0.02
76
0.76
68
III
0.03
79
0.79
69
0.01
80
0.80
70
II
0.02
82
0.82
72
0.01
83
0.83
73
II
0.02
85
0.85
74
III
0.03
88
0.88
75
0.01
89
0.89
76
II
0.02
91
0.91
77
0.01
92
0.92
78
0.01
93
0.93
79
0.01
94
0.94
80
0.01
95
0.95
82
II
0.02
97
0.97
84
0.01
98
0.98
85
0.01
99
0.99
88
0.01
100
100
Sumatorias
Distribucin de frecuencias
Rango = VM -Vm
45 - 26 = 19
en donde:
K: es el nmero de clases
n: es el nmero de datos por agrupar.
b) Segundo mtodo.
n
n < 50
5a7
6 a 10
7 a 12
n >= 250
10 a 20
Usando el primer procedimiento tenemos que:
Para nuestro ejemplo, K = ln 30/ ln 2 = 4.907 que al redondear a enteros,
quedara una K = 5.
Si usamos el segundo mtodo, podremos observar que n = 30 es menor que
50 y se nos recomienda, de acuerdo a la tabla, que tomemos de 5 a 7
clases, por lo tanto K = 5 es una buena asignacin.
3. Clculo de la amplitud.
La amplitud se calcula redondeando el cociente del rango entre el nmero
de clases (R/K) a la unidad ms pequea (u) inmediata superior en que se
encuentran los datos brutos. Como los datos de nuestro ejemplo estn en
enteros, la unidad ms pequea es un entero u = 1, de tal manera que la
amplitud ser, R/K = 19/5 = 3.8 que al redondearlo al entero inmediato
superior, nos dar la amplitud.
Amplitud: A = 4.
4. Clculo de los lmites de clase.
Datos del problema.
32 38 26 29 32 41 28 31 45 36
45 35 40 30 31 40 37 33 28 30
30 41 39 38 33 35 31 36 37 32
Para construir los lmites de clase, (lmite inferior Li y lmite superior Ls)
se coloca como lmite inferior de la primera clase al valor ms pequeo de
los datos brutos, 26 para nuestro ejemplo, y cuatro enteros (la unidad ms
pequea es un entero) ms adelante, incluyendo el 26, tendremos el
lmite superior de la primera clase, 26 + 3 = 29 ( se suma solo tres enteros
porque el 26 est incluido).
Clases Li - Ls
1 26 - 29
Para calcular el lmite inferior de la segunda clase, hay que agregarle un
entero al lmite superior de la primera clase, esto es 29 + 1 = 30. El lmite
superior es 4 enteros adelante, incluyendo al 30, esto es 29 + 4 = 33. Este
proceso se repite iterativa mente hasta completar la clase nmero 5.
Clases
Li - Ls
1
26 - 29
30 -33
34 - 37
38 - 41
42 - 45
26 - 29 25.5 - 29.5
30 - 33 29.5 - 33.5
34 - 37 33.5 - 37.5
38 - 41 37.5 - 41.5
42 - 45 41.5 - 45.5
reales. Para la clase uno, X1 = (26 + 29)/2 = (25.5 + 29.5)/2 = 27.5 Para las
siguientes clases se procede de la misma forma o simplemente se le suma
la amplitud a la marca de clase anterior, por ejemplo, X2 = X1 + 4 = 27.5 + 4
= 31.5, y as para el resto de las clases.
Clases Li - Ls Lri - Lrs
x
1
Lri - Lrs
8. Frecuencia Relativa.
2/30, 6.67%
Lri - Lrs
fr
25.5
Lri - Lrs
fr
25.5 0
6.67% 45.5 30
Clases Li - Ls
Lri - Lrs
fr
25.5 0
0%
Grfico de barras
Este tipo de grfica se elabora con rectngulos, sus bases son del mismo ancho y
sus alturas equivalentes con las frecuencias. A diferencia del histograma, no es
necesario tener una escala horizontal continua, por lo que los rectngulos (o
barras) no tienen que aparecer juntas entre si. Adems, se pueden representar en
la misma grfica utilizando las mismas escalas horizontales y verticales, varios
datos correspondientes a las mismas variables producto de distintas
observaciones.
Como ejemplo, se presenta el comportamiento de tres calificaciones parciales de
cuatro alumnos de topografa. Las series (cada una de las calificaciones parciales)
estn coloreadas de diferente color para mostrar el comportamiento tanto
individual, como de cada uno de los alumnos con respecto a los dems. Observa
que la escala horizontal no es continua (es nominal) y se refiere a cada alumno.
Grficas de lneas:
Estas grficas se utilizan para datos relacionados, donde existe cierta continuidad
entre las observaciones, como por ejemplo, el crecimiento poblacional, la
evolucin del peso o estatura de una persona a travs del tiempo, el desempeo
acadmico de un estudiante a lo largo de su instruccin escolar, las variaciones
presentadas en la medicin realizada en algn experimento cada segundo o
minuto; y consisten en una serie de puntos trazados en las intersecciones de las
marcas de clase y las frecuencias de cada una, unindose consecutivamente con
lneas:
Grfico circular:
Cuando lo que se desea es resaltar las proporciones que representan algunos
subconjuntos con respecto al total, es decir, cuando se est usando una escala
categrica, conviene utilizar una grfica llamada de pastel o circular.
Por ejemplo, para ilustrar la matrcula en licenciatura (en Mxico) por reas de
conocimiento en el ao de 1992 se puede usar algo as como sigue
Histograma
La representacin grfica ms comn es histograma aplicado a las distribuciones
de frecuencias.
Por ejemplo, para representar el nmero de accesos a la pgina web del Instituto
Tecnolgico de Tuxtla Gutirrez, registrado en un da de la semana es:
Polgono de frecuencias:
Es muy parecido a las grficas de lneas pero, en el polgono de frecuencias se
aaden dos clases con frecuencia cero: una antes de la primera clase con datos
y otra despus de la ltima.
Por ejemplo el polgono de la grfica de arriba quedara de la siguiente manera:
Distribucin acumulada:
Este tipo de grfica, tambin conocida como ojiva, es una grfica similar al
polgono de frecuencias, que se obtiene de a partir de las frecuencias
acumuladas. y de igual manera existen las ojivas mayor que y las ojivas menor
que.
Las siguientes grficas son ejemplos de ojivas, a la izquierda la mayor que, a la
derecha la menor que, utilizando los datos que se usaron para ejemplificar el
histograma.