Está en la página 1de 18

Siendo el dato el material que se debe procesar, es decir, la materia prima de la estadstica, el primer paso es entonces la recoleccin de datos,

para lo cual se emplean diferentes tcnicas, como la entrevista personal, el cuestionario, la observacin, etc. El segundo paso es la organizacin y ordenamiento de los datos, lo que se hace a travs de tablas, las cuales pueden ser por medio de una distribucin de frecuencias simples o una distribucin de frecuencias con intervalos, en ambos casos agrupando todos aquellos que corresponden a una mismo dato nominal o variable y expresando en una columna el nmero de veces que aparece esa variable.

Por ejemplo, se desea hacer una tabla que muestre las calificaciones en Matemticas de un grupo escolar. Se ve que hubieron dos alumnos que sacaron 10 de calificacin, siete estudiantes sacaron

ww w.

LA FRECUENCIA es el nmero de veces que aparece cada variable o dato nominal.

at

em

at

ic

a1

.c om

9, etc.; se dice entonces que la frecuencia del dato nominal 10 es de dos; la frecuencia de la variable 9 es siete, etc. Una distribucin de frecuencias es el resultado de organizar los datos recolectados en grupos, mostrando la frecuencia de cada uno. Esta puede ser simple o por intervalos.

13.1 DISTRIBUCIN DE FRECUENCIAS SIMPLE Organizar los datos recolectados, ya sea de menor a mayor o viceversa, de manera que se muestre la frecuencia de cada uno de ellos, es hacer una distribucin de frecuencias simple. El primer paso es localizar el dato menor y el dato mayor dentro del conjunto de datos recolectados an en desorden, en el caso que los datos sean de carcter numrico. Una vez conseguido lo anterior, en una primera columna se escriben todos los nmeros que van desde el menor hasta el mayor, incluidos stos. Luego, se cuenta cuntas veces aparece el primer valor nominal, para lo cual se aconseja ir marcando con una lnea ( / ) cada vez que se cuente uno. El proceso debe repetirse para cada variable. Finalmente se cuentan el nmero de marcas que se hayan registrado para cada valor nominal y se procede a construir la tabla definitiva. Ejemplo: Ordenar y construir una tabla de frecuencias simple del siguiente conjunto de datos recolectados. 24 21 23 28 31 27

ww w.

20 22 24 22 28 21

at e

at ic
32 33 20 29 32 33

a1 .c
32 30 25 29 35 29

om

29 27 26 33 33 25

21 26 32 35 32 24

Solucin: Primer paso: Se localizan los nmeros ms chico y ms grande: son el 20 y el 35. Segundo paso: Se hace una lista completa de nmeros desde el 20 hasta el 35: 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35

at

20 21 22 23

// /// // /

24 25 26 27

/// // // //

a1
28 29 30 31

.c om

Tercer paso: Se cuenta cuntos datos nominales 20 aparecen y por cada uno que aparezca se pone una rayita ( / ). Se hace lo mismo para cada valor: // //// / / 32 33 34 35 ///// //// //

Cuarto paso: Se elabora la tabla definitiva. En una tabla son indispensables Los encabezados de columna, las lneas horizontales que delimitan la tabla por la parte superior y por la parte inferior, la lnea horizontal que delimita por su paste inferior a los encabezados y las lneas verticales que delimitan las columnas.

ww

A manera de comprobacin, para tener la seguridad de que no se escap alguno o no se contaron de ms, la suma de todas las rayitas ( / ) debe ser igual al nmero de datos nominales del conjunto inicial. En este caso existen 36 datos nominales y 36 rayitas, lo que significa que el conteo fue correcto.

w.

at

em

ic

DATO NOMINAL x 20 21 22 23 24 25 26

FRECUENCIA f 2 3 2 1

ww w.

29 30 31 32 33 34 35

at

28

em

27

at

TOTAL:

ic a

1.c
2 2 2 2 4 1 1 5 4 0 2 36

om

Es conveniente y a veces necesario obtener el total de una columna en una tabla, lo cual se especifica como lo muestra la tabla anterior. Para evitar confundir con otro dato nominal, la suma de cualquier columna debe ponerse afuera de la tabla.

CUESTIONARIO2

1) 2) 3) 4) 5) 6) 7) 8) 9) 10) 11) 12) 13) 14)

Cul es la materia prima de la estadstica? Cul es el primer paso que se verifica en la estadstica? Cules son las diferentes tcnicas que se emplean en la recoleccin de datos? Cul es la tcnica ms simple para contar el nmero de veces que aparece cada dato? Cul es el segundo paso en la estadstica? Para llevar a cabo el segundo paso, qu se utilizan? Cmo pueden ser las tablas? Qu es frecuencia? Qu es una distribucin de frecuencias? Cuntas clases de distribucin de frecuencias existen y cules son? En qu consiste la distribucin de frecuencias simple? En qu consiste la distribucin de frecuencias por intervalos? Describir los cuatro pasos que deben seguirse para hacer una distribucin de frecuencias simple. Organizar el siguiente conjunto de datos en una tabla de frecuencias simple:

ww

w.

at

em

at

ic a1

.c om

1 8 5 4 15)

5 6 3 2

4 5 3 5

4 2 8 7

9 9 7 7

8 9 7 9

Organizar el siguiente conjunto de datos en una tabla de frecuencias simple: 5 3 6 1 2 3 6 2 2 5 3 4 1 2 8 2 9 9 8 4 8 4 1 3

21 28 29 28 22 21 27 18)

25 28 29 27 28 23 27

w.

17)

Organizar los siguientes datos en una tabla de frecuencias simple: 22 22 25 27 25 27 22 24 25 20 24 25 27 22 28 28 23 22 25 27

Organizar los siguientes datos en una tabla de frecuencias simple: 31 25 34 34 29

ww

at

em

10 18 15 14 13

15 16 13 12 9

14 15 13 11 10

ic a1
14 12 18 11 19

.c
9 9 17 15

om

16)

Organizar el siguiente conjunto de datos en una tabla de frecuencias simple: 18 19 17 13

at

28 39 28 38 33 38 38 29

38 29 27 38 29 37 37 27

26 25 27 26 35 27 29 26

25 33 24 35 33 32 30

32 30 23 32 30 23 29

Cuando se trabaja con variables discretas, el ancho de clase o longitud del intervalo es la resta de el lmite superior menos el lmite inferior de cada clase o intervalo, mientras que el nmero de datos es la resta de el lmite superior menos el lmite inferior de cada clase o intervalo ms 1. Por ejemplo, si se elabora una tabla para analizar cuntas personas tienen 0, 1 2 hijos, cuntas 3, 4 5 hijos, cuntas 6, 7 u 8 hijos, etc., N DE HIJOS 02 35

ww

El ancho de clase o longitud del intervalo es la resta de el lmite superior menos el lmite inferior de cada clase o intervalo. As, en el ejemplo anterior, el intervalo de 0 a 2 hijos tiene un ancho de 2 - 0 = 2. No debe confundirse el ancho de la clase con el nmero de datos nominales que contiene el intervalo.

w.

at

em

Los datos recolectados pueden tambin organizarse por intervalos. Por ejemplo, al realizar un censo en una ciudad, podra interesar cuntas personas tienen 0, 1 2 hijos, cuntas 3, 4 5 hijos, cuntas 6, 7 u 8 hijos, etc. Cada intervalo se llama tambin clase.

at

ic a1 .c

13.2 DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS

om

68 9 - 11

el ancho de clase sera 2 0 = 2 mientras que el nmero de datos que contenga el intervalo sera de 2 0 + 1 = 3 . Da lo mismo hacerlo con cualquier rengln. Cuando se trabaja con variables continuas, el ancho de clase o longitud del intervalo es, igual que antes, la resta de el lmite superior menos el lmite inferior de cada clase o intervalo, mientras que el nmero de datos posibles que pudiera contener el intervalo no es posible conocerlos porque caben todos los valores intermedios. Por ejemplo, si se elabora una tabla para analizar cuntas personas pesan de 20kilos a 30 kilos, cuntas de 30 kilos a 40 kilos, etc.

20 30 30 40 40 50 50 - 60

el ancho de clase sera 30 20 = 10 mientras que el nmero de datos que contenga el intervalo no es posible determinarlo, ya que pueden darse pesos como 21.4, o bien 24.76, etc. Da lo mismo hacerlo con cualquier rengln. Aqu se presenta el conflicto de que si una persona pesa 40 kg. en qu fila debe contarse, en la segunda o en la tercera, porque en ambas est el valor de 40? Lo anterior se suele resolver incluyendo un extremo s y el otro no en cada fila. Simblicamente significara que

ww

w.

at em

at ic

PESO EN KG.

a1

.c om

PESO EN KG.

20 x < 30 30 x < 40 40 x < 50 50 x < 60

de esta manera el valor 40 ya no est incluido en la segunda fila y s en la tercera. A la organizacin de los datos recolectados en tablas por intervalos se le llama distribucin de frecuencias por intervalos. La caracterstica ms importante es que el ancho de cada clase o longitud del intervalo debe ser el mismo para cada intervalo.

Solucin: Conviene iniciar de la misma manera que en la organizacin de frecuencias simple. Entonces se localizan los nmeros ms chico y ms grande: son el 20 y el 35 y se hace una lista completa de nmeros desde el 20 hasta el 35. A continuacin se cuentan cuntos datos nominales aparecen por cada uno y se pone una rayita ( / ), de lo que resulta: 20 // 24 /// 28 // 32 /////

ww

24 21 23 28 31 27

20 22 24 22 28 21

32 33 20 29 32 33

at

ic a
32 30 25 29 35 29

Ejemplo: Ordenar y construir una tabla de frecuencias con cuatro intervalos del siguiente conjunto de datos recolectados. 29 27 26 33 33 25 21 26 32 35 32 24

w.

at

em

1.c

om

21 22 23

/// // /

25 26 27

// // //

29 30 31

//// / /

33 34 35

//// //

A manera de comprobacin, para tener la seguridad de que no se escap alguno o no se contaron de ms, la suma de todas las rayitas ( / ) debe ser igual al nmero de datos recolectados del conjunto inicial. En este caso existen 36 datos recolectados y 36 rayitas, lo que significa que el conteo fue correcto. Despus, se cuenta cuntos datos nominales existen dentro del conjunto. En este caso hay 16. Entonces, como hay 16 datos nominales y se piden cuatro intervalos, simplemente se dividen, por lo que cada intervalo incluir a cuatro datos nominales, como lo muestra la siguiente tabla:

INTERVALO

ww

32 - 35 total:

w.

28 - 31

at

24 - 27

em

20 - 23

at

CUESTIONARIO 3

1) 2) 3)

Qu otro nombre recibe un intervalo? Qu significa ancho de clase ? Qu significa longitud del intervalo ?

ic a1 .c
8 9 8 11 36

FRECUENCIA f

om

4) 5) 6) 7) 8)

Cul es la caracterstica principal que deben tener los intervalos? A la organizacin de los datos recolectados en tablas por intervalos, cmo se le llama? Qu es una distribucin de frecuencias por intervalos. ? Cul es la diferencia al construir una tabla con una distribucin de frecuencias por intervalos, si la variable tiene valores continuos o si tiene valores discretos? Organizar el siguiente conjunto de datos en una tabla que contenga 3 intervalos: 1 8 5 4 3 1 2 4 5 6 3 2 5 1 4 7 4 5 3 6 7 1 8 1 4 2 8 9 3 5 8 9 9 9 7 5 4 6 4 9 8 9 7 8 2 3 6 5

5 3 6 1 0 0 1 5 10)

2 3 6 2 10 4 7 5

em
2 5 3 9 11 7 1 2

at

9) Organizar el siguiente conjunto de datos en una tabla que contenga 4 intervalos: 10 2 8 5 7 9 0 0 9 9 8 2 7 10 11 11 8 4 1 6 11 11 9 4

Organizar el siguiente conjunto de datos en una tabla que contenga 5 intervalos: 10 18 15 14 15 16 13 12 14 15 13 15 14 12 18 18 10 10 17 13 18 19 17 11

ww

w.

at

ic a1

.c o

12 11)

10

11

11

14

19

Organizar el siguiente conjunto de datos en una tabla que contenga 4 intervalos: 31 38 25 24 32 38 32 29 25 26 33 24 33 37 32 26 34 25 30 38 29 27 25 33 34 32 28 38 34 32 31 34 29 39 27 26 33 26 29 30 28 29 27 35 30 27 29 31

ww w.

21 28 25 24 21 27 25 21

25 22 20 22 21 25 21 20

22 25 23 22 28 23 28 27

a1
24 28 28 22 20 20 24 27

12)

Organizar el siguiente conjunto de datos en una tabla que contenga 5 intervalos: 28 29 27 29 20 28 22 23 28 29 27 21 25 26 22 21

at

em

at

ic

.c om

13.3 FRECUENCIAS ACUMULADAS Muchas veces resulta de gran utilidad tener informacin sobre la frecuencia que a partir del inicio de la tabla se tiene hasta cierto dato nominal determinado. A lo anterior de se le conoce con el nombre de frecuencias acumuladas ( fa) y se aade en una columna en la misma tabla. Ejemplo 1: En los datos del ejemplo de la pgina 128, sus frecuencias acumuladas son: x 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 TOTAL: f 2 3 2 1 3 2 2 2 2 4 1 1 5 4 0 2 36 fa 2 5

.c om

7 8 11 13 15 17 19 23 24 25 30 34 34 36

ww

w.

at

em at

ic

a1

Obsrvese que la columna de las frecuencias acumuladas no se suma, pero debe coincidir el ltimo valor acumulado con la suma de la columna de las frecuencias.

Ejemplo 2: En los datos del ejemplo de la pgina 134, sus frecuencias acumuladas son:

INTERVALO 20 - 23 24 - 27 28 - 31 32 - 35 total:

f 8 9 11 8 36

fa 8 17 25 36

1) 2)

A las tablas del cuestionario 2, agregar una columna de frecuencias acumuladas. A las tablas del cuestionario 3, agregar una columna de frecuencias acumuladas.

ww w.

at e
CUESTIONARIO 4

at ic

a1

.c om

13.4 PORCENTAJES Y PORCENTAJES ACUMULADOS Otras dos informaciones muy tiles dentro de la etapa de organizacin de datos es calcular el porcentaje de cada variable conforme a su frecuencia, lo mismo que su porcentaje acumulado, ya sea en una distribucin de frecuencias simple o por intervalos. Para calcular el porcentaje basta hacer una regla de tres, en donde el 100% es el nmero N de datos recolectados, o sea el total de las frecuencias, esto es

n f = 100 %
donde:

je

% = porcentaje correspondiente al dato nominal de frecuencia f. O bien, despejando, se obtiene que

at

em
%= 100 f n

Ejemplo 1: En la tabla del ejemplo 1, pgina 128, aadir una columna que exprese los porcentajes de cada dato nominal y otra de sus porcentajes acumulados. Solucin: Para obtener el porcentaje del primer dato x = 20, se plantea una regla de tres simple, en donde el nmero total de datos es el 100%:

ww w.

at ic

n = nmero total de datos recolectados o frecuencia total f = frecuencia particular del dato nominal del que se desea saber su porcenta-

a1

.c om

36 2 = 100 %
de donde

%=

100 2 36

% = 5.5
Se hace lo mismo con los dems datos, de manera que la tabla se completa de la siguiente forma:

24 25 26 27 28 29 30 31 32 33

M at

23

1 3 2 2 2 2 4 1 1 5 4

em

22

7 8

at

21

ic

20

a1

fa

.c om

%a 5.5555 13.8888 19.4443 22.2222 30.5553 36.1108 41.6663 47.2218 52.7773 63.8884 66.6661 69.4438 83.3326 94.4437

5.5555 8.3333 5.5555 2.7777 8.3333 5.5555 5.5555 5.5555 5.5555

11 13 15 17 19 23 24 25 30 34

ww w.

11.1111 2.7777 2.7777 13.8888 11.1111

34 35 Totales:

0 2 36

34 36

0 5.5555 99.9992

94.4437 99.9992

Ejemplo 2: En la tabla del ejemplo 2, pgina 134, aadir una columna que exprese los porcentajes de cada dato nominal y otra de sus porcentajes acumulados. Solucin: Igual que en el ejemplo anterior, con una regla de tres simple se obtienen los porcentajes pedidos, en donde el nmero total de datos (36) es el 100%:

n f = 100 %

24 - 27 28 - 31 32 - 35

ww w.

20 - 23

INTERVALO

at

em
fa 8 17 25 36

% = 22.2
% 22.2222 25 22.2222 30.5555 99.9999 %a 22.2222 47.2222 69.4444 99.9999

8 9 8

11 total: 36

at

%=

ic

100 8 36

a1

de donde para el primer intervalo que tiene frecuencia igual a 8:

.c om

CUESTIONARIO

1)

A las tablas del cuestionario 2, agregar una columna de porcentajes y otra de porcentajes acumulados. A las tablas del cuestionario 3, agregar una columna de porcentajes y otra de porcentajes acumulados.

2)

ww

w.

at em

at

ic

a1

.c om