Está en la página 1de 78

TEMA 2. Organizacin de los datos.

TEMA 2. Organizacin de los datos.


Individuo: Es el elemento de la poblacin o de la muestra que aporta informacin sobre lo que se estudia.
Variable: Caracterstica o propiedad de los individuos que se desea estudiar y se puede medir o calificar; cambia o vara con el tiempo en un individuo dado, o cambia o vara de elemento a elemento. Ej. Edad, peso, sexo, estado civil, nmero de

Escalas de Medicin
Escala Nominal

Escala Ordinal

Escala de Intervalo

Escala de Razn

TEMA 2. Organizacin de los datos.


Escala Nominal: Est asociada a variables cualitativitas y es denominada de este modo si no se pueden hacer operaciones aritmticas entre sus valores, pues stos son nicamente ETIQUETAS. Ejemplo: sexo, cdigo postal, estado civil, nmero telefnico, nmero al correr en un maratn, deporte favorito, carrera a estudiar, etc.

TEMA 2. Organizacin de los datos.


Escala Ordinal: Los valores de la variable que tienen un ORDEN con un nivel especfico, pero no se pueden hacer operaciones aritmticas entre ellas. Ejemplo: Psimo Malo Regular Bueno Excelente Primaria Secundaria Preparatoria Licenciatura

TEMA 2. Organizacin de los datos.


Escala de Intervalo: En ella existe un orden entre los valores de la variable y adems una NOCIN DE DISTANCIA aunque no se puedan realizar operaciones. El cero o punto de inicio no es nico, es ms bien un punto de referencia.

Ejemplo: Escalas de temperatura, la edad de la Tierra, la lnea del tiempo de la humanidad.

TEMA 2. Organizacin de los datos.


Escala de Razn: La magnitud tiene SENTIDO FSICO, existe el cero absoluto, existe orden, se puede determinar cuntas veces es mayor uno que otro.

Ejemplo: peso, estatura, edad, distancia, dinero, etc.

Redondeo de datos, notacin cientfica y cifras significativas.


Redondeo: El redondeo de datos es un procedimiento que consiste en escribir un nmero que representa a una cantidad con menos cifras de las que tiene realmente para tener una idea rpida de la cantidad.

Notacin Cientfica
Es una manera de escribir en forma breve cifras muy grandes o pequeas. La forma n es general a x 10 , en donde a es un nmero entre 1 y 9, n es un nmero entero.
4 Ejemplo: 4 El nmero 25 000 se escribe 2.5 x 10 , o el nmero 0.00025 se escribe como 2.5 x 10 .

Cifras Significativas
A los dgitos exactos que se utilizan para escribir una cifra, a parte de los ceros para localizar el punto decimal, se les llama cifras significativas. Ejemplos:
3.22 tiene 3 cifras significativas. 0.0032 = 3.2 x 10 tiene 2 cifras significativas. -3 0.00320 = 3.20 x 10 tiene 3 cifras significativas. -3

La cifra 3.22 se encuentra realmente entre 3.215 y 3.225. La cifra 0.0032 es un valor que se encuentra entre 0.00315 y 0.00325.

La cifra 0.00320 se encuentra entre las cifras 0.003195 y 0.003205

Orden de datos
La ordenacin es el proceso mediante el cual los datos estn acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos. Hay dos mtodos comunes:

Listado en orden ascendente Mtodo de tallo y hojas

Ejemplo
Considera que la variable de estudio es el peso de 25 estudiantes. Los pesos se encuentran en la siguiente tabla:
Peso de 25 estudiantes (en kg) 40 56 52 63 57 43 44 62 50 66 48 42 44 56 63 51 55 50 55 51 49 52 59 45 58

Listado en orden ascendente


El proceso consiste en ordenarlos de menor a mayor
Peso de 25 estudiantes (en kg) Peso de 25 estudiantes (en kg) 40 45 51 55 59 42 48 51 56 62 43 49 52 56 63 44 50 52 57 63 44 50 55 58 66

42 56 52 63 57

40 44 62 50 66

48 43 44 56 63

51 55 50 55 51

49 52 59 45 58

Mtodo de tallo y hojas


Si los nmeros de los datos estn formados por dos dgitos, se hace una columna con el primer dgito (decenas) y a la derecha de cada uno de ellos se escribe, en fila, slo el segundo dgito (unidades) de cada uno de los datos que tengan el mismo primer dgito.

Datos sin ordenar:


4 5 6 2,0,8,9,4,3,4,5 1,6,5,2,2,0,9,0,6,5,7,1,8 2,3,6,3

Peso de 25 estudiantes (en kg) 42 56 52 63 57 40 44 62 50 66 48 43 44 56 63 51 55 50 55 51 49 52 59 45 58

Datos ordenados:
4 5 6

0,2,3,4,4,5,8,9 0,0,1,1,2,2,5,5,6,6,7,8,9 2,3,3,6

Doble tallo
Una variante de este mtodo es en lugar de dividir en un grupo las decenas, se divide en dos grupos. El primero abarcando los dgitos del 0 al 4 y el segundo del 5 al 9.

El ejemplo anterior 4 queda: 4


5 5 6 6

0,2,3,4,4 5,8,9 0,0,1,1,2,2, 5,5,6,6,7,8,9 2,3,3 6

Caso de variables cualitatitivas


El procedimiento es: Se identifican todos los valores diferentes y se acomodan en columna. Se agrega una segunda columna en donde se van registrando, mediante una lnea vertical, la veces que aparece el valor dado.

Ejemplo
Considera que la variable de estudio es el color de playera de 25 estudiantes. Los colores se encuentran en la siguiente tabla:
rosa gris azul blanco blanco caf azul negro rosa blanco

rosa gris gris

azul azul blanco

caf blanco caf

blanco rosa negro

blanco gris verde

TEMA 2. Organizacin de los datos.

Color

Frecuencia

rosa gris rosa gris gris

azul blanco azul blanco caf negro

rosa blanco

azul caf blanco blanco azul blanco rosa gris blanco caf negro verde

Azul Blanco Caf Gris Negro Rosa Verde

IIII

IIII II III IIII II IIII I

Tabla de Frecuencia de Datos


Una vez que se tenga ordenados los datos, se acomodan en la Tabla de distribucin de frecuencias o tabla de frecuencias.
La tabla es bsicamente una tabla de valores x-y, dnde x representa el dato y y representa la frecuencia.

TEMA 2. Organizacin de los datos.


La frecuencia es el nmero de veces que aparece cada dato. Hay dos clases de tablas de frecuencias:
Para datos NO agrupados. Para datos agrupados.

Tabla de frecuencias para datos NO agrupados


Est formada por dos columnas: una para la variable xi y la otra para su frecuencia f, a esta frecuencia se le llama frecuencia absoluta o frecuencia observada.

Ejemplo
Tabla de frecuencias de los pesos en kg de 25 alumnos.
Peso de 25 estudiantes (en kg)
xi f xi f 40 42 43 44 45 48 49 50 51 1 1 1 2 1 1 1 2 2 52 55 56 57 58 59 62 63 66 Total 2 2 2 1 1 1 1 2 1 25

40 45 51 55 59

42 48 51 56 62

43 49 52 56 63

44 50 52 57 63

44 50 55 58 66

Frecuencia relativa y acumulada


Por lo regular, se agregan dos columnas: la de la frecuencia relativa fr y la de la frecuencia acumulada fa. La frecuencia relativa se obtiene mediante el cociente de la frecuencia y el nmero total de datos, esto es fr = f/n. La frecuencia acumulada se obtiene sumando las frecuencias anteriores a las frecuencias de un dato dado.

Ejemplo
1/25

xi
40 42 43

f
1 1 1

fr
0.04

fa 1 2
3 2/25

xi
52 55 56

f
2 2 2

fr
0.08

fa
14

0.04
0.04 0.08 0.04

0.08 0.08 0.04


0.04

16 18
19 20

44
45 48 49

2
1 1 1

5
6 7 8 10 12

57
58 59 62

1
1 1 1

0.04
0.04 0.08 0.08

0.04
0.04 0.08 0.04

21
22 24 25

50
51

2
2

63
66 Total

2
1 25

Siempre es el nmero total

Siempre es 1

Intervalo de clase
En ocasiones es conveniente acomodar los datos en pequeos grupos de igual tamao, llamados intervalos de clase. El punto medio o marca de clase xi, se obtiene con:

El tamao del intervalo se obtiene mediante la diferencia de los lmites superior e inferior.

Marca de clase = Lmite inferior + lmite superior 2

Ejemplo
Lmite inferior Lmite superior Lm inf + Lim sup 2

Intervalo de clase 38 42 43 47 48 52 53 57 58 62 63 67

Punto medio xi 40 45 50 55 60 65

Lmite verdadero del intervalo


Frontera de clase o lmite verdadero del intervalo: Intervalo de clase Punto medio xi
40 2.5

37.5 42.5 42.5 47.5 47.5 52.5 52.5 57.5 57.5 62.5 62.5 67.5

40 + 2.5

40 45 50 55 60 65

Tabla de intervalos con lmites verdaderos


Usando smbolos de Est incluido No est incluido desigualdad
Intervalo de clase 37.5 x < 42.5 42.5 x < 47.5 47.5 x < 52.5 52.5 x < 57.5 57.5 x < 62.5 62.5 x < 67.5 Punto medio xi 40 45 50 55 60 65

Usando y Est incluido parntesis No est incluido

corchetes

Intervalo de clase [37.5 , 42.5) [42.5 , 47.5) [47.5 , 52.5) [52.5 , 57.5) [57.5 , 62.5)

Punto medio xi 40 45 50 55 60

[62.5 , 67.5)

65

El tamao del intervalo es de 5

TEMA 2. Organizacin de los datos.


Si por alguna razn no es fcil decidir el ancho del intervalo y el nmero de ellos, se pueden utilizar las siguientes frmulas:

K = 1 + 3.3 log (n) Donde K = nmero aproximado de clases n = nmero de datos. Amplitud de los intervalos = Rango / K Donde Rango = diferencia entre el dato mayor y el dato menor.

Ejemplo
Para el ejemplo de los datos de los pesos de 25 alumnos, el valor de K:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6. Por lo tanto se requieren aproximadamente 6 intervalos.

Y la amplitud de los intervalos sera:

Amplitud = Rango / K = (66 40) / 5.6 = 4.64. Aproximadamente 5 unidades es la amplitud de los intervalos.

Tabla de distribucin de frecuencias para datos agrupados


Se elabora con los intervalos de clase, sus puntos medios y las frecuencias correspondientes para cada uno de los intervalos. Datos agrupados xi f 52 2
Datos sin agrupar
40
42 43 44

1
1 1 2

55
56 57 58

2
2 1 1

Intervalo de clase
38 42 43 47 48 52 53 57 58 62 63 - 67

Punto medio xi
40 45 50 55 60 65

f
2 4

45
48 49 50

1
1 1 2

59
62 63 66

1
1 2 1

8
5 3 3

51

Total

25

Total

25

Se agregan las columnas de frecuencia relativa fr y frecuencia acumulada fa:


Intervalo de clase Punto medio xi f fr Fa
2/25 4/25 8/25

38 42 43 47 48 52 53 57 58 62 63 - 68

40 45 50 55 60 65 Total

2 4 8 5 3 3 25

0.08 0.16 0.32 0.20 0.12 0.12 1

2 6 14 19 22 25

Por ltimo se agregan las columnas: Frecuencia porcentual, f% %f, se obtiene multiplicando la frecuencia relativa fr x 100. Frecuencia relativa acumulada fra, se obtiene sumando las frecuencias relativas anteriores a un dato dado. Frecuencia porcentual acumulada, f%a, se obtiene sumando las frecuencias porcentuales acumuladas a un dato dado.

Tablas de frecuencias absoluta, relativa y acumulada


Intervalo Punto medio de clase xi 38 42 40 43 47 45 48 52 50 53 57 55 58 62 60 63 - 68 65 Total f
2 4 8 5 3

0.08 x 100

fr
0.08 0.16 0.32 0.20 0.12

f%
8 16 32 20 12

0.08 x 100

2/25

fa
2 6

fra
0.08 0.24 0.56

f%a
8 24 56 76

14 19 22

3 25

0.12 1

12 100

25

0.76 0.88 88 1 100

Grfica de Datos
Existen dos tipos de grficas mas usuales: Polgono de Frecuencias Histograma Otros grficos: Grfica de barras Pictograma Grfico Circular o de pastel.

Polgono de Frecuencias
Es la representacin mediante un grfico de lnea. En l se muestra la distribucin de frecuencias y est formado por segmentos de lnea que unen los puntos correspondientes a la frecuencia de cada una de las clases. El eje x representa el dato xi y el eje y las frecuencias.

Ejemplo
9 8 7 6 5 f 4 3 2 1 0

Polgono de Frecuencias

Intervalo de clase

Punto medio xi

38 42
43 47 48 52 53 57 58 62 63 - 68

40
45 50 55 60 65 Total

2
4 8 5 3 3 25

35

40

45

50

55

60

65

70

xi

El eje y puede ser sustituido por las frecuencias relativas o porcentuales.


Polgono de Frecuencia Relativa
0.35 0.3 0.25

fr 0.2
0.15 0.1 0.05 0 35 40 45 50 55 60 65 70

xi

Polgono de Frecuencia Porcentual


35 30 25

% f 20
15 10 5 0

35

40

45

50

55

60

65

xi

Histograma
Es la representacin grfica de los datos mediante una sucesin de rectngulos. Est formado por rectngulos cuya anchura representa a cada uno de los intervalos y la altura corresponde a la frecuencia. En el eje x estarn los lmites verdaderos, los puntos medios y en el eje y las frecuencias.
12 10 8 6 4 2 0 0.95 2.95 14

4.95

Ejemplo

Intervalo de clase 38 42 43 47 48 52 53 57 58 62

Punto medio xi 40 45 50 55 60 65 Total

f 2 4 8 5 3 3 25

Histograma
9 8 7 6 5 f 4 3 2 1 0 35 40 45 50 xi 55 60

63 - 68

65

Tambin podemos usar la frecuencia relativa y la frecuencia porcentual.


Histograma con frecuencias relativas
0.35 0.3 fr 0.25 0.2 0.15 0.1

0.05
0
35 40 45 50 55 60 65

xi

Histograma con frecuencias porcentuales


35 30 25 %f 20 15 10 5 0 35 40 45 50 xi 55 60 65

Pirmide Poblacional
Una variante en el histograma es colocar en el eje x de tal manera que las columnas quedarn en forma horizontal, es muy comn en datos poblacionales.

Ojiva
Es la representacin grfica de las frecuencias acumuladas mediante un grfico de lnea. Se muestra la distribucin de frecuencias acumuladas de los datos. En el eje x estarn los puntos medios y en el eje y las frecuencias acumuladas.

Ejemplo
Intervalo de clase 38 42 Punto medio xi 40 f 2 fr 0.08 fa 2

43 47 48 52 53 57 58 62 63 - 68

45 50 55 60 65 Total

4 8 5 3 3 25

0.16 0.32 0.20 0.12 0.12 1

6 14 19 22 25

Ojiva
30 25
22 25

20

19

fa 15
10 5
2 6

14

35

40

45

50

55

60

65

xi

Usando la frecuencia acumulada y la frecuencia porcentual.


Intervalo Punto medio de clase xi 38 42 43 47 48 52 53 57 58 62 63 - 68 40 45 50 55 60 65 f 2 4 8 5 3 3 fr 0.08 0.16 0.32 0.20 0.12 0.12 f% 8 16 32 20 12 12 fa 2 6 14 19 22 25 fra 0.08 0.24 0.56 0.76 0.88 1 f%a 8 24 56 76 88 100

Total

25

100

Ojiva con frecuencia relativa acumulada


1 0.9 0.8 0.7 0.6 fra 0.5 0.4 0.3 0.2 0.1 0
0.88

0.76

0.56

0.24

0.08

35

40

45

50

55

60

xi

Ojiva con frecuencia porcentual acumulada


100 90 80 70 60 f%a 50 40 30 20 10 0
88 76

56

24

8 0

35

40

45

50

55

60

xi

Grfico Circular
Tambin es llamado grfico de pastel. Slo se representan datos de frecuencias relativas o frecuencias porcentuales. Se debe dividir el rea del crculo de manera proporcional a las frecuencias.
13% 13% 17% 57%

PERRO PAJARO HAMSTER GATO

Agregaremos una columna a nuestra tabla de frecuencias Frecuencia relativa al crculo, multiplicando (fr)(360), para mostrar la parte proporcional de crculo medida en grados que corresponde a cada intervalo.

Ejemplo 1
Intervalo de clase 38 42 Punto medio xi 40 f 2 fr 0.08 (fr ) (360) 28.8 57.6 115.2 72
0.08 x 360 0.16 x 360

43 47 48 52 53 57 58 62 63 - 68

45 50 55 60 65
Total

4 8 5 3 3 25

0.16 0.32 0.20 0.12 0.12 1

43.2 43.2 360

65 Grfico Circular 40 12% 8% 60 12%

45 16%
55 20% 50 32%

Ejemplo 2
Color Frecuencia Conteo Color de Playera
Azul Negro Blanco Rosa Caf Verde Gris

Azul Blanco Caf Gris Negro Rosa Verde

IIII IIII II III IIII II IIII I

4 7 3 4 2 4 1

4% 16% 8% 28% 16% 12% 16%

Otros Grficos
La grfica de barras se traza similar al Histograma, slo que las barras se dibujan separadas unas de otras. La escala en el eje x es para mostrar categoras o intervalos de nmeros NO consecutivos.
60 50 40 30 20 10 0 PERRO PAJARO HAMSTER GATO

Frecuencia absoluta

Carrera
Medicina Mecnica Civil

Alumnos
8 11 8
Eleccin de Carrera

11

11

8 3 3

Agronoma
Fsico - Matemticas Leyes Contadura

3
3 6 11

Pictograma
Similar al de barras, slo que se sustituyen por figuras, generalmente relacionadas con la variable estudiada.

Organizacin de los datos


Una vez que se ha realizado la recoleccin de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organizacin y tabulacin.

Organizacin de los datos


Formas de organizar los datos:
Un arreglo: es la forma ms sencilla de organizar los datos en bruto, consiste en colocar las observaciones en orden segn su magnitud: ascendente o descendente. Poco prctica cuando se tiene una gran cantidad de datos.

Organizacin de los datos


Una distribucin de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrn de la distribucin de manera ms significativa.

Clase

Pto. Medio

fi

Fi

fri

FRi

Organizacin de los datos


La Distribucin de Frecuencias:
Se recomienda su uso cuando se tienen grandes cantidades de datos (n). Su construccin requiere, en primer lugar, la seleccin de la cantidad de intervalos de clase. Para definir la cantidad de intervalos de clase (k), se puede usar:
La regla de Sturges: k = 1 + 3.3log(n) k = n

Organizacin de los datos


La cantidad de clases no puede ser tan pequeo (menos de 5) o tan grande (ms de 20), que la verdadera naturaleza de la distribucin sea imposible de visualizar. La amplitud de todas las clases deber ser la misma. Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto. Los lmites de las clases deben tener una cifra significativa ms que los datos en bruto.

Organizacin de los datos


Determinar:
Punto medio = (Li+Ls)/2. Frecuencia absoluta de la clase (fi). Frecuencia acumulada de la clase (Fi). Frecuencia relativa de la clase (fri):
fri = fi/n

Frecuencia relativa acumulada de la clase (FRi).

Ejemplos de Distribucin de Frecuencias


A continuacin se presentan las calificaciones de 60 estudiantes que presentaron al examen de ingreso de la UPAO en el ao 2014:

Ejemplos de Distribucin de Frecuencias

23 80 52 41 60 34

60 77 10 71 78 67

79 81 64 83 89 17

32 95 75 54 76 82

57 41 78 64 84 69

74 65 25 72 48 74

52 92 80 88 84 63

70 85 98 62 90 80

82 55 81 74 15 85

36 76 67 43 79 61

a) Construya una distribucin de frecuencias. b) Qu puede concluir de estos datos.

Representacin grfica de los datos


Los grficos permiten visualizar en forma global y rpida el comportamiento de los datos. Para datos cuantitativos agrupados en clases, comnmente se utilizan tres grficos:
Histogramas. Polgono de frecuencias. Ojiva o Polgono de frecuencias acumuladas.

Ejemplos de construccin de grficos

Representacin grfica de los datos

Histograma

Representacin grfica de los datos

Histograma y Polgono de Frecuencias

Representacin grfica de los datos

Ojiva

Representacin grfica de los datos


Para datos cualitativos se usan:
Curvas Barras Sectores

Representacin grfica de los datos

Barras

Barras

Representacin grfica de los datos

Curvas

Representacin grfica de los datos


Sectores, torta o circular

También podría gustarte