Está en la página 1de 13

Facultad de Ciencias Sociales Departamento de Sociologa Clase N 3-4 Construccin de distribuciones de frecuencia con intervalos de clase. 1.

La distribucin de frecuencias que se desarroll en la clase pasada tena un rango o recorrido bastante pequeo: 5. El rango o recorrido de la distribucin de una variable es la diferencia entre su valor mximo y su valor mnimo. 2. Cuando las variables tiene un rango o recorrido mayor a 12 es conveniente construir la tabla o distribucin de frecuencias con intervalos de clase, que son agrupaciones de valores de variable que resumen o sintetizan la informacin tratada. Este criterio se utiliza tanto para variables discretas como para variables continuas. 3. Los intervalos de clase deben ser mutuamente excluyentes y exhaustivos. Intervalos mutuamente excluyentes significa que cada valor de la variable debe ser incluido en uno y slo en un intervalo de clase. Intervalos exhaustivos significa que todos los valores de la variable deben ser incluidos en alguno de los intervalos construidos. 4. Ejemplo: Los puntajes de habilidad acadmica de 50 estudiantes son los siguientes: 93 83 64 93 46 96 77 71 57 87 88 55 94 62 54 74 82 - 59 - 61 - 29 - 36 - 91 - 55 - 58 - 67 - 77 - 71 52 - 46 - 91 - 85 - 48 - 81 - 74 - 68 - 63 - 72 - 99 86 - 73 - 79 - 85 - 96 - 59 - 84 - 71 - 89 - 38 - 62 88.

Pasos en la construccin de la distribucin de frecuencias agrupada en intervalos de clase: (1) Identificar el valor mnimo y mximo de la variable y determinar el rango o recorrido. Xmx = 99 Xmn = 29 Rango= Xmx - Xmn Rango= 99-29=70

(2) Determinar el nmero (i) y amplitud o ancho de los intervalos de clase (c) de tal manera que el producto (ic) sea ligeramente superior al rango (rango=70). Por ejemplo: con i=8 y c=9, tenemos ic=72, esto significara usar 8 intervalos de clase de un ancho constante de 9 puntos. (3) Determinar un punto de partida. El punto de partida debe ser un poco menor que el valor mnimo de la variable (Xmn=29). Por ejemplo: Se puede comenzar en 28. Esto significa que el lmite inferior del primer intervalo comienza en 28; agregamos 9 puntos (el ancho de cada intervalo) y obtenemos 28+9=37 que sera el lmite inferior del segundo intervalo; 37+9=46 el tercero y as sucesivamente. Los lmites superiores de cada intervalo son los valores ms altos que se incluyen en cada intervalo de clase: 36, 45, 54, etc. Entonces el primer intervalo sera 28-36, el segundo sera 37-45, etc. As se procede sucesivamente hasta construir los 8 intervalos de clase. Debe tenerse sumo cuidado en lo siguiente: los valores mnimos y mximos de la variable deben quedar incluidos o ser iguales al lmite inferior del primer intervalo y al lmite superior del ltimo intervalo, respectivamente. La experiencia indica que no debe haber muchos ni pocos intervalos. Se recomienda un nmero mayor de 5 pero menor que 12 intervalos. Es tambin recomendable utilizar un nmero impar como ancho de cada intervalo de clase. (4) Despus se procede al recuento de las observaciones para determinar las frecuencias absolutas correspondientes a cada intervalo de clase construido. Debe ser verificado que no quede ningn valor de la variable sin ser incluido en la tabla de frecuencias.

Tabla de frecuencias Xi 28 - 36 37 - 45 46 - 54 55 - 63 64 - 72 73 - 81 82 - 90 91 - 99 X'i 32 41 50 59 68 77 86 95 fi 2 1 5 10 7 7 10 8 fir 0.04 0.02 0.10 0.20 0.14 0.14 0.20 0.16 Fac+ Fac2 3 8 18 25 32 42 50 50 48 47 42 32 25 18 8 firac+ 0.04 0.06 0.16 0.36 0.50 0.64 0.84 1.00 firac1.00 0.96 0.94 0.84 0.64 0.50 0.36 0.16

(5) En esta distribucin de frecuencias como en todas aquellas que tienen intervalos de clase deben distinguirse los lmites verdaderos respecto de los lmites aparentes de los intervalos de clase. Los lmites verdaderos no ocurren en la muestra sino que estn ubicados fuera de ella: lmite real inferior= lmite aparente inferior - 0.5 lmite real superior= lmite aparente superior + 0.5 Ejemplo: en la anterior distribucin: lmites verdaderos 27.5 - 36.5 36.5 - 45.5 45.5 - 54.5 54.5 - 63.5 63.5 - 72.5 72.5 - 81.5 81.5 - 90.5 90.5 - 99.5 lmites aparentes 28 - 36 37 - 45 46 - 54 55 - 63 64 - 72 73 - 81 82 - 90 91 - 99

(6) Tambin debe considerarse el concepto de marca de clase o punto medio de los intervalos. Cada intervalo de clase tiene un punto medio que es equivalente a :

X'i =

Lmite inferior + lmite superior --------------------------------------- = 2

28+36 64 -------- = ---- = 32 2 2

y as sucesivamente: 32, 41, 50, 59, 68, 77, 86, 95. (7) Histograma de frecuencias: Los histogramas de frecuencias son grficos que slo se usan cuando la distribucin de frecuencias de la variable est constituida por interva-los de clase. Tambin se utilizan en su construccin el sistema de coordenadas cartesianas. En el eje de la abcisa se colocan los intervalos de clase y en el eje de las ordenadas se colocan las frecuencias absolutas de los intervalos o sus alturas correspondientes. Se llama histograma al contorno de la figura que resulta al dibujar una columna rectangular sobre cada intervalo siendo el ancho de cada columna igual a la amplitud del intervalo y su altura igual a la frecuencia absoluta. Ejemplo de figura de histograma. Existen dos modos de construir un histograma de frecuencias: (a) calculando directamente la altura del histograma cuando la amplitud de los intervalos es variable. (b) tomando como altura las frecuencias absolutas cuando la amplitud del intervalo es constante. (a) Histograma de frecuencias mediante clculo directo de la altura: Cuando los intervalos de clase tienen amplitud diferente no puede calcularse la altura mediante las frecuencias absolutas sino que hay que recurrir a otro procedimiento. El rea de cada histograma es: A = ci X hi

El rea de cada rectngulo es igual a cada frecuencia absoluta, entonces reemplazando: fi= ci X hi, y por despeje: hi= fi / ci

Desde esta frmula puede calcularse cada una de las alturas de los intervalos de un histograma. La altura de cada rectngulo es igual al cuociente resultante de la divisin de cada frecuencia absoluta por la amplitud de su intervalo de clase. La altura calculada mediante esta frmula debe agregarse en una nueva columna a la tabla de frecuencia: Ejemplo de histograma con ancho de intervalo variable. (b) Histograma de frecuencias tomando como altura las frecuencias absolutas: Cuando todos los intervalos de clase tienen la misma amplitud (ci=constante) entonces hay una simplificacin: la altura de los rectngulos se torna igual a las frecuencias absolutas y el rea de cada rectngulo resulta proporcional a las frecuencias. Ejemplo de histograma con ancho de intervalo constante. (8) Polgono de frecuencias. Las marcas de clase son los puntos medios de cada rectngulo en un histograma de frecuencias. Si los unimos mediante lneas obtenemos el grfico de superficie denominado polgono o poligonal de frecuencias. Ejemplo. (9) Ojivas de Galton. Las ojivas de Galton son un grfico que utiliza en el eje de las ordenadas las Fac(+) y Fac(-), simultneamente, constituyendo dos lneas curvas que se cruzan y que dejan en el lugar de interseccin la mediana de los casos estudiados. Ejemplo de Ojivas.

ESTADIGRAFOS DE POSICION: La estadstica descriptiva proporciona los denominados estadgrafos o medidas de posicin para indicar la manera en que los datos se renen o concentran en determinadas posiciones. Existen bsicamente dos tipos de tcnicas para describir la posicin de los datos: (1) Las medidas de tendencia central, y (2) las medidas de rden (1) Medidas de tendencia central: Las medidas de tendencia central sirven para medir la concentracin de los datos en torno a un punto central. Esto es, sirven para ubicar los promedios en que se distribuyen los datos. No existe slo un promedio, sino varios promedios, entre los cuales los ms importantes son los llamados: Moda, Media Aritmtica, Mediana y Rango medio. (a) La Moda o Modo: Se simboliza como Mo y se define como el valor de variable que se repite ms veces en una distribucin de frecuencias. Su utilidad consiste ms que nada en la rapidez de su clculo porque suele ser muy inestable con datos extremos. Las distribuciones pueden ser : Unimodales, bimodales, trimodales o no tener moda. Clculo de la moda en datos no-agrupados en tablas de frecuencia: La moda en este caso es simplemente el valor o valores de mayor frecuencia: Ejemplo: 1. La moda de : 3 - 4 - 3 - 3 - 5 es Mo=3

2. Si tomamos tres series de nmeros: (a) 71 75 83 75 Mo=75 61 68 (b) 71 (c) 75 83 74 Mo=No hay 61 68 71 75 83 75 83 68

Mo= 75 y 83

Clculo de la moda en datos agrupados en tablas de frecuencias: En el caso de datos agrupados en tablas de frecuencias la Moda se calcula mediante la siguiente frmula: 1 Mo= Li + --------- c 1 + 2 donde: Li = Lmite inferior del intervalo que contiene la frecuencia modal. Frecuencia modal es aquella que rene el mayor nmero de casos. 1 = Es igual a la magnitud en que la frecuencia modal supera a la frecuencia inmediatamente anterior. 2 = Es igual a la magnitud en que la frecuencia modal supera a la frecuencia inmediatamente superior. c = amplitud de los intervalos. Ejemplo de clculo: (b) La Media Aritmtica:

La media aritmtica se define como la medida de tendencia central que suma los valores de variable y los divide por el nmero de casos u observaciones. 1. Clculo de la media aritmtica en datos no-agrupados: Sea Xi una variable con n valores (X1, X2, X3,......, Xn), la media aritmtica se denotar por X y se define mediante la siguiente frmula: i X= ---------n

donde el desarrollo de la frmula implica que: X1+X2+X3+X4+.....+Xn X= ------------------------------n

Ejemplo: Sean las siguientes notas obtenidas por un alumno en un semestre en todos sus ramos: 3-4-5-6-2-5-1. Calcular la media de las notas. i X1+X2+X3+X4+X5+X6+X7 3+4+5+6+2+5+1 26 X= ------ = ------------------------------------- = --------------------- = ---- = 3.71 n 7 7 7 X=3.71 El promedio de las notas obtenidas por el alumno es 3.71. 2. Clculo de la media en variables discretas: Cuando la variable analizada es discreta, los datos se organizan en una tabla de frecuencias y la media aritmtica se define por la siguiente frmula: ifi X=-------- = n

El desarrollo de esta frmula implica que valor de variable debe multiplicarse por la frecuencia respectiva de la categora. O sea:

X1f1 + X2f2 + X3f3 + ..... + Xnfn ifi X= ------- = --------------------------------------------- = n f1 + f2 + f3 + ...... + fn Ejemplo: Xi 1 2 3 4 fi 5 9 8 6 --n= 28 (Xifi) 5 18 24 24 ----71 (Xifi) 71 X= ------ = ----- = 2.53 n 28 X = 2.53

3. Clculo de la media aritmtica en datos agrupado en intervalos de clase: Cuando los valores de la variable estn agrupados en intervalos de clase con lmites inferiores y superiores, (li y ls) se utiliza la marca de clase o punto medio (X'i) de cada intervalo como el valor de variable a considerar en el clculo de la media aritmtica. La frmula de clculo de la media para variables agrupadas en intervalos de clase es: X'ifi X= --------- = n

Ejemplo: Xi 38-44 45-51 52-58 59-65 66-72 73-79 80-86 87-93 94-100 X'i 41 48 55 62 69 76 83 90 97 fi 2 2 3 4 11 9 7 7 5 -----n= 50 X'ifi 82 96 165 248 759 684 581 630 485 -----3730 X= 74.6

3730 X'ifi X= ------- = -------- = 74.6 n 50 (c) LA MEDIANA (Me).

La mediana de un conjunto de datos se define como el valor de variable que deja sobre s al 50% de los casos y bajo s al otro 50% de los casos, esto es divide a la variable en dos mitades iguales. Esta medida de promedio es mucho ms estable que la media aritmtica puesto que no se deja influir por los valores extremos de la distribucin. 1. Clculo de la mediana en datos no agrupados: Cuando los datos no se encuentran agrupados en tablas de frecuencia, el clculo de la mediana se realiza de las siguientes dos maneras: a. Si la serie de datos tiene un nmero de valores impar entonces una vez ordenados los datos de menor a mayor, la mediana corresponde al valor central. Ejemplo: Sean los siguientes datos: 4, 3, 2, 5 , 7. (impares)

Ordenacin: 2 , 3, 4 , 5, 7 Me= 4 b. Si la serie de datos tiene un nmero par de valores entonces, una vez ordenados los datos, la mediana es el promedio de los dos valores centrales. Ejemplo: Sea el siguiente conjunto de datos: 5, 2, 7, 8, 9, 6 Ordenacin: 2, 5, 6, 7, 8, 9 6 +7 Me = ------ = 6.5 2 Me = 6.5

2. Clculo de la Mediana en variables discretas: Los pasos para calcular la mediana en variables discretas son los siguientes: 2.1 Se deben calcular las frecuencias acumuladas ascendentes (Fac+) 2.2 Se debe determinar la primera frecuencia acumulada mayor que N/2. 2.3 El valor de variable ubicado frente a esa frecuencia acumulada es la mediana de la variable. Ejemplo # 1: Sea la siguiente variable discreta: Xi 1 2 5 7 10 13 fi 3 4 9 10 7 2 ---n= 35 Fac+ 3 7 16 26 33 35 Clculo de mediana: 1 Clculo de Fac+ 2 1 Fac+ > N/2 Si N/2= 35/2 = 17.5 entonces 1 Fac+ > 17.5 = 26 3 Me = 7

Ejemplo # 2: Sea Xi una variable discreta con las siguientes frecuencias: Xi 2 3 4 6 8 10 fi Fac+ 3 5 6 10 16 20 Clculo de mediana: 1 2 3 4 Clculo de Fac+ N/2 = 20/2 =10 1 Fac+ > 10 =16 Me = 8

3 2 1 4 6 4 --n= 20

3. Clculo de la mediana en variables agrupadas en intervalos de clase: Cuando los datos cporresponden a una variable que est agrupada en intervalos de clase, la mediana se obtiene con la siguiente frmula: (N/2) - Fac+(ant) Me = Li + -------------------- c fi Aqu: Li = Es el lmite inferior verdadero del intervalo que contiene a la mediana fi = Nmero de casos (frecuencias) del intervalo que contiene a la mediana. c = amplitud del intervalo que contiene a la mediana. Fac+(ant) = Frecuencia acumulada correspondiente al lmite inferior del intervalo. N/2 = Orden de la distribucin.

Ejemplo de clculo de mediana en datos agrupados: Sea Xi una variable continua con la siguiente distribucin: Xi 38-44 45-51 52-58 59-65 66-72 73-79 80-86 87-93 94-100 fi 2 2 3 4 11 9 7 7 5 --n = 50 Fac+ 2 4 7 11 22 31 38 45 50 Pasos en el clculo de la Mediana: 1. Debe calcularse N/2 : N/2= 50/2 =25 2. Ubicar 1 Fac+ > N/2 (25) = 31 3. Aplicar frmula: 25 - 22 Me= 72.5 + ----------- 7 = 9 3 Me = 72.5 + ------ 7 9 Me = 72.5 + 2.33 = 74.8 Me = 74.8

También podría gustarte