Está en la página 1de 44

MANUAL DEL PARTICIPANTE

NOMBRE:____________________________________________________________

FECHA:______________________________________________________________

Curso diseado por:

MTRO. JOS LUIS MORENO Y HERMOSILLO

INTRODUCCIN: General al curso: La Estadstica es una herramienta que nos permite organizar la informacin sobre un evento determinado y concluir a partir de sta el comportamiento actual o a futuro de

dicho evento. Existe la creencia de que la Estadstica requiere conocimientos matemticos sofisticados para ser manipulada. Nada mas alejado de la realidad que sto. Invito al participante a darse cuenta de ello a lo largo de este curso. Gane con la estadstica, la herramienta que le abrir las puertas al mundo de la toma de decisiones, al mundo del mejoramiento o aseguramiento de la calidad, al mundo de la optimizacin.

OBJETIVO GENERAL DEL CURSO: Al trmino del curso el participante emplear las tcnicas de organizacin y clasificacin de la informacin obtenida a partir de un evento, describiendo cada una de las caractersticas que lo posicionan como un suceso especfico.

MDULO I.- OBTENCIN Y ORGANIZACIN DE LA INFORMACIN. OBJETIVO DE APRENDIZAJE: Clasificar informacin obtenida a partir de la medicin de un evento usando una tabla de distribucin de frecuencias.

INTRODUCCIN Cuando medimos un evento, la informacin fluye y generalmente es fra y poco comunicativa acerca de las caractersticas del mismo. La situacin se torna diferente cuando la misma informacin se presenta clasificada y ordenada de acuerdo a lineamientos conocidos. Veamos que diferente se tornan nuestras medidas cuando las clasificamos y ordenamos que cuando simplemente las tomamos.

DESARROLLO DEL TEMA

La Estadstica est ligada con los mtodos cientficos en la toma, recopilacin, organizacin, presentacin y anlisis de datos, tanto para la deduccin de conclusiones como para tomar decisiones razonables de acuerdo con tales anlisis.

Que debemos entender por Estadstica? El trmino Estadstica se utiliza para denotar los mismos datos o nmeros que se derivan de ellos, como por ejemplo, los promedios, desviaciones, etc , en la cual esta ciencia se encarga de la recopilacin, organizacin, anlisis y conclusin de los datos referidos.

Para poder sacar conclusiones, se hace necesario organizar la informacin . La parte de la Estadstica que se encarga de la organizacin de dicha informacin se llama Estadstica Descriptiva y aquella que se encarga de emitir conclusiones emanadas de esos datos y de una anlisis de los mismos, se llama Estadstica Inferencial. La informacin estadstica se puede obtener de una poblacin , o cuando hacerlo se dificulta, se hace sobre una muestra. Acordaremos que una poblacin involucra a la totalidad de elementos, individuos u objetos que poseen uno o varios atributos especficos que son de inters para un estudio determinado. La poblacin puede ser finita o infinita. La primera es aquella que tiene un nmero determinado de elementos, mientras que la segunda incluye aquellos casos en que el nmero de elementos no es cuantificable o es muy difcil de evaluar. Respecto de la muestra, consideraremos como tal, al conjunto de elementos, individuos u objetos extrado de una poblacin y que se considera representativo de ella. Los datos que se extraen de una poblacin o de una muestra pueden ser constantes o variables. Constantes son aquellos que no varan sin importar si las condiciones del medio cambian. Por ejemplo: No importa que la temperatura, la humedad, la salinidad en un da cambien, la duracin en horas de un da nunca cambiar. En este caso, dicha duracin, se le llama constante. Por otro lado, una variable es un smbolo que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio. Las variables pueden ser discretas o continuas. Las primeras son aquellas cuando los valores que puede asumir son generalmente producto de conteos. Por ejemplo: nmero de hijos por familia, nmero de asientos ocupados por viaje, nmero de folios de infraccin por da, etc. Las continuas son aquellas que pueden asumir cualquier valor entre dos valores dados. Estas, generalmente, son producto de mediciones. Ejemplo: Estatura de persona, Peso de una persona, velocidad, temperatura, etc. Qu son los datos? Son colecciones de cualquier cantidad de observaciones relacionadas por ciertas caractersticas comunes. Ejemplo: nmero de das de hospedaje de los turistas extranjeros en los hoteles de gran turismo, consumo por persona en un restaurante, kilometraje recorrido por vehculo arrendado. La toma de datos es la obtencin de una coleccin de los mismos que no han sido ordenados. Ordenarlos significa colocarlos en orden creciente o decreciente de magnitud. Cuando el nmero de datos de los que se dispone es muy grande, es til distribuirlos en clases o categoras y determinar el nmero de individuos pertenecientes a cada clase, que lo llamaremos frecuencia de clase. Una ordenacin tabular de los datos reunidos en clases y con las frecuencias correspondientes a cada una se conoce como una distribucin de frecuencias o tabla de frecuencias.

Los datos ordenados y resumidos en las tablas de frecuencias se suelen llamar datos agrupados. Las clases en las que reunimos los datos abarcan un intervalo de valores que recibe el nombre de intervalo de clase. Los valores menor y mayor de los datos contenidos en una clase se conocen como lmites inferior y superior de la clase. El tamao o ancho de un intervalo de clase se conoce como la diferencia entre los lmites superior e inferior de dicha clase. Se conoce tambin como anchura de clase, tamao de clase o longitud de la clase. Marca de clase es el punto medio del intervalo de clase. Se obtiene sumando los lmites inferior y superior de la clase y dividiendo entre dos. Tambin se llama punto medio de la clase. Para efectos de un anlisis estadstico, todas las observaciones pertenecientes a un intervalo de clase se suponen coincidentes con la marca de clase. Para formar una distribucin de frecuencias es necesario seguir una secuencia de pasos que ilustrar por medio de un ejemplo.

Ejemplo 1.1 Supngase que se desea analizar el tiempo de vida de los focos de las seales direccionales para autos, fabricados por una empresa. Para ello se procede a obtener una muestra de 30 focos registrando el nmero de horas que duran encendidos.

Los resultados obtenidos se muestran en el siguiente cuadro de datos redondeados a la hora mas cercana.

237 290 315 284 261

180 234 284 292 374

285 271 320 192 228

225 295 255 318 358

288 247 305 268 210

232 338 274 279 244

En este momento pueden plantearse preguntas de este tipo: Cuntos focos tuvieron como mximo una durabilidad de 218 horas? Cuntos duraron encendidos entre 257 y 335 horas, inclusive? Qu porcentaje de los focos analizados duraron como mnimo 336 horas? La forma en que se presentaron los datos dificulta la obtencin de la respuesta a tales interrogantes. Conviene pues, organizar los datos de tal modo que proporcionen informacin resumida y mas clara sobre el proceso.

El procedimiento (marco terico) para organizar los datos en distribuciones de frecuencias se describe a continuacin: 1.- Ordene sus datos en orden ascendente o descendente. Cualquiera que sea su decisin lo llevar al mismo resultado. Una vez ordenados determine el rango de la variable en donde Rango = VM vm en donde VM = el mayor valor observado de la variable y vm = el menor valor observado en la variable. 2.- Se determina la amplitud de cada clase mediante el siguiente mecanismo: i).- se calcula R / K, donde K es un valor que depende del nmero de datos n; y la determinacin de K se realiza conforme al siguiente criterio.

N Menor que 50 De 50 a 100 De 100 a 250 250 o mas

K De 5 a 7 De 6 a 10 De 7 a 12 De 10 a 20

ii).- el valor R / K resultante se expresar siempre en las mismas unidades decimales de los datos manejados, redondeando su valor a la unidad decimal inmediata superior correspondiente, denotando el resultado por la letra A.

Por ejemplo, para un cuadro de datos con nmeros enteros

38 -------

25 ---------

27 ---------

-----------

Si

R / K = 7.24, entonces A = 8 ;

La unidad decimal mnima en este caso es el enter

Para un cuadro de datos con nmeros que estn expresados en una cifra decimal:

1.2 -------

1.4 ---------

2.8 ---------

-----------

o Si R / K = 0.323 , entonces A = 0.4 ;

La unidad decimal mnima en este caso es La dcim

Por otra parte si se tiene un conjunto de datos que estn expresados con dos cifras decimales

8.75 7.69 ---------------

9.23 ---------

-----------

a Si R / K = 0.2566, entonces A = 0.26 ;

La unidad decimal mnima en este caso es La centsima

iii).- LA amplitud de los intervalos es el valor de A . 3.- Se obtienen los lmites reales o fronteras de cada clase. Si X* = VM ( ) u : y si u representa el valor de la unidad decimal mnima de los datos, las fronteras inferior (LS ) y superior (LS) de cada clase se calculan de la siguiente manera

FRONTERAS INTERVALOS 1 2 3 4 ... ... ... R LI X* X* + A X* + 2 A X* + 3 A ... ... ... X* + ( r 1 ) A LS X* + A X* + 2 A X* + 3 A X* + 4 A ... ... ... X* + r A

El nmero de clases o intervalos que se construyan debe ser tal, que el valor mximo de los datos VM quede comprendido dentro del intervalo r .

4.- Se determina el punto medio de cada intervalo, el cual se conoce como marca de clase y se calcula usando la frmula:

LIi + LS i Xi = 2

, i = 1 , 2 , ... , r

donde LIi y LSi son las fronteras inferior y superior de la clase i respectivamente. 5.- Se determina el nmero de datos ( f i ) que queden ubicados en la clase i , en donde i = 1 , 2 , 3 , ... , r, fi es llamada la frecuencia absoluta de la clase i, y f1 + f2 + f3 + ... + fr = n es decir, la suma de las frecuencias absolutas de los r intervalos es igual al nmero de datos. La tabla compuesta por las columnas que representan a las fronteras y a las frecuencias absolutas de los r intervalos es igual al nmero de datos. La tabla compuesta por las columnas que representan a las fronteras y a las frecuencias absolutas de cada clase es llamada la DISTRIBUCIN DE FRECUENCIAS ABSOLUTAS

Regresando a nuestro caso de los datos correspondientes al tiempo de vida de los 30 focos , los pasos a seguir para la agrupacin en clase se ilustran a continuacin: A.- Determinacin del rango. vm = 180 , VM = 374 R = VM vm = 374 180 = 194 R = 194 B.- Establecimiento de la amplitud de los intervalos. i).- como n = 30 y 30<50, se selecciona K = 5 ; entonces

R / K = 194 / 5 = 38.8 ii).- A = 39 C.- Establecimiento de las fronteras superior e inferior de cada clase. u=1 X*= vm (1/2) u = 180 (1/2)(1) = 179.5 X* + A = 179.5 + 39 = 218.5 X* + 2A = 179.5 + 2(39) = 257.5 X* + 3A = 179.5 + 3(39) = 296.5 X* + 4A = 179.5 + 4(39) = 335.5 X* + 5A = 179.5 + 5(39) = 374.5 Intervalos 1 2 3 4 5 Lmite inferior 179.5 218.5 257.5 296.5 335.5 Lmite superior 218.5 257.5 296.5 335.5 374.5

D.- Clculo de la marca de clase de cada intervalo. X1 = (179.5 + 218.5 )/2 = 199 X3 = (257.5 + 296.5 )/2 = 277 X5 = (355.5 + 374.5 )/2 = 355 X2 = (218.5 + 257.5 ) / 2 = 238 X4 = (296.5 + 335.5 ) / 2 = 316

Intervalos 1 2 3 4 5

Lmite inferior 179.5 218.5 257.5 296.5 335.5

Lmite superior 218.5 257.5 296.5 335.5 374.5

Marca de Clase 199 238 277 316 355

E.- Determinacin de las frecuencias absolutas de cada clase Fi.

Intervalos 1 2 3 4 5

Lmite inferior 179.5 218.5 257.5 296.5 335.5

Lmite superior 218.5 257.5 296.5 335.5 374.5

Frecuencias absolutas 3 8 12 4 3 30

Las columnas 1 y 5 forman la DISTRIBUCIN DE FRECUENCIAS ABSOLUTAS , de la cual podemos extraer la informacin necesaria para contestarnos preguntas del estilo de las que se plantearon al inicio de esta seccin. Por ejemplo, puede apreciarse en la tabla que el tercer intervalo de clase fue el que agrup el mayor nmero de datos.: 12 focos tuvieron una durabilidad entre 257.5 y 296.5 horas. Tres focos duraron encendidos menos de 218.5 horas, etc. El porcentaje de los focos analizados que duraron encendidos como mnimo 336 horas, es de 3/30= 0.10 , o sea 10%. Hagamos un ejemplo mas para visualizar si lo que hicimos nos qued claro. Ejercicio 1.2 Con el propsito de estudiar el nmero de piezas que satisfacen las especificaciones del total de piezas que se elaboran diariamente en una de las lneas de produccin de una fabrica, se analiz la produccin de 40 das. El nmero de piezas que cumplieron con las especificaciones de cada uno de esos 40 das se muestra en el siguiente cuadro:

24 33 44 29 39

28 34 42 37 45

39 25 36 39 40

24 29 41 43 38

32 41 37 35 26

35 36 36 27 26

42 41 39 29 31

30 32 28 26 24

A.- Obtener lo que a continuacin se indica. a).- Rango = R = VM vm = b).- Como n = 40 , y 40 es menor que 50 seleccionaremos K = 6 , as R/K= A= c).- u = X* = vm (1/2)u = por lo tanto

Intervalos 1 2 3 4 5 6

Lmite inferior Lmite superior

Marca de clase

Frecuencias absolutas 7

31.5 37.5 43.5 2

40 B.- De acuerdo con la distribucin de frecuencia obtenida en el inciso anterior, contestar lo siguiente: a).- La frontera superior de la tercera clase es: b).- El punto medio de la segunda clase es: c).- La frontera inferior de la sexta clase es: d).- La marca de clase del quinto intervalo es: e).- Las fronteras de la clase con mayor frecuencia son: f).- El nmero de das en los que se produjeron mas de 31 piezas que cumplieron con las especificaciones es: g).- El nmero de das en los que se produjeron a lo mas 39 piezas que cumplieron con las especificaciones es: h).- El nmero de das en los que se produjeron mas de 27 pero menos de 43 piezas que cumplieron con las especificaciones es: i).- El porcentaje de das en los que se produjeron mas de 39 piezas que cumplieron con las especificaciones es:

1.3 Distribuciones de Frecuencias Relativas, Absolutas acumuladas y Relativas Acumuladas


Como pudo apreciarse en los ejercicios anteriores de la distribucin de frecuencias absolutas, se puede extraer informacin acerca de las fracciones o los porcentajes de los datos ubicados en determinados intervalos, acumulacin o suma de frecuencias de dos o mas intervalos, etc. De hecho, a partir de la distribucin de frecuencias absolutas se pueden generar, entre otras, las DISTRIBUCIONES DE FRECUENCIAS

RELATIVAS, ABSOLUTAS ACUMULADAS Y RELATIVAS ACUMULADAS.

10

La FRECUENCIA RELATIVA de la clase i es el porcentaje o fraccin de los


datos que quedaron localizados en esa clase; se representan como hi y es igual a fi / n , es decir, hi = fi / n , i = 1,2,3,...,r hi =( fi / n ) * 100

de tal modo que : h1 + h2 + h3 + ... + hr = 1 y se puede expresar en fraccin decimal o porcentaje.

Ejemplo 1.4: A. Considerando nuevamente el ejemplo de la durabilidad de los 30 focos para seales direccionales utilizado en el problema inicial de esta seccin, se tiene: h1 = ( f1 / n ) * 100 = (3/30) * 100 = 10% h2 = (f2 / n ) * 100 = (8/30) * 100 = 26.7% h3 = (f3 / n ) * 100 = (12/30) * 100 = 40% h4 = (f4 / n ) * 100 = (4 / 30) * 100 = 13.3% h5 = (f5 / n ) * 100 = (3 / 30) * 100 = 10% puede verificarse que h1 + h2 + h3 + h4 + h5 = 1 o sea el 100%

Esta informacin se presenta en la siguiente tabla:

11

Intervalos 1 2 3 4 5

Lmite inferior 179.5 218.5 257.5 296.5 335.5

Lmite superior 218.5 257.5 296.5 335.5 374.5

Marca de clase 199 238 277 316 355

Frecuencias absolutas 3 8 12 4 3 30

Frecuencias relativas 10% 26.7% 40% 13.3% 10% 1

Las columnas de las fronteras de clases y de las frecuencias relativas forman la distribucin de Frecuencias Relativas. LA FRECUENCIA ABSOLUTA ACUMULADA hasta la clase i representa el nmero de datos u observaciones que tuvieron un valor menor o igual que la frontera superior de la clase i. Se simboliza como Fi y se calcula sumando las frecuencias absolutas desde la primera clase hasta la clase i, es decir: Fi = f1 + f2 + f3 + ... + fi, con i = 1,2,3,...,i Para el ejemplo considerado F1 = f1 = 3 F2 = f1 + f2 = 3 + 8 = 11 F3 = f1 + f2 + f3 = 3 + 8 + 12 = 23 F4 = f1 + f2 + f3 + f4 = 3 + 8 + 12 + 4 = 27 F5 = f1 + f2 + f3 + f4 + f5 = 3 + 8 + 12 + 4 + 3 = 30 = n Para toda distribucin se cumple que Fr = n (el nmero total de datos ) Esta informacin se expresa en la siguiente tabla:

12

Intervalos

Lmite inferior 179.5 218.5 257.5 296.5 335.5

Lmite superior 218.5 257.5 296.5 335.5 374.5

1 2 3 4 5

Marca Frecuencias Frecuencias Frecuencias de absolutas relativas absolutas clase acumuladas 199 3 10% 3 238 8 26.7% 11 277 12 40% 23 316 4 13.3% 27 355 3 10% 30 30 1

La FRECUENCIA RELATIVA ACUMULADA hasta la clase i representa el porcentaje de datos que tuvieron un valor menor que la frontera superior de la clase i. Se simboliza como Hi y se calcula dividiendo la frecuencia absoluta acumulada de la clase i entre el nmero total de datos n. O sea: Hi = ( Fi ) / n para i = 1 , 2 , 3 , ... , r Hi = ( Fi ) / n * 100 Para el ejemplo, H1 = ( F1 / n ) * 100 = (3 / 30 ) * 100 = 10% H2 = ( F2 / n ) * 100 = (11/30) * 100 = 36.7% H3 = ( F3 / n) * 100 = (23/30) * 100 = 76.6% H4 = ( F4 / n ) * 100 = (27/30) * 100 = 90% H5 = ( F5 / n ) * 100 = (30/30 ) * 100 = 100% Hr = 100% para cualquier distribucin Esta informacin se resume en la siguiente tabla:

13

Interval Lmite os inferior

Lmite Marca Frecuen Frecuenci superior de cias as clase absoluta relativas s 218.5 257.5 296.5 335.5 374.5 199 238 277 316 355 3 8 12 4 3 TOTALES 10% 26.7% 40% 13.3% 10%

1 2 3 4 5

179.5 218.5 257.5 296.5 335.5

Frecuenci as absolutas acumulad as 3 11 23 27 30 30

Frecuencias Absolutas Acumuladas 10% 36.66% 76.66% 90% 100% 1

Ejercicio 1.5 : Completar la siguiente tabla. Haciendo referencia a los datos del problema 1.2.
Interval Lmite os inferior Lmite Marca Frecuen superior de cias clase Absolutas 27.5 31.5 35.5 39.5 43.5 47.5 25.5 29.5 33.5 37.5 41.5 45.5 8 7 6 10 7 2 Frecuencias relativas Frecuencias absolutas acumuladas 15 15% 31 5% 52.5% Frecuencias Relativas Acumuladas 20%

1 2 3 4 5 6

23.5 27.5 31.5 35.5 39.5 43.5

TOTALES

40

Una vez que la tabla ha sido llenada, escoja la opcin correcta en las siguientes afirmaciones. a).- El nmero de das en los que se produjeron menos de 35.5 piezas dentro de las especificaciones es: i) 6 ii) 15 iii) 21 iv) 6/40

b).- El porcentaje de das en los que se produjeron mas de 39.5 piezas dentro de las especificaciones es: i) 25% ii) 77.5 iii) 17.5 iv) 22.5%

c).- El porcentaje de das en los que se produjeron entre 27.5 y 31.5 piezas dentro de especificaciones es: i) 37.5 ii) 17.5 iii) 57.5 iv) 87.5 %

14

Con el fin de ejercitar lo aprendido hasta ahora lo invito a que desarrolle el siguiente:

Ejercicio 1.6: Los datos que se presentan a continuacin estn relacionados con la presin mnima a reventar, de 30 mangueras usadas para la conduccin de gasolina en automvil; la presin est medida en Kg / cm2 redondeando al entero mas prximo.

75 70 73 64 70

67 71 69 74 65

70 68 74 68 64

69 72 69 66 71

73 69 70 65 75

69 64 68 66 65

Organizar los datos a).- Calcular el rango b).- Determinar la amplitud de cada intervalo, para ello considere K = 5 c).- Formar las distribuciones de frecuencias absolutas, frecuencias relativas, frecuencias absolutas acumuladas y frecuencias relativas acumuladas. d).- De acuerdo a las distribuciones obtenidas conteste lo siguiente: 1.- Cuntas mangueras tienen una presin mnima a reventar entre 64 y 69 Kgs/cm2, incluyendo ambos valores? 2.- Cul es la marca de clase del tercer intervalo? 3.- Cul es el porcentaje de mangueras que tienen una presin mnima a reventar menor que 72.5 Kgs/cm2 La informacin manejada anteriormente resulta mas clara cuando la podemos ver plasmada en un eje coordenado. 1.7 HISTOGRAMAS Y POLGONOS DE FRECUENCIA ABSOLUTAS Y RELATIVAS. La distribucin de frecuencias absolutas y relativas se presentan grficamente mediante histogramas y polgonos de frecuencia. Un Histograma de frecuencias absolutas es un conjunto de rectngulos ( uno para cada clase ), que tienen como base la amplitud del intervalo, y como altura la frecuencia absoluta del intervalo correspondiente. Un Histograma de frecuencias relativas es un conjunto de r rectngulos ( uno para cada clase ), que tiene como base la amplitud del intervalo , y como altura la frecuencia relativa del intervalo correspondiente.

15

Un Polgono de frecuencias absolutas ( relativas ) es un conjunto de segmentos lineales que unen a los puntos medios de las bases superiores de cada rectngulo del histograma de frecuencias correspondiente. Al construir las grficas de las distribuciones de frecuencias se utilizan en el eje vertical la escala adecuada a las frecuencias, y en el horizontal la adecuada a las unidades en las que estn expresados los datos del ejemplo en consideracin. Ejemplo 1.8: Graficar el histograma y el polgono de frecuencias absolutas de la distribucin de frecuencias que corresponde a los datos que se refieren a la durabilidad de 30 focos para seales direccionales ( en horas ).

Interval Lmite os inferior

Lmite Marca Frecuen Frecuenci superior de cias as clase absoluta relativas s 218.5 257.5 296.5 335.5 374.5 199 238 277 316 355 3 8 12 4 3 10% 26.7% 40% 13.3% 10%

1 2 3 4 5

179.5 218.5 257.5 296.5 335.5

Frecuenci as absolutas acumulad as 3 11 23 27 30 30

Frecuencias Absolutas Acumuladas 10% 36.66% 76.66% 90% 100% 1

14 12 10 8 6 4 2 0 1 2 3 4 5 6 7

14 12 10 8 6 4 2 0 Serie2 Serie1

Tracemos ahora el histograma y el polgono de frecuencias relativas:

16

45 40 35 30 25 20 15 10 5 0 160 199 238 277 316 355 394

14 12 10 8 6 4 2 0 Serie2 Serie1

Si usted compara ambos grficos se encontrar que su geometra es igual cambiando nicamente los datos del eje vertical. Observe que en ambos casos, siguiendo la secuencia de la grfica se agregaron los valores 0 de la izquierda y derecha de la grfica, con el fin de mostrar los puntos en que la misma corta al eje de las abscisas. Lo invito a que ejercitemos lo comentado en este apartado con el fin de reafirmar lo visto.

Ejercicio 1.9: La siguiente distribucin de frecuencias corresponde al nmero de piezas que satisfacen las especificaciones, en cada uno de los 40 das en los que se analiz la produccin.

Interval Lmite os inferior

Lmite Marca Frecuen superior de cias clase Absolutas 27.5 31.5 35.5 39.5 43.5 47.5 25.5 29.5 33.5 37.5 41.5 45.5 8 7 6 10 7 2

Frecuencias relativas

Frecuencias absolutas acumuladas 15

1 2 3 4 5 6

23.5 27.5 31.5 35.5 39.5 43.5

Frecuencias Relativas Acumuladas 20% 52.5%

15% 31 5%

40
Trace el histograma y el polgono de frecuencias absolutas y relativas.

17

1.10 GRAFICA DE DISTRIBUCIONES DE FRECUENCIAS ABSOLUTAS ACUMULADAS Y RELATIVAS ACUMULADAS. OJIVAS

Interna -los

Lmite inferior

Lmite Marca Frecuen superior de cias clase absoluta s 179.5 218.5 257.5 296.5 335.5 374.5 160 199 238 277 316 355 0 3 8 12 4 3

Frecuencias relativas

0 1 2 3 4 5

140.5 179.5 218.5 257.5 296.5 335.5

0 10% 26.7% 40% 13.3% 10%

Frecuencias absolutas acumuladas 0 3 11 23 27 30

Frecuencias Absolutas Acumuladas 0 10% 36.66% 76.66% 90% 100%

Las distribuciones de frecuencias absolutas y relativas acumuladas se representan grficamente mediante polgonos de frecuencias acumuladas u ojivas. Una ojiva es la curva que resulta de unir los puntos superior de cada clase con las frecuencias absolutas o relativas acumuladas hasta dicha clase, pudiendo as construirse ojivas ojivas de frecuencia absoluta acumulada y ojivas de frecuencia relativa acumulada. Ejemplo 1.11: La siguiente tabla corresponde a las distribuciones de frecuencias absolutas acumuladas y relativas acumuladas de la durabilidad de 30 focos para seales direccionales.

Obsrvese que en la tabla ha sido agregado el intervalo o (cero) representado por 140.5-179.5 ( anterior al intervalo 1 y con amplitud 39, igual que los restantes ). Esto no altera la organizacin de los datos, ya que la clase cero se le asigna una frecuencia cero y se incluye con el propsito de que las ojivas de las distribuciones de frecuencias acumuladas partan del eje horizontal. A.- Construir la ojiva de la distribucin de frecuencias absolutas acumuladas.

18

35 30 25 20 15 10 5 0 180 219 258 297 336 375

Serie2

Las ojivas se extienden horizontalmente a la derecha de 374.5 horas, denotando que los 30 focos tuvieron una durabilidad menor que cualquier nmero de horas superior a 374.5 B.- Construir la ojiva de la distribucin de frecuencias relativas acumuladas.

120 100 80 60 40 20 0 180 219 258 297 336 375 Serie2

Verdad que qued claro? Veamos si es cierto:

Ejercicio 1.12: En la siguiente tabla se muestran las distribuciones acumuladas y relativas acumuladas correspondientes al nmero de piezas que cumplieron con las especificaciones de cada uno de los 40 das en los que se analiz la produccin.

19

Interval Lmite os inferior

Lmite Marca Frecuen superior de cias clase Absolutas 23.5 27.5 31.5 35.5 39.5 43.5 47.5 21.5 25.5 29.5 33.5 37.5 41.5 45.5 0 8 7 6 10 7 2

Frecuencias relativas

0 1 2 3 4 5 6

19.5 23.5 27.5 31.5 35.5 39.5 43.5

0% 20% 17.5% 15% 25% 17.5% 5%

Frecuencias absolutas acumuladas 0 8 15 21 31 38 40

Frecuencias Relativas Acumuladas 0 20 37.5 52.5 77.5 95 100

40

A.- Construir la ojiva de la distribucin de frecuencias absolutas acumuladas. B.- Construir la ojiva de la distribucin de frecuencias relativas acumuladas. 1.13.- CONCLUSIN Y SNTESIS DEL TEMA La informacin por si sola no tiene ninguna utilidad. Organizarla y clasificarla en tablas de distribucin de frecuencias permite ver el comportamiento del fenmeno y plasmarlo en grficas para que, de manera objetiva, dejan ver como se distribuye la informacin. Si su comportamiento es normal o no, esto es, si la mayor parte de los datos giran alrededor de un dato central y los dems fluctan en magnitudes parecidas a l.

La organizacin de los datos nos permiti valorar el rango de los mismos como una medida de dispersin, clasificarlos en clases representadas cada una por la llamada marca de clase, cuantificarlos de manera absoluta y relativa, para luego verlos plasmados en histogramas y polgonos de frecuencias tanto absolutas como relativas y analizarlos en forma acumulativa mediante las ojivas. La organizacin de la informacin parece ser mas clara cuando se presenta en frecuencias relativas debido a la idea conceptual que ya tenemos sobre los porcentajes.

20

INSTRUMENTOS DE EVALUACIN

DATOS GENERALES DEL EVALUADO:

DATOS GENERALES DEL EVALUADOR:

MTRO. JOS LUIS MORENO Y HERMOSILLO COORDINADOR ACADMICO DE LA UNIDAD DE INGENIERAS Y CIENCIAS EXACTAS DE LA UNIVA PLANTEL PUERTO VALLARTA

Con el objeto de estudiar la distribucin de dimetros internos de las mangueras para direccin hidrulica elaborados por una empresa, se consideraron 40 de tales piezas. Las medidas de los dimetros internos de las 40 mangueras, en pulgadas y redondeados a dos decimales, se dan a continuacin:

0.31 0.34 0.33 0.33 0.35 0.29 0.37 0.32

0.28 0.31 0.31 0.30 0.29 0.30 0.36 0.33

0.35 0.30 0.32 0.33 0.31 0.32 0.33 0.29

0.32 0.34 0.33 0.36 0.30 0.28 0.37 0.32

0.32 0.29 0.34 0.32 0.32 0.35 0.30 0.31

Generar una tabla de distribucin de frecuencias absolutas y relativas acumuladas, su histograma y polgono de frecuencias absolutas y su histograma y polgono de frecuencias acumuladas. Hacer tambin la ojiva de frecuencias relativas acumuladas. Considere k = 6

21

RESPUESTA A LOS REACTIVOS:

TABLA DE DISTRIBUCIN DE FRECUENCIAS


CLASE LIMITE INFERIOR 1 2 3 4 5 0.275 0.295 0.315 0.335 0.355 LIMITE SUPERIOR 0.295 0.315 0.335 0.355 0.375 MARCA DE CLASE 0.285 0.305 0.325 0.345 0.365 FREC. FREC. FREC FREC REL RELATIVA ACUM 6 16 30 36 40 15 25 35 15 10 15 40 75 90 100

ABSOLUTA ABS. ACUM 6 10 14 6 4

HISTOGRAMA Y POLGONO DE FRECUENCIAS ABSOLUTAS

16 14 12 10 8 6 4 2 0 0.255 0.275 0.295 0.315 0.335 0.355 0.375 Serie2

22

HISTOGRAMA Y POLGONO DE FRECUENCIAS RELATIVAS


40 35 30 25 20 15 10 5 0 0.256 0.275 0.295 0.315 0.335 0.355 0.375 Serie2

OJIVA DE FRECUENCIAS RELATIVAS ACUMULADAS

120 100 80 60 40 20 0 0.256 0.275 0.295 0.315 0.335 0.355 Serie2

INDICADORES DE SATISFACCIN: 1.- La tabla de distribucin de frecuencias debe estar completa aunque el orden sea distinto al que aparece en la respuesta.

23

2.- Los histogramas y polgonos de frecuencia deben aparecer como se presenta en la solucin. Eso incluye el caso de frecuencias absolutas y el de frecuencias relativas. 3.- La ojiva tambin debe aparecer como se presenta en la solucin correspondiente. ESPECIFICACIN DEL VALOR DE CADA REACTIVO. 30% La tabla de distribucin de frecuencias. El valor ser proporcionalmente menor en la medida de lo que le falte a la tabla. 20% El histograma y polgono de frecuencias absolutas. 20% El histograma y polgono de frecuencias relativas. 30% La ojiva de frecuencias relativas.

CONCLUSIONES FINALES ANOTA TUS CONCLUSIONES:

DE QUE MANERA PUEDES APLICAR LO VISTO EN ESTE TEMA?

BIBLIOGRAFA: 1.- Estadstica de Murray Spiegel. Editorial Mac Graw Hill. MXICO 1998 2.- Estadstica con 720 problemas de Taro Yamane Ed Harla. MXICO 1980.

24

TEMA 2.- MEDIDAS DE TENDENCIA CENTRAL Objetivo de aprendizaje: Identificar las medidas de tendencia central mas importantes distinguiendo la utilizacin adecuada de las mismas Este mdulo no requiere de una evaluacin previa, ya que esta es la misma que la aplicada en el tema anterior.

INTRODUCCIN: Lo que la mayora de las veces se piensa de manera intuitiva al hablar del promedio de un conjunto de datos es una cantidad, que de alguna manera representa al centro de los datos; es decir, hay mediciones antes y despus del promedio. El registrar los datos, elaborar sus distribuciones de frecuencia y construir sus grficas nos permite tener una buena descripcin de las tendencias de stos. Si adicionalmente establecemos nmeros que indiquen cual es la tendencia central de las mediciones, habremos avanzado un poco mas en la tarea de realizar una buena descripcin de estas observaciones (datos). DESARROLLO DEL TEMA Las tres medidas de tendencia central mas conocidas estn La Media Aritmtica , La Mediana y La Moda. Si X1, X2,..., Xn son n datos, (mediciones), llamaremos la Media Aritmtica de estos m datos y la representaremos por X a la siguiente cantidad: Xi = _______ n

X1 + X2 + X3 + ... +Xn X = _______________________________ n

25

con frecuencia se considera a la media aritmtica, como el Promedio o simplemente la Media de estos datos. Por ejemplo, si tenemos X1=0.70 La cantidad X1+X2+X3+X4+X5 = 5 5 esta cantidad representa el centro de los datos. 0.70+0.75+0.65+0.85+0.80 = 0.75 X2=0.75 X3=0.65 X4=0.85 X5=0.80;

Ejercicio 2.1: Demuestre que la media aritmtica de los siguientes datos : 101,122,116,103,124,118,109,111,120,107,121,110 es: 113.5 Ejemplo 2.2 Se toman 5 muestras cada hora, cada una de tamao 3, sobre la longitud externa, en pulgadas, de los resortes producidos en una mquina y se registran los datos en la siguiente tabla:
i 1 2 3 X Primera 2.88 2.53 2.79 2.73 Segunda 2.68 2.91 2.63 2.74 Tercera 2.59 2.56 2.77 2.64 Cuarta 2.63 2.85 2.64 2.71 Quinta 2.80 2.60 2.9 2.77

Encuentre el promedio de promedios, o sea, la media aritmtica de las medias aritmticas de estas mediciones. 2.73+2.74+2.64+2.71+2.77 13.59 X= = = 2.718 pulgadas 5 5 o sea, 2.718 pulgadas es la longitud externa promedio de los 15 resortes. La frmula estudiada anteriormente para la media aritmtica, es aplicable a una coleccin de n datos no agrupados.

26

Cuando los datos han sido organizados en tablas de frecuencias, y solo se conocen las marcas de clase y el nmero de datos asignados a cada clase, se hace necesario expresar la frmula de la media aritmtica de la siguiente manera: Xi fi X= n donde Xi es la marca de clase del intervalo i , fi la frecuencia absoluta del intervalo i y r es el nmero de intervalos. Ejemplo 2.3: La distribucin de frecuencias absolutas dada a continuacin corresponde al tiempo de vida, en horas, de 30 focos para seales direccionales.

Interna -los

Lmite inferior

Lmite Marca Frecuen superior de cias clase absoluta s 179.5 218.5 257.5 296.5 335.5 374.5 160 199 238 277 316 355 0 3 8 12 4 3

Frecuencias relativas

0 1 2 3 4 5

140.5 179.5 218.5 257.5 296.5 335.5

0 10% 26.7% 40% 13.3% 10%

Frecuencias absolutas acumuladas 0 3 11 23 27 30

Frecuencias Absolutas Acumuladas 0 10% 36.66% 76.66% 90% 100%

Los pasos a seguir para obtener X se ilustran a continuacin: Primer paso: Obtener el producto Xi fi para cada intervalo. X1 f1 = 199 * 3 = 597 X2 f2 = 238 * 8 = 1904 X3 f3 = 277 * 12 = 3324 X4 f4 = 316 * 4 = 1264 X5 f5 = 355 * 3 = 1065 Segundo paso: Calcular la suma X1 f1 + X2 f2 + X3 f3 + X4 f4 + X5f5 = 597+1904+3324+1264+1065= = 8154 27

Tercer paso: Agregar a la tabla de distribucin de frecuencias, los datos obtenidos en los pasos primero y segundo de la forma siguiente:

Interna -los

Lmite inferior

0 1 2 3 4 5 Total

140.5 179.5 218.5 257.5 296.5 335.5

Lmite Marca Frecuen superior de cias clase Absoluta s 179.5 160 0 218.5 199 3 257.5 238 8 296.5 277 12 335.5 316 4 374.5 355 3 30

Xi fi 0 597 1904 3324 1264 1065 8154

Cuarto paso: Xi fi Sustituir en la frmula, X = n = 30 8154 = 271.8

Ejercicio 2.4: La siguiente distribucin de frecuencias corresponde a las mediciones e 40 piezas que produce una mquina: Interval Lmite os inferior Lmite Marca Frecuen superior de cias clase Absolutas 23.5 21.5 0 27.5 25.5 8 31.5 29.5 7 35.5 33.5 6 39.5 37.5 10 43.5 41.5 7 47.5 45.5 2 40

Xi fi

0 1 2 3 4 5 6 Total

19.5 23.5 27.5 31.5 35.5 39.5 43.5

28

Calcule la media de los datos incluidos en esta tabla y llene los espacios vacos de la misma.

MEDIANA La media aritmtica no es el nico indicador usado como una medida de tendencia central de un conjunto de datos. An mas, la media aritmtica no es un buen representante de los datos si entre ellos aparecen algunos que se alejan demasiado de la mayora. Ejemplo: Un despacho de contadores tiene 10 empleados de los cuales 9 ganan 100 pesos diarios y uno gana 500 diarios. Cuanto ganan en promedio por da los empleados del despacho? Si seguimos el mtodo tradicional el promedio sera el resultado de dividir (9*900 + 500) / 10 = 140 Es claro que esa cantidad no es representativa de lo que est pasando en el despacho. En estos casos la media aritmtica no es un buen mtodo para obtener el promedio. Si se tiene un nmero impar de datos, a la medicin que ocupe la posicin central de stos, ordenados por su magnitud, se le llama la Mediana. Si el nmero de datos es par, entonces la mediana es el promedio de las dos mediciones centrales. Si A representa la variable, entonces la reconoceremos como la mediana del conjunto de mediciones. Una caracterstica de la mediana es que divide en dos partes exactamente iguales a las observaciones ordenadas. Esto nos lleva a que el polgono de frecuencias lo parte en dos elementos que tienen la misma rea. Ejemplo 2.5: Los nmeros 2,1,3,1,12,3,1,1,3,1,10 representan el nmero de hijos que tienen 11 empleados de una compaa. Para obtener la mediana de estos datos se ordena de la manera siguiente: 1,1,1,1,1,2,3,3,3,10,12. El dato central es 2 por lo que = 2 hijos. Note que antes y despus de = 2 hay la misma cantidad de datos. Por esta razn la mediana resulta ser una buena medida de tendencia central. Por otro lado, si obtenemos la media aritmtica de estas 11 mediciones se obtiene: 1+1+1+1+1+2+3+3+3+10+12 X= 11 = 3.45 hijos

29

Observe que la media aritmtica no representa adecuadamente los datos, ya que la mayora de ellos estn a la izquierda no a su alrededor. Ejercicio 2.6: En un curso de mecnica automotriz en el cual participaron 30 personas, se obtuvieron las siguientes calificaciones: 85 95 60 95 75 65 80 65 60 85 70 80 70 65 85 70 40 90 70 75 75 50 90 75 75 100 55 80 75 100

Obtenga la media y la mediana de estos datos y opine de acuerdo a su percepcin, cual de las dos medidas de tendencia central se apega mas a la realidad. El ejercicio anterior involucra un mayor nmero de datos. Esto hace que la labor de ordenamiento de los datos sea mas complicada. Mas an, si tomamos en cuenta que en Estadstica un nmero que pudiera ser confiable en cuanto a tamao de la muestra es 250, la idea de ordenar este numero de datos puede ser un elemento inquietante. Los mtodos modernos de computacin permiten efectuar estas operaciones de manera automatizada. Las hojas de clculo que se encuentran en el mercado del software tienen la posibilidad de que al proporcionarles los datos obtenidos, de un solo teclado calculan la medida de tendencia central deseada. El proceso que le permite a la computadora calcular las medidas de tendencia central es el mismo que hemos descrito anteriormente. La nica diferencia es que la computadora lo calcula a la velocidad de la luz. Es posible para datos agrupados, de los cuales solo se conoce la distribucin de frecuencia absoluta, obtener la mediana de igual manera en que teniendo esta informacin era posible conocer la media aritmtica. El algoritmo que se usa es diferente y lo presento a continuacin: - ( f ) c con: F mediana L = Frontera inferior de la clase de la mediana N = Nmero de datos ( frecuencia total ) ( f ) = suma de frecuencias de las clases inferiores a la de la mediana f mediana = frecuencia de la clase de la mediana c = ancho del intervalo de clase de la mediana.

N/2 Mediana = L +

30

Como podemos observar, la mayor parte de las variables en este algoritmo involucran la clase de la mediana. Quiere decir esto que para poder resolver el problema tenemos que conocer la mediana? La respuesta es no. En el siguiente ejemplo veremos que es posible, sin conocer el valor de la mediana, ubicarla en que clase se encuentra. Ejemplo 2.7: Hallar la mediana de los pesos de 40 estudiantes cuya distribucin de frecuencia se muestra a continuacin.

Limite inferior 118 127 136 145 154 163 172

Limite superior 126 135 144 153 162 171 180 Total

Frecuencia 3 5 9 12 5 4 2 40

Recordemos que la mediana esta situada en el centro de la distribucin de datos ya ordenados. Esto nos lleva a que , observando la tabla, la suma de las tres primeras frecuencias de clase es 3+5+9=17. Para llegar al 20 deseado, que sera la posicin media entre los 40 datos, tomamos 3 mas de entre los 12 casos de la cuarta clase. No sabemos cuanto vale la mediana, pero lo que si sabemos es que cae en la cuarta clase, que es, por lo tanto, la clase de la mediana. Si aplicamos el algoritmo propuesto anteriormente nos encontramos que: L = frontera inferior de la clase de la mediana = 144.5 (consideremos que alguien con una altura de 144.6, al redondear a enteros la altura entrara en esta clase )

N = nmero de datos = 40 ( f) = suma de frecuencias de las clases inferiores a la de la mediana = 3+5+9=17 f mediana = frecuencia de la clase de la mediana = 12 c = ancho del intervalo de la clase de la mediana = 9 luego:

31

N/2 - (f ) Mediana = L + f mediana c = 144.5 +

40/2

- 17 9 = 146.8 lb 12

Como fue, se obtuvo el valor de la mediana, determinando nicamente la clase a la que perteneca. Ejercicio 2.8 A continuacin mostramos una tabla que incluye el nmero de bodas ( admite repeticiones ) en U.S. para hombres y mujeres de distintos grupos de edad durante 1984. a).- <hallar la mediana de la edad de hombres y mujeres en esas bodas. b).- Por qu la mediana es una medida de tendencia central mas adecuada que la media en este caso? Edad Edad Varones Mujeres ( aos ) ( aos ) ( miles ) ( miles ) lim inf lim sup 18 19 121 481 20 24 2441 4184 25 29 5930 6952 30 34 6587 7193 35 44 11788 11893 45 54 9049 9022 55 64 8749 8171 65 74 5786 4654 75 Y mas 2581 1524

LA MODA La moda de un conjunto de nmeros es el valor que ocurre con mayor frecuencia; es decir, el valor mas frecuente. La moda puede no exisrir, e incluso no ser nica. En caso de existir. Ejemplos: El conjunto: 2,2,5,7,9,9,9,10,10,11,12, y 18 tiene moda 9 El conjunto 3,5,8,10,12,15, y 16 no tiene moda El conjunto 2,3,4,4,4,5,5,7,7,7, y 9 tiene dos modas 4 y 7, se llama bimodal. Una distribucin con moda nica se dice unimodal.

32

La moda puede deducirse de una distribucin de frecuencias o de un histograma de manera similar a la usada para determinar la mediana para datos agrupados. Esto se hace a partir de la frmula: A Moda = L + A + A2 L = frontera inferior de la clase que contiene a la moda A = exceso de la frecuencia modal sobre la clase inferior inmediata A2 = exceso de la frecuencia modal sobre la clase superior inmediata C = ancho del intervalo de la clase modal. c donde:

Ejemplo 2.9: El salario semanal de los 65 empleados de una empresa se muestra en la tabla inmediata al problema. Calcule el salario modal de los 65 empleados .

Salario Frecuencia Medio 255 8 265 10 275 16 285 14 295 10 305 5 315 2 N= 65

Para poder resolver este problema debemos ver que la primera columna de la tabla de distribucibn de frecuencias se refiere al salario medio de cada clase. Esto quiere decir que esta columna se refiere a la marca de clase de nuestra distribucin. Al tener una diferencia constante entre cada una de las marcas de clase, inferimos que el ancho de cada uno de los intervalos de clase tambin es constante e igual a 10 Si analizamos los datos veremos que estos se distribuyen de manera simtrica por lo que podemos suponer que la moda se encuentra cerca de la mediana o de la media. Esto nos permite concluir que la clase modal es la tercera. Con esto tenemos: L = 269.995, A = 16 - 10 = 6, A2 = 16 - 14 = 2, y c = 10. Luego

33

6 Moda = 269.995 + 2+ 6 10 = 277.50

Se pide al lector que justifique por que las variables en la frmula toman los valores arriba propuestos. Para resolver este problema hemos partido de la suposicin que la moda se encontraba cerca de la mediana o la media, lo cual nos permiti suponer cual sera la clase modal. Qu sucedera si nuestra suposicin no es vlida?. Cuando no existe la certeza de que las hiptesis hechas sean verdaderas existe otro mtodo, el cual es emprico que nos permite calcular una de las medidas en funcin de las otras 2. Esto es:

Media - moda = 3 ( media - mediana )

Al decir que esta es una frmula emprica queremos dejar claro que los resultados que se obtienen a partir de ella son aproximados. Para la solucin del problema anterior, en caso de que las suposiciones hechas no sean del todo convincentes, si es posible obtener la media y la mediana a partir de la tabla de distribucin de frecuencias proporcionada. Esto permitira calcula la moda despejndola de la frmula emprica de la cual tenemos: Moda = Media - 3 ( Media - Mediana ) En la cual sustituyendo los valores obtenidos de media y mediana podremos conocer el valor de la moda.

CONCLUSIN Y SNTESIS DEL TEMA La idea que tenemos acerca de un promedio de datos, tuvimos la oportunidad de constatar que cambia de acuerdo al caso. En algunos casos es mas conveniente usar para promediar la media aritmtica, en otros la mediana y en otros la moda. Hemos visto que es mas sencillo obtener estas medidas cuando los datos estn organizados y agrupados que cuando los tenemos dispersos. As mismo hemos visto que existen algoritmos que nos permiten calcular estas medidas de tendencia central y que sus resultados concuerdan con lo que la lgica nos dira. Hacia donde tienden los datos es importante pero no nos proporciona una idea completa de lo que est sucediendo respecto de que tan dispersos estn los mismos. Para ello pasaremos al siguiente mdulo en el que veremos que tan amalgamados estn los datos respecto de su promedio.

34

INSTRUMENTOS DE EVALUACIN DATOS GENERALES DEL EVALUADO:

DATOS GENERALES DEL EVALUADOR: MTRO. JOS LUIS MORENO Y HERMOSILLO COORDINADOR ACADMICO DE LA UNIDAD DE INGENIERAS Y CIENCIAS EXACTAS DE LA UNIVA PLANTEL PUERTO VALLARTA NOMBRE DEL CURSO: ESTADSTICA PARA NO INGENIEROS FECHA DE REALIZACIN:____________________________ EMPRESA U ORGANIZACIN:_________________________ INSTRUCCIONES DE APLICACIN:
Con el ejercicio propuesto en la evidencia de aprendizaje del mdulo anterior, calcule la media, la mediana y la moda del mismo. Analice y discuta su resultado. RESPUESTAS A LOS REACTIVOS MEDIA = 32.1 MEDIANA = 32 MODA = 32 Para la tabla de distribucin desarrollada en el problema nos encontramos que las medidas de tendencia central son muy parecidas. Esto quiere decir que la distribucin de los datos se parece mucho a una distribucin normal en la que la mayor parte de la informacin gira alrededor de un dato que es el que podemos nombrar como el representativo de los dems. Aqu sospechamos tambin que usar cualquiera de las medidas de tendencia central nos llevara a conclusiones similares. INDICADORES DE SATISFACCIN: Se deben calcular correctamente las tres medidas de tendencia central. El mtodo que se siga es irrelevante, pudindose usar en cualquiera de los casos la frmula emprica. Es muy importante llegar a la conclusin de que dado que las tres medidas se parecen mucho, es posible usar cualquiera de ellas para calcular la medida de tendencia central del problema. ESPECIFICACIN DEL VALOR DE CADA REACTIVO: Cada uno de los valores de las tres medidas de tendencia central tendrn un peso del 25% de la calificacin del reactivo y la conclusin el 25% restante. Queda a 35

criterio del evaluador analizar el avance en los clculos para otorgar la calificacin correspondiente.

CONCLUSIONES FINALES ANOTA TUS CONCLUSIONES:

DE QUE MANERA PUEDES APLICAR LO VISTO EN ESTE TEMA?

BIBLIOGRAFA: 1.- Estadstica de Murray Spiegel. Editorial Mac Graw Hill. MXICO 1998 2.- Estadstica con 720 problemas de Taro Yamane Ed Harla. MXICO 1980. FECHA DE ELABORACIN: OCTUBRE DEL 2006. ELABOR: MTRO. JOS LUIS MORENO Y HERMOSILLO REALIZ:__________________________________________________

36

TEMA 3.- MEDIDAS DE DISPERSIN O MEDIDAS DE VARIABILIDAD OBJETIVO DE APRENDIZAJE: Manejar las medidas de dispersin mas importantes aplicndolas a ejercicios prcticos con el fin de mostrar que tanta variabilidad existe en un conjunto de datos dado.

EVALUACIN PREVIA:

Auxilindose de su calculadora encuentre la raz cuadrada de: X ( A B ) + Y( C D ) = con A = 48, B = 33, C = 29, D = 33 , X= 3, Y=8 DESARROLLO DEL TEMA: La tabla de distribucin de frecuencias, el histograma y el polgono de frecuencias de un conjunto de datos, constituyen representaciones analticas y grficas del comportamiento de stos. La media y la mediana fueron usadas como medidas cuantitativas de la tendencia central; sin embargo, es conveniente adems establecer indicadores cuantitativos de la variabilidad de los datos. Tales indicadores se conocen como Medidas de Dispersin. Para ilustrar la necesidad del uso de medidas de dispersin, considrese el siguiente ejemplo. En dos cursos de computacin para nios, con doce alumnos cada uno, se obtuvieron las siguientes calificaciones Grupo A Grupo B 5,5,6,7,7,7,7,7,7,8,8,8 3,3,3,5,5,6,8,9,10,10,10,10

Calcularemos la media aritmtica, la mediana y la moda en cada grupo. Para el grupo A tenemos que: Media = 6.83 Mediana = 7 Moda = 7

Para el grupo B, tenemos que Media = 6.83 Mediana = 7 Moda = 10

37

Para los dos grupos la media y la mediana son iguales. Alguien que desconozca cuales fueron las calificaciones individuales de estos dos grupos y solamente supiera que ambos grupos tienen el mismo nmero de alumnos y la misma media aritmtica y mediana respectivamente, podra pensar que las calificaciones del grupo A y del grupo B son muy semejantes y hasta podra afirmar que son iguales. Sin embargo, mediante un ligero anlisis se podra verificar que el comportamiento de los datos de esos grupos es distintos, como puede visualizarse en el siguiente tipo de consideraciones. Supongamos que la calificacin mnima para aprobar es 7, observe lo siguiente: 1. 2. 3. 4. 5. 6. En el grupo A solamente reprob el 25% (5,5,6) En el grupo B reprob el 50% (3,3,3,5,5,6) En el grupo A ningn alumno obtuvo una calificacin superior a 8 En el grupo B un 42% obtuvo una calificacin superior a 8 En el grupo A ningn alumno obtuvo notas menores de cinco. En el grupo B el 25% obtuvo una nota menor que 5.

Resulta claro, entonces, que conocer la media aritmtica o la mediana ( o ambas ) de una coleccin de datos es muy til, pero estas medidas de tendencia central nada nos dicen respecto de su variabilidad. En este tema manejaremos las medidas de variabilidad mas comunes: el rango, y la desviacin estndar. Rango Al estudiar las distribuciones de frecuencias, se estableci el rango de un conjunto de datos como la diferencia entre el mayor y el menor de ellos. O sea, R = VM - vm Con VM = observacin mayor y vm = observacin menor

El rango es una medida de dispersin que proporciona la amplitud dentro de la cual se encuentra la totalidad de los datos u observaciones. Mientras mayor parecido se encuentre entre el rango y el valor mayor, lgicamente los datos estarn mas dispersos. Si el rango tiende a cero, quiere decir que los valores mayor y menor se parecen lo cual nos permite asegurar que los datos quedan muy cercanos entre si o lo que es lo mismo, estn poco dispersos. Sin embargo, es de suma utilidad tener informacin de la ubicacin de los datos respecto de su centro ( media o mediana ). Dado que no es posible obtener esta informacin a partir del rango, se definirn a continuacin medidas de dispersin que si la proporcionan.

38

Desviacin Estndar Definicin: Sean A1, A2, A3, ... , An , n datos y su promedio. La desviuacin estndar de estos n datos denotada por S est dada por: ( A1 - ) + ( A2 - ) + ( A3 - ) + ... + ( An - ) S = n

esto es: ( Ai - ) S = n

Ejemplo 3.1: Se obtendr la desviacin estndar S de las calificaciones de los grupos A y B que se manejaron al iniciar este mdulo. Para el grupo A, los datos son: 5,5,6,7,7,7,7,7,7,8,8,8 y = 6.833

(A1 - ) + ( A2 - ) + ... + ( A12 - ) S = 12 =

(5-6.333) + (5-6.333) + (6- 6.333) + ... + (8-6.333) S = 12 =

S = 1.0299 Para el grupo B, los datos son: 3,3,3,5,5,6,8,9,10,10,10,10 y = 6.833

Sustituyendo en la frmula para S tenemos:

39

(3 - 6.833) + (3 - 6.833) + (3 - 6.833) + (5 - 6.833) + ... + (10- 6.833) S = 12

S = 2.853 puntos de calificacin. Estos resultados son consistentes con las observaciones hechas sobre las calificaciones del grupo A y del grupo B al inicio del tema, de las cuales se desprenda que la dispersin de los datos alrededor de = 6.833 es mayor en el grupo B que en el grupo A. La desviacin estndar del grupo B es de 2.853 y para el grupo A es de 1.0299 puntos de calificacin. Esto nos permite concluir que la distribucin de datos fue distinta a pesar de que dos de sus medidas de tendencia central coincidieron. De aqu que es importante el manejo de las medidas de dispersin adems de la media, la mediana y la moda. Ejercicio 3.2: En el departamento de pintura de una fbrica automotriz se registr el espesor en micras de la pelcula de pintura para una muestra de 9 puertas de automvil, obtenindose los siguientes resultados: 1.13 1.06 1.18 1.08 1.12 1.14 1.26 1.10 1.18

Calcule la media aritmtica de los 9 datos y su desviacin estndar.

Si los datos estn agrupados en tablas de distribucin de frecuencias, la desviacin estndar se puede calcular: f i ( Ai - ) S = n

en donde f i es la frecuencia absoluta de la clase i; Ai es la marca de clase del intervalo i; y n es el nmero total de datos ( ser la suma de todas las frecuencias ) Ejemplo 3.3: La distribucin de frecuencias absolutas dada a continuacin corresponde al tiempo de vida, en horas, de los 30 focos para seales direccionales del inicio de este mdulo Obtenga la desviacin estndar de la misma. |

40

Interval Lmite os inferior

1 2 3 4 5 1

179.5 218.5 257.5 296.5 335.5

Lmite Marca Frecuen Marca de Frec. Por superior de cias clase por Diferencia clase Absoluta frecuencia De s (Ai ) 218.5 199 3 597 15900 257.5 238 8 1904 9140 296.5 277 12 3324 325 335.5 316 4 1264 7815 374.5 355 3 1065 20767 Suma 8154 53947

8154 Media = 30 = 271.8 = entonces:

53947 ( f i ( Ai - ) ) S = N = 30 = 42.41

Observemos que la desviacin estndar es muy pequea respecto de la media. Esto nos lleva a concluir que los datos en esta distribucin de frecuencias no estn muy dispersos.

Ejercicio 3.4: Calcular y analizar la desviacin estndar del conjunto de datos cuya distribucin de frecuencias aparece en la tabla siguiente:

Salario Frecuencia Medio 255 8 265 10 275 16 285 14 295 10 305 5 315 2 N= 65

41

CONCLUSIN Y SNTESIS DEL TEMA Dada una distribucin de frecuencias, las medidas de tendencia central pueden dar una visin engaosa de un proceso o servicio. Una forma de complementar dicha informacin, como pudimos ver, es medir la variabilidad de la misma. Esta se puede medir, entre otros, por medio de dos instrumentos: El Rango y la desviacin tpica o Estndar. Mientras mas pequeo sea el valor que se obtiene respecto de la media implica que los datos estn menos dispersos.

INSTRUMENTOS DE EVALUACIN DATOS GENERALES DEL EVALUADO:

DATOS GENERALES DEL EVALUADOR: MTRO. JOS LUIS MORENO Y HERMOSILLO COORDINADOR ACADMICO DE LA UNIDAD DE INGENIERAS Y CIENCIAS EXACTAS DE UNIVA PLANTEL PUERTO VALLARTA NOMBRE DEL CURSO: ESTADSTICA Y MATEMTICAS ADMINISTRATIVAS FECHA DE REALIZACIN:____________________________ EMPRESA U ORGANIZACIN:_________________________ INSTRUCCIONES DE APLICACIN:
Con los datos de la tabla de la evidencia de aprendizaje del mdulo 1, calcule la desviacin tpica de la misma y analice su resultado. RESPUESTAS A LOS REACTIVOS: DESVIACIN TPICA = 2.3729 El valor obtenido es porcentualmente muy pequeo comparado con cualquiera de las medidas de tendencia central del problema. Esto quiere decir que el mismo presenta una dispersin muy pequea lo cual reafirma el por qu las medidas de tendencia central resultaron con valores muy parecidos. De aqu que podemos decir que nuestro problema presenta una variabilidad muy pequea. INDICADORES DE SATISFACCIN:

42

Se debe calcular la medida de dispersin solicitada y dar el comentario respecto de la misma.

ESPECIFICACIN DEL VALOR DE CADA REACTIVO: La medida de dispersin tiene un peso del 65% del reactivo y el 35% restante lo dar la conclusin respecto del valor obtenido.

CONCLUSIONES FINALES ANOTA TUS CONCLUSIONES:

DE QUE MANERA PUEDES APLICAR LO VISTO EN ESTE TEMA?

BIBLIOGRAFA: 1.- Estadstica de Murray Spiegel. Editorial Mac Graw Hill. MXICO 1998 2.- Estadstica con 720 problemas de Taro Yamane Ed Harla. MXICO 1980. FECHA DE ELABORACIN: OCTUBRE DEL 2006. ELABOR: MTRO. JOS LUIS MORENO Y HERMOSILLO REALIZ:__________________________________________________

43

44

También podría gustarte