Está en la página 1de 15

MEDIDAS DE RESUMEN INTRODUCCIN.

Son valores numricos que sirven para caracterizar un conjunto de datos; es decir, que nos permiten describir el comportamiento de los datos. Se clasifican en medidas de Tendencia Central, medidas de posicin, medidas de Dispersin y medidas de Forma. MEDIDAS DE TENDENCIA CENTRAL O DE POSICIN. Son medidas de resumen que nos indican alrededor de qu valor se agrupan o concentran los datos. Son medidas de Tendencia Central o Centralidad: la Media Aritmtica, la Mediana, la Moda, la Media Geomtrica. La Media Aritmtica. Conocida tambin como promedio o simplemente media, se define como el cociente de la suma de los datos y el tamao de la muestra. Sean los datos X 1 , X 2 , X 3 ,..., X n la media aritmtica se denota con X y se define como:

X =

X 1 + X 2 + X 3 + ... + X n n

o, utilizando el signo de suma:

X =

X
i =1

(1)

Calcule la media de los siguientes conjuntos de datos: A: 13, 17, 20, 10, 12, 18 B : 11.8, 13.6, 14.2, 16.5, 12.5, 18.5, 14.6, 15.4 Dados los siguientes datos: 20, 24, 22, 25, 28, 20, 20, 20, 22, 22, 20, 24, 25, 28, 20, 24, su media aritmtica es: 20 + 24 + 22 + 25 + 28 + 20 + 20 + 20 + 22 + 22 + 20 + 24 + 25 + 28 + 20 + 24 X = 16 20 + 20 + 20 + 20 + 20 + 20 + 22 + 22 + 22 + 24 + 24 + 24 + 25 + 25 + 28 + 28 X = 16 20(6) + 22(3) + 24(3) + 25(2) + 28(2) X = (2) 16 120 + 66 + 72 + 50 + 56 364 X = = = 22.75 16 16 El numerador de (2) se puede disponer en una tabla como: Xi fi Xifi 20 6 120 22 3 66 24 3 72 25 2 50 28 2 56 Total 16 364 Puede utilizarse cuando los datos se repiten la frmula:

X =

X
i =1

fi

(3)

La frmula (3) tambin puede utilizarse cuando los datos estn agrupados en una distribucin de frecuencias, siendo los Xi los puntos medios de los intervalos.

Dada la distribucin de frecuencias: Intervalos fi 10-<16 7 16-<22 13 22-<28 15

Xi 13 19 25

fi 7 13 15

Xifi 91 247 375

10 5 50 Aplicando la frmula (3) 1208 X = = 24.16 50 Calcule la media aritmtica de: (a) Xi 12 13 14 15 16 fi 4 6 7 13 10 (b)

28-<34 34-<40

31 37

10 5 50

310 185 1208

Intervalos 7-<13 13-<19 19-<25 25-<31 31-<37

fi 7 13 15 10 5

La Mediana Calcule la mediana de los siguientes datos: A: 5, 7, 9, 11, 13 B: 8, 10, 11, 13, 15, 16 C: 12, 7, 8, 10, 3, 5, 9, 15 C: 3,5,7,8,9,10,12,15 La mediana es el valor que se encuentra en el centro de un conjunto ordenado de datos. As, para obtener la mediana de un conjunto de datos, previamente debe ordenarse los datos de menor a mayor. Luego debe determinarse el lugar que n +1 ocupa la mediana calculando . Si el nmero de datos es impar la mediana es el dato que se encuentra en el centro 2 y, si el nmero de datos es par, la mediana es el promedio de los dos valores que estn en el centro. Calcule la mediana para los siguientes datos: A: 8, 5, 2, 9, 12, 7, 16, 4, 10 B: 12, 10, 8, 5, 9, 11, 14, 7,15, 13 C: Xi 4 6 8 10 fi 3 5 8 6 Mediana para datos agrupados en intervalos. Para el clculo de la mediana se procede de la siguiente manera: a) Se obtienen las frecuencias absolutas acumuladas b) Se identifica el intervalo que contiene a la mediana. n +1 2 El intervalo de la mediana es el intervalo que tiene como frecuencia absoluta acumulada a F i , la frecuencia n +1 absoluta acumulada menor tal que Fi > 2 c) Se utiliza la frmula: n +1 ( Fi 1 ) Me = LRI + c 2 fi Donde LRI: es el lmite real inferior del intervalo mediano. C: la amplitud del intervalo mediano. Fi-1 : frecuencia acumulada del intervalo que antecede al intervalo mediano. fi : es la frecuencia simple del intervalo mediano. Ejemplo: Intervalos fi Fi 7-<13 7 7 13-<19 13 20 = Fi-1 19-<25 15=fi 35 = Fi 25-<31 10 45 31-<37 5 50 n + 1 50 + 1 = = 25.5 2 2

12 4

14 2

Como 35 es la frecuencia acumulada menor tal que 35 > 25.5, el intervalo que contiene a la mediana es el intervalo 19-< 25. As: LRI = 19, c = 6, Fi-1 = 20 y fi = 15. La mediana es: ( 25.5 20) Me = 19 + 6 = 19 + 2.2 15 Me = 21.1 Significa que el 50% de los datos son menores que 21.1 y el otro 50% de los datos son mayores que 21.1 Ejercicio. Calcule la mediana de los datos de la distribucin: Intervalos fi 3-<11 5 11-<19 7 19-<27 8 27-<35 13 35-<43 17 43-<51 10 La moda. Cul es la moda en los siguientes conjuntos de datos: A : 3, 5, 7, 5, 8, 5, 2, 5 Mo=5 B: 5, 5, 3, 4, 7, 7, 7, 8, 5 Mo=5 y 7 tienen distribucin bimodal C: 5, 3, 7, 9, 8, 1, 12, 11 No hay moda Qu es moda? La moda es el dato que ms se repite. Es el dato que tiene mayor frecuencia. Cul es la moda en la distribucin: Xi 4 6 8 10 12 14 fi 3 5 12 6 4 2 Mo=8 Moda en datos agrupados en intervalos: Intervalos fi 3-<11 5 11-<19 7 19-<27 8 27-<35 13 = fi-1 35-<43 17 =fi 43-<51 10 =fi+1 Para hallar la moda se procede as: a) Se determina el intervalo que contiene a la moda( intervalo de mayor frecuencia) b) Se aplica la frmula: 1 ) donde Mo = LRI + c ( 1 + 2 1 = f i f i 1 y 2 = f i f i +1 siendo f i la frecuencia simple del intervalo modal, f i la frecuencia simple del intervalo que precede al 1 modal, y f i + 1 la frecuencia simple del intervalo que sigue al modal. Para el ejemplo, el intervalo modal es 35 -< 43, por lo tanto la moda es : 4 Mo = 35 + 8 ( ) = 35 + 2.9 = 37.9 4 +7 Ejercicio. Halle la moda de: Intervalos fi 12-< 17 5 17-< 22 8 22-< 27 15 27-< 32 22 32- < 37 17 37- < 42 13

La media geomtrica. Es la raz n-sima de X1. X2. X3. ... Xn, es decir:
X g = n X 1 X 2 ... X n As la media geomtrica de 4, 6, 8, 10 es: X g = 4 4 x6 x8 x10 = 6.62

Ejercicio. Hallar la media geomtrica de: 3, 5, 7, 9, 11. MEDIDAS DE POSICIN Estas medidas, llamadas tambin cuantiles, dividen a un conjunto de datos ordenados en grupos iguales. Entre estas medidas tenemos a los cuartiles, a los deciles y a los percentiles. CUARTILES Son tres valores Q1, Q2 y Q3 que dividen al conjunto de datos ordenados en cuatro grupos iguales: _______ !_______!_______!______ 25% Q1 25% Q2 25% Q3 25% El cuartil 1, Q1 , es el valor que supera al 25% de los datos y es superado por el 75% de los datos. Qu es el cuartil 2, Q2 ? El cuartil 3, Q3 , es el valor que supera al 75% de los datos y es superado por el 25% de los datos. Calculo del cuartil Qi Se ordenan los datos. Se ubica el lugar que ocupa el cuartil, calculando El cuartil Qi , es el valor que ocupa el lugar i = 1, 2, 3. donde i = 1, 2, 3. En todo caso, realizamos una interpolacin, para

obtener el cuartil. Ejemplo Datos: 13, 8, 5, 20, 25, 22, 16, 2, 10, 15, 7, 11 Q3 =? Datos ordenados: 2, 5, 7, 8, 10, 11, 13, 15, 16, 20, 22, 25 Lugar que ocupa el Q3: = 9.75 Es un valor que est entre el dato que se encuentra en el lugar 9 y el dato que se encuentra en el lugar 10. = 16 + 0.75 ( 20- 16) = 16 + 3 = 19 Significa que el 75% de los datos son menores que 19 y el 25% de los datos son mayores que 19. Q2 = 11 + 0.5 ( 13-11)=12 DECILES Son nueve valores D1, D2, , D9 que dividen a un conjunto ordenado de datos en diez grupos iguales. Qu significa D 2? Qu significa D6? PERCENTILES Son 99 valores P1, P2, , P99 que dividen a un conjunto ordenado de datos en 100 grupos iguales. Qu significa P30? Qu significa el P80? Podemos notar que el Q2 = Md, Q3 = P75 , Q1 = P25, P50 = D5 = Md Cuantiles para datos agrupados en intervalos.

Hallando percentiles, hallamos tambin los deciles y cuartiles. Para hallar los percentiles seguimos el procedimiento siguiente: Para hallar el percentil Pr 1) Obtenemos las frecuencias acumuladas. 2) Identificamos el intervalo del percentil. Calculamos:

3) Aplicamos la frmula:

Pr = L + c ( Donde L es el lmite inferior verdadero del intervalo Fj-1 es la frecuencia acumulada fj es frecuencia simple del intervalo del percentil c la amplitud del intervalo. Ejemplo: Dada la distribucin de frecuencias obtener el Percentil 40. Intervalos fi Fi 20-27 8 8 28-35 12 20 36-43 15 35 44-51 20 55 52-59 17 72 60-67 9 81 68-75 3 84 Identificamos intervalo de P40 =33.6 El intervalo del percentil 40 es 36-43 P40 = 35.5 + 8( P40 = 35.5 + 7.25 P40 = 42.75 El 40% de los datos son menores que 42.75 y el 60% de los datos son mayores que 42.75. Calcule el decil 4. inmediata menor que

MEDIDAS DE DISPERSIN A y B son dos conjuntos de datos: A: B: 121 90.5 119 122 118 140 118.5 121.5 95.5 144.5

149.5 100

Calcule la media para los dos conjuntos. En un solo segmento construya el diagrama de puntos para ambos conjuntos. Las medidas de dispersin miden la diseminacin, el grado de esparcimiento de los puntos. Tambin se llaman medidas de variabilidad.. Los puntos del conjunto B tienen mayor diseminacin que los puntos del conjunto A. Entre las medidas de dispersin tenemos a las siguientes: Rango. Llamado tambin recorrido o alcance, es la diferencia entre el dato mayor y el dato menor: Rango = Xmayor - Xmenor Calcule los rangos de los conjuntos A y B. Varianza. Si a cada uno de los datos del conjunto A le restamos la media obtenemos las desviaciones de los datos con respecto a su media. Estas desviaciones son: 1 -1 2 -2 -1.5 1.5

Cul es la suma de estas desviaciones? Cules son los cuadrados de estas desviaciones? Sume los cuadrados de las desviaciones y divida la suma por el nmero de datos menos uno. El resultado obtenido se llama varianza de la muestra y se denota con S 2. S2 = 1 + 1 + 4 + 4 + 2.25 + 2.25 = 2.9 5

Calcule la varianza de los datos del conjunto B. Las desviaciones se denotan: X i X . Cuntas son estas? La frmula para la varianza de la muestra es:

S2 =

(X

X )2

n 1

Al elevar al cuadrado las diferencias y distribuyendo la sumatoria, se obtiene una frmula de mayor uso en la prctica:

S2 =

X i2

( X i ) 2 n
PARA DATOS NO AGRUPADOS

n 1

Para obtener la varianza de los datos del conjunto A: X i2 Xi 121 14641 119 14161 122 14884 118 13924 118.5 14042.25 121.5 14762.25 720.0 86414.5 La varianza es:

S2 =

86414.5 5

(720) 2 86414.5 86400 = 6 5

S2 = 2.9 Calcule la varianza para los datos del conjunto B. Cmo se calcula la varianza para datos agrupados en una distribucin de frecuencias? Varianza para datos agrupados en una distribucin de frecuencias La frmula que se utiliza es:

S2 =

X i2 f i

( X i f i ) 2 n

donde Xi son puntos medios de los intervalos. Ejemplo. Dada la distribucin de frecuencias: Intervalos fi Xi 3-<11 5 7 11-<19 7 15 19-<27 8 23 27-<35 13 31 35-<43 17 39 43-<51 10 47 60

n 1

fi 5 7 8 13 17 10 60

Xifi 35 105 184 403 663 470 1860

X i2 f i 245 1575 4232 12493 25857 22090 66492

S =

66492

(1860) 2 60 = 66492 57660 59 59

= 149.69 La desventaja de la varianza es que est expresada en el cuadrado de las unidades; es decir, si los datos estn dados en metros la varianza est dada en m2 o si los datos estn dados en segundos la varianza est dada en segundos 2. La desviacin estndar. Llamada tambin desviacin tpica, es la raz cuadrada de la varianza. Se la denota con S. La desviacin estndar, a diferencia de la varianza, se expresa en las unidades de los datos. Para los datos agrupados, del ejemplo, su desviacin estndar es: S = 149.69 = 12.23 El coeficiente de variacin. Es una medida relativa de dispersin y se define como: S x100% X Expresa qu porcentaje de la media es la desviacin estndar. C.V. = Ejemplos, el coeficiente de variacin para el conjunto A es: 1.70 x100% = 1.42% 120 La desviacin estndar es el 1.42% de la media. C.V. = Calcule el coeficiente de variacin para los datos de la distribucin de frecuencias. El coeficiente de variacin sirve para comparar la dispersin dos o ms conjuntos de datos que tienen diferentes unidades de medidas.

Tambin sirve para comparar la dispersin de dos o ms conjuntos de datos que difieren en media aritmtica. Dados los conjuntos de datos: C : 65, 68, 70, 64, 60 D: 7, 9, 5, 3, 10 que son los pesos, en kilogramos, de un conjunto de personas adultas y de un conjunto de nios, respectivamente. En qu conjunto hay mayor dispersin?. Las medias de los conjuntos son X A = 65.4kg y X B = 6.8kg y las desviaciones estndar S A = 3.85kg y S B = 2.86kg , respectivamente. De acuerdo a las desviaciones estndar podemos estar tentados a afirmar que en el conjunto A hay mayor dispersin que en el conjunto B, Sin embargo, los coeficientes de variacin nos permiten dar una respuesta correcta a la pregunta. 3.85 2.86 x100% = 5.89% y C.V.B = x100% = 42.06% C.V.A = 65.4 6.8 MEDIDAS DE FORMA Sirven para describir las deformaciones horizontales o verticales de una distribucin de los datos. Tenemos a las medidas de asimetra y de apuntamiento. MEDIDAS DE ASIMETRIA Estas medidas describen las deformaciones horizontales. Para este propsito se utiliza el coeficiente de asimetra.

Si Si Si

> 0, la distribucin tiene asimetra positiva; = 0, la distribucin es simtrica; < 0, la distribucin tiene asimetra negativa

MEDIDAS DE APUNTAMIENT0 Describen las deformaciones verticales. Con este propsito se utiliza el coeficiente de apuntamiento.

Si Si Si

, la distribucin es platicrtica; = 0 , la distribucin es mesocrtica; > 0, la distribucin es leptocrtica

EJERCICIOS PROPUESTOS 1. Encuentre la Media Aritmtica de las edades de los alumnos del V ciclo de Administracin del Instituto Superior Tecnolgico Trujillo. Las cuales son: 30, 27, 37, 40, 29, 49, 31, 33 e Interprete su resultado. 2. Los datos representan los sueldos de los trabajadores Administrativas del Hospital Carrin: 800, 1100, 750, 1200, 1000, 1800 soles. Halle el sueldo promedio e interprete. 3. La nota mnima para aprobar una asignatura es 11. Si un estudiante obtiene las notas: 12, 08, 9.5, 13.5, 8.5, 10, 11.5, 14 en los trabajos mensuales de la asignatura en cuestin. El estudiante fue aprobado?. 4. Dada la siguiente distribucin: Xi 1 2 3 4 5 fi 2 4 7 3 3 Determinar e interpretar la media, mediana y moda

5. Una empresa desea investigar el grado de conocimientos que posee su personal. Para llevar acabo una capacitacin. Para dicha investigacin se tomo un examen escrito a todo el personal que arrojo los siguientes resultados: Puntuacin N de empleados 0-30 94 30-50 140 50-70 160 70-90 98 90-100 8 Nota: si la media es >= 50 puntos no habr capacitacin. Hallar la media aritmetica y si ser necesario la capacitacin en dicha empresa. 6. Las longitudes, en minutos, que 10 pacientes esperan en el consultorio de un doctor antes de recibir el tratamiento se registraron como sigue: 5, 11, 9, 5, 10, 15, 6, 10, 5 y 10. Encuentre: a) La media b) la mediana c) la moda d) el rango e) La varianza f) la desviacin estndar g) el coeficiente de variacin. 7. Los siguientes datos muestran la cantidad de fosfatos por carga de lavado, en gramos, para una muestra aleatoria de diversos tipos de detergentes que se usan de acuerdo con las instrucciones prescritas: 48, 47, 42, 42, 41, 34, 31, 30, 29, 29, 29, 26. Para los datos de fosfatos dados, encuentre: a) La media aritmtica b) la mediana c) la moda d) el rango e) la desviacin estndar f) el coeficiente de variacin. 8. Las duraciones en miles de horas de un grupo de eco grafos son: Duracin N de eco grafos 26 7 6 10 13 10 14 18 14 18 22 18 22 14 22 26 6 Para estos datos calcule: a) Los puntos medios de los intervalos b) La media c) La mediana d) La moda e) La varianza f) La desviacin estndar g) El coeficiente de variacin h) Los cuartiles, D4 , P5 , P88 9. Para los datos del ejercicio 8, obtenga: a) La distribucin de frecuencias porcentuales b) La distribucin de frecuencias porcentuales acumuladas c) Construya un histograma para la distribucin de frecuencias de a) d) Construya una ojiva con la distribucin de frecuencias dada en b) 10. Los siguientes datos son precios (en soles) de renta mensual para una muestra de 10 departamentos sin amoblar en el centro de una ciudad grande, y una muestra de 10 departamentos sin amoblar de la periferia. Centro de la ciudad: 955 1000 985 980 940 975 965 999 1247 1119 Periferia: 750 755 725 705 694 725 690 745 575 800 a) Para cada conjunto de datos calcule: la media, desviacin estndar y coeficiente de variacin. b) Qu puede decirse acerca de los departamentos sin amoblar que rentan en el centro de la ciudad y en la periferia? Compare las rentas de las dos reas. 11. Los siguientes datos representan muestras de 20 problemas que reportaron los clientes en dos oficinas diferentes de una compaa telefnica, y el tiempo, que tom resolverlos (en minutos) Tiempo para resolver problemas en la central I 1.48 1.75 0.78 2.85 o.52 1.60 4.15 3.97 1.48 3.10

1.02 0.53 0.93 1.60 0.80 1.05 6.32 3.93 5.45 0.97 Tiempo para resolver problemas en la central II 7.55 3.75 0.10 1.10 0.60 0.52 3.30 2.10 0.58 4.02 3.75 0.65 1.92 0.60 1.53 4.23 0.08 1.48 1.65 0.72 Para cada una de las oficinas de la central telefnica: a) Calcule: Media aritmtica, rango, desviacin estndar y coeficiente de variacin. b) Con base en los resultados del inciso c) Existen diferencias entre las dos oficinas? 12. La siguiente muestra representa las edades de 25 personas sometidas a un anlisis de preferencias para un estudio de mercado: 25 19 21 35 44 20 27 32 38 33 18 30 19 29 33 26 24 28 39 31 31 18 17 30 27 Calcular e interpretar la media aritmtica y determinar la varianza. 13. Calcular la varianza de las siguientes cantidades medidas en metros: 3, 3, 4, 4, 5 14. Los siguientes datos son las calificaciones reportadas por el profesor: Calificacio N Alumnos nes 0-1 1 2-3 1 4-5 3 6-7 0 8-9 5 10-11 4 12-13 6 14-15 10 Hallar la desviacin estndar. 15. Los datos siguientes corresponden al tiempo en seg. necesario para procesar 25 trabajos en una CPU: 0.02 0.75 1.17 1.61 2.59 0.15 0.82 1.23 1.94 3.07 0.19 0.92 1.38 2.01 3.53 0.47 0.96 1.40 2.16 3.76 0.71 1.16 1.59 2.41 4.75 Vamos a calcular distintas medidas de centralizacin y a comentarlas. 16. En una Universidad que ofrece un programa de postgrado especializado en manejo de desechos peligrosos. Para planificar futuros cambios, se hizo una encuesta para determinar los antecedentes y objetivos de los 223 estudiantes que actualmente estn inscritos en el programa (Fuente: Journal of Professional Issues in Engineering, abril de 1990). La grfica circular muestra un desglose de las licenciaturas que cursaron los 223 estudiantes. Interprete la grfica. Transforme este grfico en un grfico de barras donde se muestren las frecuencias absolutas.

17.Qu forma tiene las distribuciones descritas por las siguientes medidas de tendencia central?: a. Media = 46, Mediana = 42, Moda = 39.

b. Media = 3,1, Mediana = 3,1, Moda = 3,1. c. Media = 105, Mediana = 110, Moda = 115. 18. Determine si las siguientes aseveraciones son verdaderas falsas. Una aseveracin verdadera tiene que ser siempre verdadera. a. El rango entre cuartiles es la mitad del rango. b. El promedio est siempre entre el primer y tercer cuartil. c. La mediana est siempre entre el primer y tercer cuartil. d. La desviacin estndar de una distribucin simtrica es siempre igual al rango entre cuartiles. e. El promedio de una distribucin simtrica es siempre igual a la mediana. 19. Un Profesor le entrega las notas en el primer control y les dice que el promedio fue de 5,7. Si usted obtuvo un 6,2: a. Puede su nota ser la mxima? b. Puede ser que el 50% de los estudiantes tuvieron mejor nota que usted? c. Si adems el Profesor da la desviacin estndar, Con cul se sentira mejor: con una desviacin estndar de 0,6 con una de 1,1? Explique. 20. Un estudio encontr que los estudiantes hombres de una Universidad pesaban en promedio 66 kilos con una desviacin estndar de 9 kilos. Las mujeres pesaban en promedio 55 kilos, con una desviacin estndar de 9 kilos. a. Puede decir si el estudiante de ms peso es Un hombre una mujer? Explique. b. Encuentre el promedio y la desviacin estndar en libras (1 kg = 2,2 libras). c. Si juntamos los hombres y las mujeres, la desviacin estndar ser: Menor que, mayor que igual a 9? 21. Los estudiantes de Sociales siempre manifiestan que tienen mayor dificultad en los cursos que involucre el tratamiento de clculos matemticos, es por ello que se realiz una medicin de la memoria en estudiantes de primer ao de la carrera. La experiencia consisti en exponer 10 palabras y 10 nmeros ante los estudiantes durante 10 segundos. Despus de cuatro das de clases, se pidi a los alumnos que recordaran las palabras y nmeros que se haban mostrados previamente, registrndose los siguientes resultados:

a. En trmino medio, Qu cantidad de palabras y nmeros recuerdan los estudiantes? b. Cul es la cantidad de palabras y de nmeros que recuerdan con mayor frecuencia? c. Determine la mediana de ambos casos. Interprete sus resultados. d. En cul de los dos grupos se recopil una informacin ms homognea? 22. Dos Profesores (A y B) estn interesados en estudiar los hbitos de sueo de los estudiantes en sus clases. Ambos profesores registran el tiempo (en minutos) que demoran en quedarse dormidos sus alumnos desde que empieza la clase. El grfico siguiente muestra los tiempos que demoran en quedarse dormidos los alumnos del profesor A.

a. Cul es el valor aproximado de las medidas de dispersin del tiempo del Profesor A? b. Qu porcentaje de alumnos se queda dormido antes de los 14 minutos con el Profesor A? Justifique. c. Los datos del Profesor B son los siguientes: 10,5 11,3 11,9 12,0 12,3 12,3 12,5 12,7 13,4 13,7 13,8 14,2 14,8 15,1 15,3 16,7 16,8 18,8 20,8 Construya un diagrama de caja (junto al diagrama de caja del profesor A) correspondiente a los tiempos en que se quedan dormidos los alumnos en la clase del Profesor B y compare ambos grupos respecto de la variable en estudio.

DIAGRAMA DE TALLO Y HOJAS


A continuacin mostramos un diagrama de tallo y hojas para la variable Talla. 3 1.3 | 468 6 1.4 | 467 13 1.5 | 1223489 23 1.6 | 3455678899 (9) 1.7 | 024445688 18 1.8 | 000349 12 1.9 | 0034566889 2 2.0 | 02 El recorrido de la variable se ha dividido en 8 partes (los tallos), que vienen representados por los valores 1.3, 1.4, 1.5, etc. Los valores que le siguen, tras la lnea vertical, son las hojas que corresponden a cada tallo. As en el primer tallo tenemos las hojas 4, 6, 8. Esta rama corresponde a los datos ms pequeos de la variable talla 1.34, 1.36, 1.38. La frecuencia acumulada de cada rama esta especificada a su izquierda. As la frecuencia de la primera rama es 3, la de la segunda tambin es 3, pero la acumulada es 6. En este caso la acumulacin de las frecuencias se hace por ambos lados de la tabla hasta llegar al tallo que contiene a la mediana. Este tallo contiene 9 elementos como est indicado entre parntesis. Esta representacin tiene la ventaja de que superpone una tabla de frecuencias y una representacin grfica dada por la forma que toman los nmeros, y que es similar al histograma de frecuencias. Adems no hay prdida de informacin, ya que se puede reconstruir todos los datos de la variable primitiva contenida en la muestra a partir de esta representacin.

GRFICA DE CAJA Y BIGOTES (BOX AND WHISKER)

En est grfica los datos se dividen en cuatro intervalos de igual frecuencia. La parte ancha, llamada Caja, contiene el 50% central de los datos de la variable. Comienza en el primer cuartil y termina en el tercer cuartil. La muestra de la caja marca la mediana (la definicin de mediana y de cuartil se ver ms adelante en el apartado de medidas de posicin). En el grfico de BoxWhisker correspondiente a la variable Talla, que aparece a continuacin, se ha marcado adems un punto, que corresponde a la media aritmtica de los valores muestrales.

Las dos lneas horizontales se llaman Bigotes y se extienden a derecha e izquierda de la Caja. El bigote de la izquierda comienza por el dato ms pequeo que dista del primer cuartil menos que 1.5 veces el rango intercuartlico (distancia entre el primer y tercer cuartil). En este caso corresponde al valor 1.34 El bigote de la derecha acaba en el mayor valor de la variable talla que diste del tercer cuartil menos que 1.5 veces el rango intercuartlico. Corresponde en este caso al valor mayor de la variable talla que es 2.02. A veces hay valores de la variable que sobresalen de los bigotes. Estos valores se clasifican como valores atpicos (Outliers). Las tablas y las grficas pretenden ordenar y clarificar la informacin contenida en la muestra. En los casos tratados, excepto en el caso del diagrama de tallo y hojas, siempre se hace perdiendo parte de informacin. En el siguiente apartado se darn algunos definiciones que pretenden reducir la informacin contenida en la muestra de una forma an ms drstica: a slo unos cuantos valores, los parmetros estadsticos de la muestra. Entre ellos destacamos las medidas de posicin y las de dispersin. Ejercicios: 7. Las longitudes, en minutos, que 10 pacientes esperan en el consultorio de un doctor antes de recibir el tratamiento se registraron como sigue: 5, 11, 9, 5, 10, 15, 6, 10, 5 y 10. Encuentre: b) La media b) la mediana c) la moda d) el rango e) La varianza f) la desviacin estndar g) el coeficiente de variacin. 2. Los siguientes datos muestran la cantidad de fosfatos por carga de lavado, en gramos, para una muestra aleatoria de diversos tipos de detergentes que se usan de acuerdo con las instrucciones prescritas: 48, 47, 42, 42, 41, 34, 31, 30, 29, 29, 29, 26. Para los datos de fosfatos dados, encuentre: a) la media aritmtica b) la mediana c) la moda d) el rango e) la desviacin estndar f) el coeficiente de variacin. 3. Las duraciones en miles de horas de un grupo de ecografos son: Duracin N de ecografos 25 7 69 13 10 13 18 14 17 22 18 21 14 22 25 6 Para estos datos calcule: i) Los puntos medios de los intervalos j) La media k) La mediana l) La moda m) La varianza n) La desviacin estndar o) El coeficiente de variacin p) Los cuartiles, D4 , P5 , P88

4. Para los datos del ejercicio 3, obtenga: e) La distribucin de frecuencias porcentuales f) La distribucin de frecuencias porcentuales acumuladas g) Construya un histograma para la distribucin de frecuencias de a) h) Construya una ojiva con la distribucin de frecuencias dada en b) 5. Los siguientes datos son precios (en soles) de renta mensual para una muestra de 10 departamentos sin amoblar en el centro de una ciudad grande, y una muestra de 10 departamentos sin amoblar de la periferia. Centro de la ciudad 955 1000 985 980 940 975 965 999 1247 1119 Periferia 750 755 725 705 694 725 690 745 575 800 c) Para cada conjunto de datos calcule: la media, desviacin estndar y coeficiente de variacin. d) Qu puede decirse acerca de los departamentos sin amoblar que rentan en el centro de la ciudad y en la periferia? Compare las rentas de las dos reas. 6. Los siguientes datos representan muestras de 20 problemas que reportaron los clientes en dos oficinas diferentes de una compaa telefnica, y el tiempo, que tom resolverlos (en minutos) Tiempo para resolver problemas en la central I 1.48 1.75 0.78 2.85 o.52 1.60 4.15 3.97 1.48 3.10 1.02 0.53 0.93 1.60 0.80 1.05 6.32 3.93 5.45 0.97 Tiempo para resolver problemas en la central II 7.55 3.75 0.10 1.10 0.60 0.52 3.30 2.10 0.58 4.02 3.75 0.65 1.92 0.60 1.53 4.23 0.08 1.48 1.65 0.72 Para cada una de las oficinas de la central telefnica: c) Calcule: Media aritmtica, rango, desviacin estndar y coeficiente de variacin.

d) Con base en los resultados del inciso a) Existen diferencias entre las dos oficinas?