Está en la página 1de 10

UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

El estudio de esta unidad le permitirá: PRÓLOGO: UN CASO ILUSTRATIVO


En nuestra vida diaria es común escuchar la palabra “promedio”. Se habla de
Interpretar el significado de los gráficos de las medidas de tendencia central y “el tipo promedio”, el promedio de las calificaciones, el promedio de los
de posición, lo cual presupone, específicamente: aumentos de precios, de las ganancias o pérdidas de un sector económico o de
una empresa, etc. Los periódicos, en todas sus secciones, pero sobre todo en
 Realizar un análisis exploratorio de datos las de negocios o financieras, nos presentan una serie de promedios de tasas
 Resumir un conjunto de datos por medio de medidas de tendencia de interés, de aumento o disminución de exportaciones o importaciones, de
central y de posición compra o venta de acciones bursátiles, etc.
 Calcular varios promedios para describir un valor representativo cercano Por ejemplo, según la Secretaría de Turismo y el Centro de Estudios
al centro de las observaciones, tanto para datos no agrupados como Superiores de Turismo (CESTUR),1 “los turistas mexicanos realizan sus viajes
para datos agrupados durante dos fechas: verano y Semana Santa, en promedio, el 36% en verano y
 Comprender la utilidad de cada uno de los promedios a calcular. el 17% en Semana Santa; gastan, en promedio, más durante sus vacaciones
 Representar gráficamente las medidas de tendencia central y de de verano que durante Semana Santa; el gasto promedio por persona va de
posición. los $420.00 a los $530.00 diarios, de los cuales la tercera parte va para
alimentos; más de la mitad de los viajes se realizan en automóvil propio, cuatro
UNA MIRADA AL TEMA de cada diez, por autobús y sólo siete de cada cien se realiza por avión. En
cuanto a los lugares de hospedaje, cuatro de cada diez turistas se hospedan en
En la primera unidad usted observó que cuando se recolectan datos de una casa familiar, el 40% lo hace en hoteles, un 6% en casa propia y el resto lo
muestra o de una población (vía una encuesta, una fuente publicada o un hace en otros inmuebles. El valor del mercado del consumo turístico nacional
experimento) suelen presentarse aleatoriamente, es decir, sin orden o patrón es de 80 mil millones de dólares al año, en promedio”.
alguno, de manera que resulta necesario que usted los ordene, organice,
agrupe y/o grafique, con el fin de que proporcionen información susceptible de Como se aprecia en la nota anterior, los promedios nos acompañan
ser analizada. diariamente y, de alguna manera, sabemos que son cifras representativas del
proceder de una sociedad, de tal suerte que sirven como base para la toma de
En el siguiente paso realizará un análisis exploratorio de datos y calculará las decisiones y el diseño de estrategias gubernamentales o del sector privado
medidas de tendencia central (media, mediana y moda), las de posición nacional o internacional para, en este caso, delinear esquemas de ofertas
(cuantiles) y las de dispersión (que serán motivo de la siguiente unidad.) Para atractivas para los turistas.
comprender la utilidad de las medidas de dispersión será necesario tomar en
cuenta que las medidas de tendencia central y las de posición son un elemento Otros ejemplos son: “Según datos del Banco de México (BANXICO), las
descriptivo que caracteriza a un conjunto de datos desde el punto de vista de compras en Internet mediante tarjetas de crédito va en aumento, sin embargo,
sus elementos centrales, esto es, en torno a qué valores se agrupan los datos y ha bajado el importe promedio de la compra al pasar de $965.00 a $798.00
qué forma tiene la distribución. De igual manera, esta unidad le será útil para entre junio de 2004 y de 2005”; 2 “...entre el 25 de octubre y el 14 de noviembre
familiarizarse con la manera específica de calcular e interpretar los promedios de 2005, el precio de las acciones de CINTRA aumentó en promedio un 20%
de porcentajes (que se verán en la unidad seis: Números índice) y las medidas ante la cercanía de la venta de las subsidiarias Mexicana y Aeroméxico”. 3
que se toman como base para comparar dos o más conjuntos de datos (unidad (Mexicana fue vendida a fines de noviembre de 2005); “...de enero a
cuatro: Medidas de dispersión), con todo ello, estaremos cumpliendo uno de los septiembre de 2005, el financiamiento externo que llegó al país por Proyectos
aspectos del Objetivo General de nuestra asignatura: “describirá [...] el de Infraestructura Productiva con Impacto Diferido en el Registro del Gasto
funcionamiento de la actividad socioeconómica nacional a través de las (PIDIREGAS) creció en promedio 53.7% respecto del mismo periodo en 2004,
estadísticas que la resumen...” a la vez que cubrimos el objetivo de la presente señaló BANXICO..;”4 “...a partir de 1994, la exportación de langosta creció en
unidad: “Interpretar el significado de los gráficos de las medidas de tendencia promedio cada año un 48%...”. 5
central y de posición.”
En esta unidad aprenderá usted a calcular los promedios como medidas que
Vale la pena mencionar que si los datos provinieran de una población, las resumen y describen un conjunto de datos que reflejan la realidad social,
medidas que usted calculará se denominarán parámetros poblacionales económica, política o demográfica de un país.
mientras que, cuando provengan de una muestra las llamaremos estadísticos
de la muestra. 3.1 Análisis exploratorio de datos

Realizar un análisis exploratorio de datos es un ejercicio que usted practicará


en varias ocasiones a lo largo de su contacto con un conjunto de datos, de
hecho, ya ha realizado algunos. En la segunda unidad, vimos que antes de

43 44
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

crear un diagrama de tallo y hoja tuvo usted que hacer una exploración del todos los valores del conjunto y resulta ser un valor único que permite
conjunto de datos para rescatar los valores menor y mayor, que le sirvieron comparar dos o más poblaciones.
para establecer los tallos del diagrama; posteriormente, ya elaborado su primer
diagrama, exploró y ordenó las hojas para registrar el diagrama definitivo; Puede calcularse para datos de nivel de intervalo y de razón (de datos no
después, destacó una serie de valores que describieron al conjunto como: en agrupados o agrupados en distribuciones de frecuencias) que provengan de
torno a qué cantidades se acumulaban los datos y otras situaciones que usted poblaciones o de muestras.
ya respondió en el ejercicio 1 de esa unidad. Más adelante, al elaborar sus
distribuciones de frecuencias y sus gráficas, obtuvo más información. Pero Media: Es el promedio más representativo de un conjunto.
existen más aspectos que usted podrá apreciar en tanto que vayamos
realizando cálculos para obtener las medidas de tendencia central y las A pesar de que la media es considerada la medida más representativa de un
medidas de posición, a lo largo de esta unidad. conjunto, existen ocasiones en que puede no serlo. Esto sucede cuando en el
conjunto existen valores extremos (muy pequeños o muy grandes) que se
3.2 Medidas resumen de un conjunto de datos alejan considerablemente de los valores centrales o cuando, en datos
agrupados, existen clases de extremo abierto que impiden calcularla, puesto
Cuando se estudia una población, ya sea utilizando la totalidad de los datos o que se desconoce la información exacta de los límites.
tan sólo una muestra, se acostumbra calcular una serie de medidas
descriptivas de resumen cuya función es revelar las características más La mediana es la medida que se halla exactamente a la mitad de un conjunto
representativas del conjunto: los parámetros o promedios. de datos ordenados (de menor a mayor o viceversa), de manera que lo divide
en dos partes iguales, donde los datos menores a ella representan el 50% del
Entre las medidas de resumen más utilizadas están las de tendencia central: conjunto y los que están por encima de ella forman el otro 50%. Sólo existe una
media, mediana y moda, que pueden calcularse tanto para datos no agrupados mediana para cada conjunto de datos.
como para datos agrupados en distribuciones de frecuencias.
Cuando la media resulta no ser representativa de un conjunto de datos, la
Las medidas de tendencia central también se denominan medidas de mediana toma su lugar como medida preferida, puesto que al ocupar el lugar
localización o de ubicación pues muestran el centro de una serie de números. central de los datos, describe mejor al conjunto.
En general las llamamos promedios; los más usuales son: la media, la
mediana y la moda. Por medio de estas tres medidas resumimos un conjunto A diferencia de la media, la mediana puede calcularse para datos agrupados
de datos pues indican el valor que suele ser el más representativo del conjunto. que presentan clases de extremo abierto; para datos de nivel ordinal, de
intervalo y de razón y nunca se ve afectada por valores extremos.
Las medidas de posición son otras medidas de resumen que nos reportan
información importante sobre la manera como está conformado un conjunto de Mediana: Medida que se encuentra exactamente a la mitad de un conjunto de
datos, entre ellas están los cuantiles, los más usados son: los cuartiles y datos ordenados.
centiles, pero también están los deciles.
La moda es la medida que aparece con mayor frecuencia en un conjunto de
También funcionan como medidas de resumen las medidas de dispersión que datos. Se calcula para todos los niveles de datos: nominal, ordinal, de intervalo
se estudiarán en la unidad 4. Entre las más usadas están: la amplitud de y de razón.
variación (o rango), la desviación media, la varianza y la desviación estándar.
A diferencia de la media y la mediana, la moda no siempre es un valor único
Con los parámetros pueden compararse dos o más poblaciones. porque existen conjuntos donde puede encontrarse más de un valor que se
repita en varias ocasiones o no hallarse valor alguno que se repita, esto es, un
Los promedios o medidas de tendencia central más utilizados en la sociedad conjunto sin moda. Cuando encontramos que en un conjunto se repiten ─en
son: media, mediana y moda. igual cantidad─ dos valores, el conjunto será bimodal: si el conjunto tuviera
más de dos números que se repitieran en igual cantidad, lo denominaríamos
Las medidas de posición son los cuantiles: deciles, cuartiles y centiles. multimodal.

3.3 Media, mediana y moda Esta medida es preferida como promedio, por encima de la media o de la moda,
cuando el conjunto de datos es de nivel nominal.
La media es el promedio más utilizado y se le considera el valor más
representativo por ser un punto de equilibrio. Es la medida que representa el Moda: Es la medida que aparece con mayor frecuencia en un conjunto de
promedio aritmético de un conjunto de observaciones porque toma en cuenta a datos.

45 46
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

A continuación calcularemos estas tres medidas. Iniciaremos con la media de clase, si lo desconoce, lo puede calcular restando del límite inferior de la
datos agrupados por ser un cálculo ligeramente más laborioso que para datos segunda clase (18) el límite inferior de la primera (10), así 18 -10= 8. Todas las
no agrupados, la cual veremos después. cantidades que necesitamos para nuestros cálculos aparecen en negritas en la
tabla siguiente:
Retomaremos, de la unidad anterior, el caso del uso de las tarjetas de crédito y
débito. Para calcular la media de datos agrupados, usted necesitará las Clase Frecuencias Frecuencias Límites
acumuladas verdaderos
cantidades que obtuvimos de los cálculos para determinar el número de clases, f FA L
los puntos medios (a los que llamaremos “x”) y las frecuencias (f) de clase. Los
puntos medios los multiplicaremos por sus respectivas frecuencias y 10 - 17 4 4 9.5 -17.5
obtendremos su sumatoria (Σfx), la cual dividiremos entre “n”, es decir, el 18 - 25 5 9 17.5 -25.5
total de datos. Emplearemos la fórmula: 26 - 33 10 19 25.5 -33.5
34 - 41 12 31 33.5 -41.5
ê S fx
x= 42 - 49 6 37 41.5 -49.5
n 50 - 57 3 40 49.5 - 57.5
40
Clase Frecuencias Puntos medios
(f) (x) fx
40
- 19
H8L = 34.2
~
10 - 17 4 13.5 54 ‗ 2
X= 33.5 +
18 - 25 5 21.5 107.5 x = Σfx = 1340 = 33.5 12
26 - 33 10 29.5 295 n 40
34 - 41 12 37.5 450 Por lo tanto, la mediana de las veces que se usó tarjeta de crédito o débito en
42 - 49 6 45.5 273 un supermercado durante 40 días fue 34.2 veces.
50 - 57 3 53.5 160.5
40 1340 De esta manera, ya obtuvimos dos de las medidas de tendencia central: la
media = 33.5 y la mediana = 34.2. Note que la mediana es ligeramente mayor
Como notará, el promedio (o media) de las veces que se utilizó tarjeta de que la media.
débito o crédito durante 40 días en los supermercados fue de 33.5 veces por
día. El procedimiento que realizamos para calcular la mediana, volveremos a
emplearlo para calcular los cuantiles.
Queremos llamar su atención hacia el hecho de que, cada vez que usted
obtenga un resultado de sus cálculos, deberá acompañarlo de una
interpretación de la medida, en relación con el tema o caso que esté Para estimar la moda de datos agrupados, basta con que usted consulte la
estudiando. Digamos que la mitad de la importancia de un cálculo que usted tabla y vea cuál es el punto medio que tiene la mayor frecuencia. En nuestro
realice es que sea correcto el resultado y la otra mitad es la interpretación que caso es el 37.5, pues tiene 12 frecuencias. No requiere usted hacer ningún
haga de él. cálculo, sólo una exploración. De esta manera puede afirmar que la moda de
las veces en que se usó tarjeta de crédito o débito en un supermercado durante
Para calcular la mediana de datos agrupados usted necesitará: las clases, el 40 días fue de 37.5 veces, cantidad mayor que la media y la mediana.
número total de datos (n), las frecuencias (f), las frecuencias acumuladas (FA),
el ancho del intervalo (i) y los límites verdaderos (L). Se calcula con la fórmula Pues bien, ya hemos obtenido las medidas de tendencia central de datos
siguiente: agrupados y los llamaremos estadísticos por provenir de una muestra. Puede
n usted apreciar que los valores no son exactamente iguales, pero son muy
~ - AF
X= L + 2 i cercanos. En la siguiente unidad hablaremos al respecto.
f

A
Para sustituir los valores en la fórmula, le sugiero que comience por el
elemento n/2, en nuestro ejemplo: 40/2, lo cual nos da 20. Escríbalo donde Ejercicio 1:
corresponde, dentro de la fórmula y luego localice el 20 en la frecuencia Retome los resultados que obtuvo usted en la unidad anterior para el
acumulada, vea la cantidad donde está contenido el 20, en nuestro ejemplo es problema de los promocionales en apoyo a los candidatos a diputados que
la FA = 31, sobre ese renglón recorra hacia la columna “límites verdaderos” y aparecieron en radio y televisión durante 30 días y calcule: a) la media
copie el inferior (33.5), después copie la FA anterior a la de la clase en que b) la mediana c) la moda d) Interprete los resultados
encontró la mediana (19) y finalmente copie la frecuencia (f) de la clase en que
se halló la mediana (12). Recuerde que el intervalo es la amplitud de cada

47 48
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

Ahora calcularemos las medidas de tendencia central para datos no 210 210 244 270 280 320 325 390 405 452
agrupados (o datos ordenados), ya sea que provengan de una población o de
una muestra. Los cálculos son los mismos, pero varía la notación de las Asimismo, dado que el 210 se repite en dos ocasiones, pasaría a ser la moda
fórmulas. del conjunto.

A
Para una población se acostumbra usar la fórmula:
SX Ejercicio 2:
µ= Calcule la media, la mediana y la moda del siguiente conjunto de
N
y para una muestra usaremos: números que representan una población: 4, 5, 8, 4, 8, 8, 3, 10, 6.
¯ Sx
X= 3.4 Media geométrica y media ponderada
n
Estas dos medidas también son de tendencia central, pero se calculan para
casos especiales, como cuando se trabaja con cantidades que cambian su
La letra µ (mu minúscula) se usa para nombrar la media de una población. valor cada cierto tiempo (y se hace necesario conocer la tasa promedio de
cambio) o cuando se calcula un promedio y debe tomarse en cuenta la
importancia de cada valor. Si en procesos como esos sólo se obtuviera la
Pongamos por ejemplo que las cantidades pagadas (en pesos cerrados) por media aritmética, los resultados serían erróneos, pues en el caso de la media
los nueve departamentos de un condominio en Naucalpan, durante un bimestre geométrica, siempre resulta ser menor que la aritmética.
a la Compañía de Luz fueron: 210, 325, 280, 405, 320, 270, 390, 244 y 452.
Para calcular la media de esta población, simplemente se suman las nueve La media geométrica (MG) siempre es menor (cuando mucho igual) que la
cantidades y luego se divide su sumatoria entre nueve, el total de datos: media aritmética.
210 + 325 + 280 + ... +452 2896
µ= = = 321.8
9 9 La media geométrica (MG) es un promedio muy utilizado en el campo de los
Podemos afirmar, entonces, que la media de los pagos de luz de los nueve negocios y la economía en general, porque continuamente se requiere
departamentos de un condominio en Naucalpan fue de $321.80 bimestralmente. determinar el cambio porcentual de ventas, sueldos o cifras como el Producto
Interno Bruto (PIB) u otras cantidades importantes para la economía de un país.
Cuando se trata de calcular la media muestral, utilizaremos la fórmula La puede usted calcular en dos casos:
correspondiente, pero procedemos de igual manera que en el caso anterior.
a) Cuando necesite conocer el promedio de porcentajes, tasas, índices o
Para calcular la mediana de una población o muestra de datos no agrupados, razones, utilice:
usted deberá ordenar los datos de menor a mayor (como lo ejemplificamos è
n
MG= Hx1L Hx2L Hx3L ... HxnL
abajo) o de mayor a menor. La mediana será el valor que se ubique
exactamente en medio de la lista. b) Cuando necesite calcular el cambio o aumento porcentual promedio
durante un intervalo de tiempo, utilice:
210 244 270 280 320 325 390 405 452

MG = $
Así, la mediana de los pagos de luz será de $320.00 a diferencia de la media valoralfinaldelperiodo
n -1
que fue de $321. 80. En este caso, debido que no existe ninguna cantidad que valoraliniciodelperiodo
se repita, afirmamos que no hay moda o que cada una de las cantidades
registradas lo son. Esta medida se obtiene calculando la n-ésima raíz del producto de los valores
que representan el cambio y es una forma de contemplar los efectos
Cuando el conjunto de datos tiene un número par, la mediana se calcula multiplicativos como la inflación o el interés compuesto.
sumando las dos cantidades del centro y dividiendo esa suma entre dos.
Es importante que usted comprenda esta medida porque la utilizará
Supongamos por ejemplo, que existiera un décimo departamento que pagara posteriormente en la unidad VI y cuando curse la materia de Macroeconomía
también $210.00, entonces la mediana sería: 280+320 / 2 = 300 o $300.00. en el tercer semestre, también le será útil porque con ella podrá minimizar la
importancia de los valores extremos de un conjunto de datos.

49 50
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

Para tener un ejemplo de cómo calcular e interpretar esta medida,


partiremos de unos datos publicados en el periódico Reforma6 durante octubre
MG = $
20
de 2005, relacionados con la economía de nuestro país. 4 - 1 = -0.1504 = -15%
38.4
La siguiente tabla muestra la participación porcentual de las exportaciones no
petroleras de México en las importaciones a Estados Unidos entre 1995 y Aprecie que hemos utilizado esta fórmula porque se trata de calcular el
2005. cambio porcentual y no el promedio de los porcentajes como en el caso
Año % Año % anterior y hemos obtenido una cantidad negativa debido a que se marca un
1995 8.25 2001 11.43 decremento. Nuevamente, nuestra poca competitividad unida al crecimiento de
1996 9.01 2002 11.37 la economía china, nos reporta tendencias preocupantes sobre nuestro futuro.
1997 9.53 2003 10.68
1998 10.25 2004 10.31

A
1999 10.57 2005 9.88 Ejercicio 3:
2000 10.99 Según cifras reportadas por BANXICO,8 el creciente financiamiento
a la importación de automóviles, computadoras, refrigeradores y videocámaras
¿Cuál ha sido el promedio porcentual anual de las exportaciones no ha impulsado el crédito al consumo. Cifras dadas en millones de pesos, de
petroleras de México en las importaciones de Estados Unidos entre 1995 y enero a agosto de cada año, partiendo del año 2000.
2005? Interprete el resultado.
Año Millones Incremento
de pesos porcentual
2000 6 392
11
MG = √ (8.25) (9.01) (9.53) (10.25) (10.57) (10.99) (11.43) (11.37) (10.68) (10.31) (9.88) 2001 10 425 63% a) Calcule la tasa de aumento anual del
2002 17 797 71% crédito al consumo en ese periodo.
M G = 10.16 2003 28 116 58% b) Calcule el promedio porcentual anual
2004 43 518 55% del crédito al consumo en ese periodo.
El promedio porcentual de las exportaciones no petroleras de México en las 2005 50 150 15%
importaciones de Estados Unidos entre 1995 y 2005 fue de 10.16%.
Puede notar que en 2001 hubo un repunte considerable, pero a partir de ese La media ponderada o pesada (XW) es un promedio que usted podrá utilizar
año ha venido bajando la participación de nuestras exportaciones pues no cuando requiera calcular una cantidad donde deba tomar en cuenta el peso o
podemos obviar el papel que la economía china juega hoy en la economía valor específico de cada dato u observación con respecto al total, esto es,
mundial y que está afectando especialmente a nuestra economía. cuando haya valores con un peso o valor diferente para cada caso. Se calcula
Si hubiéramos calculado este promedio con una media aritmética, el resultado con la fórmula:
hubiera sido:
w1 x1 +w2 x2+ w3x3 +... +wn xn
xw =
8.25+9.01+9.53+…+9.88 w1 +w2+w3 +... +wn
X= = 10.21%
11
La media ponderada (XW) calcula el promedio que toma en cuenta la
Como usted puede apreciar, la media geométrica es menor que la media importancia de cada valor con respecto al total.
aritmética. Vayamos a otro ejemplo también relacionado con el tema de nuestro
comercio con Estados Unidos. Veámoslo con un ejemplo cercano a su experiencia. Usted sabe que en
nuestro curso de Estadística descriptiva el sistema de evaluación consta de dos
7
Según la Oficina Textil y del Vestido de Estados Unidos (OTEXA), las partes: un examen final con un valor del 60% de su calificación final y tres
exportaciones de mezclilla mexicana han sido, en millones de metros exámenes parciales que valen, respectivamente, 15%, 15% y 10%, sumando
cuadrados, como sigue: así el 40% que corresponde a la primera fase de su calificación total.
Año Cantidad Pensemos que usted obtiene 8.5 en el primero; 9.0 en el segundo y 9.5 en el
2001 38.4 tercero. ¿Qué promedio lleva usted realmente?
2002 36.9 ¿Cuál es la tasa de cambio porcentual
2003 33.5 de las exportaciones mexicanas hacia H0.15x8.5L +H0.15x9L + H0.10x9.5L 3.575
2004 30.7 Estados Unidos durante ese periodo? xw = = = 8.94
0.15 + 0.15 + 0.10 0.40
2005 20.0

51 52
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

El 8.94 es su promedio hasta el momento, con el cual ha acumulado el 36% del Ya vimos que la mediana es el promedio que divide al conjunto en dos partes
40% de su calificación total. iguales, un 50% menor y un 50% mayor a ella; así los cuartiles dividen al
conjunto en cuatro partes iguales que representan cada una un 25% del total.
Veamos otro ejemplo: Suponga que usted desea calcular el costo promedio del Generalmente se calculan el primero (cuartil uno = Q1) y el tercero (cuartil tres
trabajo por hora para dos productos que elabora su empresa, para los cuales = Q3) que representan, respectivamente, el 25% y el 75% de las observaciones.
se necesitan distintos niveles de trabajo con un costo respectivo diferente y Podemos decir que la mediana viene siendo el cuartil dos.
horas requeridas determinadas que se presentan en la siguiente tabla:
Cuartil: Divide al conjunto en cuatro partes iguales.
HORAS DE TRABAJO INVERTIDO
NIVEL DE TRABAJO SALARIO POR HORA POR UNIDAD DE PRODUCTO Si usted se remitiera a la gráfica de frecuencias acumuladas u ojiva, podría
(X) Producto 1 Producto 2 localizar los cuartiles fácilmente al dividir el gráfico en cuatro partes, de manera
No calificado $ 5.00 1 4 que la primera sería el Q1 y la tercera el Q3, la cifra localizada representará el
Semicalificado 7.00 2 3 25% y el 75% respectivo de la población o muestra estudiada.
Calificado 9.00 5 3
Los cuartiles para datos agrupados se calculan con las siguientes fórmulas:
Realizaremos los cálculos para cada producto. n n
- AF - AF
Q1 = L + 4 i Q3 = L + 4 i
Xw = (5x1)+(7x2)+(9x5) = 64 = 8 Xw= (5x4)+(7xx3)+(9x3) = 68 = 6.8 f f
1+2+5 8 4+3+3 10
A la diferencia entre el cuartil tercero y el primero (Q3 - Q1) se le denomina
De esta manera, sabrá usted que el costo promedio por unidad de producto recorrido intercuartílico o rango intercuartílico (RIC), que representa el 50%
para el artículo uno es de $8.00 y para el artículo dos de $6.80 central del conjunto de datos.

A
Ejercicio 4: RIC (rango intercuartílico): Representa el 50% central del conjunto.

El IFE publicó, en septiembre de 2005, en un periódico local de Los Los centiles dividen al conjunto en 100 partes iguales, de manera que cada
Ángeles, California, cinco anuncios promoviendo la inscripción al padrón división representa un 1% del conjunto. Los centiles que más suelen calcularse
electoral entre los mexicanos residentes en Estados Unidos para que votaran son el décimo (centil diez = P10) y el nonagésimo (centil noventa = P90). A la
durante las elecciones federales de 2006. Como resultado, obtuvo los datos diferencia entre el centil noventa y el diez (P90 - P10) se le llama amplitud
que se dan en la siguiente tabla: centílica y representa el 80% central de los datos del conjunto, eliminando los
datos extremos.
No. de veces que el lector 1 2 3 4 5
vio el anuncio Los centiles para datos agrupados se calculan con las siguientes fórmulas:

Frecuencia 893 1592 1718 324 112 10n 90n


- AF - AF
100 100
P10 = L + i P90 = L + i
¿Cuál fue el promedio de veces que un lector vio el anuncio del IFE durante f f
septiembre de 2005?
Retomemos, una vez más, nuestro ejemplo de las tarjetas de crédito y débito
para calcular tanto los cuartiles como los centiles. Nuevamente requerirá
3.5 Cuantiles: deciles, cuartiles y percentiles usted: las clases, el número total de datos (n), las frecuencias (f), las
frecuencias acumuladas (FA), el ancho del intervalo (i) y los límites verdaderos
Los cuantiles son medidas de posición no central usadas para describir la (L) y, sobre todo, recordar el procedimiento que practicamos para calcular
variación de un conjunto de datos desde el punto de vista de su dispersión, a la la mediana.
vez que lo dividen en partes iguales. Si lo dividen en diez partes iguales se
denominan deciles, si lo dividen en cuatro partes se denominan cuartiles y, si Todas las cantidades que necesitamos para los cálculos del primer cuartil
lo dividen en 100 partes iguales se denominarán centiles. aparecen en negritas en la tabla siguiente:

Cuantil: Medida de posición no central que describe la dispersión del conjunto.

53 54
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

Clase Frecuencias Frecuencias Límites Habrá usted notado que en el lugar de la FA se colocó un cero, esto se debe a
Acumuladas verdaderos
f FA L que la clase en que se halla el centil 10 es la primera y por lo tanto no hay
frecuencia acumulada anterior.
10 - 17 4 4 9.5 -17.5 Para obtener el centil noventa, que equivale al noveno decil, procedemos de
18 - 25 5 9 17.5 -25.5 igual manera. En la tabla aparecen con negritas las cantidades que requerimos.
26 - 33 10 19 25.5 -33.5
34 - 41 12 31 33.5 -41.5 Clase Frecuencias Frecuencias Límites
acumuladas verdaderos
42 - 49 6 37 41.5 -49.5 f FA L
50 - 57 3 40 49.5 - 57.5 10 - 17 4 4 9.5 -17.5
40 18 - 25 5 9 17.5 -25.5
26 - 33 10 19 25.5 -33.5
40
-9 34 - 41 12 31 33.5 -41.5
Q1 = 25.5 + 4 H8L = 26.3 42 - 49 6 37 41.5 -49.5
10 50 - 57 3 40 49.5 - 57.5
40
Para obtener el tercer cuartil, procedemos de igual manera. En la tabla
aparecen con negritas las cantidades que requerimos. 90H40L
- 31
Clase Frecuencias Frecuencias Límites P90 = 41.5 + 100
H8L = 48.2
acumuladas verdaderos 6
f FA L
10 - 17 4 4 9.5 -17.5 La amplitud centílica, en este caso, es 30.7 obtenido de 48.2 - 17.5.
18 - 25 5 9 17.5 -25.5
26 - 33 10 19 25.5 -33.5 Amplitud centílica =P90 -P10 =48.2 - 17.5 =30.7
34 - 41 12 31 33.5 -41.5
42 - 49 6 37 41.5 -49.5 Los últimos seis resultados obtenidos pueden interpretarse de la siguiente
50 - 57 3 40 49.5 - 57.5 manera: que el 25% de las veces que menos se usó la tarjeta fue 26.3 veces,
40 mientras que el 25% de las veces que más se usó fue 40.83 veces, que el 80%
de las veces que se usó va de 17.5 a 48.2 veces, que el 10% de las veces que
3H40L
- 19 más se usó fue 48.2 veces como mínimo, etc.
Q3 = 33.5 + 4
H8L = 40.83
12 Como podrá usted observar en las fórmulas para calcular la mediana, los
cuartiles y los centiles, el número de datos n ─en cada fórmula─ se divide entre
El RIC, para este caso, es igual a 14.53, obtenido de 40.83 - 26.3. el número de secciones que representa cada medida (la mediana representa
Para obtener el centil diez que equivale al primer decil, procedemos de igual dos, o sea cada parte es el 50%, por eso n/2; los cuartiles representan cuatro
manera. En la tabla aparecen con negritas las cantidades que requerimos. partes, o sea, el 25% cada uno, por eso n/4, y los centiles representan cien
partes, por eso n/100. En el caso del Q1, vendría siendo ¼, de allí que se use
Clase Frecuencias Frecuencias Límites
acumuladas verdaderos 1n/4, pero como no se usa el coeficiente 1, se omite; el Q3 representa ¾, por lo
f FA L que en la fórmula aparece 3n/4; en el P10 encontramos 10n/100 y en el P90,
10 - 17 4 4 9.5 -17.5 90n/100.
18 - 25 5 9 17.5 -25.5
26 - 33 10 19 25.5 -33.5 Por semejanza, podríamos calcular el P33 anotando en nuestra fórmula 33n/100
34 - 41 12 31 33.5 -41.5 y para el P82, 82n/100, etc. Asimismo, podríamos decir que la mediana es el P50,
42 - 49 6 37 41.5 -49.5 que el Q1 = P25 y que el Q3 = P75. También podemos decir que el P20 es el decil
50 - 57 3 40 49.5 - 57.5 dos, que el P30 es el decil tres etc.
40

A
10H40L
-0 Ejercicio 5:
P10 = 9.5+ 100 H8L = 17.5 Retomando el problema que ha venido resolviendo sobre los
4 promocionales en apoyo a candidatos a diputados, calcule:

55 56
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

a) Q1, Q3 y el RIC b) P10, P90 y la amplitud centílica que el noveno centil es igual a 461.2, valor que se interpreta como que la
c) Interprete los resultados décima parte de los departamentos que más consumen luz pagan mínimo
$461.20 bimestralmente.

Para el cálculo de cuartiles, deciles y centiles de datos no agrupados, R Estamos por concluir el estudio de esta unidad, antes de abordar el
podemos utilizar, en general, la formula: último tema, confronte cuáles son los objetivos logrados hasta
Lc = Hn+1L
c este momento y qué falta por cubrir. Comente en asesoría sus
100 dudas u observaciones.

Retomemos el ejemplo de los pagos a la Cía. de Luz, pero agreguemos más


departamentos y sus respectivos pagos. Supongamos que son quince y sus 3.6 Representación gráfica de las medidas de tendencia central y de
pagos respectivos fueron de: 200, 210, 210, 220, 300, 350, 475, 325, 280, 405, posición: diagrama de “box-wiskers” y campana
320, 270, 390, 244 y 452.
Tanto las medidas de tendencia central como las de posición no central puede
Al igual que para el cálculo de la mediana, para calcular los cuantiles es localizarlas usted en los gráficos que aprendió a trazar en la unidad dos de este
necesario que primero ordenemos los datos de menor a mayor: curso. Por ejemplo, en un histograma o en un polígono de frecuencias, basta
ubicar las cantidades obtenidas de nuestros cálculos en el eje de las X y
200, 210, 210, 220, 244, 270, 280, 300, 320, 325, 350, 390, 405, 452, 475 trazar una línea vertical desde el eje de las X hasta los límites del gráfico.
Realizar este ejercicio cuando usted presente un informe o una exposición
Calculemos, con la fórmula, los cuartiles uno y tres. sobre los resultados de su investigación, no sólo le servirá para que su
auditorio o lectores vean con mayor claridad los resultados sino que le ayudará
a tener un mayor control de la información que presenta, servirá para formular
L25 = H 15+1L L75 = H 15+1L
25 75
=4 = 12 conclusiones a la vista de todos y “vestirá con elegancia y atractivo visual” su
100 100 trabajo.

Los resultados 4 y 12 nos expresan el lugar que ocupa cada cuartil en la lista Otro recurso con el que puede usted contar para presentar un resumen de su
ordenada de nuestros datos, así el primer cuartil resulta ser el 220 al ocupar el información es un diagrama que se ha vuelto muy popular: el diagrama de
cuarto lugar de la lista y el tercer cuartil le corresponde al 390 al ocupar el lugar “box-wiskers” o de “caja y bigotes”.
número 12. Al interpretar estos datos podemos decir (por ejemplo) que la
cantidad máxima que paga la primera cuarta parte de los departamentos que Este diagrama se basa en cinco números: los valores mayor y menor de su
menos pagan por consumo de luz es de $220.00, mientras que la cuarta parte conjunto de datos, la mediana, el cuartil uno y el cuartil tres. Para crearlo, usted
de los que más pagan es mínimo $390.00 deberá trazar una recta numérica cuya longitud será ligeramente mayor a la
Ahora calculemos el primer decil y el noveno centil. proporcional del rango o distancia entre los datos menor y mayor. Luego
L10 = H 15+1L L90 = H 15+1L
10 90 localizará los valores correspondientes a la mediana y a los cuartiles y sobre la
= 1.6 = 14.4 recta trazará una caja ─dejando un espacio entre caja y recta─ que tendrá
100 100
como límites a los cuartiles, la mediana estará marcada dentro de la caja.
Para el caso del primer decil, la fórmula nos indica que se halla en el lugar 1.6, Posteriormente, y para finalizar, trazará con línea punteada los “bigotes”, que
esto es, entre el primero y segundo, a una distancia de 0.6 de ellos; el primer partirán de los extremos de la caja y terminarán en el lugar que corresponda al
valor es 200 y el segundo es 210, por lo que la distancia entre ellos es de 10, al valor menor y al valor mayor, respectivamente. Este gráfico es un valioso
cual hay que pasar a 0.6 de la distancia, es decir, lo multiplicamos por 0.6 (0.6 recurso para resumir la información.
x 10 = 6) y sumamos ese producto al primer valor (200 + 6) para obtener que el
primer decil es igual a 206, valor que se interpreta señalando que la décima Diagrama de “box-wiskers”: Se basa en cinco números: los valores mayor y
parte de los departamentos que menos consumen luz pagan máximo $206.00 menor de su conjunto de datos, la mediana, el cuartil uno y el cuartil tres.
al bimestre.
Para el ejemplo de las tarjetas (otra vez), el diagrama de “caja y bigotes” nos
De la misma manera procedemos para determinar el valor que ocupa el noveno queda así:
centil. Se halla en el lugar 14.4, entre el último y el penúltimo, que Valor mayor = 52 (tomado de nuestros datos ordenados)
corresponden a las cantidades 452 y 475; la distancia entre ambas es de 23: Valor menor = 12 (tomado de nuestros datos ordenados)
multiplicado por 0.4 nos da 9.2, que sumado a la cantidad menor nos resulta Mediana = 34.2 Cuartil 1 = 26.3 Cuartil tres = 40.8

57 58
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

Cada cuartil corresponde al 25% del conjunto; cada centil, al 1% y cada decil al
12 26.5 34.2 40.8 52 10%.
|------------------|______|_____|---------------| La base para trazar un diagrama de “caja y bigotes” es el cálculo de cinco
números: los valores mayor y menor del conjunto, los cuartiles uno y tres y la
___________________________________________ mediana.
10 20 30 40 50 Todas las medidas aprendidas en esta unidad le ayudarán a tener un
conocimiento más preciso sobre las características de la población que esté
estudiando.
Con este diagrama también podemos distinguir que del lado izquierdo de la
mediana ─y por tanto del conjunto─ hay más datos que del lado derecho, lo
cual indica que existe asimetría negativa. El tema de la asimetría lo veremos en “Para recordar lo esencial”
la próxima unidad.
Nuevos términos y conceptos fundamentales

A Ejercicio 6:

Trace un diagrama de “box-wiskers” para el ejercicio que ha venido


Amplitud centílica: Es la diferencia entre el centil noventa menos el centil diez.
Centil: Es la medida que divide al conjunto en cien partes iguales.
Cuantil: Es el nombre con que se generaliza a los deciles, cuartiles y centiles.
Cuartil: Es la medida que representa el 25% de un conjunto de datos.
desarrollando sobre los promocionales en apoyo a los candidatos para
diputados. Decil: Es la medida que divide en diez partes iguales a una población.
Diagrama de box-wiskers: Gráfica moderna basada en cinco números: los
valores mayor y menor de su conjunto de datos, la mediana, el cuartil uno y el
cuartil tres.
R Como al término de las unidades anteriores, antes de leer la Estadístico: Es el término utilizado para nombrar las medidas de tendencia
conclusión, reflexione sobre su proceso de aprendizaje, evalúe los central calculadas para una muestra.
pasos que ha dado para lograr resolver los ejercicios planteados durante la Media: Es el promedio más utilizado en la sociedad pues se le considera el
presente unidad y verifique que el objetivo se ha alcanzado. Comente en más representativo de un conjunto.
asesoría sus observaciones. Media geométrica: Es un promedio muy utilizado en el campo de los negocios
y la economía para calcular promedios de porcentajes o calcular porcentajes de
cambio a través de un periodo dado.
EN SUMA Media ponderada: Es el promedio que toma en cuenta la importancia de cada
Tanto las medidas de tendencia central como las de posición (no central) le valor con respecto al total.
sirven a usted para describir, resumidamente, un conjunto de datos, a la vez Mediana: Medida de tendencia central que se encuentra exactamente a la
que le permiten apreciar patrones y tendencias de manera más exacta que si mitad de un conjunto, luego de ordenarlo de menor a mayor o viceversa.
sólo presentara la información en tablas de frecuencias o por medio de gráficas Medidas de tendencia central: Son las que representan el centro de un
carentes de estas cantidades. conjunto de datos. Son la media, la mediana y la moda. Para casos especiales,
Las medidas de tendencia central son: media (aritmética), mediana y moda, la media geométrica y la media ponderada. Se calculan para datos agrupados y
pero para casos especiales es necesario calcular la media geométrica o la para datos ordenados.
ponderada. Moda: Es la medida que aparece con mayor frecuencia en un conjunto de
Cuando calculamos medidas de tendencia central para una población las datos.
denominamos parámetros poblacionales, pero si los datos provienen de una Parámetro: Es el término con que se denominan las medidas de tendencia
muestra los llamamos estadísticos. Estas medidas pueden calcularse para central calculadas para una población.
datos agrupados y para datos ordenados. Promedio: Es el término que generaliza a las medidas de tendencia central.
La media es el promedio que más se ocupa en la sociedad, pero cuando Rango intercuartílico: Es la distancia entre los cuartiles uno y tres
existen datos extremos en el conjunto no resulta confiable, por lo que se
prefiere usar la mediana porque a ella no le afectan dichos datos. Para datos
de nivel nominal se recurre más a la moda.
“Para comprobar lo que ha aprendido en esta Unidad”
Los cuantiles (cuartiles, percentiles y deciles) son medidas de posición no
central que dividen al conjunto de datos en partes iguales. Los cuartiles lo EJERCICIOS DE AUTOEVALUACIÓN
dividen en cuatro partes; los centiles, en cien partes y los deciles, en diez De acuerdo con lo estudiado en la Unidad Didáctica:
partes.
- Elabore un informe que presente el caso que ha venido resolviendo sobre la
cantidad de anuncios publicitarios que aparecieron tanto en radio como en TV,

59 60
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA

durante 30 días en apoyo a distintos candidatos a diputado, integrando su Ejercicio 3:


información, desde los datos en bruto hasta los cálculos de la amplitud
Sus cálculos debieron ser:
centílica. Ilústrelo con el polígono de frecuencias, la ojiva y el diagrama de
$
50150
“box-wiskers”. No olvide agregar sus interpretaciones. 5 - 1 = 0.5098 = 51%
6392
è
H63L H71L H58L H55L H15L = 46.35 = 46.4%
5


ACTIVIDAD DE AUTOEVALUACIÓN x = 63 + 71 + 58 + 55 + 15 = 52.4%
5

Le sugerimos “echar un vistazo” al periódico de su preferencia o a alguna a) El porcentaje del incremento anual o tasa de aumento anual al financiamiento del crédito al
página de Internet para obtener datos reales y practicar con ellos los conceptos consumo, entre el año 2 000 y 2 005, por los bancos en México fue de 51%.
y cálculos aprendidos en esta unidad. b) El promedio porcentual del financiamiento del crédito al consumo, entre el año 2 000 y 2 005,
Confronte la información que se le ha ofrecido a lo largo de esta unidad con las por los bancos en México fue de 46.4%.
c) En efecto, la media geométrica es menor que la media aritmética porque esta es igual a
fuentes consultadas que se citan, para que practique y se familiarice con la 52.4%, cantidad mayor a la obtenida con la media geométrica.
forma en que pueden extraerse los datos de este tipo de fuentes y con ellos
realizar un análisis estadístico. Ejercicio 4:

Su cálculo debió ser:


Xw = (893 x 1) + (1592 x 2) + (1718 x 3) + (324 x 4) + (112 x 5) = 2.39
SU OPINIÓN ES IMPORTANTE 4639
El promedio de veces que un mexicano residente en California leyó en el periódico local el
¿La información presentada en la unidad tiene alguna relevancia para Ud. en lo anuncio del IFE, durante septiembre de 2005, fue de 2.39 veces.
personal o en lo profesional? ¿Por qué?
Ejercicio 5:

Sus cálculos debieron ser:


a) Q1 = 58.5 + [(7.5 - 6 / 12) x 12] = 60 , Q3 = 70.5 + [(22.5 - 18 / 6) x 12] = 79.5, RIC = 19.5
RESPUESTAS A LOS EJERCICIOS DE LA UNIDAD. b) P10= 46.5 + [(3 - 2 / 4) x 12] = 49.5 , P90 = 82.5 + [(27 - 24 / 4) x 12] = 67.5
Amplitud centílica = 42
Ejercicio 1: c) El 25% de los días en que menos promocionales se transmitieron por radio y TV en apoyo a
los candidatos a diputados fue de máximo 60 veces, mientras que el 25% de los días en que
Sus cálculos debieron ser: más se transmitieron fue por lo menos 79.5 veces. El 10% de los días en que menos
Clase Frecuencia Límites Puntos Frecuencias promocionales se transmitieron, aparecieron un máximo de 49.5 veces, mientras que el 10% de
verdaderos medios acumuladas
los días en que más se transmitieron fue un mínimo de 91.5%.
f L x fx FA
(La respuesta a este inciso d puede variar de acuerdo con la forma en que usted prefiera
35-46 2 34.5-46.5 40.5 81 2
expresar las interpretaciones.)
47-58 4 46.5-58.5 52.5 210 6
59-70 12 58.5-70.5 64.5 774 18
Ejercicio 6:
71-82 6 70.5-82.5 76.5 459 24 36 60 64.5 79.5 95
83-94 4 82.5-94.5 88.5 354 28 |---------------------|___|_____|-------------|
95-105 2 94.5-105.5 100.5 201 30 ____________________________________________
30 2079 30 40 50 60 70 80 90 100

Media = 2079 / 30 = 69.3 Mediana = 58.5 + [(15 - 6 / 12) x 12] = 67.5

a) Media = 69.3 b) Mediana = 67.5 c) Moda = 64.5


FUENTES CONSULTADAS.
1
d) El promedio de veces que aparecieron por día los promocionales transmitidos por radio y TV López, M., “Viaja el turismo a casa familiar”, en Reforma, sección A Negocios,
durante 30 días fue de 69.3 veces. Del 50% de los días que menos promocionales se México, 16 de noviembre de 2005, p. 11 A
transmitieron aparecieron máximo un total de 67.5 veces ( o durante el 50% de los días en que 2
Navarro, A., “Elevan usuarios pago electrónico”, en Reforma, sección A
más se transmitieron los promocionales se presentaron por lo menos 67.5 veces.) La cifra que
más se repitió al contar las veces que se transmitieron los promocionales fue de 64.5 veces. Negocios, México, 23 de noviembre de 2005, p. 11.
3
(La respuesta a este inciso d puede variar de acuerdo con la forma en que usted prefiera Bibian, C. “Gana acción 20 por ciento”, en Reforma, sección A Negocios,
expresar las interpretaciones.) México, 16 de noviembre de 2005, p. 9 A.
4
Sarabia, E. “Crece la deuda de Pidiregas”, en Reforma, sección A Negocios,
Ejercicio 2:
México, 23 de noviembre de 2005, p. 12.
La media de este conjunto de datos es de 6.22, su mediana es de 6 y su moda es 8.

61 62

También podría gustarte