Documentos de Académico
Documentos de Profesional
Documentos de Cultura
43 44
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA
crear un diagrama de tallo y hoja tuvo usted que hacer una exploración del todos los valores del conjunto y resulta ser un valor único que permite
conjunto de datos para rescatar los valores menor y mayor, que le sirvieron comparar dos o más poblaciones.
para establecer los tallos del diagrama; posteriormente, ya elaborado su primer
diagrama, exploró y ordenó las hojas para registrar el diagrama definitivo; Puede calcularse para datos de nivel de intervalo y de razón (de datos no
después, destacó una serie de valores que describieron al conjunto como: en agrupados o agrupados en distribuciones de frecuencias) que provengan de
torno a qué cantidades se acumulaban los datos y otras situaciones que usted poblaciones o de muestras.
ya respondió en el ejercicio 1 de esa unidad. Más adelante, al elaborar sus
distribuciones de frecuencias y sus gráficas, obtuvo más información. Pero Media: Es el promedio más representativo de un conjunto.
existen más aspectos que usted podrá apreciar en tanto que vayamos
realizando cálculos para obtener las medidas de tendencia central y las A pesar de que la media es considerada la medida más representativa de un
medidas de posición, a lo largo de esta unidad. conjunto, existen ocasiones en que puede no serlo. Esto sucede cuando en el
conjunto existen valores extremos (muy pequeños o muy grandes) que se
3.2 Medidas resumen de un conjunto de datos alejan considerablemente de los valores centrales o cuando, en datos
agrupados, existen clases de extremo abierto que impiden calcularla, puesto
Cuando se estudia una población, ya sea utilizando la totalidad de los datos o que se desconoce la información exacta de los límites.
tan sólo una muestra, se acostumbra calcular una serie de medidas
descriptivas de resumen cuya función es revelar las características más La mediana es la medida que se halla exactamente a la mitad de un conjunto
representativas del conjunto: los parámetros o promedios. de datos ordenados (de menor a mayor o viceversa), de manera que lo divide
en dos partes iguales, donde los datos menores a ella representan el 50% del
Entre las medidas de resumen más utilizadas están las de tendencia central: conjunto y los que están por encima de ella forman el otro 50%. Sólo existe una
media, mediana y moda, que pueden calcularse tanto para datos no agrupados mediana para cada conjunto de datos.
como para datos agrupados en distribuciones de frecuencias.
Cuando la media resulta no ser representativa de un conjunto de datos, la
Las medidas de tendencia central también se denominan medidas de mediana toma su lugar como medida preferida, puesto que al ocupar el lugar
localización o de ubicación pues muestran el centro de una serie de números. central de los datos, describe mejor al conjunto.
En general las llamamos promedios; los más usuales son: la media, la
mediana y la moda. Por medio de estas tres medidas resumimos un conjunto A diferencia de la media, la mediana puede calcularse para datos agrupados
de datos pues indican el valor que suele ser el más representativo del conjunto. que presentan clases de extremo abierto; para datos de nivel ordinal, de
intervalo y de razón y nunca se ve afectada por valores extremos.
Las medidas de posición son otras medidas de resumen que nos reportan
información importante sobre la manera como está conformado un conjunto de Mediana: Medida que se encuentra exactamente a la mitad de un conjunto de
datos, entre ellas están los cuantiles, los más usados son: los cuartiles y datos ordenados.
centiles, pero también están los deciles.
La moda es la medida que aparece con mayor frecuencia en un conjunto de
También funcionan como medidas de resumen las medidas de dispersión que datos. Se calcula para todos los niveles de datos: nominal, ordinal, de intervalo
se estudiarán en la unidad 4. Entre las más usadas están: la amplitud de y de razón.
variación (o rango), la desviación media, la varianza y la desviación estándar.
A diferencia de la media y la mediana, la moda no siempre es un valor único
Con los parámetros pueden compararse dos o más poblaciones. porque existen conjuntos donde puede encontrarse más de un valor que se
repita en varias ocasiones o no hallarse valor alguno que se repita, esto es, un
Los promedios o medidas de tendencia central más utilizados en la sociedad conjunto sin moda. Cuando encontramos que en un conjunto se repiten ─en
son: media, mediana y moda. igual cantidad─ dos valores, el conjunto será bimodal: si el conjunto tuviera
más de dos números que se repitieran en igual cantidad, lo denominaríamos
Las medidas de posición son los cuantiles: deciles, cuartiles y centiles. multimodal.
3.3 Media, mediana y moda Esta medida es preferida como promedio, por encima de la media o de la moda,
cuando el conjunto de datos es de nivel nominal.
La media es el promedio más utilizado y se le considera el valor más
representativo por ser un punto de equilibrio. Es la medida que representa el Moda: Es la medida que aparece con mayor frecuencia en un conjunto de
promedio aritmético de un conjunto de observaciones porque toma en cuenta a datos.
45 46
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA
A continuación calcularemos estas tres medidas. Iniciaremos con la media de clase, si lo desconoce, lo puede calcular restando del límite inferior de la
datos agrupados por ser un cálculo ligeramente más laborioso que para datos segunda clase (18) el límite inferior de la primera (10), así 18 -10= 8. Todas las
no agrupados, la cual veremos después. cantidades que necesitamos para nuestros cálculos aparecen en negritas en la
tabla siguiente:
Retomaremos, de la unidad anterior, el caso del uso de las tarjetas de crédito y
débito. Para calcular la media de datos agrupados, usted necesitará las Clase Frecuencias Frecuencias Límites
acumuladas verdaderos
cantidades que obtuvimos de los cálculos para determinar el número de clases, f FA L
los puntos medios (a los que llamaremos “x”) y las frecuencias (f) de clase. Los
puntos medios los multiplicaremos por sus respectivas frecuencias y 10 - 17 4 4 9.5 -17.5
obtendremos su sumatoria (Σfx), la cual dividiremos entre “n”, es decir, el 18 - 25 5 9 17.5 -25.5
total de datos. Emplearemos la fórmula: 26 - 33 10 19 25.5 -33.5
34 - 41 12 31 33.5 -41.5
ê S fx
x= 42 - 49 6 37 41.5 -49.5
n 50 - 57 3 40 49.5 - 57.5
40
Clase Frecuencias Puntos medios
(f) (x) fx
40
- 19
H8L = 34.2
~
10 - 17 4 13.5 54 ‗ 2
X= 33.5 +
18 - 25 5 21.5 107.5 x = Σfx = 1340 = 33.5 12
26 - 33 10 29.5 295 n 40
34 - 41 12 37.5 450 Por lo tanto, la mediana de las veces que se usó tarjeta de crédito o débito en
42 - 49 6 45.5 273 un supermercado durante 40 días fue 34.2 veces.
50 - 57 3 53.5 160.5
40 1340 De esta manera, ya obtuvimos dos de las medidas de tendencia central: la
media = 33.5 y la mediana = 34.2. Note que la mediana es ligeramente mayor
Como notará, el promedio (o media) de las veces que se utilizó tarjeta de que la media.
débito o crédito durante 40 días en los supermercados fue de 33.5 veces por
día. El procedimiento que realizamos para calcular la mediana, volveremos a
emplearlo para calcular los cuantiles.
Queremos llamar su atención hacia el hecho de que, cada vez que usted
obtenga un resultado de sus cálculos, deberá acompañarlo de una
interpretación de la medida, en relación con el tema o caso que esté Para estimar la moda de datos agrupados, basta con que usted consulte la
estudiando. Digamos que la mitad de la importancia de un cálculo que usted tabla y vea cuál es el punto medio que tiene la mayor frecuencia. En nuestro
realice es que sea correcto el resultado y la otra mitad es la interpretación que caso es el 37.5, pues tiene 12 frecuencias. No requiere usted hacer ningún
haga de él. cálculo, sólo una exploración. De esta manera puede afirmar que la moda de
las veces en que se usó tarjeta de crédito o débito en un supermercado durante
Para calcular la mediana de datos agrupados usted necesitará: las clases, el 40 días fue de 37.5 veces, cantidad mayor que la media y la mediana.
número total de datos (n), las frecuencias (f), las frecuencias acumuladas (FA),
el ancho del intervalo (i) y los límites verdaderos (L). Se calcula con la fórmula Pues bien, ya hemos obtenido las medidas de tendencia central de datos
siguiente: agrupados y los llamaremos estadísticos por provenir de una muestra. Puede
n usted apreciar que los valores no son exactamente iguales, pero son muy
~ - AF
X= L + 2 i cercanos. En la siguiente unidad hablaremos al respecto.
f
A
Para sustituir los valores en la fórmula, le sugiero que comience por el
elemento n/2, en nuestro ejemplo: 40/2, lo cual nos da 20. Escríbalo donde Ejercicio 1:
corresponde, dentro de la fórmula y luego localice el 20 en la frecuencia Retome los resultados que obtuvo usted en la unidad anterior para el
acumulada, vea la cantidad donde está contenido el 20, en nuestro ejemplo es problema de los promocionales en apoyo a los candidatos a diputados que
la FA = 31, sobre ese renglón recorra hacia la columna “límites verdaderos” y aparecieron en radio y televisión durante 30 días y calcule: a) la media
copie el inferior (33.5), después copie la FA anterior a la de la clase en que b) la mediana c) la moda d) Interprete los resultados
encontró la mediana (19) y finalmente copie la frecuencia (f) de la clase en que
se halló la mediana (12). Recuerde que el intervalo es la amplitud de cada
47 48
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA
Ahora calcularemos las medidas de tendencia central para datos no 210 210 244 270 280 320 325 390 405 452
agrupados (o datos ordenados), ya sea que provengan de una población o de
una muestra. Los cálculos son los mismos, pero varía la notación de las Asimismo, dado que el 210 se repite en dos ocasiones, pasaría a ser la moda
fórmulas. del conjunto.
A
Para una población se acostumbra usar la fórmula:
SX Ejercicio 2:
µ= Calcule la media, la mediana y la moda del siguiente conjunto de
N
y para una muestra usaremos: números que representan una población: 4, 5, 8, 4, 8, 8, 3, 10, 6.
¯ Sx
X= 3.4 Media geométrica y media ponderada
n
Estas dos medidas también son de tendencia central, pero se calculan para
casos especiales, como cuando se trabaja con cantidades que cambian su
La letra µ (mu minúscula) se usa para nombrar la media de una población. valor cada cierto tiempo (y se hace necesario conocer la tasa promedio de
cambio) o cuando se calcula un promedio y debe tomarse en cuenta la
importancia de cada valor. Si en procesos como esos sólo se obtuviera la
Pongamos por ejemplo que las cantidades pagadas (en pesos cerrados) por media aritmética, los resultados serían erróneos, pues en el caso de la media
los nueve departamentos de un condominio en Naucalpan, durante un bimestre geométrica, siempre resulta ser menor que la aritmética.
a la Compañía de Luz fueron: 210, 325, 280, 405, 320, 270, 390, 244 y 452.
Para calcular la media de esta población, simplemente se suman las nueve La media geométrica (MG) siempre es menor (cuando mucho igual) que la
cantidades y luego se divide su sumatoria entre nueve, el total de datos: media aritmética.
210 + 325 + 280 + ... +452 2896
µ= = = 321.8
9 9 La media geométrica (MG) es un promedio muy utilizado en el campo de los
Podemos afirmar, entonces, que la media de los pagos de luz de los nueve negocios y la economía en general, porque continuamente se requiere
departamentos de un condominio en Naucalpan fue de $321.80 bimestralmente. determinar el cambio porcentual de ventas, sueldos o cifras como el Producto
Interno Bruto (PIB) u otras cantidades importantes para la economía de un país.
Cuando se trata de calcular la media muestral, utilizaremos la fórmula La puede usted calcular en dos casos:
correspondiente, pero procedemos de igual manera que en el caso anterior.
a) Cuando necesite conocer el promedio de porcentajes, tasas, índices o
Para calcular la mediana de una población o muestra de datos no agrupados, razones, utilice:
usted deberá ordenar los datos de menor a mayor (como lo ejemplificamos è
n
MG= Hx1L Hx2L Hx3L ... HxnL
abajo) o de mayor a menor. La mediana será el valor que se ubique
exactamente en medio de la lista. b) Cuando necesite calcular el cambio o aumento porcentual promedio
durante un intervalo de tiempo, utilice:
210 244 270 280 320 325 390 405 452
MG = $
Así, la mediana de los pagos de luz será de $320.00 a diferencia de la media valoralfinaldelperiodo
n -1
que fue de $321. 80. En este caso, debido que no existe ninguna cantidad que valoraliniciodelperiodo
se repita, afirmamos que no hay moda o que cada una de las cantidades
registradas lo son. Esta medida se obtiene calculando la n-ésima raíz del producto de los valores
que representan el cambio y es una forma de contemplar los efectos
Cuando el conjunto de datos tiene un número par, la mediana se calcula multiplicativos como la inflación o el interés compuesto.
sumando las dos cantidades del centro y dividiendo esa suma entre dos.
Es importante que usted comprenda esta medida porque la utilizará
Supongamos por ejemplo, que existiera un décimo departamento que pagara posteriormente en la unidad VI y cuando curse la materia de Macroeconomía
también $210.00, entonces la mediana sería: 280+320 / 2 = 300 o $300.00. en el tercer semestre, también le será útil porque con ella podrá minimizar la
importancia de los valores extremos de un conjunto de datos.
49 50
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA
A
1999 10.57 2005 9.88 Ejercicio 3:
2000 10.99 Según cifras reportadas por BANXICO,8 el creciente financiamiento
a la importación de automóviles, computadoras, refrigeradores y videocámaras
¿Cuál ha sido el promedio porcentual anual de las exportaciones no ha impulsado el crédito al consumo. Cifras dadas en millones de pesos, de
petroleras de México en las importaciones de Estados Unidos entre 1995 y enero a agosto de cada año, partiendo del año 2000.
2005? Interprete el resultado.
Año Millones Incremento
de pesos porcentual
2000 6 392
11
MG = √ (8.25) (9.01) (9.53) (10.25) (10.57) (10.99) (11.43) (11.37) (10.68) (10.31) (9.88) 2001 10 425 63% a) Calcule la tasa de aumento anual del
2002 17 797 71% crédito al consumo en ese periodo.
M G = 10.16 2003 28 116 58% b) Calcule el promedio porcentual anual
2004 43 518 55% del crédito al consumo en ese periodo.
El promedio porcentual de las exportaciones no petroleras de México en las 2005 50 150 15%
importaciones de Estados Unidos entre 1995 y 2005 fue de 10.16%.
Puede notar que en 2001 hubo un repunte considerable, pero a partir de ese La media ponderada o pesada (XW) es un promedio que usted podrá utilizar
año ha venido bajando la participación de nuestras exportaciones pues no cuando requiera calcular una cantidad donde deba tomar en cuenta el peso o
podemos obviar el papel que la economía china juega hoy en la economía valor específico de cada dato u observación con respecto al total, esto es,
mundial y que está afectando especialmente a nuestra economía. cuando haya valores con un peso o valor diferente para cada caso. Se calcula
Si hubiéramos calculado este promedio con una media aritmética, el resultado con la fórmula:
hubiera sido:
w1 x1 +w2 x2+ w3x3 +... +wn xn
xw =
8.25+9.01+9.53+…+9.88 w1 +w2+w3 +... +wn
X= = 10.21%
11
La media ponderada (XW) calcula el promedio que toma en cuenta la
Como usted puede apreciar, la media geométrica es menor que la media importancia de cada valor con respecto al total.
aritmética. Vayamos a otro ejemplo también relacionado con el tema de nuestro
comercio con Estados Unidos. Veámoslo con un ejemplo cercano a su experiencia. Usted sabe que en
nuestro curso de Estadística descriptiva el sistema de evaluación consta de dos
7
Según la Oficina Textil y del Vestido de Estados Unidos (OTEXA), las partes: un examen final con un valor del 60% de su calificación final y tres
exportaciones de mezclilla mexicana han sido, en millones de metros exámenes parciales que valen, respectivamente, 15%, 15% y 10%, sumando
cuadrados, como sigue: así el 40% que corresponde a la primera fase de su calificación total.
Año Cantidad Pensemos que usted obtiene 8.5 en el primero; 9.0 en el segundo y 9.5 en el
2001 38.4 tercero. ¿Qué promedio lleva usted realmente?
2002 36.9 ¿Cuál es la tasa de cambio porcentual
2003 33.5 de las exportaciones mexicanas hacia H0.15x8.5L +H0.15x9L + H0.10x9.5L 3.575
2004 30.7 Estados Unidos durante ese periodo? xw = = = 8.94
0.15 + 0.15 + 0.10 0.40
2005 20.0
51 52
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA
El 8.94 es su promedio hasta el momento, con el cual ha acumulado el 36% del Ya vimos que la mediana es el promedio que divide al conjunto en dos partes
40% de su calificación total. iguales, un 50% menor y un 50% mayor a ella; así los cuartiles dividen al
conjunto en cuatro partes iguales que representan cada una un 25% del total.
Veamos otro ejemplo: Suponga que usted desea calcular el costo promedio del Generalmente se calculan el primero (cuartil uno = Q1) y el tercero (cuartil tres
trabajo por hora para dos productos que elabora su empresa, para los cuales = Q3) que representan, respectivamente, el 25% y el 75% de las observaciones.
se necesitan distintos niveles de trabajo con un costo respectivo diferente y Podemos decir que la mediana viene siendo el cuartil dos.
horas requeridas determinadas que se presentan en la siguiente tabla:
Cuartil: Divide al conjunto en cuatro partes iguales.
HORAS DE TRABAJO INVERTIDO
NIVEL DE TRABAJO SALARIO POR HORA POR UNIDAD DE PRODUCTO Si usted se remitiera a la gráfica de frecuencias acumuladas u ojiva, podría
(X) Producto 1 Producto 2 localizar los cuartiles fácilmente al dividir el gráfico en cuatro partes, de manera
No calificado $ 5.00 1 4 que la primera sería el Q1 y la tercera el Q3, la cifra localizada representará el
Semicalificado 7.00 2 3 25% y el 75% respectivo de la población o muestra estudiada.
Calificado 9.00 5 3
Los cuartiles para datos agrupados se calculan con las siguientes fórmulas:
Realizaremos los cálculos para cada producto. n n
- AF - AF
Q1 = L + 4 i Q3 = L + 4 i
Xw = (5x1)+(7x2)+(9x5) = 64 = 8 Xw= (5x4)+(7xx3)+(9x3) = 68 = 6.8 f f
1+2+5 8 4+3+3 10
A la diferencia entre el cuartil tercero y el primero (Q3 - Q1) se le denomina
De esta manera, sabrá usted que el costo promedio por unidad de producto recorrido intercuartílico o rango intercuartílico (RIC), que representa el 50%
para el artículo uno es de $8.00 y para el artículo dos de $6.80 central del conjunto de datos.
A
Ejercicio 4: RIC (rango intercuartílico): Representa el 50% central del conjunto.
El IFE publicó, en septiembre de 2005, en un periódico local de Los Los centiles dividen al conjunto en 100 partes iguales, de manera que cada
Ángeles, California, cinco anuncios promoviendo la inscripción al padrón división representa un 1% del conjunto. Los centiles que más suelen calcularse
electoral entre los mexicanos residentes en Estados Unidos para que votaran son el décimo (centil diez = P10) y el nonagésimo (centil noventa = P90). A la
durante las elecciones federales de 2006. Como resultado, obtuvo los datos diferencia entre el centil noventa y el diez (P90 - P10) se le llama amplitud
que se dan en la siguiente tabla: centílica y representa el 80% central de los datos del conjunto, eliminando los
datos extremos.
No. de veces que el lector 1 2 3 4 5
vio el anuncio Los centiles para datos agrupados se calculan con las siguientes fórmulas:
53 54
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA
Clase Frecuencias Frecuencias Límites Habrá usted notado que en el lugar de la FA se colocó un cero, esto se debe a
Acumuladas verdaderos
f FA L que la clase en que se halla el centil 10 es la primera y por lo tanto no hay
frecuencia acumulada anterior.
10 - 17 4 4 9.5 -17.5 Para obtener el centil noventa, que equivale al noveno decil, procedemos de
18 - 25 5 9 17.5 -25.5 igual manera. En la tabla aparecen con negritas las cantidades que requerimos.
26 - 33 10 19 25.5 -33.5
34 - 41 12 31 33.5 -41.5 Clase Frecuencias Frecuencias Límites
acumuladas verdaderos
42 - 49 6 37 41.5 -49.5 f FA L
50 - 57 3 40 49.5 - 57.5 10 - 17 4 4 9.5 -17.5
40 18 - 25 5 9 17.5 -25.5
26 - 33 10 19 25.5 -33.5
40
-9 34 - 41 12 31 33.5 -41.5
Q1 = 25.5 + 4 H8L = 26.3 42 - 49 6 37 41.5 -49.5
10 50 - 57 3 40 49.5 - 57.5
40
Para obtener el tercer cuartil, procedemos de igual manera. En la tabla
aparecen con negritas las cantidades que requerimos. 90H40L
- 31
Clase Frecuencias Frecuencias Límites P90 = 41.5 + 100
H8L = 48.2
acumuladas verdaderos 6
f FA L
10 - 17 4 4 9.5 -17.5 La amplitud centílica, en este caso, es 30.7 obtenido de 48.2 - 17.5.
18 - 25 5 9 17.5 -25.5
26 - 33 10 19 25.5 -33.5 Amplitud centílica =P90 -P10 =48.2 - 17.5 =30.7
34 - 41 12 31 33.5 -41.5
42 - 49 6 37 41.5 -49.5 Los últimos seis resultados obtenidos pueden interpretarse de la siguiente
50 - 57 3 40 49.5 - 57.5 manera: que el 25% de las veces que menos se usó la tarjeta fue 26.3 veces,
40 mientras que el 25% de las veces que más se usó fue 40.83 veces, que el 80%
de las veces que se usó va de 17.5 a 48.2 veces, que el 10% de las veces que
3H40L
- 19 más se usó fue 48.2 veces como mínimo, etc.
Q3 = 33.5 + 4
H8L = 40.83
12 Como podrá usted observar en las fórmulas para calcular la mediana, los
cuartiles y los centiles, el número de datos n ─en cada fórmula─ se divide entre
El RIC, para este caso, es igual a 14.53, obtenido de 40.83 - 26.3. el número de secciones que representa cada medida (la mediana representa
Para obtener el centil diez que equivale al primer decil, procedemos de igual dos, o sea cada parte es el 50%, por eso n/2; los cuartiles representan cuatro
manera. En la tabla aparecen con negritas las cantidades que requerimos. partes, o sea, el 25% cada uno, por eso n/4, y los centiles representan cien
partes, por eso n/100. En el caso del Q1, vendría siendo ¼, de allí que se use
Clase Frecuencias Frecuencias Límites
acumuladas verdaderos 1n/4, pero como no se usa el coeficiente 1, se omite; el Q3 representa ¾, por lo
f FA L que en la fórmula aparece 3n/4; en el P10 encontramos 10n/100 y en el P90,
10 - 17 4 4 9.5 -17.5 90n/100.
18 - 25 5 9 17.5 -25.5
26 - 33 10 19 25.5 -33.5 Por semejanza, podríamos calcular el P33 anotando en nuestra fórmula 33n/100
34 - 41 12 31 33.5 -41.5 y para el P82, 82n/100, etc. Asimismo, podríamos decir que la mediana es el P50,
42 - 49 6 37 41.5 -49.5 que el Q1 = P25 y que el Q3 = P75. También podemos decir que el P20 es el decil
50 - 57 3 40 49.5 - 57.5 dos, que el P30 es el decil tres etc.
40
A
10H40L
-0 Ejercicio 5:
P10 = 9.5+ 100 H8L = 17.5 Retomando el problema que ha venido resolviendo sobre los
4 promocionales en apoyo a candidatos a diputados, calcule:
55 56
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA
a) Q1, Q3 y el RIC b) P10, P90 y la amplitud centílica que el noveno centil es igual a 461.2, valor que se interpreta como que la
c) Interprete los resultados décima parte de los departamentos que más consumen luz pagan mínimo
$461.20 bimestralmente.
Para el cálculo de cuartiles, deciles y centiles de datos no agrupados, R Estamos por concluir el estudio de esta unidad, antes de abordar el
podemos utilizar, en general, la formula: último tema, confronte cuáles son los objetivos logrados hasta
Lc = Hn+1L
c este momento y qué falta por cubrir. Comente en asesoría sus
100 dudas u observaciones.
Los resultados 4 y 12 nos expresan el lugar que ocupa cada cuartil en la lista Otro recurso con el que puede usted contar para presentar un resumen de su
ordenada de nuestros datos, así el primer cuartil resulta ser el 220 al ocupar el información es un diagrama que se ha vuelto muy popular: el diagrama de
cuarto lugar de la lista y el tercer cuartil le corresponde al 390 al ocupar el lugar “box-wiskers” o de “caja y bigotes”.
número 12. Al interpretar estos datos podemos decir (por ejemplo) que la
cantidad máxima que paga la primera cuarta parte de los departamentos que Este diagrama se basa en cinco números: los valores mayor y menor de su
menos pagan por consumo de luz es de $220.00, mientras que la cuarta parte conjunto de datos, la mediana, el cuartil uno y el cuartil tres. Para crearlo, usted
de los que más pagan es mínimo $390.00 deberá trazar una recta numérica cuya longitud será ligeramente mayor a la
Ahora calculemos el primer decil y el noveno centil. proporcional del rango o distancia entre los datos menor y mayor. Luego
L10 = H 15+1L L90 = H 15+1L
10 90 localizará los valores correspondientes a la mediana y a los cuartiles y sobre la
= 1.6 = 14.4 recta trazará una caja ─dejando un espacio entre caja y recta─ que tendrá
100 100
como límites a los cuartiles, la mediana estará marcada dentro de la caja.
Para el caso del primer decil, la fórmula nos indica que se halla en el lugar 1.6, Posteriormente, y para finalizar, trazará con línea punteada los “bigotes”, que
esto es, entre el primero y segundo, a una distancia de 0.6 de ellos; el primer partirán de los extremos de la caja y terminarán en el lugar que corresponda al
valor es 200 y el segundo es 210, por lo que la distancia entre ellos es de 10, al valor menor y al valor mayor, respectivamente. Este gráfico es un valioso
cual hay que pasar a 0.6 de la distancia, es decir, lo multiplicamos por 0.6 (0.6 recurso para resumir la información.
x 10 = 6) y sumamos ese producto al primer valor (200 + 6) para obtener que el
primer decil es igual a 206, valor que se interpreta señalando que la décima Diagrama de “box-wiskers”: Se basa en cinco números: los valores mayor y
parte de los departamentos que menos consumen luz pagan máximo $206.00 menor de su conjunto de datos, la mediana, el cuartil uno y el cuartil tres.
al bimestre.
Para el ejemplo de las tarjetas (otra vez), el diagrama de “caja y bigotes” nos
De la misma manera procedemos para determinar el valor que ocupa el noveno queda así:
centil. Se halla en el lugar 14.4, entre el último y el penúltimo, que Valor mayor = 52 (tomado de nuestros datos ordenados)
corresponden a las cantidades 452 y 475; la distancia entre ambas es de 23: Valor menor = 12 (tomado de nuestros datos ordenados)
multiplicado por 0.4 nos da 9.2, que sumado a la cantidad menor nos resulta Mediana = 34.2 Cuartil 1 = 26.3 Cuartil tres = 40.8
57 58
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA
Cada cuartil corresponde al 25% del conjunto; cada centil, al 1% y cada decil al
12 26.5 34.2 40.8 52 10%.
|------------------|______|_____|---------------| La base para trazar un diagrama de “caja y bigotes” es el cálculo de cinco
números: los valores mayor y menor del conjunto, los cuartiles uno y tres y la
___________________________________________ mediana.
10 20 30 40 50 Todas las medidas aprendidas en esta unidad le ayudarán a tener un
conocimiento más preciso sobre las características de la población que esté
estudiando.
Con este diagrama también podemos distinguir que del lado izquierdo de la
mediana ─y por tanto del conjunto─ hay más datos que del lado derecho, lo
cual indica que existe asimetría negativa. El tema de la asimetría lo veremos en “Para recordar lo esencial”
la próxima unidad.
Nuevos términos y conceptos fundamentales
A Ejercicio 6:
59 60
UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN UNIDAD 3 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA
‗
ACTIVIDAD DE AUTOEVALUACIÓN x = 63 + 71 + 58 + 55 + 15 = 52.4%
5
Le sugerimos “echar un vistazo” al periódico de su preferencia o a alguna a) El porcentaje del incremento anual o tasa de aumento anual al financiamiento del crédito al
página de Internet para obtener datos reales y practicar con ellos los conceptos consumo, entre el año 2 000 y 2 005, por los bancos en México fue de 51%.
y cálculos aprendidos en esta unidad. b) El promedio porcentual del financiamiento del crédito al consumo, entre el año 2 000 y 2 005,
Confronte la información que se le ha ofrecido a lo largo de esta unidad con las por los bancos en México fue de 46.4%.
c) En efecto, la media geométrica es menor que la media aritmética porque esta es igual a
fuentes consultadas que se citan, para que practique y se familiarice con la 52.4%, cantidad mayor a la obtenida con la media geométrica.
forma en que pueden extraerse los datos de este tipo de fuentes y con ellos
realizar un análisis estadístico. Ejercicio 4:
61 62