Está en la página 1de 14

Medidas de posición

La importancia en el uso de algunas medidas estadísticas radica en que sintetizan la posición general de los
datos, en donde la información general que proporcionan permite lograr un mayor conocimiento de su
comportamiento.

Seguidamente se analizan cinco de las principales medidas de posición.

Moda: Corresponde al dato que más se repite en un conjunto de datos, se utiliza tanto para cualitativos como
cuantitativos. En un grupo de observaciones puede ser que no exista moda o que haya más de una moda.

Promedio o media aritmética: Se dice que es una medida de tendencia central debido a que tiende a
caracterizar la mayor concentración de datos. Es uno de los valores más utilizados dentro de los análisis
estadísticos, es la medida de tendencia central de mayor relevancia. Se calcula mediante la fórmula:

∑𝑥𝑖 𝑆𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠


𝑥̅ = =
𝑛 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠

Máximo y mínimo: Estos valores se definen a partir de sus propios nombres. El máximo corresponde al dato
de mayor valor numérico del conjunto y el mínimo representa el de menor valor numérico.

Nota: El promedio tiene la desventaja de ser muy sensible a los valores extremos, de modo que, si un conjunto
de datos tiene unos pocos valores más grandes o más pequeños del común, provocan que el promedio se sesgue
o incline hacia esos valores extremos.

Mediana: Otra forma de buscar una representación más justa cuando los valores extremos ejercen una fuerte
influencia sobre el promedio consiste en utilizar la mediana, la cual representa el valor central del conjunto de
acuerdo con las magnitudes de los datos. Es decir, para la determinación de la mediana no interesa tanto el valor
numérico de las observaciones sino la posición de los mismos.

𝑛+1
Para calcular la mediana se deben ordenar los datos en orden ascendente y utilizar la fórmula 𝑃 = , esta nos
2

dará la posición de la mediana. En caso de que la cantidad de datos sea impar, nos dirá directamente donde se
encuentra esta, pero si la cantidad de datos es par se debe considerar un procedimiento adicional. Para este caso,
se deben considerar los valores asociados a las posiciones enteras entre las que se encuentra la posición
resultante. Una vez que se identifican se deben sumar y dividir entre dos, el resultado corresponde a la mediana.

Cuartiles: Los cuartiles son medidas estadísticas que se utilizan para dividir el conjunto de datos en cuatro
partes, cada una de ellas encierra un 25% de los datos. El primer cuartil es un valor numérico para el cual 25%
de los datos (o sea la cuarta parte) son menores o iguales a dicho valor, el tercer cuartil es el valor para el cual

1
75% de los datos (tres cuartas partes) son menores o iguales que dicho valor. El segundo cuartil, corresponde a
la mediana de la distribución e indica que 50% de los datos (dos cuartas partes) son menores o iguales a dicho
valor.

Por lo anterior, para determinar la mediana y los otros dos cuartiles, los datos deben estar ordenados de menor a
mayor y se consideran las siguientes fórmulas para determinar su posición:

𝑛+1
𝑄1 → 𝑃 =
4

𝑛+1
𝑄2 = 𝑀𝑒 → 𝑃 =
2

3(𝑛 + 1)
𝑄3 → 𝑃 =
4

En caso que la posición sea decimal, se debe realizar el mismo procedimiento que realizamos con la mediana.

Promedio ponderado

Cuando se pide determinar el promedio, en el cual los valores de los datos tienen pesos relativos o
ponderaciones diferentes entre sí, se debe prestar atención no solamente a cada dato sino a su peso relativo. Esto
ocurre por ejemplo al obtener la nota promedio de un curso, generalmente las evaluaciones tienen diferentes
pesos relativos, por lo que el promedio debe determinarse considerando dichas ponderaciones y no un promedio
simple.

Este se calcula mediante la fórmula:

𝑥1 ⋅ 𝑤1 + 𝑥2 ⋅ 𝑤2 + ⋯ + 𝑥𝑛 ⋅ 𝑤𝑛
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑜 =
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛

El promedio ponderado se interpreta de la misma manera que una media simple.

2
Forma de la distribución de los datos

Para analizar las distribuciones debe considerarse que la mediana se ubica en el centro de la distribución,
mientras que la media aritmética se sesga hacia la presencia de los valores extremos, por ello, se tendrían las
siguientes definiciones:

a) Asimetría positiva: Para que una distribución de los datos tenga una asimetría positiva el promedio debe
ser mayor que la mediana.
b) Asimetría negativa: Para que la distribución de los datos presente una asimetría negativa el promedio
debe ser menor que la mediana.
c) Simétrica: En caso de que la mediana y el promedio sean iguales se tiene una simetría.

Ejemplo

Para explorar más acerca de los promedios, examinamos el siguiente conjunto de datos de tres maestros; cada
uno de ellos asegura que su grupo obtuvo mejor calificación promedio que los demás:

Maestro Silva: 62, 94, 95, 98, 98

Maestro Juárez: 62, 62, 75, 99, 100

Maestra Rivera: 40, 70, 77, 99, 99

Determine todas las medidas de posición. ¿Los datos presentan simetría o asimetría?

Ejercicios

1. Determine las medidas de posición de los siguientes conjuntos de datos:

3
2. En la comunidad, como parte de un estudio, se les preguntó a las familias: ¿Cuántas veces al mes utilizaban
los servicios del EBAIS? Las respuestas fueron las siguientes:

a) Elabore una tabla de frecuencias y encuentre las medidas de tendencia central.


b) ¿Cuántas familias utilizan el EBAIS más que el promedio?
c) ¿Cuántas familias utilizan el EBAIS menos que la mediana?
3. En la siguiente tabla de frecuencias, encuentre las medidas de tendencia central.

4. Para los siguientes grupos de datos encuentre la información solicitada. A partir de la tercera serie, se deja
un espacio para ordenar los datos.

4
5. En un curso con alto grado de dificultad de la universidad, un estudiante debió realizar siete pruebas cortas y
debía obtener una nota mínima de 70 para aprobar la materia. Desafortunadamente, en el cuarto examen
tuvo un problema de salud que afectó su concentración y le hizo obtener una baja calificación. Las notas
obtenidas son las siguientes: 71; 75; 78; 28; 80; 89 y 70. De acuerdo a esta información determine:
a. Calcule todas las medidas de posición con la información anterior y determine la nota obtenida en el
curso.

b. Considera usted justa esta calificación, si la respuesta es negativa; establezca algún procedimiento que
permita otorgarle una calificación más justa al estudiante.

6. En la siguiente tabla se muestra la cantidad de casos reportados positivos de VIH y su prevalencia por cada
1000 habitantes.

a. Determine todas las medidas de posición vistas.


b. Una organización brindará atención especial a los países con una prevalencia mayor al 25% de los
datos. ¿A cuáles países sería?
c. Otra organización ayudará a al 25% de los países con menos casos. ¿Cuáles serían?

5
7. En la siguiente tabla se muestran los precios de algunos teléfonos celulares del mercado

a. Calcule el promedio del costo de los teléfonos.


b. Calcule la mediana del costo de los teléfonos.
c. Una empresa financia únicamente el 25% de los
teléfonos más caros. ¿cuáles modelos se pueden
financiar?
d. La mamá de Pedro, le comprará un teléfono y lo pone a
escoger entre los teléfonos que están en el 25% más
barato. ¿Entre cuáles teléfonos puede escoger?

8. Suponga que una compañía de Hardware para computadoras está realizando un concurso para ascender a un
agente de ventas al puesto de administrador de una de sus sucursales. Para tal efecto, el Gerente General
decidió aplicar una prueba de conocimientos básicos de Estadística a todos sus agentes vendedores y
seleccionar en una primera etapa a aquellos que obtengan calificaciones más altas que el puntaje promedio.
La prueba tuvo un valor total de 120 puntos y los datos obtenidos en la prueba se resumen seguidamente:
Desafortunadamente, una vez que le entregaron los puntajes a cada agente y construyeron la distribución de
frecuencias, perdieron las notas individuales y solamente les quedó esta distribución. Aunque pueden
recuperar la información pidiendo a los agentes que devuelvan la carta en la que le entregaron la calificación
de la prueba deciden trabajar con la información que poseen.
Con esta información determine el puntaje promedio de la prueba e indique cuántos agentes vendedores
(aproximadamente) quedaron seleccionados en la primera etapa.

6
Medidas de variabilidad

Las medidas de variabilidad, también conocidas como medidas de dispersión, nos permiten saber con mayor
exactitud qué tan concentrados o que tan dispersos están los datos de una distribución alrededor de la medida de
posición, es decir, qué tan juntos o qué tan separados están.

Las medidas de variabilidad o dispersión tienen por objetivo resumir en un solo valor la variabilidad de los
datos de acuerdo con algún principio básico que caracterice esa medida.

Recorrido: Esta es la medida de variabilidad más simple, consiste en determinar el rango total de los datos,
viene dado por la diferencia entre el valor máximo y valor mínimo del conjunto. Aunque esta medida es un
referente de variabilidad, no es una buena medida debido a que depende exclusivamente de los valores
extremos. Si uno de ellos (máximo o mínimo) se comporta muy diferente al resto de las observaciones, entonces
el recorrido tiende a sobredimensionar la variabilidad de los datos. Se calcula con la fórmula:

𝑅 = 𝑚á𝑥𝑖𝑚𝑜 − 𝑚í𝑛𝑖𝑚𝑜

El recorrido intercuartílico: Esta medida corresponde a la diferencia entre el tercer y el primer cuartil, es decir
corresponde al rango de variabilidad de 50% de los valores centrales. Esta medida es mucho más precisa que el
recorrido total, pues elimina la influencia de los valores extremos, pero no considera todos los datos.

50%

Recorrido intercualtílico= Q3-Q1

7
La variancia y la desviación estándar: Para medir la variabilidad de una forma más precisa, es necesario buscar
una medida que en su cálculo utilice toda la información de los datos. En este sentido, la medida que mejor se
ajusta a este principio consiste en determinar las diferencias o desviaciones de cada dato respecto al promedio.
Se calcula utilizando la fórmula: Sumatoria
Xi= Dato
2
∑(𝑥𝑖 − 𝑥̅ )2
𝑠 = = 𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑖𝑎
Muestra 𝑛−1 X=Promedio

n=número de datos
∑(𝑥𝑖 − 𝑥̅ )2 de la muestra
𝑠=√ = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
𝑛−1

Esta es correspondiente para cuando realizamos el cálculo para una muestra, para una población tiene un ligero
cambio: Nota: la
Sumatoria desviación
estándar es la
Xi= Dato 2
∑(𝑥𝑖 − 𝑥̅ )2 raíz cuadrada de
𝜎 = = 𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑖𝑎 la varianza
𝑁
X=Promedio
Población
N= Número de datos
de la población ∑(𝑥𝑖 − 𝑥̅ )2
𝜎=√ = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
𝑁

Ejemplo

1. Los datos corresponden a la cantidad de lluvia (en litros por metro cuadrado) que cayó en los once cantones
de la provincia de Guanacaste durante la noche de mayor impacto del Huracán Otto. Calcule el promedio,
los recorridos y la desviación estándar poblacional.
15 − 48 − 40 − 35 − 28 − 14 − 35 − 67 − 36 − 58 − 52

Utilizando la calculadora Los pasos que vienen están muy completos, yo los seguí y todo
bien, no están complicados
Con la calculadora FX-570 se puede realizar el cálculo de la variancia y desviación estándar de una manera más
sencilla. Se debe oprimir la tecla “mode” seguida del 3, en este seleccionamos el modo estadístico.
Posteriormente seleccionamos el 1: 1 − 𝑉𝐴𝑅. Aparecerá una tabla en la que se deben ingresar todos los datos
uno a uno (se introduce uno y se oprime el igual). Al finalizar se oprime 𝐴𝐶 para pasar a la pantalla principal.

Luego, oprimimos la tecla “Shift”, 1 y 4. Al estar en esta posición podemos seleccionar entre 1: 𝑛 que es el
número de datos, 2: 𝑥̅ que es el promedio, 3: 𝜎𝑥 que es la desviación para una población y 4: 𝑠𝑥 que es la
desviación para una muestra.

8
Con la calculadora FX-570 LA X se puede realizar el cálculo de la variancia y desviación estándar de una
manera más sencilla. Se debe oprimir la tecla “MENU” seguida del 6, en este seleccionamos el modo
estadístico. Posteriormente seleccionamos el 1: 1 − 𝑉𝐴𝑅. Aparecerá una tabla en la que se deben ingresar todos
los datos uno a uno (se introduce uno y se oprime el igual). Al finalizar se oprime la tecla 𝑂𝑃𝑇𝑁 y luego 3,
donde nos dará todos los resultados.

Ejercicios

1. Para el siguiente grupo de datos calcule las medidas de variabilidad sin usar calculadora.

2. Los siguientes datos son una muestra de la tasa de producción diaria de botes de fibra de vidrio que fabrica
cierta compañía.
21 − 18 − 23 − 17 − 22 − 24 − 19 − 22 − 21 − 17
El gerente de producción de la compañía siente que una desviación estándar de más de tres botes por día
indica variaciones de tasas de producción inaceptables. ¿Deberá preocuparse por las tasas de producción de
la planta?
3. La chef en jefe de cierto restaurante acaba de recibir dos docenas de jitomate de su proveedor, pero todavía
no los acepta. Sabe por la factura que el peso promedio de un jitomate es 7.5 onzas, pero insiste en que
todos tengan un peso uniforme. Aceptará los jitomates sólo si el peso promedio es 7.5 onzas y la desviación
estándar es menor que 0.5 onzas. Los pesos de los jitomates son los siguientes:

6.9 − 6.7 − 9.5 − 8.6 − 7.3 − 6.4 − 7.2 − 6.9 − 8.1 − 6.2 − 7.3 − 8.4 − 9.0 − 7.3 − 7.0 − 8.7 − 7.2
6.5 − 7.1 − 8.0 − 6.7 − 9.4 − 6.9 − 7.5
¿Cuál es la decisión del chef y por qué?

9
Diagrama de cajas y bigotes

Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido
intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana
y por lo tanto su relación con los cuartiles primero y tercero.

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la
variable. Las líneas que sobresalen de la caja se llaman bigotes.

Ejemplo

1. Utilizamos la distribución correspondiente a la edad de 20 personas.

36 − 25 − 37 − 24 − 39 − 20 − 36 − 45 − 31 − 31
39 − 24 − 29 − 23 − 41 − 40 − 33 − 24 − 34 − 40

Se deben ordenar los datos para posteriormente calcular los cuartiles.

Dibujar la caja

Información del diagrama

Podemos obtener abundante información de una distribución a partir de estas representaciones. Veamos alguna:

La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre
el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%.

El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más jóvenes
están más concentrados que el 25% de los mayores.

El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en 14,5 años.

10
2. En los siguientes grupos de datos, se da un resumen de algunas medidas de posición. Encuentre el recorrido,
el recorrido intercuartílico y realice diagramas de cajas para cada grupo. Discuta el significado de los
“bigotes” en el diagrama.
a. 𝑚𝑖𝑛 = 1, 𝑚á𝑥 = 5, 𝑄1 = 2, 𝑀𝑒 = 3, 𝑄3 = 5
b. 𝑚𝑖𝑛 = 11, 𝑚á𝑥 = 51, 𝑄1 = 25, 5 , 𝑀𝑒 = 35, 𝑄3 = 44
c. 𝑚𝑖𝑛 = 8, 𝑚á𝑥 = 54, 𝑄1 = 11, 𝑀𝑒 = 41, 𝑄3 = 52

¿Qué conclusiones podemos sacar a partir de los diagramas?

Ejercicios

1. Las puntuaciones obtenidas por 87 personas tienen los siguientes parámetros de posición: 𝑄1 = 4,1; 𝑀𝑒 =
5,1 y 𝑄3 = 6,8. Todas las puntuaciones están en el intervalo 1 a 9. Realice un diagrama de caja.

2. A continuación, se muestran diagramas de caja para los tiempos de práctica de piano en horas a la semana
para Tomás y Diana. Realice algunas comparaciones de sus tiempos de práctica

11
3. A continuación, aparecen diagramas de caja donde se comparan los precios de los boletos en dos teatros:

a. ¿Cuál es la mediana del precio de los boletos en cada teatro?


b. ¿Cuál es el teatro que tiene mayor rango en sus precios?
c. ¿Cuál es el precio más alto de un boleto en cada teatro?
d. Realice algunos comentarios comparando los precios de los boletos en los dos teatros.

4. Considere la siguiente información:


En el siguiente diagrama de cajas se presentan datos referentes a la temperatura promedio diaria, en grados
Celsius, registradas durante 60 días consecutivos en las ciudades A y B:

Analice la veracidad de las siguientes proposiciones, responda sobre la línea con un Falso o Verdadero:
a. En la ciudad B, al menos un día se registró una temperatura menor o igual que 13°C.
b. La temperatura más baja registrada en la ciudad A fue de 13°C.
c. En la ciudad A, al menos 15 días se registró una temperatura promedio menor o igual a 10°C.
d. En ambas ciudades un 25% de las temperaturas promedio registradas fue igual o mayor que 17°C.
e. En la ciudad A se presenta una menor variabilidad de temperaturas que en la ciudad B.

12
Medidas relativas

Estandarización o tipificación de mediciones

Una vez que los datos se tipifican son comparables entre sí, en términos relativos. Se determina por:

𝑥𝑖 − 𝑥̅ 𝑑𝑎𝑡𝑜 − 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜
𝑍= = = 𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎𝑐𝑖ó𝑛
𝜎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟

La estandarización o tipificación es un proceso que se realiza sobre un valor de una variable y sirve, entre otras
cosas, para comparar de una forma válida datos procedentes de grupos de datos con características diferentes.
Tanto para una muestra como para una población se aplica la misma fórmula, lo único que se debe considerar es
la desviación para cada una.

El resultado que se obtiene indica qué tan cercano está un dato al promedio de su grupo de manera relativa, con
lo que entre más cercano a cero sea el valor, más cerca está el dato del promedio y viceversa, entre mayor sea la
estandarización, más se aleja del promedio.

Coeficiente de variación o variabilidad relativa

Una de las funciones primordiales de la Estadística es brindar herramientas que permitan comparar datos
tomando en cuenta los factores que afectan los resultados. Así, el coeficiente de variación permite comparar la
variabilidad de un grupo de datos cuando estos tienen magnitudes muy distintas o bien sus unidades de medidas
son diferentes.

𝜎
Para calcularlo se utiliza la fórmula: 𝐶𝑉 = ⋅ 100% y se debe considerar que entre más grande sea el
𝑥̅
coeficiente de variación, significa que los datos varían más entre ellos.

Ejemplo

1. Dos hermanos discuten sobre quién obtuvo una mejor nota en el examen de admisión a una universidad.
Juan realizó el examen en el 2014 y obtuvo una calificación de 660, mientras que Miguel obtuvo 645 en el
2017, ambos en una escala de 800 puntos. Juan indica que no hay nada que discutir pues su calificación es
más alta. Pero Miguel le indica que, aunque eso es cierto, en el 2014 la calificación promedio fue de 630
con una desviación estándar de 30 puntos, mientras que en el 2017 la calificación promedio fue de 610 con
una desviación estándar de 25 puntos. Por ello Miguel dice que fue él quien, en términos relativos, obtuvo
una mejor nota.
Con base en esta información, ¿quién cree que tiene la razón? ¿Por qué?

13
2. Utilice el coeficiente de variación para medir, ¿cuál de los siguientes grupos de datos varia más entre sí?

Ejercicios

1. En el campeonato de natación se van a recibir 5 estudiantes de cuatro escuelas diferentes, para distribuirlos
equitativamente en las diferentes competencias se han tomado sus estaturas:

a. ¿Cuál es el promedio de la estatura de cada escuela de natación?


b. ¿Cuál es la desviación estándar obtenida en cada escuela?
c. ¿Cuál es el coeficiente de variación de cada escuela?

2. A continuación, se presentan los datos de ligas diferentes de fútbol, respecto a goles anotados por partido

Utilice estandarización para comparar a un portero de la liga A, que tiene un promedio de 2, 2 goles por
partido, con otro de la liga B, que tiene un promedio de 2, 5 goles por partido.

3. Mariana juega Básquet y Viviana béisbol. En la tabla se muestran los porcentajes de aciertos que tuvieron
en la semana (Mariana en tiros libres, mientras que Viviana en bateo).

a. ¿Cuál de las dos es más constante en su deporte?


b. ¿Cuál de las dos tuvo mejor día el viernes?

14

También podría gustarte