Está en la página 1de 10

UNIDAD 4: MEDIDAS DE

RESUMEN
Cuando nosotros agrupamos los datos en una tabla de frecuencias simples, en intervalos de clase,
o bien, dejamos datos sin agrupar y ordenados, buscamos resumir esta información en medidas de
fácil interpretación que nos permitan conocer los aspectos más relevantes de toda la distribución
de datos, y existen distintas medidas que nos permiten cumplir con este RESUMEN que es la etapa
que vamos viendo del proceso estadístico, y pasar también a la etapa que denominamos ANÁLISIS.

Medidas de tendencia central – Medidas de posición- Medidas de Dispersión y Medidas de Forma.

Cuando hablamos de medidas de tendencia central buscamos responder a preguntas como: ¿cuál
es el valor central? O ¿Qué valor/valores representan mejor a la totalidad de los datos?

Para esto, existen 3 medidas de las que sacamos conclusiones respondiendo a esas preguntas.

MEDIA ARITMÉTICA
Estamos hablando de un promedio simple de todas las observaciones, en donde, sumamos todas
ellas y la dividimos entre el número total de observaciones que haya (n).

La media puede servir para representar un conjunto de datos. Por ejemplo, si habiendo realizado
lo expresado anteriormente, se obtiene que en un grupo las personas (por ejemplo, estudiantes
de la clase de estadística) tienen una estatura cuya media es 1.60 m, entonces el 1.60 m
representaría la estatura de todos, aunque puede no ser la estatura de ninguno de forma exacta y
particular.

Si la media de temperatura de un mes fue 35°, sabremos que fue un mes caluroso, aún sin conocer
las temperaturas diarias.

Lo importante es interpretar de forma correcta el resultado obtenido, teniendo en cuenta la


variable con la que trabajemos. Diríamos, entonces, que, EN PROMEDIO, LA TEMPERATURA
REGISTRADA EN GRADOS CELCIUS A LO LARGO DEL MES DE FEBRERO DE 2023, FUE DE 35
GRADOS.

O, EN PROMEDIO, LA ESTATURA DE LOS ESTUDIANTES EN LA CÁTEDRA DE ESTADÍSTICA 2023, ES


DE 1,60 METROS.

Siempre hay que tener cierto cuidado para calcular la media aritmética y que esta resulte
representativa, porque:

- Es afectada por valores extremos. Quiere decir que, siguiendo con un ejemplo sencillo
como las temperaturas de febrero, si las mismas vienen dadas de la siguiente manera:
32° 34° 35° 35° 35° 36° 37° media aritmética = 34,85°
Pero, si hubiera un día que hizo 3°. La media se modifica y puede no llegar a representar
tanto a ciertos elementos observados.
MEDIANA
Se puede definir como el lugar del valor central de una sucesión. La divide en un número igual de
valores anteriores y sucesores.

Realmente no importa si los datos se ordenan de forma ascendente o descendente, la mediana


corresponderá al mismo valor.

Si el número de datos es impar, la mediana corresponderá a un único valor. Si es par,


corresponderá al promedio entre los dos valores centrales.

Para calcular la mediana, hay que identificar a qué posición de los datos ordenados le corresponde
el valor de la mediana: (número de datos + 1) / 2.

 Si el número de datos es impar, la división dará un resultado entero, que será la posición
donde está el dato que corresponde a la mediana. Si hay 9 datos, el dato que corresponde
a la mediana está en la posición (9 + 1) / 2 = 5
 Si el número de datos es par, la mediana será el promedio de las dos posiciones
correspondientes: si hay 10 datos, el cálculo da (10 + 1 ) / 2 = 5.5, que está a medio
camino entre 5 y 6. Esas son las posiciones de los datos que es necesario promediar para
obtener la mediana.

La mediana deja el 50% de las observaciones por encima de ese valor, y el restante 50% por
debajo. Divide la distribución en 2 partes.

¿Cómo la interpretamos? Pongamos de ejemplo la temperaturas registradas a lo largo del mes de


febrero de 2023 en grados celcius. Si realizamos el procedimiento indicado para identificar la
posición y determinamos que el valor de la mediana es igual a 32°, decimos que

UN 50% DE LAS TEMPERATURAS EN GRADOS CELCIUS REGISTRADAS A LO LARGO DEL MES DE


FEBRERO DE 2023 , TIENEN UN VALOR DE A LO SUMO 32° EN DICHO MES, MIENTRAS QUE EL 50%
DE TEMPERATURAS REGISTRADAS RESTANTES SON, EN IGUAL PERÍODO, SUPERIORES A 32°.

Tener en cuenta que primero calculamos la POSICIÓN del valor que estamos buscando. POSICIÓN
≠ VALOR de la mediana.

A veces, la mediana puede llegar a ser más representativa que la media aritmética si la distribución
tiene valores extremos.

MODA
La moda es el valor de la variable que más veces se repite en la muestra.

Para localizar la moda se busca la frecuencia (absoluta o relativa) máxima, el valor de la variable
correspondiente a dicha frecuencia es la moda.

Si los valores de la variable se agrupan en intervalos, el intervalo modal es aquel al que le


corresponde la frecuencia máxima, pero veremos más adelante que, se puede, a través de una
fórmula, obtener un valor más exacto.
De esta manera, si hiciéramos un conteo de las temperaturas registradas en el mes de febrero de
2023 y llegamos a la conclusión de que la temperatura más repetida fue de 32°, por ejemplo:

LA TEMPERATURA EN GRADOS CELCIUS REGISTRADA A LO LARGO DEL MES DE FEBRERO DE 2023


QUE MÁS SE REPITIÓ, FUE DE 32°.

Además de las medidas de tendencia central, hay otras medidas de posición que dividen el
conjunto de datos en partes iguales, y los principales son los cuartiles.

Los cuartiles son los tres valores que dividen a un conjunto de datos ordenados en cuatro partes
iguales. Por lo tanto, el primer, segundo y tercer cuartil representan respectivamente el 25%, 50%
y 75% del conjunto de datos estadísticos. Si se fijan, el segundo cuartil, al representar el 50% de los
datos, es igual a hablar de la mediana. Por eso nos vamos a enfocar en analizar el primer y tercer
cuartil.

En analogía con la mediana, es importante aprender a interpretar los resultados de los cuartiles:

EL PRIMER CUARTIL DEJA EL 25% DE LOS DATOS DE LA VARIABLE ANALIZADA POR DEBAJO DE SU
VALOR, Y EL 75% RESTANTE POR ENCIMA DE ÉL.

MIENTRAS QUE EL TERCER CUARTIL DEJA EL 75% DE LOS DATOS DE LA VARIABLE ANALIZADA POR
DEBAJO DE SU VALOR, Y EL 25% RESTANTE POR ENCIMA DE ÉL.

Debe completarse este análisis con la variable bien especificada y detallada.

Para calcularlos, hay que buscar nuevamente la posición del valor que representa a cada cuartil.

PRIMER CUARTIL

Entonces, por ejemplo, siendo n = 10

X 10/4 + ½ = X3
El valor del primer cuartil estará en la posición 3.

TERCER CUARTIL
Siguiendo el ejemplo, siendo n = 10

X (3 . 10) /4 + ½ = X 8
El valor del tercer cuartil estará en la posición 8.

Después con un ejemplo práctico vamos a ver que cuando tratamos con estadística 2 y estadística
3, las tablas de frecuencias nos van a facilitar porque vamos a buscar en nuestra frecuencia
acumulada porcentual el 25% o el 75% de los datos, dependiendo el cuartil, y vamos a encontrar el
valor de forma rápida.

Otras medidas de posición que podemos analizar y pueden ser útiles son deciles y centiles.

Los deciles son nueve valores que dividen a un conjunto de datos ordenados en diez partes
iguales. De modo que el primer, segundo, tercer,… decil representa el 10%, 20%, 30%,… de la
muestra o población.

Pregunta: ¿Qué decil es igual a la mediana?

La posición la calculamos de igual forma, siempre adaptándolo, es decir, dividiríamos n/10.

Los percentiles son los valores que dividen a un conjunto de datos ordenados en cien partes
iguales. Es decir: representa el 1%, 2%, 3%, 4%, 5%............. 98% 99% 100% de los datos.

Pregunta: ¿Qué centil tendría el mismo valor que el primer cuartil? ¿Y que el tercero?

EJEMPLO DE APLICACIÓN: ESTADÍSTICA 2

N° de hijos 0 1 2 3 4
Familias 6 10 12 18 4 50
Se encuestaron a 50 familias del barrio 8 de Abril de Santiago del Estero sobre el número de hijos
que tienen y se obtuvieron los siguientes resultados:

¿Ante qué tipo de variable estamos?

Agrupamos en frecuencias simples y procedemos al cálculo de las medidas:


Xi Fi Fi Hi Hi f% F%
0 6 6 0,12 0,12 12% 12%
1 10 16 0,2 0,32 20% 32%
2 12 28 0,24 0,56 24% 56%
3 18 46 0,36 0,92 36% 92%
4 4 50 0,08 1 8% 100%
50 1 100%

MEDIA ARITMÉTICA (x̄) = Sumatoria de valores multiplicados por su frecuencia / n

104/50 = 2,08 y decimos que:

EN PROMEDIO, UNA FAMILIA DEL BARRIO 8 DE ABRIL DE SANTIAGO DEL ESTERO, TIENE 2,08
HIJOS.

MEDIANA (Me) = Primero, buscamos la posición:

(50 + 1) / 2 = 25,5

Quiere decir que el valor de la mediana se encuentra a mitad de camino entre la posición 25 y la
posición 26, y hay que promediar las mismas.

Posición 25 = 2

Posición 26 = 2

(2 + 2) / 2 = 2

Me = 2 Decimos entonces que:

UN 50% DE LAS FAMILIAS DEL BARRIO 8 DE ABRIL EN SANTIAGO DEL ESTERO TIENEN, A LO SUMO,
2 HIJOS, MIENTRAS QUE EL 50% RESTANTE TIENEN UNA CANTIDAD SUPERIOR A 2 HIJOS.

MODA (Mo) = Nos preguntamos: ¿qué cantidad de hijos es la que más se repite entre las familias?

Mo = 3 Decimos entonces que:

LA MAYORÍA DE LAS FAMILIAS DEL BARRIO 8 DE ABRIL DE SANTIAGO DEL ESTERO TIENEN 3 HIJOS.

PRIMER CUARTIL (Q1) = Recordemos que, como la mediana, primero buscamos posicionarlo:

X (50/4) + ½ = X 13

En la posición 13, buscamos el valor de nuestro primer cuartil


Q1 = 1

Es importante fijarnos en la columna de frecuencias absolutas acumuladas, porque vemos que el


valor 0 (hijos) ocupa las posiciones 1, 2, 3, 4, 5 y 6. El valor 1 (hijo) ocupa las posiciones 7, 8, 9, 10,
11, 12, 13, 14, 15, 16… y así sucesivamente, por eso, nuestro primer cuartil tiene un valor de 1,
porque está en la posición 13, que se corresponde con un hijo.

TERCER CUARTIL (Q3) = Posicionamos:

X [(50.3)/4] + ½ = X 38
En la posición 38, buscamos el valor de nuestro tercer cuartil

Q3 = 3

¿Cómo interpretarían los 2 cuartiles que calculamos?

EJEMPLO DE APLICACIÓN: ESTADISTICA 3

De una muestra de 100 bombillas eléctricas fabricadas en CABA, se han obtenido estos datos
sobre su duración, en horas, y se han construido intervalos para sintetizarlo.

(No nos enfocaremos en cómo fueron armados los intervalos porque ese procedimiento se vio en
la unidad 2)

Construimos nuestra tabla de frecuencias:


Xi fi Fi hi Hi f% F% Xi*
[30, 35) 6 6 0,06 0,06 6% 6% 32,5
[35, 40) 11 17 0,11 0,17 11% 17% 37,5
[40, 45) 26 43 0,26 0,43 26% 43% 42,5
[45, 50) 33 76 0,33 0,76 33% 76% 47,5
[50, 55) 19 95 0,19 0,95 19% 95% 52,5
[55, 60] 5 100 0,05 1 5% 100% 57,5
100 1 100%

MEDIA ARITMÉTICA (x̄) = Sumatoria de marcas de clase multiplicadas por su frecuencia simple / n

4565/100 = 45,65 y decimos que:

EN PROMEDIO, LA DURACIÓN DE LAS BOMBILLAS ELÉCTRICAS DE UNA FÁBRICA DE CIUDAD


AUTÓNOMA, ES DE 45,65 HORAS.

MEDIANA (Me) = Cuando trabajamos con intervalos de clase ya no identificamos la posición con
un cálculo separado, simplemente, utilizamos una fórmula que nos arroja su valor.

Lo que debemos hacer es fijarnos en la tabla, nuestra F% acumulada, en qué intervalo se llega a
acumular el 50% de los datos. Si lo vemos, está en el intervalo de [45, 50) horas, y ese es el límite
inferior que la fórmula nos indica que debemos tomar.

Faa = Frecuencia absoluta acumulada del intervalo anterior

a = amplitud de los intervalos = 5

Usando la fórmula obtenemos que:

Me = 46,06 y podemos decir que:

UN 50% DE LAS BOMBILLAS ELÉCTRICAS DE UNA FÁBRICA DE CIUDAD AUTÓNOMA DURAN COMO
MÁXIMO/ A LO SUMO 46,06 HORAS, MIENTRAS QUE EL 50% RESTANTE DURA UNA CANTIDAD DE
HORAS SUPERIOR A 46,06.
MODA (Mo) = Cuando los datos son muchos y están agrupados en intervalos de clase, lo que
identificamos de manera rápida es el intervalo modal, pero no el valor exacto de la misma, por
eso, utilizamos una fórmula para su cálculo:

Li= límite inferior del intervalo modal

Δ1 = fi – fi anterior = 33- 26 = 7

Δ2 = fi – fi posterior = 33 – 19 = 14

a = amplitud del intervalo

Utilizando la fórmula obtenemos

Mo = 46,66 por eso decimos que:

LA MAYORÍA DE LAS BOMBILLAS ELÉCTRICAS FABRICADAS EN CIUDAD AUTÓNOMA TIENEN UNA


DURACIÓN DE 46,66 HORAS.

PRIMER CUARTIL (Q1) =

Lo que debemos hacer es fijarnos en la tabla, nuestra F% acumulada, en qué intervalo se llega a
acumular el 25% de los datos. Si lo vemos, está en el intervalo de [40, 45) horas, y ese es el límite
inferior que la fórmula nos indica que debemos tomar.

Q1 = 41,54 horas

TERCER CUARTIL (Q3) =


Lo que debemos hacer es fijarnos en la tabla, nuestra F% acumulada, en qué intervalo se llega a
acumular el 75% de los datos. Si lo vemos, está en el intervalo de [45, 50 ) horas, y ese es el límite
inferior que la fórmula nos indica que debemos tomar.

Q3 = 49,85 horas

¿Cómo interpretarían los resultados obtenidos de los cuartiles?

También podría gustarte