Documentos de Académico
Documentos de Profesional
Documentos de Cultura
RESUMEN
Cuando nosotros agrupamos los datos en una tabla de frecuencias simples, en intervalos de clase,
o bien, dejamos datos sin agrupar y ordenados, buscamos resumir esta información en medidas de
fácil interpretación que nos permitan conocer los aspectos más relevantes de toda la distribución
de datos, y existen distintas medidas que nos permiten cumplir con este RESUMEN que es la etapa
que vamos viendo del proceso estadístico, y pasar también a la etapa que denominamos ANÁLISIS.
Cuando hablamos de medidas de tendencia central buscamos responder a preguntas como: ¿cuál
es el valor central? O ¿Qué valor/valores representan mejor a la totalidad de los datos?
Para esto, existen 3 medidas de las que sacamos conclusiones respondiendo a esas preguntas.
MEDIA ARITMÉTICA
Estamos hablando de un promedio simple de todas las observaciones, en donde, sumamos todas
ellas y la dividimos entre el número total de observaciones que haya (n).
La media puede servir para representar un conjunto de datos. Por ejemplo, si habiendo realizado
lo expresado anteriormente, se obtiene que en un grupo las personas (por ejemplo, estudiantes
de la clase de estadística) tienen una estatura cuya media es 1.60 m, entonces el 1.60 m
representaría la estatura de todos, aunque puede no ser la estatura de ninguno de forma exacta y
particular.
Si la media de temperatura de un mes fue 35°, sabremos que fue un mes caluroso, aún sin conocer
las temperaturas diarias.
Siempre hay que tener cierto cuidado para calcular la media aritmética y que esta resulte
representativa, porque:
- Es afectada por valores extremos. Quiere decir que, siguiendo con un ejemplo sencillo
como las temperaturas de febrero, si las mismas vienen dadas de la siguiente manera:
32° 34° 35° 35° 35° 36° 37° media aritmética = 34,85°
Pero, si hubiera un día que hizo 3°. La media se modifica y puede no llegar a representar
tanto a ciertos elementos observados.
MEDIANA
Se puede definir como el lugar del valor central de una sucesión. La divide en un número igual de
valores anteriores y sucesores.
Para calcular la mediana, hay que identificar a qué posición de los datos ordenados le corresponde
el valor de la mediana: (número de datos + 1) / 2.
Si el número de datos es impar, la división dará un resultado entero, que será la posición
donde está el dato que corresponde a la mediana. Si hay 9 datos, el dato que corresponde
a la mediana está en la posición (9 + 1) / 2 = 5
Si el número de datos es par, la mediana será el promedio de las dos posiciones
correspondientes: si hay 10 datos, el cálculo da (10 + 1 ) / 2 = 5.5, que está a medio
camino entre 5 y 6. Esas son las posiciones de los datos que es necesario promediar para
obtener la mediana.
La mediana deja el 50% de las observaciones por encima de ese valor, y el restante 50% por
debajo. Divide la distribución en 2 partes.
Tener en cuenta que primero calculamos la POSICIÓN del valor que estamos buscando. POSICIÓN
≠ VALOR de la mediana.
A veces, la mediana puede llegar a ser más representativa que la media aritmética si la distribución
tiene valores extremos.
MODA
La moda es el valor de la variable que más veces se repite en la muestra.
Para localizar la moda se busca la frecuencia (absoluta o relativa) máxima, el valor de la variable
correspondiente a dicha frecuencia es la moda.
Además de las medidas de tendencia central, hay otras medidas de posición que dividen el
conjunto de datos en partes iguales, y los principales son los cuartiles.
Los cuartiles son los tres valores que dividen a un conjunto de datos ordenados en cuatro partes
iguales. Por lo tanto, el primer, segundo y tercer cuartil representan respectivamente el 25%, 50%
y 75% del conjunto de datos estadísticos. Si se fijan, el segundo cuartil, al representar el 50% de los
datos, es igual a hablar de la mediana. Por eso nos vamos a enfocar en analizar el primer y tercer
cuartil.
En analogía con la mediana, es importante aprender a interpretar los resultados de los cuartiles:
EL PRIMER CUARTIL DEJA EL 25% DE LOS DATOS DE LA VARIABLE ANALIZADA POR DEBAJO DE SU
VALOR, Y EL 75% RESTANTE POR ENCIMA DE ÉL.
MIENTRAS QUE EL TERCER CUARTIL DEJA EL 75% DE LOS DATOS DE LA VARIABLE ANALIZADA POR
DEBAJO DE SU VALOR, Y EL 25% RESTANTE POR ENCIMA DE ÉL.
Para calcularlos, hay que buscar nuevamente la posición del valor que representa a cada cuartil.
PRIMER CUARTIL
X 10/4 + ½ = X3
El valor del primer cuartil estará en la posición 3.
TERCER CUARTIL
Siguiendo el ejemplo, siendo n = 10
X (3 . 10) /4 + ½ = X 8
El valor del tercer cuartil estará en la posición 8.
Después con un ejemplo práctico vamos a ver que cuando tratamos con estadística 2 y estadística
3, las tablas de frecuencias nos van a facilitar porque vamos a buscar en nuestra frecuencia
acumulada porcentual el 25% o el 75% de los datos, dependiendo el cuartil, y vamos a encontrar el
valor de forma rápida.
Otras medidas de posición que podemos analizar y pueden ser útiles son deciles y centiles.
Los deciles son nueve valores que dividen a un conjunto de datos ordenados en diez partes
iguales. De modo que el primer, segundo, tercer,… decil representa el 10%, 20%, 30%,… de la
muestra o población.
Los percentiles son los valores que dividen a un conjunto de datos ordenados en cien partes
iguales. Es decir: representa el 1%, 2%, 3%, 4%, 5%............. 98% 99% 100% de los datos.
Pregunta: ¿Qué centil tendría el mismo valor que el primer cuartil? ¿Y que el tercero?
N° de hijos 0 1 2 3 4
Familias 6 10 12 18 4 50
Se encuestaron a 50 familias del barrio 8 de Abril de Santiago del Estero sobre el número de hijos
que tienen y se obtuvieron los siguientes resultados:
EN PROMEDIO, UNA FAMILIA DEL BARRIO 8 DE ABRIL DE SANTIAGO DEL ESTERO, TIENE 2,08
HIJOS.
(50 + 1) / 2 = 25,5
Quiere decir que el valor de la mediana se encuentra a mitad de camino entre la posición 25 y la
posición 26, y hay que promediar las mismas.
Posición 25 = 2
Posición 26 = 2
(2 + 2) / 2 = 2
UN 50% DE LAS FAMILIAS DEL BARRIO 8 DE ABRIL EN SANTIAGO DEL ESTERO TIENEN, A LO SUMO,
2 HIJOS, MIENTRAS QUE EL 50% RESTANTE TIENEN UNA CANTIDAD SUPERIOR A 2 HIJOS.
MODA (Mo) = Nos preguntamos: ¿qué cantidad de hijos es la que más se repite entre las familias?
LA MAYORÍA DE LAS FAMILIAS DEL BARRIO 8 DE ABRIL DE SANTIAGO DEL ESTERO TIENEN 3 HIJOS.
PRIMER CUARTIL (Q1) = Recordemos que, como la mediana, primero buscamos posicionarlo:
X (50/4) + ½ = X 13
X [(50.3)/4] + ½ = X 38
En la posición 38, buscamos el valor de nuestro tercer cuartil
Q3 = 3
De una muestra de 100 bombillas eléctricas fabricadas en CABA, se han obtenido estos datos
sobre su duración, en horas, y se han construido intervalos para sintetizarlo.
(No nos enfocaremos en cómo fueron armados los intervalos porque ese procedimiento se vio en
la unidad 2)
MEDIA ARITMÉTICA (x̄) = Sumatoria de marcas de clase multiplicadas por su frecuencia simple / n
MEDIANA (Me) = Cuando trabajamos con intervalos de clase ya no identificamos la posición con
un cálculo separado, simplemente, utilizamos una fórmula que nos arroja su valor.
Lo que debemos hacer es fijarnos en la tabla, nuestra F% acumulada, en qué intervalo se llega a
acumular el 50% de los datos. Si lo vemos, está en el intervalo de [45, 50) horas, y ese es el límite
inferior que la fórmula nos indica que debemos tomar.
UN 50% DE LAS BOMBILLAS ELÉCTRICAS DE UNA FÁBRICA DE CIUDAD AUTÓNOMA DURAN COMO
MÁXIMO/ A LO SUMO 46,06 HORAS, MIENTRAS QUE EL 50% RESTANTE DURA UNA CANTIDAD DE
HORAS SUPERIOR A 46,06.
MODA (Mo) = Cuando los datos son muchos y están agrupados en intervalos de clase, lo que
identificamos de manera rápida es el intervalo modal, pero no el valor exacto de la misma, por
eso, utilizamos una fórmula para su cálculo:
Δ1 = fi – fi anterior = 33- 26 = 7
Δ2 = fi – fi posterior = 33 – 19 = 14
Lo que debemos hacer es fijarnos en la tabla, nuestra F% acumulada, en qué intervalo se llega a
acumular el 25% de los datos. Si lo vemos, está en el intervalo de [40, 45) horas, y ese es el límite
inferior que la fórmula nos indica que debemos tomar.
Q1 = 41,54 horas
Q3 = 49,85 horas