Está en la página 1de 14

SEMANA 5– ESTADÍSTICA SOCIAL

ESTADÍSTICA SOCIAL

SEMANA 5

Procesamiento de información y
medidas de tendencia central II

IACC-2020
1
SEMANA 5– ESTADÍSTICA SOCIAL

APRENDIZAJES ESPERADOS
El estudiante será capaz de:

• Calcular medidas de tendencia central


para el procesamiento de información.

IACC-2020
2
SEMANA 5– ESTADÍSTICA SOCIAL

APRENDIZAJES ESPERADOS ............................................................... ¡Error! Marcador no definido.


INTRODUCCIÓN ............................................................................................................................. 3
1 MEDIDAS D ETENDENCIA CENTRAL, CARACTERÍSTICAS Y APLICACIONES……………………………………..5

1.1 MEDIA ................................................................................................................................ 5


1.2 MEDIANA ........................................................................................................................... 8
1.3 MODA .............................................................................................................................. 10
2. APLICACIONES ...................................................................................................................... 11
COMENTARIO FINAL .................................................................................................................... 12
REFERENCIAS ............................................................................................................................... 13

INTRODUCCIÓN

IACC-2020
3
SEMANA 5– ESTADÍSTICA SOCIAL

En el contenido pasado se revisó cómo se juntarse, ya que así como los datos se
podía procesar y resumir información centralizan o juntan, también existen
cuantitativa a través de la creación de tablas medidas para establecer cómo los datos se
de distribución de frecuencia. dispersan, tales como las medidas de
dispersión o variación (varianza y desviación
En cambio, en este contenido de estudio, estándar).
se ingresará de lleno al tema estadístico a
través de la revisión de las medidas de Ahora bien, ambas formas de medir los
tendencia central, que son parte básica de datos (centralidad y dispersión) se
lo que se conoce dentro de la estadística complementan al momento de analizar
descriptiva. En este sentido, este tipo de diversa información estadística y no son, en
estadística se caracteriza por el uso de ningún caso, antagonistas. En la figura N.º
tablas, gráficas y todas aquellas 1, los puntos de color púrpura se
herramientas que permitan presentar de encuentran más dispersos que los puntos
manera resumida y clara específica sobre verdes, los cuales tienden a estar más
un grupo o fenómeno. concentrados.

Las medidas de tendencia central están En lo que respecta a las medidas de


constituidas por la media, la mediana y la variación o dispersión, se verá en el
moda, y nos indican cómo los datos tienden próximo contenido. Por lo anterior, es
a centralizarse o juntarse. importante que se tenga claridad y se
internalice el concepto de centralidad,
Es importante tener claridad del concepto sobre todo, en lo referente a la media
de centralidad de los datos, o dicho de otra aritmética, o también conocida como
manera, de cómo los datos tienden a promedio.

Figura N.º 1.

Fuente: material elaborado para esta asignatura.

1. MEDIDAS DE TENDENCIA CENTRAL, CARACTERÍSTICAS Y APLICACIONES


Triola, Pineda y Hernández plantean que un aspecto clave “cuando describimos, exploramos y comparamos

IACC-2020
4
conjuntos de datos, las siguientes características suelen ser sumamente importantes: centro, variación,
distribución, valores extremos y cambios a través del tiempo” (2009, p.76).

En este contexto, cuando Triola et al. hablan del centro, se refieren a las medidas de tendencia central y las
definen de la siguiente manera: “una medida de tendencia central es un valor que se encuentra en el centro o a
la mitad de un conjunto de datos” (2009, p.77).

En palabras simples, las medidas de tendencia central son utilizadas para verificar si los datos son
representativos en una muestra; por ejemplo, si los datos obtenidos por un estudio son similares o se encuentran
agrupados sin tener una gran diferencia, la media es representativa a la muestra; por el contrario, si los datos
son dispersos la muestra es poco representativa.

Ejemplo:

En dos cursos de 5 alumnos cada uno se obtienen las siguientes notas.

Curso 1: 6,0 – 6,2 – 6,1 – 6,0 – 5,9.

Curso 2: 2,0 – 7,0 – 6,9 – 2,2 – 6,8.

Como se puede apreciar en el ejemplo, en el curso 1, los datos se encuentran agrupados y tienden a juntarse o
ser muy similares. En el caso del curso 2, los datos están más bien dispersos y no son representativos del nivel
del curso

1.1 MEDIA
Una de las medidas de tendencia central más conocida es la media aritmética, también llamada promedio.

La media aritmética de un conjunto de valores es la medida de tendencia central que se calcula al


sumar los valores y dividir el total entre el número de valores. Esta medida de tendencia central se
utilizará con frecuencia a lo largo del libro y nos referiremos a ella simplemente como la media. (Triola
et al., 2009, p.77)

La definición planteada por estos autores se expresa a través de la fórmula de la figura N.º 2, en la cual, la
letra griega  (sigma mayúscula) significa que todos los valores que se tengan se deben sumar. A su vez,
la letra n significa el “tamaño de la muestra, que es el número de valores en el conjunto de datos” (2009, p.77).

IACC-2020
5
Figura N.º 2

Fuente: material elaborado para esta asignatura.

Para poder dimensionar lo anterior, se utilizará como ejemplo las notas obtenidas por 14 estudiantes en una
prueba. Como se puede apreciar en la figura N.º 3, las 14 notas se encuentran en la parte superior de la
fracción (numerador) y se deben sumar. A su vez, en la parte inferior de la fracción (denominador) se
establece la cantidad de notas, que son 14 en total.

Figura N.º 3

Fuente: material elaborado para esta asignatura.

El cálculo de la media o promedio exige realizar una división, por lo que solo se puede aplicar o realizar a
variables de intervalo o razón (ver contenidos Semana 3: Tipos de datos y Niveles de medición).

A su vez, el resultado siempre se debe expresar o decir en la unidad de medida de la variable que se está
calculando. En el ejemplo anterior, el resultado debe expresar que el promedio de notas de los 14
estudiantes es de 6,25 puntos en escala de notas.

La media aritmética o promedio, posee dos propiedades importantes que afectan su resultado y también
afectan otros resultados que dependen de su valor, como por ejemplo, la desviación estándar, que se verá
en el próximo contenido. El cálculo de la desviación estándar toma como base de cálculo o punto de
referencia, la media aritmética o promedio, por lo que, si esta se ve afectada o se modifica, también se
modifica el valor de la desviación estándar.

En relación a las dos propiedades del promedio, se plantea que:

• Que es sensible a valores extremos.

IACC-2020
6
• Esta sensibilidad es mayor o se denota aún más cuando la cantidad de valores es pequeña.

Se explicará lo anterior a través de un ejemplo. Se toma como referencia las 14 notas de la figura N.º 4.
Como se puede ver, el promedio de notas es de 6,25. Y se reemplazarán las dos notas que se encuentran
destacadas en un círculo rojo.

Figura N.º 4

Fuente: material elaborado para esta asignatura.

Si las notas que se encuentran destacadas con un círculo rojo se reemplazan con dos notas 1, como se
puede apreciar en la figura N.º 5, automáticamente el promedio de notas baja a 5,62.
Con este ejemplo, se demuestra que la media es sensible a valores extremos. Al hablar de valores extremos,
se hace referencia a valores alejados o distintos del resto de los valores.

Figura N.º 5

Fuente: material elaborado para esta asignatura.

En el caso planteado anteriormente se trataba de 14 valores. Ahora, se verá qué pasa con la sensibilidad de la
media cuando la cantidad de valores es mayor. De 14 valores del ejemplo anterior, se aumentará a 28 el
número de valores (tamaño de la muestra). En la figura N.º 6, el promedio es de 6,25 puntos en escala de
nota y se reemplazarán los dos valores con nota 4, que se encuentran destacados en un círculo rojo.

Figura N.º 6

IACC-2020
7
Fuente: material elaborado para esta asignatura.

Los dos valores o notas 4 que se encuentran destacadas en el círculo rojo, serán reemplazadas por dos notas
1, como se puede apreciar en la figura N.º 7. El promedio de 6,25 baja a 6,04. Si bien, las notas 1 son valores
extremos (se alejan del resto de los valores), debido a la gran cantidad de valores (tamaño de la muestra) el
promedio no se ve afectado. Es decir, se comprueba que la sensibilidad de la media es mayor a valores
extremos cuando la cantidad de valores es menor. Mientras aumenta la cantidad de valores, la sensibilidad va
disminuyendo.

Figura N.º 7

Fuente: material elaborado para esta asignatura.

Si se utiliza un ejemplo más coloquial, un estudiante que tiene tres notas 7 tendrá un promedio 7,0 (figura
N.º 8). Sin embargo, al reemplazar uno de los 7 por una nota 1, automáticamente el promedio baja a 5,0 (figura
N.º 9).

Figura N.º 8 Figura N.º 9

Fuente: material elaborado para esta asignatura. Fuente: material elaborado para esta asignatura.

1.2 MEDIANA

IACC-2020
8
Frente a la sensibilidad de la media ante a valores extremos, surge la mediana para compensar dicho efecto.
La mediana, como valor, sigue siendo un valor intermedio o central, ya que la mitad de los valores se
encuentra por arriba de su valor y la otra mitad se encuentra por debajo.

La mediana de un conjunto de datos es la medida de tendencia central que implica el valor intermedio,
cuando los valores de los datos originales se presentan en orden de magnitud creciente (o decreciente).
La mediana suele de denotarse con |x (y se lee “x con tilde”) (Triola, Pikneda y Hernández, 2009, p.78).

Para poder calcular la mediana, Triola, Pineda y Hernández. plantean que “primero se ordenan los valores
(se acomodan en orden) y luego se sigue uno de los siguientes dos procedimientos” (2009, p.78):

• Si el número de valores es impar, la mediana es el número que se localiza exactamente a la mitad de


la lista.
• Si el número de valores es par, la mediana se obtiene calculando la media de los dos
números que están a la mitad.

A continuación, se verá, a través de un ejemplo, el paso a paso de cómo se aplican los dos
procedimientos planteados por Triola, Pineda y Hernándezl. (2009):

1) Ordenar los valores de menor a mayor. En la figura Nº 10, los valores se encuentran ordenados
de menor a mayor. Los números en rojo arriba de los valores indican la posición y el número
de valores.
Figura N.º 10

Fuente: material elaborado para esta asignatura.

2) En este caso, el número de valores de la figura N.º 11 es par. Por lo tanto, la mediana será el
valor que se encuentre entre el 6,2 y el 6,3. En este caso 6,25, y se obtiene calculando la media
entre 6,2 y 6,3.

Figura N.º 11

IACC-2020
9
Fuente: material elaborado para esta asignatura.

3) Si el número de valores es impar, como es el caso de la figura N.º 12, la mediana será el valor
que se ubica exactamente al medio de la lista de valores, tal como se destaca en el círculo rojo

Figura N.º 12

Fuente: material elaborado para esta asignatura.

1.3 MODA
La moda es, simplemente, el valor que más se repite. Triola, Pi n ed a y He r ná n de z . plantean
que “la moda de un conjunto de datos es el valor que se presenta con mayor frecuencia” (2009,
p.80).

Se pueden dar dos situaciones:

• Si en un conjunto de datos se presentan dos valores con la misma frecuencia y ambos


son los más altos, entonces se puede decir que se está frente a una distribución de datos
bimodal.
• Por el contrario, si son más de dos los valores que tienen la misma frecuencia y son los
más altos, entonces se habla de una distribución de datos multimodal.
• Si ningún valor se repite, se plantea que no existe moda.
En el conjunto de datos de la figura N.º 13, se puede observar que el valor o nota 6,8 se repite
cuatro veces, mientras que las notas 5,8-6,0-6,2 y 7,0 se repiten dos veces. En este ejemplo
la moda sería 6,8, ya que de todos los valores es el que más veces se repite.

Figura N.º 13

IACC-2020
10
SEMANA 5 – ESTADÌSTICA SOCIAL

Fuente: material elaborado para esta asignatura.

2. APLICACIONES
Una característica importante de las medidas de tendencia central, es que se pueden aplicar a
cierto tipo de datos y niveles de medición (ver anexo 1 como recordatorio de los distintos tipos
de medición).
Figura N.º 14

Fuente: material elaborado para esta asignatura.

Como se puede apreciar en la figura N.º 14, el cálculo de las medidas de tendencia central solo se
puede aplicar dependiendo del tipo de dato y de su respectivo nivel de medición. Por ejemplo, la
moda es la única medida de tendencia central que se puede aplicar a datos nominales
(cualitativos), como por ejemplo colores de casa; se pueden contar cuántas casas de color rojo,
amarillo o blanco existen y determinar cuál es el color de casa que más se repite, es decir, la moda.

Por otro lado, a los niveles de medición de intervalo o razón, por tratarse de datos cuantitativos,
independiente de si son discretos o continuos, se les puede aplicar todas las medidas de tendencia
central; se pueden ordenar de mayor a menor las notas de los estudiantes de una asignatura y
determinar cuál es el promedio de notas, cuál sería la nota que corta o distribuye los valores por
la mitad o determinar cuál es la moda o nota que más se repite.

El cálculo de las tres medidas de tendencia central también sirve para realizar otros cálculos y
valores, como por ejemplo, determinar si una distribución de datos se encuentra sesgada. El tema
del sesgo se verá en la Semana 7, por lo que es importante tener claridad de los contenidos vistos
en esta semana.

IACC-2020
11
SEMANA 5 – ESTADÌSTICA SOCIAL

COMENTARIO FINAL
Las medidas de tendencia central están conformadas, principalmente, por la media, la mediana y
la moda. Lo que se conoce como promedio está relacionado con el cálculo de la media aritmética.

Los tres valores mencionados sirven para determinar cómo o de qué manera se tiende a juntar o
centralizar un conjunto de datos o valores.

Ahora bien, las medidas de tendencia central, como indicadores de centralidad, se complementan
con otro conjunto de indicadores que señala cómo se dispersa un conjunto de valores, como
son la varianza y la desviación estándar, temas que se verán en el próximo contenido.

En este contexto, la media aritmética o promedio sirve de base y punto de referencia para
el cálculo de la desviación estándar, por lo que la sensibilidad que tiene la media como
propiedad también afecta el cálculo, en este caso, de la desviación estándar.

IACC-2020
12
SEMANA 5 – ESTADÌSTICA SOCIAL

REFERENCIAS
Triola, M., Pineda, L. y Hernández, R. (2009). Estadística. 10.ª edición. México: Pearson Educación.

PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE:

IACC (2020). Procesamiento de información y medidas de tendencia central II

Estadística Social. Semana 5.

IACC-2020
13
SEMANA 5 – ESTADÌSTICA SOCIAL

IACC-2020
14

También podría gustarte