Está en la página 1de 11

Estadística Básica para Economía y Administración.

Clase 3

Clase Nº3. Estadística Descriptiva

Análisis univariado. Medidas de tendencia central,


posición y dispersión.

Introducción
Hola a todos y todas,
En la clase de esta semana vamos a avanzar con análisis univariado incorporando
medidas resumen además de las tablas de frecuencias y gráficos trabajadas la clase
anterior que nos permitían ver la distribución con mayor detalle.
Es importante que tengamos en cuenta que no todas ellas vamos a poder usarlas
para todo tipo de variables, sino que tendremos que tener en cuenta su nivel de
medición.

Objetivos de la clase
Al finalizar esta clase, esperamos que logren:
- Identificar las medidas de tendencia central, de posición y dispersión.
- Definir sus características principales y limitaciones en el uso.
- Calcular cada una de ellas.
- Interpretar los resultados obtenidos conjuntamente
- Reconocer las diferentes formas de una distribución, clasificando los diferentes
tipos de simetría.
- Utilizar adecuadamente el coeficiente de variación para comparar variabilidad.

Desarrollo de la Clase
Como ya vimos en la clase 2, cualquier variable puede ser presentada en tablas de
frecuencia y ser representada gráficamente, siempre teniendo en cuenta el tipo de
gráfico apropiado para cada nivel de medición de variables –u teniendo en cuenta
también otras características como la cantidad de categorías de la variable-. Para
variables cualitativas (Nominales u Ordinales) son habituales los gráficos de barras
de sectores o tortas entre otros, mientras que para variables cuantitativas suelen
utilizarse diagrama de bastones o de puntos, gráficos escalonados, histograma,
polígonos de frecuencias y ojiva.
En cuanto a las tablas de distribuciones de frecuencias (absolutas, relativas y
aculadas para las ordinales y numéricas), recordemos también que los datos pueden
construirse con distintos niveles de desagregación en función del análisis y claridad
en la presentación. En el caso de las cuantitativas, al agrupar los valores se habla de
intervalos de clase.
Las tablas de frecuencias y los gráficos nos permiten presentar y analizar la
información de manera más detallada y analítica, incluso cuando reagrupamos

Prof. Emilio Cabello / Marcela Grinszpun


-1-
Estadística Básica para Economía y Administración. Clase 3

categorías, perdemos algo de detalle, pero seguimos teniendo información con cierto
nivel de desagregación. Además de estas formas contamos también con
herramientas, medidas sintéticas que resumen en un solo valor características de la
distribución de la variable analizada. Estas medidas tienen un alto poder de síntesis,
pero una gran pérdida de detalle, por lo cual suelen interpretarse conjuntamente
para poder tener una idea más acabada del comportamiento del fenómeno.

Medidas de Tendencia Central: media, mediana, modo.


Estas medidas resumen nos permiten caracterizar típicamente a la distribución en
estudio. Al ser sólo un valor, son útiles para realizar comparaciones entre variables.
Su resultado siempre refiere a alguna categoría de la variable (o a algún valor dentro
de su rango).
Si bien en la carpeta de trabajo están ubicadas todas bajo el título de medidas de
posición, suelen denominarse también a estas tres medidas, Modo o Moda (Mo),
Media aritmética (𝑥 ) y Mediana (Md) o (Me) como medidas de tendencia central por
el lugar de la distribución donde tienden a ubicarse. Para su aplicación hay que tener
en cuenta el nivel de medición de la variable.

Modo o Moda (Mo): NOM, ORD, NUM


Mediana (Md) o (Me): ORD, NUM
Media o Promedio Aritmético (x): NUM

Modo o Moda (Mo)


Es la categoría o valor que se presenta u ocurre con mayor frecuencia. Se dice que
es el valor más común de la distribución. La moda puede no ser única. Existen
distribuciones unimodales, bimodales o multimodales. Esta medida puede utilizarse
con variables de cualquier nivel de medición.
Entre sus propiedades o características salientes podemos mencionar que puede
aplicarse en todos los niveles de medición y es de fácil comprensión y determinación.
Por otro lado, brinda escasa información sobre el resto del conjunto de los datos, sólo
sobre la categoría más frecuente (nada dice sobre el resto de los valores, cuan cerca
o lejos se encuentra del resto de las frecuencias, etc.)

Ejemplos:

Prof. Emilio Cabello / Marcela Grinszpun


-2-
Estadística Básica para Economía y Administración. Clase 3

La media aritmética (𝒙 )
Se calcula como la suma de todos los valores de una distribución dividida por el
número de casos. Sólo puede utilizarse en variables de nivel de medición cuantitativa.

Entre sus características podemos mencionar que su cálculo incluye a todos los
valores y casos. Requiere necesariamente que sea de nivel de medición numérico.
Es sensible a valores extremos no compensados. Es decir que ante la presencia de
algún valor que se aleja del resto de los casos en un sentido, la media se ve afectada
por el mismo –creciendo o decreciendo según corresponda-. Esto hace que en
muchos casos no resulte útil como medida, por lo cual hay que siempre leerla
conjuntamente con el resto de las medidas de tendencia central (luego de presentar
la mediana volveremos sobre este punto)

Otra propiedad de esta medida es que conociendo el también el número total de


casos (n) permite calcular la suma/total de los valores. Por ejemplo, si tengo la media
de ingresos y el total de personas puedo calcular la masa total de dinero en concepto
de ingresos.
La suma de las distancias de cada valor individual con respecto a la media es igual a
0, por eso se dice que la media es el punto de equilibrio de los valores.
Se puede calcular la media total a partir de las medias de dos subconjuntos. Si los
subconjuntos tienen diferente cantidad de casos, se tiene que ponderar, pesar cada
media por dicha cantidad (multiplicando) y luego dividir por el total de casos. Se la
conoce como media aritmética ponderada.

Si los datos están agrupados en una tabla de frecuencias, se debe multiplicar el valor
por la cantidad de veces que se repite –datos presentados en columna auxiliar “f.x”.

Prof. Emilio Cabello / Marcela Grinszpun


-3-
Estadística Básica para Economía y Administración. Clase 3

Ejemplo:

Si los datos están agrupados en intervalos de clase, se considera el punto medio del
mismo para el cálculo de la media.

Mediana (Md) o (Me)


Es la categoría o valor del caso ocupa la posición central de la distribución,
dividiéndola en dos partes iguales. Es condición que nuestra distribución esté
previamente ordenada con algún criterio, por lo que esta medida no puede utilizarse
en variables de nivel de medición nominal. Dado que para su determinación es
necesario hallar una posición a partir de un conjunto de valores ordenados, está
medida suele considerarse también Medida de Posición además de Medida de
Tendencia Central –por ubicarse en el centro-.

En cuanto a sus propiedades, a diferencia de la media, la mediana no es sensible a


valores extremos. No importa cuál sea el valor de los casos más bajos o más altos,
el valor del caso que se encuentra en el centro no se afecta por ellos, dado que no
modifica la posición. Sí se modifica al cambiar la cantidad de casos.
Requiere necesariamente que los valores/categorías de la variable estén ordenados
y al igual que el modo no brinda información sobre el resto de los valores de la
distribución.

En los textos, se presentan distintas fórmulas –para datos desagrupados o


agrupados, con n par o impar- que permiten ubicar el orden o posición de la mediana,
al encontrar el caso central1, pero es importante no confundir este resultado con el
valor de la Mediana. Una vez encontrada el orden o posición, la mediana será el valor
o categoría que tenga ese caso.

Si se presentan los casos agrupados en tablas de frecuencias es común también hallar


la posición de la mediana a partir de la frecuencia acumulada. Así, se ubica la

1
Si las distribuciones tienen cantidad de casos pares por lo cual no “cae” exactamente en un caso sino
entre dos de ellos, por tanto, toma ambos como “medianas”. Suele formalizarse en dos expresiones: Md(o)
= n/2 y n/2 + 1. Mientras que el n es impar, el orden de la mediana puede encontrarse a partir de la
ecuación (n+1) / 2.

Prof. Emilio Cabello / Marcela Grinszpun


-4-
Estadística Básica para Economía y Administración. Clase 3

categoría en que la Fac de la distribución supera (acumula) la barrera del 50% -mitad
de la distribución-, prescindiendo del número de caso en absolutos.

Ejemplo:

Medidas de Posición Mediana, cuartiles, deciles, percentiles.


Análogamente a la mediana, existen otras medidas de posición que dividen a la
distribución en cierto número de partes iguales.
Las más comunes son los cuartiles que dividen en cuatro partes iguales de 25% cada
una a la distribución, quintiles –dividen en 5 grupos de 20%-, deciles –en 10 partes
de 10%- y percentiles –en 100 de 1% cada una-.

Cabe aclarar que cuando se dice que dividen en partes iguales, nos estamos refiriendo
siempre a la proporción o cantidad de casos, frecuencias, que quedan incluidas en
cada grupo. Es importante diferenciar que no es la misma cantidad de
valores/categorías.
Las medidas de posición no refieren a cada uno de los grupos, sino que definen el
valor del caso que se encuentra delimitando dichos grupos (como lo vimos con la
mediana). En el habla común es habitual utilizar la palabra para referir
indistintamente al grupo conformado como a la medida que lo delimita. Es decir, se
habla que hay diez “deciles” pero el decil como medida de posición son nueve: son
los valores de los casos que delimitan cada una de esas porciones, al igual que la

Prof. Emilio Cabello / Marcela Grinszpun


-5-
Estadística Básica para Economía y Administración. Clase 3

mediana que la medida es una, pero divide en dos mitades. Ene l siguiente esquema
se grafican los grupos y la posición donde se encontraría cada una de las medidas.

Pueden también hallarse a partir de establecer en primer lugar el orden o posición


de la medida que se está intentando determinar o también buscando el porcentaje
correspondiente en la columna de frecuencia acumulada. Una vez identificado el caso
en dicha posición, la medida queda determinada por el valor de dicho caso.

Por ejemplo, al buscar la categoría del caso que se encuentra en la frecuencia


acumulada que incluye el 30%, estaríamos determinando el Decil 3. Dicho valor
delimita el tercer grupo decílico del cuarto. Deja por debajo el 30% y por encima el
70% mayor.
Para determinar el percentil 73. Deberíamos buscar el valor del caso que se dónde
se encuentra incluido el 73% en la frecuencia acumulada, y si buscamos el Quintil 4
deberíamos buscar el valor del caso donde queda acumulado el 80% y así
análogamente.

Nociones sobre asimetría.


La lectura conjunta de las tres medidas de tendencia central, nos permiten tener una
primera aproximación a la comprensión global del comportamiento de la variable a
partir del análisis de la forma.

Si las medidas de tendencia central tienden a coincidir, la forma de la distribución es


simétrica. Esto no quiere decir que no haya casos que por los valores que presentan
se alejen de la media, sino que, de existir, los mismos se encuentran “compensados”.
Es decir, si hay valores atípicos extremos hacia un lado de la distribución, también
los hay hacia el otro. Las medidas para analizar cuán cerca o lejos se encuentran los
valores con respecto a la media, son conocidas como medidas de dispersión o
variabilidad que veremos a continuación.
Por otro lado, cuando aparecen diferencias entre ellas lo que nos indica es que la
distribución es asimétrica o sesgada hacia la derecha o hacia la izquierda. Si bien hay
medidas específicas que miden estos aspectos, simplemente el análisis conjunto de
las medidas de tendencia central, nos advierten sobre la presencia de casos extremos
no compensados. Esto se debe a que como mencionamos la media aritmética es
atraída, influida, afectada por valores extremos, mientras que la mediana no,
indicando así que, si la media se aleja de la mediana, se debe a la presencia de dichos
valores.

Prof. Emilio Cabello / Marcela Grinszpun


-6-
Estadística Básica para Economía y Administración. Clase 3

Medidas de dispersión o de variabilidad.


Antes de avanzar con el cálculo y uso de estas medidas es importante diferenciar el
concepto de variabilidad del de asimetría. Las medidas de dispersión no nos brindan
información sobre la simetría o asimetría, es decir, sobre si hay sesgos, valores
extremos no compensados, sino que nos indican cómo varía nuestro fenómeno.

Prof. Emilio Cabello / Marcela Grinszpun


-7-
Estadística Básica para Economía y Administración. Clase 3

Estas medidas son complementarias a la información brindada por las medidas de


tendencia central y posición para la interpretación del fenómeno bajo estudio. Las
MTC nos brindan información sobre las regularidades y comportamientos típicos de
la distribución, mientras que las de dispersión nos proveen información sobre cómo
varían. Nos indican cuan homogénea o heterogénea es nuestra distribución. Sin ellas
podríamos interpretar incorrectamente el fenómeno.

Por ejemplo, podemos tener dos grupos de estudiantes para los cuales la variable
nota se haya comportado del mismo modo si sólo tenemos en cuenta las medidas de
tendencia central y posición. En ambos casos, Media, Mediana y Moda fue de 7
puntos, conformando distribuciones simétricas e iguales entre sí en tanto esas
medidas. Si sólo nos quedamos con esa información podríamos creer que la
distribución de la variable nota en ambos grupos se comportó de forma idéntica, sin
embargo, al obtener alguna medida de dispersión, nos puede relevar algún otro
aspecto del fenómeno.
Es decir, la nota puede ser un 7 de promedio, pero está claro que puede haber
diversas formas de llegar a ese 7 a partir de las notas individuales. Podrían ser todas
7, y dar 7 de promedio; podrían en general orbitar alrededor del 7 sin alejarse mucho
y dar 7 de promedio, o podrían estar muy “repartidas” alrededor del 7 y también dar
7 de promedio. Es decir, la media es una medida síntesis que homogeniza las
diferencias en su cálculo. Las medidas de dispersión nos permitirán poner en juego
cómo se comportó el fenómeno teniendo en cuenta su variabilidad. Mayores valores
en estas medidas, nos indican mayor variabilidad, heterogeneidad y viceversa.

Las medidas que vamos a trabajar podemos clasificarlas en:


Variabilidad absoluta: Las más comunes son varianza y desvío y nos permiten
conocer la variabilidad de las unidades de análisis alrededor de la media para
variables cuantitativas.
Hay otras como el rango o desvío intercuartílico, que nos brindan una primera noción
de la variabilidad a partir de la variación entre valores individuales.
Variabilidad Relativa: El coeficiente de variación que pone en relación al desvío con
su media.

Prof. Emilio Cabello / Marcela Grinszpun


-8-
Estadística Básica para Economía y Administración. Clase 3

El rango, recorrido, alcance o amplitud total de una distribución es la diferencia


entre su valor máximo y mínimo, mientras que el rango intercuartílico, refiere a
la diferencia entre el valor del cuartil 3 y el 1ro. Así, estas medidas, no toman en
cuenta la totalidad de los valores, sino que son definidas sólo en relación a dos puntos
de la distribución. La varianza y el desvío estándar en cambio se construyen a partir
de las distancias de todos los casos con respecto a la media de la distribución
La varianza es el promedio de las diferencias cuadradas de cada valor de la
distribución respecto de su media aritmética. Se elevan las diferencias al cuadrado,
porque de otro modo nos daría una suma igual a cero, dado que las diferencias
positivas y negativas al promedio se anulan entre sí. Al elevar los desvíos individuales
al cuadrado para evitar la suma cero, la medida resultante de la varianza queda
expresada en unidades cuadradas, por lo cual, se aplica la raíz cuadrada para volverla
a su unidad original y así simplificar la interpretación del resultado. Esta medida es
conocida como desvío estándar y es una de las más utilizadas.
En la página 39 y 40 de la carpeta de trabajo pueden ver las fórmulas de cada una.

Si bien tanto el programa Excel como las calculadoras permiten calcular la varianza
y la desviación estándar,2 es importante que podamos también realizar los cálculos
“manualmente”. Para ello, podemos hacerlos a partir de una tabla de distribución de
frecuencias utilizando columnas auxiliares.
1er paso: La primera columna contiene la diferencia individual de ese valor con
respecto a la media.
2do paso. En una segunda columna auxiliar, se eleva al cuadrado dicho valor.
3er paso: En la última columna auxiliar se multiplica por la frecuencia absoluta.
4to paso: Finalmente se realiza la sumatoria de los valores de esta última columna y
se dividen por la cantidad de casos.3 Aquí se obtiene la varianza.
5º paso: Sólo para obtener el desvío estándar, se aplica la raíz cuadrada al resultado
obtenido en el paso 4.

2
Pueden consultarse estos tutoriales para Excel https://www.youtube.com/watch?v=hEsQTQKVkso y
para calculadora científica https://www.youtube.com/watch?v=qguhqq0xvM0
3
En el caso de ser una distribución correspondiente a una población (Censo) se divide por el total de
casos, si corresponden a una muestra, se divide por la cantidad de casos menos uno.

Prof. Emilio Cabello / Marcela Grinszpun


-9-
Estadística Básica para Economía y Administración. Clase 3

En cuanto a su interpretación, siempre resulta difícil poder determinar si es mucha o


poca la variabilidad, sin ninguna otra referencia que nos permita contextualizarla, por
lo cual es útil trabajar comparativamente. Un mayor desvío o varianza indica más
variabilidad, más heterogeneidad, mientras que un menor desvío marca menor
dispersión, más homogeneidad. Sin embargo, dado que la varianza y el desvío
estándar están construidos haciendo eje en la media aritmética, sólo vamos a poder
comprar estas medidas si las medias de las distribuciones son iguales. Si son
diferentes, entonces no podemos compararlas directamente y tendremos que utilizar
el coeficiente de variación, construido como el cociente entre el desvío estándar y
la media aritmética –multiplicado por 100- y nos servirá para comparar la variabilidad
en distribuciones de medias diferentes.4

Cierre

En la clase de hoy incorporamos medidas resumen en el análisis univariado, tanto


para variables cualitativas como cuantitativas.
Estas medidas de tendencias central y posición nos permiten conocer de forma
sintética características de nuestra distribución y el análisis conjunto de las medidas
de tendencia central para analizar la forma -simetría o asimetría. Finalmente
incorporamos medidas de dispersión.
Recuerden que es importante para su aplicación tener en cuenta el nivel de medición
para el que pueden calcularse, y conocer tanto cómo se determinan o calculan cómo
poder interpretarlas.

4
Se recomienda la lectura de las páginas 92-93 del capítulo 4 del libro de la Universidad de Misiones que
brinda ejemplos muy claros para ilustrar el uso e interpretación del coeficiente de variación.

Prof. Emilio Cabello / Marcela Grinszpun


- 10 -
Estadística Básica para Economía y Administración. Clase 3

La próxima clase cerraremos la Unidad 1 con análisis bivariado en la que utilizaremos


tablas de contingencia y las distintas formas de expresar porcentajes y su uso para
relacionar variables y contrastar hipótesis.

Actividad práctica

Realizar el Ej.3. Pág. 5 y el Ej. 7. Pág. 7 de la Guía de ejercicios.

Bibliografía

Material Obligatorio:
Aguirre, Niño, Simonetti E. Estadística aplicada en las Ciencias Sociales Y Humanas.
Estadística I. Editorial Universitaria de Misiones, 2005. Capítulo 3 y 4.

Bibliografía Complementaria:
Berenson y D.M. Levine. (2001). Estadística para Administración y Economía.
Editorial Prentice Hall. 2º edición. México.2001. Cap.4: “Resumen y descripción de
datos numéricos”

Prof. Emilio Cabello / Marcela Grinszpun


- 11 -

También podría gustarte