Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos previos
Parámetro:
Medida descriptiva de la población total de todas las observaciones de interés
para el investigador.
Estadístico:
Elemento que describe una muestra y sirve como una estimación del
parámetro de la población correspondiente.
Medidas Descriptivas
Previamente a estudiar las medidas de tendencia central, las ubicaremos en el contexto de las
medidas descriptivas más utilizadas en la estadística. Estas medidas sirven para describir los
datos o información de interés en un estudio, permitiendo hacer una especie de retrato de la
información, ya que nos proporcionan aspectos esenciales de la misma, sin tener que ver uno a
uno los datos.
Las medidas de tendencia central son el primero de los tres grupos de medidas descriptivas que
estudiaremos. En el desarrollo de este tema se identificará cuáles son las diferentes medidas de
tendencia central, como se calculan, y la interpretación de las mismas.
El cuadro sinóptico que se presenta a continuación resume la clasificación de las medidas
descriptivas y dentro de éstas las diferentes medidas de tendencia central que estudiaremos.
Media Media Simple
Medidas de Tendencia Central Moda Media Ponderada
Mediana
Cuartiles
Medidas Medidas de Posición Deciles
Descriptivas
Percentiles
Rango
Absoluta Desviación Media
Desviación estándar
Varianza
Medidas de Dispersión
Media aritmética
Es una medida de tendencia central que indica el valor promedio de un conjunto de datos, de
allí que a veces nos referimos a la media como el promedio de los datos y la denotamos con los
siguientes símbolos:
Características
•
La media solo puede utilizarse para datoscuantitativos y es única.
•
Tiene la desventaja que es afectada por valores extremos
Por Ejemplo
En una encuesta a personas con hipertensión arterial , se les ha preguntado el numero de veces que han recibido el
control de su presión arterial en los últimos seis meses. Las respuestas se muestran en los siguientes datos :
3 5 2 2 16 0 6 0 4 3 1 3
Observe que el numero de elementos de la muestra es n = 13
Si se hace un arreglo de los datos en orden ascendente, quedarían de la siguiente manera:
0 0 1 1 2 2 3 3 3 4 5 6 6
Para calcular la media de las edades: se suman todos los valores y se divide entre el
número de observaciones, como se muestra a continuación:
Este valor indica que el numero promedio que han recibido control de
su presión arterial en los últimos seis meses es de 2.77
Suponga que se toman todos los datos del ejercicio anterior, los cualles se presentan de
forma ascendente
0 0 1 1 2 2 2 2 2 3 3 3 3 4 5 5 5 6 6 6 6 7 7 8
Observe que el numero de elementos de la población es N=24
Para calcular la media poblacional se suman todos los datos de la población y se divide por el
número de observaciones :
Note que en este caso el número de elementos de la muestra es par (n=16) en este caso se
toman los dos valores centrales del conjunto de datos ordenados y se calcula el promedio de
ambos.
Para calcular la mediana de un conjunto de datos no agrupados, se siguen los
siguientes pasos:
1. Se ordenan los datos en forma ascendente.
2. Si el conjunto de datos es impar, la mediana ocupa el valor central del conjunto de
valores.
3. Si el conjunto de datos es impar, la mediana se obtiene sacando el promedio de los
dos valores centrales.
Como se muestra en el siguiente ejemplo, en el cual quitamos un dato a la muestra del
ejemplo anterior quedando n=15
50% 50%
Note que en este caso el número de elementos de la muestra es impar (n=15), por
lo tanto la mediana se ubica en el valor central; si el conjunto de datos es par, se
toman los dos valores centrales y se saca el promedio de los dos para obtener la
mediana.
Moda
Es la medida de tendencia central con mayor frecuencia dentro de un conjunto de datos, en
otras palabras es el valor que más se repite en una serie de datos. La notación usada para
representar la Moda es
Características
* La moda tiene la ventaja que puede aplicarse a datos cualitativos y cuantitativos, es fácil de
calcular, no se ve afectada por los valores extremos del conjunto de datos; sin embargo, pudiera
ser que la moda no exista, es decir, que ningún dato se repite. Por otra parte la moda podría no
ser única, o sea conjuntos de datos con más de una moda, cuando hay dos modas se dice que
los datos son bimodales, y en general, si los datos tienen más de tres modas, se dice que esos
datos son multimodales.
Si tomamos nuevamente el ejemplo de las edades tomadas a 16 niños hospitalizados por una crisis
de asma. Para determinar la moda se tendría que observar cual es el dato que tiene la frecuencia
mas alta hay cuatro niños que tienen 8 años, por lo tanto la moda es 8
Para reforzar sus conocimientos sobre medidas de tendencia central para datos no agrupados
observe los siguientes video:Video 1 y Video 2
Medidas de dispersión
Las medidas de dispersión corresponden al segundo bloque de medidas descriptivas,
éstas indican que tan dispersos están los datos entre sí; ayudan a determinar aspectos
de homogeneidad o heterogeneidad en un conjunto de datos.
En este caso el Gerente de Producción tiene un problema ya que no es posible dividir el bono.
¿Qué otro criterio, con base estadística, puede considerarse para definir cuál de los dos
empleados tiene un mejor indicador de productividad?
Como los datos obtenidos sumando la última columna, podemos calcular el promedio
de las desviaciones de los datos con respecto a la media (Desviación Media) de cada
empleado de la siguiente manera
Interpretación:
• Para el Empleado A, el promedio de las deviaciones de su producción
semanal con respecto a la media fue de 65 unidades y
• Para el Empleado B, el promedio de las deviaciones de su producción
semanal con respecto a la media fue de 7.5 unidades
Lo anterior indica que los valores de producción del Empleado B son más cercanos a la
media, indicando menor variación o dispersión, lo cual podría inducirnos a pensar que
su producción es más estable, versus Empleado A que pareciera ser menos estable en
sus resultados.
En Conclusión :
Considerando el indicador de dispersión, podríamos recomendar al Gerente de Producción que
en caso de empate, el bono se otorgue al empleado con el indicador de dispersión más bajo. Si
éste fuera el criterio para desempatar. La bonificación sería para el Empleado B
Con este ejemplo se evidencia la importancia de las medidas de dispersión ya que
complementan el análisis de la información, indicando que tan homogéneos o heterogéneos
son los datos entre si.
Rango
De dispersión Desviación media
absoluta Estándar o típica
Varianza
Medidas de dispersión
De dispersión
relativa Coeficiente de
variación
Rango
Esta medida de dispersión nos indica la distancia entre el valor máximo y el valor mínimo de la
muestra o de la población. La fórmula para calcular el Rango de un conjunto de datos es la
siguiente:
Si observa la diferencia entre las dos fórmulas anteriores es que para la calcular S, se utiliza la
media de la muestra y se divide por n-1, y para calcular σ se utiliza la media poblacional y se
divide por N.
Ejemplo:
Calculemos la desviación estándar del ejercicio anterior referido
Interpretación : Indica
que en promedio los
datos del ultimo digito del
seguro social de 5
personas se desvían con
respecto a su media 2.39
Varianza
Esta es una medida de dispersión que se obtiene al elevar al cuadrado la desviación estándar, se
denota por los símbolos: s2 la muestra y σ2 para la población; las fórmulas para calcular la
varianza son las siguientes:
En el caso del ejemplo del ultimo digito del seguro social de 5 personas s=2.39
¿Cuál seria la varianza?
Solución:
Varianza:s2=(2.39)2=5.7121
Medidas de Dispersión Relativas
Estás son medidas de dispersión que se comparan con otra medida que puede ser de tendencia
central , estudiaremos únicamente el coeficiente de variación, denotado por CV y se expresa en
porcentaje, el cual se calcula de la siguiente manera:
Ejemplo:
En el caso del ejemplo del ultimo digito del seguro social de 5
personas conocemos la media =3.8 y la desviación estándar s=2.39
¿Cuál es el coeficiente de variación ? Interpretación:el coeficiente de
variación indica que los últimos
dígitos del seguro social se dispersan
con respecto a la media en un
69.89%
Utilizando el modo estadístico de la
calculadora
Dependiendo del tipo de calculadora vean el siguiente Video