Está en la página 1de 9

1.

2 Medidas de tendencia central

Fórmulas para datos no agrupados

La medida más común de tendencia central, o localización de los datos, es la media


aritmética ordinaria. Debido a que casi siempre consideramos a los datos como la
muestra, nos referimos a la media aritmética como la media de muestra. Si las
observaciones en una muestra de tamaño n son x1, x2 …, xn entonces la media de
muestra es:

La media de la muestra x representa el valor promedio de todas las observaciones


en la muestra. También podemos pensar en el cálculo del valor promedio de todas
las observaciones en una población. Este promedio se denomina la media de la
población, y se denota por medio de la letra griega µ(mu). Cuando hay un número
finito de observaciones (N), entonces la media de la población es:

Otra medida de tendencia central es la mediana, o punto en el cual la muestra se


divide en dos mitades iguales. Sean x(1), x(2), . . . , x(n) los elementos de una
muestra arreglada en orden creciente de magnitud; esto es, x(1) denota la
observación más pequeña(2) denota la segunda observación más pequeña, . . . , y
x(n) denota la observación más grande. Entonces la mediana se define
matemáticamente como:
Así como x es el valor medio en una muestra, hay un valor medio en la población.
Definimos µ como la mediana de la población; esto es, µ es un valor de la variable
tal que, la mitad de la población se encuentra debajo de µ y la mitad está arriba de
ella.

El modo es la observación que ocurre con mayor frecuencia en la muestra. Por


ejemplo, el modo de los datos de la muestra

Es 2, ya que este valor ocurre cuatro veces, y ningún otro valor se presenta tan a
menudo. Puede haber más de un modo.

Si los datos son simétricos, entonces coinciden la media y la mediana. Si además,


los datos sólo tienen un modo (diremos que los datos son unimodales), entonces
coinciden la media, la mediana y el modo
1.3 Medidas de dispersión (datos no agrupados)

Las medidas de dispersión son útiles porque: Nos proporcionan información


adicional que nos permite juzgar la confiabilidad de nuestra medida de tendencia
central. Si los datos están muy dispersos la posición central es menos
representativa de los datos, como un todo, que cuando estos se agrupan más
estrechamente alrededor de la media.

Nos permiten comparar varias muestras con promedios parecidos

Los estudios estadísticos permiten hacer inferencias de una característica de una


población a partir de la información contenida en una muestra. Los métodos
numéricos que describen a los conjuntos de observaciones tienen como objetivo dar
una imagen mental de la distribución de frecuencias.

Una vez localizado el centro de la distribución de un conjunto de datos, lo que


procede es buscar una medida de dispersión de los datos.

RANGO - El rango de un conjunto de números es la diferencia entre el mayor y el


menor de todos ellos.

1) La diferencia entre los valores mayor y menor


2) 2) Los valores mayor y menor del grupo

DESVIACIÓN MEDIA - La desviación media o desviación promedio es abreviada


por MD. Mide la desviación promedio de valores con respecto a la media del grupo,
sin tomar en cuenta el signo de la desviación. Datos no agrupados x es la media
aritmética de los números y I xj – x I es el valor absoluto de la desviación de xj
respecto de x. (El valor absoluto de un número es el número sin signo y se denota
con dos barras verticales).
DESVIACIÓN ESTÁNDAR - La desviación estándar se denota por s. Se define
como

VARIANZA - Se define como el cuadrado de la desviación estándar y se representa


como s²

COEFICIENTE DE VARIACIÓN - La variación o dispersión real, tal como se


determina de la desviación estándar u otra medida de dispersión, se llama
dispersión absoluta. La dispersión relativa es

A la dispersión relativa se le llama coeficiente de variación o coeficiente de


dispersión si la dispersión absoluta es la desviación estándar s y el promedio es la
media x. Se define como

y se expresa en general como porcentaje.

La dispersión indica que tan cercanos o lejanos se encuentran los valores unos de
otros. Dichos valores pueden pertenecer a un conjunto de datos agrupados
(distribuciones de frecuencias) o no agrupados (ordenados de acuerdo a su
magnitud). Las medidas de dispersión que son más comunes son: rango, desviación
media, desviación estándar, varianza. Las medidas de dispersión que utilizan la
media como referencia son: desviación media, desviación estándar, varianza. Las
medidas de dispersión vistas fueron para datos muéstrales.
1.4 Distribución de frecuencias

La distribución de frecuencia es una disposición tabular de datos estadísticos,


ordenados ascendente o descendentemente, de acuerdo a la frecuencia de cada
dato. Las frecuencias pueden ser:

FRECUENCIA ABSOLUTA (fi): Es el número de veces que se repite un determinado


valor de la variable (xi). Se designa por fi. PROPIEDAD: la suma de todas las
frecuencias absolutas es igual al total de observaciones (n)

FRECUENCIA ACUMULADA (Fi): Las frecuencias acumuladas de una distribución


de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que
integran cada una de las filas de una distribución de frecuencia, esto se logra
cuando la acumulación de las frecuencias se realiza tomando en cuenta la primera
fila hasta alcanzar la última. Las frecuencias acumuladas se designan con las letras
Fi. Se calcula:

FRECUENCIA RELATIVA (hi): Es aquella que resulta de dividir cada una de las
frecuencias absolutas entre el número total de datos. Las frecuencias relativas se
designan con las letras hi. Se calcula

PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.

FRECUENCIA RELATIVA ACUMULADA (Hi): Es aquella que resulta de dividir cada


una de las frecuencias acumuladas entre número total de datos. Se designa con las
letras Hi. Se calcula;

PROPIEDAD: La última frecuencia relativa acumulada es la unidad.


Componentes de una distribución de frecuencias de clase

1.- Clase o Intervalo de clase.- Son divisiones o categorías en las cuales se agrupan
un conjunto de datos ordenados con características comunes. Para organizar los
valores de la serie de datos hay que determinar un número de clases que sea
conveniente. En otras palabras, que ese número de intervalos no origine un número
pequeño de clases ni muy grande. Un número de clases pequeño puede ocultar la
naturaleza natural de los datos y un número muy alto puede provocar demasiados
detalles como para observar alguna información de gran utilidad en la investigación.
A las fronteras del intervalo, la llamaremos, límites inferior y superior de la clase y
los denotaremos por Li-1, Li

2.- Punto medio o Marca de clase (Ẋ).- Es la semisuma del límite inferior y superior
de una clase, tal como lo indica la siguiente formula.

3.- Amplitud, Longitud o Tamaño del Intervalo.- Los intervalos de clases pueden ser
de tres tipos: Clases de igual tamaño, clases de tamaños desiguales y clases
abiertas. En términos generales, las clases de igual tamaño son los más utilizados
y recomendados para los cálculos estadísticos. Se designa por las letras Ic.

Elaboración de una Distribución de Frecuencias

A. Recopilación de datos. Consiste en escribir los datos de la muestra que nos


interesa conocer, sin importar el orden.
B. Ordenamiento de los datos. Consiste en ordenar los datos en forma
ascendente o descendente para facilitar el conteo de datos que
correspondan a cada uno de los intervalos
C. Determinación del número de clases. El número de clases en que se agrupan
los datos se determina con la raíz cuadrada del número de datos cuando este
es menor de 200.
Para muestras con 200 o más datos el número de clases se determina con la raíz
cúbica del número de datos.

D. Cálculo del tamaño de clase. Para determinar el tamaño de clase es


necesario conocer el rango de la muestra, que se obtiene con la diferencia
entre el dato mayor y el dato menor de la muestra y se representa con la letra
R.

El tamaño de clase se obtiene al dividir el rango entre el número de clases, y se


representa con la letra c.

E. Elaboración de intervalos. El tamaño de clase indica el número de datos que


conforman a cada intervalo, considerando los valores extremos llamados
límites. En cada intervalo aparece un límite inferior (LI) y un límite superior
(LS).
F. Obtención de Frecuencias. La frecuencia de clase se obtiene contando, en
la tabla de datos ordenados, los que correspondan al intervalo de dicha clase.
Medidas de tendencia central (para datos agrupados)

 Media (datos agrupados) - Se calcula sumando todos los productos


de marca clase con la frecuencia absoluta respectiva y su resultado dividirlo
por el número total de datos:

La marca clase de una tabla para datos agrupados en intervalos corresponde al


promedio de los extremos de cada intervalo.

 Moda - Es el valor que representa la mayor frecuencia absoluta. En tablas


de frecuencias con datos agrupados, hablaremos de intervalo modal. La
moda se representa por Mo.

Li Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia
absoluta).

fi Frecuencia absoluta del intervalo modal.

fi-1 Frecuencia absoluta del intervalo anterior al modal.

fi+1 Frecuencia absoluta del intervalo posterior al modal.

t Amplitud de los intervalos.

 Mediana - Es el valor que ocupa el lugar central de todos los datos cuando
éstos están ordenados de menor a mayor. La mediana se representa
por Me. La mediana se puede hallar sólo para variables cuantitativas.

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega


hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que
buscar el intervalo en el que se encuentre. N / 2
Varianza - la podemos definir como:

donde m es el número de clases o agrupamientos y la frecuencia para el


respectivo dato .

Teorema. La varianza para un conjunto de datos agrupados es dada como

Para obtener la desviación estándar en un conjunto de datos agrupados es


inmediata, basta con sacar la raíz cuadrada a la varianza obtenida.