Está en la página 1de 4

Introducción

El trabajo con datos se inició desde tiempos remotos en las


sociedades primitivas, cuando en los pueblos fue necesario contar
sus habitantes y calcular sus recursos para poder organizar sus
comunidades y sus vidas.

La historia confirma que los primeros procesos de recopilación,


procesamiento y análisis de información fueron realizados por los
gobernantes de las grandes civilizaciones antiguas con la finalidad de
que tuvieran conocimientos de los bienes que el Estado poseía y
cómo estaban distribuidos en la población. Desde entonces en
muchos Estados se ordenaban estudios que les permitieran tener
mayor conocimiento de determinadas características de la población,
planificar los impuestos y conocer la cantidad de hombres
disponibles para la guerra.

Con el transcurso del tiempo ya por el siglo XVII en las sociedades era
necesario hacer análisis numéricos relacionados con la salud pública,
nacimientos, muertes y actividades propias del comercio, situación
que determinó un perfeccionamiento paulatino de los procesos de
recopilación y tratamiento de información hasta llegar a la actualidad
en que el estudio y análisis de datos no se limita solamente al estudio
demográfico y de la Economía.
Desarrollo

Análisis – Medidas de Tendencia Central

Una de las bases en las que se fundamenta la calidad en nuestros días


es la estadística, la cual aporta herramientas de análisis que pueden
llegar a ser muy complejas. Sin embargo, si contamos con un
conjunto de datos, podemos explorar inicialmente sus características
básicas mediante la estadística descriptiva.

Existen tres Medidas de Tendencia Central que nos revelarán algunas


cualidades de los datos con que contamos: La media, la mediana y la
moda.

Media
También conocida como promedio, ésta importante medida de
tendencia central se expresa de esta manera en términos
matemáticos:

Visto a manera de procedimiento, para calcular la media debemos


realizar los siguientes tres pasos:

1. Sumar uno por uno todos los datos.


2. Contar la cantidad de datos, con esto se obtendrá n.
3. Dividir el total obtenido en el paso 1. entre n.
La media tiene la ventaja de sintetizar en un sólo número todos los
datos, por lo que obtendremos una idea general del fenómeno que
estamos analizando. Nos ayuda a comparar, por ejemplo, el diámetro
de los tornillos de una línea de producción cuya media sea de 12.71
mm contra el de otra línea con una media de 12.68mm y nos dará una
idea de que la primera línea produce tornillos más grandes.

Mediana

Por otro lado, tenemos a la mediana, también conocida como


“Percentil 50″, que nos revela, de entre todas las observaciones, el
que se encuentra justo a la mitad. Si pensamos en el ejemplo de la
línea de producción de tornillos, de la cual obtuvimos una muestra,
para obtener la mediana tendremos que dividir la lista entre 2, el
valor que quede a la mitad del listado será la mediana. En el caso
de que no haya un número justo en el medio, tomaremos los dos al
centro y calculamos su promedio para obtener la mediana.

La representación de la Mediana se hace con el siguiente


símbolo:

La ventaja de la mediana sobre la media es que si existe algún


dato atípicos, es decir, una observación fuera de serie con un
valor demasiado pequeño o demasiado grande al resto de los
datos, la mediana no se ve gravemente afectada, ya que no
toma en cuenta los datos en sí, sino el dato en la posición
central en el listado.

Moda

La moda es el o los valores que más se repiten en nuestro


listado de datos. Si tenemos dos modas con valores
significativamente distintos entre ellas, podríamos pensar
que nuestros datos provienen de muestras diferentes y que
hay un factor que alteró las observaciones entre una y otra.
La Moda no tiene un símbolo por lo que nos referimos a ella
por su nombre.
En la realidad, es difícil que en una muestra, la Media, la
Mediana y la Moda coincidan en un mismo valor y valores
muy dispares entre ellos podrían indicar algún error en la
observación, en la toma de la muestra o en las mediciones
realizadas.

Medidas de dispersión

Las medidas de dispersión entregan información sobre la variación de la


variable. Pretenden resumir en un solo valor la dispersión que tiene un
conjunto de datos. Las medidas de dispersión más utilizadas son: Rango de
variación, Varianza, Desviación estándar, Coeficiente de variación.

Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor
valor de la variable.

También podría gustarte