Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDADES ESTADSTICAS
MEDIDAS DE DISPERSIN
MEDIDAS DE DISPERSIN
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la
moda slo nos revelan una parte de la informacin que necesitamos acerca de las
caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de
los datos, debemos medir tambin su dispersin, extensin o variabilidad.
La dispersin es importante porque:
Proporciona informacin adicional que permite juzgar la confiabilidad de la medida
de tendencia central. Si los datos se encuentran ampliamente dispersos, la
posicin central (promedio) ,es menos representativa de los datos.
Ya que existen problemas caractersticos para datos ampliamente dispersos,
debemos ser capaces de distinguir que presenta es dispersin antes de abordar
esos problemas.
Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea
tener una amplia dispersin de valores con respecto al centro de distribucin o
esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y
evitar escoger distribuciones que tengan las dispersiones ms grandes.
Pero si hay dispersin en la mayora de los datos, y debemos estar en capacidad
de describirla. Ya que la dispersin ocurre frecuentemente y su grado de
variabilidad son importantes.
REGRESIN Y CORRELACION
REGRESIN Y CORRELACIN
En muchos casos se requiere conocer ms que el comportamiento de una sola
variable, se requiere conocer la relacin entre dos o ms variables como la
relacin entre produccin y consumo; salarios y horas de trabajo; oferta y
demanda; salarios y productividad; la altura de un rbol y el dimetro de su tronco;
el nivel socioeconmico de una persona y su grado de depresin; etc.
Muchos de estos comportamientos tienen una tendencia lineal, aunque hay
muchos otros que lo hacen de forma curva, en este curso slo se trabajar sobre
variables con correlacin lineal. A continuacin se describir brevemente en qu
consiste un diagrama de dispersin y cules son los criterios que deben tenerse
en cuenta para hallar la mejor lnea o lnea de tendencia del comportamiento de
las variables.
La palabra regresin la utilizamos para significar la estimacin de una variable en
funcin de otro valor conocido, correspondiente a la otra variable.
Decimos que la mejor lnea que se ajusta a un conjunto de puntos es aquella en
donde la suma de los cuadrados de las diferencias entre los valores reales y los
estimados es mnima.
Para determinar el grado de correlacin entre las variables, no basta con calcular
la varianza explicada, pues existe el coeficiente de determinacin o coeficiente de
correlacin al cuadrado; sin embargo, frecuentemente se utiliza un coeficiente de
correlacin rectilneo, r siendo este un valor entre -1 y 1.
NMEROS INDICES
NMEROS INDICE
Los nmeros ndice son cifras relativas expresadas en trminos porcentuales, que
sirven para indicar las variaciones que sufre una serie de valores respecto a una
de ellas, tomada como punto de referencia y a la cual se le denomina base.
Los nmeros ndices no son una medida cuantificable, se trata de un indicador de
variacin en la variable observada. Son indicadores muy utilizados en el sector
econmico por ejemplo, la variacin en los precios de un producto respecto al ao
anterior, la cantidad de unidades vendidas de un producto respecto al mes
anterior, el costo de produccin por unidad de este trimestre comparado con el
inmediatamente anterior, etc.
Si se trata de una serie corta, el perodo base seleccionado ser el primer valor de
la serie; pero si la serie es extensa se debe seleccionar cono perodo base aquel
que haya sido ms estable, es decir, que no presente cambios muy bruscos
debido a factores internos y/o externos. Sin embargo, la seleccin de la serie base
depender de los anlisis que el investigador requiera hacer para sus variables.
Actividad 8
MEDIDAS DE DISPERSIN
MEDIDAS DE DISPERSIN
COEFICIENTE DE VARIACIN
MEDIDAS DE ASIMETRIA
MEDIDAS DE ASIMETRIA
Los datos sesgados a la izquierda (sesgo negativo) presentan una cola izquierda
ms larga y su media y mediana se encuentran a la izquierda de la moda. Ser
asimtrica negativa y:
MEDIA < MEDIANA < MODA
Figura
Distribuciones sesgadas
(a) Sesgada a la derecha; (b) Sesgada a la izquierda; (c) Simtrica
Las asimetras positivas son las ms frecuentes que las sesgadas hacia la
izquierda, porque con frecuencia es ms fcil obtener valores excepcionalmente
grandes que valores excepcionalmente pequeos. Ejemplo de ello es la
distribucin de valores en los consumos de servicios pblicos, las calificaciones en
pruebas, los sueldos, etc.
MEDIDAS DE APUNTAMIENTO O CURTOSIS
CORRELACIN
COEFICIENTE DE CORRELACIN
Para determinar el coeficiente de correlacin, es necesario conocer primero el
error estndar del estimado de la recta ajustada. Se trata pues de medir el grado
de confiabilidad de la ecuacin de la recta estimada. El error estndar indicar la
dispersin o la variabilidad de los valores observados alrededor de la lnea de
regresin.
NUMEROS INDICE
Los nmeros ndice son cifras relativas expresadas en trminos porcentuales, que
sirven para indicar las variaciones que sufre una serie de valores respecto a una
de ellas, tomada como punto de referencia y a la cual se le denomina base.
Los nmeros ndices no son una medida cuantificable, se trata de un indicador de
variacin en la variable observada. Son indicadores muy utilizados en el sector
econmico por ejemplo, la variacin en los precios de un producto respecto al ao
anterior, la cantidad de unidades vendidas de un producto respecto al mes
anterior, el costo de produccin por unidad de este trimestre comparado con el
inmediatamente anterior, etc.
Si se trata de una serie corta, el perodo base seleccionado ser el primer valor de
la serie; pero si la serie es extensa se debe seleccionar cono perodo base aquel
que haya sido ms estable, es decir, que no presente cambios muy bruscos
debido a factores internos y/o externos. Sin embargo, la seleccin de la serie base
depender de los anlisis que el investigador requiera hacer para sus variables.
Los nmeros ndice se pueden construir para una sola observacin o para un
conjunto de ellas; en el primer caso, se hablar de ndices simples y para un
conjunto de datos dados, se hablar de ndices compuestos. Estos ltimos se
clasifican a su vez en agregativos y de promedios. Los promedios se clasifican en
aritmticos, geomtricos, medianos, etc., pero en la prctica los ms utilizados son
los aritmticos.
INDICES COMPUESTOS
Se construyen a partir de un grupo de series de tiempo, concernientes a varios
artculos. Se trata de examinar el valor no de un artculo, sino de un grupo de ellos
respecto a otro considerado de ms importancia. Los ndices compuestos
determinan una condicin particular, por ejemplo el costo de vida relativo a
transporte, vivienda, alimentacin, etc. Se habla entonces de calcular un ndice
agregado ponderado.
Son muchas las frmulas para calcular ndices ponderados, los ms conocidos
son los de Laspeyres, Paashe, Fisher, Keynes, Marshall, Edgeworth, Walsh,
Drobisch y Sidgwick. Generalmente en ellos las ponderaciones son las cantidades
o precios. Cuando se van a calcular los ndices de precios en un grupo de
artculos, las ponderaciones son las cantidades, y en el clculo de los ndices de
cantidad las ponderaciones son los precios.