Está en la página 1de 11

Introduccin

Se llama Series de Tiempo son mediciones estadsticas a un conjunto de


mediciones de cierto fenmeno o experimento registrado secuencialmente en
el tiempo.

El primer paso para analizar una serie de tiempo es graficarla, esto permite:
identificar la tendencia, la estacionalidad, las variaciones irregulares
(componente aleatoria).

Un modelo clsico para una serie de tiempo, puede ser expresada como suma
o producto de tres componentes: tendencia, estacional y un trmino de error
aleatorio. En adelante se estudiar cmo construir un modelo para explicar la
estructura y prever la evolucin de una variable que observamos a lo largo del
tiempo.

Correlacin entre variables


La Correlacin es una tcnica estadstica usada para determinar la relacin
entre dos o ms variables.
En probabilidad y estadstica, la correlacin indica la fuerza y la direccin de
una relacin lineal y proporcionalidad entre dos variables estadsticas. Se
considera que dos variables cuantitativas estn correlacionadas cuando los
valores de una de ellas varan sistemticamente con respecto a los valores
homnimos de la otra: si tenemos dos variables (A y B) existe correlacin si al
aumentar los valores de A lo hacen tambin los de B y viceversa. La
correlacin entre dos variables no implica, por s misma, ninguna relacin de
causalidad
La relacin entre la duracin de una carrera de distancia y el test del
escaln, o la relacin entre las caractersticas de la personalidad y la
participacin en deportes de alto riesgo.
La correlacin puede ser de al menos dos variables o de una variable
dependiente y dos o ms variables independientes, denominada correlacin
mltiple.
Caractersticas:
1. El valor cero indica ausencia de relacin lineal entre las variables;
2. El valor numrico del coeficiente, independientemente del signo de la
correlacin, indica la fuerza de la relacin;
3. El signo indica la direccin de la relacin;
4. El valor positivo ms elevado es +1, mientras que el negativo es -1.
Es decir, hay algunos aspectos de relieve a la hora de interpretar un ndice de
correlacin. Los mencionados se refieren a la interpretacin del nmero, pero
existen otros referidos al mtodo y al concepto.
1. Relacin: Asociacin y correlacin. Una primera idea es que hay dos tipos de
ndices de relacin: Los ndices de asociacin y los de correlacin.
2. Relacin, no causalidad. Una segunda observacin por hacer es que los
ndices de correlacin no expresan relacin de causalidad, en una sola
direccin, relacin unvoca, sino relacin biunvoca.
3. Relacin tipificada. Una tercera observacin se refiere al hecho de que la
correlacin es una medida tipificada de la relacin entre variables.
4. Fuerza de la relacin o varianza compartida. Un ndice de correlacin no es
fcilmente interpretable. Para ello es preciso que dicho coeficiente sea elevado

al cuadrado, el cual expresa la proporcin de variabilidad -no se olvide que la


correlacin es variabilidad compartida por dos variables- que ambas variables
comparten.
5. Variabilidad y restriccin del rango de la distribucin. Se ha mencionado en
los clculos de la correlacin que la primera condicin para que sta exista es
que haya variabilidad en las puntuaciones.
6. Direccin de la correlacin. Otra de las caractersticas de la correlacin se
refiere a la naturaleza de la relacin entre las variables, que se refleja en el
signo de la correlacin. Dado que el recorrido de una correlacin es desde 0 a
/1/, el signo es de vital importancia.
7. Significacin de la correlacin. Merece la atencin detenerse en la
significacin del valor de correlacin.
Uso de correlacin.
Para finalizar, considrese el caso de la relacin entre el consumo y el
ingreso de una muestra simulada de 200 familias representativas de una
regin, que se present en la seccin 1. La simulacin se realiz de tal forma
que exista una relacin lineal significativa entre el consumo y el ingreso.
Al aplicar la frmula (2.11), se obtiene un coeficiente de correlacin igual a
0.99, de donde se deduce que existe una fuerte relacin lineal positiva entre el
consumo y el ingreso. Usualmente, los paquetes economtricos permiten
mostrar el coeficiente de correlacin a travs de una matriz de correlaciones,
donde los elementos de la diagonal son siempre iguales a 1 (pues muestran la
correlacin entre cada variable consigo misma) y los que estn fuera de la
diagonal miden la correlacin entre cada par de variables.
Matriz de Correlaciones: Consumo e Ingreso
INGRESO
CONSUMO

INGRESO
1000000
0.993350

CONSUMO
0.993350
1000000

Importancia
El estudio de las correlaciones es de una importancia extrema en el campo
de las ciencias. En concreto, gran parte de la investigacin en las ciencias
sociales, y el de la educacin no es una excepcin, se dedica al estudio de la
variabilidad en alguna variable o realidad entre grupos, individuos o culturas a
lo largo del tiempo y a travs de diversos entornos y lugares. Sin variabilidad no
hay ciencia experimental. Es la variabilidad la que despierta la curiosidad de
todos y mueve a algunos a investigar cul es su origen en orden a explicarla.
Para intentar explicar la variabilidad de tales variables se recurre al estudio de

las covariaciones de stas con otras variables. Es decir, el punto de arranque


de la ciencia es la constatacin de la variabilidad de las variables en primer
trmino y su co-variabilidad despus.
Afirma Kerlinger (1975, 62) que las relaciones son la esencia de la ciencia.
Y las relaciones en la ciencia lo son entre clases o conjuntos de objetos, pues
no puede conocerse la relacin entre variables midiendo solamente a un sujeto.
Es solamente a partir del estudio de la relacin entre variables o fenmenos
como surgen hiptesis, que luego se confirmarn. Y es precisamente a partir
del conocimiento de la relacin entre variables como puede llegarse a formular
predicciones de una a partir de otra.

Diagrama de dispersin
Un diagrama de dispersin se emplea cuando existe una variable que
est bajo el control del experimentador. Si existe un parmetro que se
incrementa o disminuye de forma sistemtica por el experimentador, se le
denomina parmetro de control o variable independiente = eje de x y
habitualmente se representa a lo largo del eje horizontal. La variable medida o
dependiente = eje de y usualmente se representa a lo largo del eje vertical. Si
no existe una variable dependiente, cualquier variable se puede representar en
cada eje y el diagrama de dispersin mostrar el grado de correlacin (no
causalidad) entre las dos variables.
Un diagrama de dispersin puede sugerir varios tipos de correlaciones entre
las variables con un intervalo de confianza determinado. La correlacin puede
ser positiva (aumento), negativa (descenso), o nula (las variables no estn
correlacionadas). Se puede dibujar una lnea de ajuste (llamada tambin "lnea
de tendencia") con el fin de estudiar la correlacin entre las variables. Una
ecuacin para la correlacin entre las variables puede ser determinada por
procedimientos de ajuste. Para una correlacin lineal, el procedimiento de
ajuste es conocido como regresin lineal y garantiza una solucin correcta en
un tiempo finito.
Uno de los aspectos ms poderosos de un grfico de dispersin, sin
embargo, es su capacidad para mostrar las relaciones no lineales entre las
variables. Adems, si los datos son representados por un modelo de mezcla de
relaciones simples, estas relaciones son visualmente evidentes como patrones
superpuestos.
El diagrama de dispersin es una de las herramientas bsicas de control de
calidad, que incluyen adems el histograma, el diagrama de Pareto, la hoja de
verificacin, los grficos de control, el diagrama de Ishikawa y el diagrama de
flujo.

Uso del diagrama de dispersin.


Se emplea cuando una variable est bajo el control del experimentador. Si
existe un parmetro que se incrementa o disminuye de forma sistemtica por el
experimentador, se le denomina parmetro de control o variable independiente
= eje de x y habitualmente se representa a lo largo del eje horizontal. La
variable medida o dependiente = eje de y usualmente se representa a lo largo
del eje vertical. Si no existe una variable dependiente, cualquier variable se
puede representar en cada eje y el diagrama de dispersin mostrar el grado
de correlacin (no causalidad) entre las dos variables.

Un diagrama de dispersin puede sugerir varios tipos de correlaciones entre


las variables con un intervalo de confianza determinado. La correlacin puede
ser positiva (aumento), negativa (descenso), o nula (las variables no estn
correlacionadas). Se puede dibujar una lnea de ajuste (llamada tambin "lnea
de tendencia") con el fin de estudiar la correlacin entre las variables. Una
ecuacin para la correlacin entre las variables puede ser determinada por
procedimientos de ajuste. Para una correlacin lineal, el procedimiento de
ajuste es conocido como regresin lineal y garantiza una solucin correcta en
un tiempo finito.

Uno de los aspectos ms poderosos de un grfico de dispersin, sin


embargo, es su capacidad para mostrar las relaciones no lineales entre las
variables. Adems, si los datos son representados por un modelo de mezcla de
relaciones simples, estas relaciones son visualmente evidentes como patrones
superpuestos.

El diagrama de dispersin es una de las herramientas bsicas de control de


calidad, que incluyen adems el histograma, el diagrama de Pareto, la hoja de
verificacin, los grficos de control, el diagrama de Ishikawa y el (diagrama de
flujo).
Coeficiente de correlacin de Pearson
En estadstica, el coeficiente de correlacin de Pearson es una medida de la
relacin lineal entre dos variables aleatorias cuantitativas. A diferencia de la
covarianza, la correlacin de Pearson es independiente de la escala de medida
de las variables.

De manera menos formal, podemos definir el coeficiente de correlacin de


Pearson como un ndice que puede utilizarse para medir el grado de relacin
de dos variables siempre y cuando ambas sean cuantitativas.
Definicin
En el caso de que se est estudiando dos variables aleatorias x e y sobre
una poblacin estadstica; el coeficiente de correlacin de Pearson se simboliza
con la letra
, siendo la expresin que nos permite calcularlo:

Dnde:

es la covarianza de

es la desviacin tpica de la variable

es la desviacin tpica de la variable

De manera anloga podemos calcular este coeficiente sobre un estadstico


muestral, denotado como
a:

Ejemplo
Con los datos sobre las temperaturas en dos das diferentes en una ciudad,
determinar el tipo de correlacin que existe entre ellas mediante el coeficiente
de Pearson.
X 18 17 15 16 14 12 9 15 16 14 16 18

SX
=180

Y 13 15 14 13 9

SY=
138

Solucin:
Se calcula la media aritmtica

10 8 13 12 13 10 8

Se llena la siguiente tabla:

Se aplica la frmula:

Existe una correlacin moderada


Coeficiente de correlacin de Spearman
Este coeficiente es una medida de asociacin lineal que utiliza los rangos,
nmeros de orden, de cada grupo de sujetos y compara dichos rangos. Existen
dos mtodos para calcular el coeficiente de correlacin de los rangos uno

sealado por Spearman y otro por Kendall 8. El r de Spearman llamado tambin


rho de Spearman es ms fcil de calcular que el de Kendall. El coeficiente de
correlacin de Spearman es exactamente el mismo que el coeficiente de
correlacin de Pearson calculado sobre el rango de observaciones. En
definitiva la correlacin estimada entre X e Y se halla calculado el coeficiente
de correlacin de Pearson para el conjunto de rangos apareados. El coeficiente
de correlacin de Spearman es recomendable utilizarlo cuando los datos
presentan valores externos ya que dichos valores afectan mucho el coeficiente
de correlacin de Pearson, o ante distribuciones no normales.
El clculo del coeficiente viene dado por:

En donde di = rxi ryi es la diferencia entre los rangos de X e Y.


Los valores de los rangos se colocan segn el orden numrico de los datos de
la variable.
Ejemplo:
Se realiza un estudio para determinar la asociacin entre la concentracin de
nicotina en sangre de un individuo y el contenido en nicotina de un cigarrillo (los
valores de los rangos estn entre parntesis).
X
Concentracin de Nicotina en
sangre
(nmol/litro)
185.7 (2)
197.3 (5)
204.2 (8)
199.9 (7)
199.1 (6)
192.8 (6)
207.4 (9)
183.0 (1)
234.1 (10)
196.5 (4)

Y
Contenido de Nicotina por
cigarrillo
(mg)
1.51 (8)
0.96 (3)
1.21 (6)
1.66 (10)
1.11 (4)
0.84 (2)
1.14 (5)
1.28 (7)
1.53 (9)
0.76 (1)

Si existiesen valores coincidentes se pondra el promedio de los rangos que


hubiesen sido asignado si no hubiese coincidencias. Por ejemplo si en una de
las variables X tenemos:

X (edad)
23
23

(Los rangos
seran)
1.5
1.5

27

3.5

27

3.5

39

41

45

...

...

Para el clculo del ejemplo anterior de nicotina


resultado:

obtendramos el siguiente

Si utilizamos la frmula para calcular el coeficiente de correlacin de Pearson


de los rangos obtendramos el mismo resultado

Conclusin
El coeficiente de correlacin es una herramienta estadstica elemental e
importante para el estudio economtrico de relaciones lineales bivariadas que
involucran el uso de datos de corte transversal o series de tiempo. Sin
embargo, este instrumento puede fallar en algunas ocasiones al sugerir la
presencia de una relacin estadsticamente significativa entre dos variables que
en verdad no tienen sentido o no poseen relacin lineal alguna, es decir, que
presentan una correlacin esprea.

http://www.monografias.com/trabajos85/coeficiente-correlacion-karl-pearson/coeficientecorrelacion-karl-pearson.shtml
http://viref.udea.edu.co/contenido/menu_alterno/apuntes/ac36-correlacion-variables.pdf
http://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson
http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas.asp

También podría gustarte