Está en la página 1de 12

Introducción a la Econometría Tema 1: INTRODUCCIÓN

Tema 1 : INTRODUCCIÓN

1.1 Análisis de datos bidimensionales.

Cuando estudiamos un fenómeno con dos características observables que creemos


puedan tener relación o cuando analizamos la posible relación entre dos fenómenos dis-
tintos se denomina variable bidimensional al conjunto de pares de valores (X,Y) en
que se puede concretar una observación conjunta cualquiera.

Así tenemos que del fenómeno “fisonomía de los individuos” se puede observar con-
juntamente las características altura y peso de cada individuo, del fenómeno “mercado
de un bien” lo haríamos con las características precio y cantidad o, también, podríamos
relacionar el fenómeno “ingreso familiar” con el fenómeno “educación” observando
conjuntamente las características salario y años de estudio. En todos estos casos se de-
fine una variable bidimensional (X,Y).

Se llama variable estadística bidimensional a una colección de observaciones conjun-


tas de (X,Y), que una vez ordenadas da lugar a lo que llamamos distribución bidimen-
sional de frecuencias que podemos representar de las siguientes formas:

1) Con observaciones agrupadas por frecuencias: [ (xi , yj) ; nij ] i = 1, ... ,h j = 1, ... ,k don-
de (xi , yj) representa a cualquier par observado nij veces de la variable (X,Y).
h k
nij es la frecuencia absoluta conjunta, cumpliéndose que: ∑ ∑n ij = N
i =1 j =1

siendo N el número total de observaciones.

2) Con observaciones sin agrupar: (xi , yi) i = 1, ... ,N que describe la serie completa de
valores observados, repetidos o no. Esta será la forma que habitualmente utilizare-
mos para representar los pares de valores obtenidos.

Nótese que en el primer caso tenemos que utilizar dos subíndices “i” y “j”, mientras
que en el segundo sólo tenemos que utilizar un subíndice.

Se denominan distribuciones marginales a las distribuciones unidimensionales que


resultan de considerar por separado cada una de las dos variables que forman la variable
bidimensional.

Distribuciones condicionadas son las distribuciones unidimensionales que surgen al


fijar un valor de una de las variables (condicionante) y considerar la distribución de los
valores de la otra (condicionada), siempre que acompañen al único valor de la variable
condicionante. Se observa que:
- al condicionar reducimos el número de elementos de la distribución al fijarnos ex-
clusivamente en los que cumplen una determinada condición definida por un valor
concreto de la otra variable.
- el número total de distribuciones condicionadas es “h + k”.

1
Departamento de Estadística e Investigación Operativa II (Métodos de Decisión)

En el Apéndice de este Tema se repasan las definiciones y expresiones de los mo-


mentos en una distribución bidimensional, a partir de la forma que considera los datos
agrupados según su frecuencia conjunta, incluyendo algunas demostraciones básicas.

Para el caso en que la distribución bidimensional se presente como el conjunto de pa-


res (xi , yi ) con i = 1, ... , N , entonces los momentos respecto al origen se expresarán
de la siguiente forma:
N N N N N N

∑x y r
i
s
i ∑x i ∑y i ∑x 2
i ∑y 2
i ∑x y i i
a 10 = x = a 01 = y = a 20 = a 02 = a 11 =
i=1 i=1 i=1 i=1 i=1 i=1
a rs =
N N N N N N

Y los momentos con respecto a las medias:


N N

∑( x - x) ∑x
N

∑ (x - x ) (y i - y )
r s 2 2
i i i
i=1 i=1
m rs = i =1
m 20 = S 2x = = - x2
N N N
N N

∑( y - y) ∑y
2 2
i i
2 i=1 i=1
m02 = S = y = - y2
N N

Siendo la covarianza igual a:


N N

∑( x i - x ) . ( y i - y) ∑x y i i
i=1 i=1
m11 = S xy = = - x.y
N N

Se dice que la variable Y es independiente de la variable X cuando las “h” distribu-


ciones condicionadas de Y/X=xi (una para cada valor de “i”) son iguales entre sí. Aná-
logamente, decimos que la variable X es independiente de la variable Y cuando las “k”
distribuciones condicionadas de X/Y=yj (una para cada valor de “j”) son iguales entre
sí e iguales a su vez a la distribución marginal de la variable X.

Se puede observar que cuando se da la independencia en un sentido se da también en


el otro, siendo la independencia recíproca. La condición necesaria y suficiente de inde-
pendencia estadística en el caso de observaciones agrupadas por frecuencias es:

n ij n i. n . j
∀ i = 1, ... , h ∀ j = 1, ... , k = ⋅ ⇔ f ij = f i. ⋅ f . j
N N N

Esta definición de independencia es muy exigente y difícil de cumplir en la práctica,


aunque los fenómenos que representen las variables X e Y no tengan ninguna relación
entre sí. El alumno ya la ha utilizado en la Teoría de la Inferencia Estadística para la
construcción del test χ2 de independencia.

Si X e Y son independientes se verifica que:

2
Introducción a la Econometría Tema 1: INTRODUCCIÓN

h k h k h k
a 11 = ∑ ∑ x y .fi j ij = ∑∑x y .f i j i• . f •j = ∑x .f .∑y .f
i i• j •j = a 10 . a 01 ⇒
i=1 j=1 i=1 j=1 i=1 j=1

si las variables son independientes → a11 = a10.a01 y por tanto la covarianza:

Sxy = a11 - a10.a01 = a10.a01 - a10.a01 = 0

Si las variables son independientes la covarianza toma el valor cero. Pero el recí-
proco no siempre es cierto, es decir: si la covarianza es cero no podemos asegurar
que las variables sean independientes.

Se dice que la variable Y depende funcionalmente de la variable X si para cada va-


lor xi que toma X le corresponde un único valor yi a la Y. La distribución condicionada
de Y/X=xi esta formada por ese valor único yi con frecuencia no nula, siendo su media
igual a ese valor y su varianza igual a cero. Análogamente se definiría la dependencia
funcional de X respecto de Y. Si se cumple en los dos sentidos se dice que la dependen-
cia funcional es recíproca o biunívoca.

Lo habitual, en el campo de la estadística aplicada, es que trabajemos con variables


cuyo grado de dependencia esté comprendido entre la independencia y la dependencia
funcional. De tal forma que los métodos estadísticos tratarán de cuantificar ese grado de
dependencia, de estudiar la forma funcional más adecuada y de medir la influencia que
una de las variables pudiera tener sobre la otra. Aspectos que se tratan en el estudio del
modelo de regresión lineal simple.

Si nos encontramos en el caso en que las frecuencias conjuntas necesariamente han


de ser unitarias porque ningún valor de la X ni de la Y se repite, como cuando se reco-
gen en una tabla las cifras anuales de consumo y renta, evidentemente dichas variables
no son independientes, mientras que aparentemente se puede pensar que existe una de-
pendencia funcional biunívoca dado que a cada valor observado de la X le corresponde
un único valor observado de la Y. Sin embargo, lo que ocurre, generalmente, en estos
casos es una limitación de información que no nos permite tener más de un par observa-
do distinto, bien porque los datos sean temporales e irrepetibles, o bien porque los datos
siendo de corte transversal corresponden a variables de tipo continuo sin posibilidad
práctica de repetición (ejemplo: gastos sanitarios e impuestos pagados por 500 familias
españolas elegidas al azar). En este último caso se puede agrupar los datos de cada una
de las variables por intervalos y construir una tabla de correlación determinando las ci-
fras de las frecuencias conjuntas correspondientes, mientras que en el otro caso, admi-
tiendo que no son independientes, tampoco podemos aceptar que exista una dependen-
cia funcional, a no ser que reconozcamos el carácter determinista del fenómeno que es-
temos estudiando.

Recordemos que la covarianza es una medida del grado de asociación lineal entre las
dos variables X e Y:

3
Departamento de Estadística e Investigación Operativa II (Métodos de Decisión)

yj
(x i (
- x) < 0 y j - y > 0) (x i (
- x) > 0 y j - y > 0)
·
· · ··
II · · · I
· · · · ··
y ··
III · · · · IV
· · ·
·· ·
·
(x i (
- x) < 0 y j - y < 0) (x i (
- x) > 0 y j - y < 0)
x xi

Como se puede ver en esta figura, que supone una relación creciente o positiva entre
las variables, cuanto más cerca de la línea recta imaginaria que pasa por el punto (x, y)
estén los puntos observados habrá más puntos pertenecientes a los cuadrantes I y III,
donde los sumandos que determinan la covarianza son positivos y tendrán más impor-
tancia en su cálculo que los puntos de los cuadrantes II y IV donde habrá menos. En el
caso de una relación lineal perfecta no habrá puntos en estos cuadrantes y los términos
de la covarianza serán todos positivos. Si la relación fuese decreciente o negativa la co-
varianza tomaría un valor negativo.

Luego, cuanto mayor sea el valor absoluto de la covarianza mayor será el grado de
relación o asociación lineal entre las variables. Si la covarianza es positiva la relación
es creciente o en el mismo sentido, si la covarianza es negativa la relación es decrecien-
te o en sentido contrario. Si la covarianza tomase el valor cero, aunque no podamos
afirmar que las variables son independientes, el grado de relación lineal es nulo.

1.2 Concepto de modelo. El modelo econométrico.

Un modelo es “una representación simplificada de la realidad” y lo hace utilizando


expresiones simbólicas por medio de un conjunto de relaciones matemáticas.

Un modelo económico representa a un fenómeno económico de forma simplificada


y en términos matemáticos. Se puede decir que un modelo económico es la expresión
matemática de una determinada teoría económica.

Un modelo econométrico es aquel modelo económico que contiene las especifica-


ciones necesarias para su aplicación empírica. Incorpora variables aleatorias permitien-
do el uso de los métodos de la inferencia estadística a partir de los datos observados so-
bre las magnitudes incluidas en el propio modelo.
Un modelo econométrico es un conjunto de relaciones matemáticas que representa
las dependencias e influencias entre diversas magnitudes económicas incorporadas al

4
Introducción a la Econometría Tema 1: INTRODUCCIÓN

modelo por medio de variables, que suelen representar a las posibles observaciones
muestrales de dichas variables, y podrán ser aleatorias. Un modelo econométrico tam-
bién recoge ciertas características del fenómeno que se estudia por medio de paráme-
tros, cuyo valor desconocido deberá estimarse aplicando el correspondiente método es-
tadístico, y suele introducir ciertas variables aleatorias denominadas perturbaciones
aleatorias o términos de error, no observables, que representan al conjunto de posibles
causas e influencias no incluidas en el modelo. La formulación del modelo se hace,
habitualmente, a partir del contenido de una determinada teoría económica que se pre-
tende contrastar empíricamente.

1.3 Ejemplo 1: La función de Consumo keynesiana

La teoría económica en que se basa este modelo podemos recogerla directamente de


la obra de Keynes: “La ley psicológica fundamental en que podemos basarnos con ente-
ra confianza, tanto a priori partiendo de nuestro conocimiento de la naturaleza humana
como de la experiencia, consiste en que los hombres están dispuestos, por regla general
y en promedio, a aumentar su consumo a medida que su ingreso crece, aunque no tanto
como el crecimiento de su ingreso. Esto quiere decir que si C es el monto del consumo
e Y el ingreso (ambos medidos en unidades de salario), ΔC tiene el mismo signo que
dC
ΔY, pero es de menor magnitud, es decir, es positivo y menor que la unidad.”(pág.
dY
96)...“la satisfacción de las necesidades primarias inmediatas de un hombre y su familia
es un motivo más fuerte que los relativos a la acumulación... Estas razones impulsarán
casi siempre a ahorrar mayor proporción del ingreso cuando el ingreso real aumen-
ta”(pág. 97).... (Teoría general de la ocupación, el interés y el dinero, J.M. Keynes)

Es decir, si C es el consumo privado y R es la renta disponible, expresados en pre-


cios constantes (o deflactados) se definen las siguientes hipótesis del modelo:

1º) C depende de R. Por tanto, si se escoge la forma lineal para expresar la relación
entre C y R el modelo económico queda:

C = α + βR

2º) La propensión marginal al consumo está comprendida entre cero y uno:

dC dC
0< <1 al ser = β esto supone que 0 < β < 1.
dR dR

3º) La propensión marginal al consumo debe ser menor que la propensión media:

dC C
<
dR R

α + β ⋅R
De aquí se deduce que β < ⇒ β ⋅R <α + β ⋅R ⇒ α > 0
R

5
Departamento de Estadística e Investigación Operativa II (Métodos de Decisión)

El modelo econométrico correspondiente se obtiene refiriendo las variables C y R a


los instantes temporales de observación e introduciendo las variables que representan a
los términos de error o perturbaciones aleatorias.

Modelo econométrico:
Ct = α + βRt + ut para t = 1,2, ... ,N

Ct : Consumo privado deflactado del periodo “t”


Rt : Renta disponible deflactada del periodo “t”
α y β : parámetros
ut : Variable aleatoria denominada perturbación aleatoria

Es evidente que si prescindimos de “ut” y sustituimos “Ct” y “Rt” por sus valores ob-
servados la ecuación “Ct = α + βRt” no se cumplirá de forma exacta, para unos valores
fijos de α y β, en los periodos considerados. Las variables ut representan todas las de-
más causas que afectan al consumo, diferentes del nivel de renta, y no están incluidas en
el modelo, introduciendo la aleatoriedad en el mismo y pudiendo, así, aplicar métodos
de inferencia estadística para la estimación de los parámetros α y β.

Las hipótesis sobre los valores de los parámetros ( 0 < β <1 y α > 0 ) deberán ser
aceptadas o rechazadas estadísticamente utilizando alguno de los métodos de contrastes
de hipótesis que nos proporciona la Inferencia Estadística.

A partir de este primer ejemplo se pueden deducir las siguientes características sobre
los elementos que constituyen un modelo econométrico:

- Cada magnitud que relaciona un modelo se representa por una variable que puede
tomar cualquier valor dentro de un conjunto establecido. A la variable que representa a
la magnitud que el modelo intenta analizar estudiando las posibles causas de sus varia-
ciones se la denomina variable endógena (también: dependiente o explicada) y a las
que representan esas posibles causas y, por tanto, sus variaciones influyen sobre la va-
riable endógena se las denomina variables exógenas (también: independientes o ex-
plicativas). En el ejemplo 1 la variable endógena es C, que representa al consumo pri-
vado del periodo a precios constantes, y la única variable exógena es R, que representa
a la renta disponible del periodo también a precios constantes.

- Las variables ut, que, como ya se ha dicho antes, contienen a todas las causas e
influencias sobre la variable endógena no representadas por las variables exóge-
nas ni por los parámetros, reciben el nombre de perturbaciones aleatorias. Al
ser el valor de los parámetros desconocido serán variables no observables o la-
tentes.

6
Introducción a la Econometría Tema 1: INTRODUCCIÓN

- Los datos que generan las variables observables pueden ser:

Series temporales: las observaciones se realizan en distintos periodos de tiempo.

Datos de sección cruzada o de corte transversal: cuando corresponden a distintos


individuos o familias o empresas pero referidos al mismo periodo de tiempo.

Datos de panel: supone una combinación de los anteriores al obtenerse los datos so-
bre un mismo conjunto de individuos(o familias o empresas) en distintos periodos de
tiempo.

En nuestro ejemplo los datos son series temporales: Ct y Rt representan, respectiva-


mente, a las cifras deflactadas del consumo privado y de la renta disponible en un país o
región determinada correspondientes al periodo de tiempo “t”.

- Al realizarse las observaciones temporalmente podemos distinguir entre variable


sin retardos, simbolizada por Xt, que recoge el valor que toma la variable X en el pe-
riodo “t” y variable retardada, simbolizada por Xt-k, que representa al valor que tomó
la variable X “k” periodos antes del periodo “t”. En el ejemplo las variables son sin re-
tardos.

- Si el modelo se define, como en nuestro ejemplo, por medio de una única ecuación
se denomina modelo uniecuacional, y si necesita de dos ecuaciones o más modelo
multiecuacional.

- Si los datos son de sección cruzada o si son series temporales pero todas las varia-
bles incluidas en el modelo aparecen sin retardos, el modelo se denomina estático y si
aparecen, en alguna ecuación del modelo, variables retardadas el modelo recibe el nom-
bre de dinámico en el sentido que intentará captar el comportamiento en el tiempo de
las variables implicadas.

- Si la forma en que intervienen variables y parámetros en cada una de las ecuaciones


que definen el modelo es lineal respecto a los parámetros, es decir, se puede expresar
como una combinación lineal en que los coeficientes son los parámetros y los elementos
de la combinación son las variables originales o alguna transformación de las mismas,
se dice que el modelo es lineal, mientras que en cualquier otro caso será un modelo no
lineal.

- Los parámetros son magnitudes que permanecen constantes durante la realización


completa del fenómeno. Afectan a las variables, como coeficientes, marcando su efecto
o peso en la relación y pueden tener interpretación económica. En el ejemplo 1 los pa-
rámetros son α y β, siendo β la propensión marginal al consumo y α el denominado
consumo autónomo.

7
Departamento de Estadística e Investigación Operativa II (Métodos de Decisión)

1.4 Etapas del trabajo econométrico.

I. ESPECIFICACIÓN

Teoría económica Ejemplo 1:


Matemáticas Ct = α + βRt + ut
Estadística matemática para t = 1,2, ... ,N

II. ESTIMACIÓN

Inferencia estadística Ejemplo 1:


(estimación) estimadores de α y β: α* y β*
Teoría económica Ct* = α* + β* Rt

III. VERIFICACIÓN

Inferencia estadística Ejemplo 1:


(contrastes de hipótesis) Ho: β = 0 H0: β = 1 Ho: α = 0
Teoría económica H1: β ≠ 0 H1: β < 1 H1: α > 0

IV. APLICACIÓN

Puede ser, por ejemplo, predicción:

Métodos estadísticos Ejemplo 1:


Teoría económica Si Rt+h = R0 → Cpt+h = α* + β* R0

8
Introducción a la Econometría Tema 1: INTRODUCCIÓN

EJERCICIOS PROPUESTOS

1.1 Las alturas (en cm.) y los pesos (en kg.) de 40 mujeres, elegidas al azar entre las que
forman un determinado colectivo, han sido:
Alturas: X Pesos: Y
X Y X Y X Y X Y
146 41 154 46 160 48 165 60
147 45 155 50 160 48 166 54
148 42 155 48 160 50 167 60
150 55 156 45 162 60 168 50
150 48 156 60 162 56 168 58
151 60 157 50 162 48 170 60
152 50 158 48 163 50 172 68
152 52 158 52 163 58 174 65
152 45 158 53 164 56 174 70
153 48 159 52 164 52 175 64

1º: Calcule las medias y las varianzas de las distribuciones marginales de alturas y pesos.
2º: Elabore la tabla de correlación de la distribución bidimensional, estableciendo para
cada variable 6 intervalos de amplitud igual a 5.
3º: Calcule, a partir de la tabla construida en el apartado anterior, las medias y varianzas
marginales, comparándolas con las obtenidas en el primer apartado.
4º: Obtenga las medias de las seis distribuciones de frecuencias de los pesos condiciona-
das a las alturas.

1.2 Las calificaciones obtenidas por 32 alumnos, elegidos al azar entre los asistentes a
un determinado Curso de especialización, en el examen previo de ingreso ( X ) y en
el examen final ( Y ), han resultado ser :

X Y X Y X Y X Y
5 3 6 5 7 6 8 10
5 4 6 5 7 7 9 10
5 5 6 6 7 7 9 8
5 5 6 6 7 8 9 9
5 6 6 7 8 6 10 8
5 8 6 9 8 7 10 9
6 4 7 4 8 7 10 10
6 4 7 5 8 8 10 10

1º: Calcule las medias y las varianzas de las dos distribuciones marginales.
2º: Elabore la tabla de frecuencias de la distribución bidimensional.
3º: Calcule la covarianza.
4º: Calcule las medias y las varianzas de las seis distribuciones de Y condicionadas a los
distintos valores que puede tomar la X.

9
Departamento de Estadística e Investigación Operativa II (Métodos de Decisión)

1.3 Teniendo en cuenta los datos anuales de la “Renta Disponible” y del “Consumo Priva-
do”, ambos expresados en miles de millones de dólares de 2000, de la economía de
Estados Unidos durante el periodo de 1960 a 2004:

Renta dis- Consumo Renta dis- Consumo Renta dis- Consumo


ponible privado ponible privado ponible privado
(miles de (miles de (miles de (miles de (miles de (miles de
millones de millones de millones de millones de millones de millones de
Año $ de 2000) $ de 2000) Año $ de 2000) $ de 2000) Año $ de 2000) $ de 2000)
1960 1759.7 1597.4 1975 3302.6 2876.9 1990 5324.2 4770.3
1961 1819.2 1630.3 1976 3432.2 3035.5 1991 5351.7 4778.4
1962 1908.2 1711.1 1977 3552.9 3164.1 1992 5536.3 4934.8
1963 1979.1 1781.6 1978 3718.8 3303.1 1993 5594.2 5099.8
1964 2122.8 1888.4 1979 3811.2 3383.4 1994 5746.4 5290.7
1965 2253.3 2007.7 1980 3857.7 3374.1 1995 5905.7 5433.5
1966 2371.9 2121.8 1981 3960.0 3422.2 1996 6080.9 5619.4
1967 2475.9 2185.0 1982 4044.9 3470.3 1997 6295.8 5831.8
1968 2588.0 2310.5 1983 4177.7 3668.6 1998 6663.9 6125.8
1969 2668.7 2396.4 1984 4494.1 3863.3 1999 6861.3 6438.6
1970 2781.7 2451.9 1985 4645.2 4064.0 2000 7194.0 6739.4
1971 2907.9 2545.5 1986 4791.0 4228.9 2001 7333.3 6910.4
1972 3046.5 2701.3 1987 4874.5 4369.8 2002 7562.2 7099.3
1973 3252.3 2833.8 1988 5082.6 4546.9 2003 7741.8 7306.6
1974 3228.5 2812.3 1989 5224.8 4675.0 2004 8004.3 7588.6
Fuente: Economic Report of the President

1º: Calcule las medias y las varianzas de las variables “Renta disponible” y “Consumo
privado”, así como su covarianza.
2º: ¿Cuáles serían los valores de las medias y las varianzas de las distribuciones del Con-
sumo privado condicionadas a los distintos valores de la Renta disponible?.

1.4 Calcule las medias, las varianzas y la covarianza de las variables X e Y si los datos
los conocemos de las siguientes formas:

A) N = 15 ; ∑Xi = 270 ; ∑Xi2 = 5542 ; ∑Yi = 84 ; ∑Yi2 = 526,5 ; ∑Xi ·Yi = 1340

B) N = 15 ; ∑Yt = 84 ; ∑(Yt -⎯Y )2 = 56,1 ; ∑(Yt - ⎯Y )(Xt - ⎯X ) = -172

∑Xt = 270 ; ∑(Xt - ⎯X )2 = 682

268
C) N = 15 ; a10 = 18 ; a01 = 5,6 ; a20 = 369, 4666667 ; a02 = 35,1 ; a11 =
3

10
Introducción a la Econometría Tema 1: INTRODUCCIÓN

APÉNDICE

Los momentos en una distribución bidimensional. La covarianza.

Sea la distribución bidimensional de frecuencias [ (xi , yj) ; nij ] i = 1, ... ,h j = 1, ... ,k ,


definimos el momento de orden (r,s) respecto al origen como :

h k

∑∑x y r
i
s
j ⋅ n ij h k
= ∑∑x ir ysj ⋅ f ij
i =1 j=1
a rs =
N i=1 j=1

Se deduce que a 10 = x y a 01 = y

h k

∑x ∑
h k h k h
a 10 = ∑∑ x 1i y 0j ⋅ f ij =
i =1 j=1
∑∑ x i ⋅ f ij =
i =1 j=1 i=1
i
j=1
f ij = ∑x
i =1
i ⋅ f i• = x
k
ya que ∑f ij = f i•
j=1
h k
Así mismo a 20 = ∑ x i2 ⋅ f i• y a 02 = ∑ y 2j ⋅ f • j
i =1 j=1
k h

∑y ∑
h k h k k
a 02 = ∑∑ x i0 y 2j ⋅ f ij = ∑∑ y 2j ⋅ f ij = 2
j fij = ∑y 2
j ⋅ f•j
i =1 j=1 i =1 j=1 j=1 i=1 j=1
h
ya que ∑f ij = f•j
i=1

Por tanto, si uno de los elementos del par (r,s) se anula, el momento resultante es el
correspondiente en la distribución marginal.

El momento de orden (1,1) o momento producto es:

h k
a 11 = ∑∑ x i y j ⋅ f ij
i =1 j=1

Definimos el momento de orden (r,s) respecto a las medias como :

m rs = ∑∑ (x i - x ) ⋅ (y j - y ) ⋅ f ij
h k
r s

i =1 j=1

Con demostraciones análogas a las utilizadas en los momentos respecto al origen se


obtiene que:
h
m 20 = ∑ (x i - x ) ⋅ f i• = S 2x = a 20 - x 2 = a 20 - a 10
2 2
m 10 = 0
i =1

m 02 = ∑ (y j - y ) ⋅ f • j = S 2y = a 02 - y 2 = a 02 - a 01
k
2 2
m 01 = 0
j=1

Se define la covarianza como:

11
Departamento de Estadística e Investigación Operativa II (Métodos de Decisión)

COV(X, Y) = m11 = S xy = ∑∑ (x i - x ) ⋅ (y j - y ) ⋅ f ij
h k

i =1 j=1

para el cálculo en función de los momentos respecto al origen: Sxy = m11 = a11 - a10.a01

S xy = ∑ ∑ (x i - x ) ⋅ (y j - y ) ⋅ f ij = ∑∑ (x i y j - xy j - yx i + x.y ) ⋅f ij =
h k h k

i =1 j=1 i =1 j=1

(sumatorio de una suma → suma de sumatorios)

h k h k h k h k
= ∑∑ x y
i =1 j=1
i j ⋅ f ij - x ∑∑ y
i =1 j=1
j ⋅ f ij - y ∑∑ x
i =1 j=1
i ⋅ f ij + x.y ∑∑ f
i =1 j=1
ij =

(teniendo en cuenta los resultados anteriores y que ΣΣ fij = 1 )

= a 11 - xa 01 - ya 10 + x.y = a 11 - a 10 a 01 - a 01a 10 + a 10 a 01 = a 11 - a 10 a 01

Transformaciones lineales en una distribución bidimensional.

Sea la variable (X ,Y) de la que a partir de su distribución bidimensional de frecuen-


cias se obtienen los momentos :

a 10 = x a 01 = y m 20 = S 2x m 02 = S 2y m11 = S xy

Si realizamos las transformaciones lineales:

X’ = a + bX Y’ = c + dY

los momentos en la distribución de frecuencias de la nueva variable (X’,Y’) serían:

a'10 = x' = a + bx a' 01 = y' = c + dy

m' 20 = S 2x' = b 2 S 2x m'02 = S 2y' = d 2 S 2y

Para las desviaciones típicas: S x' = b S x S y' = d S y

Para la covarianza: m'11 = S x'y' = bdS xy


Demostración:
S x'y' = ∑∑ (x'i − x') ⋅ (y' j − y') ⋅ f ij = ∑∑ (a + bx i − a − bx ) ⋅ (c + dy j − c − dy ) ⋅ f ij =
h k h k

i =1 j=1 i =1 j=1

= ∑∑ b(x i − x ) ⋅ d (y j − y ).f ij = bd ∑∑ (x i − x ) ⋅ (y j − y ) ⋅ f ij = bdS xy


h k h k

i =1 j=1 i =1 j=1

12

También podría gustarte