Estadística Descriptiva DEE

TEMA 1: CONCEPTOS BÁSICOS
1- ESTADÍSTICA Y UNIDADES
- Estadística Descriptiva: ordena y resume los datos para extraer las características más
relevantes.
- Estadística Matemática o Teórica: estudia las leyes del comportamiento de los

fenómenos aleatorios, las generaliza y las aplica para inferir resultados. O dicho de otra
forma, evalúa la información proporcionada por los datos para sacar conclusiones fiables
sobre la naturaleza del fenómeno que generó los datos.
El cálculo de probabilidades permite inferir datos de una pequeña muestra a un gran

grupo o población.
Unidad estadística: ser vivo, cosa o hecho del que se obtienen uno o varios datos. Su
conjunto conforma la población.
Cada uno de los individuos de la población puede describirse según uno o varios caracteres.
2- CARACTERES: VARIABLES Y ATRIBUTOS

Los caracteres son cualquier rasgo o característica de las ud. estadísticas de una pobl.
- Cualitativos o Atributos: no pueden medirse, sus distintas modalidades se describen

con palabras. Se dividen en:
• ordinales: pueden ordenarse (nivel de estudios)
• nominales: sus modalidades no se ordenan (sexo)
- Cuantitativos o Variables: toman valores numéricos, es decir se describen con

números. Pueden ser:
• discretos: toman un número finito o infinito numerable de valores (edad)
• continuos: tienen infinitos valores. Siempre existe otro valor entre dos distintos
(peso)
3-DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES

• Frecuencia absoluta (ni): veces que se repite un valor.
k
∑n
i =1
i =N
• Frecuencia relativa (fi): proporción de individuos con un valor.

k k
ni
∑ fi = ∑
i =1 i=1 N
=1
ED 1
• Frecuencia absoluta acumulada (Ni): número de observaciones menores o
iguales a un valor.
Ni = n1 + n2 + … + ni−1 + ni ; Nk = N
• Frecuencia relativa acumulada (Ni): proporción de observaciones menores o

iguales a un valor.
Ni
Fi = = f1 + f2 + … + fi−1 + fi ; Fk = 1
N
4- TABLAS ESTADÍSTICAS
Es una forma de representar reducidamente los datos de una investigación. Aparecen los
valores con sus distintas frecuencias (dependiendo de los requerimientos aparecerán las
frecuencias absolutas y/o las relativas, y las acumuladas).
Si la variable es continua, los datos se agrupan en intervalos de una cierta amplitud,

identificados por su marca de clase, que es el punto medio (límite inferior más límite superior
dividido entre dos).
Se recomienda que los intervalos sean de la misma amplitud, disjuntos, consecutivos,
cuantos más mejor, y que los extremos sean valores no observables.
5- REPRESENTACIONES GRÁFICAS
Se trata de los métodos mediante los que las observaciones estadísticas se representan por
magnitudes o figuras geométricas, ya que aunque la tabla incluya toda la información
disponible, los gráficos ayudan a ver pautas de comportamiento en la población.
Por tanto, no son un sustitutivo de las tablas, sino un complemento.
Pueden clasificarse por el tiempo (estáticos o dinámicos), por el sistema (cartesianos,

polares, de longitud, de superficies, de volúmenes), por el fin (activos o pasivos).
Hay muchos tipos de gráficos, dependiendo del tipo de caracteres que se tengan:
1- ATRIBUTOS:
a) Diagrama de rectángulos: sobre un eje cartesiano se representa cada modalidad

con un rectángulo. Todos tienen la misma anchura, y su altura es proporcional a la
frecuencia absoluta de cada modalidad.
ED 2
b) Diagrama de sectores: en este caso es el área del sector circular la que representa
la frecuencia de cada modalidad, por lo que se reparten los 360 grados del círculo
proporcionalmente a las frecuencias.
c) Pictograma: consiste en dibujos que aluden a cada modalidad del atributo. Las
proporciones se representan bien mediante la repetición del dibujo, o bien con el
tamaño del dibujo.
d) Diagrama triangular: sólo es útil cuando el atributo tiene tres modalidades entre las
que se reparten el total de la población. Se basa en que en un triángulo equilátero,
las paralelas a los lados, trazadas desde un punto interior, tienen una longitud cuya
suma es constante e igual al lado del triángulo.
e) Diagrama de Pareto: se ordenan las modalidades de mayor a menor, y entonces se

representan las frecuencias en un diagrama de rectángulos al que se añade una
línea poligonal que muestra las frecuencias acumuladas.
ED 3
f) Cartograma: es un mapa en el que las distintas modalidades se indican mediante un
código de colores, con los que se pintan las regiones. Es muy usado en la
representación de resultados electorales.
2- VARIABLES DISCRETAS:
a) Diagrama de barras: sobre un eje cartesiano se representa cada modalidad con una
barra, cuya altura es proporcional a la frecuencia absoluta de cada modalidad si es
un diagrama de frecuencias absolutas; o a la frecuencia relativa si es de frecuencias
relativas.
b) Polígono de frecuencias: es una línea poligonal obtenida al unir los puntos (xi , fi ) ,
donde xi es el valor i de la variable, y fi su frecuencia relativa (también puede
hacerse con las frecuencias absolutas, ni .este caso es el área del sector circular la
ED 4
que representa la frecuencia de cada modalidad, por lo que se reparten los 360
grados del círculo proporcionalmente a las frecuencias.
c) Diagrama acumulativo o de escalera: representa las frecuencias acumuladas,

abolutas o relativas, de tal forma que queda un gráfico escalonado.
3- VARIABLES CONTINUAS:
a) Histograma: sobre un eje cartesiano se representa cada modalidad con un

rectángulo, cuya base va del límite inferior al superior de cada intervalo. En este
caso, las frecuencias quedan representadas por las áreas de los rectángulos, no por
sus alturas. Si todos los intervalos tuvieran la misma amplitud, entonces sería igual
que un diagrama de barras. Para poder construirlo no debe haber intervalos
abiertos. Para calcular las alturas se haría:
fi
hi = donde hi altura, fi frecuencia, y ai amplitud
ai
ED 5
b) Polígono de frecuencias: es el mismo caso que para las variables discretas, con la
diferencia de que se combina con el histograma, uniendo las líneas los puntos
medios de las cimas de los rectángulos.
c) Diagrama acumulativo: es similar al caso discreto, excepto que se supone que

dentro de cada intervalo las observaciones redistribuyen uniformemente, por lo que
no queda forma escalonada.
d) Diagrama de tallos y hojas: es una especie de diagrama de barras horizontal, en el

que se colocan los tallos (normalmente la parte entera de los valores) a la izquierda,
y luego el primer decimal de los valores que tienen ese tallo. Así se ven las
frecuencias absolutas.
e) Diagrama de caja: tras ordenar los datos de menor a mayor, se calculan los
cuartiles 1 y 3 (estos marcan los extremos de la caja), y la mediana (divide la caja
en dos). Luego se calculan los límites admisibles fuera de los cuales los datos son
atípicos:
ED 6
LI = Q1 − 1,5 ( Q3 − Q1 ) LS = Q3 + 1,5 ( Q3 − Q1 ) .
a) Con estos límites se dibujan los “bigotes”: el izquierdo con el menor valor de la
distribución mayor o igual que el LI; y el derecho con el mayor valor menor o igual
al LS. Por último, se pintan los datos atípicos y la media.
ED 7
TEMA 2: MEDIDAS DE SÍNTESIS. LA
MEDIA
1- MEDIDAS DE POSICIÓN
Las tablas estadísticas ofrecen toda la información disponible, pero muchas veces es
demasiado extensa, así que se intenta resumir en una serie de medidas de síntesis,
representadas por unos estadísticos. Estas medidas son operativas si tienen en cuenta todos
los valores de la distribución, son calculables, y únicas para cada distribución
Las medidas de síntesis se dividen en medidas de posición, de dispersión, de forma y de
concentración.
Las medidas de posición tratan de cuantificar entorno a qué valor o valores se distribuyen
las observaciones. Se dividen en medidas de posición no central (cuantiles) y las de posición
central (media, mediana y moda).
Debido a la extrema simplificación que se lleva a cabo con las medidas de posición, todos
los valores observados se resumen en uno únicamente, se les exige una serie de
condiciones, establecidas por Yule:
1) estar definidas de manera objetiva
2) usar todas las observaciones disponibles
3) tener un significado concreto y sencillo de interpretar
4) ser sencillas de calcular
5) prestarse a cálculos algebraicos posteriores
6) ser poco sensibles a cambios en la muestra
Es prácticamente imposible encontrar estadísticos que cumplan todas estas condiciones, así
que dependiendo de lo que se busque, se elegirán unos u otros.
2- LA MEDIA ARITMÉTICA
Es la suma de todos los valores observados ponderados por sus frecuencias. Es la más
conocida y usada.
Es el centro de gravedad de la distribución, es decir, la suma de las diferencias de todos los

puntos que quedan a la izquierda de la media respecto a ella coincide en valor absoluto con
la suma de las diferencias de todos los puntos que quedan a su derecha:
x1 − x ⋅ n1 + x2 − x ⋅ n2 + …… + x j − x ⋅ nj = x j+1 − x ⋅ nj+1 + …… + xk − x ⋅ nk
/ x1 , x2 , … , x j < x < x j+1 , … , xk
De esta ecuación se deriva la expresión más común de la media aritmética:
∑xn i i k
x= i=1
= ∑ x i fi
N i =1
ED 8
En el caso de variables con datos agrupadas, se usan las marcas de clase para calcular la
media.
PROPIEDADES:
k
1) Valor total de las observaciones: N ⋅ x = ∑ x i ⋅ ni
i=1
Demostración:
k
∑x i ⋅ ni k
Nx = N ⋅ i =1
= ∑ x i ⋅ ni
N i =1
2) La suma de la diferencia entre las observaciones y la media es cero:

k
∑ (x
i =1
i − x) ⋅ ni = 0
Demostración:
k
k k k ∑x i ⋅ ni
∑ (x i − x) ⋅ ni = ∑ x i ⋅ ni − x ⋅ ∑ ni = N ⋅
i =1 i =1 i =1
i =1
N
− x ⋅N = N⋅ x −N⋅ x = 0
3) Responde a cambios de escala (homogeneidad) y origen:

y i = ax i + b ⇒ y = ax + b
Demostración:
k k k k k k
∑y i ⋅ ni ∑ ( ax i + b ) ⋅ ni ∑ ax i ⋅ ni + ∑ bni a ⋅ ∑ x i ⋅ ni b ⋅ ∑ ni
y= i =1
= i =1
= i =1 i =1
= i =1
+ i =1
= ax + b
N N N N N
4) La media aritmética de una combinación lineal de v.a. es la combinación lineal de las

medias:
x i = ay i + bzi ⇒ x = ay + bz
Demostración:
k k k k k k
∑x i ⋅ ni ∑ ( ay i + bzi ) ⋅ ni ∑ ay i ⋅ ni + ∑ bzi ⋅ ni a ⋅ ∑ y i ⋅ ni b ⋅ ∑ zi ⋅ ni
x= i =1
= i =1
= i =1 i =1
= i =1
+ i =1
= ay + bz
N N N N N
5) Composición de poblaciones o media de medias: la media de un conjunto de muestras

es la media ponderada de las medias de las muestras.
N1 x1 + N2 x 2 + … + Nr x r
X=
N1 + N2 + … + Nr
ED 9
Demostración: sean r muestras distintas, cada una compuesta por k i caracteres o
intervalos, habiendo p en total. Entonces:
p k1 k2 kr
∑x i ⋅ ni ∑x 1i ⋅ ni + ∑ x 2i ⋅ ni + …… + ∑ x ri ⋅ ni
X= i =1
= i =1 i =1 i =1
=
N N
k1 k2 kr
∑x 1i ⋅ ni ∑x 2i ⋅ ni ∑x ri ⋅ ni
N1 i =1
+ N2 i =1
+ …… + Nr i =1
N1 N2 Nr N1 x1 + N2 x 2 + … + Nr x r
= =
N N1 + N2 + … + Nr
6) Minimiza el sumatorio de los cuadrados de las diferencias de las observaciones respecto

a un valor:
k
min ∑ (x i − a)2 ni ⇒ a = X
i=1
k
Demostración: Sea Q(a) = ∑ (x
i =1
i − a)2 ni
k k
dQ(a) k k k ∑x i ⋅ ni ∑x i ⋅ ni
1ª Condición : = −2∑ (x i − a) ⋅ ni = 0; a∑ ni = ∑ x i ⋅ ni ; a= i =1
k
= i =1
=x
da N
i =1 i =1 i =1
∑n
i =1
i
d2 Q(a) k
2ª Condición : 2
= 2∑ ni = 2N > 0 ⇒ mínimo
da i =1
CÁLCULO ABREVIADO: con objeto de facilitar el cálculo práctico de la media, cuando la

distribución presenta numerosos valores o éstos están compuestos por bastantes dígitos, es
aconsejable realizar el siguiente cambio de variable, aprovechando la propiedad 3:
xi − Ox
k k k
xi − Ox ∑ c
⋅ ni ∑ xi ⋅ ni − Ox ∑ ni x − Ox
yi = ⇒ y = i=1 = i=1 i =1
= ⇒ x = c ⋅ y + Ox
c N N⋅c c
Entre las ventajas de la media aritmética están que se presta a cálculos posteriores; es
fácil de calcular; usa todos los valores; y es única. Además es un estimador insesgado de la
media poblacional.
En contra tiene el fuerte peso de los extremos y los datos atípicos (en ese caso es mejor
usar la mediana). Para evitarlo, en ocasiones se usa la media recortada.
3- MEDIA GEOMÉTRICA
Es la raíz N-ésima del producto de los valores elevados a su frecuencia:
k
x G = N x1n1 ⋅ x n22 ⋅ … ⋅ x knk = N
∏x
i=1
ni
i
ED 10
PROPIEDADES:
1) El logaritmo de la media geométrica es la media aritmética de los logaritmos de los

valores:
k
∑ ln(x ) ⋅ n i i
ln x G = i=1
N
Demostración:
k
k
n k ni k ∑ ln(x ) ⋅ n i i
ln x G = ln N ∏ x = ln ∏ x = ∑ i ln x i =
ni
i i
N i=1
i =1 i =1 i=1 N N
2) La media geométrica de las observaciones dividida por su media es uno:

n1 n2 nk
 x1   x 2   xk 
N
  ⋅   ⋅… ⋅   =1
 xG   xG   xG 
Demostración:
n1 n2 nn
 x1   x 2   xn  x1n1 ⋅ x n22 ⋅ … ⋅ x nkk N
x1n1 ⋅ x n22 ⋅ … ⋅ x knk xG
N
  ⋅  ⋅… ⋅   = N = = =1
 xG   xG   xG  x nG1 + n2 +…nk xG xG
3) Responde a cambios de escala (homogeneidad):

y i = ax i ⇒ y G = ax G
Demostración:
k k k k
∏y ∏ ( ax ) = N aN ∏ x ni i = a ⋅ N ∏ x ni i = ax G
ni
yG = N
ni
i = N
i
i =1 i =1 i =1 i =1
Se aplica fundamentalmente en Economía, sobre todo para promediar porcentajes, tasas,

números índice; es decir, variables acumulativas. Por ejemplo, para calcular una tasa de
interés media:
Cn = C 0 (1 + i1 )(1 + i2 ) … (1 + in ) = C0 (1 + i )n → i = n (1 + i1 )(1 + i2 ) … (1 + in ) − 1
Entre sus ventajas se encuentra que reduce la influencia de los extremos, tiene en cuenta
todas las observaciones, y se presta a cálculos posteriores.
En contra, que es laboriosa de calcular, y si los valores están próximos a cero, tiende a
cero.
ED 11
4- MEDIA ARMÓNICA
La media armónica se define cómo:
1 N
xH = k
= k
1 1
∑
i =1 x i
ni ∑
i=1 x i
ni
PROPIEDADES:
1) El inverso de la media armónica es la media aritmética de los inversos de los valores:

k
1
1
∑x
i=1
ni
= i
xH N
Demostración:
k
1
1 1
∑x i =1
ni
= = i
xH N N
k
1
∑
i =1 x
ni
i
2) Responde a cambios de escala (homogeneidad):

y i = ax i ⇒ y H = ax H
Demostración:
N N N N
yH = k
= k
= k
= a⋅ k = ax H
1 1 1 1 1
∑
i =1 y i
ni ∑
i =1 ax i
ni ⋅ ∑ n
a i=1 x i i
∑i =1 x i
ni
Usa todas las observaciones en su cálculo, y en algunas ocasiones es más representativa

que la media aritmética.
Por el contrario, se vuelve indeterminada cuando alguna observación es cero, y le influyen

mucho los valores pequeños.
5- MEDIA CUADRÁTICA
Se define como la raíz cuadrada de la media de los cuadrados de las observaciones
ponderadas por su frecuencia:
∑x 2
i ⋅ ni
xQ = i=1
ED 12
Cumple la propiedad de homogeneidad.
Se usa cuando no se quiere tener en cuenta el signo de los valores.
RELACIÓN ENTRE MEDIAS

Siempre se cumple la relación:
xH < x G < x < x Q
Demostración: por simplicidad, sean x1 y x2 dos valores de frecuencia unitaria:
x1 + x 2 2 x12 + x 22
x= ; x G = x1 x 2 ; xH = ; xQ =
2 1 1 2
+
x1 x 2
2 2x1 x 2
4x12 x 22 ≤ x1 x 2 ( x1 + x 2 ) ;
2
1º − x H ≤ x G ⇒ ≤ x1 x 2 ; ≤ x1 x 2 ;
1 1 x1 + x 2
+
x1 x 2
0 ≤ ( x1 − x 2 )
2
4x1 x 2 ≤ x12 + 2x1 x 2 + x 22 ; 0 ≤ x12 − 2x1 x 2 + x 22 ; → Se verifica siempre
( x + x2 )
2
x + x2
2º − x G ≤ x ⇒ x1 x 2 ≤ 1 ; x1 x 2 ≤ 1 ; 4x1 x 2 ≤ x12 + 2x1 x 2 + x 22 ;
2 4
0 ≤ ( x1 − x 2 )
2
0 ≤ x12 − 2x1 x 2 + x 22 ; → Se verifica siempre
( x1 + x 2 )
2
x + x2 x12 + x 22 x12 + x 22
3º − x ≤ x Q ⇒ 1 ≤ ; ≤ ; x12 + 2x1 x 2 + x 22 ≤ 2x12 + 2x 22 ;
2 2 4 2
0 ≤ ( x1 − x 2 )
2
0 ≤ x12 − 2x1 x 2 + x 22 ; → Se verifica siempre
ED 13
TEMA 3: MEDIDAS DE POSICIÓN
ROBUSTAS
Las medidas de posición robustas son las que están poco afectadas por los valores atípicos.
1- MEDIANA
Habiendo ordenado los valores observados de menor a mayor, el valor que ocupa la
posición central, es decir, que deja tantos valores por debajo como por encima, será la
mediana (Me). Lógicamente, su frecuencia absoluta es N/2.
CÁLCULO DE LA MEDIANA
• Datos desagregados: si el número total de observaciones, N, es impar, se toma el valor

N+1
central, es decir, el valor correspondiente a la frecuencia absoluta acumulada .
2
Cuando N es par, se toma como mediana la media aritmética entre los valores
N N+1
correspondientes a las frecuencias absolutas acumuladas y , ya que estos serían los
2 2
valores centrales.
• Datos agregados: cuando los datos están agrupados en clases, lo primero es identificar la
clase o intervalo mediano, que es en el que la frecuencia absoluta acumulada supera el valor
N
. Como se supone que los valores comprendidos en el intervalo mediano se distribuyen
2
uniformemente, entonces se interpola, quedando:
N
− Ni−1 0,5 − Fi−1
Me = L i−1 + 2 ⋅ c i = L i−1 + ⋅ ci
ni fi
donde L i−1 es el límite inferior del intervalo mediano y ci su amplitud.
PROPIEDAD: El sumatorio de las desviaciones absolutas respecto a un punto se hace

mínimo con la mediana:
n
min ∑x
i=1
i − p ni ⇒ p = Me
Demostración: sea una distribución de frecuencias unitarias. Si suponemos k > Me tal que
x1 ≤ x2 ≤ … ≤ xm−1 ≤ Me ≤ xm ≤ … ≤ xa−1 ≤ k ≤ xa ≤ … ≤ xn , entonces:
m −1 a −1
n n

∑x
i =1
i −k = ∑ (k − x ) + ∑ (k − x ) + ∑ ( x
i =1
i
i=m
i
i= a
i − k)


n m −1 a −1 n  Restándolas
∑ x i − Me = ∑ (Me − x i ) + ∑ ( x i − Me ) + ∑ ( x i − Me ) 
i =1 i =1 i=m i= a

n n m −1 a −1 n a −1
∑x
i =1
i − k − ∑ x i − Me =
i =1
∑ (k − Me ) + ∑ (k + Me − 2x ) + ∑ (Me − k )
i =1 i=m
i
i= a
Sumando y restando ∑ (k − Me )
i=m
ED 14
n n m −1 a −1 n a −1 a −1
∑x
i =1
i − k − ∑ x i − Me =
i =1
∑ (k − Me ) + ∑ (k + Me − 2x ) + ∑ (Me − k ) + ∑ (k − Me ) − ∑ (k − Me ) =
i =1 i=m
i
i= a i=m i=m
m −1 a −1 a −1 a −1
 n 
= ∑ ( k − Me ) + ∑ ( 2k − 2x i ) −  ∑ ( k − Me ) + ∑ ( k − Me )  = ( m − 1 )( k − Me ) − ( n − m )( k − Me ) + 2∑ ( k − x i )
i =1 i=m  i= a i=m  = m −1
i=m
n n a −1 n n
∑x i − k − ∑ x i − Me = 2∑ ( k − x i ) > 0 ⇒ ∑x i − k > ∑ x i − Me ∀k > Me

i =1 i =1 i=m i =1 i =1
Para k < Me (entonces x1 ≤ x2 ≤ … ≤ x a−1 ≤ k ≤ xa ≤ … ≤ xm−1 ≤ Me ≤ xm ≤ … ≤ xn ):

a −1 m −1
n n

∑x i − k = ∑ (k − x i ) + ∑ ( x i − k ) + ∑ ( xi − k )
i =1 i =1 i= a i=m 
n a −1 m −1 n  Restándolas
∑ x i − Me = ∑ (Me − x i ) + ∑ (Me − x i ) + ∑ ( x i − Me ) 
i =1 i =1 i= a i=m

n n a −1 m −1 n m −1
∑x i − k − ∑ x i − Me = ∑ ( k − Me ) + ∑ ( 2x i − k − Me ) + ∑ (Me − k ) Sumando y restando ∑ (k − Me )

i =1 i =1 i =1 i= a i=m i= a
n n a −1 m −1 n m −1 m −1
∑x i − k − ∑ x i − Me = ∑ ( k − Me ) + ∑ ( 2x i − k − Me ) + ∑ (Me − k ) + ∑ ( k − Me ) − ∑ ( k − Me ) =
i =1 i =1 i =1 i= a i=m i= a i= a
 a −1 m −1
 m −1 n m −1
=  ∑ ( k − Me ) + ∑ ( k − Me )  + ∑ ( 2x i − 2k ) − ∑ ( k − Me ) = ( m − 1)( k − Me ) − ( n − m )( k − Me ) + 2∑ ( x i − k )
 i=1 i= a  i= a i=m
= m −1
i= a
n n m −1 n n
∑x i − k − ∑ x i − Me = 2∑ ( x i − k ) > 0 ⇒ ∑x i − k > ∑ x i − Me ∀k < Me

i =1 i =1 i= a i =1 i =1
Responde a cambios de escala y de origen.
Entre sus ventajas está la facilidad para calcularla, aunque la principal es está poco
afectada por los valores extremos de la variable (cosa que no ocurría con la media)
Su mayor desventaja radica en que no se adapta a cálculos posteriores.
2- MODA
Es el valor de la variable más repetido, es decir, el de mayor frecuencia.
CÁLCULO DE LA MODA
• Datos desagregados: en este caso la identificación de la moda es inmediata. Se trataría

de la modalidad o valor con mayor frecuencia. También es muy fácil distinguirla en un
diagrama de barras, correspondiendo la moda al valor con la barra de mayor altura) o el
vértice más alto ante un polígono de frecuencias).
• Datos agregados: cuando los datos están agrupados en clases, primero debe identificarse
la clase o intervalo modal, que es el que tiene mayor altura en el histograma, es decir, el
 n
intervalo con mayor hi  = i  . Para calcular la moda, se tienen en cuenta las alturas de los
 ci 
intervalos anexos al modal, tendiendo hacia el más alto. De esta forma la distancia de la
ED 15
moda hacia los extremos es inversamente proporcional a las alturas de los intervalos anexos.
Así el cálculo quedaría:
hi+1
Mo = L i−1 + ⋅c
hi−1 + hi+1 i
donde L i−1 es el límite inferior del intervalo modal y ci su amplitud.
En el caso de que todos los intervalos tuvieran igual amplitud, se podría calcular
directamente con las frecuencias (absolutas o relativas):
ni+1 fi+1
Mo = L i−1 + ⋅ c i = L i−1 + ⋅c
ni−1 + ni+1 fi−1 + fi+1 i
Responde a cambios de escala y origen.
Es buena cuando hay mucha concentración. Es fácil de interpretar, y de calcular.
Entre sus desventajas está que no se presta a cálculos posteriores, y que puede no ser
única, lo que supone una falta de representatividad.
3- CUANTILES
Los cuantiles dividen la distribución de una población en “s” partes iguales, es decir, con
idéntica frecuencia, una vez ordenados de forma creciente.
Los más frecuentes son:
a) Cuartiles (Q1 , Q2 , Q3 ) : dividen la distribución en 4 partes, por lo que dejan el 25% de los
datos entre dos consecutivos.
b) Deciles (D1 ,D2 , … ,D8 ,D9 ) : dividen la distribución en 10 partes, por lo que dejan el 10%
de los datos entre dos consecutivos.
c) Percentiles (P1 ,P2 , … ,P98 ,P99 ) . dividen la distribución en 100 partes, por lo que dejan el
1% de los datos entre dos consecutivos.
CÁLCULO DE LOS CUANTILES
Al igual que con la mediana, se tomarán unos supuestos:

- se elegirá un valor que satisfaga la definición de cuantil, aunque no sea uno de la variable
- se asume que dentro de cada intervalo los valores se distribuyen uniformemente, por lo
que se podrá interpolar linealmente.
• Datos desagregados: para calcular la posición o rango del cuantil j-ésimo se aplica la
expresión:
N−1
R C j (s) = j ⋅ +1
s
ED 16
Si el resultado es un número entero, el valor que coincida con esa frecuencia será el
cuantil. Si no, se calcula la media aritmética entre los valores coincidentes con la frecuencia
sin decimales y la posterior.
• Datos agregados: cuando los datos están agrupados en clases, primero se identifica el
j⋅N
intervalo del cuantil, que será en el que se supere la frecuencia absoluta acumulada . Y
s
luego sólo queda interpolar:
j⋅N j
− Ni−1 − Fi−1
C j (s) = L i−1 + s ⋅ ci = L i−1 + s ⋅ ci j = 1,2,… , s − 1
ni fi
donde L i−1 es el límite inferior del intervalo del cuantil y ci su amplitud.
Lógicamente hay diferentes tipos de cuantiles que coinciden, siendo el caso más
importante:
Me = Q2 = D5 = P50
4- APLICACIONES
Para describir la tendencia central y elegir qué medida usar, debe tenerse en cuenta lo que
se busca, y la clase de datos que se tienen.
La media aritmética, centro de gravedad de la distribución, utiliza todas las observaciones,

por lo que es muy sensible a los datos atípicos. Sin embargo, cuando se manejan varias
muestras, es bastante estable. Es la mejor para usar en cálculos posteriores. Y no puede
calcularse cuando hay intervalos con extremos no definidos.
La mediana no maneja toda la información, pero no le influyen los datos atípicos. Es

apropiada para distribuciones muy asimétricas. Y también cuando los extremos de los
intervalos son abiertos.
La moda es la única medida posible para atributos nominales. Tampoco usa todos los
datos, ni su valor, sino sus frecuencias. Cuando no es única, pierde representatividad.
Ante distribuciones campaniformes simétricas, las tres medidas dan valores parecidos. Con
distribuciones fuertemente asimétricas, o con forma de “J” o “L”, la medida adecuada es la
mediana. Y con distr. en forma de “U”, ninguna es útil.
ED 17
TEMA 4: MEDIDAS DE DISPERSIÓN
Miden la representatividad de las medidas de posición, mayor cuanto menor sea la
dispersión.
Se dividen en absolutas (medidas en las mismas ud. que los datos), y en relativas (sin
ud.). Entre las primeras están los recorridos, la varianza, la desviación típica, las
desviaciones medias. Y entre las segundas, los coeficientes de variación, el recorrido
geométrico y el de Student,…
1- EL RECORRIDO
El recorrido más típico, también llamado rango o amplitud de variación, se define como la
diferencia entre el mayor y el menor valor:
R = x máx − x mín
Como defectos de esta medida destacan su gran sensibilidad a los datos extremos; que no
tiene en cuenta los valores intermedios; y que no es calculable cuando alguno de los
extremos es indeterminado.
Otros tipos de recorrido que intentan subsanar estas deficiencias:

• Intercuartílico: Q3 − Q1
• Interdecílico: D9 − D1
Q3 − Q1
• Semicuartílico:
2
x máx
• Geométrico:
x mín
x máx − x mín
• de Student:
σ
2- LA VARIANZA
Es la media aritmética de los cuadrados de las desviaciones de los datos respecto a la
media. Coincide con el momento central de segundo orden (m2). Por tanto, nos queda:
k
∑ (x i − x ) ⋅ ni
S = 2
x
i =1
N
PROPIEDADES:
1) Nunca es negativa: S2x ≥ 0

Demostración: es un promedio de cuadrados, por lo que nunca puede ser un número
negativo. Y se anulará si y sólo si x i − x = 0 ∀i , es decir, cuando X sea una constante.
ED 18
2) Responde a cambios de escala, pero no de origen:
Y = a ⋅ X + b ⇒ S 2y = a2 ⋅ S2x
Demostración:
k k k
∑ (y i − y)2 ⋅ ni ∑ (ax i + b/ − ax − b)
/ 2 ⋅ ni a2 ⋅ ∑ (x i − x)2 ⋅ ni
S2y = i =1
= i =1
= i =1
= a2 ⋅ S 2x
N N N
3) Coincide con la diferencia entre el momento ordinario de segundo grado y el cuadrado

de momento ordinario de primer orden:
S2x = a2 − a12
Demostración:
∑(x )
k k k k k
∑ (x − x ) ⋅ ni ∑x ⋅ ni − ∑ x i ⋅ ni + x 2 ∑ ni
2
i
2
i − 2x i x + x 2 ⋅ ni 2
i
S2x = i =1
= i =1
= i =1 i =1 i =1
=
N N N
k k
∑x 2
i ⋅ ni ∑x 2
i ⋅ ni
= i =1
− 2x + x =
2 2 i =1
− x 2 = a2 − a12
N N
4) Teorema de König: la media de los cuadrados de las desviaciones respecto de un

punto c es igual a la varianza más el cuadrado de la distancia entre la media y c:
k k
∑ ( x i − c ) ⋅ ni ∑ (x − x ) ⋅ ni
2 2
i
+ (x − c)
2
i=1
= i=1
N N
Demostración:
k k k
∑ (x − c ) ⋅ ni ∑ ( x − x ) − ( c − x )  ⋅ ni ∑ ( x − x ) − 2 ( x i − x )( c − x ) + ( c − x )  ⋅ ni
2 2 2 2
i i i

i =1
= i =1
= i =1
=
N N N
=0
k k k k
∑ ( xi − x ) 2 ( c − x ) ∑ ( x i − x ) ⋅ ni ( c − x ) ∑ ni ∑ ( x i − x )
2 2 2
⋅ ni ⋅ ni
+ (x − c)
2
= i =1
− i =1
+ i =1
= i =1
N N N N
Aprovechando esta última propiedad, al calcular es mucho más práctico usar esta otra
expresión:
k
∑x 2
i ⋅ ni
S = 2
x
i =1
− x2
N
Muy relacionada con esta medida se encuentra la cuasivarianza (usada en inferencia):
∑(x i − x ) ⋅ ni
N 2
S = 2 i=1
= S
c
N −1 N −1 x
ED 19
3- LA DESVIACIÓN TÍPICA
Para corregir el que la varianza está medida en unidades al cuadrado, se usa la desviación
típica, que es la raíz cuadrada positiva de la varianza:
k
∑(x i − x ) ⋅ ni
Sx = + S = + 2
x
i =1
PROPIEDADES:
1) Nunca es negativa: Sx ≥ 0
Demostración: por definición tiene que ser así, ya que es una raíz positiva.

Y = a ⋅ X + b ⇒ Sy = a ⋅ Sx
Demostración:
k k k
∑ (y i − y)2 ⋅ ni ∑ (ax i + b/ − ax − b)
/ 2 ⋅ ni a2 ⋅ ∑ (x i − x)2 ⋅ ni
Sy = i =1
= i =1
= i =1
= a2 ⋅ S 2x = a ⋅ S x
N N N
Al igual que la varianza, es bastante sensible a los datos atípicos
En distribuciones simétricas, como la normal, se cumple que los intervalos:

• (x − σ ; x + σ ) comprende el 68% de las observaciones
• ( x − 2σ ; x + 2σ ) comprende el 95% de las observaciones
• ( x − 3σ ; x + 3σ ) comprende el 99,7% de las observaciones
TIPIFICACIÓN DE UNA VARIABLE: una variable queda tipificada o estandarizada

cuando se la somete a una transformación tal que su media sea cero y su varianza uno. Esto
se logra con la transformación:
X−x
Z=
Sx
Demostración:
x−x S 2x
z= = 0 (propiedad 3 de la media aritmética) / S 2z = =1 (propiedad 2 de la varianza)
Sx S 2x
ED 20
4- OTRAS MEDIDAS
Entre las medidas absolutas aparte de las ya vistas, pueden destacarse las desviaciones:
k
∑x i − x ⋅ ni
• absoluta media respecto a la media: DM = i =1
N
k
∑x i − Me ⋅ ni
• absoluta media respecto a la mediana: DMe = i =1
Y en el grupo de las medidas relativas, las más importantes son los coeficientes de
variación, entre los que se encuentran:
Sx
• de Pearson: CV =
x
DMe
• mediano: CVMe =
Me
Q3 − Q1
• cuartílico: CVQ =
Q3 + Q1
ED 21
TEMA 5: MEDIDAS DE FORMA
1- MOMENTOS
Los momentos son unos promedios que sistematizan el estudio de las medidas de síntesis,
facilitando su cálculo y proveyéndolas de un contexto matemático.
Caracterizan hasta tal punto a una distribución, que dos distribuciones son iguales si todos
sus momentos lo son.
FACTORIALES
Se usan para variables discretas cuyos valores son números naturales:
k
xi !
∑ (x
i=1 − r)!
ni
vr = i
N
POTENCIALES
Son los más usados, y sirven tanto para variables discretas como para continuas.
El momento respecto al punto p de orden r se define como la media aritmética de las

diferencias entre las observaciones y p elevadas a r:
k
∑ (x i − p)r ⋅ ni
a′r = i=1
N
Esto es para un punto cualquiera, pero hay dos puntos especialmente importantes, y de ahí
que sus momentos tengan nombre específico.
a) RESPECTO AL ORIGEN U ORDINARIOS:

El punto p es el origen, es decir, cero, por lo que el momento queda:
k
∑x r
i ⋅ ni
ar = i=1
N
Los primeros momentos ordinarios son: a0 = 1 a1 = x
b) RESPECTO A LA MEDIA O CENTRALES:

En este caso el punto de referencia es la media, x :
k
∑ (x i − x)r ⋅ ni
mr = i=1
N
Los primeros momentos centrales son: m0 = 1 m1 = 0 m2 = S2x
ED 22
RELACIÓN ENTRE MOMENTOS ORDINARIOS Y CENTRALES:
Ambos tipos de momentos están íntimamente relacionados, y calculados unos, pueden

 r
k r  
hallarse los otros gracias al desarrollo del binomio de Newton ( a − b ) = ∑ ( −1 )   ar −k ⋅ bk  .
r
 k =0 k  
a) Cálculo de los momentos centrales con los ordinarios (lo usual):

r
r 
mr = ∑ (−1)r   ar −i ⋅ a1i
i= 0 i 
Demostración:
n n r
 r  r −k k r n
k  r  r −k
∑ ∑ ( −1 )  x i ⋅ x ⋅ ni ∑ ∑ ( −1)   x i ⋅ x ⋅ ni
k
∑ (x
k
i − x)r ⋅ ni
i= 0 k = 0 k
  k = 0 i= 0 k
 
mr = i=1 = = =
N N N
k r  k r 
r n r
∑ ( −1)   ⋅ x k ∑ x ri −k ⋅ ni ∑ ( −1)   ⋅ x k ⋅ ar −k r
k  k  r 
= ∑ (−1)r   ar −k ⋅ a1k
k =0 i= 0 k =0
= =
N N k =0 k 
Ejemplos:
• m2 = a2 − a12
• m3 = a3 − 3a2 ⋅ a1 + 2a13
• m4 = a4 − 4a3 ⋅ a1 + 6a2 ⋅ a12 − 3a14
b) Cálculo de los momentos ordinarios con los centrales:

r
r 
ar = ∑   mr −i ⋅ a1i
i =0  i 
Demostración:
n n r 
n r r n
r 
∑ xir ⋅ ni ∑ (x i − x + x)r ⋅ ni ∑ ∑ r −k
  (x i − x) ⋅ x ⋅ ni
k
k
∑ ∑  k  (x i − x)r −k ⋅ x k ⋅ ni
ar = i=1 = i=1 =
i = 0 k = 0   =
k =0 i= 0   =
N N N N
r
r  k n r
r  k
∑  
k =0  k 
⋅ x ∑ (x i − x) r −k
⋅ ni ∑   ⋅ x ⋅ mr −k
k =0  k 
r
r 
= ∑   mr −k ⋅ a1k
i= 0
= =
N N k =0  k 
PROPIEDAD: a los momentos ordinarios les afectan los cambios de origen y escala,
mientras que a los centrales sólo los de escala.
xi − b
Demostración: y i =
a
r
x −b
∑i  i a  ni 1 ∑ (x − b ) ni
r
i
- Ordinarios: ar =   = r i
n a n
r
 xi − b X − b 
∑ ∑ (x )
r
−  n − X ni
i  a a  i 1 i
- Centrales: mr = = r i
n a n
ED 23
CORRECCIÓN DE SHEPPARD
Cuando los datos están agrupados, se incurre en un error al suponer que los valores de
cada intervalo se concentran en la marca de clase. Esto no tiene importancia en los
momentos impares, pero sí en los pares. Estas correcciones son:
a2 a2 7a4
m2 = m2 − m4 = m4 − m2 +
12 2 240
donde m es el momento corregido, m el momento calculado, y a la amplitud de las clases.
2- MEDIDAS DE ASIMETRÍA
Estas medidas dan una idea de cómo se distribuye la frecuencia alrededor de la media. En
general se aplican a distribuciones campaniformes. Una distribución puede ser:
• Simétrica (Mo = Me = x ) : los valores por encima de la media tienen igual frecuencia
que los que están por debajo, es decir, que x y Me coinciden. Además, si la
distribución es unimodal, también la moda comparte el mismo valor.
• Asimétrica por la derecha (Mo < Me < x ) : tienen mayor frecuencia los valores por
debajo de la media. Suelen presentar una cola alargada hacia la derecha.
• Asimétrica por la izquierda ( x < Me < Mo ) : los valores por encima de la media tienen
mayor frecuencia. Suelen tener una cola alargada hacia la izquierda.
Asimétrica Asimétrica
Derecha Izquierda
COEFICIENTE DE ASIMETRÍA DE FISHER

Es la mejor medida de simetría. Su expresión es:
m3
g1 =
S 3x
Al igual que con todo el resto de medidas de simetría, su resulta indica:
• g1 < 0 ⇒ asimétrica a la izquierda
• g1 = 0 ⇒ simétrica
• g1 > 0 ⇒ asimétrica a la derecha
ED 24
PROPIEDAD: responde a cambios de escala pero no de origen.
xi − b
a
m3x
3 3
m3 y a m3x a
g1y = = a3 = ⋅ = ⋅ g1x
S3y  Sx 
3
a3 S 3x a3
 
 a 
OTROS COEFICIENTES DE ASIMETRÍA

x − Mo
1) Coef. de Pearson 1: Ap1 =
Sx
3(X − Me)
2) Coef. de Pearson 2: AP2 =
Sx
(Q3 − Me) − (Me − Q1 ) Q3 + Q1 − 2Me

3) Coef. de Bowley: AB = =
(Q3 − Me) + (Me − Q1 ) Q3 − Q1
Q3 + Q1 − 2Me
4) Coef. de Yule: AY =
2Me
k
∑ (x i − x)3 ni
5) Momento de orden 3: m3 = i=1
N
< 0 ⇒ Asimétrica por la izquierda


Todos indican lo mismo que el coeficiente de Fisher:  = 0 ⇒ Simétrica

 > 0 ⇒ Asimétrica por la derecha
3- MEDIDA DE CURTOSIS O APUNTAMIENTO

Es el grado de achatamiento o afilamiento del polígono o curva de frecuencias de una
distribución. Se mide comparando con distribuciones normales.
Esta medida es más eficaz cuanto más simétrica sea la distribución.
Una distribución puede ser:
• Leptocúrtica: si es más apuntada que la normal.

• Mesocúrtica: si tiene el mismo apuntamiento.
• Platicúrtica: si es más plana que la curva normal.
ED 25
Leptocúrtica
Mesocúrtica
Platicúrtica
COEFICIENTE DE CURTOSIS DE FISHER
Su expresión es:
m4
g2 = −3
S 4x
Según el resultado que dé, indicará:
• g2 > 0 ⇒ leptocúrtica
• g2 = 0 ⇒ mesocúrtica
• g2 < 0 ⇒ platicúrtica
PROPIEDAD: no responde a cambios de escala ni de origen.

xi − b
a
m4 x
m4 y a4 m4 x
g2y = = a4 = ⋅ = g2x
4 2
S y  S 2x  a4 S x4
 2
a 
ED 26
TEMA 6: MEDIDAS DE CONCENTRACIÓN
Tratan de cuantificar cómo se reparte la variable considerada, normalmente económica,
entre sus perceptores.
Para ello primero se ordenan las observaciones de menor a mayor, y se calculan las
siguientes frecuencias:
• Frecuencia relativa acumulada en porcentaje: pi = Fi × 100
∑x
j =1
j ⋅ nj
• Volumen de variable acumulada: qi = k
× 100
∑x
j =1
j
⋅ nj
PROPIEDAD: Al haber ordenado los datos de menor a mayor, siempre se cumplirá:

pi ≥ qi ∀i
Demostración: (Por reducción al absurdo) Se parte suponiendo pi < qi :

i k i
Ni
∑x
j =1
j ⋅ nj ∑x
j =1
j ⋅ nj ∑x
j =1
j ⋅ nj
pi < qi ; < k
; < ; x < xi
N N Ni
∑x
j =1
j ⋅ nj
Es decir, que la media de la variable es menor que la media de los i primeros intervalos, lo
que es absurdo debido a la ordenación ascendente.
1- CURVA DE LORENZ O DE CONCENTRACIÓN

Es una representación gráfica de pi y qi en un cuadrado. Siempre es convexa, y se dibuja
la diagonal como referencia, ya que representa la equidistribución. Los casos extremos son:
• Equidistribución: si todas las observaciones se repartieran la variable a partes

iguales, entonces la acumulación de frecuencia, pi , y de volumen de variable, qi ,
coincidirían para todos los intervalos. Es decir, todas sus combinaciones se
encontrarían en la diagonal.
• Máxima desigualdad: si en cambio toda la variable se acumulara en una única

observación, todas las qi serán cero hasta llegar a la última observación. Entonces
la cueva de Lorenz se representaría por los lados inferior y derecho del cuadrado.
Por tanto, cuanto más cerca está la curva de Lorenz de la diagonal, más equitativo es el
reparto.
ED 27
qi
q4
q3
Ac
q2
q1
p1 p2 p3 p4 pi
2- ÍNDICE DE GINI
Es el cociente entre el área de concentración ( A c , área entre la curva de Lorenz y la
diagonal) y el área del triángulo bajo la diagonal (0,5):
Ac i IG ≈ 0 → Equidad
IG = = 2 ⋅ Ac ; 0 ≤ IG ≤ 1 ; ⇒
1
2 i IG ≈ 1 → Desigualdad Total
Para hallar su expresión se calcula B, el área de los trapecios y el triángulo que quedan
bajo la curva de Lorenz:
qi
B
pi
fi
p 1 ⋅ q1 (p − p1 )( q + q1 ) + … + (p − p k −1 )( q + q k −1 ) = (pk − p i−1 ) (q + q ) = 1 k
∑ (q )
i −1
∑
2 2 k k i i
B= + i + q i−1 f i
2 2 2 i =1 2 2 i =1
donde p 0 = q 0 = 0
1  1 k
( ) ( )
k
ÍNDICE DE GINI EXACTO: IG = 2 ⋅  − B  = 1 − 2/ ⋅ ∑ q i + q i−1 f i = 1 − ∑ q i + q i−1 f i
2  2/ i=1 i =1
ED 28
Normalmente a la hora de calcular este índice se usa otra expresión que aproxima su
resultado al anterior:
k −1
∑ (p i − qi )
ÍNDICE DE GINI APROXIMADO PARA CÁLCULOS: I′G = i=1
k −1
∑p
i=1
i
3- OTROS INDICADORES
MEDIALA
Es el valor de la distribución que la divide de tal forma que la suma de los valores de los
individuos que toman ese valor o menores es igual a la de los valores de los individuos con
valores mayores
Se calcula como la mediana, interpolando en el intervalo medial:
0,5 − qi−1
Ml = L i−1 + ⋅ ci
qi − qi−1
donde L i−1 es el límite inferior del intervalo medial y ci su amplitud.
COEFICIENTE DE THEIL
Sólo puede usarse con datos positivos, aunque tiene la ventaja de que no hay que ordenar
los datos.
N
xi x
T = logN + ∑ ⋅ log i
i=1 Nx Nx
En el caso de que hubiera equidistribución, T = 0 :

N
x x N
1 1 N/ 1
xi = x ∀i ⇒ T = logN + ∑ ⋅ log = logN + ∑ ⋅ log = logN + log = logN − logN = 0
i =1 Nx Nx i =1 N N N/ N
Y se concentrara en un único individuo, T = logN :
xi = 0 ∀i ≠ N  Nx Nx
 ⇒ T = logN + ⋅ log = logN
x N = Nx  Nx Nx
Para poder comparar distintas distribuciones, se usa el índice de Theil relativo, que está
acotado entre 0 y 1:
T
TR =
logN
ED 29
TEMA 7: INTERPOLACIÓN
1- CONCEPTO
Es el proceso de cálculo del valor de una variable, Y, correspondiente al de otra variable, X,
comprendido entre dos consecutivos de la sucesión x1 , x 2 , … , x n , que tiene sus
correspondientes y1 , y 2 , … , y n .
Los pares (x i , y i ) , puntos aislados, determinan una función. Si no está determinada, la

interpolación se basa en el principio de continuidad, haciendo pasar una curva por los puntos
conocidos, y atribuyendo a los otros las coordenadas de ésta.
Si el valor de X a interpolar, x 0 , cumple x 0 < x1 o x 0 > x n , entonces se llama extrapolación,

al estar fuera del campo de variación de X.
Se supone que X e Y no son indep., por tanto, Y = f(X) , función a la que pertenecen todos
los pares (x i , y i ) . Puede haber varias función que lo cumplan, por lo que debe elegirse la más
sencilla, llamada función de interpolación.
2- INTERPOLACIÓN LINEAL Y PARABÓLICA
La interpolación polinómica obtiene los valores a partir de la ecuación de un polinomio de

grado n − 1 que pasa por los n puntos conocidos de la sucesión:
y = a0 + a1 x + a2 x 2 + ……… + an −1 x n −1
Los cocientes se obtienen del sistema de n ecuaciones con n incógnitas creado con los n
puntos:
 y1 = a0 + a1 x1 + a2 x12 + …… + an−1 x1n−1

 n−1
 y 2 = a0 + a1 x 2 + a2 x 2 + …… + an−1 x 2
2

 …………
 y = a + a x + a x 2 + …… + a x n−1
 n 0 1 n 2 n n−1 n
Expresado de forma matricial:
 y1   1 x 1 x12 … x1n−1   a0 
     
 y 2  = 1 x 2 x 22 … x n2−1   a1 
⋅ ⇒ Y = ∆×A
 ⋮  ⋮ ⋮ ⋮ … ⋮   ⋮ 
     
y 
 n  1 x n x n2 … x nn−1   an−1 
Si el sistema es compatible y determinado, la solución será única. Para ello el determinante

de ∆ no debe ser nulo:
ED 30
1 x1 x12 … x1n−1
1 x2 x 22 … x n2−1
∆ = ≠0
… … … … …
1 xn x n2 … x nn−1
Si hay puntos repetidos, deben eliminarse, ya que anulan ∆ .
Si se cumple esto, los coeficientes se calculan:

A = ∆ −1 × Y
INTERPOLACIÓN LINEAL
Es el caso particular de la interpolación polinómica cuando n − 1 = 1 , es decir, cuando se

tienen dos puntos. En este caso la función de interpolación es una recta, y = a + bx , que
debe pasar por ambos puntos, (x1 , y1 ) y (x 2 , y 2 ) . Distintas formas para hallar a y b:
y1 = a + bx1 
a) 
y 2 = a + bx 2 
y − y1 x − x1
b) =
y 2 − y1 x 2 − x1
x y 1
c) x1 y1 1 = 0
x2 y2 1
INTERPOLACIÓN PARABÓLICA
En esta ocasión se tienen tres puntos, por lo que n − 1 = 2 , y la función de interpolación es

una parábola, y = a + bx + cx 2 . Aplicando la solución general:
−1
 a0   1 x1 x12   y1 
     
A = ∆ −1 × Y ⇒  a1  =  1 x 2 x 22  ⋅  y 2 
 a  1 x x 23   y 3 
 2  3
3- INTERPOLACIÓN POR APROXIMACIONES SUCESIVAS

Este método evita el tener que resolver el sistema de ecuación cada vez que se reciba
información suplementaria, es decir, otro punto (x1 , y1 ) . Partiendo de dos puntos:
y − y1 x − x1 y − y1
= → y = y1 + 2 (x − x1 )
y 2 − y 1 x 2 − x1 x 2 − x1
ED 31
Sea (x 3 , y 3 ) un nuevo punto. Si se verifica la anterior ec., la interpolatriz no cambiaría, pero
si no, la nueva debería ser una parábola de 2º grado, quedando:
y 2 − y1
y = y1 + (x − x1 ) + A 2 (x − x1 )(x − x 2 )
x 2 − x1
Para (x1 , y1 ) y (x 2 , y 2 ) se anula el nuevo término, por lo que la verifican. Para calcular A 2
se sustituye para (x 3 , y 3 ) :
y 2 − y1
y 3 = y1 + (x − x1 ) + A 2 (x 3 − x1 )(x 3 − x 2 )
x 2 − x1
Una vez calculado A 2 , se puede operar para hallar la parábola: y = a0 + a1 x + a2 x 2
Si se añadiera un nuevo punto (x 4 , y 4 ) , el proceso sería análogo:
y = a0 + a1 x + a2 x 2 + A 3 (x − x1 )(x − x 2 )(x − x 3 )
Sustituyendo por el nuevo punto:
y 4 = a0 + a1 x 4 + a2 x 24 + A 3 (x 4 − x1 )(x 4 − x 2 )(x 4 − x 3 ) → Valor de

A3 ⇒
y = b0 + b1 x + b2 x 2 + b3 x 3
El proceso puede iterarse todas las veces que sea necesario.
4- MÉTODO DE LAGRANGE
Sean n puntos (x1 , y1 ), (x 2 , y 2 ), …… , (x n , y n ) . La fórmula de interpolación de Lagrange viene
dada por la expresión:
(x − x 2 )(x − x 3 ) …… (x − x n ) (x − x1 )(x − x 3 ) …… (x − x n )
y = y1 + y2 +…
(x1 − x 2 )(x1 − x 3 ) …… (x1 − x n ) (x 2 − x1 )(x 2 − x 3 ) …… (x 2 − x n )
 n x − x

(x − x1 )(x − x 2 ) …… (x − x n−1 ) n
 j 
… + yn = ∑ yi ⋅ ∏
(x n − x1 )(x n − x 2 ) …… (x n − x n−1 ) i=1  
j =1 x i − x j 
 j ≠ i 
Se puede comprobar que se cumple para cada punto, por ej. (x 2 , y 2 ) :
(x 2 − x1 )(x 2 − x 3 ) …… (x 2 − x n )
Para x = x 2 → y = y1 ⋅ 0 + y 2 + ……… + y n ⋅ 0 = y 2
(x 2 − x1 )(x 2 − x 3 ) …… (x 2 − x n )
ED 32
TEMA 8: DISTRIBUCIONES
BIDIMENSIONALES I
Si en una misma población se miden dos características, se obtienen dos series estadísticas
de ambas variables, X e Y. Si se consideran simultáneamente, es decir, pares de valores
(x i , y i ) , se está ante una variable estadística bidimensional.
Pueden estudiarse por separado las distribuciones de la población dependiendo del carácter
X o el Y, y resumirlas (X, S X , Y, S Y , …) ; pero es interesante considerarlas simultáneamente
para estudiar su interrelación, si existe, y su intensidad.
1- TABLAS DE DOBLE ENTRADA Y DE CONTINGENCIA

Sean X e Y dos caracteres de una población con k y p valores o modalidades
respectivamente. La distribución conjuntas se representa por (x i , y j ,nij ) , donde x i es el i-
ésimo valor de X, y j el j-ésimo de Y, y nij la frecuencia absoluta conjunta de esos valores.
Esto puede disponerse en tablas de correlación, que son tablas de doble entrada. Si la
distribución bidimensional es de atributos, entonces se denomina tabla de contingencia.
Y
y1 y2 … yj … yp ni·
X
x1 n11 n21 … n1j … n1p n1·
x2 n21 n22 … n2j … n2p n2·
… … … … … … …
xi ni1 ni2 … nij … nip ni·
… … … … … … …
xk nk1 nk2 … nkj … nkp nk·
n·j n·1 n·2 … n·j … n·p N
La última fila y la última columna representan las distribuciones marginales de cada una de
las variables:
p 
n i• = ∑ n ij 
j =1  k p
k
 ∑ ni• = ∑ n• j = N
n • j = ∑ n ij  i =1 j =1
i =1

ni• k n• j h h k
fi• = = ∑ fij ; f• j = = ∑ fij ; ∑ fi• = ∑ f• j = 1
N j =1 N i =1 i =1 j =1
ED 33
2- REPRESENTACIONES GRÁFICAS
Al igual que en las distribuciones unimodales, dependiendo del tipo de datos, hay distintas
clases de gráficos.
1- CARACTERES CUALITATIVOS (A Y B):
a) Diagrama de rectángulos apilados: representan en un mismo gráfico la distribución

 
relativa global y una familia de distribuciones condicionadas  A o B  . Cada
 Bi Ai 
rectángulo representa una modalidad del carácter condicionante. Su base es
proporcional a n• j , y la altura se divide en proporción a las frecuencias
condicionadas, fi j . Por tanto, el área de cada figura que compone el rectángulo es
nij = n• j ⋅ fi j
b) Diagrama de barras independientes: se escoge un carácter, y para cada modalidad

suya se construye un diagrama de barras con el resto de caracteres.
2- CARACTERES CUALITATIVO Y CUANTITATIVO (A Y X):
Se usan los mismos gráficos que para dos caracteres cualitativos.
ED 34
3- CARACTERES CUANTITATIVOS (X E Y):
Además de los dos tipos de gráficos anteriores, se dispone de:
a) Diagrama de puntos o nube de dispersión: cada par de valores se representa por un

punto en un espacio euclídeo bidimensional. Si los datos están agrupados se
representan las marcas de clase. En el caso de que algún par de valores se repita,
entonces la frecuencia absoluta se muestra con el área del punto.
b) Diagrama de rectángulos apilados: es exactamente igual que en los casos

anteriores.
c) Estereograma o histograma en tres dimensiones: está constituido por

paralelepípedos cuyo volumen representan la frecuencia, ya que los lados de la base
son las amplitudes de los intervalos para cada variable, y la altura coincide con
nij
hij =
(L i − L i−1 )(L j − L j−1 )
Este gráfico tiene dos desventajas> una su complicada realización (perspectiva
caballera), y la otra que hay prismas que quedan ocultos detrás de otros.
ED 35
4- SERIES CRONOLÓGICAS:
a) Representación cartesiana: en el eje de abscisas siempre se coloca el tiempo, y en

el de ordenadas, la otra variable. Se unen los puntos mediante rectas. Pueden
representarse varias series temporales en un mismo gráfico.
b) Representación polar: para variables estacionales, es útil dividir el plano con

radiovectores de tal forma que cada uno represente un mes (o el periodo temporal
correspondiente). Así pueden observarse las variaciones a lo largo del año.
ED 36
BIDIMENSIONALES II
A lo largo de todo el tema se van a suponer dos caracteres, X e Y, con k y p modalidades
respectivamente.
1- DISTRIBUCIONES MARGINALES Y CONDICIONADAS

DISTRIBUCIONES MARGINALES
A partir de los datos de una tabla de doble entrada de una variable bidimensional pueden
calcularse las distribuciones unidimensionales de las variables que la componen. A éstas se
las conoce como distribuciones marginales. Simplemente se trata de sumar las frecuencias
por filas o columnas, ya que corresponden a un único valor de la variable X (filas) o Y
(columnas).
p 
Distribución marginal X: n i• = ∑ n ij 
j =1  k p
k
 ∑ n i• = ∑ n • j = N
n • j = ∑ n ij 
i =1 j =1
Distribución marginal Y :
i =1

Para frecuencias relativas:

p n i• k n •j k p
fi• = ∑ fij = / f• j = ∑ fij = / ∑ fi• = ∑ f• j = 1
j =1 N i =1 N i =1 j =1
A partir de las distribuciones marginales se pueden calcular los estadísticos ya vistos para
cada una de las variables.
DISTRIBUCIONES CONDICIONADAS
Describen la distribución de una variable para la subpoblación que cumple una condición en
el otro carácter. Por ejemplo, la distribución condicionada de X por la modalidad ‘j’ de Y
X 
 Y =y  :
 j 
n ij
f ij = ∀i = 1,… ,k
n •j
 
Es análogo para Y condicionado por X = x i  Y :
 X = xi 
n ij
fji = ∀j = 1,… ,p
n i•
ED 37
La condición puede coincidir con una modalidad de la variable condicionante, o abarcar
varias (por ejemplo usando > o <).
Con ambos tipos de distribución, se llega a la relación:

n ij n i• n ij n • j n ij
= ⋅ = ⋅ ⇔ f ij = f i• ⋅ fji = f • j ⋅ f ij
N N n i• N n •j
2- INDEPENDENCIA Y ASOCIACIÓN DE DOS VARIABLES

INDEPENDENCIA
Dos variables, X e Y, son independientes si las variaciones de una no afectan a la otra. De

una forma más formal:
X e Y son independientes si y sólo si las distribuciones condicionadas de X (Y) por cada
modalidad de Y (X) son idénticas entre sí, e iguales a la distribución marginal de X (Y).
n i1 n i2 n ip n i• n ij n i• 
= =…= = → = ∀i, j 
n •1 n •2 n •p N n •j N  n i• × n • j
 ⇔ n ij = ⇔ f ij = f i• × f • j
n 1j n 2j n kj n •j n ij n •j  N
= =…= = → = ∀i, j
n 1• n 2• n k• N n i• N 
Es indiferente cual de las dos formas elegir, ya que la independencia es una propiedad
recíproca, es decir, que si se demuestra que X es independiente de Y, entonces queda
demostrado que Y también lo es respecto de X.
DEPENDENCIA FUNCIONAL
X depende funcionalmente de Y si a cada modalidad de Y le corresponde una única

modalidad de X. Es decir, para todo j, la frecuencia absoluta nij es cero excepto para un valor
i, en el que nij = n• j .
A efectos prácticos, esto significa que sabiendo la modalidad de Y a la que pertenece una
observación, podemos predecir con total seguridad la modalidad para la variable X.
A diferencia de la independencia, la dependencia funcional no tiene por qué ser recíproca
COEFICIENTES DE ASOCIACIÓN
Los anteriores eran los dos casos extremos. Cuando el grado de dependencia no es
expresable con una aplicación, como ocurre con la funcional, se trata de dependencia
estadística, y puede medirse su fuerza con distintos coeficientes.
Con caracteres cuantitativos, lo normal es usar el coeficiente de correlación de Pearson,

que se verá en el tema 10.
ED 38
Los atributos tienen sus propias medidas:
a) COEFICIENTE RHO DE CORRELACIÓN POR RANGOS DE SPEARMAN: se usa para

comparar rangos, es decir, para ordenaciones. Coincide con el coeficiente de
correlación lineal, pero en el caso de ordenaciones. Varía entre -1 y 1, siendo 0 el
resultado en caso de independencia entre las variables.
N
6 ∑ d i2
ρ =1− i=1
donde di = x i − y i ∀i
N3 − N
−1 ≤ ρ ≤ 1 ρ = 0 ⇒ Indep.
b) COEFICIENTE DE ASOCIACIÓN H: se usa para tablas 2x2. Parte de la condición de

independencia. Cuando valga 0, los atributos serán independientes. Si no, el signo
indica el tipo de asociación entre los atributos. Tiene el inconveniente de no estar
acotado, por lo que no se pueden hacer comparaciones.
n 1• ⋅ n •1 n 11 ⋅ n 22 − n 12 ⋅ n 21
H = n11 − =
N N
−∞ < H < ∞ H = 0 ⇒ Indep.
c) COEFICIENTE DE ASOCIACIÓN Q DE YULE: para evitar el inconveniente del anterior

coeficiente, Yule propuso modificarlo de tal forma que el coeficiente varíe entre -1 y 1,
siendo 0 el resultado en caso de independencia entre los atributos.
N⋅H n n − n12n21
Q= = 11 22
n11n22 + n12n21 n11n22 + n12n21
−1 ≤ Q ≤ 1 Q = 0 ⇒ Indep.
d) COEFICIENTE DE CONTINGENCIA χ2: compara las frecuencias observadas con las

teóricas si los atributos fueran independientes. A partir de él se calcula el Cuadrado
medio de la contingencia (ϕ ) .
2
Ambos dan 0 en caso de independencia, y no están
acotados.
k p (n′ij × nij )2 χ2 ni• ⋅ n• j

χ2 = ∑ ∑ ϕ2 = donde nij′ = ∀i, ji
i=1 j=1 nij N N
χ2 ≤ 0 χ 2 = 0 ⇒ Indep.
ϕ2 ≤ 0 ϕ 2 = 0 ⇒ Indep.
ED 39
e) COEFICIENTE DE CONTINGENCIA C DE PEARSON: corrige el defecto de los anteriores,
al estar acotado entre 0 y 1. Lo malo es que nunca llega a ser 1, excepto con infinitas
modalidades.
χ2 ϕ2
C= =
N + χ2 N + ϕ2
1
0 ≤ C ≤ 1− / min ( k,p ) ≥ 2. C = 0 ⇒ Indep.
min ( k,p )
f) COEFICIENTE T DE TSCHUPROW: una vez más es una mejora del anterior, ya que
incluye el número de filas y de columnas.
χ2 ϕ2
T2 = =
N ⋅ (k − 1)(p − 1) (k − 1)(p − 1)
0 ≤ T2 ≤ 1 T 2 = 0 ⇒ Indep.
ED 40
BIDIMENSIONALES III
1- MOMENTOS
Su significado es el mismo que para las distribuciones univariables.
Sean X e Y dos variables con k y p valores respectivamente.
En general, el momento de orden (r, s) respecto a los puntos c y d se define como la media
aritmética de los productos de las diferencias entre las observaciones de X y c elevadas a r, y
las diferencias entre las observaciones de Y y d elevadas a s:
k p nij
a′rs = ∑ ∑ (x i − b)r ⋅ (y j − d)s ⋅
i =1 j=1 N
ORDINARIOS
El punto de referencia es el origen, es decir, c = d = 0 .
k p n ij
ars = ∑ ∑ x ir ⋅ y sj ⋅
i =1 j=1 N
Si uno de los órdenes se hace cero, se hallan los momentos de la distribución marginal de
la otra variable:
k p n ij k n i•
r = 1; s = 0 ⇒ a10 = ∑ ∑ x i ⋅ = ∑ xi ⋅ =x
i =1 j =1 N i =1 N
k p n ij p n •j
r = 0; s = 1 ⇒ a01 = ∑ ∑ y j ⋅ = ∑ yj ⋅ =y
i =1 j =1 N j =1 N
Otros casos particulares bastante usados son los de orden (2,0) y (0,2) para calcular las
varianzas; y el de orden (1,1), llamado momento producto, para la covarianza:
k n i• p n •j k p n ij
a20 = ∑ x i2 ⋅ a02 = ∑ y 2j ⋅ a11 = ∑ ∑ x i y j
i =1 N j =1 N i =1 j =1 N
CENTRALES
Estos se referencian respecto a las medias aritméticas de las variables.
k p n ij
mrs = ∑ ∑ (x i − x)r (y j − y)s ⋅
i =1 j=1 N
ED 41
Como en el caso ordinario, si un orden se hace cero, aparecen los momentos de la
distribución marginal de la otra variable, destacando las varianzas:
k p n ij k n i•
m10 = ∑ ∑ (x i − x) ⋅ = ∑ (x i − x) ⋅ =0
i =1 j =1 N i =1 N
k p n ij p n •j
m01 = ∑ ∑ (y j − y) ⋅ = ∑ (y j − y) ⋅ =0
i =1 j =1 N j =1 N
k p n ij k n i•
m20 = ∑ ∑ (x i − x)2 ⋅ = ∑ (x i − x)2 ⋅ = S 2x
i =1 j =1 N i =1 N
k p n ij p n •j
m02 = ∑ ∑ (y j − y)2 ⋅ = ∑ (y j − y)2 ⋅ = S 2y
i =1 j =1 N j =1 N
También destaca la covarianza:

k p n ij
m11 = ∑ ∑ (x i − x) ⋅ (y j − y) ⋅ = S XY
i =1 j =1 N
RELACIÓN ENTRE MOMENTOS ORDINARIOS Y CENTRALES:
S2x = m20 = a20 − a10

2
S 2y = m02 = a02 − a201 S xy = m11 = a11 − a10 ⋅ a01
Demostración:
k p n ij k n i• k n i•
S2x = m20 = ∑ ∑ (x i − a10 )2 ⋅ = ∑ (x i − a10 )2 ⋅ = ∑ (x i2 − 2x i ⋅ a10 + a10
2
)⋅ =
i =1 j =1 N i =1 N i =1 N
k n i• k n i• k n i•
= ∑ x 2i ⋅ − 2a10 ⋅ ∑ x i ⋅ + a10
2
⋅∑ = a20 − 2a10 ⋅ a10 + a10
2
= a20 − a10
2
i =1 N i =1 N i =1 N
k p n ij p n •j p n •j
S2y = m02 = ∑ ∑ (y j − a01 )2 ⋅ = ∑ (y j − a01 )2 ⋅ = ∑ (y 2j − 2y j ⋅ a01 + a201 ) ⋅ =
i =1 j =1 N j =1 N j =1 N
p n •j p n •j p n •j
= ∑ y 2j ⋅ − 2a01 ⋅ ∑ y j ⋅ + a201 ⋅ ∑ = a02 − 2a01 ⋅ a01 + a201 = a02 − a201
j =1 N j =1 N j =1 N
k p n ij k p n ij k p n ij
S xy = m11 = ∑ ∑ (x i − a10 ) ⋅ (y j − a01 ) ⋅ = ∑ ∑ (x i ⋅ y j − x i ⋅ a01 − a10 ⋅ y j + a10 ⋅ a01 ) ⋅ = ∑ ∑ xi ⋅ y j ⋅ −
i =1 j =1 N i =1 j =1 N i =1 j =1 N
k n i• p n •j k p n ij
−a01 ⋅ ∑ x i ⋅ − a10 ⋅ ∑ y j ⋅ + a10 ⋅ a01 ⋅ ∑ ∑ = a11 − a10 ⋅ a01 − a10 ⋅ a01 + a10 ⋅ a01 = a11 − a10 ⋅ a01
i =1 N j =1 N i =1 j =1 N
CÁLCULO ABREVIADO: con objeto de facilitar el cálculo práctico, frecuentemente es

conveniente hacer cambios de escala y/u origen para facilitar cálculos:
xi − Ox
x i′ =
cx x = c x ⋅ x′ + Ox ; S2x = c 2x ⋅ S2x ′ ;
S xy = c x ⋅ c y ⋅ S x ′y ′
y j − Oy y = c y ⋅ y′ + O y ; S2y = c 2y ⋅ S2y ′ ;
y ′j =
cy
ED 42
2- COVARIANZA
Es una medida de asociación lineal entre dos variables. Coincide con el momento central de
primer orden para ambas variables. Su signo indica si la relación entre las variables es
positiva o negativa. Su expresión es:
k p
∑ ∑ (x i − x)(y j − y) ⋅ n ij
i=1 j=1
S xy = = m11
N
Dependiendo de su resultado, se sacan las conclusiones:

i S xy < 0 ⇒ Re lación inversa
i S xy = 0 ⇒ ∃/ Re lación lineal
i S xy > 0 ⇒ Re lación directa
PROPIEDADES:
1) La covarianza de una variable consigo misma es su varianza:

S xx = S 2x
Demostración:
k p n ij k n i•
S xx = ∑ ∑ (x i − a10 ) ⋅ (x i − a10 ) ⋅ = ∑ (x i − a10 )2 ⋅ = S2x
i =1 j =1 N i =1 N
x ′ = ax ± b 
 ⇒ S x ′y ′ = a ⋅ c ⋅ S xy
y ′ = cy ± d 
Demostración:
k p n ij k p n ij
S x ′y ′ = ∑ ∑ (x i′ − x ′) ⋅ (y ′j − y ′) ⋅ = ∑ ∑ (ax i ± b/ − ax ± b)
/ ⋅ (cy j ± d/ − cy ± d)
/ ⋅ =
i =1 j =1 N i=1 j =1 N
k p n ij k p n ij
∑ ∑ a(x
i =1 j =1
i − x) ⋅ c(y j − y) ⋅
N
= a ⋅ c ⋅ ∑ ∑ (x i − x)(y j − y) ⋅
i =1 j =1 N
= a ⋅ c ⋅ S xy
3) S xy = a11 − a10 ⋅ a01 :

Demostración: ya quedó demostrado en el apartado anterior.
4) A y B independientes ⇒ S xy = 0 ¡Pero no lo contrario!
Demostración: si A y B independientes
n ij n i• n • j
= ⋅ ⇒ a11 = a10 ⋅ a01 ⇒ S xy = m11 = a11 − a10 ⋅ a01 = 0
N N N
ED 43
3- CORRELACIÓN
Es el grado de dependencia existente entre dos variables. Si este grado es alto, puede
realizarse un ajuste lineal.
El coeficiente de correlación más usado es el de Pearson:

Sxy
rxy =
Sx Sy
−1 ≤ rxy ≤ 1
Éste representa una mejora respecto a la covarianza, ya que está acotado entre -1 y 1, por
lo que muestra el grado de dependencia.
Según su valor, se deduce:

• rxy < 0 ⇔ S xy < 0 ⇒ Re lación lineal decrec.
• rxy = 0 ⇔ S xy = 0 ⇒ ∃/ lineal decrec.
• rxy > 0 ⇔ S xy > 0 ⇒ Re lación lineal crec.
PROPIEDADES:
1) No varía ante cambios de escala (del mismo signo) ni de origen:
x ′ = ax ± b  a, c > 0
 ⇒ rx ′y ′ = rxy / 
y ′ = cy ± d  a, c < 0
Demostración:
S x ′y ′ a/ ⋅ c/ ⋅ S xy S xy
rx ′y ′ = = = = rxy
Sx′ ⋅ Sy′ a/ ⋅ S x ⋅ c/ ⋅ S y Sx ⋅ Sy
2) A y B independientes ⇒ rxy = 0
Demostración: si A y B independientes
S xy 0
S xy = 0 ⇒ rxy = = =0
Sx ⋅ Sy Sx ⋅ Sy
ED 44
N-DIMENSIONALES I
1- DISTRIBUCIONES N-DIMENSIONALES
Es una generalización de las distribuciones bidimensionales.
En este caso se tienen n series estadísticas, es decir, n variables ( x1 , x2 , … , xn ) , cada una

con k1 ,k 2 , … ,kn valores. Si se consideran simultáneamente se obtiene una variable
estadística n-dimensional. Por tanto cada observación queda caracterizada por un vector n-
dimensional cuyas componentes son los valores para cada una de esas variables:
Observación i − ésima → ( x1i , x2i , … , xni )

La distribución n-dimensional quedará representada por el vector de valores y su
frecuencia absoluta:
x 1i , x 2 j , … , x nl ,n ij…l( )
Familia de frecuencias de una distribución n-dimensional:
• Frecuencia absoluta (nij···l): veces que aparece conjuntamente un grupo de valores.

k1 k2 kn
∑ ∑… ∑ n
i =1 j =1 l =1
ij…l
=N
• Frecuencia relativa (fij···l): proporción de individuos con un un grupo de valores.

k1 k2 kn k1 k2 kn
n ij…l
∑ ∑ … ∑ f ij…l =
i =1 j =1 l =1
∑ ∑… ∑
i =1 j =1 l =1 N
=1
• Frecuencia absoluta acumulada (Nij···l):

i j l
Nij...l = ∑ ∑… ∑ n
u =1 v =1 z =1
uv…z
Nk1k2 ...kn = N
• Frecuencia relativa acumulada (Fij···l):

Nij...l i j l i j l n uv…z
Fij...l =
N
= ∑ ∑ … ∑ f uv…z =
u =1 v =1 z =1
∑ ∑… ∑
u =1 v =1 z =1 N
Fk1k2 ...kn = 1
ED 45
2- DISTRIBUCIONES MARGINALES Y CONDICIONADAS
Sean n caracteres x1 , x2 , … , xn , con k1 ,k 2 , … ,kn modalidades:
DISTRIBUCIONES MARGINALES
Cuando se trata de variables n-dimensionales, hay varias clases de distribuciones
marginales, dependiendo del subconjunto de variables que se escoja.
Existen desde las distribuciones marginales de n-1 dimensiones hasta las unidimensionales
(en las que se suman las frecuencias de todas menos una variable, por lo que en este caso
se estaría ante la distribución marginal de una variable individual):
• n-1 dimensional: sólo se suman las frecuencias de una única variable, por lo que
quedan n-1 variables. Hay n distribuciones marginales de este tamaño.
Distribución Marginal de ( x1 , … , xm−1 , xm+1 … , xn ) :

km
ni…r • t…l
ni…r • t…l = ∑ ni…rst…l ; fi…r • t…l =
s =1 N
∀i = 1, … ,k1;…………… ; ∀r = 1, … ,km−1; ∀t = 1, … ,km+1;…………… ; ∀l = 1, … kn
n 
• n-2 dimensional: se suman las frecuencias de dos variables. Hay   distribuciones
2
marginales de este tipo.
(
Distribución Marginal de x1 , … , xm−1 , xm+1 , … , xp −1 , xp +1 , … , xn : )
k m kp
ni…r •t…a•c…l
ni…r • t…a•c…l = ∑ ∑ ni…rst…abc…l ; fi…r • t…a•c…l =
s =1 b =1 N
∀i = 1, … ,k1;…… ; ∀r = 1, … ,k m−1; ∀t = 1, … ,km+1;…… ; ∀a = 1, … ,kp−1; ∀c = 1, … ,kp +1;…… ; ∀l = 1, … kn
• …………………………………………………...
 n 
• bidimensional: se suman las frecuencias de n-2 variables. Hay   distribuciones
n − 2 
marginales de esta clase.
(
Distribución Marginal de xm , xp : )
k1 km−1 km+1 kp −1 kp +1 kn
n•…•s•…•b •…•
n•…•s•…•b•…• = ∑ … ∑ ∑ … ∑ ∑ … ∑ ni…rst…abc…l ; f•…•s•…•b •…• =
i=1 r =1 t =1 a =1 c =1 l =1 N
∀s = 1, … ,k m; ∀b = 1, … ,kp
ED 46
• unidimensional: se suman las frecuencias de todas las variables excepto una. Éstas
coinciden con las distribuciones de las variables individuales. Hay n distribuciones
marginales de este tipo.
Distribución Marginal de xm :
k1 km−1 km+1 kn
n•…•s•…•
n•…•s•…• = ∑ … ∑ ∑ … ∑ ni…rst…l ; f•…•s•…• =
i =1 r =1 t =1 l =1 N
∀s = 1, … ,k m
PROPIEDAD: la suma de cualquiera de las distribuciones marginales es siempre N.
km km kp k1 km−1 km+1 kp −1 kp +1 kn
∑ n•…•s•…• = ∑ ∑ n•…•s•…•b•…• = …… = ∑ … ∑ ∑ … ∑ ∑ … ∑ ni…r •t…a•c…l =
s =1 s =1 b =1 i=1 r =1 t =1 a=1 c =1 l =1
k1 km−1 km+1 kn k1 kn
= ∑… ∑ ∑ … ∑ ni…r • t…l = ∑ … ∑ ni…l = N
i =1 r =1 t =1 l =1 i =1 l =1
DISTRIBUCIONES CONDICIONADAS
Al igual que con las distribuciones marginales, hay distintas clases de distribuciones
condicionadas según su dimensión, es decir, dependiendo del número de variables que
condicionen.
• n-1 dimensional: sólo condiciona una variable, por lo que quedan n-1 variables en la
distribución condicionada. Hay n distribuciones condicionadas de este tamaño.
Distribución Condicionada de ( x1 , … , xm−1 , xm+1 … , xn ) por xm :
f(x1i , …… , xnl ) n i…rst…l

f si…rt…l = =
f(xms ) n •…•s•…•
∀i = 1, … ,k2 ; ………… ; ∀r = 1, … ,k m−1; ∀t = 1, … ,k m+1 ;………… ; ∀l = 1, … kn
n 
• n-2 dimensional: condicionan dos variables. Hay   distribuciones condicionadas de
2
este tipo.
(
Distribución Condicionada de x1 , … , xm−1 , xm+1 , … , xp −1 , xp +1 , … , xn ) (
por xm , xp : )
f(x1i, …… , xnl ) n i…rst…l
i…rt…ac…l =
f s,b =
f(xms , xpb ) n •…•s•…•b•…•
∀i = 1, … ,k2 ; ……… ; ∀r = 1, … ,km−1; ∀t = 1, … ,km+1 ;…… ; ∀a = 1, … ,kp−1; ∀c = 1, … ,kp +1;…… ; ∀l = 1, … kn
• …………………………………………………...
ED 47
 n 
• bidimensional: son n-2 las variables condicionantes. Hay   distribuciones
n − 2 
marginales de esta clase.
Distribución Condicionada de xm , xp ( ) ( )
por x1 , … , xm−1 , xm+1 , … , xp −1 , xp +1 , … , xn :
f(x1i , …… , xnl ) n i…rst…l

i…rt…ac…l
f s,b = =
f(x1i , … , xm−1,r , xm+1,t , … , xp −1,a, xp +1,c , … , xnl ) n i…r •t…a•c…l
∀s = 1, … ,km ; ∀b = 1, … ,kp
• unidimensional: una variable es condicionada por todas las demás. Hay n

distribuciones condicionadas de este tipo.
Distribución Condicionada de xm por ( x1 , … , xm−1 , xm+1 , … , xn ) :
f(x1i, …… , xnl ) n i…rst…l

i…rt…l
f s,b = =
f(x1i , … , xm−1,r , xm+1,t , … , xnl ) n i…r • t…l
∀s = 1, … ,km
ED 48
N-DIMENSIONALES II
1- MOMENTOS
Para facilitar el manejo de los datos, éstos se representan mediante matrices. Cada
variables se representa en una columna, mientras que las filas se reservan a las
observaciones:
x1 x2 xj xm
↓ ↓ ↓ ↓
 x11 x21 … x j1 … xm1  ← Obs. 1

 
← Obs. 2
 x12 x22 … x j2 … xm2 
 
X=
… … … … … … 
 x1i x2i … x ji … xmi  ← Obs. i
 
… … … … … … 
 
 x1N x2N … x jN … xmN  ← Obs. N
Para hallar los momentos ordinarios de las distribuciones marginales de cada variable no
hay más que sumar los valores de la columna correspondiente y dividirlo entre el número de
observaciones. Si se hace para todas las variables, se halla el vector columna llamado Media
o Centro de Gravedad muestral multivariante:
 N 
 ∑ x1i 
 i=1 
 N 
 N   x1 
 ∑ x2i   x 
x =  i=1 = 2
 N  …
 …   x 
 N   m
∑x 
 i=1 mi 
 
 N 
Para calcular los momentos de 2º orden, hay que premultiplicar X por X′ (su traspuesta)
y dividir entre N:
ED 49
 N 2 N N 
 ∑ x1i ∑ x1i x 2i ∑ x1i x mi 
 i =1 i =1
… i =1

 N N N 
 N N
2
N 
1  ∑ x 2i x1i ∑ x 2i ∑ x 2i x mi 
N
( X′ ⋅ X ) =  i=1 N i =1
N
… i =1
N

 
 … … … … 
 N N N

∑x x ∑ x mi x 2i ∑ x mi 
2
 i=1 mi 1i i =1 i =1 
 … 
 N N N 
Para calcular los momentos centrales, primero se halla la matriz de las desviaciones
respecto a sus medias, Xd :
 x11 − x1 x 21 − x 2 … x m1 − x m 
 
x − x1 x 22 − x 2 … x m2 − x m 
Xd =  12
 … … … … 
 
 x1N − x1 x 2N − x 2 … x mN − x m 
Si ahora se la premultiplica por X′d , se halla la matriz de suma de cuadrados y productos

cuadrados (SCPC) en desviaciones a la media:
 N N N 
∑ (x1i − x1 ) ∑ (x1i − x1 )(x 2i − x 2 ) … ∑ (x1i − x1 )(x mi − x m ) 
2

i=1 i=1 i=1
 
 (x − x )(x − x )
N N
(x 2i − x 2 )2 … ∑ (x 2i − x 2 )(x mi − x m ) 
N
 ∑ ∑
′
Xd ⋅ Xd = i=1 2i 2 1i 1
i=1 i=1
 
 … … … … 
N N N 
 ∑ (x mi − x m )(x1i − x1 ) ∑ (x mi − x m )(x 2i − x 2 ) … ∑ (x mi − x m )
2

 i=1 i=1 i=1 
Finalmente, si se divide esta matriz entre N se llega a la matriz de varianzas y covarianzas:
 N N N 
∑ (x1i − x1 ) ∑ (x1i − x1 )(x 2i − x 2 ) ∑ (x1i − x1 )(x mi − x m ) 
2

i=1 i=1 i=1
 … 
 N N N 
 N N N 
 ∑ (x 2i − x 2 )(x1i − x1 ) ∑ (x 2i − x 2 ) ∑ (x 2i − x 2 )(x mi − x m ) 
2
1
V = ( Xd ⋅ Xd ) =  i=1
′ i=1
… i=1 
N  N N N 
 … … … … 
 
 N (x − x )(x − x ) N N

∑ (x mi − x m )(x 2i − x 2 ) ∑ (x mi − x m )
2
 i∑
=1
mi m 1i 1
i=1 i=1 
 … 
 N N N 
ED 50
 S12 S12 … S1m 
 
S S22 … S2m 
V =  21 
… … … … 
S 2 
 m1 Sm2 … Sm 
La matriz de correlaciones puede hallarse premultiplicando y posmultiplicando la matriz de

varianzas y covarianzas por la matriz D :
1 
S 0 …0 
 1   1 r12 … r1m 
 1   
0 … 0  r 1 … r2m 
D= S2  → R = D ⋅ V ⋅ D =  21
… … … …
… … … …  
   rm1 rm2 … 1 
0 1 
 0 …
 Sm 
En cuanto a los momentos de varias variables:
k1 k 2 km
• Momentos Ordinarios: ars…t = ∑ ∑ … ∑ x1ir ⋅ x 2s j ⋅ … ⋅ x ml
t
i =1 j =1 k =1
k1 k 2 km
• Momentos Centrales: mrs…t = ∑ ∑ … ∑ (x1i − x1 )r ⋅ (x 2 j − x 2 )s ⋅ … ⋅ (x ml − x m )t
i =1 j =1 l =1
2- CORRELACION (para tres variables)

CORRELACIÓN PARCIAL
Muestra el grado de relación lineal que hay entre dos de las variables de la distribución
eliminando el efecto de la tercera, es decir, manteniéndola fija.
r12 − r23 ⋅ r13

r12•3 =
1 − r13
2
⋅ 1 − r23
2
PROCESO PARA LLEGAR A ESA EXPRESIÓN:

Primero se calcula la regresión lineal de cada una de las variables cuya correlación se
quiere calcular (en este caso x1 y x2 ) por el resto ( x3 ):
x̂1 = a1 + b13 x3
x̂2 = a2 + b23 x3
ED 51
Luego se hallan los residuos de cada una de las regresiones:
x1* = x1 − ˆ
x1 = x1 − a1 − b13x3
x*2 = x2 − ˆ
x2 = x2 − a2 − b23 x3
Así quedan eliminados los efectos de x3 en las otras dos variables.

A continuación se hace la regresión entre los dos residuos:
x1* = a0 + b0 x*2
Pues el coeficiente de correlación lineal de esta regresión es el coeficiente de correlación

parcial, ya que se eliminaron anteriormente los efectos de x3 :
r12•3 = r1*2* =
(
Cov x1* , x2*) =
Cov ( x1 − a1 − b13 x3 , x2 − a2 − b23 x3 )
=
Var ( x ) ⋅ Var ( x )
*
1
*
2
Var ( x1 − a1 − b13x3 ) ⋅ Var ( x2 − a2 − b23 x3 )
(1) Cov ( x1 , x2 ) − b23Cov ( x1 , x3 ) − b13Cov ( x2 , x3 ) + b13b23 Var ( x3 )
= =
Var ( x1 ) + b13
2
Var ( x3 ) − 2b13Cov ( x1 , x3 ) ⋅ Var ( x2 ) + b223 Var ( x3 ) − 2b23Cov ( x2 , x3 )
S23 S13 S13S23
S12 − S13 − S23 + S23 S13S23
S12 −
(S )
2 2 2
S S 2
(2) 3 3
3 S23
= = =
2
S S13 S223 S23 2
S13 S223
S +
2 13
S −2
2
S13 ⋅ S + 2
S −2
2
S23 S −
2
⋅ S −
2
( ) ( )
1 3 2 3 1 2
S23
2
S23 S23
2
S23 S23 S23
S12 S S
− 13 ⋅ 23
S1S2 S1S3 S2S3 r12 − r13 ⋅ r23
= =
S2
S 2
S S 2 2
1 − r13
2
⋅ 1 − r23
2
1
2
− ⋅13
2 2
− 2
2
23
2 2
S1 SS S
1 3 SS 2 2 3
(1) Propiedad Covarianza : Cov ( aX + bY + c, dZ + eW + f ) = adCov ( X,Z ) + aeCov ( X, W ) + bdCov ( Y,Z ) + beCov ( Y, W )
Propiedad Varianza : Var ( aX + bY + c ) = a2 Var ( X ) + b2 Var ( Y ) + 2abCov ( X, Y )
S13 S23
(2) Coeficientes Regresión : b13 = b23 =
S23 S23
CORRELACIÓN MÚLTIPLE
Informa del grado de relación lineal que hay entre una variable de la distribución y la
combinación lineal del resto de variables.
2
r12 − 2 r12 r13 r23 + r13
2
R1•23 =
1 − r23
2
Su valor siempre está comprendido entre cero y uno.
PROCESO PARA LLEGAR A ESA EXPRESIÓN:

Primero se calcula la regresión lineal de cada la de las variables cuya correlación se quiere
calcular (en este caso x1 ) por el resto ( x2 y x3 ):
x̂1 = a + b12 x2 + b13 x3
ED 52
Ahora se hace la regresión entre x1 y ˆ
x1 :
x̂1 = a0 + b1x1
Pues el coeficiente de correlación lineal de esta regresión es el coeficiente de correlación

múltiple:
Cov ( x1 , ˆ
x1 ) Cov ( x1 , a + b12 x2 + b13 x3 )
R1•23 = r1,1ˆ = = =
Var ( x1 ) ⋅ Var ( ˆ
x1 ) Var ( x1 ) ⋅ Var ( a + b12 x2 + b13 x3 )
(1) b12Cov ( x1 , x2 ) + b13Cov ( x1 , x3 )
= =
Var ( x1 ) ⋅ b12
2
Var ( x2 ) + b13
2
Var ( x3 ) + 2b12b13Cov ( x2 , x3 )
S12S23 − S13S23 S13S22 − S12S23
S12 + S13
(3)
S22S23 − S223 S22S23 − S223
= =
( ) ( )
2 2
S12S23 − S13S23 S13S22 − S12S23 S12S − S13S23 S13S − S12S23
2 2
S12 ⋅ S22 + S32 + 2 3 2
S23
(S S ) (S S ) S22S32 − S23 S22S23 − S223
2 2 2
2
2
2
3 −S 2
23
2
2
2
3 −S 2
23
2
S12 S23 − S12S13S23 + S13
2
S22 − S12S13S23
S22S23 − S223
= ……
(S ) (S )
2 2
S S 2
12
2
2
2
3 − 2S12S13S23S S + S S S + S 2
2
2
3
2
13
2
23
2
2
2
13
2
2 S − 2S12S13S23S S + ……
2
3
2
2
2
3
S12 ⋅
(S S )
2
2
2
2
3 −S 2
23
=
…
……
…… + S12
2
S223S23 + 2S12S13S23S22S23 − 2 S12
2
S223S23 − 2 S13
2
S223S22 + 2S12S13S323
…
S S − 2S12S13S23 + S13
2
12
2
3
2
S22
S22S23 − S223
= =
(S ) (S )
2 2
S S 2
12
2
2
2
3 +S 2
13
2
2 S − 2S12S13S23S S − S S S − S S S + 2S12S13S
2
3
2
2
2
3
2
12
2
23
2
3
2
13
2
23
2
2
3
23
S12 ⋅
S22S23 − S223
2
S12 S23 − 2S12S13S23 + S13
2
S22
S12S22S23
= =
( ) ( )
2 2
S12
2
S12 S22 S23 + S13
2
S22 S23 − 2S12S13S23S22S23 − S12
2
S223S23 − S13
2
S223S22 + 2S12 S13S323
⋅
( ) (S )
2 2 2
S 1 S12 S22 2
3
2
r12 − 2r12r13r23 + r13
2 2
r12 − 2r12r13r23 + r13
2 2
r12 − 2r12r13r23 + r13
2
= = =
(r )( ) 1 − r23
2
2
r12 + r13
2
− 2r12r13r23 − r12r23 − r13
2 2
r23 + 2r12r13r23
2 2 3 2
12 − 2r12r13r23 + r13
2
1 − r23
2
(1) Vease página 52

S12 S23 S22 S12
S13 S23 S12S − S13S23
2
S23 S13 S13S22 − S12S23
(3) Coeficientes Regresión : b12 = = 3
b13 = =
S 2
2 S23 S22S32 − S23
2
S 2
2 S23 S22S32 − S23
2
S23 S23 S23 S23
ED 53
TEMA 13: REGRESIONES I
1- CRITERIO DE LOS MÍNIMOS CUADRADOS

La regresión trata de plasmar la relación existente entre X (variable exógena o
independiente) e Y (variable endógena o dependiente).
Se busca una función que describa la nube de puntos (x i , y j ) i = 1, 2, … , k y j = 1, 2, … , p , en la que

intervendrán n parámetros (a1 , a2 , … , an ) tal que n < N (número de observaciones):
Y = f(X, a1 , a2 ,… , an ) → y j = ϕ (x i , a1 , a2 ,… , an )
ˆ
A cada observación, x i , le corresponde un valor real u observado, y j , y un valor teórico, ŷ j .

Su diferencia se llama residuo y se representan por:
ej = y j − ˆ
yi
El método de los mínimos cuadrados determina los parámetros ai de tal forma que la
media ponderada de los residuos sea mínima. Para evitar que se compensen residuos
negativos y positivos previamente se elevan al cuadrado:
( )
k p k p
⋅ nij = ∑ ∑  y j − ϕ ( x i , a1 , a2 ,… , an )  ⋅ nij ⇒ min Φ ( a1 , a2 ,… , an )
2 2
Φ = ∑ ∑ yj − ˆ
yj
i=1 j=1 i=1 j=1
Aplicando el método de optimización:
1as Condiciones (ECUACIONES NORMALES):

∂Φ k p ∂ϕ
= −2∑ ∑  y j − ϕ ( x i , a1 , a2 ,… , an )  ⋅ nij ⋅
2
=0
∂a1 i=1 j=1 ∂a1
∂Φ k p ∂ϕ
= −2∑ ∑  y j − ϕ ( x i , a1 , a2 ,… , an )  ⋅ nij ⋅
2
=0
∂a2 i=1 j=1 ∂a2
⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
∂Φ k p ∂ϕ
= −2∑ ∑  y j − ϕ ( x i , a1 , a2 ,… , an )  ⋅ nij ⋅
2
=0
∂an i=1 j=1 ∂an
2as Condiciones:
 ∂2Φ ∂2Φ ∂2Φ 

 … 
 ∂a1
2
∂a1∂a2 ∂a1∂an 
 2 
 ∂ Φ ∂2Φ ∂2Φ 
D+
…
 ∂a2∂a1 ∂a22 ∂a2∂an 
 
 … … … … 
 2 
 ∂ Φ ∂2Φ ∂2Φ 
 ∂a ∂a ∂an2 
…
 n 1 ∂an∂a2
ED 54
TIPOS DE AJUSTE
AJUSTE LINEAL
Se ve en el tema 14.
AJUSTE PARABÓLICO
La función de regresión de Y sobre X es una parábola:
ŷ j = a + bx i + cx i2
De esta forma, la función a minimizar queda:

k p
Φ = ∑ ∑ (y j − a − bx i − cx i2 )2 ⋅ nij
i =1 j =1
Cuyas Ecuaciones Normales son:

∂Φ k p
= −2 ∑ ∑ (y j − a − bx i − cx 2i ) nij = 0
∂a i=1 j=1
∂Φ k p
= −2 ∑ ∑ (y j − a − bx i − cx 2i ) nij x i = 0
∂b i=1 j=1
∂Φ k p
= −2 ∑ ∑ (y j − a − bx i − cx 2i ) ⋅ nij x i2 = 0
∂c i=1 j=1
Operando y simplificando a momentos ordinarios (es decir, dividiendo entre N):

p k k

∑ y jn• j = aN + b∑ x i ni• + c ∑ x i2ni• 
j =1 i=1 i=1
 a01 = a + b ⋅ a10 + c ⋅ a20
k p k k k

∑ ∑ x i y jn• j = a∑ x i ni• + b∑ x i2ni• + c ∑ x 3i ni•  ⇒ a11 = a ⋅ a10 + b ⋅ a20 + c ⋅ a30
i=1 j=1 i=1 i=1 i=1

k p k k k  a21 = a ⋅ a20 + b ⋅ a30 + c ⋅ a40
∑ ∑ x i2 y jn• j = a∑ x i2 ni• + b∑ x 3i ni• + c ∑ x i4ni• 
i=1 j=1 i=1 i=1 i=1 
AJUSTE HIPERBÓLICO:
En este caso la regresión se ajusta a una función hiperbólica:

1
Y = a+b
X
1
Se reduce al caso lineal con la transformación: Z= ⇒ Y = a + bZ
X
AJUSTE POTENCIAL:
La función de regresión se adapta a una función:
Y = aXb
ED 55
También puede reducirse al caso lineal tomando logaritmos:
ln Y = ln aXb = ln a + b ⋅ ln X
Renombrando U = ln Y; A = ln a; Z = ln X ⇒ U = A +b⋅Z
AJUSTE EXPONENCIAL:
Se ajusta la regresión a una función de la forma:
Y = a ⋅ bX
Este caso también puede transformarse en una regresión lineal:
ln Y = ln ab X = ln a + X ⋅ lnb
Renombrando U = ln Y; A = ln a; B = ln b ⇒ U = A+B⋅X
2- VARIANZA RESIDUAL
Como medida de dispersión y de la bondad del ajuste, se calcula la varianza de los errores,
es decir, de las diferencias entre los datos observados y los teóricos, siendo mejor el ajuste
cuanto menor sea.
∑ ∑ ( y j − ˆy j ) n ij ∑ ( y j − ˆy j ) n • j
k p 2 p 2 p
∑ e2j n • j
i =1 j =1 j =1 j =1
S2e = = =
N N N
Su raíz cuadrada positiva recibe el nombre de error estándar.
Casos particulares:
p p k p
∑ y2jn • j − a∑ y jn • j − b∑ ∑ xiy jn ij
j=1 j=1 i=1 j=1
• Ajuste lineal: S2e =
N
p p k p k p
∑ y2j n • j − a∑ y jn • j − b∑ ∑ xiy jn ij − c∑ ∑ xi2 y jn ij
j=1 j=1 i=1 j=1 i=1 j=1
• Ajuste parabólico: S2e =
N
DESCOMPOSICIÓN DE LA VARIANZA
La varianza total puede descomponerse como la suma de la varianza explicada por la
regresión más la varianza residual:
S2y = S2ŷ + S2e
Demostración:
ED 56
p p p p 2
∑ e2j ⋅ n• j ∑ (y j − ˆy j )2 ⋅ n• j ∑ (y j − ˆy j + y − y)2 ⋅ n• j ∑ (y j − y) − (yˆ j − y)  ⋅ n• j
j =1 j =1 j =1 j =1
S2e = = = = =
N N N N
p p
∑ (y j − y)2 ⋅ n• j ∑ (yˆ j − y)2 ⋅ n• j 2 p 2 p
j =1 j =1
= + − ∑ (y j − y)(yˆ j − y) ⋅ n• j = S2y + S2ŷ − ∑ (yˆ j + e j − y)(yˆ j − y) ⋅ n• j =
N N N j=1 N j=1
p p p

∑ ˆ j − y)2 ⋅ n• j
(y ∑ ˆy j e j ⋅ n• j ∑ ye j ⋅ n• j 
2 p
= j =1 j =1
= S2y + S2ˆy − ∑ (yˆ j − y)2 + ˆ
y j e j − ye j  ⋅ n• j = S2y + S 2ˆy − 2  + + =
j 1
N j =1  N N N 
 
(1)
= S2y + S2ˆy − 2(S 2ˆy + 0 − 0) = S 2y + S 2ˆy − 2S2ˆy = S2y − S2ˆy
N N N
(1) Propiedades Residuos : ∑ ei =0 ∑ ˆy iei = ∑ ϕ (x i , a1 , … , an )ei =0
i =1 i =1 i =1
COEFICIENTE DE DETERMINACIÓN
Se define como el cociente entre la varianza explicada y la varianza total. Es decir, que
indica la proporción de variaciones de la variable dependiente explicadas por la regresión.
S2e S2Yˆ
R =1− 2 = 2
2
SY SY
0 ≤ R2 ≤ 1
• Ajuste pésimo: R2 = 0 ⇔ S 2ŷ = 0; S 2e = S 2y
• Ajuste óptimo: R2 = 1 ⇔ S 2ŷ = S 2y ; S 2e = 0
Subsana el inconveniente de la varianza residual para hacer comparaciones, ya que el

coeficiente de determinación es una medida abstracta, así que permite cualquier comparar
cualquier tipo de regresiones.
ED 57
TEMA 14: REGRESIONES II
1- RECTAS DE REGRESIÓN
En el caso de detectar una relación lineal, lo que se obtiene mediante la técnica de los
mínimos cuadrados es la recta de regresión.
RECTA DE REGRESIÓN DE Y SOBRE X:
Se parte de:
k p
min φ1 = ∑ ∑ (y j − a − bx i )2 nij
a,b i =1 j =1
Así se obtienen las Ecuaciones Normales:

∂φ1 p k
=0 → ∑ y j n• j = aN + b∑ xini•
∂a j =1 i =1
∂φ1 k p k k
=0 → ∑ ∑ xi y j n• j = a∑ x ini• + b∑ x i2ni•
∂b i =1 j =1 i =1 i =1
Si se opera:
÷N a01 = a + b ⋅ a10  ×( − a10 ) −a10 ⋅ a01 = −a ⋅ a10 − b ⋅ a10
2
 sumando
→  →  →
a11 = a ⋅ a10 + b ⋅ a20  a11 = a ⋅ a10 + b ⋅ a20 
S xy
→ (
a11 − a10 ⋅ a01 = b ⋅ a20 − a10
2
) → m11 = b ⋅ m20 → S xy = b ⋅ S 2x ⇒ b=
S2x
S xy S xy
a01 = a + b ⋅ a10 → a = a01 − a10 ⇒ a=y− ⋅x
S2x S2x
Por tanto, sustituyendo a y b, la recta de regresión queda:

S xy S xy S xy
y = a + bx → y=y− ⋅x + ⋅x → y−y =
ˆ (x − x)
S2x S2x S2x
RECTA DE REGRESIÓN DE Y SOBRE X: (es análogo)

k p Aná logamente S xy
min φ2 = ∑ ∑ (x i − a′ − b′y j )2 nij ⇒ x−x =
ˆ (y − y)
a′,b′ i =1 j =1 S2y
Ambas rectas se cortan en (x, y) , punto denominado centro de gravedad.
ED 58
Los coeficientes de regresión son las pendientes de las rectas de regresión:
∂y Sxy
- de Y sobre X: = tgα = b = 2
∂x Sx
∂x Sxy
- de X sobre Y: = tgα ′ = b′ = 2
∂y Sy
El signo de b y b’ será el mismo de la cov. Si S2xy > 0 , las rectas de regresión serán crec. Si
S2xy < 0 , serán decrecientes Y si S2xy = 0 , entonces las rectas de regresión serán
perpendiculares entre sí, y paralelas a los ejes.
y
x = f’(y)
α′
y = f(x)
y α
x
x
PROPIEDADES:
N N N
1) ∑ ei = 0 ⇔ ∑ y i = ∑ ˆy i
i =1 i =1 i =1
Demostración:
N N N N N ∂φ1
∑ ei = ∑ y i − ∑ ˆyi = ∑ y i − aN − b∑ x i = =0
i=1 i =1 i=1 i=1 i=1 ∂a
N
2) ∑ ei ⋅ x i = 0
i =1
Demostración:
N N N N ∂φ1
∑ ei xi = ∑ y i x i − a∑ x i − b∑ x 2i = =0
i=1 i=1 i=1 i=1 ∂b
N
3) ∑ ei ⋅ ˆy i = 0
i =1
Demostración:
N N N
∑ eiˆyi = a∑ ei + b ∑ ei x i = 0
i=1 i=1 i =1
ED 59
2- COEFICIENTE DE CORRELACIÓN LINEAL
Mide el grado de asociación lineal entre dos variables.
S2xy
S/ 2y − S/ 2y +
S2ŷ S2x S2xy S xy
r= 1− = = ⇒ r=
S2y S 2y S2x ⋅ S2y Sx ⋅ Sy
El coeficiente de determinación lineal tiene la misma interpretación, y se expresa como:
S2xy
r2 = = R2
S2x ⋅ S2y
Ambos son invariantes ante cambios de origen y de escala.
S xy S xy S xy tg α
r= b ⋅ b′ = ⋅ 2 = o con ángulos: r=
2
Sx Sy Sx ⋅ Sy π 
tg  − α ′ 
2 
π 
• si r=0 ⇒ tg α = 0 → α = 0º ; tg  − α ′  → ∞ ⇒ α ′ = 0º
(recta Y/X paralela al eje X) 2 
(recta X/Y paralela al eje Y)
π  π
• si r ± 1 ⇒ tg α = tg  − α ′  → α = − α ′ (Las dos rectas coinciden)
2  2
3- POSICIÓN DE LAS RECTAS SEGÚN VALOR DEL

COEFICIENTE DE CORRELACIÓN
Sy Sx
A partir de las relaciones b = r ⋅ y b′ = r ⋅ , quedan las rectas de regresión:
Sx Sy
 Sy
y − y = r ⋅ (x − x)
 Sx

 x − x = r ⋅ S x (y − y)
 Sy

Sy
y−y=
(x − x) 
Sx 
a) r = 1:  Son la misma recta, con pendiente positiva.
Sx
x−x= (y − y) 
Sy 

ED 60
Sy 
y−y=− (x − x) 
Sx 
b) r = -1:  Son la misma recta, con pendiente negativa.
Sx
x − x = − (y − y) 
Sy 

y − y = 0
c) r = 0:  Cada recta paralela a un eje, y perpendiculares entre ellas.
x − x = 0
d) -1 < r < 0: serán dos rectas distintas y con pendiente negativa.
e) 0 < r < 1: serán dos rectas distintas y con pendiente positiva.
ED 61
TEMA 15: SERIES TEMPORALES I
1- INTRODUCCIÓN
Serie temporal (cronológica o histórica): sucesión de observaciones de un fenómeno
ordenadas en el tiempo. Permite analizar la evolución de una variable a lo largo de del
tiempo, tanto para construir un modelo descriptivo de la historia del fenómeno, como para
predecir sus valores futuros.
Una serie temporal puede considerarse una distribución bidimensional en la que la variable
dependiente es la que se quiere analizar, y la variable independiente es el tiempo.
La variable explicada puede ser una magnitud stock (referida a un momento concreto) o
flujo (referida a la acumulación en un periodo de tiempo).
Con el análisis gráfico de la serie temporal se pueden detectar las características más
importantes, como movimientos a L/P, amplitud de las oscilaciones, existencia de ciclos,
rupturas, datos anómalos, etc. Para esto debe tenerse especial cuidado con la elección de la
escala para evitar distorsiones.
2- COMPONENTES
1º. Tendencia (Tt ) : describe el movimiento general de la serie a L/P,
proporcionando las pautas generales de su comportamiento. Se necesita un
número grande de observaciones para poder calcularla.
2º. Estacional (E t ) : recoge las oscilaciones a C/P, que se producen regularmente
con un periodo igual o inferior al año. Suele deberse a factores climatológicos,
biológicos, culturales,…
3º. Cíclica (C t ) : refleja oscilaciones a M/P, con duración mayor de un año, no tan
regulares como las estacionales; y normalmente debidas a la alternancia de
periodos de prosperidad y depresión en la actividad económica.
4º. Irregular o residual (It ) : recoge los movimientos sin periodicidad reconocible,
de carácter esporádico o accidental.
En la práctica es complicado separar ciclo y tendencia. Por ello algunos autores las tratan
conjuntamente, hablando de la componente extraestacional.
3- MODELOS DE DESCOMPOSICIÓN
a) Aditivo: y t = Tt + C t + E t + It
b) Multiplicativo: y t = Tt × C t × E t × It
c) Mixto: y t = Tt × C t × E t + It
ED 62
Para elegir el modelo más adecuado hay varios procedimientos, que básicamente indican si
la tendencia y la componente estacional son independientes, en cuyo caso se debería escoger
el modelo aditivo; o no lo son, debiendo usar entonces unos de los otros dos modelos.
− Gráfico: si las oscilaciones estacionales tienen una amplitud similar todos los años, se
escogería el modelo aditivo. Si esa amplitud tiende a crecer o decrecer, se escogería uno
de los otros dos modelos.
− Gráfico Desviación típica-Media: se calcularía la media y la desv. típica de la variable

para cada año (lo óptimo sería hacerlo para la longitud del ciclo, pero suele ser bastante
difícil descubrirla), y se representan los puntos en un gráfico con la media en el eje x, y
la desviación típica en el eje y. Si los puntos se distribuyen aleatoriamente, tendencia y
estacionalidad serían independientes, por lo que el mejor modelo sería el aditivo. Si en
cambio los puntos están alineados, debe elegirse uno de los otros dos modelos.
− Coeficiente de Variación de las diferencias y cocientes estacionales: compara los

coeficientes de variación estacionales con un modelo aditivo y uno multiplicativo. Para
ello primero deben calcularse las diferencias y los cocientes estacionales, en las que L es
el número de datos anuales (4 si son trimestrales, 12 si son anuales,…).
N
∑ (dEt − dE )2 • si CV(d E ) > CV(k E ) ⇒
t =L +1
T −L ⇒ Modelo b) o c)
diferencia estacional: dEt = y t − y t −L → CV(dE ) =
dE
N
∑ (k Et − k E )2 • si CV(d E ) < CV(k E ) ⇒
t =L +1
yt T −L ⇒ Modelo a)
cociente estacional: k Et = → CV(k E ) =
y t −L kE
4- MÉTODOS DE DETERMINACIÓN DE LA TENDENCIA

1- AJUSTE ANALÍTICO O REGRESIÓN
Ajusta una función, Tt o ŷ t , a la nube de puntos ( yi , ti ) , por el método de los mínimos
cuadrados. La forma de la función se elige tras un análisis visual del gráfico de la serie,
percibiendo su movimiento a L/P, y también teniendo en cuenta los coeficientes de bondad
del ajuste.
Si hay estacionalidad, es conveniente transformar los datos originales, calculando la media

anual, y ajustar la función a esos datos.
Las formas funcionales más corrientes son:
− Tendencia lineal:
Ec. Normales ∑ y t = Na + b∑ t  S ty
y t = a + bt
ˆ ⇒  ⇒ ˆ
y t = y + 2
(t − t )
∑ t
y t = a ∑ t + b ∑ 
t 2
S t
ED 63
− Tendencia parabólica:
∑ y t = Na + b∑ t + c ∑ t 2 
Ec. Normales 
ŷ t = a + bt + ct 2 ⇒ ∑ y t t = a∑ t + b∑ t 2 + c ∑ t 3 

∑ y t t 2 = a∑ t2 + b∑ t3 + c ∑ t 4 
− Tendencia exponencial:
y t = a + bt ⇔ ln ˆ
ˆ y t = ln a + t ⋅ lnb
− Tendencia logística:
k
ŷ t = y 0 + + c ⋅ e −ht
l
2- MEDIAS MÓVILES
Consiste en promediar los valores con un cierto número de observaciones anteriores, y el
mismo número de observaciones posteriores. El tamaño idóneo debe ser múltiplo de la
componente estacional (años completos), y de la cíclica (lo que es mucho más difícil). Es un
procedimiento sencillo, pero es difícil elegir el orden, y además se pierden observaciones al
principio y al final de la serie. Otra desventaja es que no existe medida de la bondad del
 S2ty 
ajuste, como en el ajuste analítico, que tiene el coeficiente de determinación  R 2 = rty2 = .
 S2t ⋅ S2y 
 
• Si el orden de p es impar:
y1 + y 2 + … + y p y 2 + y 3 + … + y p +1 y 3 + y 4 + … + y p +2
y p +1 = ; y p +3 = ; y p +5 = ; ……
2
p 2
p 2
p
p −1
2
y +y + … + yt + … + y +y ∑ y t +i
p −1 p −1 p −1 p −1 p −1
t− t− +1 t+ −1 t+ i=−
En general: yt = 2 2 2 2
= 2
p p
• Si el orden de p es par: se sigue el mismo proceso, pero como la serie estaría

descentrada, se calcula la media entre cada par de medias móviles:
y p +1 + y p + 3 y p +3 + y p +5 y p+5 + y p +7
y p+2 = 2 2
; y p+ 4 = 2 2
; y p+6 = 2 2
; ……
2
2 2
2 2
2
p +1 p+2
Se pierden − 1 observaciones al principio y al final si p es impar, y − 1 si es par.
2 2
ED 64
3- MÉTODO DE LAS DIFERENCIAS
Es el empleado en la teoría avanzada de series temporales. Se basa en diferenciar los
valores, creando una nueva serie:
zt = y t − y t −1 = (1 − L)y t donde Ls = y t − s
Mediante la representación gráfica de z t puede verse si ésta crece, decrece, u oscila

alrededor de un valor a L/P. En el último caso, z t sería la serie sin tendencia. En los otros
dos casos, se repetiría el proceso hasta encontrar una serie estacionaria:
w t = (1 − L)zt = z t − zt −1 = (y t − y t −1 ) − (y t −1 − y t − 2 ) = y t − 2y t −1 + y t − 2 = (1 − L)2 y t
Si se hubiera partido de un modelo multiplicativo, e y t fuera el ln de la variable original,

ut , entonces z t se interpreta como la tasa de cambio de ut :
ut
z t = (1 − L)y t = lnu t − ln u t −1 = ln
u t −1
ED 65
TEMA 16: SERIES TEMPORALES II
1- ANÁLISIS DE SERIES TEMPORALES

Hasta 1927, los métodos de análisis de series temporales seguían la concepción clásica o
determinista (las incidencias irregulares se suponen puntuales y erráticas, sin repercusión en
los cambios futuros de la variable).
Desde esa fecha, Yule abrió el camino de la concepción moderna o estocástica (las
incidencias irregulares sí condicionan los movimientos futuros de la variable).
El análisis de series temporales persigue la descripción de la serie, y la predicción de la

evolución futura de la serie. Para esto pueden adoptarse dos enfoques: univariante (una
variable explicada), o multivariante.
2- VARIACIONES ESTACIONALES
1- MÉTODO DE LAS RELACIONES DE MEDIAS MENSUALES RESPECTO
A LA TENDENCIA
a) Se calculan las medias anuales, y con ellas la recta de regresión por mínimos
cuadrados. Así se haya la tendencia.
y t • = a + bt
b) Se calculan las medias mensuales (o trimestrales o lo que sea dependiendo de la

frecuencia de observaciones al año):
N y ik
y •k = ∑ k = 1, 2,… ,m
i =1 N
c) Se corrigen restando el efecto de la tendencia:

b(k − 1)
y′•k = y •k −
m
d) Se calcula la media global corregida:

y ′•1 + y ′•2 + …… + y ′•m
y=
m
e) Se calculan los Índices de Variación Estacional (si el esquema es multiplicativo) o las

diferencias si el esquema es aditivo:
y ′•k IVEk
IVEk = × 100 → E•k = E•k = y ′•k − y ′
y′ 100
Si la serie no tuviera tendencia ( b = 0 ) , no habría que corregir las medias.
ED 66
2- MÉTODO DE LAS MEDIAS MÓVILES
En este método se suponen unidas tendencia y ciclo en la componente extraestacional.
a) Se calcula la componente extraestacional, X t , por medias móviles de orden anual (12

para series mensuales, 4 para trimestrales,…), y se elimina de la serie original,
quedando así las componentes estacional y residual.
y tk
Aditivo: E tk + Itk = y tk − X tk Multiplicativo: Itk ⋅ E tk =
X tk
b) Se calcula la media para cada mes o trimestre con los datos sin tendencia. De esta
forma se anula el efecto de la componente irregular.
N N y 
∑ ( yik − Xik ) ∑  Xtk 
i =1 
Aditivo: E•k = i =1 Multiplicativo: E•k =
tk 
N N
c) Se halla la media anual con las medias mensuales (o trimestrales) anteriormente

obtenidas, y se normalizan los valores de tal manera que la media sea cero en el
modelo aditivo y uno en el multiplicativo, hallando así la componente estacional:
m
∑ E•k
i =1
Media anual: E=
m
E •k
Aditivo: E•k = E•k − E Multiplicativo: E•k =
E
3- MÉTODO DE LAS DIFERENCIAS ESTACIONALES

Se crea una nueva serie, con las diferencias interanuales, ya que suele ser suficiente para
eliminar las variaciones estacionales, comprobando si en la serie original se ve un patrón, y
en la nueva desaparece.
(1 − Lm )y t = y t − y t −m = zt
El método más usado es el X-11, del Bureau of the Census de EE. UU.
3- VARIACIONES CÍCLICAS
La obtención del ciclo es bastante difícil, debido a que no siempre existe; son necesarias
series muy largas para poder detectarlo; no siempre tienen la misma longitud; y puede darse
el caso de que se superpongan más de un ciclo de distintas longitudes de onda.
Todo ello hace que sea muy frecuente el tratamiento de las series en el que se prescinde
del estudio separado de los ciclos y, en su lugar, se trabaja con la componente mixta ciclo-
tendencia, a la que también se le conoce como extraestacional.
Para obtener el ciclo, se eliminan la tendencia y la estacionalidad, dejando la variable

irregular, ya que no desvirtúa el aspecto general del ciclo. A esta variable se la llama R t :
ED 67
y tk
Aditivo: R tk = C tk + I tk = y tk − Ttk − E tk Multiplicativo: R tk = C tk ⋅ Itk =
Ttk ⋅ E tk
A partir de esta serie, y mediante el análisis armónico, puede llegarse al ciclo:
B
R t = A ⋅ cos(ω t) + B ⋅ sen(ω t) = R ⋅ cos(ω t − α ); R = A 2 + B 2 , α = arctg
A
2ω π
R → amplitud, → periodo, → frecuencia, α → fase (valor R t en origen)
π 2ω
2π 2π
Si se ajusta a una expresión: R t = A 0 + A ⋅ cos t + B ⋅ sen t
p p
Y si se usa el método de los mínimos cuadrados, los parámetros serían:
p
∑ Rt 2 p 2π 2 p 2π
t =1
A0 = A= ∑ R t ⋅ cos t B= ∑ R t ⋅ sen t
p p t =1 p p t =1 p
p, que es el periodo o duración del ciclo, no se conoce, por lo que se le pueden dar
distintos valores, y con los periodogramas, elegir el valor más adecuado.
ED 68
TEMA 17: NÚMEROS ÍNDICES
Es una medida estadística que compara los valores de una variable en dos situaciones
distintas, tomando una como referencia. Son una simplificación de la realidad, por lo que
deben tenerse precauciones al calcularlos, como por ejemplo al fijar la situación inicial de
referencia, ya que condiciona el resultado de las comparaciones. Éstas pueden ser
geográficas, sectoriales, temporales.
1- ÍNDICES SIMPLES
Sea X una magnitud simple, y sean x0 y xt sus valores en los periodos base (0) y corriente
(t). El número índice simple muestra la variación de dicha magnitud, y se define:
xt
I0t (X) = × 100
x0
(todos los índices están multiplicados por 100, pero por comodidad en la notación se omite)
Los índices simples más usuales son los de precios, cantidades y valor relativos:
pit qit pit × qit
p0t (i) = ; q0t (i) = ; V0t (i) = = p0t (i) × q0t (i)
pi0 qi0 pio × qio
PROPIEDADES (deseables):
1. Existencia: todo número índice debe existir, es decir, tener un valor finito.
2. Identidad: si los periodos base y corriente son el mismo, el índice es 1: It = 1

t
xt 1 1
3. Inversión: I0t = = = 0
x0 x t It
x0
x t′ x t x 0 1
4. Circular: ⋅ ⋅ =1 ⇔ I0t′ × Itt′ × I0t = 1 ⇒ I0t′ × Itt′ = = I0t
x 0 x t′ x t I0t
5. Proporcionalidad: si en el periodo actual todas las magnitudes sufren una

variación proporcional, el índice queda afectado por la misma variación.
x it′ (1 + k)x it
x it′ = x it + k ⋅ x it = (1 + k)x it → I′(i) = = = (1 + k) ⋅ I(i)
x i0 x i0
6. Homogeneidad: los índices son invariantes ante cambios en las unidades de

medida (cambios de escala).
ED 69
2- ÍNDICES COMPLEJOS
Resumen en una sola serie la evolución temporal de un conjunto de variables relacionadas
entre sí. Se dividen en dos: no ponderados (se asigna el mismo peso a todas las variables), y
ponderados (se asigna distintos pesos según su importancia relativa en el conjunto).
1- NO PONDERADOS
N
I0t (1) + I0t (2) + …… + I0t (N) ∑ I0t (i)

i =1
a) Media Aritmética Simple: I0t = =
(Índice de Sauerbeck) N N
N
b) Media Geométrica Simple: IGt 0 = N I0t (1) ⋅ I0t (2) ⋅ …… ⋅ I0t (N) = N ∏ I0t (i)
i =1
N N
c) Media Armónica Simple: IHt 0 = =
1 1 1 N 1
+ + …… + t ∑ t
I0t (1) I0t (2) I0 (N) i =1 I0 (i)
x1t + x 2t + …… + xNt ∑ x it
i =1
d) Media Agregada Simple: IBt 0 = =
x10 + x 20 + …… + x N0 N
(Índice de Bradstreet y Dûtot)
∑ x i0
i =1
2- PONDERADOS
N
t
∑ ωi ⋅ I0t (i)
a) Media Aritmética Ponderado: IP 0 = i =1
N
∑ ωi
i =1
1
N t ωi  N
= ∏ I0 (i)   ∑
G ωi
b) Media Geométrica Ponderado: IPt 0
 i=1   
i=1
N
∑ ωi
i =1
c) Media Armónica Ponderado: IPtH0 = N ω
∑ t
i
i =1 I0 (i)
ED 70
N
∑ ωi ⋅ x it
i =1
d) Media Agregada Ponderado: IPtA0 = N
∑ ωi ⋅ x i0
i =1
3- ÍNDICES DE LASPEYRES Y PAASCHE

ÍNDICE DE LASPEYRES
Es la media aritmética ponderada por el valor en el periodo base:
ωi = pi0 × qi0
Así que el índice queda:
N N pit N
∑ It 0 (pi ) ⋅ ωi ∑ p/ i0 × qi0 ∑ pit × qi0
i =1 / i0
i =1 p i =1
L t 0 (p) = N
= N
= N
∑ ωi ∑ pi0 × qi0 ∑ pi0 × qi0
i =1 i =1 i =1
N
∑ pi0 × qit
i =1
Para cantidades se expresaría: L t 0 (q) = N
∑ pi0 × qi0
i =1
Al elegir el periodo base, se debe elegir un año normal, sin irregularidades. Si no existe, se
promedian varios años, habiendo tres posibilidades:
• Cantidades: q′i =
qi0 + qi1 + …… + qin
→ L t 0 (p) =
∑ pit × q′i
n ∑ pi0 × q′i
pi0 + pi1 + …… + pin ∑ pit × qi0

• Precios: p′i = → L t 0 (p) =
n ∑ p′i × qi0
• Valores (es decir, ambos): L t 0 (p) =

∑ pit × q′i
∑ p′i × q′i
ED 71
ÍNDICE DE PAASCHE
Es la media aritmética ponderada por el valor de la cantidad del periodo corriente con
precios del periodo base:
ωi = pi0 × qit
Así que el índice queda:
N N pit N
∑ It 0 (pi ) ⋅ ωi ∑ p/ i0 × qit ∑ pit × qit
i =1 / i0
i =1 p i =1
Pt 0 (p) = N
= N
= N
∑ ωi ∑ pi0 × qit ∑ pi0 × qit
i =1 i =1 i =1
N
∑ pit × qit
i =1
Para cantidades quedaría: Pt 0 (q) = N
∑ pit × qi0
i =1
Este índice sólo puede compararse con el periodo base, ya que las ponderaciones varían en
cada periodo ( q it para precios, p it para cantidades). Por ello cada vez es menos utilizado.
4- EL ÍNDICE DE PRECIOS AL CONSUMO (IPC)

El IPC es una medida estadística de la evolución del conjunto de precios de los bienes y
servicios que consume la población residente en viviendas familiares en España.
Hasta la base 2001, el IPC basaba su cálculo en el sistema de base fija, que se
caracterizaba por mantener fijas la composición de la cesta de la compra y las ponderaciones
durante la vigencia de la base. Es decir, que sólo se cambiaban cada 8 o 9 años, que era la
periodicidad de la Encuesta Básica de Presupuestos Familiares (EBPF).
En 1997 se implantó la Encuesta Continua de Presupuestos Familiares (ECPF), que

sustituyó a la EBPF y a la encuesta trimestral, y permitía la actualización permanente de las
ponderaciones y la composición de la cesta. Así, desde 2001 comenzó un nuevo sistema de
cálculo más dinámico, ya que se revisan las ponderaciones anualmente. Además, se
estableció que los cambios de base se realizaran cada 5 años.
En el IPC base 2011, vigente desde enero de 2012, continúa este sistema, usando para ello
la información proporcionada por la Encuesta de Presupuestos Familiares (EPF) base 2006,
cuya principal característica es su periodicidad anual.
ÁMBITOS
1- Temporal: desde enero de 2012, el periodo base es el año 2011. El periodo de

referencia de los precios, como se usa el índice de Laspeyres encadenado, es el mes de
diciembre del año anterior al considerado. Y el periodo de referencia de las ponderaciones se
actualiza siendo diciembre del año anterior, utilizando la EPF de los últimos años con
información.
ED 72
Respecto a las ponderaciones, para ciertos niveles de desagregación, su periodo de
referencia es el mes de diciembre del año anterior, ya que su ponderación se actualiza
anualmente con la información de la EPF y otras fuentes. Aparte cada cinco años se realiza
un cambio de base, con el que se actualizarán las ponderaciones para todos los niveles
funcionales y geográficos.
2- Poblacional: en el IPC base 2011 el estrato de referencia incluye toda la población que
reside en viviendas familiares en España; se excluyen por tanto los gastos de las personas
que residen en hogares colectivos o instituciones (conventos, residencias de ancianos,
prisiones, etc.) y los gastos de los no residentes.
3- Geográfico: todo el territorio nacional. Dependiendo de los índices, puede haber

desagregaciones nacionales, autonómicas y provinciales.
4- Campo de consumo: es el conjunto de bienes y servicios que los hogares consumen

(sin gastos en b. de inversión, autoconsumos y autosuministros, alquileres imputados).
En la EPF siguen la clasificación internacional de consumo COICOP (Clasification Of
Individual COnsumption by Purpose).
La cesta de la compra es el conjunto de bienes y servicios seleccionados en el IPC, y cuya
evolución representa a la parcela COICOP a la que pertenecen. Son elegidos en base a la
información de las EPF. En el IPC base 2011 se compone de 489 artículos, cada uno bien
especificado para facilitar su identificación a los encuestadores.
5- Desagregación funcional: el IPC base 2011 se adapta completamente a la

clasificación internacional de consumo COICOP. La estructura funcional del IPC consta de 12
grupos, 37 subgrupos, 79 clases, 126 subclases, 57 rúbricas, y 29 grupos especiales.
Los 12 grupos son:
1- Alimentos y bebidas no alcohólicas
2- Bebidas alcohólicas y tabaco
3- Vestido y calzado
4- Vivienda
5- Menaje
6- Medicina
7- Transporte
8- Comunicaciones
9- Ocio y cultura
10- Enseñanza
11- Hoteles, cafés y restaurantes
12- Otros b y s.
Desagregación geográfica: en el IPC base 2011 sigue con los mismos niveles de
desagregación que el IPC 2006:
ÍNDICE Nacional CC. AA. Provincia

General X X X
Grupos X X X
Subgrupos X X X
Clases X
Subclases X
Rúbricas X X
Grupos Especiales X X
ED 73
DISEÑO MUESTRAL
a) Selección de municipios: atendiendo a criterios demográficos (como el IPC 2001) y a
representación geográfica (datos del Padrón Municipal a 1 de enero de 2010), se eligen 177
municipios, incluidas las 50 capitales de provincia y Ceuta y Melilla. En 97 se recogen precios
de toda la cesta, en 44 se recogen precios de toda la cesta de Alimentación y parte del resto,
y en 36 se recogen precios de una cesta reducida.
Debe destacarse que el porcentaje de población cubierto es superior al teórico, ya que
algunos de los establecimientos incluidos en la muestra reciben gente de fuera de sus
municipios (grandes centros comerciales por ejemplo).
b) Selección de zonas comerciales y establecimientos: se eligieron 33.000 establecimientos

siguiendo una serie de criterios:
• deben estar representadas todas las zonas comerciales y los distintos tipos de
establecimientos que existen.
• los establecimientos deben ser los de mayor afluencia de público en la localidad y/o
los de mayor volumen de venta.
• los establecimientos deben ser representativos del tipo de artículos sobre los que se
recoge información.
• no puede recogerse más de una vez al día el precio de un mismo artículo en cada
establecimiento.
• no debe concentrarse un número importante de observaciones de diferentes
artículos en un mismo establecimiento.
• los establecimientos de acceso restringido (economatos, cooperativas,…) no pueden
formar parte de la muestra.
c) Selección de artículos: se consulta a organismos, empresas y establecimientos, y junto a

la información de las EPF, se eligieron 489 artículos de acuerdo a los criterios:
• la evolución de sus precios debe ser similar a la del resto de artículos de la parcela
que representa.
• deben ser los artículos consumidos habitualmente por la población.
• deben tener precios fácilmente observables.
• deben ofrecer garantías razonables de permanencia en el mercado.
Con el paso al IPC base 2006, el número de observaciones ascendió a 220.000 precios
mensuales, cantidad mantenida en el IPC base 2011.
MÉTODO GENERAL DE CÁLCULO
La fórmula para calcular los índices es la de Laspeyres encadenado, empezada a usar en el

IPC base 2001.
N N pik
∑ pik × qki −1 ∑ k −1 i
pk −1 × qki −1
t t t N
i =1 pi
t
0 ILE = ∏ i =1
N
= ∏ N
= ∏ ∑ k −1 Iki ⋅ Wik −1
k =1
∑ pki −1 × qki −1 k =1
∑ pki −1 × qki −1 k =1 i =1
i =1 i =1
pki pki −1 × qki −1

donde k −1 Ii =
k
; Wik −1 =
pki −1 ∑ pki −1 × qki −1
i
ED 74
Hay índices simples, de los agregados elementales (un artículo en una provincia). Los
precios medios se calculan con la media geométrica sin ponderación:
nmt
i Pimt
Pi mt
= nmt
i
∏ Pi,mtj → mt
dic(t −1) Ii = × 100
j =1 Pi dic(t −1)
donde:
• Pi,mtj es el precio del agregado elemental i recogido en el establecimiento j en el m
del año t.
• nmt
i es el número de precios procesados del agregado elemental i en el m del año t.
mt
• dic(t −1) Ii es el índice referido a diciembre del año (t-1), del agregado elemental i,
en el mes m del año t.
• Pimt es el precio medio del agregado elemental i, en el m del año t.
• Pi dic(t −1) es el precio medio del agregado elemental i, en diciembre del año (t-1).
También hay índices agregados, de agregados funcionales, ‘A’, por provincia, ‘p’:
mt
dic(t −1) I A,p = i,p × dic(t −1)Wi,p
∑ dic(t −1) Imt
i∈A
donde:
mt
• dic(t −1) Ii,p es el índice referido a diciembre del año (t-1), del artículo i en la provincia
p en el mes m del año t.
• dic(t −1)Wi,p es la ponderación (en tanto por uno) referida a diciembre del año (t-1)
del artículo i en la provincia p, dentro de la agregación A, es decir:
gasto realizado en el artículo i dentro de la provincia p
dic ( t −1)Wi,p =
gasto realizado en la agregación funcional A dentro de la provincia p
Y de agregado geográfico, ‘R’, por agregado funcional ‘A’:

mt
dic(t −1) I A,R = ∑ mt
dic(t −1) I A,p × dic(t −1)WA,p
p∈R
donde:
mt
• dic(t −1) I A,p es el índice referido a diciembre del año (t-1), de la agregación funcional
A en la provincia p en el mes m del año t.
• dic(t −1)WA,p es la ponderación (en tanto por uno) referida a diciembre del año (t-1)
de la agregación A en la provincia p, es decir:
gasto realizado en el artículo i dentro de la provincia p
dic ( t −1)Wi,p =
gasto realizado en la agregación funcional A dentro de la provincia p
ED 75
Tasas de Variación:
• MENSUAL: es el cociente entre el índice del mes corriente, m, y el índice del mes
anterior, (m-1):
mt mt
I dic(t −1) I
Vmt (m −1)t = 11
(m −1)t
× 100 = (m −1)t
× 100
11I I
dic(t −1)
• ACUMULADA: se calcula como el cociente entre el índice del mes corriente, m, y el

índice de diciembre del año anterior:
mt
mt dic(t −1)
mt
I dic(t −1) I dic(t −1) Imt
V = 11
dic(t −1)
× 100 = dic(t −1)
× 100 = × 100
11 I dic(t −1) I 100
• ANUAL: se trata del cociente entre los índices del mes corriente, m, y del mismo mes del
año anterior, ambos en base 2011:
mt
mt m(t −1) I
V = 11
m(t −1)
× 100
11I
TIPOS DE ARTÍCULO
Los artículos pueden clasificarse según la periodicidad de recogida de sus precios

(mensuales y trimestrales), por el lugar de recogida (provincias o servicios centrales), y por
el método de cálculo de los índices elementales.
Los artículos estaciónales son aquellos que sufren fluctuaciones periódicas en sus precios y
cantidades consumidas. Por ello sus ponderaciones varían a lo largo del año.
Los artículos de recogida centralizada también tienen una metodología propia, debido a que
sus precios no se recogen en cada provincia, sino en los Servicios Centrales del INE, ya que
hay pocas empresas comercializadoras, y/o se dispone de un directorio perfectamente
definido de empresas informantes, o directamente se publican las tarifas en boletines
oficiales.
RECOGIDA DE PRECIOS
La recogida se realiza mediante un cuestionario generado automáticamente para cada

establecimiento, en el que el entrevistador anota los precios e incidencias relativos a los
artículos que aparecen en el mismo. Cada establecimiento es visitado por un solo
entrevistador, excepto los hipermercados y las grandes superficies.
En general, el período de recogida de los precios abarca aproximadamente desde el día 1 al

22 de cada mes, ambos inclusive. Sin embargo, en los artículos de recogida centralizada este
período se amplía, siempre que es posible, hasta el final del mes correspondiente.
Desde el IPC, base 2001, se recogen las reducciones de los precios debidas a ofertas y
promociones, y a los periodos oficiales de rebajas.
ED 76
TRATAMIENTO DE LA INFORMACIÓN
Tras la recogida de la información, se procede a la depuración de los datos. En general, se

revisan todas las variaciones superiores al 10% o inferiores al –10%, para los artículos de
Alimentación, y las superiores al 5% y las negativas, para el resto de artículos.
Además de eso, también se realiza el tratamiento de la falta de precio, es decir, se estima
el precio de aquellos artículos que no estaban disponibles en el momento de la visita al
establecimiento.
Los cambios de calidad son un problema que debe ajustarse. Se dan cuando un artículo
integrante del IPC es sustituido por otro, y hay que determinar qué parte de la diferencia de
precios se debe a una calidad diferente. Los métodos más habituales son: ajuste total de
calidad, ajuste por calidad idéntica, regresión hedonista, precios de solapamiento.
ENLACE DE SERIES
Antes cada cambio de base suponía una ruptura en las series, teniendo que calcular unos
coeficientes de enlace. A partir de 2001, el IPC es un índice encadenado, por lo que no es
necesario calcular ningún coeficiente de enlace. Por tanto, en el IPC base 2011 sólo se
cambió el periodo de referencia o base, teniendo que calcular simplemente un coeficiente de
re-escala, que hace que la media aritmética simple de índices de 2011, en base 2006, sea
100:
100
Cre −escala = 12
1
∑
12 m=1 06 I
m11
Se ha establecido que cada cinco años se cambiará la base, realizando una revisión
completa de la metodología y la muestra, y la actualización de ponderaciones a todos los
niveles de desagregación.
5- ÍNDICE DE PRODUCCIÓN INDUSTRIAL (IPI)

El IPI es un índice de volumen cuya finalidad es medir la evolución en el corto plazo del
valor añadido de las ramas industriales. Su periodicidad es mensual.
El ámbito poblacional del IPI es el conjunto de las actividades industriales, es decir, las
pertenecientes a las secciones B, C y D de la CNAE 2009 (versión española de la NACE Rev.
2). Por tanto mude la evolución de la cantidad y la calidad, sin influencia de los precios.
Su ámbito temporal es el mes.
Y respecto al geográfico, se calculan datos a nivel nacional y por comunidades autónomas
sin incluir a Ceuta y Melilla.
El Marco de la Encuesta es el Directorio Central de Empresas y Establecimientos. Se trata

de un registro organizado de información con datos de identificación, localización,
distribución territorial y clasificación por tamaño y actividad económica de las unidades:
empresa y establecimiento. No obstante, el DIRCE se utiliza de forma indirecta como marco
poblacional del IPI en el caso de las secciones C y D, puesto que, en la práctica, la selección
de las unidades informantes del IPI para estas secciones se realiza a partir de los
establecimientos de la Encuesta Industrial Anual de Productos (EIAP).
La muestra de establecimientos que suministran información está compuesta por un panel

de establecimientos que, según la Encuesta Industrial Anual de Productos, producen un
ED 77
porcentaje significativo de cada bien seleccionado en la cesta, como más representativo de
cada clase de la CNAE 2009. La muestra está formada por unos 11.500 establecimientos
La recogida de la información se realiza a través de las Delegaciones Provinciales y los

Servicios Centrales del INE. El sistema de recogida es mediante la cumplimentación de un
cuestionario mensual por parte del informante del establecimiento.
El Índice de Producción Industrial base 2010 es un índice de Laspeyres de base fija. Un

agregado elemental es el componente de más bajo nivel de agregación para el cual se
obtienen índices y en cuyo cálculo no intervienen ponderaciones. A los índices de estos
agregados se les denomina índices elementales o índices simples. En el caso del IPI los
agregados elementales son los productos más adecuados para aproximar la evolución de la
actividad de cada una de las clases (cuatro dígitos) de las secciones B, C, D y división 36 de
la CNAE 2009.
El IPI tiene desagregación geográfica (nacional y autonómicos) y funcionales (secciones,

divisiones, grupos y clases). En el caso de los índices generales nacional y autonómicos
también puede tenerse en cuenta el destino económico de los bienes.
Los índices corregidos del efecto calendario eliminan la influencia del número de días
laborables y festividades de cada Comunidad Autónoma para poder hacer comparaciones.
Cálculo de índices:
• SIMPLE: expresión de la fórmula de cálculo de los índices elementales de los productos

que componen la cesta:
N
∑ t
qi,h
{h∈A t }
I = 0 Iit −1 ⋅
t
0 i N
t −1
∑ qi,h
{h∈A t }
donde:
t
• 0 Ii es el índice elemental i en el periodo t con respecto al periodo base 0 en la
comunidad autónoma o nacional (A).
t −1
• 0 Ii es el índice elemental i en el periodo (t-1) con respecto al periodo base 0 en la
comunidad autónoma o nacional (A).
t
• qi,h es el dato de producción para el producto i en el mes t facilitado por el
informante h, situado en la comunidad autónoma o nacional (A).
t −1
• qi,h es el dato de producción para el producto i en el mes (t-1) facilitado por el
informante h, situado en la comunidad autónoma o nacional (A).
• h ∈ A t es cada uno de los establecimientos que dan información en el mes t y (t-1)
situados en la comunidad autónoma o nacional (A).
• AGREGADO: se obtiene como la suma ponderada de los índices elementales de los

productos que pertenecen a cada clase. La ponderación se extrae de la EIAP. Como no se
tiene el valor añadido de cada bien, se usa el valor de la producción:
VPi,0
0 It = ∑ ⋅ 0 Iit = ∑ Wi,0 ⋅ 0 Iit
i∈clase ∑ VPj,0 i∈clase
j∈clase
ED 78
Los índices de cualquier agregación funcional a nivel más agregado, grupos, divisiones,
secciones de la CNAE 2009 o sectores económicos por destino económico de los bienes
(bienes de consumo duradero, bienes de consumo no duradero, bienes que equipo, bienes
intermedios y energía) se obtienen como agregación de los índices del nivel agregado inferior
y pertenecientes al que deseamos calcular, utilizando como pesos o ponderaciones el valor
añadido generado en esa actividad o sector en el año base, en el ámbito territorial
correspondiente (comunidad autónoma o territorio nacional), respecto al valor añadido
generado por todas las actividades o sectores incluidos en ese nivel.
N VABi,0 N
I =∑
0 t N
⋅ 0 Iit = ∑ Wi,0 ⋅ 0 Iit
i =1
∑ VAB j,0 i=1
j =1
6- DEFLACTACIÓN DE SERIES MONETARIAS (fuera del

programa)
Consiste en transformar valores monetarios nominales en moneda de poder adquisitivo
constante (valor real):
N N
deflactar
∑ pit × qit  
→ ∑ pi0 × qit
i =1 i =1
(valor no min al) (valor real)
∑ pit × qit ∑ pit × qit

• Usando el Índice de Paasche: i
= ∑ pi0 × qit = i
∑ pit × qit i Pt 0 (p)
i
∑ pi0 × qit
i
Es lo óptimo, pero para calcularlo se necesita el índice de Paasche, que no siempre está
disponible. Por esto es más usado el deflactor con el índice de Laspeyres, aunque no da
realmente el valor de la cantidad actual a precios de periodo base.
∑ pit × qit ∑ pit × qit

• Usando el Índice de Paasche: i
= ∑ pi0 × qi0 × i
= V0 × Pt 0 (q)
∑ pit × qi0 i ∑ pit × qi0
i i
∑ pi0 × qi0
i
ED 79

Estadística Descriptiva DEE

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística Descriptiva DEE

Cargado por

Copyright:

Formatos disponibles

TEMA 1: CONCEPTOS BÁSICOS

- Estadística Matemática o Teórica: estudia las leyes del comportamiento de los

El cálculo de probabilidades permite inferir datos de una pequeña muestra a un gran

2- CARACTERES: VARIABLES Y ATRIBUTOS

- Cualitativos o Atributos: no pueden medirse, sus distintas modalidades se describen

• nominales: sus modalidades no se ordenan (sexo)

- Cuantitativos o Variables: toman valores numéricos, es decir se describen con

3-DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES

• Frecuencia relativa (fi): proporción de individuos con un valor.

• Frecuencia relativa acumulada (Ni): proporción de observaciones menores o

Si la variable es continua, los datos se agrupan en intervalos de una cierta amplitud,

Pueden clasificarse por el tiempo (estáticos o dinámicos), por el sistema (cartesianos,

a) Diagrama de rectángulos: sobre un eje cartesiano se representa cada modalidad

e) Diagrama de Pareto: se ordenan las modalidades de mayor a menor, y entonces se

c) Diagrama acumulativo o de escalera: representa las frecuencias acumuladas,

a) Histograma: sobre un eje cartesiano se representa cada modalidad con un

c) Diagrama acumulativo: es similar al caso discreto, excepto que se supone que

d) Diagrama de tallos y hojas: es una especie de diagrama de barras horizontal, en el

Es el centro de gravedad de la distribución, es decir, la suma de las diferencias de todos los

De esta ecuación se deriva la expresión más común de la media aritmética:

2) La suma de la diferencia entre las observaciones y la media es cero:

3) Responde a cambios de escala (homogeneidad) y origen:

4) La media aritmética de una combinación lineal de v.a. es la combinación lineal de las

5) Composición de poblaciones o media de medias: la media de un conjunto de muestras

6) Minimiza el sumatorio de los cuadrados de las diferencias de las observaciones respecto

CÁLCULO ABREVIADO: con objeto de facilitar el cálculo práctico de la media, cuando la

1) El logaritmo de la media geométrica es la media aritmética de los logaritmos de los

2) La media geométrica de las observaciones dividida por su media es uno:

3) Responde a cambios de escala (homogeneidad):

Se aplica fundamentalmente en Economía, sobre todo para promediar porcentajes, tasas,

1) El inverso de la media armónica es la media aritmética de los inversos de los valores:

2) Responde a cambios de escala (homogeneidad):

Usa todas las observaciones en su cálculo, y en algunas ocasiones es más representativa

Por el contrario, se vuelve indeterminada cuando alguna observación es cero, y le influyen

Se usa cuando no se quiere tener en cuenta el signo de los valores.

RELACIÓN ENTRE MEDIAS

• Datos desagregados: si el número total de observaciones, N, es impar, se toma el valor

donde L i−1 es el límite inferior del intervalo mediano y ci su amplitud.

PROPIEDAD: El sumatorio de las desviaciones absolutas respecto a un punto se hace

∑x i − k − ∑ x i − Me = 2∑ ( k − x i ) > 0 ⇒ ∑x i − k > ∑ x i − Me ∀k > Me

Para k < Me (entonces x1 ≤ x2 ≤ … ≤ x a−1 ≤ k ≤ xa ≤ … ≤ xm−1 ≤ Me ≤ xm ≤ … ≤ xn ):

∑x i − k − ∑ x i − Me = ∑ ( k − Me ) + ∑ ( 2x i − k − Me ) + ∑ (Me − k ) Sumando y restando ∑ (k − Me )

∑x i − k − ∑ x i − Me = 2∑ ( x i − k ) > 0 ⇒ ∑x i − k > ∑ x i − Me ∀k < Me

Responde a cambios de escala y de origen.

Su mayor desventaja radica en que no se adapta a cálculos posteriores.

• Datos desagregados: en este caso la identificación de la moda es inmediata. Se trataría

donde L i−1 es el límite inferior del intervalo modal y ci su amplitud.

Responde a cambios de escala y origen.

Es buena cuando hay mucha concentración. Es fácil de interpretar, y de calcular.

CÁLCULO DE LOS CUANTILES

Al igual que con la mediana, se tomarán unos supuestos:

donde L i−1 es el límite inferior del intervalo del cuantil y ci su amplitud.

La media aritmética, centro de gravedad de la distribución, utiliza todas las observaciones,

La mediana no maneja toda la información, pero no le influyen los datos atípicos. Es

Otros tipos de recorrido que intentan subsanar estas deficiencias:

1) Nunca es negativa: S2x ≥ 0

3) Coincide con la diferencia entre el momento ordinario de segundo grado y el cuadrado

4) Teorema de König: la media de los cuadrados de las desviaciones respecto de un

Muy relacionada con esta medida se encuentra la cuasivarianza (usada en inferencia):

2) Responde a cambios de escala, pero no de origen:

Al igual que la varianza, es bastante sensible a los datos atípicos

En distribuciones simétricas, como la normal, se cumple que los intervalos:

• ( x − 2σ ; x + 2σ ) comprende el 95% de las observaciones

• ( x − 3σ ; x + 3σ ) comprende el 99,7% de las observaciones