Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 1
Concepto de Estadstica
ESTADSTICA
ESTADSTICA INFERENCIA
PROBABILIDAD
DESCRIPTIVA ESTADSTICA
En resumen:
z Si se quiere resumir la distribucin de los caracteres observados,
usaremos la Estadstica Descriptiva.
z Si, por el contrario, se espera generalizar las caractersticas
obtenidas a la poblacin, estaremos ante la Estadstica
Inferencial.
Tema 2
Series Estadsticas.
Tabulacin y Representacin
EE I 9
Conceptos Previos
Toda investigacin estadstica empieza esencialmente por observar y anotar
las caractersticas del fenmeno que se quiere estudiar. Por ello, partiremos de
una serie de conceptos:
EE I 12
Conceptos:
0 45 0,3 45 0,3
1 60 0,4 105 0,7
2 21 0,14 126 0,84
3 15 0,1 141 0,94
4 6 0,04 147 0,98
5 3 0,02 150 1
150
Ventajas:
- Permiten realizar una labor de sntesis buscando las regularidades y periodos.
- Constituyen un mtodo de control ya que descubren las variaciones anormales debidas a alguna razn o
a un error.
- Se pueden descubrir errores de imprenta o de clculo.
- En un nico grfico se pueden representar varias tablas estadsticas, lo que permitir el estudio y
comparacin de fenmenos relacionados entre s o contrapuestos.
Inconvenientes:
- No sustituyen a la tabla estadstica, sino que la completan.
- Deben rotularse con un ttulo adecuado, en el que estn perfectamente delimitados los hechos
observados en el espacio y en el tiempo.
- La lectura de un grfico es menos precisa que la de una tabla estadstica, ya que se basa en
impresiones visuales de longitud, reas o diversas tonalidades cromticas.
- Las unidades de las escalas de los grficos pueden ampliarse o reducirse, exagerando hechos
insignificantes o atenuando los importantes.
EE I 17
Ejemplo: Las exportaciones en miles de millones de ptas en Espaa entre
el ao 1981 y 1992 fueron las que se presentan a continuacin.
7000
6000
8000
Exportaciones
5000
Exportaciones
6000
4000
4000
3000
2000
2000
0
1000
1980 1982 1984 1986 1988 1990 1992 1994
0 Aos
1980 1982 1984 1986 1988 1990 1992 1994
Aos
EE I 18
Distribuciones de frecuencias unidimensionales: variables no
agrupadas en intervalos:
Diagrama de barras Polgono de frecuencias
70 70
Nmero de familias
Nmero de familias
60 60
50 50
40 40
30 30
20 20
10 10
0 0
0 1 2 3 4 5 -1 0 1 2 3 4 5 6
Nmero de hijos Nmero de hijos
EE I 19
Distribuciones de frecuencias unidimensionales: variable agrupada
en intervalos.
Polgono de frecuencias
Histograma
10
10
8
8
Densidades
Densidades
6
6
4 4
2 2
0 0
[140,160) [160,170) [170,175) [175,180) [180,200) [140,160) [160,170) [170,175) [175,180) [180,200)
Estaturas
Estaturas
160
140
120 POLGONO ACUMULATIVO: Se
100
construye trazando, sobre cada intervalo,
Ni
80
60 lneas hasta la altura Ni o Fi de cada uno.
40
20
0
140 150 160 170 180 190 200
Estaturas
EE I 20
Distribuciones de frecuencias bidimensionales:
Nube de puntos
1600
1400
Renta nacional
1200
1000
800
600
400
200
0
25 30 35 40 45 50
Produccin elctrica
7000
6000
Exportaciones
5000
4000
3000
2000
1000
0
1980 1982 1984 1986 1988 1990 1992 1994
COORDENADAS POLARES: Se utilizan para
Aos fenmenos que presentan movimientos
peridicos de 1 ao.
COORDENADAS CARTESIANAS: Se
representan los periodos de tiempo frente a DIAGRAMAS DE
los valores de la variable a estudiar. Oeste
Norte
SECTORES: Se
trata de un crculo
Otras representaciones: Este
dividido en tantos
sectores como
PIRMIDES DE EDADES: Son histogramas modalidades del
Sur
de frecuencias, pero con los ejes cambiados. Se atributo.
usan mucho para estudiar la distribucin de los ni
N de grados = .360
habitantes segn su edad y sexo. N EE I 22
Estadstica Empresarial I
Tema 3
Distribuciones de frecuencias
unidimensionales
2 3 6 ( x x ).n
i =1
i i =0
Ventajas Inconvenientes
- Es fcil de calcular. - Es bastante sensible a valores
- Intervienen todos los valores de la extremos, lo cual puede distorsionar
variable su valor y su representatividad.
Ventajas Inconvenientes
- Intervienen todos los valores de la -Influencia de los valores pequeos de la
variable. variable, destacando su no determinacin
- En algunos casos, es ms representativa cuando alguno de los valores de la variable
que la media aritmtica. es igual a 0.
Mo = x j / n j = max ni
i
xi ni xi ni
1 3 0 2
2 4 2 9
8 8 3 9
15 10 8 8
21 1 9 6
26 34
EE I 30
DISTRIBUCIN AGRUPADA EN INTERVALOS: En este caso, primero
se determinar el intervalo modal, que ser aquel que tenga asociado
una mayor frecuencia absoluta (si la amplitud es constante) o densidad
de frecuencia (si la amplitud es variable).
INTERVALO MODAL
[ Lj,Lj+1)
EE I 32
di
di+1
di-1
h
Li Li+1
h h hi 1 hi 1
= i 1 h = ai Mo = Li + ai
ai h hi +1 hi 1 + hi +1 hi 1 + hi +1
con hi 1 = d i d i 1 y hi +1 = d i d i +1
NOTAS:
- El valor de la moda no coincide por ambos mtodos, ya que son ambos mtodos aproximados.
- Si la amplitud de los intervalos es constante, las densidades de frecuencia se sustituyen por las
frecuencias absolutas.
3
Mo = 1 + 2 = 1,857
4+3
54 1
Mo = 1 + 2 = 1+ 2 = 1,666
(5 4) + (5 3) 1+ 2
EE I 34
Mediana: Es aquel valor tal que, una vez ordenados los valores de la
variable en orden creciente, deja a su izquierda y a su derecha igual
nmero de frecuencias.
[Li ,Li+1) ni Ni
[2,4) 2 2
[4,7) 3 5
[7,9) 2 7
[9,12) 1 8
Ni=
[12,20) 4 12
12
Ni-1=
Teorema de Tales
h sobre ABC
a c h N / 2 N i 1
= =
b d ai ni
N / 2 N i 1
h= ai
Li= =Li+1
ni EE I 36
Por tanto, para obtener la mediana, usaremos la expresin:
N
N i 1
Me = Li + 2 ai
ni
Ventajas Inconvenientes
- Facilidad de clculo. - En su determinacin no intervienen todos
- No es sensible a valores extremos, ya que los valores de la variable, por lo que no
no los tiene en cuenta. utiliza toda la informacin disponible.
EE I 37
RELACIONES ENTRE LAS MEDIDAS DE TENDENCIA CENTRAL:
k
( xi P).ni
( xi P).ni
i =1 N
(Media de las desviaciones respecto a P)
Ventajas Inconvenientes
-Es una buena medida de dispersin - Viene expresada en una unidad distinta a
cuando se ha utilizado la media como la de la variable, concretamente, en las
medida de posicin. unidades de la variable al cuadrado.
EE I 44
PROPIEDADES DE LA VARIANZA:
S X = 0.89 = 0.943
EE I 46
Medidas de dispersin relativas:
m2 = a2 a12
EE I 50
Medidas de forma
Las medidas de forma establecen una tipologa de las distribuciones
segn la forma de su representacin grfica. Se van a clasificar en:
medidas de asimetra y medidas de curtosis o apuntamiento.
CAMPANIFORME
P = x = Me
EN FORMA DE U
P = x = Me
EE I 52
Distribucin asimtrica : Puede serlo a la derecha o a la izquierda.
Una distribucin es
asimtrica a la derecha o
positiva si la distribucin
se orienta ms hacia la
derecha que a la izquierda
de la media aritmtica (los
datos estn ms dispersos
a la derecha de la media).
Una distribucin es
asimtrica a la izquierda
o negativa si la
distribucin se orienta ms
hacia la izquierda que a la
derecha de la media
aritmtica (los datos estn
ms dispersos a la
izquierda de la media).
EE I 53
Si la distribucin es asimtrica a la derecha, de las dos ramas de la curva que
separa la media, la de la derecha es ms larga que la de la izquierda. Si es
asimtrica a la izquierda, ocurrir lo contrario.
COEFICIENTE DE APUNTAMIENTO
DE FISHER
m4 a4 4a1a3 + 6a12 a2 3a14
g2 = 4 =
S S4
g 2 < 3 Platicrtica
g 2 = 3 Mesocrtica
g 2 > 3 Leptocrtica
CURVA DE LORENZ:
0 pi , qi 100
EE I 59
xi ni xi.ni Ni ui pi=(Ni/N).100 qi=(ui/uk).100
x1 n1 x1.n1 N1 u1 p1 q1
x2 n2 x2.n2 N2 u2 p2 q2
: : : : : : :
: : : : : : :
xk nk xk.nk Nk uk pk=100 qk=100
N uk
Si los valores de la
variable estn ordenados
de menor a mayor, se
verifica que pi qi.
La curva de Lorenz se
situar entre los dos
casos extremos que se
consideran.
EE I 62
NDICE DE GINI:
k 1
(p q ) i i
CASOS EXTREMOS
IG = i =1
k 1
, 0 IG 1 Concentracin mnima: Concentracin mxima:
p
i =1
i pi = qi , i = 1, ..., k. qi = 0 , i = 1, ..., k-1.
k 1 k 1 k 1
(p q ) i i
0 (p q ) p i i i
k-1 9833 9450 383 Por tanto, podemos concluir que la distribucin est poco
24232 5942 concentrada, estando los salarios bastante bien repartidos.
Si bien el ndice de Gini tiene la ventaja de resumir en una sola cifra las
complejas informaciones expresadas en la curva de Lorenz, puede
darse el caso de que dos distribuciones de frecuencias diferentes
presenten el mismo valor del ndice de Gini, an siendo la estructura del
reparto de los valores de cada variable diferentes.
Ejemplo: Las distribuciones de
frecuencias A y B generan las curvas
de Lorenz siguientes, que muestran
una estructura de reparto distinta. Sin
embargo, puede comprobarse que: .
I GA = I GB
EE I 64
Estadstica Empresarial I
Tema 4
Distribuciones de frecuencias
q-dimensionales
Ejemplo: Sobre un grupo de empresas podemos observar sus ingresos (X) y sus gastos (Y),
o bien, su nmero de trabajadores (X), los salarios que perciben (Y) y las horas de trabajo
que realizan (Z). Sobre un grupo de personas estudiamos su altura (X) y su peso (Y).
n
i =1 j=1
ij =N f
i =1 j=1
ij =1 n
i =1
i. =N n j=1
.j =N
EE I 67
Ejemplo: En una determinada oposicin se quiere estudiar la relacin
entre la edad de los 15 aspirantes (X) y la calificacin que han obtenido
(Y). A partir de las observaciones obtener la tabla de correlacin.
X 23 25 26 26 25 21 28 23 28 22 26 26 22 26 26
Y 3 3 4 3 8 4 5 5 5 4 3 3 6 3 4
X Y X Y
n ij
xi ni. yj n.j xi / Y=yj ni/j yj / X=xi nj/i n ij f
fi / j = = N = ij
x1 n1. y1 n.1 x1 n1j y1 ni1 n . j n . j f. j
N
x2 n2. y2 n.2 x2 n2j y2 ni2 n ij
: : : : : : : : f j/ i
n
= ij = N = ij
f
n i. n i. f i.
xh nh. yk n.k xh nhj yk nik N
N N n.j ni.
EE I 69
Ejemplo: Para el ejemplo anterior de la oposicin, obtener:
X (edad) 23 25 26 26 25 21 28 23 28 22 26 26 22 26 26
Y (nota) 3 3 4 3 8 4 5 5 5 4 3 3 6 3 4
n i. n . jn ij
X e Y son independientes f ij = = = f i.f. j , i, j
N N N
Si X e Y son independientes estadsticamente, entonces fi/j = fi. y fj/i = f.j
nij ni. n. j nij ni. n. j
n n n n
fi / j = ij = N = N N = i. = f i. f j /i = ij = N = N N = . j = f. j
n. j n. j indep n. j N ni. ni. indep ni. N
N N N N EE I 70
Distribuciones Q-dimensionales
Habitualmente, en los problemas reales intervienen ms de dos
caractersticas, por lo que se hace necesario el estudio de las distribuciones Q-
dimensionales.
Dada una variable Q-dimensional (X1, X2, ..., XQ), el conjunto de observaciones
de esta variable acompaadas de sus correspondientes frecuencias absolutas
conjuntas, constituye la distribucin conjunta Q-dimensional, que se tabula de
la siguiente forma:
X1 X2 ... XQ n ( X1 ,X 2 ,...,X Q ) X Y Z n ( X ,Y , Z)
x11 x21 ... xQ1 n1 x1 y1 z1 n1
x12 x22 ... xQ2 n2 x2 y2 z2 n2
... ... ... ... ... ... ... ... ...
Q=3
x1i x2i ... xQi ni xi yi zi ni
... ... ... ... ... ... ... ... ...
x1h x2h ... xQh nh xh yh zh nh
N N EE I 71
DISTRIBUCIONES MARGINALES Y CONDICIONADAS DE (X,Y,Z)
EE I 73
COVARIANZA Se trata de una medida que hace referencia a
la dependencia lineal existente entre ambas
h k ( x i x ) ( y j y) n ij variables. Si la covarianza es positiva, las
m11 = = SX Y dos variables varan en el mismo sentido, y si
i =1 j=1 N
es negativa, lo harn en sentido opuesto.
INDEPENDENCIA Y COVARIACIN:
Momentos de rdenes r1, r2, ..., rQ Momentos de rdenes r1, r2, ..., rQ
respecto al origen respecto a la media
(x1i x1) 1 (x2i x2 ) 2 ...(xQi xQ ) Q ni
r r r k r r r
x 11i x 22i ...x QiQ n i
mr1 r2...rQ =
k
a r1 r 2 ...r Q =
i =1 N i=1 N
MATRIZ DE COVARIANZAS
Casos particulares:
a100...0 = x1 a 010...0 = x 2 L a 00...01 = x Q S11 S12 L S1Q
S21 S22 L S2 Q
m 200...0 = S11 m 020...0 = S22 L m 00...02 = SQQ S=
M M M M
m1100...0 = S12 m10100...0 = S13 L m 00...011 = SQ 1Q S EE I 75
Q1 SQ 2 L SQQ
Estadstica Empresarial I
Tema 5
Regresin y correlacin
bidimensional y mltiple
Qu tipo de ajuste
plantearas en cada
caso?
H H H
=0 =0 L =0
a1 a2 aR
AJUSTE LINEAL: H N N
a = 0 yi = N a + b x i
i =1 i =1
yti = f (xi, a, b) = a + b xi
H = 0 x y = a x + b x2
N N N
b
i =1
i i
i =1
i
i =1
i
AJUSTE PARABLICO: H N N N
a = 0 y i = N a + b x i + c x 2
i
i =1 i =1 i =1
H N N N N
b i =1 i =1 i =1 i =1
H N N N N
= 0 x i y i = a x i + b x i + c x i4
2 2 3
c i =1 i =1 i =1 i =1
EE I 80
AJUSTE EXPONENCIAL:
N N
ln y i = N ln a + ln b x i
xi i =1 i =1
yti = f (xi, a, b) = a b N N N
x ln y = ln a x + ln b x 2
ln yti = ln a + xi ln b
i =1
i i
i =1
i
i =1
i
AJUSTE POTENCIAL:
N N
ln y i = N ln a + b ln x i
b i =1 i =1
yti = f (xi, a, b) = a x i N N N
ln x ln y = ln a ln x + b (ln x ) 2
ln yti = ln a + b ln xi
i =1
i i i =1
i
i =1
i
AJUSTE HIPERBLICO: N N
1
i y = N a + b
1 i =1 i =1 x i
yti = f (xi, a, b) = a + b N
xi 1 y =a
N
1 N
1
i + b 2
i =1 x i i =1 x i i =1 x i
EE I 81
TIPOS DE AJUSTES
EE I 82
Ejemplo 1: Ajustar a las siguientes Ejemplo 2: Ajustar a las siguientes
observaciones la funcin que mejor observaciones la funcin que
explique Y a partir de X. Los datos mejor explique Y a partir de X. Los
son: (1,2), (2,2), (3,5), (4,6), (5,8). datos son: (1,2), (2,18), (3,36),
(4,12), (5,1).
Y = - 02 + 16 X
N N N
X
2 SXY
i =1
x i yi = a x i + b x i
i =1 i =1
a = y 2 x
SX
2 H 2 H
a2 ab = 2.N > 0
>0 y H= 2 >0 a 2
a 2
H H
2
ba b2 H = 2.N.S2X > 0
EE I 85
Coeficiente de determinacin y de correlacin lineal
Una vez que se ha realizado un ajuste para tratar de explicar una
variable Y en funcin de otra variable X, necesitaremos obtener un
indicador de la bondad del ajuste planteado.
VT = S =
2 d 2
i (y i yt i )2
VT = VE + VR
Y
i =1 N VR = S2ry = i =1
= i =1
EE I 86
N N
Para medir la bondad del ajuste planteado podra considerarse la
proporcin de la varianza total que queda explicada por la regresin.
2
VE VT VR VR S
Coeficiente de determinacin R2 = = = 1 = 1 r2y
VT VT VT SY
As, cuanto mayor sea el valor de R2, mejor ser el ajuste realizado, ya
que la varianza residual sera pequea.
R2 = 0 S2ry = S2Y (Ajuste psimo)
0 R2 1
R2 = 1 S2ry = 0 (Ajuste perfecto)
Para el caso de la regresin lineal, la varianza residual tomar el valor
2
siguiente: S2 = S2 SXY
ry Y
S2X
2 S2XY
SY SY 2
2
Coeficiente de S 2
S 2
S 2
S X S 2
r2 = 1 2 =
r y Y r y
= = XY
determinacin lineal SY S2Y S2Y S2X S2Y
EE I 88
CASOS POSIBLES:
En resumen:
EE I 91
Ejemplo: Supongamos que hemos obtenido una recta de regresin que
nos explica el gasto mensual por individuo en bebidas alcohlicas (Y) en
funcin del sueldo mensual (X). Predecir el gasto en bebidas alcohlicas
para un individuo que gana mensualmente 300000 ptas, y para otro que
gana 700000 ptas.
Y = - 20000 + 022 . X
EE I 93
Estadstica Empresarial I
Tema 7
Nmeros ndices
I 0 (X)
ndice de producto de magnitudes: I 0 (X .Y) = I 0 (X ) I 0 (Y)
t t t
w w
N
I1w1 + ... + I N wN I w N N N i i
I
i i wi wi I =
* i =1
= i =1
I =
*
= i =1
I =
* i =1 w1
I ...I wN
= i=1 wi H
1 1 N
1
N
w i w
N
i
G 1 N
i =1
i
I1
w1 + ... +
IN
wN I
i =1
wi
i
i =1 i =1
EE I 100
ndice media agregativa
ponderado
N
x w + ... + x Nt wN x w it i
I A* = 1t 1 = i =1
x10 w1 + ... + x N 0 wN N
x
i =1
i0 wi
NOTAS:
Los sistemas (1) y (2) corresponden a situaciones reales, mientras que (3) y (4) no.
Los sistemas (2) y (3) tienen el gran inconveniente de que necesitan conocer las
cantidades consumidas en el periodo actual, lo cual no es simple posible.
Los sistemas ms utilizados son el (1) y (3).
Si la magnitud X es la cantidad, se utilizan los mismos sistemas de ponderacin,
cambiando precios (p) por cantidades (q).
EE I 101
ndice de precios de Laspeyres: Se trata de un ndice media aritmtica
ponderado obtenido usando el sistema de ponderacin (1): wi = pi0 qi0
N N N
p it
I w i i
i =1 p
pi0q i0 p q it i0
Determina el incremento de valor que experimenta un
conjunto de artculos o bienes entre los periodos 0 y t,
L p = I ( P) = i =1
N
= i0
N
= i =1
N suponiendo que las cantidades consumidas son las
w
i =1
i p i =1
i0 qi0 p i =1
i0 qi0 mismas para ambos periodos e iguales a qi0.
DEFLACTACIN:
Pp 0
t
corregir el efecto de la prdida del valor del dinero y hacer
i =1 comparaciones en una unidad comn.
Tema 8
Series Temporales
EE I 111
Naturaleza de las Series Temporales
Una serie temporal est formada por varias componentes, que son
las encargadas de explicar los cambios observados en la variable a lo
largo del tiempo. La descomposicin ms comn es la que distingue las
componentes tendencial, estacional, cclica y aleatoria, propuesta por
el enfoque clsico de las series temporales.
EE I 112
2. Variaciones estacionales: Son las oscilaciones a corto plazo que se
reproducen de forma peridica ms o menos regular con periodo
constante igual o inferior al ao, debidas principalmente a las influencias
de las estaciones del ao, causas climatolgicas, costumbres, etc.
Ejemplos: Las temperaturas medias mensuales
tienen cada ao un mximo en verano y un mnimo
en invierno, por lo que presentan periodicidad anual;
el volumen de compras diarias que se realiza en un
supermercado presenta mximos y mnimos a
principios y a finales de mes, respectivamente, luego
presenta periodicidad mensual,...
En la grfica siguiente se representa la serie del
IPI (ndice de Produccin Industrial) y se observa la
cada del mes de agosto, comportamiento que se
repite de forma regular y peridica.
3. Movimientos cclicos: Son movimientos a medio plazo que se
reproducen de manera peridica, pero no tan regular como los de la
componente estacional. Con un periodo no constante y ms amplio que
los periodos estacionales, los ciclos observados en series econmicas
estn asociados principalmente a la alternancia de etapas de prosperidad
y depresin de la actividad econmica. EE I 113
4. Variaciones irregulares o aleatorias: Son comportamientos que no
muestran carcter peridico ni regular y que se deben a fenmenos
catastrficos o fortuitos que afectan de manera casual a la variable, como
pueden ser inundaciones, terremotos, incendios, accidentes, huelgas,...
EE I 115
Anlisis de la Tendencia Secular
Los procedimientos estadsticos que se utilizan para estimar la
componente tendencial (responsable del comportamiento a largo plazo
de la serie) se dividen en analticos y no analticos.
MTODOS NO ANALTICOS:
EE I 116
2. Ajuste por medias mviles: Consiste en hallar las medias de cada
grupo de R observaciones consecutivas, siendo R generalmente el
nmero de observaciones anuales de las que se dispone.
MEDIAS MVILES DE ORDEN R
R IMPAR R PAR
y R +1 + y R +3
y1 + y 2 + ... + y p
y R +1 = y R +2 = 2 2
2
R 2 2
y 2 + y 3 + ... + y p +1 y R +3 + y R +5
y R +3 = y R +4 = 2 2
R
2 2 2
y 3 + y 4 + ... + y p + 2 y R +5 + y R +7
y R +5 =
2
R y R +6 = 2 2
2 2
M
M
Y = N .a + b t
i =1
i
i =1
i
N N N
Y = 31992 + 985 t
t Y =a t
i =1
i i
i =1
i + b t i2
i =1
EE I 123
Ejemplo: Se cuenta con una serie temporal de los precios medios por
trimestre de un determinado producto, entre los aos 1995 y 1998.
EE I 124
Los IGVE miden el nivel porcentual
del componente estacional con
respecto al nivel medio o tendencia.
La media de los IGVE debe ser
igual a 100 (o a 1), indicando que en
un periodo anual las fluctuaciones
estacionales se deben compensar; al
no poder existir fluctuaciones
estacionales superiores al ao.
La magnitud en estudio sufre un
incremento de un 512 % respecto al
valor de la tendencia, debido a la
estacionalidad observada en el 1er
trimestre. Se produce, tambin, una
disminucin del 1625 % respecto al
valor tendencial, debido a la
estacionalidad del 2. Se obtiene una
disminucin del 255 % respecto al
valor tendencial, causada por la
estacionalidad del 3; y, por ltimo,
se produjo un incremento del 1275
% respecto a la tendencia, debido a
la estacionalidad del 4 trimestre.
EE I 125
Desestacionalizacin:
Yi Y
Yd i = = i
I.G.V.E. E i
30 30
25 25
Ydi
Yi
20 20
15 15
10 10
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Tiem po (t) Tiem po (t)
Yi Yd i
Yi = Ti . E i . Ci . Ii Ci . Ii = =
Ti . E i Ti
EE I 130
Movimientos Irregulares
Son comportamientos que no muestran carcter peridico ni regular y
que se deben a fenmenos catastrficos o fortuitos que afectan de
manera casual a la variable.
Ci . Ii
Ii =
Ci
EE I 131
Los valores obtenidos para la componente irregular son los siguientes:
EE I 132
COMPONENTES OBTENIDAS PARA LA SERIE TEMPORAL DEL EJEMPLO
EE I 133
Estadstica Empresarial I
Tema 9
Teora de la probabilidad
ESTADSTICA
ESTADSTICA INFERENCIA
PROBABILIDAD
DESCRIPTIVA ESTADSTICA
(a) Asociativa: A U (B U C) = (A U B) U C A I (B I C) = (A I B) I C
(b) Conmutativa: A U B = B U A AIB = BIA
(c) Elemento neutro: A U = A AIE = A
(d) Distributiva: A U (B I C) = (A U B) I (A U C) A I (B U C) = (A I B) U (A I C)
(e) Leyes de Morgan: A U B = A I B AIB= AUB
(1) A U (B I A )
(2) (A U (A U B)) I B
EE I 140
La probabilidad y sus enfoques
Ya se ha indicado que en cualquier experimento aleatorio es
imposible predecir el resultado de antemano. Sin embargo, la
Probabilidad intenta explicar la aparicin de los distintos resultados.
N de casos favorables
Pr obabilidad =
N de casos posibles
Ejemplo: Para el experimento que consiste en extraer una carta de la
baraja espaola, determinar la probabilidad de los siguientes sucesos:
(a) Salir una copa (b) Salir un rey (c) Salir una figura EE I 141
Interpretacin frecuentalista: Se basa en la posibilidad de repetir un
experimento bajo las mismas condiciones. Al aumentar el nmero de
pruebas realizadas n, la frecuencia relativa f de un suceso A tiende a
estabilizarse en torno a un valor fijo. Se entiende por frecuencia relativa
asociada a un suceso el cociente entre el nmero de veces que ocurre,
m, y el nmero de pruebas realizadas, n.
m n (A)
f (A) = = = P (A)
n n
Ejemplo: Sea el experimento que consiste en lanzar un clavo al aire,
pudiendo caer de punta o de lado (no equiprobables). Suponiendo que se
repite el experimento 1000 veces y que en 12 de ellas cay el clavo de
punta, determinar la probabilidad de que el clavo caiga de punta.
EE I 143
Definicin axiomtica de probabilidad
Esta definicin se basa en un conjunto de axiomas que permitirn
construir un modelo matemtico de la probabilidad que sea capaz de
explicar las regularidades observadas en los sucesos asociados a un
experimento aleatorio.
como la frecuentalista de la U Ai
i =1
probabilidad.
Nota 2: A la terna (E, , P) se le
denomina espacio probabilstico. EE I 144
AXIOMAS DE KOLMOGOROV
Axioma 1 : A : 0 P (A) 1
Axioma 2 : P (E ) = 1
Axioma 3 : Sea A1 , A 2 ,..., A k una sucesin de sucesos
incompatibles dos a dos (A i A j = , i j)
k k
Entonces : P U A i = P (A i )
i =1 i =1
Nota: Estos tres axiomas son equivalentes a las propiedades de las frecuencias
relativas.
CONSECUENCIAS DE LOS AXIOMAS:
()
(a ) A : P A = 1 P (A) (b) P () = 0
(c.1) A, B : P (A B) = P (A) + P (B) P (A B)
(c.2) A, B, C : P (A B C) = P (A ) + P (B) + P (C) P (A B)
P ( A C ) P ( B C) + P ( A B C) EE I 145
A B = (A B) (A B) (B A)
R = P (A) + P (B) + P (C)
A = (A B) (A B)
S = P (A B) + P (A C) + P (B C)
B = (B A) (A B)
T = P ( A B C)
P (A B)
P (A / B) =
P (B)
Esta definicin se aceptar si verifica los tres axiomas de
Kolmogorov, es decir, si verifica que:
Axioma 1 : A : 0 P (A/B) 1
Axioma 2 : P (E / B) = 1
Axioma 3 : Sea A1 , A 2 ,..., A k una sucesin de sucesos
incompatibles dos a dos (A i A j = , i j)
k k
Entonces : P U A i / B = P (A i / B)
i =1 i =1
EE I 148
Sea un espacio probabilstico (E, , P), y dos sucesos cualesquiera A y
B de . Se dice que A y B son estocsticamente independientes
cuando la ocurrencia de B no influye en la de A, y viceversa. En este
caso, se verificar que:
P (A / B) = P (A) P (B / A) = P (B)
P (A B) = P (A) . P (B)
EE I 149
En general, n sucesos A1, A2, ..., An son globalmente independientes
si se verifica que:
P (A i A j ) = P (A i ) . P (A j ) , i j
P (A i A j A k ) = P (A i ) . P (A j ) . P (A k ) , i j k
LLLLLLLLLLLLLLLLLLLLL
P ( A1 A 2 L A n ) = P ( A1 ) . P ( A 2 ) L P ( A n )
Diremos que los sucesos A1, A2, ..., An son independientes dos a dos
si cualquier par de dichos sucesos son estocsticamente independientes.
Nota: Si A1, A2, ..., An son globalmente independientes son
independientes dos a dos.
P (A j ) . P (B / A j )
P (A j / B) = n
P (A ) . P (B / A )
i =1
i i
EE I 153
Estadstica Empresarial I
Tema 6
Estadstica de Atributos
: : : : : : : : a1 n1. b1 n.1
: : : : : : : : : : : :
h k h k
n = n
i =1
i.
j=1
.j = n ij = N
i =1 j=1
EE I 156
Independencia
De anloga forma al caso de las variables, podemos decir que, dados
dos atributos A y B:
n ij
n i. n . j n i. n . j
A y B son independientes = i, j n ij = i, j
N N N N
EE I 157
Tablas de contingencia 2x2
A continuacin, vamos a tratar de obtener un coeficiente que
cuantifique el grado de asociacin entre dos atributos, en el caso en que
los dos atributos presenten dos modalidades.
a2 N . H ij
n21 n22 n2.
Q ij = i = 1, 2 ; j = 1, 2
n11 n 22 + n12 n 21
n.j n.1 n.2 N
siendo H = F.O. F.T.
2
T =
2
N (h 1) (k 1)
Propiedades:
(1) 0 T2 1, sea cual sea el nmero de modalidades de cada atributo (h y k).
(2) T2 = 0 Independencia entre los atributos.
(3) T2 = 1 Perfecta asociacin entre los atributos.
Ejemplo: La siguiente tabla recoge la distribucin de las calificaciones del primer
parcial de EEI del curso 91/92 para los 398 alumnos matriculados, teniendo en
cuenta el grupo al que pertenecen.
Curso / Nota Susp. Aprob. Notab. Sobre. Total
Discutir la asociacin
1 A 86 21 8 3 118
entre el grupo de
1 B 73 27 7 0 107
cada alumno y la
1 C 44 19 2 0 65 calificacin obtenida.
1 D 61 34 9 4 108
Total 264 101 26 7 398 EE I 161
Correlacin ordinal
Existe un tipo de atributos que, aunque no se puedan medir
numricamente, son susceptibles de algn tipo de ordenacin.
Estaremos, pues, ante un atributo jerarquizado, que se caracteriza
porque entre sus modalidades se puede establecer una ordenacin o
clasificacin, segn dos criterios diferentes de ordenacin.
X 1 2 3 4 5
Y 3 1 4 2 5
EE I 162
Correlacin por rangos de Spearman
Sea A el atributo jerarquizado segn los criterios X e Y.
N
As pues: - 1 1
=0 Independencia
EE I 163
Correlacin por rangos de Kendall
Sea A el atributo jerarquizado segn los criterios X e Y.
S Se basa en el concepto de
Coeficiente de correlacin por = N .( N 1) inversin de los rangos
rangos de Kendall 2 respecto al orden natural.
150,00
(5) Menaje 64,10 67,08
100,00
(6) Medicina 27,53 34,76
50,00
(7) Transporte 153,23 163,89 0,00
1 2 3 4 5 6 7 8 9 10 11 12
(8) Comunicaciones 27,35 27,41
IPC Nacional IPC Canarias
(9) Ocio y cultura 68,34 77,62
101,3 101,4 102,2 103,6 103,9 104 103,2 103,5 103,9 104,9 105,1 105,5
01/03 02/03 03/03 04/03 05/03 06/03 07/03 08/03 09/03 10/03
105 105,2 106 106,8 106,7 106,8 106,1 106,6 106,9 107,7
109
ndice con base 2001
108
107
106
105
104
103
102
101
100
nov-01 feb-02 may-02 sep-02 dic-02 mar-03 jun-03 oct-03 ene-04
Meses