Documentos de Académico
Documentos de Profesional
Documentos de Cultura
0, In distibucién es asimétrica postiva (0 asimétrica a la derecha); sig <0, la
istibucién es asiméttica negativa (o asimétrica a la izquienlay; y sila distibucién es simétrica,
“(no necesarianente se da al revs; esto es, exsten distribuciones asimétricas con
© ITES.ParaninfoDISTRIEUCIONES DE FRECUENCIAS UNIDIMENSIONALES + 57
B, Medidas de curtosis,
Coeficiente de curtosis:
ate coeficiente se define séle para distribuciones campaniformes y simétricas (0 con ligera
asimetra). Si g, > 0, la distribucién se denomina leptocttica (més apuntada que la distibucion
hormal}); sig; <0, plaictirtica (menos apuntada que la normal); y sig, =0, mesoctirtica
igual que la normal,
‘Las medidas de forma son también caractertsticas propias de la variables y a0 de fos a
4.5 MEDIDAS DE CONCENTRACION
oven de reliewe el mayor o menor grado de igualdad en el reparto del tial de Jos recursos,
Yam
Senn
zp
FE indice de Gini varia entre 0 y 1, corresponttiendo los casos extremos a concentra
rninima o equiistribuci6n (= 0) y concentracion maxima (c= 1).
indice de Gini: I =
Fhs00 4 = Ym
‘Curva de Lorenz: Es ta epresentacion grafica Je los porcentajes acumulados de individuos (p) y
‘de recursos (q). Se colosan Ics p, en el eje de abscisas, los q; en el de ordenadas, y se unen
todos los puntos (p,q), cousiderando (0,0) como et primer punto y (100,100) como el dti-mo,
[Asi cuanto mas proximna est la curva la bisectriz del primer cuadrante, mis parecidos serdn
‘ambos poreentajes acumulados, por lo que menor seré la concentracin.
4%
mi
1 a dtc nrm to emo, S he rin mio my coms
© ITES-Parninfo58 + ESTADISTICA DESCRIPTIVA PARA ECONOMIA Y ADMINISTRACION OE EMPRESAS
1.5_Transformaciones lineales
‘Veamos aliora cémo afectan trnstormaciones lineates del tipo Y= aX +b, con a>0, a las
principales medidas estudiadas en los epfgrates anteriores:
Teak a>0 |, YaR4 Yaaktb, a>0
Media artmétca year ~ yaree yaart
a Magy) aMorXy | Moy) = atx) +b | Moery= alorX) +
Medians Maty=oMedX) | metry —Mety + | AI aMeCH) + 6
oe 640 = 06, 00) Gul =aC,,,09 + 8
Varianea Sp=e'st
Desviackn pic
Coicente de varincin
le Pearson
oui deasmetta| gy) 20 =800
[coctcente de curtons | 3. (F)= 8.64) (1) 6509
POP), 7
ies de Git FelD= TeX) 4 OO+5N, au (XB,
woneen | MOO cy Cree
© ES ParaintoTema 4Distribuciones Bidimensionales
¢ Distribuciones de frecuencia bidimensionales
e Representaciones graficas
¢ Distribuciones marginales
Distribuciones condicionadas
« Independencia estadi:
¢ Momentos bidimensionales
¢ Covarianza
Coeficiente de correlacionDistribuciones de
frecuencias
bidimensionales
Distribuciones de frecuencias bidimensionales
Representaciones graficas
Distribuciones marginales
Distribuciones condicionadas
Independencia estadistica
Variables bidimensionales: momentos
Medidas de asaciacién para atrbutosCISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES + 139
.1 Distribuciones de frecuencias
bidimensionales
do un conjunto de ¥ individuos » elementos, s¢ desea estudiar dos caracterisicas de los
ismos, medidas por las variables Xe ¥, cuyos posibles valores son ¥.X.00%) &
Lyre Jen fespectivamente, También podria darse el caso de que alguno de los caracteres
2a cuaitativo, 0 incluso tos dos.
-ecuencia absoluta conjunta del pat (1, ),) es el nimero 1, de elementos en el total de los N
ceonsiderados que presentan el valor x, para la primera caracteristica y el valor y; para la
segunda,
‘ecuencia relativa conjunta det pac (4, ¥)) 8 la proporeién Jf, de elementos del conjunto
para los cuales la primera caracteristica toma el valor x, y la segunda el valor y,. Se obtiene
camo f, 22, y nic pe 100 rece cena de omens cn achas
‘alos ena cra cosira,
Se dina dsbucn de fecaenelasbidmensiona al cnjno depres (4,9) Jamo
nn fas ffecuencias asociadas a cada uno de ellos, (159) Mara ajara a’ Dich
stribucin de freevencias suele presentarse en una tabla de dable entrada, que recibe el nombre
tabla de correlacion si los dos caracteres son cuantitativos, y tabla de contingencia si al
nos uno de ellos es cualitaive. Ademds, para el caso de las variables, los datos pueden venir
rupados en intervals 0 no, sean proceda,
[xe] »
a [mm my
a | tm me |
© ES Paraninfo1140 « ESTADISTICA DESCRIPTIVA PARA ECONOMIA ¥ ADNINISTRACION DE EMPRESAS
2.2 Representaciones graficas
acid del diagrama de rectingulos al caso
Diagrama de rectdngulos tridimensional. Gener
bidimensional
Diagrama de barras tridimensional, Generalizacion del diagrama de barras. al caso
bidimensional
stercograma o escalograma, Generalizacn del histograma al caso bidimensional
Diagrama de dispersién 0 nube de puntos. Grifico s6lo pata variables que representa los pares
‘de observaciones como puntos en un sistema cartesiano, donde cada uno de os cjes
‘corresponde a una de las variables. Esta representacién ayuda a descubrir visualmente la
‘existencia de algin tipo de relacin entre dos variables
2.3 Distribuciones marginales
Son cada una de las dos distribuciones de frecuencias unimensionales que se obsienen 2 partir
Je In distibucion bidimensional {0.9)57%}.,.. jypua.. t estHliar el Comportamiento de
veda una de las dos componentes de (X.Y) por separado, Ast, en el caso de Ia distibucidn
Sorvespondiente @ X, que denotarens por (3 A.J,» 1 Mrecwencia marginal m, representa
21 mimero de elementos para los cules la primera caracterstca toma el valor 1), sea cual sea el
salor de ¥, esto es,
«la frecuencia marginal 1,
‘niewtras que en la distibueién correspondiente a Y, {yj}
Jenota el nimero de elementos part los cuales la segunda caracterstca toma el valor y,, inde-
>endientemente del valor que tome X,
oS
siendo entonces NV Esta informacidn se puede representar en la
abla de doble entrada:
DITES-PacanintoDISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES * 141
dk y
ee me [om
puesto que las distribuciones marginales no son ms que distribuciones de freeuencias unidi-
ensionales, se podrian obtener pars ells las distnias medidas estudiadas en el tema anterior.
br otra parte, todos los comentarios anteriores Sobre distribuciones marginales se pueden aplicar
1 ningGn problema a la situacién en la que una o las dos componentes del par (X,Y) sean ateibu-
nadas
1 distibucion de X condicionada a que Y tome el valor y, es la distribucién uni
, feresentada en la siguente tabla, tanto en fecuencias absolut Como reativas,
RUSE | a | A
5 [a [Ie
ms May | fae
| aw | fw
mf
se my = my Y Sup
Det mismo modo, se define la dstibucon de Ycondicionada a que X tone et valor; eto
PE MDien at
(© MES Paraninto1142 » ESTADIGTICA DESCRIPTIVA PARA ECONOMIA ¥ ADMINISTRACION OF EMPRESAS
¥k=n [| fn
ge || Bo
|| to
peeee ae
Nétese que por ser las distribuciones condicionadas también de caricter unidimensional, se
podsian caleular para ellas las medidas estudiadas en el tema anterior, Ademis, de mievo las
Aistibuciones condicionadas pueden definiese tanto para variables como attibutos.
. Independencia estadistica
‘Se dice que dos caracteres Xe ¥ son estadistcamente independientes silos valores (o modalida-
des) que toma uno de ellos no se ven afeetados por los valores (0 modalidades) que toma el otro;
formalmente, si
We hoat
logue es equivatemte «
ensionales: Momentos
2.6. Variables bi:
‘AV igual que en et casy unidisensional, ¢s posible distinguir entre momentos respecto al origen
{ordinarios) y momentos respecto& ka media (centres):
Loe
‘Momento ordinario de orden (8): ayy = ==>
YVEi-D'O, yy
‘Momento central de orden (isk):
BITES PoraoinfoDISTRIGUCIONES DE FRECUENCIAS MIDIMENSIONALES » 143,
De entre los momentos bidimensionales destaca la covarisnza, que propotciona una medida
cl grado de relacin lineal existente entre las variables X ¢ Y. Oua medide para ef mismo
Sneepto, pero con Ia ventaja de ser adimensional y acotada, es el coeficiente de correlaciin
real, que toma el valor 0 cuando ne existe dependencta lineal ene las variables y fos valores 1
“1 cuando existe una dependencia tinea perfecta (1 en el caso de relacidn lineal dvecta y — en
| caso de relacién lineal invest),
YY ei -H,- Pm,”
# Covarianza: Syy =m. =
«+ Coeficiente de correlacion linea:
‘Ane tranformaciones lineales del tipo U = aX +b y V=cY +d, con a>0 y c>0, se
ene Sy @CSyyY Toy * hoy» Bel e280 general, sin restricciones sobre el signo de @ y ¢,
gue siendo Spy = aeSyy, mientras que Foy
‘ay ¢ tienen distnta signo.
rer Sia ¢ tienen el mismo sign, ¥ fy = Fy
.7 Medidas de asociacién para atributes
1.7.1, MEDIDAS DE ASOCIAGION PARA ATRIBUTOS EN ESCALA
ORDINAL
neste contexto suele ser iil notar ks observaciones bidimensionales con un solo fece,& la
fe que usar frecuencias unitarias, de modo que un par se repetrd tantas veees como sea
seesaio: {(%.3,)huaa, a Teniendo en cuenta to anterior, se ordenan por separado Tas
bervaciones de Xe Y de mene a mayor, y se asignan los rangos Rix) y Ri)
drrespondientes a cada una de ella. asociando el valor 1 a fa menor observacién y el valor N'&
‘mayor, Cuando dos © ms elementos tienen la misma modalidad para un atributo se les asigna
{ promedio de los rangos que les comesponderian sino hubiera empates
63 RO Rov!
Coeficiente de correlacién por ranges de Spearman: ow NEP SI
Fs simplemente el coeficiente de correlacién lineal entre los rangos, y, en el eas0 de exitir
cempates debe correyirse, transformindose en
Y
© TES Parninfo
loaTema 5Regresion y Correlacién
¢ Introduccion
e Regresion minimo-cuadratica
¢ Regresion lineal
« Correlacion
Otros ajustes no lineales
¢ PredicciénRegresion
y
correlacion
Introduccién
Regresién minimo-cuadratica
Rogrosién fnoal
Comelacign
‘Otros ajustes no lineales
PredicciénREGRESION Y CORRELACION « 205,
3.1_Introduccién
‘Cuando se estudian conjuntamente dos variables que no son estadisticamente independiente, Ia
relacign de dependencia existente entre ella puede ser funeional (elacion matemitica exacta
tentre las dos vaables, por ejemplo, espacio recorrido por un vehicula que va a velocidad
onsiante y tempo empleado en correla) o estadistiea (relacon aproximada entre las dos
Yarables, por ejemplo, nivel de gasto de las familias en funcion de su renta disponible). En este
ito caso, ineresa estudiar et grado de dependenciaexistente ent as variables (teoria de la
correlacién) detcominar la funsién que mejor explique dicha dependencia (teovia de la
regres)
Dadas dos variables X © ¥ on distrbucion conjunta de frecuencias {(x.¥))smy}e 8°
ddenomina regresin de ¥ sobre X (FX) a la func que explica la variable ¥ para cada valor de
ta variable X- De igual forms, la represiin de X sobre ¥ (X72) determina el comportaniento de
1X en funcion de. Sin plrdida de g>neralidad, consideraremos la distribu de pares de valores
(3,3) eon Frecuencas uniaras.
o-cuadratica
3.2. Regresién mii
‘Para obtener la funeion de regresién de Y sobre X, en primer lugar, se representan grficamente
ten unos ejes de coordenadas los pares de observaciones de las dos variables (nube de puntos 0
diagrama de dispersion), y se seleccona el tipo de funcidn que mejor se ajusta a esos puntos. En
segundo lugar, se determina dicha funeién haciendo minima la suma de los cuadrados de tos
residuos 0 errores, ¢, (diferencia entre la variable dependiente observada, y), y el valor teérivo,
5), que se obtione al unter en la fancién ascogida x por x; estas, 4, =, —5))
Min 10-37)
De igual forma se obtiene le funcién de regresion de X sobre Y haciendo minimo
$cqe iy Soom eos wrt agile gus ee a itn is
‘expresiones anteriores
© IFES Parainfo206 « ESTADISTICA DESCRIPTIVA FARA ECONOMIA ¥ ADMINISTRACION DE EMPRESAS.
3.3_Regresion lineal
Si la funcidn que se adapta la nube de puntos es una recta, se habla de regresin lineal, Ser de
fa forma j-— a+ bx para le regresién YIX y 7=a’+b'y para la de X/Y. Los coeficientes b y 6”
reciben el nombre de coeficientes de rogresin, mientras que a y a’ son Tos puntos de corte con
Jos tespectivos ejes
3.3.1. RECTA DE REGRESION DE Y SOBRE X
Se caleulan tos purdmeus a y 6 ue minimizan 3 (3; ~a~by)*oblenndose las siguientes
ccuaciones normales
Eo -av oS
San=0Ss+03
‘que dan lugar @
Ast, la recta YX viewe dada por
3.3.2. RECTA DE REGRESION DE X SOBRE Y
Se minimiza 3 (x, a’), obteniéndose las siguientes ecuaciones normals
aque dan lugar a
© TES ParnintoREGRESION Y CORRELACION « 207
Asi, In recta X/Y viene dada por
3.3.3. PROPIEDADES
1, Lasama de los ertores es cer.
2, La media de los valores tedrieas coincide con La media de los valores obsetvados de ta
variable dependient,
3, Las rectas de rogresidin se cortax en el punto (
¥). denominado centro de gravedad
4. La covarianca entre la variable independiente y el error es cero.
5. La covarianza entre la variable wérica y el ervores Cero
5. La varianza de la variable dependiente se descompone como sums de la varianza explisads
por la regresién y la varianza residual
aa la regresion YIN, se tiene
Spas}+8?
con
Para la regresin XY
6 ITES Paraninto208 + ESTADISTICA DESCRIPTIVA PARA ECONOMIA Y ADMINISTAACION DE EMPRESAS
3.4 Correlacion
‘Se denomina correlacion al grado de dependencia entre las variables. Si la funcién que se ha
ajustado mediante la regresién pasa por todos Jos puntos —es decir, los residuos son textos
nulos— el grado de dependencia es el maximo posible. Por el contrari, cuanto més grandes sean
los residuos, menor seri la dependencia expresada por Ia funcidn elegida. Asi, en general, para
mmedit el grado de dependencia se define el eoeficiente de determinacién,
See
Scr
Sendo SCE la sua de los euadrdos de tos errows, SCE = Se, y SCT ia uma de tos
cuadrados de las desviaciones de cade valor de a yarable dependienterespecto de su media,
SCT =; -77
- Puraelsjuste lineal, el coeiciente de determinacin puede caleulase como
SCE_) 8 _S}
ser")
En este caso, 0 R* <1, coincidiendo el cundrado del coeficiente de correlacién lineal, 7°,
con el coeficiente de determinacion de la regresin lineal, que puede obtenerse también a partir
de los coefcientes de regresiGn de ls ectas, R bb’, Cuanto mayor sea el coeficiente de
Seterminacién, mayor seré la correbcion y, por taio, Tz depehdencia ene las variables. Adem,
se tiene gue:
1, relacin lineal perfecta positiva
“1, relacin lineal perfecta megativa
0. inexistencia de relacfn tinea
+ -1<1<0, relacin lineal negativa, mis fuerte cuanto mis préximo esté de —L
+ 0