Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1.1.- Concepto:
En muchas ocasiones no basta con estudiar la descripcin de un fenmeno y sus
variaciones,
es conveniente conocer a qu son debidas esas variaciones. Puede resultar
interesante e incluso
necesario estudiar los cambios producidos en una variable en relacin con otras, o
cmo influyen unas variables para que otra cambie. Cuando se estudian
conjuntamente varias variables se entra en el campo de la estadstica multivariable
(muchas variables). Si el estudio se reduce a dos variables, como en este tema, se
llama estadstica bidimensional.
La estadstica bidimensional estudia fenmenos en los que intervienen
dos variables
conjuntamente, buscando la relacin que existe entre ambas. As, por
ejemplo, se puede estudiar la influencia que tienen los ingresos de una determinada
familia en los gastos que tiene, o cmo influye la velocidad de un cierto automvil
en su consumo de combustible, o qu relacin existe entre los pesos y las estaturas
de un grupo de personas. Una variable bidimensional se representa por un par (X,
Y), donde X es la primera variable y toma los valores x1, x2, x3, ...,xn e Y la
segunda y toma los valores, y1, y2, y3, ...,yn .
Sin embargo, al considerar dos variables de una poblacin o muestra, no
podemos afirmar que
se trata de una variable bidimensional porque la relacin entre las
variables puede no ser estadstica.
As, entre dos variables puede existir:
Dependencia Funcional.
Cuando es posible predecir con exactitud los valores de una variable a partir de los
de la otra,
se dice que ambas variables estn en relacin funcional. Dada la variable (X,Y)
existir una funcin
f(x) tal que yi = f(xi). Para cada valor de x se puede conocer el valor de y.
Ejemplo:
a) La altura desde la que cae un cuerpo y el tiempo que tarda en llegar al suelo est
sujeto a la
ley de la gravedad. Siempre tarda lo mismo en recorrer el mismo espacio.
b) El precio de una tela es funcin del coste del metro de tela y del nmero de
metros.
Independencia o Incorrelacin.
Cuando las dos variables no tienen ninguna relacin entre ellas y podemos
estudiarlas por separado.
Ejemplo:
a) La estatura y la nota de matemticas.
b) La nota en selectividad y el nmero de letras del nombre.
1.3.-Distribuciones marginales
Se denomina distribucin marginal de una variable bidimensional a la distribucin
que se obtiene al estudiar independientemente cada variable.
Si tomamos la primera columna y la ltima columna en la tabla anterior, obtenemos
la distribucin de frecuencias marginales de la variable estadstica Y:
1.4.-Vector de medias.
Sea (X,Y) una distribucin estadstica bidimensional. Al par ( x, y ) se le denomina
vector de mediaso centro de gravedad de la distribucin.
1.5.-Distribuciones condicionadas
Son las distribuciones que se obtienen al fijar un valor en una de las variables y
estudiar las frecuencias correspondientes a la otra.
Por ejemplo, la distribucin de la variable Y para el valor X=xi.
La distribucin que se obtiene es unidimensional.
Interpretacin de la covarianza
Una covarianza positiva y alta indica que ambas variables crecen o decrecen
simultneamente,
es decir, presentan una fuerte correlacin. Cuando mayor sea la covarianza, ms
estrecha es
la relacin entre las variables.
Una covarianza alta y negativa indica que cuando una variable crece, la otra
decrece y viceversa, es decir, presentan una fuerte correlacin inversa. Cuanto
menor sea la covarianza,
puesto que es negativa, ms estrecha es esta relacin entre las variables.
La covarianza cero o prxima a cero indica que no existe relacin entre las
variables.
Matriz de covarianzas
2.1. DEFINICIN:
Dado dos variables, la correlacin permite hacer estimaciones del valor de una de
ellas conociendo el valor de la otra variable. Los coeficientes de correlacin son
medidas que indican la situacin relativa de los mismos sucesos respecto a las dos
variables, es decir, son la expresin numrica que nos indica el grado de relacin
existente entre las 2 variables y en qu medida se relacionan
,
Donde:
xy : es la covarianza de ( x , y ) .
r x. y =
xi y in x y = n x i y i xi y i
( n1 ) s x s y
n x ( x ) n y ( y )
2 2 2 2
i i i i
Donde:
r : coeficiente de correlacin de Pearson.
Al igual que las otras pruebas paramtricas, la varianza de las variables X y Y deben
guardar homogeneidad.
INTERPRETACIN:
Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia
total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta,
la otra disminuye en idntica proporcin.
Ntese que una correlacin negativa no es menos fuerte que una correlacin
positiva. As, por ejemplo, un de 0,5 es tan grande o fuerte como un de 0,5. Los
signos positivos y negativos slo indican si el valor de una variable aumenta o
disminuye, respectivamente, con el aumento en el valor de la otra variable. Como
usted sabe, cuando los aumentos (disminuciones) de una variable producen
aumentos (disminuciones) en la otra, la relacin es positiva. Es negativa cuando los
aumentos (disminuciones) de una variable producen disminuciones (aumentos) en
la otra.
Ejemplo 1:
X = Das de 5 7 9 11 13 15 17 19 21 23
trabajo
Y= 140 196 252 308 364 420 476 532 588 644
Remuneracin
El cuadrado de Xi y de Yi
Para poder realizar los clculos con mayor comodidad, utilizaremos la siguiente
tabla:
Xi Yi Xi Y i Xi2 Yi2
5 140 700 25 19600
7 196 1372 49 38416
9 252 2268 81 63504
11 308 3388 121 94864
13 364 4732 169 132496
15 420 6300 225 176400
17 476 8092 289 226576
19 532 10108 361 283024
21 588 12348 441 345744
23 644 14812 529 414736
140 3920 64120 2290 1795360
Vamos a quedarnos slo con la ltima fila para hacer los clculos.
10
Xi 140
Media marginal de X:
X = i=1 = =14
n 10
10
Yi 3920
Media marginal de Y:
Y = i=1 = =392
n 10
10
X 2i
Desviacin tpica marginal de X:
x= i=1
n
X 2=
2290
10
142=5.74
10
Y 2i
Desviacin tpica marginal de Y:
y= i=1
n
Y 2=
1795360
10
3922=160.85
10
Xi Y i 64120
Covarianza:
xy = i=1 X Y = 14 392=924
n 10
xy 942
Coeficiente de correlacin de Pearson: r xy = = =1
x y 5.74 160.85
600
500
400
Remuneracin
300
200
100
0
4 6 8 10 12 14 16 18 20 22 24
Dias de trabajo
EJEMPLO 2:
X = Aos 1 2 3 4 5 6 7 8 9 10 11
Y= 965 195 835 968 133 798 875 118 987 106 893
Produccin 4 0 4 5
El cuadrado de Xi y de Yi
Para poder realizar los clculos con mayor comodidad, utilizaremos la siguiente
tabla:
Xi Yi Xi Y i Xi2 Yi2
1 965 965 1 931225
2 1954 3908 4 3818116
3 835 2505 9 697225
4 968 3872 16 937024
5 1330 6650 25 1768900
6 798 4788 36 636804
7 875 6125 49 765625
8 1184 9472 64 1401856
9 987 8883 81 974169
10 1065 10650 100 1134225
11 893 9823 121 797449
1386261
66 11854 67641 506
8
Vamos a quedarnos slo con la ltima fila para hacer los clculos.
1386261
66 11854 67641 506
8
10
Xi 66
Media marginal de X:
X = i=1 = =6
n 11
10
Yi 11854
Media marginal de Y:
Y = i=1 = =1077.64
n 11
10
X 2i
Desviacin tpica marginal de X:
x= i=1
n
X 2=
506 2
11
6 =3.16
10
Y 2i
Desviacin tpica marginal de Y:
y= i=1
n
Y 2=
13862618
11
1077.642=314.53
10
Xi Y i 67641
Covarianza:
xy = i=1 X Y = 6 1077.64=316.66
n 11
xy 316.66
Coeficiente de correlacin de Pearson: r xy = = =0.32
x y 3.16 314.53
3. MODELOS DE REGRESIN
a) Regresin lineal
b) Regresin exponencial
Ser aquella en la que la funcin de ajuste ser una funcin exponencial del tipo:
y=ceax
ln y=ax+ln c
Si ponemos ahora X=x, e Y=ln y, obtenemos la relacin lineal
Y=aX+b
Usar la calculadora para transformar esta tabla de datos en esta otra, tenemos:
b) Regresin logartmica
2.- Hallaremos las derivadas con respecto a cada uno de los coeficientes del
polinomio. Este mtodo al adaptarse a una curva utiliza ecuaciones de
segundo grado.
Ejemplo:
CEMENTO 2 3 5 2 4
AGUA 8 10 15 7 11
(LITROS):
SE PIDE:
SOLUCION 1
-Datos
X=agua en litros
Y=cemento en bolsas
Sxy
-Recta de regresin y sobre x:y= y + xx
S X2 (
x =
Xi 8+10+15+7+11
= 5 =10,2agua
n
x
2 X i2 x
2 82+ 102+ 152+ 72+ 112
10.2
2
S = - = - =7.76
n 5
y =
Yi 2+3+5+2+4
= 5 =3.2
n
2 Y i2 y 2 =
22 +32 +52 +22 + 42 2
S y = - - 3.2 =1.36cem
n 5
XiYi x y =
XiYi
Sxy= - (10.2)(3.2)=19.24
n 5
REEMPLAZANDO EN LA RECTA
Sxy 19.24
y= y + 2 ( xx =3.2+
SX 7.76 (x-10.2)=2.47x-22.08
SOLUCION 2
a +bx
Modelo regresin exponencial: y=e
Sxz
-Recta de regresin z sobre x: z= z + xx
S X2 (
z =
Zi 0.693+ 1.098+1.609+0.693+1.386
= 5 =1.0958
n
2 Z i2 z 2 =
0.6932+1.098 2+1.609 2+0.693 2+1.386 2
S z = - =1.3351
n 5
XiZi x z =
XiZi
Sxz= - (10.2)(1.0958)=45.30
n 5
REEMPLAZANDO EN LA RECTA
Sxz 45.3
z= z + 2 ( xx =1.0958+
SX 7.76 (x-10.2)=5.83x-58.371
4. REGRECION MULTIPLE
Este tipo se presenta cuando dos o ms variables independientes influyen sobre
una variable dependiente. Ejemplo: Y = f(x, w, z).
Por ejemplo: Podra ser una regresin de tipo mltiple:
Una Empresa de desarrollo de software establece relacionar sus Ventas en funcin
del numero de pedidos de los tipos de software que desarrolla (Sistemas,
Educativos y Automatizaciones Empresariales), para atender 10 proyectos en el
presente ao.
En la Tabla representa Y (Ventas miles de S/.) e X (N pedidos de sistemas), W (N
de pedidos de Aplicaciones Educativas) y Z (N de pedidos de Automatizaciones
empresariales).
Y 440
X 50
W 105
Z 75
Objetivo: Se presentara primero el anlisis de regresin mltiple al desarrollar y
explicar el uso de la ecuacin de regresin mltiple, as como el error estndar
mltiple de estimacin. Despus se medir la fuerza de la relacin entre las
variables independientes, utilizando los coeficientes mltiples de determinacin.
Anlisis de Regresin Mltiple
Dispone de una ecuacin con dos variables independientes adicionales:
Para poder resolver se puede utilizar programas informticos como AD+, SPSS y
Minitab y Excel.
Mide la tasa porcentual de los cambios de Y que pueden ser explicados por ,
y simultneamente.
Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja de
Calculo de Excel podemos calcular tambin los coeficientes de regresin:
En los resultados de Excel se llama error tpico y para explicar la relacin del
aprendizaje de PHP que se viene desarrollando es de 0.861
El coeficiente de determinacin mltiple (r2)
Utilizaremos para determinar la tasa porcentual de Y para ser explicados las
variables mltiples, utilizando la si siguiente formula:
INTERPRETACION.-
El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas
obtenidas por las asignaturas de Algoritmos, Base de Datos y Programacin.