Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISEOS ESTADSTICOS
Total
Valores de X
1
11
12
1
.
2
21
22
2
.
Total
=
= =
Pgina | 1
UNA PUNO
DISEOS ESTADSTICOS
Donde:
:
. = =
=1
. = =
=1
=1 =1
DISTRIBUCIONES MARGINALES
Distribucin Marginal de X
.
Distribucin Marginal de Y
.
1.
.1
Total
= .
=
Total
= .
=
Ejemplo 1: Supongamos que queremos analizar el comportamiento conjunto de las variables grado
de instruccin (X) y regin de procedencia (Y) de los empleados del Ministerio de Agricultura, los datos
se muestran en la siguiente tabla:
Tabla 1: Distribucin conjunta de las frecuencias de las variables grado de instruccin (X) y regin de
procedencia (Y)
X
Primaria
Secundaria
Superior
Total
Y
Completa
Completa
Costa
40
30
20
90
Sierra
35
15
10
60
Selva
30
15
5
50
Total
105
60
35
200=n
Fuente: Datos dietticos.
Cada elemento del cuerpo de la tabla representa la frecuencia observada de las realizaciones
simultneas de X e Y. As observamos que 40 empleados con primaria completa son de la Costa, 30
empleados con secundaria completa son de la Costa, etc.
Los totales de las filas nos dan la distribucin marginal de la variable X (grado de instruccin) y los
totales de las columnas nos dan la distribucin marginal de la variable Y (regin de procedencia).
Pgina | 2
UNA PUNO
DISEOS ESTADSTICOS
Observacin 2: En muchas situaciones en vez de trabajar con las frecuencias absolutas, podemos
construir tablas con las frecuencias relativas (proporciones). Como se hizo en el caso unidimensional.
Sin embargo existen tres posibilidades de expresar la proporcin de elementos en cada celda.
1) Con relacin al total general, y se llama frecuencia relativa, as la frecuencia relativa
correspondiente al par ( ; ), es dada por:
=
= 1, 2, , ; = 1,2, ,
Las frecuencias relativas marginales de las variables X e Y son dados respectivamente por:
. =
. =
) , = 1, 2, , ; = 1, 2, ,
.
) , = 1, 2, , ; = 1, 2, ,
.
Ejemplo 2: La distribucin conjunta de las proporciones (frecuencias relativas) de los datos de la tabla
1, con relacin al total de observaciones ( = 200), est dado en la siguiente tabla.
Tabla 2: Distribucin conjunta de las proporciones (en porcentajes) con relacin al total general de las
variables grado de instruccin (X) y regin de procedencia (Y)
X
Primaria
Secundaria
Superior
Total
Y
Completa
Completa
Costa
20%
15%
10%
45%
Sierra
17.5%
7.5%
5%
30%
Selva
15%
7.5%
2,5%
25%
Total
52.5%
29%
17.5%
100%
40
Aqu podemos afirmar que 11 100 = 200 100 = 20% de los empleados del Ministerio de
Agricultura son de la costa y tienen grado de instruccin primaria completa, mientras que 21
35
100 = 200 100 = 217,5% de los empleados son de la sierra y tienen grado de instruccin primaria
completa.
Los porcentajes totales de las filas y columnas nos dan las distribuciones marginales de cada una de
las variables X e Y. As el 45% (porcentaje marginal) de los empleados del Ministerio de Agricultura son
de la Costa, 30% de la Sierra y 25% de la Selva.
Ejemplo 3: La distribucin de las proporciones de los datos de la tabla 1, con relacin al total de cada
columna esta dado en la siguiente tabla.
Pgina | 3
UNA PUNO
DISEOS ESTADSTICOS
Tabla 3: Distribucin conjunta de las proporciones (en porcentaje) con relacin a los totales de cada
columna de las variables X e Y de la tabla 1.
X
Primaria
Completa
38.1%
33.3%
28.6%
100%
Y
Costa
Sierra
Selva
Total
Secundaria
Completa
50%
25%
25%
100%
11
.1
Superior
Total
57.1%
28.6%
14.3%
100%
45%
30%
25%
100%
40
35
21
Ministerio de Agricultura con primaria completa son de la costa, 21 100 = .1
= 105 100 =
31
.1
30
105
=
=1 =1
= 1
=1 =1
3.
. = 1. + 2. + + . =
=1
4.
. = .1 + .2 + + . =
=1
5.
. = 1 . = 1
=1
6.
7.
=1
= .
=1 =1
=1
= .
=1 =1
=1
Pgina | 4
UNA PUNO
DISEOS ESTADSTICOS
f
i 1
i. i
f x X
k
S X2
i.
i 1
n 1
f y
e
SY2
.j
j 1
n 1
i 1
2
i. i
j 1
.j
yj
n ( X )2
n 1
e
f x
f
j 1
.j
y 2j n (Y ) 2
n 1
SX
i 1
f y
e
f x X
k
i.
j 1
SY
n 1
.j
n 1
f x
k
S XY CovX ; Y
i 1 j 1
ij
X y j Y
n
Donde:
=
=1 =1
S XY
1 k e
CovX ; Y f ij xi y j X Y
n i 1 j 1
Pgina | 5
UNA PUNO
DISEOS ESTADSTICOS
Ejemplo 3: En una encueta realizada en una poblacin se obtuvo la siguiente informacin con relacin
al nmero de habitantes (X) y dormitorios (Y) en una muestra de 50 viviendas.
Habitantes Dormitorios
Habitantes Dormitorios
Habitantes Dormitorios
(X)
(Y)
(X)
(Y)
(X)
(Y)
6
2
5
2
4
1
3
2
3
1
4
1
5
2
3
1
4
1
5
2
5
2
3
1
8
3
3
2
4
1
5
2
5
2
4
1
6
2
2
1
4
1
5
2
3
1
4
2
4
1
4
2
6
1
2
1
3
1
3
2
8
4
6
3
4
1
4
3
4
1
4
2
2
1
2
1
5
2
2
1
6
3
5
2
3
1
4
1
4
2
3
2
4
2
8
4
3
1
2
1
Se pide:
a) Construir una tabla bidimensional y las frecuencias marginales.
b) Determinar las frecuencias acumuladas.
c) Encuentre las medias y varianzas marginales.
d) Halle la covarianza.
Solucin:
a) La tabla bidimensional con sus frecuencias absolutas y marginales es
Y
Total
1
2
3
4
X
fi.
2
6
0
0
0
6
3
7
4
0
0
11
4
10
5
1
0
16
5
0
9
0
0
9
6
1
2
2
0
5
8
0
0
1
2
3
TOTAL
24
20
4
2
n=50
f.j
Pgina | 6
UNA PUNO
DISEOS ESTADSTICOS
6
17
32
41
44
44
6
17
33
42
47
48
6
17
33
42
47
50
c) Para hacer los clculos ordenados de las medias y varianzas marginales, es conveniente construir
la siguiente tabla
Y
TOTAL
1
2
3
4
fi.Xi
fi.xi2
X
fi.
2
6
0
0
0
6
12
24
3
7
4
0
0
11
33
99
4
10
5
1
0
16
64
256
5
0
9
0
0
9
45
225
6
1
2
2
0
5
30
180
8
0
0
1
2
3
24
192
TOTAL
24
20
4
2
n=50
208
976
f.j
f.jyj
24
40
12
8
84
2
f.jyj
24
80
36
32
172
e
i. i
i 1
n
k
S
2
X
f x
i 1
2
i. i
208
4.16
50
n ( X )2
n 1
e
2
Y
f
j 1
.j
y 2j n (Y ) 2
n 1
f
j 1
.j
yj
84
1.68
50
976 50(4.16) 2
2.26
50 1
172 50(1.68) 2
0.63
50 1
S XY
1 k e
393
CovX ; Y f ij xi y j X Y
(4.16)(1.68) 0.8712
n i 1 j 1
50
Pgina | 7
UNA PUNO
DISEOS ESTADSTICOS
Pgina | 8
UNA PUNO
DISEOS ESTADSTICOS
A partir del diagrama de dispersin podemos visualizar que los datos se aproximan a una curva suave,
que se denomina curva de aproximacin. En la fig. 1 los datos parecen aproximarse a una lnea recta
por lo que se dice que hay una relacin lineal entre las variables, en la fig. 2 aunque existe una relacin
entre las variables esta no es lineal por lo que se le conoce como relacin no lineal.
El problema general para encontrar ecuaciones de curvas de aproximacin que se ajustan a conjuntos
de datos se denomina ajuste de curvas.
LA LNEA RECTA
El tipo ms simple de curva de aproximacin es la lnea recta, cuya ecuacin puede expresarse como:
= 0 + 1
Dados dos puntos cualesquiera (1 , 1 ), (2 , 2 ) en la recta es posible determinar las constantes
0 1 . La ecuacin resultante de la recta se expresara as:
2 1
1 = (
) ( 1 )
1 = ( 1 )
2 1
Donde:
2 1
=(
)
2 1
Se llama pendiente de la recta y representa el cambio en Y, dividido entre el cambio correspondiente
en X.
En la ecuacin anterior la constante 1 es la pendiente m.
La constante 0 que es el valor de Y cuando X=0, se denomina la interseccin en Y.
De todas las curvas que se aproximan a un conjunto de datos definidos por puntos, la curva que tiene
la propiedad de que 12 + 22 + + 2 es un mnimo se llama curva de ajuste ptimo o curva de
mnimos cuadrados.
Pgina | 9
UNA PUNO
DISEOS ESTADSTICOS
( ) ( )( )
2 ( )2
El trabajo requerido para encontrar una recta de mnimos cuadrados puede simplificarse si se
transforma = y = , entonces la ecuacin de la recta de mnimos cuadrados se
expresa como:
= ( 2)
ANLISIS DE REGRESIN
El Anlisis de Regresin es un mtodo que se emplea para encontrar una funcin que se ajusta a una
nube de puntos o diagrama de dispersin, con la finalidad de poder obtener una prediccin
aproximada de una de las variables a partir de la otra. As la regresin de la variable Y sobre X es
dada por:
= () = 0 + 1
Naturalmente debemos elegir una funcin ptima de entre todas las funciones que se ajustan a la
nube de puntos, esto es, la que mejor encaje sobre los puntos del diagrama de dispersin, para lo cual
utilizamos el mtodo de los mnimos cuadrados.
Ejemplo 1: Dados los siguientes datos:
X
2
3
Y
1
3
5
7
7
11
9
15
10
17
Construya una lnea recta que se aproxime a los datos (en el diagrama de dispersin).
Encuentre una ecuacin para esta recta.
Pgina | 10
UNA PUNO
DISEOS ESTADSTICOS
Diagrama de Dispersin
Y 18
16
14
12
10
8
6
4
2
0
0
10
12
Para determinar la ecuacin de la recta dada por = 0 + 1 solo necesitamos dos puntos.
Elegimos los puntos (2,1) y (3,3) tenemos:
Si sustituimos (2,1) en la ecuacin queda 1 = 0 + 21
De manera similar para el punto (3,3) tenemos 3 = 0 + 31
Resolviendo las ecuaciones simultneamente 0 = 3 1 = 2 la ecuacin requerida es:
= 3 + 2
Ejemplo 2: Con los datos del problema anterior, calcule:
a) Y cuando X=4
b) Y cuando X=15
c) Y cuando X=0
d) X cuando Y=7.5
e) El incremento en Y correspondiente al crecimiento de una unidad en X
Solucin:
a) Si = 4, = 3 + 2(4) = 5 como se busca un valor de Y correspondiente a un valor de X
incluido entre dos valores dados de X, este proceso se llama interpolacin lineal.
b) Si = 15, = 3 + 2(15) = 27 como se busca un valor de Y correspondiente a un valor de X
fuera de o exterior a los valores dados de X, este proceso se llama extrapolacin lineal
c) Si = 0, = 3 + 2(0) = 3 el valor de Y cuando X=0 se llama interseccin en Y, es el valor
de Y en el punto en que la recta (extendida si es necesario) se cruza con el eje Y.
d) Si = 7.5, 7.5 = 3 + 2, = 7.25
e) Si = 0, 0 = 3 + 2, = 1.5 el valor de X cuando Y=0 se llama interseccin en X, es el valor
de X en el punto donde la recta (extendida si es preciso) se cruza con el eje X.
Pgina | 11
UNA PUNO
f)
DISEOS ESTADSTICOS
Y
1
2
4
4
5
7
8
9
= 40
X2
1
9
16
36
64
81
121
196
2
= 524
XY
1
6
16
24
40
63
88
126
XY = 364
Y2
1
4
16
16
25
49
64
81
2
= 256
( ) ( )( ) (8)(364) (56)(40)
7
=
=
= 0.636
2
2
2
(8)(524) (56)
( )
11
( ) ( )( ) (8)(364) (40)(56)
=
= 1.50
(8)(256) (40)2
2 ( )2
Pgina | 12
UNA PUNO
DISEOS ESTADSTICOS
CORRELACIN LINEAL:
La correlacin es un mtodo empleado para determinar el grado de relacin entre las variables que
se estudian, para as determinar en qu medida una relacin funcional describe o explica de forma
adecuada la relacin entre estas variables.
Atendiendo al relacionamiento entre las variables X e Y, podemos tener.
1. Correlacin directa o positiva: Cuando las variables X e Y presentan variaciones en un mismo
sentido, esto es, para mayores valores de X corresponden mayores valores de Y.
2. Correlacin inversa o negativa: Cuando las variaciones de X e Y, son en sentido contrario, esto es,
para mayores valores de X corresponden menores valores de Y.
Ejemplo: En el diagrama de dispersin de la figura 1, se observa que las dos variables presentan
una cierta asociacin lineal directa o (Positiva).
En la figura 2 el diagrama de dispersin nos presenta una dependencia lineal inversa (o negativa),
y finalmente en la figura 3 se aprecia una situacin en donde las dos variables, no presentan,
prcticamente correlacin.
Pgina | 13
UNA PUNO
DISEOS ESTADSTICOS
( )( )
[ 2 ( )2 ][ 2 ( )2 ]
( 2 )( 2 )
Ejemplo 6: Con los datos del ejemplo 3 hallar e interpretar el coeficiente de correlacin lineal.
Solucin: Reemplazando los valores hallados en la formula tenemos:
=
( )( )
[ 2 ( )2 ][ 2 ( )2 ]
(8)(364) (56)(40)
[(8)(524) (56)2 ][(8)(256) (40)2 ]
= 0.977
El valor de = 0.977 indica que existe una muy fuerte correlacin lineal positiva entre las variables.
La otra forma de calcular el coeficiente de correlacin lineal es utilizando la frmula:
=
( 2 )( 2 )
Pgina | 14
UNA PUNO
DISEOS ESTADSTICOS
Donde:
= =
El procedimiento para el clculo requiere realizar el siguiente arreglo:
)
(
-6
-4
-3
-1
1
2
4
7
1
1
3
2
4
4
6
4
8
5
9
7
11
8
14
9
= 56
= 40
56
40
=
= 7 =
=5
8
8
=
)
(
-4
-3
-1
-1
0
2
3
4
( 2 )( 2 )
36
16
9
1
1
4
16
49
24
12
3
1
0
4
12
28
16
9
1
1
0
4
9
16
2 = 132
xy = 84
2 = 56
84
(132)(56)
= 0.977
Ejemplo 7: Los siguientes datos corresponden a las estaturas X e Y respectivas en pulgadas (pulg.) de
una muestra de 12 padres y sus hijos mayores.
Estatura X del padre (pulg.) 65 63 67 64 68 62 70 66 68 67 69 71
Estatura Y del hijo (pulg.)
68 66 68 65 69 66 68 65 71 67 68 70
a)
b)
c)
d)
Pgina | 15