Está en la página 1de 15

UNA PUNO

DISEOS ESTADSTICOS

VARIABLE ESTADSTICA BIDIMENSIONAL


En la prctica a menudo estamos interesados en analizar el comportamiento conjunto de dos o ms
variables, es decir situaciones en las que el investigador realiza la observacin simultnea de dos
caractersticas del individuo, obtenindose de esta manera pares de resultados; por ejemplo,
podemos observar en una persona su peso y su talla.
Los distintos valores que pueden adoptar estas caractersticas en estudio forman un conjunto de
pares, que denotamos por (X;Y) y la llamamos variable estadstica bidimensional.
Observacin 1.- La variable estadstica bidimensional (X;Y) puede representar las situaciones
siguientes:
Dos caractersticas cualitativas; por ejemplo la educacin y regin de procedencia de una persona.
Dos caractersticas cuantitativas; por ejemplo, el peso y la altura de una persona.
Una cualitativa y otra cuantitativa; por ejemplo, la profesin y la edad de una persona.
Si las componentes de una variable bidimensional (X;Y) son caractersticas cuantitativas, pueden a su
vez clasificarse en:
a) X discreta e Y discreta; por ejemplo, nmero de admisiones y nmero de mdicos en un hospital
durante un mes.
b) X continua e Y continua; por ejemplo, el peso y la altura de una persona.
c) X discreta e Y continua; por ejemplo, nmero de accidentes automovilsticos que se producen
dentro de los lmites de la ciudad y el grado de alcohol en el cuerpo.
d) X continua e Y discreta; por ejemplo, la estatura del padre de familia y nmero de hijos.
REPRESENTACIN DE LA INFORMACIN MEDIANTE TABLAS BIDIMENSIONALES
Definicin: Sea (X;Y) una variable estadstica bidimensional tal que los distintos valores que toman X
e Y son:
: 1 , 2 , 3 , ,
: 1 , 2 , 3 , ,
Una distribucin bidimensional de frecuencias es un arreglo de los valores
observados (1 ; 1 ), (2 ; 2 ), , ( ; ) de la variable bidimensional (X;Y) con sus respectivas
frecuencias en una tabla de doble entrada de la forma
Valores de Y

Total

Valores de X
1

11
12
1
.
2

21
22
2
.

Total

=
= =

Ing. Ronald Mamani Mayta

Pgina | 1

UNA PUNO

DISEOS ESTADSTICOS

Donde:
:

. = =
=1

. = =
=1

Nmero de veces que aparece repetido el valor (1 ; 1 ), y se llama frecuencia


absoluta del par ( ; ) = 1, 2, 3, , = 1, 2, 3, ,
Total de pares con primera componente ( = 1, 2, 3, , ), y se llama
frecuencia marginal del valor .
Total de pares con segunda componente ( = 1, 2, 3, , ), y se llama
frecuencia marginal del valor .
Nmero total de pares observados.

=1 =1

DISTRIBUCIONES MARGINALES
Distribucin Marginal de X
.

Distribucin Marginal de Y
.

1.

.1

Total

= .
=

Total

= .
=

Ejemplo 1: Supongamos que queremos analizar el comportamiento conjunto de las variables grado
de instruccin (X) y regin de procedencia (Y) de los empleados del Ministerio de Agricultura, los datos
se muestran en la siguiente tabla:
Tabla 1: Distribucin conjunta de las frecuencias de las variables grado de instruccin (X) y regin de
procedencia (Y)
X
Primaria
Secundaria
Superior
Total
Y
Completa
Completa
Costa
40
30
20
90
Sierra
35
15
10
60
Selva
30
15
5
50
Total
105
60
35
200=n
Fuente: Datos dietticos.
Cada elemento del cuerpo de la tabla representa la frecuencia observada de las realizaciones
simultneas de X e Y. As observamos que 40 empleados con primaria completa son de la Costa, 30
empleados con secundaria completa son de la Costa, etc.
Los totales de las filas nos dan la distribucin marginal de la variable X (grado de instruccin) y los
totales de las columnas nos dan la distribucin marginal de la variable Y (regin de procedencia).

Ing. Ronald Mamani Mayta

Pgina | 2

UNA PUNO

DISEOS ESTADSTICOS

Observacin 2: En muchas situaciones en vez de trabajar con las frecuencias absolutas, podemos
construir tablas con las frecuencias relativas (proporciones). Como se hizo en el caso unidimensional.
Sin embargo existen tres posibilidades de expresar la proporcin de elementos en cada celda.
1) Con relacin al total general, y se llama frecuencia relativa, as la frecuencia relativa
correspondiente al par ( ; ), es dada por:

=
= 1, 2, , ; = 1,2, ,

Las frecuencias relativas marginales de las variables X e Y son dados respectivamente por:
. =
. =

= 1, 2, , ; (Frecuencia relativa marginal del valor )


= 1, 2, , ; (Frecuencia relativa marginal del valor )

2) Con relacin al total de cada fila


(

) , = 1, 2, , ; = 1, 2, ,
.

3) Con relacin a cada columna.


(

) , = 1, 2, , ; = 1, 2, ,
.

Ejemplo 2: La distribucin conjunta de las proporciones (frecuencias relativas) de los datos de la tabla
1, con relacin al total de observaciones ( = 200), est dado en la siguiente tabla.
Tabla 2: Distribucin conjunta de las proporciones (en porcentajes) con relacin al total general de las
variables grado de instruccin (X) y regin de procedencia (Y)
X
Primaria
Secundaria
Superior
Total
Y
Completa
Completa
Costa
20%
15%
10%
45%
Sierra
17.5%
7.5%
5%
30%
Selva
15%
7.5%
2,5%
25%
Total
52.5%
29%
17.5%
100%
40

Aqu podemos afirmar que 11 100 = 200 100 = 20% de los empleados del Ministerio de
Agricultura son de la costa y tienen grado de instruccin primaria completa, mientras que 21
35

100 = 200 100 = 217,5% de los empleados son de la sierra y tienen grado de instruccin primaria
completa.
Los porcentajes totales de las filas y columnas nos dan las distribuciones marginales de cada una de
las variables X e Y. As el 45% (porcentaje marginal) de los empleados del Ministerio de Agricultura son
de la Costa, 30% de la Sierra y 25% de la Selva.
Ejemplo 3: La distribucin de las proporciones de los datos de la tabla 1, con relacin al total de cada
columna esta dado en la siguiente tabla.

Ing. Ronald Mamani Mayta

Pgina | 3

UNA PUNO

DISEOS ESTADSTICOS

Tabla 3: Distribucin conjunta de las proporciones (en porcentaje) con relacin a los totales de cada
columna de las variables X e Y de la tabla 1.
X

Primaria
Completa
38.1%
33.3%
28.6%
100%

Y
Costa
Sierra
Selva
Total

Secundaria
Completa
50%
25%
25%
100%

As podemos decir que 11 100 =

11
.1

Superior

Total

57.1%
28.6%
14.3%
100%

45%
30%
25%
100%

40

100 = 105 100 = 38.1% de los empleados del

35

21
Ministerio de Agricultura con primaria completa son de la costa, 21 100 = .1
= 105 100 =

33.3% de la sierra y 31 100 =

31
.1

30

105

100 = 28.6% de la selva.

PROPIEDADES DE LAS FRECUENCIAS


Sea n el nmero total de pares observados de la variable bidimensional (X;Y), se destacan las siguientes
propiedades.
1. La suma de las frecuencias absolutas es igual al nmero de pares observados.

=
=1 =1

2. La suma de las frecuencias relativas es igual a la unidad.

= 1
=1 =1

3.

. = 1. + 2. + + . =
=1

4.

. = .1 + .2 + + . =
=1

5.

. = 1 . = 1
=1

6.
7.

=1

= .
=1 =1

=1

= .
=1 =1

=1

Ing. Ronald Mamani Mayta

Pgina | 4

UNA PUNO

DISEOS ESTADSTICOS

MEDIAS Y VARIANZAS MARGINALES


Definicin 2: Sean (1 ; 1 ), (1 ; 2 ), , (1 ; ), (2 ; 1 ), , ( ; ) valores distintos de la variable
bidimensional (X;Y) con frecuencias absolutas 11 , 12 , , , respectivamente. Las medias y
varianzas marginales de X e Y son dadas por:
k

f
i 1

i. i

f x X
k

S X2

i.

i 1

n 1

f y
e

SY2

.j

j 1

n 1

i 1

2
i. i

j 1

.j

yj

n ( X )2

n 1
e

f x

f
j 1

.j

y 2j n (Y ) 2
n 1

Por tanto las desviaciones tpicas marginales de X e Y son:

SX

i 1

f y
e

f x X
k

i.

j 1

SY

n 1

.j

n 1

Definicin 3: Sean (1 ; 1 ), (2 ; 2 ), , ( ; ) valores distintos de la variable (X;Y) con frecuencias


absolutas 11 , 12 , , , respectivamente. La covarianza entre las variables X e Y es dada por:

f x
k

S XY CovX ; Y

i 1 j 1

ij

X y j Y
n

Donde:

=
=1 =1

Otra frmula abreviada de la covarianza es:

S XY

Ing. Ronald Mamani Mayta

1 k e
CovX ; Y f ij xi y j X Y
n i 1 j 1

Pgina | 5

UNA PUNO

DISEOS ESTADSTICOS

Ejemplo 3: En una encueta realizada en una poblacin se obtuvo la siguiente informacin con relacin
al nmero de habitantes (X) y dormitorios (Y) en una muestra de 50 viviendas.
Habitantes Dormitorios
Habitantes Dormitorios
Habitantes Dormitorios
(X)
(Y)
(X)
(Y)
(X)
(Y)
6
2
5
2
4
1
3
2
3
1
4
1
5
2
3
1
4
1
5
2
5
2
3
1
8
3
3
2
4
1
5
2
5
2
4
1
6
2
2
1
4
1
5
2
3
1
4
2
4
1
4
2
6
1
2
1
3
1
3
2
8
4
6
3
4
1
4
3
4
1
4
2
2
1
2
1
5
2
2
1
6
3
5
2
3
1
4
1
4
2
3
2
4
2
8
4
3
1
2
1
Se pide:
a) Construir una tabla bidimensional y las frecuencias marginales.
b) Determinar las frecuencias acumuladas.
c) Encuentre las medias y varianzas marginales.
d) Halle la covarianza.
Solucin:
a) La tabla bidimensional con sus frecuencias absolutas y marginales es
Y
Total
1
2
3
4
X
fi.
2
6
0
0
0
6
3
7
4
0
0
11
4
10
5
1
0
16
5
0
9
0
0
9
6
1
2
2
0
5
8
0
0
1
2
3
TOTAL
24
20
4
2
n=50
f.j

Ing. Ronald Mamani Mayta

Pgina | 6

UNA PUNO

DISEOS ESTADSTICOS

b) La tabla de frecuencias acumuladas es


Y
1
X
2
6
3
13
4
23
5
23
6
24
8
24

6
17
32
41
44
44

6
17
33
42
47
48

6
17
33
42
47
50

c) Para hacer los clculos ordenados de las medias y varianzas marginales, es conveniente construir
la siguiente tabla
Y
TOTAL
1
2
3
4
fi.Xi
fi.xi2
X
fi.
2
6
0
0
0
6
12
24
3
7
4
0
0
11
33
99
4
10
5
1
0
16
64
256
5
0
9
0
0
9
45
225
6
1
2
2
0
5
30
180
8
0
0
1
2
3
24
192
TOTAL
24
20
4
2
n=50
208
976
f.j
f.jyj
24
40
12
8
84
2
f.jyj
24
80
36
32
172
e

i. i

i 1

n
k

S
2
X

f x
i 1

2
i. i

208
4.16
50

n ( X )2

n 1
e

2
Y

f
j 1

.j

y 2j n (Y ) 2
n 1

f
j 1

.j

yj

84
1.68
50

976 50(4.16) 2

2.26
50 1
172 50(1.68) 2

0.63
50 1

d) Al emplear la frmula abreviada de la covarianza se tiene

S XY

1 k e
393
CovX ; Y f ij xi y j X Y
(4.16)(1.68) 0.8712
n i 1 j 1
50

Ing. Ronald Mamani Mayta

Pgina | 7

UNA PUNO

DISEOS ESTADSTICOS

RELACIN ENTRE VARIABLES


En muchas aplicaciones estadsticas se deben resolver problemas que contienen un conjunto de
variables y que se sabe que existe alguna asociacin entre ellas. En este conjunto de variables muy a
menudo se tiene una sola variable dependiente (o respuesta), y que depende de una o ms variables
independientes o predictoras (o de regresin) X1, X2, , Xk
Ejemplo: El salario es dependiente de: aos de experiencia, grado de instruccin, sexo, etc.
La variable dependiente se mide con un error que no se controla en el experimento, por tanto, Y es
una variable aleatoria. Las variables independientes X1, X2, , Xk se miden con un error despreciable,
que en la mayora de los casos se controla en el experimento, y por lo tanto, no tienen la propiedad
de ser variables aleatorias.
La primera forma es determinar una relacin funcional de la variable dependiente, con respecto a una
o ms variables independientes con el fin de predecir valores de Y. este mtodo es el anlisis de
regresin.
La segunda forma de estudio de la asociacin entre variables, es, medir la magnitud relacin entre
ellas, mediante un coeficiente o ndice. A esta tcnica se denomina Anlisis de Correlacin.
Los mtodos de regresin y correlacin entre variables se clasifican por el nmero de variables
independientes, en simple y mltiple.

NOCIONES DE CORRELACIN Y REGRESIN LINEAL


AJUSTE DE CURVAS
Para determinar una ecuacin que relacione variables, un primer paso es recolectar datos que
muestren los valores correspondientes de las variables en consideracin. Por ejemplo, suponga que X
e Y denotan la estatura y el peso de hombres adultos, respectivamente, entonces una muestra de n
individuos revelara las estaturas 1 , 2 , 3 , , ; as como los pesos correspondientes
1 , 2 , 3 , ,
El siguiente paso es graficar los puntos (1 , 1 ), (2 , 2 ), , ( , ) en un sistema rectangular de
coordenadas. El conjunto de puntos resultante suele denominarse Diagrama de dispersin.

Ing. Ronald Mamani Mayta

Pgina | 8

UNA PUNO

DISEOS ESTADSTICOS

A partir del diagrama de dispersin podemos visualizar que los datos se aproximan a una curva suave,
que se denomina curva de aproximacin. En la fig. 1 los datos parecen aproximarse a una lnea recta
por lo que se dice que hay una relacin lineal entre las variables, en la fig. 2 aunque existe una relacin
entre las variables esta no es lineal por lo que se le conoce como relacin no lineal.
El problema general para encontrar ecuaciones de curvas de aproximacin que se ajustan a conjuntos
de datos se denomina ajuste de curvas.

LA LNEA RECTA
El tipo ms simple de curva de aproximacin es la lnea recta, cuya ecuacin puede expresarse como:
= 0 + 1
Dados dos puntos cualesquiera (1 , 1 ), (2 , 2 ) en la recta es posible determinar las constantes
0 1 . La ecuacin resultante de la recta se expresara as:
2 1
1 = (
) ( 1 )

1 = ( 1 )
2 1
Donde:
2 1
=(
)
2 1
Se llama pendiente de la recta y representa el cambio en Y, dividido entre el cambio correspondiente
en X.
En la ecuacin anterior la constante 1 es la pendiente m.
La constante 0 que es el valor de Y cuando X=0, se denomina la interseccin en Y.

EL MTODO DE LOS MNIMOS CUADRADOS


Sean (1 , 1 ), (2 , 2 ) valores de la variable bidimensional (X;Y), para un determinado valor de X por
ejemplo 1 habr una diferencia entre el valor 1 , y el valor correspondiente deducido a partir de la
curva . Como se muestra en la figura estas diferencias se simbolizan con y se conocen como
desviacin, error o residual, que puede ser positivo, negativo o cero.
Una medida de la bondad de ajuste de los datos en la curva C de la siguiente figura est dado por
12 + 22 + + 2 . Si esta es pequea el ajuste es bueno; si es grande el ajuste es malo.

De todas las curvas que se aproximan a un conjunto de datos definidos por puntos, la curva que tiene
la propiedad de que 12 + 22 + + 2 es un mnimo se llama curva de ajuste ptimo o curva de
mnimos cuadrados.

Ing. Ronald Mamani Mayta

Pgina | 9

UNA PUNO

DISEOS ESTADSTICOS

LA RECTA DE MNIMOS CUADRADOS


La recta de mnimos cuadrados que se aproxima al conjunto puntos (1 , 1 ), (2 , 2 ), , ( , )
tiene por ecuacin:
= 0 + 1
Donde las constantes 0 1 se determinan resolviendo simultneamente las ecuaciones:
= 0 + 1
X = 0 + 1 2
Denominadas ecuaciones normales para la recta de mnimos cuadrados, de donde las constantes
0 1 pueden calcularse a partir de las frmulas:
( )( 2 ) ( )( )
0 =
2 ( )2
1 =

( ) ( )( )
2 ( )2

El trabajo requerido para encontrar una recta de mnimos cuadrados puede simplificarse si se
transforma = y = , entonces la ecuacin de la recta de mnimos cuadrados se
expresa como:

= ( 2)

Si la variable X se toma como la variable dependiente en lugar de la independiente la ecuacin de la


resta se expresa como:
= 0 + 1
Entonces los resultados son vlidos si X e Y se intercambian y si si 0 1 se sustituyen por 0 1

ANLISIS DE REGRESIN
El Anlisis de Regresin es un mtodo que se emplea para encontrar una funcin que se ajusta a una
nube de puntos o diagrama de dispersin, con la finalidad de poder obtener una prediccin
aproximada de una de las variables a partir de la otra. As la regresin de la variable Y sobre X es
dada por:
= () = 0 + 1
Naturalmente debemos elegir una funcin ptima de entre todas las funciones que se ajustan a la
nube de puntos, esto es, la que mejor encaje sobre los puntos del diagrama de dispersin, para lo cual
utilizamos el mtodo de los mnimos cuadrados.
Ejemplo 1: Dados los siguientes datos:
X
2
3
Y
1
3

5
7

7
11

9
15

10
17

Construya una lnea recta que se aproxime a los datos (en el diagrama de dispersin).
Encuentre una ecuacin para esta recta.

Ing. Ronald Mamani Mayta

Pgina | 10

UNA PUNO

DISEOS ESTADSTICOS

Solucin: Graficamos los pares ordenados correspondientes a los datos.

Diagrama de Dispersin
Y 18
16
14
12

10
8
6

4
2
0
0

10

12

Para determinar la ecuacin de la recta dada por = 0 + 1 solo necesitamos dos puntos.
Elegimos los puntos (2,1) y (3,3) tenemos:
Si sustituimos (2,1) en la ecuacin queda 1 = 0 + 21
De manera similar para el punto (3,3) tenemos 3 = 0 + 31
Resolviendo las ecuaciones simultneamente 0 = 3 1 = 2 la ecuacin requerida es:
= 3 + 2
Ejemplo 2: Con los datos del problema anterior, calcule:
a) Y cuando X=4
b) Y cuando X=15
c) Y cuando X=0
d) X cuando Y=7.5
e) El incremento en Y correspondiente al crecimiento de una unidad en X
Solucin:
a) Si = 4, = 3 + 2(4) = 5 como se busca un valor de Y correspondiente a un valor de X
incluido entre dos valores dados de X, este proceso se llama interpolacin lineal.
b) Si = 15, = 3 + 2(15) = 27 como se busca un valor de Y correspondiente a un valor de X
fuera de o exterior a los valores dados de X, este proceso se llama extrapolacin lineal
c) Si = 0, = 3 + 2(0) = 3 el valor de Y cuando X=0 se llama interseccin en Y, es el valor
de Y en el punto en que la recta (extendida si es necesario) se cruza con el eje Y.
d) Si = 7.5, 7.5 = 3 + 2, = 7.25
e) Si = 0, 0 = 3 + 2, = 1.5 el valor de X cuando Y=0 se llama interseccin en X, es el valor
de X en el punto donde la recta (extendida si es preciso) se cruza con el eje X.

Ing. Ronald Mamani Mayta

Pgina | 11

UNA PUNO

f)

DISEOS ESTADSTICOS

Si X se incrementa una unidad de 2 a 3, Y se incrementa de 1 a 3, un cambio de dos unidades, Si


X se incrementa de 2 a 10 (10-2)=8 unidades, entonces Y se incrementa de 1 a 17 (17-1)=16
unidades, es decir un aumento de 8 unidades en X corresponde a un aumento de 16 unidades en
Y, podemos decir tambin Y se incrementa 2 unidades por un incremento de una unidad en X.

Ejemplo 3: Dado los siguientes datos:


X
1
3
4
6
8
9
11
14
Y
1
2
4
4
5
7
8
9
a) Construya una recta que se aproxime a los datos.
b) Encuentre una ecuacin para esta recta.
c) Compare los valores de Y obtenidos a partir de la recta de aproximacin con aquellos dados en la
anterior tabla.
d) Estime el valor de Y cuando X=10
Ejemplo 4 Ajuste una recta de mnimos cuadrados a los datos del ejemplo anterior usando:
a) X como variable independiente.
b) Y como variable independiente.
Solucin: Realizamos el siguiente arreglo y clculos adicionales con los datos:
X
1
3
4
6
8
9
11
14
= 56

Y
1
2
4
4
5
7
8
9
= 40

X2
1
9
16
36
64
81
121
196
2
= 524

XY
1
6
16
24
40
63
88
126
XY = 364

Y2
1
4
16
16
25
49
64
81
2
= 256

a) Los valores de 0 1 para la recta de mnimos cuadrados de Y sobre X son:


( )( 2 ) ( )( ) (40)(524) (56)(364)
6
0 =
=
=
= 0.545
2
2
2
(8)(524) (56)
( )
11
1 =

( ) ( )( ) (8)(364) (56)(40)
7
=
=
= 0.636
2
2
2
(8)(524) (56)
( )
11

Entonces la recta queda: = 0.545 + 0.636


b) Los valores de 0 1 para la recta de mnimos cuadrados de X sobre Y son:
( )( 2 ) ( )( ) (56)(256) (40)(364)
0 =
=
= 0.50
(8)(256) (40)2
2 ( )2
1 =

Ing. Ronald Mamani Mayta

( ) ( )( ) (8)(364) (40)(56)
=
= 1.50
(8)(256) (40)2
2 ( )2

Pgina | 12

UNA PUNO

DISEOS ESTADSTICOS

Entonces la recta queda: = 0.50 + 1.50


Ejemplo 5: Los siguientes datos corresponden a las estaturas redondeadas en pulgadas (pulg.) y los
pesos redondeados en libras (lb.) de una muestra de 12 estudiantes varones obtenidas al azar de los
alumnos del primer semestre de la Escuela Profesional de Educacin.
Estatura X (pulg.)
70
63
72
60
66
70
74
65
62
67
65
68
Peso Y (lb.)
155 150 180 135 156 168 178 160 132 145 139 152
a)
b)
c)
d)
e)

Obtenga un diagrama de dispersin de los datos.


Construya una recta que se aproxime a los datos.
Encuentre la ecuacin de la recta construida en la parte b.
Estime el peso de un estudiante cuya estatura es de 63 pulg.
Calcule la estatura de un estudiante cuyo peso es de 168 lb.

CORRELACIN LINEAL:
La correlacin es un mtodo empleado para determinar el grado de relacin entre las variables que
se estudian, para as determinar en qu medida una relacin funcional describe o explica de forma
adecuada la relacin entre estas variables.
Atendiendo al relacionamiento entre las variables X e Y, podemos tener.
1. Correlacin directa o positiva: Cuando las variables X e Y presentan variaciones en un mismo
sentido, esto es, para mayores valores de X corresponden mayores valores de Y.
2. Correlacin inversa o negativa: Cuando las variaciones de X e Y, son en sentido contrario, esto es,
para mayores valores de X corresponden menores valores de Y.
Ejemplo: En el diagrama de dispersin de la figura 1, se observa que las dos variables presentan
una cierta asociacin lineal directa o (Positiva).
En la figura 2 el diagrama de dispersin nos presenta una dependencia lineal inversa (o negativa),
y finalmente en la figura 3 se aprecia una situacin en donde las dos variables, no presentan,
prcticamente correlacin.

Ing. Ronald Mamani Mayta

Pgina | 13

UNA PUNO

DISEOS ESTADSTICOS

CALCULO DEL COEFICIENTE DE CORRELACIN


El coeficiente de correlacin es un nmero abstracto que indica el grado de asociacin entre las
variables, y se define del siguiente modo:
=

( )( )
[ 2 ( )2 ][ 2 ( )2 ]

Otra frmula es:


=


( 2 )( 2 )

El coeficiente de correlacin lineal es un nmero comprendido entre -1 y 1, esto es:


1 1
Valores positivos indican que las dos variables aumentan o disminuyen al mismo tiempo, mientras que
valores negativos significan que cuando una variable aumenta la otra disminuye o viceversa.
Si r es exactamente igual a -1 +1, quiere decir que hay una perfecta asociacin entre las dos variables,
en el sentido de que por cada unidad que aumenta o disminuye una variable, la otra cambia siempre
igual nmero de unidades. En dichas ocasiones los puntos en el grafico caeran todos sobre una lnea
recta.
Si r=0, significa que no hay ninguna asociacin entre las dos variables o de existir, no es una relacin
lineal
En resumen para la interpretacin del coeficiente de correlacin tenemos el siguiente cuadro:

Ejemplo 6: Con los datos del ejemplo 3 hallar e interpretar el coeficiente de correlacin lineal.
Solucin: Reemplazando los valores hallados en la formula tenemos:
=

( )( )
[ 2 ( )2 ][ 2 ( )2 ]

(8)(364) (56)(40)
[(8)(524) (56)2 ][(8)(256) (40)2 ]

= 0.977

El valor de = 0.977 indica que existe una muy fuerte correlacin lineal positiva entre las variables.
La otra forma de calcular el coeficiente de correlacin lineal es utilizando la frmula:
=

Ing. Ronald Mamani Mayta


( 2 )( 2 )

Pgina | 14

UNA PUNO

DISEOS ESTADSTICOS

Donde:
= =
El procedimiento para el clculo requiere realizar el siguiente arreglo:
)
(
-6
-4
-3
-1
1
2
4
7

1
1
3
2
4
4
6
4
8
5
9
7
11
8
14
9
= 56
= 40
56
40
=
= 7 =
=5
8
8
=

)
(
-4
-3
-1
-1
0
2
3
4


( 2 )( 2 )

36
16
9
1
1
4
16
49

24
12
3
1
0
4
12
28

16
9
1
1
0
4
9
16

2 = 132

xy = 84

2 = 56

84
(132)(56)

= 0.977

Ejemplo 7: Los siguientes datos corresponden a las estaturas X e Y respectivas en pulgadas (pulg.) de
una muestra de 12 padres y sus hijos mayores.
Estatura X del padre (pulg.) 65 63 67 64 68 62 70 66 68 67 69 71
Estatura Y del hijo (pulg.)
68 66 68 65 69 66 68 65 71 67 68 70
a)
b)
c)
d)

Construya un diagrama de dispersin.


Calcule la recta de regresin de mnimos cuadrados de Y sobre X.
Determine la recta de regresin de mnimos cuadrados de X sobre Y.
Calcule e interprete el coeficiente de correlacin lineal.

Ing. Ronald Mamani Mayta

Pgina | 15

También podría gustarte