Está en la página 1de 53

UNIVERSIDAD NACIONAL AGRARIA DE LA SELVA

FACULTAD DE RECURSOS NATURALES RENOVABLES


DEPERTAMENTO ACADEMICO DE CIENCIAS EN CONSERVACION DE
SUELOS Y AGUA
METODOS ESTADISTICOS
TABLA DE FRECUENCIAS
Sirven para ordenar y organizar los datos estadsticos. Con ellas,
una masa amorfa de datos pasa a ser una coleccin ordenada.
-

Clases son los grupos de datos:

Formula de Sturges
Numero de clases = 1 + 3.322 log n , donde n es el numero total de datos.
Si se obtiene un numero decimal, se aproxima al siguiente entero.
-

El intervalo o ancho de clase ; es el espacio que hay entre el lmite


superior y el limite inferior de la clase.

Ancho de clase = ( dato superior dato inferior ) / numero de clases.

La frecuencia absoluta es el numero de veces que se repite cada dato.

La marca de clase es el punto medio de la clase. Se obtiene dividiendo


entre dos la suma de los valores extremos de cada clase.

El rango es la diferencia entre el valor mayor y el valor menor.

La frecuencia absoluta acumulada es la frecuencia total hasta el limite


superior de cada clase.

La frecuencia relativa se obtiene dividiendo la frecuencia absoluta entre


el numero total de datos y se puede expresar como una fraccin se
simboliza f = F / n

PRACTICA
TABLA DE FRECUENCIA
Se desea saber cmo varia el peso de un grupo de estudiantes de Ingeniera
en Conservacin de Suelos. Se selecciona una muestra de 50 estudiantes
cuyos pesos se dan en kilos :
DATOS
65
64
64
63
64

63
65
65
65
64

65
64
64
63
63

63
72
71
70
69

69
68
68
67
67

67
66
66
66
66

53
55
56
57
58

58
57
59
59
60

60
60
61
61
61

61
62
62
62
62

Para construir la tabla se debe calcular :


Numero de clases o intervalos
K = 1 + 3.322 log n

K = 1 + 3.322 log 50 = 6.64 = 7

Rango = dato mximo dato mnimo


Ancho de clase ( tamao del intervalo )
I = Rango / K

19 / 7 = 2.71 = 3

72 53 = 19

TABLA DE DATOS AGRUPADOS

Pesos

Marca
de
clase

Frecuenci
a
Absoluta

Xi

fi

Frecuenci
a
Absoluta
acumulad
a
Fi

Frecuencia
relativa
Hi

Frecuenci
a relativa
acumulad
a
Hi

(%)

53 55

54

4.00

4.00

56 58

57

10.00

14.00

59 61

60

16

18.00

32.00

62 64

63

15

31

30.00

62.00

65 67

66

12

43

24.00

86.00

68 70

69

48

10.00

96.00

71 73

72

50

4.00

10.00

Total

50

100.00

EXPERIMENTO
El
experimento
es
el
conjunto
de
reglas
usadas
para
obtener una muestra de la poblacin y al concluir el ensayo obtener
informacin acerca de la poblacin.
Little y Jackson afirman que el experimento es un elemento de investigacin
utilizada para descubrir algo desconocido, o para probar un principio o una
hiptesis.
DISEO EXPERIMENTAL
Planear un experimento de manera que se pueda obtener la informacin del
problema bajo investigacin.
Es el proceso que se sigue para asignar los tratamientos a las unidades
experimentales.
TRATAMIENTO
Elemento sometido a estudio o ensayo de comparacin
Es la cantidad o calidad, del factor a estudiar toma durante el experimento.
Ejm
Marca de fertilizante
Cantidad de fertilizante
Sistema de riego
Profundidad de siembra
TRATAMIENTO TESTIGO
Es un tratamiento que se compara.
Es un tratamiento especial del experimento y sirve como comparacin de los
tratamientos de prueba.
UNIDAD EXPERIMENTAL
Es el material al que se le aplica los tratamientos.
Una maceta
Una parcela
Un pollo
REPETICIN
Es una replica de la aplicacin de un tratamiento es otra unidad experimental
bajo las mismas condiciones.
Cuando en un experimento se tiene un conjunto de tratamientos para poder
estimar el error experimental, es necesario que dichos tratamientos aparezcan
ms de una vez en el experimento, para as aumentar la precisin de ste,
controlar el error experimental y disminuir la desviacin estndar de la media.
BLOQUE
Es un conjunto de unidades experimentales lo ms homogneas posibles, en el
cual aparecen todos los tratamientos una sola vez; dicho bloque se debe
colocar perpendicular al gradiente para tratar de maximizar el error.

ERROR EXPERIMENTAL
Es una fuente de variacin que permite evaluar el efecto de los tratamientos.
El error experimental se forma por la variacin de la unidades que recibieron el
mismo trato en la aplicacin de los tratamientos y que por efectos no
controlables reportan cierta diferencias.
Los resultados experimentales varan no slo por la accin de los tratamientos,
sino tambin por variaciones ambientales que tienden a enmascarar el efecto
de los tratamientos. Por lo general, para expresar estas variaciones se usa el
trmino error experimental. Pero el trmino error no quiere decir equivocacin,
sino que incluye todo tipo de variacin externa ajena al material experimental.
El error experimental es la medida de variacin que existe entre las
observaciones de unidades experimentales en el mismo tratamiento, es decir la
variacin no proveniente de los tratamientos.
Las modalidades ms recomendadas para disminuir el error son:
Utilizar unidades experimentales muy uniformes, como suelo
homogneo, riesgos, densidad de siembra, fertilizacin, control de
plagas y hierbas, etctera.

Tamao adecuado de la unidad experimental.

Eliminacin del efecto de orilla y de la competencia entre tratamientos.

Distribucin adecuada de los tratamientos mediante sorteos.

Usar el nmero adecuado de repeticiones para cada tratamiento.

Poner todos los tratamientos en igualdad de condiciones, de manera que


si alguno es superior a los dems, se pueda probar.

POBLACIN
Conjunto de unidades elementales (personas, animales, plantas, etc.) con
caractersticas comunes en las cuales se estudian una o ms variables.
Ejm:
El conjunto de madereros de la ciudad de Pucallpa.
El conjunto de docentes de la UNAS.
Conjunto de especies forestales de Contamana.

UNIDAD ELEMENTAL
Son los elementos que conforman la poblacin. Es la unidad de donde se
obtienen la informacin deseada acerca de una caracterstica o un atributo
especifico.
Ejm:
Un maderero de la Ciudad de Pucallpa.
Un Docente de la UNAS.
Una especie forestal maderable de contamana.
MUESTRA
Es un subconjunto de una poblacin conformado por uno o ms unidades
elementales.
Ejm:
20 madereros de Pucallpa
10 docentes de la UNAS
25 especies forestales maderables de Contamana.

TAMAO DE LA MUESTRA
n =

Z2 x pq
__________
e2

Z = 1.96
e = error 3% ( 0.03 )
p = 0.5
q = 0.5

ajustando
N =

n
_____________________
1 + ( n - 1 )
_________
N

N = poblacin

VARIABLE
Son elementos, caractersticas, propiedades, atributos o conductas que tienden
a tomar diferentes valores, cuando son observadas las unidades elementales
de la muestra o poblacin.
Las variables son observadas a travs de evaluaciones, mediciones o
encuestas.
Ejm:
Altura de planta de Bambu.
Sabor del fruto de aguaje.
Calidad de fruto de cacao.
Nmero de flores de planta de rosa.
Dimetro de planta de Cedro.
Peso de Cerdo.
TIPOS DE VARIABLES
Variables Cualitativas
Son aquellas caractersticas que cuyos resultados no pueden ser
expresadas en forma de valores numricos.
Ejm:
Color de hoja de maz.
Sabor de la fruta de Ungurahui.
Calidad de fruta del Cacao.
Sexo de los vacunos.
Lugar de procedencia de choferes.
Religin de los pobladores de Yarinacocha.
Variables Cuantitativas
Son aquellas caractersticas cuyos resultados pueden ser expresados en
valores numricos.
Ejm:
Altura de planta de Camu Camu.
Dimetro de planta de Tornillo.
Longitud de Bambu.
Peso de los estudiantes de Contabilidad.

CLASES DE VARIABLES CUANTITATIVAS


Variables Cuantitativas Discretas
Son aquellas que presentan valores enteros.
Ejm:
Nmero de hojas.
Nmero de hijos.
Nmeros de frutos.
Grado de Estudio.

Variables Cuantitativas Continuas


Son aquellas caractersticas que pueden asumir cualquier valor
numrico dentro de un intervalo continuo.
Ejm:
Altura de planta.
Longitud de rbol.
Variables Independientes
Es el contexto experimental es la que el investigador manipula con el fin
de establecer la posible influencia que tiene sobre la variable dependiente.
Variable Dependiente
Es la variable que va a ser afectada en los resultados o que experimenta
modificaciones por la presencia de la variable Independiente. Esta variable no
se manipula solo se mide.
Indicadores
Son subvariables que se desprenden de la variable principal a partir de un
proceso del anlisis y deduccin lgica con el objetivo de facilitar su control,
manipulacin, medicin y evaluacin.

ANALISIS DE VAIANCIA
Es un procedimiento aritmtico que consiste en desdoblar la suma de
cuadrados total ( variacin total )en fuentes de variacin reconocidas, con todo
y la variacin que no se puede medir ( provenientes de la variabilidad
inherente al material experimental o de la falta de homogeneidad del ambiente
donde se realiz el experimento ); fuente de variacin que se conoce como
residuo o error experimental .
El ANVA se utiliza en todos los campos de investigacin cuando los datos se
miden cuantitativamente.
FUENTES DE VARIACIN
Estan referidas a las fuentes controlables y no controlables de un diseo
experimental
GRADOS DE LIBERTAD
Los grados de libertad son el numero de contrastes ortogonales menos el
numero de restricciones impuestas que se pueden hacer en un grupo de datos.

COEFICIENTE DE VARIACIN
Es una medida de variacin del experimento en funcin del error experimental y
la magnitud de la variable en estudio.
CV = CME
-------------------------- x 100
Promedio general

DISEOS EXPERIMENTALES

DISEO COMPLETAMENTE AL AZAR ( DCA )


Es el diseo ms simple y se usa cuando las unidades experimentales ( u.e )
son homogneas, y la variacin entre ellas es muy pequea. Se usa para
experimentos de laboratorio, invernaderos, granjas, viveros, gabinete . En estos
experimentos las condiciones ambientales son controlados. El coeficiente de
variacin debe ser menor de 15 % .
VENTAJAS.
Es fcil de planear .
Se aplica cuando las unidades experimentales son homogneas.
La distribucin de los tratamientos en las unidades experimentales son al azar.
No es necesario que el numero de tratamientos sea igual al nmero de
repeticiones.
Es flexible en cuanto al nmero de tratamientos y repeticiones, el lmite esta
dado por el nmero de unidades experimentales en general.
DESVENTAJAS
No es eficiente cuando el material es heterogneo.
El error experimental incluye la variacin total entre las unidades
experimentales

MODELO ADITIVO LINEAL O MODELO ESTADISTIVO


Y ij = u + i + ij
Y i j = Observacin.
U = Media
i = Efecto del tratamiento
i j = Error


EJEMPLO DISEO COMPLETO AL AZAR
En un ensayo con macetas se aplicaron cinco tratamientos a vetiveria,
consistentes en sustratos diversos : 1.- arena, 2.- aserrn, 3.- tierra agrcola, 4.tierra negra y 5.-paja de arroz . Se tomaron cuatro macetas por tratamiento.
Los rendimientos en peso seco se expresan en gramos.
Hipotesis : Ho = No existe diferencia entre tratamientos. T1= T2 = T3
Ha = Si existe diferencia entre tratamientos T1 T2 T3
Tratamientos
Maceta
1
2
3
4
5
______________________________________________________________
1
101
51
83
67
29
2
93
61
68
40
45
3
93
59
72
46
51
4
96
58
75
52
42
______________________________________________________________
Total

Y1. =

383 Y 2 . = 229 Y 3 . = 298

Media 1 = 95.75

= 57.25 3 = 74.50

= 51.25

5 = 41.75

Y 2 = ( 1282 ) 2 = 82176
nk
20

FC TC =

SC Total = ( Y i j - ) 2 =
i

Y 4 . = 205 Y 5 . = 167 1282

Y ij

nk

Y .. 2

SC total = 1012 + 512 + ..+ 512 + 522 - 82176 = 8168


SC Tratamiento = n ( i - ) 2 = Yi 2 .. - Y .. 2
n
nk
i
j
i
SC tratamiento = 3832 + 2292 + 298 2 + 2052 + 1672 - 82176
4
SC Error = ( Y i j - i ) 2 i j
i

SC Error = SC total - SC tratamiento


Sc Error = 8168 7286 = 882

Y 2 ij

-
Y .. 2
i
nk

= 7286

ANALISIS DE VARIANCIA
Fuentes de
variacin

GL

Tratamiento

CM

Fc

t -1

SCt
Gl

CMt
CMe

Error

t ( r 1)

Sce
Gl

Total

tr 1

CV = Cme x 100

SC

Ft

Sig

ANALISIS DE VARIANCIA
Fuentes de
variacin

GL

SC

CM

Fc

Ft
(5%)

Sig

Tratamiento

7286

1821.5

30.98

3.06

**

Error

15

882

58.8

Total

19

8168

CV. 58.8
64.1

x 100 = 11.8 %

Fuentes :
Padron C. Julio 1996 Diseos Experimentales con aplicacin a al agricultura
Copia de clases de Mtodos Estadsticos La Molina.
Calzada B. Jos 1970 Mtodos de Investigacin para la Investigacin

DISEO COMPLETAMENTE AL AZAR CON DIFERENTE NUMERO DE


UNIDADES POR TRATAMIENTO
A veces se presenta el caso que por insuficiencia de material para todos los
tratamientos, o porque se han perdido unidades experimentales no se dispone
de igual numero de observaciones por tratamiento. Esta es una de las ventajas
del DCA, ya que los datos se pueden estimar directamente sin tener que
estimar parcelas prdidas. Por ejemplo durante un experimento para probar 04
hormonas de enraizamiento. Durante el experimento se presento la chupadera
y no enraizaron 16 estacas de anturios. La hiptesis por probar es :
Ho : No existe diferencia entre los tratamientos.
Ha : Si existe diferencia entre los tratamientos
1 .- Se analiz en un experimento de cuatro niveles de hormona para enraizar
estacas de anturios con 9 estacas por nivel. Durante el experimento no
enraizaron 16 estacas. Se midieron la altura en cm.
Resultados del experimento ( cm )
______________________________________________________________
Niveles
__________________________________________
Repeticiones
1
2
3
4
______________________________________________________________
1
45
35
34
41
2
46
33
34
41
3
49
35
44
4
44
34
43
5
33
41
6
42
7
44
8
41
9
41
_________________________________________________________
Total
Promedio

184

68

170

378

46

34

34

42

Fc Tc = ( 45 +46 + 49 +.+ 44 + 41 + 41 ) 2 = 3200


20
SC tratamiento = 1842
4

682
2

+ 170 2 + 378 2 - Tc = 432


5
9

SC total = 452 + 462 + 49 + .. + 442 + 412 + 412 - Tc = 464


SC error = SC total SC tratamiento = 464 432 = 32

ANALISIS DE VARIANCIA
Fuentes de
variacin

GL

SC

CM

Fc

Ft
( 0.05 )

Sig

Tratamiento

432

144

72

3.24

++

Error

16

32

Total

19

464

CV = 2
------ x 100 = 2.97 %
47.5

PRUEBAS ESTADISTICAS PARA LA COMPARACION DE MEDIAS

DIFERENCIA LIMITE DE SIGNIFICACION ( DLS )


Este mtodo es la aplicacin de la prueba de t de Student, utilizada
sucesivamente en las comparaciones posibles entre las medias de los
tratamientos evaluados.
Es recomendable solo en el caso de haber especificado algunas
comparaciones al planear la investigacin
1 Encontrar la DLS = CM error
n

t ( gl error )

2 Colocar los promedios en orden descendente


T ( testigo )
A
B
C
.
3 Hacer las comparaciones mediante el cuadro
COMPARACION

DIFERENCIA

DLS

SIGNIFICACION

PRUEBA DE DUNCAN
Esta prueba permite comparar todas las medias entre si, sin restricciones.
La ventaja consiste en el hecho de que no necesita que el valor F sea
significativo para poderlo usar. El procedimiento es el siguiente:
a) Determinar la desviacin estandar de la media
sx =

CM error
n

b) Extraer los valores correspondientes de la tabla empleando los grados de


libertad del error y de los tratamientos y multiplicarlo por la desviacin
estandar de la media. Estos productos constituyen los valores crticos.
c) Establecer l orden de mrito de las medias de los tratamientos.
d) Determinar las diferencias entre las medias y compararla con el
correspondiente valor crtico. Si la diferencia observada es mayor que el

valor crtico correspondiente se acepta que hay diferencia entre las medias
comparadas

COMPARACION

Diferencia

AES

Valor
Crtico

Sig

PRUEBA DE TUKEY
Esta prueba se usa para hacer las comparaciones de medias entre si y es
vlida cuando las repeticiones estn completas
PRUEBA DE CONTRASTES ORTOGONALES
Es una prueba de comparacin de tratamiento que el investigador debe
conocer antes de iniciar su experimento . Previamente debe saber cules
comparaciones de tratamientos son las que le darn la informacin deseada.
Para el anlisis de las comparaciones se usan los totales de los tratamientos
en lugar de las medias, porque as se ahorra y se evitan errores por redondeo
de cifras.
Este mtodo consiste en descomponer los grados de libertad y la suma de
cuadrado para tratamientos . Existen ( t 1 ) contrastes ortogonales donde t es
el nmero de tratamientos.

PRUEBA ESTADISTICAS PARA LA COMPARACION DE MEDIAS


1 .- Se estudi 4 tipos de raciones para auje, uno de los cuales fue el
alimento usual al que se le identifico como testigo. Se emplearon los aujes
machos, la misma edad, estado sanitario., los resultados medidos en kg fueron
TRATAMIENTO
TESTIGO

3.7
3.2
3.5
3.2

4.0
4.4
5.7
4.7

4.7
4.3
5.9
4.7

6.4
7.5
8.4
6.9

TOTAL

13.6

18.8

19.6

29.2

PROMEDIO

3.4

4.7

4.9

7.3

ANVA
Fuentes de
variacin

GL

SC

CM

Fc

Ft
( 0.05 )

Sig

Raciones
( tratamientos )

31.71

10.57

23.4

3.49

**

Error

12

5.42

0.45

Total

15

37,13

CV = 13,24

DIFERENCIA LIMITE DE SIGNIFICACION ( DLS )

Este mtodo es la aplicacin de la prueba de t de Student, utilizada


sucesivamente en las comparaciones posibles entre las medias de los
tratamientos evaluados.
Es recomendable solo en el caso de haber especificado algunas
comparaciones al planear la investigacin
1 Encontrar la DLS = 2 CM error
n

t ( gl error )

DLS

= 2 ( 0.45 ) x 2.18
4
DLS = 1.035
2 Colocar los promedios en orden descendente
T ( testigo ) = 3.4
A
= 4.7
B
= 4.9
C
= 7.3
.
3 Hacer las comparaciones mediante el cuadro
COMPARACION
Testigo
Testigo
Testigo
A vs
A vs
B vs

vs. A
vs B
vs C
B
C
C

DIFERENCIA

DLS

SIGNIFICACION

1.3
1.5
3.9
0.2
2.6
2.4

1.035
1.035
1.035
1.035
1.035
1.035

*
*
*
n.s
*
*

Orden de merito
C
a
B
b
A
b
T

3.4 - 4.7 =
3.4 4.9 =
3.4 7.3 =
4.7 4.7 =
4.7 - 7.3 =
4.9 - 7.3 =

PRUEBA DE DUNCAN

Esta prueba permite comparar todas las medias entre si, sin restricciones.
La ventaja consiste en el hecho de que no necesita que el valor F sea
significativo para poderlo usar. El procedimiento es el siguiente:
e) Determinar la desviacin estandar de la media
sx =

CM error
n

sx =

0 .45 = 0.33
4

f) Extraer los valores correspondientes de la tabla empleando los grados de


libertad del error y de los tratamientos y multiplicarlo por la desviacin
estandar de la media. Estos productos constituyen los valores crticos.
DLS ( valor crtico ) = AES . S x
El valor de AES depende de , gl del error y P
P es el nmero de tratamiento del orden ( ascendente o descendente )
comprendido entre los dos tratamientos a comparar. Los valores de AES
aumentan a medida que crece P.
g) Establecer el orden de mrito de las medias de los tratamientos.
Testigo
A
B
C

= 3.4
= 4.7
= 4.9
= 7.3

h) Determinar las diferencias entre las medias y compararla con el


correspondiente valor crtico. Si la diferencia observada es mayor que el
valor crtico correspondiente se acepta que hay diferencia entre las medias
comparadas.
= 0.05

gl = 12 cm = 0.45

COMPARACION
Testigo
Testigo
Testigo
A
A
B

vs A
vs B
vs C
vs B
vs C
vs C

Orden de merito
C
B
A

n=4

= 0.33

Diferencia

AES

Valor
Crtico

Sig

1.3
1.5
3.9
0.2
2.6
2.4

2
3
4
2
3
2

3.08
3.22
3.32
3.08
3.22
3.08

1.016
1.062
1.095
1.033
1.062
1.016

*
*
*
n.s
*
*

a
b
b

testigo

Fuente. Apuntes de Clase de Mtodos Estadsticos de UNALM

DISEO BLOQUE COMPLETO AL AZAR ( DBCA )


Este diseo rene las unidades experimentales ( u.e ) a las cuales se aplicarn
los tratamientos en bloques de cierto tamao, de tal modo que los tratamientos
se efecten dentro de cada bloque.
Las u.e son homogneas en el bloque y heterogneas entre bloques.
La variabilidad entre u.e de bloques diferentes ser mayor que entre unidades
del mismo bloque.
En cada bloque en nmero de unidades es igual al nmero de tratamientos
( bloques completos ).
Los tratamientos son asignados al azar en las unidades experimentales de
dentro de cada bloque.
Durante el experimento todas las parcelas dentro del bloque se deben tratar
por igual, excepto cuando se aplique un tratamiento cuyo efecto se quiera
medir. Es de fcil planeacin y procedimiento de clculo simple.
La desventaja radica en que, cuando el nmero de tratamiento es alto,
aumenta la superficie del terreno dentro de cada bloque y tambin el error
experimental . Se considera 20 el lmite.
MODELO ADITIVO LINEAL O MODELO ESTADISTICO
Y ij = u + i + j + ij
Y i j = Observacin.
U = Media
i = Efecto del tratamiento
j = Efecto del bloque
i j = Error

ANALISIS DE VARIANCIA

Fuentes de
variacin

GL

SC

CM

Fc

Ft

Sig

Bloque
Tratamiento
Error
Total

DISEO BLOQUE COMPLETO AL AZAR ( DBCA )


PRACTICA
Se quiere estudiar cinco ecotipos de frijol de palo , A, B, C , D , E, si existen
diferencias en sus rendimientos. Para el efecto se llevo a cabo el experimento
en un campo acomodando 5 bloques al terreno y distribuyendo los ecotipos al
azar en cada bloque.. Los rendimientos obtenidos se dan en kg por parcela de
9 m 2.
ECOTIPOS
BLOQUE
A

TOTAL

_
Y.j

1.6

1.8

1.1

2.0

0.9

7.4

1.48

II

1.5

1.4

1.2

1.9

0.5

6.5

1.33

III

1.3

1.2

1.0

1.2

0.8

5.5

1.10

IV

1.8

1.3

1.2

2.0

1.0

7.3

1.46

1.1

1.2

1.0

1.3

0.7

5.3

1.06

TOTAL
_
yi.

7.3

6.9

5.5

8.4

3.9

32

1.46

1.38

1.10

1.68

0.78

HIPOTESIS
Bloques

1.28

Ho = B1 = B2 = B3 = B4 = B5
Ha = B1 B2 B3 B4 B5
Tratamientos
Ho = TA = TB = TC = TD = TE
Ha = TA TB TC TD TE
Clculos
Suma cuadrados de Bloques ( SC B ) =
7.42 + 6.52 + 5.52 + 7.32 + 5.32
------------------------------------5

322
------ = 0.77
25

Suma de cuadrado de Tratamientos ( SC t ) =


7.32 + 6.92 + 5.52 + 8.42 + 3. 92
-----------------------------------------5

322
------ = 2.42
25

Suma de cuadrados del total ( SCT ) =


1.62 + 1.82 + 1.12 +.+1.02 + 1.32 + 0.72

- 322 = 3.78
---25

Suma cuadrado del error ( SC e ) =


1.62 + 1.82 +.....+ 1.32 + 0.72 (

7.4 +.+ 5.3 - 7.3 + .+3.9


-------------------- )
( ------------------ ) = 0.59
5
5

ANALISIS DE VARIANCIA
Fuentes de
variacin

GL

SC

CM

Fc

Ft

Sig

( 0.05 )
4

0.77

0.19

4.75

Tratamiento
Ecotipos

2.42

0.61

15.25

Error

16

0.59

0.04

Total

24

3.78

Bloque

CV = 15.6 %

Fuente : Mtodos Estadsticas para la Investigacin. Calzada Benza, Jos


Mtodos Estadsticos , Padron Julio.

DISEO BLOQUE COMPLETO AL AZAR ( DBCA )


PERDIDA DE UNIDADES EXPERIMENTALES
Se quiere estudiar cinco ecotipos de frijol de palo , A, B, C , D , E, si existen
diferencias en sus rendimientos. Para el efecto se llevo a cabo el experimento

en un campo acomodando 5 bloques al terreno y distribuyendo los ecotipos al


azar en cada bloque.. Los rendimientos obtenidos se dan en kg por parcela de
9 m 2. Por motivos de fuerza mayor se perdi una unidad experimental
ECOTIPOS
BLOQUE

TOTAL

_
Y.j

1.6

1.8

1.1

2.0

0.9

7.4

1.48

II

1.5

1.2

1.9

0.5

III

1.3

1.2

1.0

1.2

0.8

5.5

1.10

IV

1.8

1.3

1.2

2.0

1.0

7.3

1.46

1.1

1.2

1.0

1.3

0.7

5.3

1.06

TOTAL
_
yi.

7.3

5.5

8.4

3.9

1.46

1.10

1.68

0.78

Se estima mediante la ecuacin de Yates


Y =
r
t
B
T
G

=
=
=
=
=

rB + tT - G
(t1) (r1)

nmero de bloques
nmero de tratamientos
total de los valores de las unidades que quedan en el bloque
total de los valores de las unidades que quedan en el tratamiento
total de los valores de las unidades que quedan en el experimento
5 ( 5.10 ) + 5 ( 5.50 ) - 30.8
Y = ---------------------------------------(51) (51)

Suma cuadrados de Bloques ( SC B ) =


Suma de cuadrado de Tratamientos ( SC t ) =

= 1.388

Suma de cuadrados del total ( SCT ) =


Suma cuadrado del error ( SC e ) =
ANALISIS DE VARIANCIA
Fuentes de
variacin

GL

SC

CM

Fc

Ft
( 0.05 )

4
Bloque
Tratamiento
Ecotipois

Error

15

Total

23

CV =

DOS UNIDADES PERDIDAS

TRATAMIENTO
_

Sig

BLOQUE

TOTAL

11

II

III

IV

17

TOTAL
_
yi.

19

16

44

Y.j

Estimacin de
X =

rB + tT - G
(t1) (r1)

x = 4 ( 8 ) + 3 ( 9 ) - ( 44 + w )
( 31) (41)
w = 4 ( 8 ) + 3 ( 19 ) + ( 44 + x )
(31) (41)

x=

w=

ANALISIS DE VARIANCIA
Fuentes de
variacin

GL

SC

CM

Fc

Ft
( 0.05 )

Sig

Bloque
Tratamiento
Error
Total
CV =

FACULTAD DE RECURSOS NATURALES RENOVABLES


CURSO : METODOS ESTADISTICOS
DISEO CUADRADO LATINO ( DCL )

Ing. JOSE LEVANO CRISOSTOMO


Es el agrupamiento de las unidades experimentales en dos direcciones ( filas y
columnas ) y la asignacin de los tratamientos al azar en las unidades, de tal
forma que en cada fila y en cada columna se encuentran todos los
tratamientos. Ejemplo.
- Tratamientos con cinco niveles de hormonas para el crecimiento.
- Hileras en cinco camadas de huanganas de cinco huanganas cada uno.
- Columnas de cinco sistemas de siembra.
- Cinco variedades tornillo en hileras
CARACTERISTICAS.
-

Las unidades experimentales se distribuyen en grupos bajo los criterios de


homogeneidad dentro de cada fila y dentro de cada columna y
heterogeneidad en otra forma.
En cada fila y en cada columna el nmero de unidades es igual al nmero
de tratamientos.
El nmero de filas y columnas es igual al nmero de tratamientos.

VENTAJAS.
-

Disminuyen los efectos de dos fuentes de variabilidad de las u.e en los


promedios de los tratamientos y en el error experimental.
El ANVA es sencillo.
En el caso que se pierdan todas las u.e de un mismo tratamiento, el resto
de los tratamientos sigue ajustado a las caractersticas del cuadrado latino.

DESVENTAJAS.
-

No es recomendable para ms de 10 tratamientos.


A igualdad de nmero de tratamientos y repeticiones , ste diseo tiene
menos grados de libertad para el error experimental.
MODELO ADITIVO LINEAL O MODELO ESTADISTICO
Y ij(k) = u + i + j + k + ij(k)

Y i j ( k ) = Observacin
U = Media general
i
= Efecto de la fila
j
= Efecto de la columna
k
= Efecto del tratamiento
i j ( k ) = Error experimental
FORMACION DE CUADRADOS LATINOS
Supongamos 4 tratamientos A, B, C, D.
A

A
B

ANALISIS DE VARIANCIA
Fuentes de
variacin

GL

Fila

r1

Columna

r1

Tratamiento

r1

Error

(r 1)(r 2 )

Total

r2 1

SC

CM

DISEO CUADRADO LATINO


PRACTICA

Fc

Ft

Sig

En un experimento piloto, se evalu el efecto de la variabilidad del suelo en el


rendimiento de cuatro variedades de frejol de palo, con el supuesto para el
diseo , que la forma del terreno deriva una heterogeneidad del medio y que el
doble criterio de agrupamiento podra reducir el error experimental.
El rendimiento de las parcelas se midi en kilos.
C O L U M N A S
1

Y.j

19.1

16.2

15.2

10.1

60.6

21.4

C 17.2

14.1

18.2

70.9

12.2

D 13.1

16.2

12.1

53.6

16.1

A 22.2

15.2

13.4

66.9

68.8

68.7

Yi.

60.7

53.8

252.0

V A R I E D A D

Y (k)

Y (.)

75.7

64.9

58.0

53.4

252.0

CALCULO DE SUMA DE CUADRADOS


Termino de correccin = TC = ( 252 )2 / 16 = 3969

SC variedad = 75.72 + 64.92 + 58.02 + 53.42


----------------------------------4

- 3969 = 70.515

SC filas = 60.62 + 70.92 + 53.62 + 66.92


------------------------------------- 4

3969 = 42.935

SC columnas = 68.82 + 68.72 + 60.72 + 53.82


--------------------------------------- - 3969 = 39.015
4
SC total = 19.12 + 21.42 + 12.22 + ..+ 12.12 + 13.42 - 3969
=167.10
SC error = SC total SC variedad SC filas Sc columnas =
167.10 70.515 41.935 - 39.015 = 14.635
ANALISIS DE VARIANCIA
Fuentes de
variacin

GL

SC

CM

Fc

Ft

Sig

42.935

14.311

5.87

39.015

13.005

5.33

70.515

23.505

9.64

14.635

2.439

Fila
Columna
Variedad
Error
15
Total
C.V = 9.91 %
DISEO PARCELAS DIVIDIDAS
Este diseo consiste en dividir parcelas en sub-parcelas y deben
adaptarse si es que uno o varios factores no pueden ir en parcelas chicas sino

grandes, Si es que hay inters de parte del experimentador en estudiar con


mayor precisin unos factores que otros. En este caso lo que se desea estudiar
con mayor precisin deben ir en las subparcelas y los que se desea con menos
precisin en las parcelas.
Estos diseos se aplican a factores como lminas de riego, encalado, sistemas
de cultivos, ancho entre surcos, frecuencias de corte, forzosamente parcelas
grandes.
CARACTERISTICAS
Las parcelas ( unidades experimentales ) estn divididas en sub - parcelas.
La asignacin del factor A ( en parcelas ) se realiza segn el diseo ( DCA,
DBCA y DCL ). En un DCA se asignan al azar en las parcelas; en DBCA, se
asignan al azar en cada bloque y en DCL al azar en las parcelas, pero con la
restriccin que estn representadas en cada fila y en cada columna.
La asignacin del factor B ( en sub - parcelas ) se realiza al azar dentro de
cada parcela, en cualquier diseo.
El nmero de sub - parcelas por parcela deben ser igual al nmero de niveles
de B.
Se forman dos errores: error en parcelas conocido como Error ( a ) y un error
en sub - parcelas llamado Error ( b ).
Una unidad experimental puede ser una parcela de terreno, una camada de
cerdos, un rbol, un horno. Las sub - unidades seran las sub-parcelas en cada
parcela, los cerdos de cada camada, las ramas de un rbol y los moldes en que
se echa la fundicin de un horno.
Este tipo de diseos puede usarse en agricultura, forestal, suelos, agua ,
zootecnia, laboratorio, invernadero.
Ejemplo.
Se quiere estudiar 3 sistemas de riego ( r 1 , r2 , r3 ) en algodn ( Gossypium
barbadense ) y 4 variedades ( v1 , v2 , v3 , v4 ) en 3 bloques.
La distribucin de los sistemas de riego deben hacerse al azar en las 3
parcelas de cada bloque y tambin la distribucin de las 4 variedades en las
sub-parcelas de cada parcela

CROQUIS DE PARCELAS DIVIDIDAS


3 tipos de riego en parcelas y 4 variedades en sub parcelas
BLOQUE I
BLOQUE III

BLOQUE II

r1

r2

r3

r2

r1

r3

r3

r1

r2

V1

V3

V2

V3

V4

V1

V2

V4

V3

V1

V2

V4

V3

V2

V1

V4

V1

V3

V4

V1

V4

V2

V3

V2

r = volmenes de riegos
v = variedades de algodn

GRADOS DE LIBERTAD EN UN DBCA


5A2B CON 5 REPETICIONES
FUENTES
GL
______________________________
Bloques
( r1)=4
A
(p1)=4
Error (a )
( p 1 ) ( r 1 ) = 16
Total parcelas
pr 1 = 24
________________________________
Bloques en sub parcelas pr 1 = 24
B
q1 =1
AB
(p1)(q1)=4
Error ( b )
p ( r 1 ) ( q 1 ) = 20
Total
rpq 1 = 49
______________________________

PRACTICA DE PARCELAS DIVIDIDAS


Se realiz un experimento para determinar la materia seca del pasto Estrella
Africana, en tres frecuencias de corte ( parcela grande ) y tres alturas de corte (
parcela chica ). Los datos de presentan en gramos .

Frecuencia
de corte ( das )

20

Altura de
corte ( cm )
0
5
10

Parcela grande

40

0
5
10

Parcela grande

60

Parcela grande
TOTAL

0
5
10

Bloque
1

5.69
3.72
3.66

5.98
3.20
2.85

5.37
3.90
2.60

6.30
4.51
3.83

23.34
15.33
12.94

13.07

12.03

11.87

14.64

51.61

6.48
3.86
11.15

7.92
4.54
3.54

4.74
4.42
3.91

6.30
5.06
3.66

25.44
17.88
22.26

21.49

16.00

13.07

15.02

65.58

4.90
5.34
3.40

5.73
4.28
5.47

12.00
6.16
4.78

8.56
6.34
3.75

31.19
22.12
17.40

13.64

15.48

22.94

18.65

70.71

48.31

187.90

48.20

43.51

47.88

Tabla de doble entrada para los totales de los tratamientos


________________________________________________
0
5
10
Frecuencias
__________________________________________________
20
23.34
15.33
12.94
51.61
40
25.44
17.88
22.26
65.58
60
31.19
22.12
17.40
70.71
_________________________________________________
Altura 79.97
55.33
52.60
187.90

Total

Los clculos son :


TC =

( 187.90 )2
36

= 980.73

( 48.20 )2 + ( 43.51 )2 + ( 47.88 )2 + ( 48.31 )2


SC repeticiones = --------------------------------------------------------- TC = 1.79
9
( 51.61 )2 + ( 65.58 )2 + ( 70.71 )2
SC frecuencia ( F ) = ------------------------------------------ - TC
12

= 16.29

( 79.97 )2 + ( 55.33 )2 + ( 52.60 )2


SC altura ( A ) = ----------------------------------------- - TC = 37.88
12
( 23.34 )2 + ( 15.33 )2 + ( 12.94 )2 +( 25.44 )2 + .... +
SC interacciones ( F x A ) = -------------------------------------------------------------------4
+ ( 22.26 )2 + ( 31.19 )2 + ( 22.12 )2 + ( 17.40 )2
------------------------------------------------------------ - TC SCF SCA = 8.71
( 13..07 )2 + ( 12.03 )2 + ( 11.87 )2 + .......+ ( 22.94 )2
SC total parcela grande = ------------------------------------------------------------------3
+ ( 18.65 )2
------------------ - TC = 47.52
SC error parcela grande =

SC total parcela grande SC repeticiones


SC F = 29.44

SC total parcela chica = ( 5.69 )2 + ( 5.98 )2 + ( 5.37 )2 +...............+ ( 5.47 )2 +


+ ( 4.78 )2 + ( 3.75 )2 TC = 149.01
SC error parcela chica = SC total parcela chica SC total parcela grande
SC A SC ( interaccin ) ( F x A ) = 54.9

ANALISIS DE VARIANCIA DEL DISEO DE PARCELA DIVIDIDA

Fuentes de
Variacin

Grados de
libertad

SC

CM

Fc

Ft
0.05

Sig

Repeticin

1.79

0.6

Frecuencia de
Corte

16.29

8.1

1.65

5.14

NS

Error parcela
Grande

29.44

4.9

Total parcela
Grande

11

47.52

Altura

37.88

18.94

6.21

3.55

Frecuencia x
Altura parcela
Chica

8.71

2.2

0.72

2.93

NS

Error parcela
Chica

18

54.9

3.05

Total parcela
Chica

35

149.01

FACULTAD DE RECURSOS NATURALES RENOVABLES


METODOS ESTADISTICOS
EXPERIMENTOS FACTORIALES
Los experimentos factoriales son aquellos que prueban varios
niveles de dos o mas factores. Por lo tanto cuando se presente un experimento
con dos o mas factores y se deba analizar como un experimento factorial.
Un factor es un grupo de clase de tratamientos de un determinado tipo. Un
nivel corresponde a los diferentes componentes del factor.
Los experimentos factoriales en si , no constituyen un diseo experimental,
estos pueden ser llevados a cualquiera de los diseos, como DCA, DBCA y
DCL.
Son tiles en las investigaciones exploratorios en los que poco se sabe acerca
de muchos factores, por ejm . Fertilizacin, nuevo cultivo en la zona, pocas de
siembra, densidad de siembra.
Todos los tratamientos de un factor se combinan con todos los tratamientos de
los otros factores.
Supongamos un experimento de dos factores : Nitrgeno ( N ) y Fsforo ( P ),
cada uno en dos niveles, para examinar su efecto en el rendimiento de un
cultivo. El nitrgeno se ensaya a los niveles N 0 , N1 y el fsforo a los niveles P 0
P1. Si todas las combinaciones posibles se ensayan entre los dos niveles de N
y los otros dos de P, se obtienen cuatro combinaciones de tratamientos. Y se
representan as 2A2B.

N0

N1

P0

P1

P0

P1

N 0 P0

N 0 P1

N 1 P0

N 1 P1

En simbologa se representan :
1 ) N 0 P0
2 ) N 0 P1
3 ) N 1 P0
4 ) N 1 P1

Si en un ensayo , se quiere probar Nitrgeno ( N ) , Fsforo


( P ) y Potasio ( K ) con tres niveles cada uno, hacer su representacin

Supongamos que desearamos estudiar 2 factores A y B, el factor A con 4


niveles ( a = 4 ) y el factor B con 3 niveles ( b = 3 ) con distribucin en bloques
al azar con 4 repeticiones.
EL MODELO ESTADISTICO O MODELO ADITIVO LINEAL
Y = U + A i + Bj
Y = Observacin individual
U = Media general
A i = Efecto del factor A
B j = Efecto del factor B
C k = Efecto de bloques
( AB ) i = Efecto de la interaccin
E i j k = Error experimental

+ C k + ( AB ) i j

E ijk

EXPERIMENTO FACTORIAL 2 A 2 B 2C EN DBCA


Se quiere probar en un experimento de fertilizacin en caa de azcar para evaluar su rendimiento en Tn / ha .
N = Dosis de Nitrgeno N1 = 0 k / ha N2 = 200 k / ha P = Dosis de Fsforo P1 = 0 k / ha P2 = 200 k / ha
K = Dosis de Potasio K1 = 0 k / ha K2 = 200 k / ha
Suma
N1

N2

P1

P2

P1

P2

K1

K2

K1

K2

K1

K2

K1

K2

BLOQUES

N1 P1 K1

N 1 P1 K2

N1 P2 K1

N1 P2 K2

N2 P1 K2

N 2 P1 K2

N2 P2 K1

N 2 P2 K2

125.6

121.0

150.8

181.1

112.1

149.2

167.1

145.1

1152.0

II

98.2

100.6

154.8

174.3

101.5

131.1

185.0

201.0

1146.3

III

110.6

134.8

175.0

137.0

147.4

118.3

174.4

188.8

1186.3

IV

130.1

134.4

185.0

161.5

135.9

161.3

151.5

201.5

1261.2

Total

464.5

490.8

665.6

653.9

496.9

559.9

678.0

736.4

4746.0

Promedio

116.1

122.7

166.4

163.5

124.2

139.9

169.5

184

Clculos :
( 4746 )2
TC = ________ = 703,891.12
32
SC total = ( 125.6 )2 + ( 112.1 )2 + ......+ ( 201.5 )2 _ TC
SC total = 27006.62
SC bloques = ( 1152.0 )2 + ............ + ( 1261.2 )2 - TC
8
SC bloques = 1046.30
SC tratamientos = ( 464.5 )2 + ........ + ( 736.4 )2 - TC
4
SC tratamientos = 18513.89
Los siguientes cuadros se utilizan para calcular las Suma de Cuadrados de los
efectos e interacciones de los tratamientos.
Arreglo NP
_______________________________________________________________
N
0

200

Sumas

955.3

1056.8

2012.1

200

1319.5

1414.4

2733. 9

Sumas
2274.8
2471.2
4746.0
_______________________________________________________________

Arreglo NK
_______________________________________________________________
N
0

200

Sumas

1130.1

1174.9

2305.0

200

1144.7

1296.3

2441.0

Sumas
2274.8
2471.2
4746.0
_______________________________________________________________
Arreglo PK
_______________________________________________________________
P
0

200

Sumas

961.4

1343.6

2305.0

200

1050.7

1390.3

2441.0

Sumas
2012.1
2733.9
4746.0
_______________________________________________________________
Entonces obtenemos :
SC ( N ) = ( 2274.8 )2 + ( 2741.8 )2
16

- TC = 1205.41

SC ( P ) = ( 2012.1 )2 + ( 2733.9 )2
16

- TC = 16281.11

SC ( NP ) = ( 955.3 )2 + ..... + ( 1414.4 )2


16
SC ( K ) =

( 2305.0 )2 + ( 2441.0 )2
16

- SC ( N ) SC ( P ) - TC = 1.35

- TC = 578.00

SC ( NK ) = ( 1130.1 )2 + ..... + ( 1296.3 )2


8

- SC ( N ) SC ( K ) - TC = 356.4

SC ( PK ) = ( 961.4 )2 + ..... + ( 1390.3 )2


8

- SC ( P ) SC ( K ) - TC = 56.71

SC ( NPK ) = SC ( T ) CS ( N ) SC ( P ) SC ( K ) SC ( NK ) SC ( PK ) SC ( NP ) = 34.97
ANALISIS DE VARIANCIA
Fuentes de
variacin

GL

SC

CM

Fc

Ft
( 0.05 )

Sig

Bloques

1046.30

348.77

1.04

3.07

NS

Tratamientos

18513.89

2644.84

7.46

2.49

N
P
K
NP
NK
PK
NPK

1
1
1
1
1
1
1

1205.41
16281.11
578.00
1.35
356.44
56.71
34.87

1205.41
16281.11
578.00
1.35
356.44
56.71
34.87

3.40
45.92
1.63
0.005
1.0
0.1
0.1

4.32
4.32
4.32
4.32
4.32
4.32
4.32

NS
**
NS
NS
NS
NS
NS

Error

21

7446.43

354.59

Total

31

27006.62

INCREMENTO EN EL RENDIMIENTO
Nitrgeno ( 12.2 t / ha )
Niveles

Fsforo ( 8.5 t / ha

Potasio ( 53.1 t / ha )

toneladas de caa / hectreas

142.2

144.1

125.8

200

154.4

200

152.6

200

170.9

_______________________________________________________________

METODOOS ESTADISTICOS
ANALISIS DE REGRESION LINEAL
El anlisis de regresin consiste en emplear mtodos que permiten
determinar la mejor relacin funcional entre dos o ms variables concomitantes
o ( relacionadas ) . El anlisis de correlacin estudia el grado asociacin de
dos o ms variables.. Estudia mejor el efecto de la variable independiente X
sobre la variable dependiente Y.
La variable independiente X es una observacin hecha en cada unidad
experimental antes de aplicar los tratamientos, e indica hasta cierto grado la
respuesta final Y de la unidad experimental.
Las relaciones entre variables ( caractersticas ) pueden presentarse cualquiera
de los tres casos:
- Una variable X puede influir en otra variable Y, esto es X Y. Ejm . El vigor
de las plantas influye sobre el rendimiento, la lluvia influye en la cantidad de
cosechas, la temperatura influye en la intensidad de ataque de las
cosechas, la materia orgnica influye en la densidad de los suelos, , la
temperatura influye en el porcentaje de humedad.
- Dos variables pueden estar influenciadas entre si ; esto es X Y, Ejm.
Precio y produccin de un artculo, peso y volumen de trozas, peso y altura
de los rboles, nubosidad y horas de sol.
- Dos variables sin estar influenciadas, pueden estar relacionadas entre s,
por estar ambas influenciadas por una tercera variable., esto es H X
Y
Ejm. El peso de las hermanas y el peso de los hermanos, estn relacionados
por la influencia de la variabilidad gentica de los padres, las notas de qumica
y bioqumica estn relacionadas por la aficin de los alumnos a los cursos de
ciencias, el precio del pan y el precio de las papas estn relacionadas por la
influencia del aumento del costo de vida a travs de los aos.
Los dos primeros deben estudiarse por regresin y el ltimo por correlacin..
La variable que influye sobre otra se denomina Variable independiente y se
representa por X , mientras que la variable que es influenciada se denomina
variable dependiente y se representa por .Y.
Por la forma de influencia existen los siguientes tipos de regresin .
Las variaciones de la variable independiente pueden provocar variaciones
proporcionales en la variable dependiente. Este tipo de relacin debe hacerse
por regresin lineal., y la representacin es una lnea recta., es una ecuacin
de primer grado Ejm peso al nacer y peso a los tres meses de edad, nubosidad
y horas de sol.
O cuadrtica si la ecuacin es de segundo grado o regresin curvilnea ejm
lluvia y rendimiento.
El estudio de la regresin tiene mltiples aplicaciones en las investigaciones en
los mas diversos campos . Por ejm por el anlisis estadstico por un largo
nmero de aos encontraremos que hay dependencia entre la temperatura de
Enero y la temperatura de Febrero, estaremos en condiciones de pronosticar
cul ser la temperatura de Febrero sabiendo la de Enero.
MODELO ESTADISTICO O MODELO ADITIVO LINEAL

Y1 = 0 +

1 X +

Y1 = Observacin
0 +

1 X = Media de la poblacin.

= Error
ANALISIS DE VARIANCIA
Fuentes
de
variacin

GL

Regresin

Error

SC

CM

b21 ( Xi X )2

b1 SP XY

Fc

Ft
(0.05 )

Sig

SCr / 1 CMr/
Cme

n 2 ( Yi Y )2 - b21( Xi X )2

Sce/
n-2

SCtotal - SC regresin
Total

n-1

( Yi Y )2

ESTIMACION DE PARAMETROS
La funcin de regresin lineal simple es expresado como :
Y 1 = 0 +

1 X +

La estimacin de los parmetros consiste en determinar los parmetros c a


partir de datos muestrales observados ; es decir , deben hallarse valores como
b0 y b1 de la muestra , que represente a 0 y 1 .
0 = Valor de la ordenada donde la lnea de regresin intercepta el eje Y
1 = El coeficiente de regresin poblacional ( pendiente de la lnea recta ).

b0 =

Y b1 X
( X i - X ) ( Yi Y )

Xi Yi ( Xi ) ( Yi ) / n

SPXY

b1 =

___________________ = _______________________ =
( X i x )2

Xi 2 ( Xi )2 / n

_______
SCX

Donde:
b0 = es el valor que representa ( estimador ) a 0
b1 = es el valor que representa ( estimador ) a 1.
SPXY = denota a la suma de productos de X con Y
SCX = denota a la suma de cuadrados de X.
Luego la ecuacin de regresin es Y = b0 + b1 X
El coeficiente de regresin ( b1 ) = Esta expresado en las mismas unidades de
la variable X, e indica el nmero de unidades que varia Y en promedio cuando
se produce cambio en una unidad en X ( pendiente de la recta de regresin ).
Si b1 = 0 , se dice que no existe relacin lineal entre las dos variables.
SI b1 es positivo, la lnea de regresin es ascendente de izquierda a derecha, y
si es negativo, la lnea es ascendente de derecha a izquierda.
b1 es el promedio de los incrementos de Y debido a los aumentos unitarios de
X, y - b1 es el promedio de las disminuciones de Y debido a los aumentos
unitarios de X.
EJEMPLO
En la tabla siguiente se presentan las alturas ( X ) y los pesos ( Y ) de varios
hombres. Se escogieron las alturas de antemano y se observaron los pesos de
un grupo de hombres al azar que tenan las alturas escogidas, resultando.
Xi
Alturas ( cm )
152
155
152
155
157
152
157
165
162
178
163
178

Yi
Pesos ( kg )
50
61.5
54.5
57.5
63.5
59
61
72
66
72
84
82

X 1946
Y 783
n = 12
_
_
X = 162.167 Y = 65.25

X2

Y2

XY

23104
24025
23104
24025
24649
23104
24649
27225
26244
31684
26569
31684

2500
3782.25
2970.25
3306.25
4032.25
3481
3721
5184
4356
5184
7056
6724

7600
9532.5
8284
8912.5
9969.5
8968
9577
11880
10692
12816
13692
14596

X 2 316986

Y2 52297

XY 128199

SC X = Xi 2 ( Xi )2 / n = 316986 - ( 1946 ) 2 / 12 = 1409.667

SCXY = Xi Yi ( Xi ) ( Yi ) / n = 128199 - ( 1946 ) ( 783 ) / 12 = 1223

b1 =

( X i - X ) ( Yi Y )
Xi Yi ( Xi ) ( Yi ) / n
___________________ = _______________________ =
( Xi x )2

Xi 2 ( Xi )2 / n

SPXY
_______
SCX

= 1223 / 1409.667 = 0.8676.


b1 = 0.8676
Luego se calcula
_
_
b0 = Y b1 X = 65.25 ( 0.8676 ) ( 162.167 ) = - 75 .446
b0 = - 75.446
Luego la ecuacin de regresin es Y = b0 + b1 X
por lo tanto la ecuacin buscada es Y = - 75.446 + 0.8676 X
El valor de b1 = 0.8676 indica que por cada centmetro de aumento en la
altura de los hombres, habr un incremento, en promedio, de 0.8676 kg en el
peso de los mismos..
La prueba estadstica es F y se evala las hiptesis
Hp : 1 = 0

No existe regresin lineal entre X e Y

Ha : 1 0

Existe regresin lineal de Y en funcin de Y

Se realiza el ANVA
SC total = SCT = Y2 - (Y )2 / 12 = 52297 - ( 783 )2 / 12 = 1206.25
SC regresin = SCR = b1 SP XY = ( 0.8676 ) ( 1223 ) = 1061.0748
SC error = SCT SCR = 1206.25 1061.0748 = 145.1752

ANALISIS DE VARIANCIA

Fuentes de
variacin

GL

Regresin

SC

CM

Fc

Ft
(0.05 )

Sig

1061.0748

1061.074
8

73.089

4.96

**

14.5175

Error

n2
12 2 = 10

145.1752

Total

n1
12 1 = 11

1206.2500

COEFICIENTE DE CORRELACION

El coeficiente de correccin lineal es el cociente entre la varianza y el producto


de las desviaciones tpicas de ambas variables.
El coeficiente de correccin lineal se expresa mediante la letra r .
xy
R= x y
Propiedades del coeficiente de correlacin
1. El coeficiente de correlacin no vara al hacerlo la escala de medicin.
Es decir, si expresamos la altura en metros o en centmetros el
coeficiente de correlacin no vara.
2. El signo de coeficiente de correlacin es el mismo que el de la
covarianza
Si la covarianza es positiva, la correlacin es directa.
Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.
3. El coeficiente de correlacin lineal es un nmero real comprendido entre
-1 y 1.
-1r 1
4. Si el coeficiente de correlacin lineal toma valores cercanos a -1 la
correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se
aproxima r a -1.
5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la
correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.
6. Si el coeficiente correlacin lineal toma valores cercanos a 0, la
correlacin es dbil.
7. Si r =1 o -1, los puntos de la nube estn sobre la recta creciente o
decreciente. Entre ambas variables hay dependencia funcional.

Ejemplos
Las notas de 12 alumnos de una clase en Matemticas y Fsica son las
siguientes:
Matemticas(X)

10 10

Fsica a(Y)

10

Hallar el coeficiente de correlacin de la distribucin e interpretarlo.


xi

yi

xi.yi

xi2

yi2

16

16

16

16

20

25

16

24

36

16

36

36

36

28

49

16

42

49

36

56

64

49

10

90

100

81

10

10

10

100

100

72

60

431

504

380

1 Hallamos las medias aritmticas


Xi
= n
72
=6
= 12

Yi
n

60
=5
= 12

2 Calculamos la covarianza
XiYi

xy=
n
xy=

431
6.5=5.92
12

3 Calculamos las desviaciones tpicas


x=

x2 i
xi 2
n

x=

504
62=2.45
12

y=

y=

y2 i
i2
n

380
25=2.58
12

4 Aplicamos la frmula del coeficiente de correlacin lineal.

xy
r= x. y
5.92
r= 2.45 .2 .58 =0.94
Al ser el coeficiente de correlacin positivo, la correlacin es directa.
Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy
fuerte

También podría gustarte