Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Formula de Sturges
Numero de clases = 1 + 3.322 log n , donde n es el numero total de datos.
Si se obtiene un numero decimal, se aproxima al siguiente entero.
-
PRACTICA
TABLA DE FRECUENCIA
Se desea saber cmo varia el peso de un grupo de estudiantes de Ingeniera
en Conservacin de Suelos. Se selecciona una muestra de 50 estudiantes
cuyos pesos se dan en kilos :
DATOS
65
64
64
63
64
63
65
65
65
64
65
64
64
63
63
63
72
71
70
69
69
68
68
67
67
67
66
66
66
66
53
55
56
57
58
58
57
59
59
60
60
60
61
61
61
61
62
62
62
62
19 / 7 = 2.71 = 3
72 53 = 19
Pesos
Marca
de
clase
Frecuenci
a
Absoluta
Xi
fi
Frecuenci
a
Absoluta
acumulad
a
Fi
Frecuencia
relativa
Hi
Frecuenci
a relativa
acumulad
a
Hi
(%)
53 55
54
4.00
4.00
56 58
57
10.00
14.00
59 61
60
16
18.00
32.00
62 64
63
15
31
30.00
62.00
65 67
66
12
43
24.00
86.00
68 70
69
48
10.00
96.00
71 73
72
50
4.00
10.00
Total
50
100.00
EXPERIMENTO
El
experimento
es
el
conjunto
de
reglas
usadas
para
obtener una muestra de la poblacin y al concluir el ensayo obtener
informacin acerca de la poblacin.
Little y Jackson afirman que el experimento es un elemento de investigacin
utilizada para descubrir algo desconocido, o para probar un principio o una
hiptesis.
DISEO EXPERIMENTAL
Planear un experimento de manera que se pueda obtener la informacin del
problema bajo investigacin.
Es el proceso que se sigue para asignar los tratamientos a las unidades
experimentales.
TRATAMIENTO
Elemento sometido a estudio o ensayo de comparacin
Es la cantidad o calidad, del factor a estudiar toma durante el experimento.
Ejm
Marca de fertilizante
Cantidad de fertilizante
Sistema de riego
Profundidad de siembra
TRATAMIENTO TESTIGO
Es un tratamiento que se compara.
Es un tratamiento especial del experimento y sirve como comparacin de los
tratamientos de prueba.
UNIDAD EXPERIMENTAL
Es el material al que se le aplica los tratamientos.
Una maceta
Una parcela
Un pollo
REPETICIN
Es una replica de la aplicacin de un tratamiento es otra unidad experimental
bajo las mismas condiciones.
Cuando en un experimento se tiene un conjunto de tratamientos para poder
estimar el error experimental, es necesario que dichos tratamientos aparezcan
ms de una vez en el experimento, para as aumentar la precisin de ste,
controlar el error experimental y disminuir la desviacin estndar de la media.
BLOQUE
Es un conjunto de unidades experimentales lo ms homogneas posibles, en el
cual aparecen todos los tratamientos una sola vez; dicho bloque se debe
colocar perpendicular al gradiente para tratar de maximizar el error.
ERROR EXPERIMENTAL
Es una fuente de variacin que permite evaluar el efecto de los tratamientos.
El error experimental se forma por la variacin de la unidades que recibieron el
mismo trato en la aplicacin de los tratamientos y que por efectos no
controlables reportan cierta diferencias.
Los resultados experimentales varan no slo por la accin de los tratamientos,
sino tambin por variaciones ambientales que tienden a enmascarar el efecto
de los tratamientos. Por lo general, para expresar estas variaciones se usa el
trmino error experimental. Pero el trmino error no quiere decir equivocacin,
sino que incluye todo tipo de variacin externa ajena al material experimental.
El error experimental es la medida de variacin que existe entre las
observaciones de unidades experimentales en el mismo tratamiento, es decir la
variacin no proveniente de los tratamientos.
Las modalidades ms recomendadas para disminuir el error son:
Utilizar unidades experimentales muy uniformes, como suelo
homogneo, riesgos, densidad de siembra, fertilizacin, control de
plagas y hierbas, etctera.
POBLACIN
Conjunto de unidades elementales (personas, animales, plantas, etc.) con
caractersticas comunes en las cuales se estudian una o ms variables.
Ejm:
El conjunto de madereros de la ciudad de Pucallpa.
El conjunto de docentes de la UNAS.
Conjunto de especies forestales de Contamana.
UNIDAD ELEMENTAL
Son los elementos que conforman la poblacin. Es la unidad de donde se
obtienen la informacin deseada acerca de una caracterstica o un atributo
especifico.
Ejm:
Un maderero de la Ciudad de Pucallpa.
Un Docente de la UNAS.
Una especie forestal maderable de contamana.
MUESTRA
Es un subconjunto de una poblacin conformado por uno o ms unidades
elementales.
Ejm:
20 madereros de Pucallpa
10 docentes de la UNAS
25 especies forestales maderables de Contamana.
TAMAO DE LA MUESTRA
n =
Z2 x pq
__________
e2
Z = 1.96
e = error 3% ( 0.03 )
p = 0.5
q = 0.5
ajustando
N =
n
_____________________
1 + ( n - 1 )
_________
N
N = poblacin
VARIABLE
Son elementos, caractersticas, propiedades, atributos o conductas que tienden
a tomar diferentes valores, cuando son observadas las unidades elementales
de la muestra o poblacin.
Las variables son observadas a travs de evaluaciones, mediciones o
encuestas.
Ejm:
Altura de planta de Bambu.
Sabor del fruto de aguaje.
Calidad de fruto de cacao.
Nmero de flores de planta de rosa.
Dimetro de planta de Cedro.
Peso de Cerdo.
TIPOS DE VARIABLES
Variables Cualitativas
Son aquellas caractersticas que cuyos resultados no pueden ser
expresadas en forma de valores numricos.
Ejm:
Color de hoja de maz.
Sabor de la fruta de Ungurahui.
Calidad de fruta del Cacao.
Sexo de los vacunos.
Lugar de procedencia de choferes.
Religin de los pobladores de Yarinacocha.
Variables Cuantitativas
Son aquellas caractersticas cuyos resultados pueden ser expresados en
valores numricos.
Ejm:
Altura de planta de Camu Camu.
Dimetro de planta de Tornillo.
Longitud de Bambu.
Peso de los estudiantes de Contabilidad.
ANALISIS DE VAIANCIA
Es un procedimiento aritmtico que consiste en desdoblar la suma de
cuadrados total ( variacin total )en fuentes de variacin reconocidas, con todo
y la variacin que no se puede medir ( provenientes de la variabilidad
inherente al material experimental o de la falta de homogeneidad del ambiente
donde se realiz el experimento ); fuente de variacin que se conoce como
residuo o error experimental .
El ANVA se utiliza en todos los campos de investigacin cuando los datos se
miden cuantitativamente.
FUENTES DE VARIACIN
Estan referidas a las fuentes controlables y no controlables de un diseo
experimental
GRADOS DE LIBERTAD
Los grados de libertad son el numero de contrastes ortogonales menos el
numero de restricciones impuestas que se pueden hacer en un grupo de datos.
COEFICIENTE DE VARIACIN
Es una medida de variacin del experimento en funcin del error experimental y
la magnitud de la variable en estudio.
CV = CME
-------------------------- x 100
Promedio general
DISEOS EXPERIMENTALES
EJEMPLO DISEO COMPLETO AL AZAR
En un ensayo con macetas se aplicaron cinco tratamientos a vetiveria,
consistentes en sustratos diversos : 1.- arena, 2.- aserrn, 3.- tierra agrcola, 4.tierra negra y 5.-paja de arroz . Se tomaron cuatro macetas por tratamiento.
Los rendimientos en peso seco se expresan en gramos.
Hipotesis : Ho = No existe diferencia entre tratamientos. T1= T2 = T3
Ha = Si existe diferencia entre tratamientos T1 T2 T3
Tratamientos
Maceta
1
2
3
4
5
______________________________________________________________
1
101
51
83
67
29
2
93
61
68
40
45
3
93
59
72
46
51
4
96
58
75
52
42
______________________________________________________________
Total
Y1. =
Media 1 = 95.75
= 57.25 3 = 74.50
= 51.25
5 = 41.75
Y 2 = ( 1282 ) 2 = 82176
nk
20
FC TC =
SC Total = ( Y i j - ) 2 =
i
Y ij
nk
Y .. 2
Y 2 ij
-
Y .. 2
i
nk
= 7286
ANALISIS DE VARIANCIA
Fuentes de
variacin
GL
Tratamiento
CM
Fc
t -1
SCt
Gl
CMt
CMe
Error
t ( r 1)
Sce
Gl
Total
tr 1
CV = Cme x 100
SC
Ft
Sig
ANALISIS DE VARIANCIA
Fuentes de
variacin
GL
SC
CM
Fc
Ft
(5%)
Sig
Tratamiento
7286
1821.5
30.98
3.06
**
Error
15
882
58.8
Total
19
8168
CV. 58.8
64.1
x 100 = 11.8 %
Fuentes :
Padron C. Julio 1996 Diseos Experimentales con aplicacin a al agricultura
Copia de clases de Mtodos Estadsticos La Molina.
Calzada B. Jos 1970 Mtodos de Investigacin para la Investigacin
184
68
170
378
46
34
34
42
682
2
ANALISIS DE VARIANCIA
Fuentes de
variacin
GL
SC
CM
Fc
Ft
( 0.05 )
Sig
Tratamiento
432
144
72
3.24
++
Error
16
32
Total
19
464
CV = 2
------ x 100 = 2.97 %
47.5
t ( gl error )
DIFERENCIA
DLS
SIGNIFICACION
PRUEBA DE DUNCAN
Esta prueba permite comparar todas las medias entre si, sin restricciones.
La ventaja consiste en el hecho de que no necesita que el valor F sea
significativo para poderlo usar. El procedimiento es el siguiente:
a) Determinar la desviacin estandar de la media
sx =
CM error
n
valor crtico correspondiente se acepta que hay diferencia entre las medias
comparadas
COMPARACION
Diferencia
AES
Valor
Crtico
Sig
PRUEBA DE TUKEY
Esta prueba se usa para hacer las comparaciones de medias entre si y es
vlida cuando las repeticiones estn completas
PRUEBA DE CONTRASTES ORTOGONALES
Es una prueba de comparacin de tratamiento que el investigador debe
conocer antes de iniciar su experimento . Previamente debe saber cules
comparaciones de tratamientos son las que le darn la informacin deseada.
Para el anlisis de las comparaciones se usan los totales de los tratamientos
en lugar de las medias, porque as se ahorra y se evitan errores por redondeo
de cifras.
Este mtodo consiste en descomponer los grados de libertad y la suma de
cuadrado para tratamientos . Existen ( t 1 ) contrastes ortogonales donde t es
el nmero de tratamientos.
3.7
3.2
3.5
3.2
4.0
4.4
5.7
4.7
4.7
4.3
5.9
4.7
6.4
7.5
8.4
6.9
TOTAL
13.6
18.8
19.6
29.2
PROMEDIO
3.4
4.7
4.9
7.3
ANVA
Fuentes de
variacin
GL
SC
CM
Fc
Ft
( 0.05 )
Sig
Raciones
( tratamientos )
31.71
10.57
23.4
3.49
**
Error
12
5.42
0.45
Total
15
37,13
CV = 13,24
t ( gl error )
DLS
= 2 ( 0.45 ) x 2.18
4
DLS = 1.035
2 Colocar los promedios en orden descendente
T ( testigo ) = 3.4
A
= 4.7
B
= 4.9
C
= 7.3
.
3 Hacer las comparaciones mediante el cuadro
COMPARACION
Testigo
Testigo
Testigo
A vs
A vs
B vs
vs. A
vs B
vs C
B
C
C
DIFERENCIA
DLS
SIGNIFICACION
1.3
1.5
3.9
0.2
2.6
2.4
1.035
1.035
1.035
1.035
1.035
1.035
*
*
*
n.s
*
*
Orden de merito
C
a
B
b
A
b
T
3.4 - 4.7 =
3.4 4.9 =
3.4 7.3 =
4.7 4.7 =
4.7 - 7.3 =
4.9 - 7.3 =
PRUEBA DE DUNCAN
Esta prueba permite comparar todas las medias entre si, sin restricciones.
La ventaja consiste en el hecho de que no necesita que el valor F sea
significativo para poderlo usar. El procedimiento es el siguiente:
e) Determinar la desviacin estandar de la media
sx =
CM error
n
sx =
0 .45 = 0.33
4
= 3.4
= 4.7
= 4.9
= 7.3
gl = 12 cm = 0.45
COMPARACION
Testigo
Testigo
Testigo
A
A
B
vs A
vs B
vs C
vs B
vs C
vs C
Orden de merito
C
B
A
n=4
= 0.33
Diferencia
AES
Valor
Crtico
Sig
1.3
1.5
3.9
0.2
2.6
2.4
2
3
4
2
3
2
3.08
3.22
3.32
3.08
3.22
3.08
1.016
1.062
1.095
1.033
1.062
1.016
*
*
*
n.s
*
*
a
b
b
testigo
ANALISIS DE VARIANCIA
Fuentes de
variacin
GL
SC
CM
Fc
Ft
Sig
Bloque
Tratamiento
Error
Total
TOTAL
_
Y.j
1.6
1.8
1.1
2.0
0.9
7.4
1.48
II
1.5
1.4
1.2
1.9
0.5
6.5
1.33
III
1.3
1.2
1.0
1.2
0.8
5.5
1.10
IV
1.8
1.3
1.2
2.0
1.0
7.3
1.46
1.1
1.2
1.0
1.3
0.7
5.3
1.06
TOTAL
_
yi.
7.3
6.9
5.5
8.4
3.9
32
1.46
1.38
1.10
1.68
0.78
HIPOTESIS
Bloques
1.28
Ho = B1 = B2 = B3 = B4 = B5
Ha = B1 B2 B3 B4 B5
Tratamientos
Ho = TA = TB = TC = TD = TE
Ha = TA TB TC TD TE
Clculos
Suma cuadrados de Bloques ( SC B ) =
7.42 + 6.52 + 5.52 + 7.32 + 5.32
------------------------------------5
322
------ = 0.77
25
322
------ = 2.42
25
- 322 = 3.78
---25
ANALISIS DE VARIANCIA
Fuentes de
variacin
GL
SC
CM
Fc
Ft
Sig
( 0.05 )
4
0.77
0.19
4.75
Tratamiento
Ecotipos
2.42
0.61
15.25
Error
16
0.59
0.04
Total
24
3.78
Bloque
CV = 15.6 %
TOTAL
_
Y.j
1.6
1.8
1.1
2.0
0.9
7.4
1.48
II
1.5
1.2
1.9
0.5
III
1.3
1.2
1.0
1.2
0.8
5.5
1.10
IV
1.8
1.3
1.2
2.0
1.0
7.3
1.46
1.1
1.2
1.0
1.3
0.7
5.3
1.06
TOTAL
_
yi.
7.3
5.5
8.4
3.9
1.46
1.10
1.68
0.78
=
=
=
=
=
rB + tT - G
(t1) (r1)
nmero de bloques
nmero de tratamientos
total de los valores de las unidades que quedan en el bloque
total de los valores de las unidades que quedan en el tratamiento
total de los valores de las unidades que quedan en el experimento
5 ( 5.10 ) + 5 ( 5.50 ) - 30.8
Y = ---------------------------------------(51) (51)
= 1.388
GL
SC
CM
Fc
Ft
( 0.05 )
4
Bloque
Tratamiento
Ecotipois
Error
15
Total
23
CV =
TRATAMIENTO
_
Sig
BLOQUE
TOTAL
11
II
III
IV
17
TOTAL
_
yi.
19
16
44
Y.j
Estimacin de
X =
rB + tT - G
(t1) (r1)
x = 4 ( 8 ) + 3 ( 9 ) - ( 44 + w )
( 31) (41)
w = 4 ( 8 ) + 3 ( 19 ) + ( 44 + x )
(31) (41)
x=
w=
ANALISIS DE VARIANCIA
Fuentes de
variacin
GL
SC
CM
Fc
Ft
( 0.05 )
Sig
Bloque
Tratamiento
Error
Total
CV =
VENTAJAS.
-
DESVENTAJAS.
-
Y i j ( k ) = Observacin
U = Media general
i
= Efecto de la fila
j
= Efecto de la columna
k
= Efecto del tratamiento
i j ( k ) = Error experimental
FORMACION DE CUADRADOS LATINOS
Supongamos 4 tratamientos A, B, C, D.
A
A
B
ANALISIS DE VARIANCIA
Fuentes de
variacin
GL
Fila
r1
Columna
r1
Tratamiento
r1
Error
(r 1)(r 2 )
Total
r2 1
SC
CM
Fc
Ft
Sig
Y.j
19.1
16.2
15.2
10.1
60.6
21.4
C 17.2
14.1
18.2
70.9
12.2
D 13.1
16.2
12.1
53.6
16.1
A 22.2
15.2
13.4
66.9
68.8
68.7
Yi.
60.7
53.8
252.0
V A R I E D A D
Y (k)
Y (.)
75.7
64.9
58.0
53.4
252.0
- 3969 = 70.515
3969 = 42.935
GL
SC
CM
Fc
Ft
Sig
42.935
14.311
5.87
39.015
13.005
5.33
70.515
23.505
9.64
14.635
2.439
Fila
Columna
Variedad
Error
15
Total
C.V = 9.91 %
DISEO PARCELAS DIVIDIDAS
Este diseo consiste en dividir parcelas en sub-parcelas y deben
adaptarse si es que uno o varios factores no pueden ir en parcelas chicas sino
BLOQUE II
r1
r2
r3
r2
r1
r3
r3
r1
r2
V1
V3
V2
V3
V4
V1
V2
V4
V3
V1
V2
V4
V3
V2
V1
V4
V1
V3
V4
V1
V4
V2
V3
V2
r = volmenes de riegos
v = variedades de algodn
Frecuencia
de corte ( das )
20
Altura de
corte ( cm )
0
5
10
Parcela grande
40
0
5
10
Parcela grande
60
Parcela grande
TOTAL
0
5
10
Bloque
1
5.69
3.72
3.66
5.98
3.20
2.85
5.37
3.90
2.60
6.30
4.51
3.83
23.34
15.33
12.94
13.07
12.03
11.87
14.64
51.61
6.48
3.86
11.15
7.92
4.54
3.54
4.74
4.42
3.91
6.30
5.06
3.66
25.44
17.88
22.26
21.49
16.00
13.07
15.02
65.58
4.90
5.34
3.40
5.73
4.28
5.47
12.00
6.16
4.78
8.56
6.34
3.75
31.19
22.12
17.40
13.64
15.48
22.94
18.65
70.71
48.31
187.90
48.20
43.51
47.88
Total
( 187.90 )2
36
= 980.73
= 16.29
Fuentes de
Variacin
Grados de
libertad
SC
CM
Fc
Ft
0.05
Sig
Repeticin
1.79
0.6
Frecuencia de
Corte
16.29
8.1
1.65
5.14
NS
Error parcela
Grande
29.44
4.9
Total parcela
Grande
11
47.52
Altura
37.88
18.94
6.21
3.55
Frecuencia x
Altura parcela
Chica
8.71
2.2
0.72
2.93
NS
Error parcela
Chica
18
54.9
3.05
Total parcela
Chica
35
149.01
N0
N1
P0
P1
P0
P1
N 0 P0
N 0 P1
N 1 P0
N 1 P1
En simbologa se representan :
1 ) N 0 P0
2 ) N 0 P1
3 ) N 1 P0
4 ) N 1 P1
+ C k + ( AB ) i j
E ijk
N2
P1
P2
P1
P2
K1
K2
K1
K2
K1
K2
K1
K2
BLOQUES
N1 P1 K1
N 1 P1 K2
N1 P2 K1
N1 P2 K2
N2 P1 K2
N 2 P1 K2
N2 P2 K1
N 2 P2 K2
125.6
121.0
150.8
181.1
112.1
149.2
167.1
145.1
1152.0
II
98.2
100.6
154.8
174.3
101.5
131.1
185.0
201.0
1146.3
III
110.6
134.8
175.0
137.0
147.4
118.3
174.4
188.8
1186.3
IV
130.1
134.4
185.0
161.5
135.9
161.3
151.5
201.5
1261.2
Total
464.5
490.8
665.6
653.9
496.9
559.9
678.0
736.4
4746.0
Promedio
116.1
122.7
166.4
163.5
124.2
139.9
169.5
184
Clculos :
( 4746 )2
TC = ________ = 703,891.12
32
SC total = ( 125.6 )2 + ( 112.1 )2 + ......+ ( 201.5 )2 _ TC
SC total = 27006.62
SC bloques = ( 1152.0 )2 + ............ + ( 1261.2 )2 - TC
8
SC bloques = 1046.30
SC tratamientos = ( 464.5 )2 + ........ + ( 736.4 )2 - TC
4
SC tratamientos = 18513.89
Los siguientes cuadros se utilizan para calcular las Suma de Cuadrados de los
efectos e interacciones de los tratamientos.
Arreglo NP
_______________________________________________________________
N
0
200
Sumas
955.3
1056.8
2012.1
200
1319.5
1414.4
2733. 9
Sumas
2274.8
2471.2
4746.0
_______________________________________________________________
Arreglo NK
_______________________________________________________________
N
0
200
Sumas
1130.1
1174.9
2305.0
200
1144.7
1296.3
2441.0
Sumas
2274.8
2471.2
4746.0
_______________________________________________________________
Arreglo PK
_______________________________________________________________
P
0
200
Sumas
961.4
1343.6
2305.0
200
1050.7
1390.3
2441.0
Sumas
2012.1
2733.9
4746.0
_______________________________________________________________
Entonces obtenemos :
SC ( N ) = ( 2274.8 )2 + ( 2741.8 )2
16
- TC = 1205.41
SC ( P ) = ( 2012.1 )2 + ( 2733.9 )2
16
- TC = 16281.11
( 2305.0 )2 + ( 2441.0 )2
16
- SC ( N ) SC ( P ) - TC = 1.35
- TC = 578.00
- SC ( N ) SC ( K ) - TC = 356.4
- SC ( P ) SC ( K ) - TC = 56.71
SC ( NPK ) = SC ( T ) CS ( N ) SC ( P ) SC ( K ) SC ( NK ) SC ( PK ) SC ( NP ) = 34.97
ANALISIS DE VARIANCIA
Fuentes de
variacin
GL
SC
CM
Fc
Ft
( 0.05 )
Sig
Bloques
1046.30
348.77
1.04
3.07
NS
Tratamientos
18513.89
2644.84
7.46
2.49
N
P
K
NP
NK
PK
NPK
1
1
1
1
1
1
1
1205.41
16281.11
578.00
1.35
356.44
56.71
34.87
1205.41
16281.11
578.00
1.35
356.44
56.71
34.87
3.40
45.92
1.63
0.005
1.0
0.1
0.1
4.32
4.32
4.32
4.32
4.32
4.32
4.32
NS
**
NS
NS
NS
NS
NS
Error
21
7446.43
354.59
Total
31
27006.62
INCREMENTO EN EL RENDIMIENTO
Nitrgeno ( 12.2 t / ha )
Niveles
Fsforo ( 8.5 t / ha
Potasio ( 53.1 t / ha )
142.2
144.1
125.8
200
154.4
200
152.6
200
170.9
_______________________________________________________________
METODOOS ESTADISTICOS
ANALISIS DE REGRESION LINEAL
El anlisis de regresin consiste en emplear mtodos que permiten
determinar la mejor relacin funcional entre dos o ms variables concomitantes
o ( relacionadas ) . El anlisis de correlacin estudia el grado asociacin de
dos o ms variables.. Estudia mejor el efecto de la variable independiente X
sobre la variable dependiente Y.
La variable independiente X es una observacin hecha en cada unidad
experimental antes de aplicar los tratamientos, e indica hasta cierto grado la
respuesta final Y de la unidad experimental.
Las relaciones entre variables ( caractersticas ) pueden presentarse cualquiera
de los tres casos:
- Una variable X puede influir en otra variable Y, esto es X Y. Ejm . El vigor
de las plantas influye sobre el rendimiento, la lluvia influye en la cantidad de
cosechas, la temperatura influye en la intensidad de ataque de las
cosechas, la materia orgnica influye en la densidad de los suelos, , la
temperatura influye en el porcentaje de humedad.
- Dos variables pueden estar influenciadas entre si ; esto es X Y, Ejm.
Precio y produccin de un artculo, peso y volumen de trozas, peso y altura
de los rboles, nubosidad y horas de sol.
- Dos variables sin estar influenciadas, pueden estar relacionadas entre s,
por estar ambas influenciadas por una tercera variable., esto es H X
Y
Ejm. El peso de las hermanas y el peso de los hermanos, estn relacionados
por la influencia de la variabilidad gentica de los padres, las notas de qumica
y bioqumica estn relacionadas por la aficin de los alumnos a los cursos de
ciencias, el precio del pan y el precio de las papas estn relacionadas por la
influencia del aumento del costo de vida a travs de los aos.
Los dos primeros deben estudiarse por regresin y el ltimo por correlacin..
La variable que influye sobre otra se denomina Variable independiente y se
representa por X , mientras que la variable que es influenciada se denomina
variable dependiente y se representa por .Y.
Por la forma de influencia existen los siguientes tipos de regresin .
Las variaciones de la variable independiente pueden provocar variaciones
proporcionales en la variable dependiente. Este tipo de relacin debe hacerse
por regresin lineal., y la representacin es una lnea recta., es una ecuacin
de primer grado Ejm peso al nacer y peso a los tres meses de edad, nubosidad
y horas de sol.
O cuadrtica si la ecuacin es de segundo grado o regresin curvilnea ejm
lluvia y rendimiento.
El estudio de la regresin tiene mltiples aplicaciones en las investigaciones en
los mas diversos campos . Por ejm por el anlisis estadstico por un largo
nmero de aos encontraremos que hay dependencia entre la temperatura de
Enero y la temperatura de Febrero, estaremos en condiciones de pronosticar
cul ser la temperatura de Febrero sabiendo la de Enero.
MODELO ESTADISTICO O MODELO ADITIVO LINEAL
Y1 = 0 +
1 X +
Y1 = Observacin
0 +
1 X = Media de la poblacin.
= Error
ANALISIS DE VARIANCIA
Fuentes
de
variacin
GL
Regresin
Error
SC
CM
b21 ( Xi X )2
b1 SP XY
Fc
Ft
(0.05 )
Sig
SCr / 1 CMr/
Cme
n 2 ( Yi Y )2 - b21( Xi X )2
Sce/
n-2
SCtotal - SC regresin
Total
n-1
( Yi Y )2
ESTIMACION DE PARAMETROS
La funcin de regresin lineal simple es expresado como :
Y 1 = 0 +
1 X +
b0 =
Y b1 X
( X i - X ) ( Yi Y )
Xi Yi ( Xi ) ( Yi ) / n
SPXY
b1 =
___________________ = _______________________ =
( X i x )2
Xi 2 ( Xi )2 / n
_______
SCX
Donde:
b0 = es el valor que representa ( estimador ) a 0
b1 = es el valor que representa ( estimador ) a 1.
SPXY = denota a la suma de productos de X con Y
SCX = denota a la suma de cuadrados de X.
Luego la ecuacin de regresin es Y = b0 + b1 X
El coeficiente de regresin ( b1 ) = Esta expresado en las mismas unidades de
la variable X, e indica el nmero de unidades que varia Y en promedio cuando
se produce cambio en una unidad en X ( pendiente de la recta de regresin ).
Si b1 = 0 , se dice que no existe relacin lineal entre las dos variables.
SI b1 es positivo, la lnea de regresin es ascendente de izquierda a derecha, y
si es negativo, la lnea es ascendente de derecha a izquierda.
b1 es el promedio de los incrementos de Y debido a los aumentos unitarios de
X, y - b1 es el promedio de las disminuciones de Y debido a los aumentos
unitarios de X.
EJEMPLO
En la tabla siguiente se presentan las alturas ( X ) y los pesos ( Y ) de varios
hombres. Se escogieron las alturas de antemano y se observaron los pesos de
un grupo de hombres al azar que tenan las alturas escogidas, resultando.
Xi
Alturas ( cm )
152
155
152
155
157
152
157
165
162
178
163
178
Yi
Pesos ( kg )
50
61.5
54.5
57.5
63.5
59
61
72
66
72
84
82
X 1946
Y 783
n = 12
_
_
X = 162.167 Y = 65.25
X2
Y2
XY
23104
24025
23104
24025
24649
23104
24649
27225
26244
31684
26569
31684
2500
3782.25
2970.25
3306.25
4032.25
3481
3721
5184
4356
5184
7056
6724
7600
9532.5
8284
8912.5
9969.5
8968
9577
11880
10692
12816
13692
14596
X 2 316986
Y2 52297
XY 128199
b1 =
( X i - X ) ( Yi Y )
Xi Yi ( Xi ) ( Yi ) / n
___________________ = _______________________ =
( Xi x )2
Xi 2 ( Xi )2 / n
SPXY
_______
SCX
Ha : 1 0
Se realiza el ANVA
SC total = SCT = Y2 - (Y )2 / 12 = 52297 - ( 783 )2 / 12 = 1206.25
SC regresin = SCR = b1 SP XY = ( 0.8676 ) ( 1223 ) = 1061.0748
SC error = SCT SCR = 1206.25 1061.0748 = 145.1752
ANALISIS DE VARIANCIA
Fuentes de
variacin
GL
Regresin
SC
CM
Fc
Ft
(0.05 )
Sig
1061.0748
1061.074
8
73.089
4.96
**
14.5175
Error
n2
12 2 = 10
145.1752
Total
n1
12 1 = 11
1206.2500
COEFICIENTE DE CORRELACION
Ejemplos
Las notas de 12 alumnos de una clase en Matemticas y Fsica son las
siguientes:
Matemticas(X)
10 10
Fsica a(Y)
10
yi
xi.yi
xi2
yi2
16
16
16
16
20
25
16
24
36
16
36
36
36
28
49
16
42
49
36
56
64
49
10
90
100
81
10
10
10
100
100
72
60
431
504
380
Yi
n
60
=5
= 12
2 Calculamos la covarianza
XiYi
xy=
n
xy=
431
6.5=5.92
12
x2 i
xi 2
n
x=
504
62=2.45
12
y=
y=
y2 i
i2
n
380
25=2.58
12
xy
r= x. y
5.92
r= 2.45 .2 .58 =0.94
Al ser el coeficiente de correlacin positivo, la correlacin es directa.
Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy
fuerte