Está en la página 1de 15

UNIVERSIDAD

NACIONAL DE
CAJAMARCA
FACULTAD DE CIENCIAS
AGRARIAS
ESCUELA ACADÉMICO
PROFESIONAL DE AGRONOMÍA

CURSO : sistemas de riego y drenajes.

TEMA : RELACION Y CORRELACION


LINEAL.

DOCENTE :

Alumna :.

CICLO : vI
UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

RELACIÓN Y CORRELACIÓN LINEAL

I. INTRODUCCION

La correlación es una técnica estadística usada para determinar la relación


entre dos o más variables.

Un diagrama de dispersión se emplea cuando existe una variable que está bajo
el control del experimentador.

El primer paso para analizar una serie de tiempo es graficarla, esto permite:
identificar la tendencia, la estacionalidad, las variaciones irregulares.

Uso y las ventajas y desventajas de Pearson así es una medida de la relación


lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza,
la correlación de Pearson es independiente de la escala de medida de las
variables. Spearmen es una medida de la correlación (la asociación o
interdependencia) entre dos variables aleatorias continuas.

SISTEMAS DE RIEGO Y DRENAJES Página 1


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

II. OBJETIVOS
Aprender a calcular la correlación entre dos variables.
Representar la recta que define la relación lineal entre dos variables.
Realizar inferencia sobre los parámetros de la recta de regresión.
Construir e interpretar intervalos de confianza e intervalos de predicción
para la variable dependiente
III. MARCO TEORICO

Correlación entre variables

La correlación es una técnica estadística usada para determinar la relación


entre dos o más variables.

La relación entre la duración de una carrera de distancia y el test del escalón, o


la relación entre las características de la personalidad y la participación en
deportes de alto riesgo.

La correlación puede ser de al menos dos variables o de una variable


dependiente de dos o más variables independientes, denominada correlación
múltiple.

DIAGRMA DE DISPERCION

Un diagrama de dispersión se emplea cuando existe una variable que está bajo
el control de experimentador. Si existe un parámetro que se incrementa o
disminuye de forma sistemática por el experimentados, se le denomina
parámetro de control o variable independiente= eje de x y habitualmente se
representa a lo largo del eje horizontal. La variable medida o dependiente = eje
y usualmente se representa a lo largo del eje vertical. Si no existe una variable
dependiente, cualquier variable se puede representar en cada eje y el diagrama
de dispersión mostrara el grado de correlación entre las dos variables.

Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las


variables con un intervalo de confianza determinado. La correlación puede ser
positiva (aumento), negativo (descenso), o nula (las variables no están
correlacionadas).

SISTEMAS DE RIEGO Y DRENAJES Página 2


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

El diagrama de dispersión es una de las herramientas básicas de control de


calidad, que incluyen además el histograma, el diagrama de Pareto, la hoja de
verificación, los gráficos de control, el diagrama de Ishikawa y el diagrama de
flujo.

Ejemplo

Las notas de 11 alumnos se una clase de matemáticas y física son las


siguientes:

matemática física
2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
7 6
8 7
10 9

Diagrama de dispersión

1. Correlación directa

La recta correspondiente a la nube de puntos de la distribución es una recta


creciente.

SISTEMAS DE RIEGO Y DRENAJES Página 3


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

2. Correlación inversa

La recta correspondiente a la nube de puntos de la distribución es una recta


decreciente.

3. Correlación nula

En este caso se dice que las variables son encorraladas y la nube de


puntos tiene una forma redondeada.

Grado de correlación

El grado de correlación indica la proximidad que hay entre los puntos de la


nube. Se pueden ser tres tipos:

1. Correlación fuerte

SISTEMAS DE RIEGO Y DRENAJES Página 4


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

La correlación será fuerte cuanto más cerca esté los puntos de la recta.

2. Correlación débil

La correlación será débil cuanto más separados estén los puntos de la recta

EL USO DE COEFICIENTES DE CORRELACION DE PEARSON

VENTAJAS Y DESVENTAJAS

Es una medida de la relación lineal entre dos variables aleatorias


cuantitativas.

A diferencia de la covarianza, la correlación de Pearson es independiente


de la escala de medida de las variables. De manera menos formal,
podemos definir el coeficiente de correlación de Pearson como un índice
que puede utilizarse para medir el grado de relación de dos variables
aleatorias x e y sobre una población, el coeficiente de correlación de
Pearson se simboliza con la letra, siendo la expresión que nos permite
calcularlo:

SISTEMAS DE RIEGO Y DRENAJES Página 5


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

VENTAJAS

 El valor del coeficiente de correlación es independiente de cualquier


unidad usada para medir variables.
 Mientras más grande sea la muestra más exacta será la estimación.
DESVENTAJAS
 Requiere supuestos acerca de la naturaleza o formas de las
poblaciones afectadas.
 Requiere que las dos variables hayan ido medidas hasta un nivel
cuantitativo continuo u que la distribución de ambos sea semejantes
a la curva normal.
USO
 Permite predecir el valor de una variable dado un valor determinando
de la otra variable.
 Se trata de valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como correlación.
 Dicho cálculo es el primer paso para determinar la relación entre las
variables.
 Consiste en la posibilidad de calcular su distribución maestral y así
poder determinar su error típico de estimación.

SISTEMAS DE RIEGO Y DRENAJES Página 6


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

REGRESIÓN LINEAL

Si sabemos que existe una relación entre una variable denominada


dependiente y otras denominadas independientes (como por ejemplo las
existentes entre: la experiencia profesional de los trabajadores y sus
respectivos sueldos, las estaturas y pesos de personas, la producción agraria y
la cantidad de fertilizantes utilizados, etc.), puede darse el problema de que la
dependiente asuma múltiples valores para una combinación de valores de las
independientes.
La dependencia a la que hacemos referencia es relacional matemática y no
necesariamente de causalidad. Así, para un mismo número de unidades
producidas, pueden existir niveles de costo, que varían empresa a empresa.
Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresión en
los cuales se obtiene una nueva relación pero de un tipo especial
denominado función, en la cual la variable independiente se asocia con un
indicador de tendencia central de la variable dependiente. Cabe recordar que
en términos generales, una función es un tipo de relación en la cual para
cada valor de la variable independiente le corresponde uno y sólo un valor de la
variable dependiente.
1. ASPECTOS TEÓRICOS
REGRESIÓN SIMPLE Y CORRELACIÓN
La Regresión y la correlación son dos técnicas estadísticas que se pueden
utilizar para solucionar problemas comunes en los negocios.
Muchos estudios se basan en la creencia de que es posible identificar y
cuantificar alguna Relación Funcional entre dos o más variables, donde una
variable depende de la otra variable.
Se puede decir que Y depende de X, en donde Y y X son dos variables
cualquiera en un modelo de Regresión Simple.
"Y es una función de X"
Y = f(X)
Como Y depende de X,
Y es la variable dependiente, y
X es la variable independiente.
SISTEMAS DE RIEGO Y DRENAJES Página 7
UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

En el Modelo de Regresión es muy importante identificar cuál es la variable


dependiente y cuál es la variable independiente.
En el Modelo de Regresión Simple se establece que Y es una función de sólo
una variable independiente, razón por la cual se le denomina también
Regresión Di variada porque sólo hay dos variables, una dependiente y otra
independiente y se representa así:
Y = f (X)
"Y está regresando por X"
La variable dependiente es la variable que se desea explicar, predecir.
También se le llama regresando ó variable de respuesta.
La variable independiente x se le denomina variable explicativa o regresor y se
le utiliza para explicar y.

ANÁLISIS ESTADÍSTICO: REGRESIÓN LINEAL SIMPLE


En el estudio de la relación funcional entre dos variables poblacionales, una
variable X, llamada independiente, explicativa o de predicción y una variable Y,
llamada dependiente o variable respuesta, presenta la siguiente notación:
Y=a+bX+e
Donde:
a es el valor de la ordenada donde la línea de regresión se intercepta con el eje
Y.
b es el coeficiente de regresión poblacional (pendiente de la línea recta).
e es el error.
SUPOSICIONES DE LA REGRESIÓN LINEAL
1. Los valores de la variable independiente X son fijos, medidos sin error.
2. La variable Y es aleatoria
3. Para cada valor de X, existe una distribución normal de valores de Y
(subpoblaciones Y)
4. Las variancias de las subpoblaciones Y son todas iguales.
5. Todas las medias de las subpoblaciones de Y están sobre la recta.
6. Los valores de Y están normalmente distribuidos y son estadísticamente
independientes.

SISTEMAS DE RIEGO Y DRENAJES Página 8


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

ESTIMACIÓN DE LA ECUACIÓN DE REGRESIÓN MUESTRAL


Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir,
encontrar los valores de a y b con los datos observados de la muestra.
El método de estimación es el de Mínimos Cuadrados, mediante el cual se
obtiene:

Luego, la ecuación de regresión muestral estimada es

Que se interpreta como:


a es el estimador de a
Es el valor estimado de la variable Y cuando la variable X = 0
b es el estimador de b , es el coeficiente de regresión
Está expresado en las mismas unidades de Y por cada unidad de X. Indica el
número de unidades en que varía Y cuando se produce un cambio, en una
unidad, en X (pendiente de la recta de regresión).
Un valor negativo de b sería interpretado como la magnitud del decremento en
Y por cada unidad de aumento en X.
2. ANTECEDENTES DEL PROBLEMA
Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y,
kg) de una muestra de 12 hombres adultos. Para cada estatura fijada
previamente se observó el peso de una persona seleccionada de entre
el grupo con dicha estatura, resultando:
X 152 155 152 155 157 152 157 165 162 178 183 178

Y 50 61.5 54.5 57.5 63.5 59 61 72 66 72 84 82


Con estos datos vamos a plantear una ecuación de regresión simple que nos
permita pronosticar los pesos conociendo las tallas. Utilizaremos a = 0.05, y
contrastaremos nuestra hipótesis con la prueba F.
3. DESARROLLO
 Representación matemática y gráfica de los datos:

SISTEMAS DE RIEGO Y DRENAJES Página 9


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

Representación Matemática
estatur peso Regresión Lineal I.C. para la I. C.
a s media individual

dato x y x ^2 y ^2 xy y est. Residu L. I. L. S. L. I. L. S.


s al

1 152 50 2310 2500 7600 56.4 -6.43 53.0 59.7 47.3 65.5
4 3 7 9 0 6

2 155 61.5 2402 3782. 9532. 59.0 2.47 56.0 61.9 50.0 68.0
5 3 5 3 9 7 5 2

3 152 54.5 2310 2970. 8284 56.4 -1.93 53.0 59.7 47.3 65.5
4 3 3 7 9 0 6

4 155 57.5 2402 3306. 8912. 59.0 -1.53 56.0 61.9 50.0 68.0
5 3 5 3 9 7 5 2

5 157 63.5 2464 4032. 9969. 60.7 2.73 58.0 63.4 51.8 69.6
9 3 5 7 5 8 5 8

6 152 59 2310 3481 8968 56.4 2.57 53.0 59.7 47.3 65.5
4 3 7 9 0 6

7 157 61 2464 3721 9577 60.7 0.23 58.0 63.4 51.8 69.6
9 7 5 8 5 8

8 165 72 2722 5184 11880 67.7 4.29 65.1 70.2 58.8 76.5
5 1 7 4 5 7

9 162 66 2624 4356 10692 65.1 0.89 62.6 67.5 56.2 73.9
4 1 5 6 7 4

10 178 72 3168 5184 12816 78.9 -6.99 74.6 83.3 69.4 88.5
4 9 5 3 5 2

11 183 84 3348 7056 15372 83.3 0.68 78.0 88.6 73.3 93.3
9 2 1 4 1 4

12 178 82 3168 6724 14596 78.9 3.01 74.6 83.3 69.4 88.5
4 9 5 3 5 2

SISTEMAS DE RIEGO Y DRENAJES Página 10


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

Representación Gráfica

4. HIPÓTESIS
HO: No hay relación entre la variable peso y la variable estatura.
HA: Hay relación entre la variable peso y la variable estatura.
Tabla de análisis de
varianza

Fuente
de Grados de Suma de Cuadrados

estadístico
Variación libertad cuadrados medios F

Debido a

la
regresión 1 1061.1 1061.1 73.08

error 10 145.2 14.5

total 11 1206.3

SISTEMAS DE RIEGO Y DRENAJES Página 11


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

Se obtiene un valor F = 73.08 > 4.96, con lo cual se rechaza la hipótesis nula y
aceptamos que la variable estatura está relacionada con la variable peso con
un 95% de confianza.
 De acuerdo al desarrollo matemático hemos obtenido los siguientes
cálculos:

Lo que nos permite obtener los coeficientes a y b.


Luego,
b = 1223 / 1409.667 = 0.8676
a = 65.25 – (0.8676) (162.167) = -75.446
5. INTERPRETACIÓN

 La ecuación de regresión estimada es:

Coeficiente de correlación: R= 0.9379


Coeficiente de determinación: R²=0.8796
El valor de b = 0.8676 indica el incremento del peso en kilogramos, en
promedio, por cada centímetro de aumento en la estatura de los hombres
adultos.
El valor de a, no tiene interpretación práctica en el ejemplo, se interpretaría
como el valor obtenido, en promedio, para el peso Y, cuando la estatura es 0.
Utilizando la ecuación de regresión para estimar o predecir valores de la
variable Y: Para una talla de 180 se obtiene un peso de 80.7 kg.
¿Cuánto se espera que pese (en promedio) una persona que mide 1.60 m?
Sustituyendo el valor de interés en la ecuación:

SISTEMAS DE RIEGO Y DRENAJES Página 12


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

Se obtiene:

IV. CONCLUSIONES
 Como conclusión nos gustaría decir que esta práctica nos dejó muy en
claro que el minitab sirve para hacer grandes cosas y además de ahorrar
mucho trabajo es muy fácil utilizarlo para la obtención de diferentes
conceptos de estadística como la correlación y algunos diagramas.
 Un diagrama de dispersión puede sugerir varios tipos de correlaciones
entre las variables con un intervalo de confianza determinado. La
correlación puede ser positiva (aumento), negativo (descenso), o nula
(las variables no están correlacionadas).

V. REFERENCIAS BIBLIOGRAFICAS

SISTEMAS DE RIEGO Y DRENAJES Página 13


UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA ACADÉMICO PROFESIONAL DE AGRONOMÍA

 http://www.monografias.com/trabajos27/regresion-simple/regresion-
simple.shtml#ixzz5Hf16zrdn.
 D.A. Lind, R.D. Mason, W.G. Marchal (2001): “Estadística para
Administración y Economía”. Ed.
 Irwin McGraw-Hill.F. [2] Kvanli, A. “Introducción to Business Statistics”
South-Western [3] R. Johnson (1996): “Elementar Statistics”. Ed.
Duxbury [4] Richard I.
 Levan & David S. Rubin (1996): “Estadística para Administradores”. Ed.
Prentice Hall.

SISTEMAS DE RIEGO Y DRENAJES Página 14

También podría gustarte