Está en la página 1de 12

Tarea 4-Actividad Intermedia –Análisis de Correlación y Regresión- Unidad 2

Curso Biometría y Diseño Experimental

Presentado por:
Gloria Inés Ochagá Bravo
Código: 1´116.860.515

Presentado a:
Tutora Jessica Almeida Braga

Universidad Abierta y a Distancia UNAD

Escuela de Ciencias Agrícolas, Pecuarias y del medio Ambiente ECAPMA

Programa Agronomía

Villavicencio-Meta

2019

INTRODUCCION
A continuación encontraras la respuestas de un cuestionario que va de la letra a la n, estas
preguntas con sus repuestas son de mucha ayuda para comprender y entender la importancia de
la estadística descriptiva, eso se logró con la ayuda de información que se pudo recopilar por
medio de internet.
Actividades a desarrollar

Los estudiantes deben definir los roles dentro de cada grupo. Deben hacer los aportes al Entorno
del Aprendizaje Colaborativo.

Cuestionario:

1. ¿Cuál es el propósito del análisis de regresión y correlación?


Rta: El análisis de regresión consiste en emplear métodos que permitan determinar la
mejor relación funcional entre dos o más variables concomitantes (o relacionadas).
El análisis de correlación estudia el grado de asociación de dos o más variables.
Analisis de Regresion
Una relacion funcional matemáticamente hablando, está dada por:
Y = f(x1,...,xn; θ1,...,θm)
donde:
Y : Variable respuesta (o dependiente)
xi : La i-ésima variable independiente (i=1,..,n)
θj : El j-ésimo parámetro en la función (j=1,..,m)
f : La función
Para elegir una relación funcional particular como la representativa de la población bajo
investigación, usualmente se procede: 1) Una consideración analítica del fenómeno que nos
ocupa, y 2) Un examen de diagramas de dispersión. (Mendiburu, s.f.).

2. ¿Por qué se requiere la regresión lineal múltiple? ¿En qué casos se presenta?
Rta: La regresión lineal múltiple trata de ajustar modelos lineales o linealizables entre una
variable dependiente y más de una variables independientes. En este tipo de modelos es
importante testar la heterocedasticidad, la multicolinealidad y la especificación. En este curso
trataremos de introducirnos en el mundo de la modelización, con creación de dummies,
configurando un individuo de referencia, factores de ponderación, variables de interacción,
interrelación, etc. Es particularmente importante entender lo que se está haciendo en cada
momento porque estos principios sirven para prácticamente todos los modelos que se emprendan
a continuación y después, con modelos más complejos y menos intuitivos, serán más difíciles de
comprender. (Granados, 2016).
Utilizamos regresión múltiple cuando estudiamos la posible relación entre varias variables
independientes (predictoras o explicativas) y otra variable dependiente (criterio, explicada,
respuesta).
Por ejemplo, podemos estar interesados en estudiar la inteligencia humana (IQ como variable
respuesta), y es posible que consideremos que puede estar relacionado con otras variables como
el tamaño del cerebro (explicativa). Es posible que el tamaño de la persona y su sexo también
deban ser tenidos en cuenta. Podríamos añadirlas al estudio como variables independientes. Un
modelo de regresión podría ofrecer una respuesta como:
IQ=80+0.02 Volumen cerebro +0.15 Tamaño-0.8 Sexo (Barón López & Téllez Montiel , s.f.)

3. Que tipos de correlación existe, cite un ejemplo para cada uno de los casos.
Rta: Hay tres tipos de correlación: positiva, negativa y nula (sin correlación).

 Correlación positiva: ocurre cuando una variable aumenta y la otra también. Por ejemplo, la
altura de una persona y el tamaño de su pie; mientras aumenta la altura, el pie también.

 Correlación negativa: es cuando una variable aumenta y la otra disminuye. El tiempo de


estudio y el tiempo que pasas jugando videojuegos, tienen una correlación negativa, ya que
cuando tu tiempo de estudio aumenta, no te queda tanto tiempo para jugar videojuegos.

 Sin correlación: no hay una relación aparente entre las variables. Los puntos en tus videojuegos
y tu talla de zapato no parece tener ninguna correlación; mientras una aumenta, la otra no tiene
ningún efecto. (SHMOOP UNIVERSITY. ALL RIGHTS RESERVED., 2019).

Ejemplo Correlación positiva

Por ejemplo: a medida que se eleva el nivel de vida de una población, tiende a aumentar el
consumo de artículos que no son de primera necesidad. CorrelaciónNegativa. Ocurre cuando al
crecer alguna de las variables, la otra decrece o viceversa. ... En el ejemplo anterior (las ventas)
tenemos una correlación positiva.
Ejemplo Correlación negativa

Por ejemplo: a medida que se eleva el nivel de vida de una población, tiende a aumentar el
consumo de artículos que no son de primera necesidad. Correlación Negativa. Ocurre cuando al
crecer alguna de las variables, la otra decrece o viceversa. ... En el ejemplo anterior (las ventas)
tenemos una correlación positiva.
4. ¿Qué es coeficiente de correlación y cuál es su interpretación?
Rta: La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es
una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos
variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es
decir, si se representan en un diagrama de dispersión los valores que toman dos variables, el
coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos
representados se aproxima a una recta.

De una forma menos coloquial, la podemos definir como el número que mide el grado de
intensidad y el sentido de la relación entre dos variables.

Siendo:

Cov (x;y): la covarianza entre el valor “x” e “y”.


σ(x): desviación típica de “x”.
σ(y): desviación típica de “y”.
(Ucha, 2019)

5. ¿Qué es coeficiente de determinación y cuál es su interpretación?


En estadística, el coeficiente de determinación, denominado R² y pronunciado R cuadrado, es
un estadístico usado en el contexto de un modelo estadístico cuyo principal propósito es predecir
futuros resultados o probar una hipótesis. El coeficiente determina la calidad del modelo para
replicar los resultados, y la proporción de variación de los resultados que puede explicarse por el
modelo.
Hay varias definiciones diferentes para R² que son algunas veces equivalentes. Las más comunes
se refieren a la regresión lineal. En este caso, el R² es simplemente el cuadrado del coeficiente de
correlación de Pearson, lo cual es sólo cierto para la regresión lineal simple. Si existen varios
resultados para una única variable, es decir, para una X existe una Y, Z... el coeficiente de
determinación resulta del cuadrado del coeficiente de determinación múltiple. En ambos casos
el R² adquiere valores entre 0 y 1. Existen casos dentro de la definición computacional de R²
donde este valor puede tomar valores negativos. (Wikipedia, 2019).
Interpretación del coeficiente de determinación
Supongamos que queremos explicar la cantidad de goles que anota Cristiano Ronaldo según la
cantidad de partidos que juega. Suponemos que, a mayor cantidad de partidos jugados, más goles
meterá. Los datos pertenecen a las últimas 8 temporadas. De tal manera que tras extraer los datos
el modelo arroja la siguiente estimación:

Cómo podemos ver en el gráfico, la relación es positiva. A más partidos jugados, como es lógico,
más goles anota en la temporada. El ajuste, según el cálculo del R cuadrado, es de 0.835. Lo cual
quiere decir que es un modelo cuyas estimaciones se ajustan bastante bien a la variable real.
Aunque técnicamente no sería correcto, podríamos decir algo así como que el modelo explica en
un 83.5% a la variable real. (López, 2019).

Ejercicios (Estudio de caso).

1. En un ensayo sobre trigo se quiere cuantificar la relación que hay entre la disponibilidad
de Nitrógeno en el suelo con la cantidad de Nitrógeno en la planta. Se obtuvieron datos para
doce parcelas en las que se registró el contenido de nutrientes en el suelo (x) y los valores
promedio de nitrógeno por planta(y)

N en el suelo N en la planta
x Y
0,42 0,13
0,45 0,15
0,50 0,16
0,55 0,17
0,68 0,18
0,69 0,18
0,70 0,19
0,73 0,20
0,80 0,20
0,90 0,21
0,92 0,22
0,94 0,23

Para estos datos realice:


a. ¿Cuál es la variable dependiente (y) respuesta y cuál es la variable independiente (x) o
predictora en este caso
b. Realice el diagrama de dispersión asignando la variable respuesta e independiente según
corresponda. ¿Qué sugiere la gráfica con respecto al modelo?
c. Identifique el modelo
d. Estime los parámetros del modelo e interprételos
e. Redacte las hipótesis que interesa contrastar en el análisis de varianza
f. Especifique matemáticamente el modelo y especifique cada término
g. Verifique los supuestos para realizar en ANOVA y determine las hipótesis
h. ¿Es significativo el modelo?
i. Realice la regresión con fórmulas en archivo Excel y con la herramienta “regresión de
análisis de datos” de Excel.
j. Son significativos los coeficientes de regresión
k. Como se cuantifica si el modelo explica una parte significativa de la variación de la
variable respuesta
l. Redactar como si fuese para la sección de material y método y resultados de un artículo
científico

2. En una investigación de suelos, se deseaba conocer el efecto residual de fósforos en


suelos donde previamente se cultivó maíz, para lo cual se midió la concentración de fósforo
inorgánico (X1) y el orgánico (X2) en varios suelos calcáreos. Además, se midió el contenido de
fósforo del maíz sembrado en esos suelos y se estimó el fósforo aprovechable por la planta
(ppm) en suelos a una temperatura de 20 °C (Y).

Para estos datos realice

a. ¿Cuál es la variable dependiente (y) respuesta y cuál es (son) la (s) variable (s)
independiente (s)(x) o predictora (s) en este caso?
b. Realice el diagrama de dispersión asignando la variable respuesta e independiente según
corresponda. ¿Qué sugiere la gráfica con respecto al modelo?
c. Identifique el modelo
d. Estime los parámetros del modelo e interprételos
e. Redacte las hipótesis que interesa contrastar en el análisis de varianza
f. Especifique matemáticamente el modelo y especifique cada término
g. Verifique los supuestos para realizar en ANAVA y determine las hipótesis
h. ¿Es significativo el modelo?
i. Realice la regresión con fórmulas en archivo Excel y con la herramienta “regresión de
análisis de datos”
j. Son significativos los coeficientes de regresión
k. Como se cuantifica si el modelo explica una parte significativa de la variación de la
variable respuesta
l. Redactar como si fuese para la sección de material y método y resultados de un artículo
científico

Los datos:

Muestra X1 X2 Y
1 0.4 53 64
2 0.4 23 60
3 3.1 19 71
4 0.6 34 61
5 4.7 24 54
6 1.7 65 77
7 9.4 44 81
8 10.1 31 93
9 11.6 29 93
10 12.6 58 51
11 10.9 37 76
12 23.1 46 96
13 23.1 50 77
14 21.6 44 93
15 23.1 56 95
16 1.9 36 54
17 26.8 58 168
18 29.9 51 99
Fuente: Datos adaptados Martínez 1997

3. A continuación, se presentan el análisis químico de una planta de leche que realizo a 23


fincas lecheras, donde se valoró los contenidos de proteína bruta (PB) y caseína (CA) en leche:

No. PB CA No. PB CA
Finca Finca
1 2.74 1.87 13 2.95 2.04
2 3.19 2.26 14 3.08 2.16
3 2.96 2.07 15 3.14 2.16
4 2.91 2.09 16 3.22 2.22
5 3.23 2.28 17 3.14 2.22
6 3.04 2.04 18 3.15 2.24
7 3.08 2.18 19 3.2 2.22
8 3.23 2.3 20 2.95 2.07
9 3.11 2.17 21 3.19 2.25
10 3.11 2.15 22 3.12 2.23
11 3.1 2.16 23 2.99 2.16
12 3.25 2.33

De acuerdo con el ejercicio:


a. Hallar el coeficiente de correlación utilizando la herramienta de Excel
b. Plantee las hipótesis
c. Aplique la t de Student con la fórmula en Excel y determine si la correlación es
significativa o no
d. Interprete el resultado

CONCLUSIONES

 Comprender conceptos de la estadistica.

 Entender el porqué de la importancia de la estadística.

 Conocer las fórmulas que se necesitan para hallar variables.

 Tener en cuenta que la estadística la vivimos diariamente.

 Resolver problemas estadísticos.


REFERENCIAS BIBLIOGRAFICAS

 Bouza, H., Carlos, N., Sistachs, V. (2009). Estadística. Teoría básica y ejercicios. La Habana,
CU: Editorial Félix Varela. Recuperado
de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?docID=10479343&p00=
estadistica
 Naiman, A., Rosenfeld, R., & Zirkel, G. (1987). Introducción a la estadística. México, D.F.,
MX: McGraw-Hill Interamericana. Recuperado
de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?docID=10491334&p00=
estadistica
 Peña, D. (2014). Fundamentos de estadística. Madrid, ES: Larousse - Alianza
Editorial. Recuperado
de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?docID=11028686&p00=
estadistica

 Zubelzu, S., Ercoreca, A. (2015). Problemas resueltos de estadística. Madrid, ESPAÑA:


Larousse - Ediciones Pirámide. Recuperado
de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?docID=11245478&p00=
estadistica

 Portal Educativo conectando neuronas. Media, moda, mediana, rango. Octavo básico-
Actividad N° 790. Recuperado de https://www.portaleducativo.net/octavo-basico/790/Media-
moda-mediana-rango

 Luis M. Roldán Fau. La Estadística Agraria. Recuperado de


https://www.aragon.es/estaticos/GobiernoAragon/Departamentos/MedioAmbiente/Areas/03_
Cambio_climatico/07_Educacion_comunicacion_cambio_climatico/estadistica.pdf

 Ecured. Medidas de dispersión. Recuperado de


https://www.ecured.cu/Medidas_de_dispersi%C3%B3n

 Vitutor. Variable estadística. Recuperado de


https://www.vitutor.com/estadistica/descriptiva/a_2.html
 Wikipedia (2019, Febrero 23). Variable estadística. Recuperado
https://es.wikipedia.org/wiki/Variable_estad%C3%ADstica

 Vitutor. Medidas de posición. Recuperado de


https://www.ditutor.com/estadistica/medidas_posicion.html

 Portal Educativo conectando neuronas. Medidas de posición. Octavo básico- Actividad N°


830. Recuperado de https://www.portaleducativo.net/octavo-basico/830/Medidas-de-posicion

 Suárez M. (2011, Julio 15) Monografías.com-Matemáticas. Medidas de posición.


Recuperado de https://www.monografias.com/trabajos87/medidas-posicion/medidas-
posicion.shtml

 Diferencias.cc. Diferencia entre población y muestra. Recuperado de


https://www.diferencias.cc/poblacion-muestra/

 Aular A. 10 Ejemplos de población y muestra. Lifeder.com. Recuperado de


https://www.lifeder.com/ejemplos-de-poblacion-muestra/

 Normas APA. Que son las hipótesis de investigación. Recuperado de


http://normasapa.net/que-son-las-hipotesis-de-investigacion/

 Séneca. Aula virtual de formación del profesorado. Cursos en abierto. Metodología del
trabajo investigado en el centro educativo, unidad 2. Recuperado de
https://educacionadistancia.juntadeandalucia.es/profesorado/autoformacion/mod/book/view.p
hp?id=3846&chapterid=3122

 Soporte de minitab°18. ¿Qué son los errores de tipo I y tipo II?. Recuperado de
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/basic-
statistics/supporting-topics/basics/type-i-and-type-ii-error/

 García J. Hola mundo. Comunicación, calidad y alguna que otra cosa más. Tesis doctoral y
otros documentos. La curva de distribución normal o ´´campana de Gauss´´. Recuperado de
https://jesusgarciaj.com/2010/01/22/la-curva-de-distribucion-normal/

 Soporte de minitab°18. El teorema del límite central: las medidas de muestras grandes y
aleatorias son aproximadamente normales. Recuperado de https://support.minitab.com/es-
mx/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/data-
concepts/about-the-central-limit-theorem/

 Martínez A. (2018, Abril 4). Tipos se distribución. Recuperado de https://rstudio-pubs-


static.s3.amazonaws.com/377130_08851253a31b41d18c25fd08fad316c3.html

También podría gustarte