Está en la página 1de 5

TERCERA UNIDAD: ANALISIS DE REGRESION Y CORRELACION

TEMA semana 10 RESUMEN RECURSO VISUAL EVALUACIÓN

REGRESION
REGRESION
 Regresión empírica
 Regresión lineal.
 Regresión parabólica
REGRESION EMPIRICA

Ejercicio 26
REGRESION Hallar el pronóstico lineal y
parabólico para el año 2020 de los
siguientes datos históricos

REGRESION LINEAL
En estadística, el análisis de la regresión es un proceso estadístico para
estimar las relaciones entre variables. Incluye muchas técnicas para el
modelado y análisis de diversas variables, cuando la atención se centra en la
relación entre una variable dependiente y una o más variables independientes
(o predictores). Más específicamente, el análisis de regresión ayuda a
entender cómo el valor de la variable dependiente varía al cambiar el valor de
una de las variables independientes, manteniendo el valor de las otras
variables independientes fijas. Más comúnmente, el análisis de regresión
estima la esperanza condicional de la variable dependiente dadas las
variables independientes - es decir, el valor promedio de la variable
dependiente cuando se fijan las variables independientes. Con menor ECUACION DE REGRESION LINEAL
frecuencia, la atención se centra en un cuantil, u otro parámetro de
localización de la distribución condicional de la variable dependiente dadas ECUACIONES NORMALES DE LA LINEA
las variables independientes. En todos los casos, el objetivo de la estimación
es una función de las variables independientes llamada la función de Ecuación 1
regresión. En el análisis de regresión, también es de interés caracterizar la
variación de la variable dependiente en torno a la función de regresión, la cual ∑ 𝑦 = 𝑏𝑛 + 𝑎 ∑ 𝑥
puede ser descrita por una distribución de probabilidad. Ecuación 2
El análisis de regresión es ampliamente utilizado para la predicción y
previsión, donde su uso tiene superposición sustancial en el campo de ∑ 𝑥𝑦 = 𝑏 ∑ 𝑥 + 𝑎 ∑ 𝑥 2 Ejercicio 27
aprendizaje automático. El análisis de regresión se utiliza también para Hallar el pronóstico lineal y
comprender cuales de las variables independientes están relacionadas con la parabólico para el año 11 de los
variable dependiente, y explorar las formas de estas relaciones. En Ecuación de regresión
siguientes datos históricos
circunstancias limitadas, el análisis de regresión puede utilizarse para inferir
relaciones causales entre las variables independientes y dependientes. Sin
embargo, esto puede llevar a ilusiones o relaciones falsas, por lo que se
recomienda precaución, por ejemplo, la correlación no implica causalidad.
En estadística, los mínimos cuadrados o mínimos cuadrados lineales es el
nombre de un método para encontrar los parámetros poblacionales en un
modelo de regresión lineal. Este método minimiza la suma de las distancias
verticales entre las respuestas observadas en la muestra y las respuestas del
modelo. El parámetro resultante puede expresarse a través de una fórmula
sencilla, especialmente en el caso de un único regresor.
Obtener la ecuación de regresión lineal es sencillo, incluso hay en los textos
de estadística los valores de a y b ya despejados, lo útil es este caso es darle
sentido a esta ecuación para responder a los pronósticos acertadamente.
Es preciso que sepan que, cuando utilizamos datos mal recopilados, mal
simulados, vamos a obtener resultados malos; entonces cuando tratamos
estos datos es necesario someter a una prueba de rigor, que se llama
coeficiente de correlación.
Para estimar los datos, debemos considerar los antecedentes históricos en el
tiempo que se encuentran los datos; estos pueden estar en años, meses, días,
semanas, etc., y decir que tenemos 15 datos históricos es tener, por ejemplo,
15 años de referencia, o, 15 meses de referencia, o, 15 semanas de
referencia. Entonces, lo interesante aquí es que, esa referencia histórica hará
posible la trascendencia del pronóstico, o sea, a mayor datos históricos mayor
alcance del pronóstico.
Todo este análisis nos permite afirmar, que, si el investigador dispone de 5
datos históricos, que es el mínimo de datos permitidos para hacer un ECUACIONES DE REGRESION CUADRATICA
pronóstico, este no puede permitir hacer un pronóstico para diez años futuros. ECUACION DE REGRESION PARABOLICO
https://www.monografias.com/trabajos86/analisis-
REGRESION PARABOLICA regresion-parabola-minimos-cuadros/analisis-
regresion-parabola-minimos-cuadros.shtml
https://www.monografias.com/trabajos86/analisis-regresion-parabola-
minimos-cuadros/analisis-regresion-parabola-minimos-cuadros.shtml ECUACIONES NORMALES DE LA PARABOLA

En la página web se aprecia el desarrollo matemático de la regresión ∑ 𝑌 = 𝑐𝑁 + 𝑏 ∑ 𝑋 + 𝑎 ∑ 𝑋 2


parabólica, también se observa una de las formas para obtener los valores de
los parámetros a, b y c; de las ecuaciones de regresión parabólica. Lo que
necesitamos de ustedes jóvenes es que por cualquier método resuelvan y ∑ 𝑋𝑌 = 𝑐 ∑ 𝑋 + 𝑏 ∑ 𝑋 2 + 𝑎 ∑ 𝑋 3
encuentren estos valores, para escribir correctamente la ecuación de
regresión parabólica y establecer los pronósticos a pedido de quien solicita la
información.
Todo lo afirmado en la regresión lineal en lo que refiere al tratamiento de
datos, también se hace para la regresión parabólica, es decir, que para darle ∑ 𝑋2𝑌 = 𝑐 ∑ 𝑋2 + 𝑏 ∑ 𝑋3 + 𝑎 ∑ 𝑋4
confiabilidad a los datos debemos obtener de estos su coeficiente de
correlación en el ámbito de la regresión parabólica, para estar más seguros
de que los datos son buenos y confiables.
Referente a la precisión o a la calidad del pronóstico, entre la línea y la
parábola, se constata que esta última es mejor, porque en su análisis utiliza 3
parámetros, comparados con 2 de la línea.
TERCERA UNIDAD: ANALISIS DE REGRESION Y CORRELACION

TEMA semana 11 RESUMEN RECURSO VISUAL EVALUACIÓN

ANALISIS DE CORRELACION FORMULA PERSONALIZADA PARA EL


Es el conjunto de técnicas estadísticas empleado para medir la intensidad de COEFICIENTE DE CORRELACION LINEAL
la asociación entre dos variables. El principal objetivo del análisis de 𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
correlación consiste en determinar qué tan intensa es la relación entre dos 𝑟=
variables. √[𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 ][𝑛 ∑ 𝑦 2 − (∑ 𝑦)2 ]
En la rama de la estadística, la correlación se refiere a que existe un vínculo
entre varios eventos. Una de las herramientas que nos permite inferir si existe FORMULA GENERAL
dicho vínculo es justamente el análisis de correlación. Este procedimiento
tiene por objetivo indicarnos si existe relación entre dos eventos, es decir, Ejercicio 28
variables, un poco sobre la naturaleza de dicha relación, y su fuerza. Para Hallar el coeficiente de correlación
poder realizar un análisis de correlación confiable, lo primero que se necesita (paramétrico) lineal y parabólico de
es realizar muchas observaciones de dos variables. Un ejemplo sería visitar los siguientes datos históricos
muchos supermercados y revisar tanto el precio de cierta fruta como el precio
de un litro de jugo. La colección de datos que se obtenga para aquellas
observaciones puede expresarse en forma de una matriz (o tabla), que puede
someterse a análisis utilizando software de estadística, como R, SAS, SPSS,
etc.
CORRELACION
El análisis de correlación general da como resultado un número entre -1 y 1,
llamado coeficiente de correlación. Este resultado nos sirve para entender tres
cosas: COEFICIENTE DE DETERMINACION
1. Si existe o no correlación entre las variables. Un coeficiente que valga
cero indica que nuestras variables son independientes; un ejemplo de
esto sería que no hay relación entre qué tan dulce es una fruta y cuál es
el precio de un litro de jugo.
2. Qué tan fuerte es la correlación (si es que existe). A más se ‘aleje del
cero’ el coeficiente, más fuerte será la correlación entre las dos variables.
Siendo así, las correlaciones cuyo coeficiente esté más cerca de -1 o 1
serán más poderosas.
3. Detalles sobre la naturaleza de la correlación. Existen correlaciones
llamadas directas (donde ambas variables aumentan o disminuyen
simultáneamente) e inversas (donde cuando una variable aumenta, la
otra disminuye). Un coeficiente positivo significa que la correlación es del
primer tipo, mientras que uno negativo indica que es del segundo. Un
ejemplo de correlación positiva es que, si el precio de una fruta aumenta,
el precio de un litro de jugo de dicha fruta también aumentará; una
correlación negativa sería que a más gente consuma una fruta, menor
cantidad de fruta estará disponible. Ejercicio 29
El coeficiente de correlación es el resultado de dividir la covarianza entre las Hallar el coeficiente de correlación
variables X y Y entre la raíz cuadrada del producto de la varianza de X y la de (paramétrico) lineal y parabólico de
Y. los siguientes datos históricos
Es muy importante tener clara la diferencia entre el coeficiente de
correlación y el coeficiente de determinación: R2: mide la proporción de
variación de la variable dependiente explicada por la variable independiente.
r: mide el grado de asociación entre las dos variables.
El coeficiente de correlación de SPEARMAN es recomendable utilizarlo
cuando los datos presentan valores extremos, ya que dichos valores afectan
mucho el coeficiente de correlación de PEARSON, o ante distribuciones no
normales
La interpretación del coeficiente rho de SPEARMAN concuerda en valores
próximos a 1; indican una correlación fuerte y positiva. Valores próximos a –
1 indican una correlación fuerte y negativa. Valores próximos a cero indican RHO SPEARMAN
que no hay correlación lineal. Puede que exista otro tipo de correlación, pero
no lineal.
El coeficiente de correlación de SPEARMAN es una medida no paramétrica
de la correlación de rango (dependencia estadística del ranking entre dos
variables). Se utiliza principalmente para el análisis de datos. Mide la fuerza y
la dirección de la asociación entre dos variables clasificadas.
Ejercicio 30
Hallar el coeficiente de correlación
(no paramétrico) de los datos
D= diferencia entre las variables (x-y) históricos del ejercicio 28
n= número de datos

También podría gustarte