Está en la página 1de 10

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD ALONSO DE OJEDA

CONVENIO UNIOJEDA –IUTEMBI

EXTENSIÓN CARORA-EDO. LARA

Trabajo de Regresión Lineal

Estudiantes

Laura Orellana CI: 26.831.242


Jose Rivero CI: 25.940.351
Josely Crespo CI: 26.554.665
Yissel Verde CI: 27.739.977
Isabel Ortegana CI: 21.275.518
Estefani Mora CI: 26.304.344

Carora 2019
Introduccion
El siguiente trabajo es de gran importancia ya que nos permite tener un conocimiento amplio
sobre la Regresion lineal ya que esto nos permite profundizar en la manera de realizer calculos
estadisticos mas amplios

Así mismo es importante señalar que la estadistica es Estudio que reúne, clasifica y recuenta
todos los hechos que tienen una determinada característica en común, para poder llegar a
conclusiones a partir de los datos numéricos extraídos.
Regresión Lineal (Aplicaciones)

Líneas de tendencia

Una línea de tendencia representa una tendencia en una serie de datos obtenidos a
través de un largo período. Este tipo de líneas puede decir si un conjunto de datos en
particular (como por ejemplo, el PBI, el precio del petróleo o el valor de las acciones) han
aumentado o disminuido en un determinado período. Las líneas de tendencia son
generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de mayor
grado dependiendo de la curvatura deseada en la línea.

Medicina

En Medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco


vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una
gran cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores
que pudieran producir correlaciones espurias.

En el caso del Tabaquismo, los investigadores incluyeron el estado socio-económico para


asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su
educación o posición económica. No obstante, es imposible incluir todas las variables
posibles en un estudio de regresión.

En el ejemplo del tabaquismo, un hipotético gen podría aumentar la Mortalidad y


aumentar la propensión a adquirir enfermedades relacionadas con el consumo de tabaco.

Industria

En la industria tiene aplicación para investigar la relación entre el rendimiento de la


producción y uno o más factores del (o de los) que depende, como la Temperatura, la
humedad ambiental, la presión, la cantidad de insumos, etc; con base en este análisis se
puede pronosticar el comportamiento de una variable que se desea estimar.

Diagrama de Dispersión
El diagrama de dispersión es una gráfica del tipo X –Y cuyo objetivo es analizar la forma
en que dos variables numéricas están relacionadas. El diagrama de dispersión se obtiene
coleccionando los datos en pares de valores sobre dos variables (x,y). Las parejas de
datos obtenidos se representan a través de puntos en una gráfica del tipo X – Y (ejes de
coordenada cartesianos).
El análisis de un diagrama de dispersión puede mostrar varios tipos de correlaciones
entre las variables con un intervalo de confianza determinado. La correlación puede ser
positiva ((Y aumenta con X)), negativa (Y disminuye con X), o nula (las variables no están
correlacionadas).
El diagrama de dispersión es una de las herramientas básicas de gestión de la calidad,
muy útil al analizar las causas de un problema y para Identificar oportunidades de mejora
continua.

Regresión Lineal Simple


La regresión lineal simple se basa en estudiar los cambios en una variable, no aleatoria,
afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas
variables que puede ser establecida por una expresión lineal, es decir, su representación
gráfica es una línea recta. Es decir, se está en presencia de una regresión lineal simple
cuando una variable independiente ejerce influencia sobre otra variable dependiente.

Ejemplo: Y = f(x)

Por Ejemplo: Supongamos que la recta de regresión es:

Costo = 15,65 + 1,29 Volumen


Se estima que una empresa que produce 25 mil unidades tendrá un costo:
Costo = 15,65 + 1,29 x 25 = 16,6 mil euros
La diferencia entre cada valor 𝑦𝑖 de la variable respuesta y su estimación ^𝑦𝑖 se llama
residuo:

Indudablemente, una empresa determinada que haya producido exactamente 25 mil


unidades no va a tener un gasto de exactamente 16,6 mil euros. La diferencia entre el
costo estimado y el real es el residuo. Si por ejemplo el costo real de la empresa es de
18 mil euros, el residuo es:

𝑒𝑖 = 18 – 16,6 = 1,4 mil euros

Método de mínimo cuadrado


Mínimo cuadrado es una técnica de análisis numérico enmarcada dentro de la
optimización matemática en la que dado un conjunto de pares ordenados una variable
dependiente, variable independiente y una familia de funciones se intenta encontrar la
función continua dentro de dicha familia , que mejor que se aproxime a los datos

MMC en series de Tiempo

Es el mejor método para obtener un ajuste lineal a una serie de datos. Es base para la
identificación de componentes de tendencia de una serie de tiempo. Con este método se
encuentra la ecuación de una recta de mínimos cuadrados. Con esta recta se
obtendrán los valores de tendencia

Esta es otra técnica de tipo cuantitativo que permite el cálculo de los pronósticos
paraperíodos futuros, para lo cual requiere de registros históricos que sean consistentes,
reales yprecisos. Esta técnica como su nombre lo indica se trata de sacar el total de las
desviacioneselevadas al cuadrado a un valor mínimo

Formula

Y= a+bx

Donde

 Y : valor proyectado
 a: punto donde la recta corta el eje
 b : la pendiente de la recta la tendencia
 x : cualquier valor de tiempo seleccionado
𝑛∑𝑥𝑦−(𝛴𝑥)𝛴𝑦 ∑𝑦− 𝑏(∑𝑥)
 𝑏= 𝑎=
𝑛∑𝑥 2 −(𝛴𝑥)2 𝑛 𝑛

Ejemplo

Una zapatería que empezó en 2006 la cual ha ido aumentando sus ventas año con año,
le gustaría saber un aproximado de sus venta en 2015
(9)(27.065.000)−(45)(4.670.000)
𝑏= (9)(285)−(45)2
4.670.000 45
𝑎= − (61.916.66 ∗ ( 9 ))
9

b= 61,916.66
a= 209,305.58

Cual es el pronostico de ventas que habra en 2015?

Y= a+bx

Y= 209.305.58 +(61.916.66)(x)

Y= 209.305.58 +(61.916.66)(10)

Y= 828,472.18

Predicción
El objetivo de las técnicas de predicción no causal (TPNC) es obtener estimaciones o
pronósticos de valores futuros de una serie temporal a partir de la información histórica
contenida en la serie observada hasta el momento actual. Estas técnicas no requieren la
especificación de los factores que determinan el comportamiento de la variable, sino que
se basan únicamente en la modelización del comportamiento sistemático de la serie. Se
consideran tres modelos posibles del comportamiento sistemático de una serie temporal:
modelo estacionario (sin tendencia), modelo con tendencia lineal y modelo con
estacionalidad. La técnica de predicción adecuada dependerá del modelo de
comportamiento de la serie.

Las hipótesis en que se basan las TPNC son, en primer lugar, la estabilidad de la forma
del comportamiento sistemático de la serie y, en segundo lugar, que el valor de la variable
observado en cualquier período t es el resultado del comportamiento sistemático y de una
perturbación aleatoria.

Regresión lineal múltiple


La regresión lineal es una técnica estadística destinada a analizar las causas de por qué
pasan las cosas. A partir de los análisis de regresión lineal múltiple podemos:
 identificar que variables independientes (causas) explican una variable
dependiente (resultado)
 comparar y comprobar modelos causales
 predecir valores de una variable, es decir, a partir de unas características predecir
de forma aproximada un comportamiento o estado

La regresión lineal múltiple es la gran técnica estadística para comprobar hipótesis y


relaciones causales

 La variable dependiente (resultado) debe ser ordinal o escalar, es decir, que las
categorías de la variable tengan orden interno o jerarquía, p.ej. nivel de ingresos,
peso, número de hijos, justificación del aborto en una escala de 1-nunca a 10-siempre.
 Las variables independientes (causas) deben ser ordinales o escalares o dummy
 Hay otras condiciones como: las variables independientes no puede estar altamente
correlacionadas entre sí, las relaciones entre las causas y el resultado deben ser
lineales, todas variables deben seguir la distribución normal y deben tener varianzas
iguales. Estas condiciones no son tan estrictas y hay maneras de tratar los datos si
se incumple. Sobre ello volveremos en futuras entradas

Como analizar la regresión lineal múltiple en 4 pasos
1. Significación de F-test: si es menor de 0,05 es que el modelo es estadísticamente
significativo y por tanto las variables independientes explican “algo” la variable
dependiente, cuánto “algo” es la R-cuadrado
2. R cuadrado: es cuánto las variables independientes explican la variable
dependiente, indica el porcentaje de la varianza de la variable dependiente
explicado por el conjunto de variables independientes. Cuanto mayor sea la R-
cuadrado más explicativo y mejor es el modelo causal.

Los dos siguientes pasos hacen referencia a la influencia de cada una de las variables
independientes:

3. Significación de t-test: si es menor de 0,05 es que esa variable independiente se


relaciona de forma significativa con la variable dependiente, por tanto, influye
sobre ella, es explicativa
4. Coeficiente beta (β): indica la intensidad y la dirección de la relación entre esa
variable independiente (VI) y la variable dependiente (VD):

 cuanto más se aleja de 0 más fuerte es la relación


 el signo indica la dirección (signo + indica que al aumentar los valores de la VI
aumentan los valores de la VD; signo – indica que al aumentar los valores de la
VI, los valores de la VD descienden)
Ejemplo de regresión lineal múltiple:

Cuáles son las causas que explican la justificación del aborto en España usando los datos
de la Encuesta Mundial de Valores de 2005. A partir de mi observación de la realidad y
la lectura de investigaciones sobre el tema propongo un modelo causal que incluye las
siguientes variables:

Variable dependiente:

 justificación del aborto: Se preguntó a los encuestados en qué grado en una escala
de 1 a 10 justificarían el aborto, donde 1 es nunca lo justificaría y 10 siempre lo
justificarían.

Variables independientes:

 Importancia de Dios en la vida: se preguntó en una escala de 1 a 10, donde 1 es


nada importante y 10 es muy importante
 Nivel educativo: se preguntó cuál es el último nivel educativo alcanzado donde 1
es sin estudios primarios completos, 2 es primarios completos, 3 es secundarios
completos y 4 es universitarios completos.
 Nivel de ingresos: se preguntó sobre cuánto gana al mes en una escala del 1 al
10 con diversos rangos salariales
 Edad
 Número de hijos
 Confianza en el gobierno: se preguntó sobre el nivel de confianza en el gobierno
en una escala de 1 a 4 donde: 1 es confío mucho, 2 es confío bastante, 3 es confío
poco y 4 es que no confío nada

Arrojando Valores
Pasos
1. La significación de F es menor de 0,05 por tanto el modelo es un bueno para explicar
la variable dependiente, es estadísticamente significativo
2. La R-cuadrado es 0,301 lo cual indica que el modelo explica el 30,1% de la varianza
de la variable dependiente. Casi un tercio de la justificación del aborto es explicado
por este conjunto de variables independientes (causas) seleccionadas.
Sobre la influencia de las variables independientes:
3. Significación de t-test: Las variables importancia de Dios, nivel educativo, edad y
confianza en el gobierno sí explican la justificación del aborto ya que la
significación es menor de 0,05. Las variables nivel de ingresos y número de hijos
no se relacionan con la justificación del aborto.
4. Coeficientes beta (β): La variable independiente que más influye o explica la
opinión de las personas respecto al aborto es la importancia de Dios ya que la beta
(-0,408) se aleja más de cero. El signo negativo indica que a menos importancia
se le da a Dios, más justificación-tolerancia del aborto. Las siguientes causas que
más influyen son la edad (beta = -0,170), a más edad menos tolerancia al aborto,
y la confianza en el gobierno (beta = -0,168), a más confianza en el gobierno más
tendencia a justificar-tolerar el aborto (OJO en el orden de las categorías de las
variables para leer el signo y dirección de las relaciones). Además, a más nivel
educativo más tendencia a justificar el aborto.
Este ejemplo es útil para entender la alta oposición a las políticas del gobierno en
España de restricción del aborto y puede apuntar a las consecuencias negativas
para los gobiernos, ya que sabiendo las causas de un fenómeno se puede predecir
qué sucederá
Siguiendo la lectura de estos cuatro estadísticos podemos comprender de forma clara y
sencilla los resultados al aplicar regresión lineal múltiple.

También podría gustarte