Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción
Los datos numéricos que están relacionados abundan en todas partes;
por ejemplo en los negocios, la economía, la medicina, la física, etcétera.
Con frecuencia, se tiene la necesidad de examinar las relaciones entre
diferentes
Variables.
Los siguientes ejemplos muestran situaciones en las que dos variables
se encuentran relacionadas:
1. La cantidad de anuncios de un producto determinado que se presenta en
los medios de comunicación está relacionada con sus ventas.
2. El número de artículos que no cumplen con las normas de calidad está
relacionado con el costo del producto.
3. El calentamiento de un cable en un circuito eléctrico está relacionado con
el voltaje aplicado a este y su tiempo de uso.
4. El rendimiento de un compuesto químico está afectado por la temperatura
y la presión.
5. El precio de licitación para un proyecto de construcción de carreteras
puede estar relacionado con su longitud y la cantidad de licitadores.
Simplemente, son las características que queremos usar para predecir algún
valor dado de y. Normalmente en Machine Learning vienen declarado como
X.
Ejemplo de Variables
Se desea estudiar la relación existente entre el número de horas que estudia
un alumno y la nota obtenida en su examen final de lapso.
Aquí la variable independiente es
X = Número de horas de estudios.
La variable dependiente es:
Y = Nota obtenida en el examen final de lapso.
Diagrama de dispersión
y = a +bx
Donde
y = Valor pronosticado de la variable dependiente.
a = valor estimado de la ordenada al origen de la población
b = valor estimado de la pendiente de la recta poblacional.
X = Variable independiente
Para determinar los valores de a y b se aplica la siguiente formula:
Si b es positiva entonces
∑ ∑ ∑ la recta de la gráfica es
creciente.
∑ (∑ )
Si b es negativa entonces
la recta de la gráfica es
decreciente.
8 Estadística II – Unidad I – Regresión Lineal Simple - Prof. Esgiorge Torrez
̅ ̅
Donde
𝑛
n = es el número de observaciones ∑ 𝑥𝑖 𝑦𝑖 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒𝑙 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜 𝑑𝑒 𝑥. 𝑦
𝑖
̅ El promedio de los valores de x
𝑛
Hablaremos de
correlación lineal fuerte:
cuando la nube se parezca
mucho a una recta y será
cada vez más débil (o menos
fuerte) cuando la nube vaya
desparramándose con
respecto a la recta.
Interpretación de la gráfica:
La distancia que hay desde un punto que no está en recta hacia ella se llama
Desviación o error y está dado por la fórmula:
No hay correlación:
r = 0: quiere decir que los datos se encuentran tan dispersos que no existe
una correlación.
2
Coeficiente de determinación r
2
Para obtener a r solo debemos elevar al cuadrado a
Coeficientes de correlación para rectas de regresión (r)
Ejemplo N° 1
Se pide:
Solución:
Paso 3: haga clic sobre cualquier punto del gráfico y luego haga click
derecho y en las opciones seleccione agregar línea de tendencia:
Para obtener la ecuación de la recta, primero haga doble clic sobre la recta
del gráfico y le aparecerá las siguientes opciones del lado derecho:
Y= a +bx
Y = 13.056x +82.268
a = 82.268 y b = 13.056
Interpretación:
r = 0.955566011
2
Coeficiente de determinación r
Ejemplo N° 2
El informe es:
31 Estadística II – Unidad I – Regresión Lineal Simple - Prof. Esgiorge Torrez
Error típico = 241.52 lo cual quiere decir que el error estándar de estimación
es de $241.52
32 Estadística II – Unidad I – Regresión Lineal Simple - Prof. Esgiorge Torrez
2
Coeficiente de determinación r
y =7,6X+1246,7
y =7,6(500) +1246,7
y =5046,7