Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresión Lineal.
La función ESTIMACION.LINEAL calcula las estadísticas de una línea con el método de los
"mínimos cuadrados" para calcular la línea recta que mejor se ajuste a los datos y después
devuelve una matriz que describe la línea. También puede combinar ESTIMACION.LINEAL con
otras funciones para calcular las estadísticas de otros tipos de modelos que son lineales en los
parámetros desconocidos, incluidas series polinómicas, logarítmicas, exponenciales y de
potencias. Debido a que esta función devuelve una matriz de valores, debe ser especificada como
fórmula de matriz. Encontrará las instrucciones correspondientes tras los ejemplos de este
artículo.
y = mx + b
O bien
si hay varios rangos de valores x, donde los valores y dependientes son función de los valores x
independientes. Los valores m son coeficientes que corresponden a cada valor x, y b es un valor
constante. Observe que y, x y m pueden ser vectores. La matriz que devuelve la función
ESTIMACION.LINEAL es {mn,mn-1,...,m1,b}. ESTIMACION.LINEAL también puede devolver
estadísticas de regresión adicionales.
Sintaxis
Sintaxis
Estadística Descripción
se1,se2,...,sen Los valores de error estándar para los coeficientes m1,m2,...,mn.
El valor de error estándar para la constante b (seb = #N/A cuando constante es
seb
FALSO).
El coeficiente de determinación. Compara los valores y calculados y reales, y los
rangos con valor de 0 a 1. Si es 1, hay una correlación perfecta en la muestra, es
decir, no hay diferencia entre el valor y calculado y el valor y real. En el otro
r2
extremo, si el coeficiente de determinación es 0, la ecuación de regresión no es útil
para predecir un valor y. Para obtener información sobre el cálculo de r2, vea la
sección de "Observaciones" más adelante en este tema.
sey El error estándar para el cálculo y.
La estadística F o valor F observado. Use la estadística F para determinar si la
F relación observada entre las variables dependientes e independientes se produce
por azar.
Grados de libertad. Use los grados de libertad para encontrar valores F críticos en
una tabla estadística. Compare los valores que encuentre en la tabla con la
estadística F devuelta por ESTIMACION.LINEAL para determinar un nivel de
df
confianza para el modelo. Para obtener información sobre el cálculo de df, vea la
sección "Observaciones" más adelante en este tema. El ejemplo 4 muestra el uso de
F y df.
ssreg La suma de regresión de los cuadrados.
La suma residual de los cuadrados. Para obtener información sobre el cálculo de
ssresid
ssreg y ssresid, vea la sección "Observaciones" más adelante en este tema.
Pendiente (m):
Para hallar la pendiente de una línea, frecuentemente indicada por m, tome dos puntos de la
línea, (x1,y1) y (x2,y2); la pendiente es igual a (y2 - y1)/(x2 - x1).
Intersección y (b):
La intersección y de una línea, frecuentemente indicada por b, es el valor de y en el punto en que
la línea cruza el eje x.
• Si solo tiene una variable x independiente, puede obtener los valores de la pendiente y de
la intersección y directamente con las fórmulas siguientes:
Pendiente:
=INDICE(ESTIMACION.LINEAL(conocido_y,conocido_x),1)
Intersección y:
=INDICE(ESTIMACION.LINEAL(conocido_y,conocido_x),2)
• Cuando especifique como argumento una constante de matriz (como conocido_x), use
comas para separar los valores contenidos en una misma fila y puntos y comas para
separar las filas. Los caracteres separadores pueden ser diferentes según la configuración
regional.
• Observe que los valores y pronosticados por la ecuación de regresión pueden no ser
válidos si quedan fuera del rango de los valores y empleados para determinar la ecuación.
• El algoritmo subyacente usado en la función ESTIMACION.LINEAL es diferente del
algoritmo subyacente usado en las funciones PENDIENTE e INTERSECCION.EJE. La
diferencia entre estos algoritmos puede producir resultados distintos cuando los datos son
indeterminados y colineales. Por ejemplo, si los puntos de datos del argumento
conocido_y son 0 y los puntos de datos del argumento conocido_x son 1:
• ESTIMACION.LINEAL devuelve un valor 0. El algoritmo de la función
ESTIMACION.LINEAL está diseñado para devolver resultados razonables para los
datos colineales y, en este caso, se puede encontrar al menos una respuesta.
• PENDIENTE e INTERSECCION.EJE devuelven un error #¡DIV/0!. El algoritmo de
PENDIENTE e INTERSECCION.EJE está diseñado para buscar solo una respuesta y
en este caso puede haber varias.
• Además de usar ESTIMACION.LOGARITMICA para calcular estadísticas para otros tipos de
regresión, puede usar ESTIMACION.LINEAL para calcular un rango de tipos de regresión
diferentes escribiendo funciones de las variables x e y como series x e y para
ESTIMACION.LINEAL. Por ejemplo, la fórmula siguiente:
funciona si se dispone de una única columna de valores y y una única columna de valores x para
calcular la aproximación cúbica (polinómica de orden 3) de esta forma:
Puede ajustar esta fórmula para calcular otros tipos de regresión, pero en algunos casos, es
necesario ajustar los valores de salida y otras estadísticas.
Ejemplos
Copie los datos del ejemplo en la siguiente tabla y péguelos en la celda A1 de una nueva hoja de
cálculo de Excel. Para las fórmulas que muestren resultados, selecciónelas, presione F2 y, a
continuación, presione Entrar. Si lo necesita, puede ajustar los anchos de la columna para ver
todos los datos.
Y conocido X conocido
1 0
9 4
5 2
7 3
Resultado (pendiente) Resultado (intersección y)
2 1
Fórmula (fórmula de matriz en celdas A7:B7)
=ESTIMACION.LINEAL(A2:A5;B2:B5;;FALSO)
Copie los datos del ejemplo en la siguiente tabla y péguelos en la celda A1 de una nueva hoja de
cálculo de Excel. Para las fórmulas que muestren resultados, selecciónelas, presione F2 y, a
continuación, presione Entrar. Si lo necesita, puede ajustar los anchos de la columna para ver
todos los datos.
Mes Ventas
1 3100 $
2 4500 $
3 4400 $
4 5400 $
5 7500 $
6 8100 $
Fórmula Resultado
=SUMA(ESTIMACION.LINEAL(B1:B6,
11000 $
A1:A6)*{9,1})
Calcula la estimación de las ventas en el noveno mes,
basándose en las ventas de los meses 2 al 6.
Copie los datos del ejemplo en la siguiente tabla y péguelos en la celda A1 de una nueva hoja de
cálculo de Excel. Para las fórmulas que muestren resultados, selecciónelas, presione F2 y, a
continuación, presione Entrar. Si lo necesita, puede ajustar los anchos de la columna para ver
todos los datos.
Valor
Oficina Entrada Antigüeda
Superficie (x1) tasado
s (x2) s (x3) d (x4)
(y)
142000
2310 2 2 20
$
144000
2333 2 2 12
$
151000
2356 3 1,5 33
$
150000
2379 3 2 43
$
139000
2402 2 3 53
$
169 00
2425 4 2 23
0$
126 00
2448 2 1,5 99
0$
142 90
2471 2 2 34
0$
163
2494 3 3 23
000 $
169
2517 4 4 55
000 $
149 00
2540 2 3 22
0$
-234,2371645
13,26801148
0,996747993
459,7536742
1732393319
Fórmula (fórmula de matriz especificada en A14:A18)
=ESTIMACION.LINEAL(E2:E12;A2:D12;VERDADERO;VERDADE
RO)
Suponga por un momento que en realidad no existe relación entre las variables, pero que ha
extraído una muestra peculiar de 11 edificios de oficinas que hace que el análisis estadístico
demuestre una relación marcada. El término "alfa" se usa para la probabilidad de llegar a la
conclusión errónea de que existe una relación.
Los valores F y df del resultado de la función ESTIMACION.LINEAL se pueden usar para determinar
la probabilidad de que se produzca por azar un valor F más elevado. F se puede comparar con los
valores críticos de las tablas de distribución F publicadas o se puede usar la función DISTR.F de
Excel para calcular la probabilidad de que se produzca por azar un valor F mayor. La distribución F
apropiada tiene los grados de libertad v1 y v2. Si n es el número de puntos de datos y omite la
constante o es VERDADERO, entonces v1 = n – df – 1 y v2 = df. Si la constante = FALSO, entonces
v1 = n – df y v2 = df. La función DISTR.F ( con la sintaxis DISTR.F(F,v1,v2) ) devolverá la
probabilidad de que se produzca por azar un valor F superior. En este ejemplo, df = 6 (celda B18) y
F = 459,753674 (celda A18).
Otra prueba hipotética determinará si cada coeficiente de la pendiente es útil para calcular el valor
tasado de un edificio de oficinas del ejemplo 3. Por ejemplo, para probar si el coeficiente de
antigüedad es significativo estadísticamente, divida -234,24 (coeficiente de la pendiente de
antigüedad) por 13,268 (el error estándar calculado de los coeficientes de antigüedad en la celda
A15). El siguiente es el valor t observado:
Si consulta una tabla de un manual de estadística, observará que el valor t crítico, de dos colas, con
6 grados de libertad y alfa = 0,05 es 2,447. Este valor crítico puede encontrarse también con la
función DISTR.T.INV de Excel. DISTR.T.INV(0,05,6) = 2,447. Puesto que el valor absoluto de t, 17,7,
es superior a 2,447, la antigüedad es una variable importante para calcular el valor tasado de un
edificio de oficinas. El significado estadístico de cada una de las demás variables independientes
puede probarse de forma similar. Los siguientes son los valores t observados para cada una de las
variables independientes.
Variable valor t observado
Superficie 5,1
Número de oficinas 31,3
Número de entradas 4,8
Edad 17,7
Todos estos valores tienen un valor absoluto superior a 2,447; por tanto, todas las variables
usadas en la ecuación de regresión son útiles para predecir el valor tasado de los edificios de
oficinas de esta área.