Está en la página 1de 9

ESTIMACION.LINEAL (funcin ESTIMACION.

LINEAL)
SE APLICA A: Excel 2016 , Excel 2013 , Excel 2010 , Excel 2007 , Excel 2016 para
Mac , Excel para Mac 2011 , Ms...
En este artculo se describen la sintaxis de la frmula y el uso de la funcin
ESTIMACION.LINEAL en Microsoft Excel. Encontrar vnculos con ms
informacin sobre cmo crear grficos y realizar un anlisis de regresin en la seccin
Vea tambin.

Descripcin
La funcin ESTIMACION.LINEAL calcula las estadsticas de una lnea con el
mtodo de los "mnimos cuadrados" para calcular la lnea recta que mejor se ajuste a los
datos y despus devuelve una matriz que describe la lnea. Tambin puede combinar
ESTIMACION.LINEAL con otras funciones para calcular las estadsticas de otros
tipos de modelos que son lineales en los parmetros desconocidos, incluidas series
polinmicas, logartmicas, exponenciales y de potencias. Debido a que esta funcin
devuelve una matriz de valores, debe ser especificada como frmula de matriz.
Encontrar las instrucciones correspondientes tras los ejemplos de este artculo.
La ecuacin para la lnea es la siguiente:
y = mx + b
- O bien y = m1x1 + m2x2 + ... + b
si hay varios rangos de valores x, donde los valores y dependientes son funcin de los
valores x independientes. Los valores m son coeficientes que corresponden a cada valor
x, y b es un valor constante. Observe que y, x y m pueden ser vectores. La matriz que
devuelve la funcin ESTIMACION.LINEAL es {mn,mn-1,...,m1,b}.
ESTIMACION.LINEAL tambin puede devolver estadsticas de regresin
adicionales.

Sintaxis
ESTIMACION.LINEAL(conocido_y, [conocido_x], [constante], [estadstica])
La sintaxis de la funcin ESTIMACION.LINEAL tiene los siguientes argumentos:

Sintaxis

Conocido_y Obligatorio. Es el conjunto de valores y que se conocen en la


relacin y = mx+b.
o Si el rango de conocido_y ocupa una sola columna, cada columna de
conocido_x se interpreta como una variable independiente.

Si el rango de conocido_y ocupa una sola fila, cada fila de conocido_x se


interpreta como una variable independiente.

Conocido_x Opcional. Es un conjunto de valores x que pueden conocerse en


la relacin y = mx+b.
o

El rango de conocido_x puede incluir uno o varios conjuntos de


variables. Si usa una sola variable, conocido_y y conocido_x pueden ser
rangos con cualquier forma, siempre y cuando sus dimensiones sean
iguales. Si usa ms de una variable, conocido_y tiene que ser un vector
(es decir, un rango compuesto por una fila o por una columna).

Si omite conocido_x, se supone que es la matriz {1,2,3,...} que tiene el


mismo tamao que conocido_y.

Constante Opcional. Es un valor lgico que especifica si se fuerza la


constante b para que sea igual a 0.
o

Si omite el argumento constante o es VERDADERO, b se calcula


normalmente.

Si constante es FALSO, b se establece como igual a 0 y los valores m se


ajustan para adaptarse a y = mx.

Estadstica Opcional. Es un valor lgico que especifica si se deben devolver


estadsticas de regresin adicionales.
o

Si estadstica es VERDADERO, ESTIMACION.LINEAL devuelve las


estadsticas de regresin adicionales, de forma que la matriz devuelta es
{mn,mn-1,...,m1,b;sen,sen-1,...,se1,seb;r2,sey;F,df;ssreg,ssresid}.

Si omite estadstica o es FALSO, ESTIMACION.LINEAL solo


devuelve los coeficientes m y la constante b.
Las estadsticas de regresin adicional son las siguientes.

Estadstica Descripcin
se1,se2,...,sen Los valores de error estndar para los coeficientes m1,m2,...,mn.
El valor de error estndar para la constante b (seb = #N/A cuando
seb
constante es FALSO).
El coeficiente de determinacin. Compara los valores y calculados y
reales, y los rangos con valor de 0 a 1. Si es 1, hay una correlacin
perfecta en la muestra, es decir, no hay diferencia entre el valor y
r2
calculado y el valor y real. En el otro extremo, si el coeficiente de
determinacin es 0, la ecuacin de regresin no es til para predecir un
valor y. Para obtener informacin sobre el clculo de r2, vea la seccin de
"Observaciones" ms adelante en este tema.
sey
El error estndar para el clculo y.
La estadstica F o valor F observado. Use la estadstica F para determinar
F
si la relacin observada entre las variables dependientes e independientes
se produce por azar.
df
Grados de libertad. Use los grados de libertad para encontrar valores F

Estadstica

ssreg
ssresid

Descripcin
crticos en una tabla estadstica. Compare los valores que encuentre en la
tabla con la estadstica F devuelta por ESTIMACION.LINEAL para
determinar un nivel de confianza para el modelo. Para obtener
informacin sobre el clculo de df, vea la seccin "Observaciones" ms
adelante en este tema. El ejemplo 4 muestra el uso de F y df.
La suma de regresin de los cuadrados.
La suma residual de los cuadrados. Para obtener informacin sobre el
clculo de ssreg y ssresid, vea la seccin "Observaciones" ms adelante en
este tema.

La ilustracin siguiente muestra el orden en que se devuelven las estadsticas de


regresin adicionales.

Observaciones

Puede describir cualquier lnea recta con la pendiente y la interseccin y:


Pendiente (m):
Para hallar la pendiente de una lnea, frecuentemente indicada por m, tome dos
puntos de la lnea, (x1,y1) y (x2,y2); la pendiente es igual a (y2 - y1)/(x2 - x1).
Interseccin y (b):
La interseccin y de una lnea, frecuentemente indicada por b, es el valor de y en
el punto en que la lnea cruza el eje x.
La ecuacin de una lnea recta es y = mx + b. Si conoce los valores de m y b,
puede calcular cualquier punto de la lnea insertando el valor y o x en esa
ecuacin. Tambin puede usar la funcin TENDENCIA.

Si solo tiene una variable x independiente, puede obtener los valores de la


pendiente y de la interseccin y directamente con las frmulas siguientes:
Pendiente:
=INDICE(ESTIMACION.LINEAL(conocido_y,conocido_x),1)
Interseccin y:
=INDICE(ESTIMACION.LINEAL(conocido_y,conocido_x),2)

La exactitud de la lnea calculada por la funcin ESTIMACION.LINEAL


depende del grado de dispersin de los datos. Cuanto ms lineales sean los
datos, ms exacto ser el modelo de ESTIMACION.LINEAL.
ESTIMACION.LINEAL usa el mtodo de los mnimos cuadrados para

determinar el mejor ajuste para los datos. Si solo tiene una variable x
independiente, los clculos para m y b se basan en las frmulas siguientes:

Donde x e y son medias de muestras, es decir, x = PROMEDIO(conocido_x) e


y = PROMEDIO(conocido_y).

Las funciones de ajuste de lnea y de curva ESTIMACION.LINEAL y


ESTIMACION.LOGARITMICA pueden calcular la lnea recta o la curva
exponencial que mejor se ajuste a los datos. Sin embargo, debe decidir cul de
los dos resultados se ajusta mejor a sus datos. Puede calcular
TENDENCIA(conocido_y,conocido_x) para una lnea recta o
CRECIMIENTO(conocido_y,conocido_x) para una curva exponencial. Estas
funciones, sin el argumento nueva_matriz_x, devuelven una matriz de valores y
pronosticados en la lnea o curva en los puntos de datos reales. Despus, puede
comparar los valores pronosticados con los valores reales. Puede crear un
grfico con ambos para realizar una comparacin visual.
En el anlisis de regresin, Excel calcula para cada punto la diferencia al
cuadrado entre el valor y calculado para ese punto y su valor y real. La suma de
estas diferencias al cuadrado se denomina suma de los cuadrados residual,
ssresid. Excel calcula a continuacin la suma total de los cuadrados, sstotal. Si
omite el argumento constante o es VERDADERO, la suma total de los
cuadrados es la suma de las diferencias al cuadrado entre los valores y reales y la
media de los mismos. Cuando el argumento constante = FALSO, la suma total
de los cuadrados es la suma de los cuadrados de los valores y reales (sin restar el
valor y medio de cada valor y individual). Puede hallar la suma de regresin de
los cuadrados, ssreg, a partir de ssreg = sstotal - ssresid. Cuanto menor sea la
suma residual de los cuadrados, en comparacin con la suma total de los
cuadrados, mayor ser el valor del coeficiente de determinacin, r2, que es un
indicador de hasta qu punto la ecuacin resultante del anlisis de regresin
explica la relacin entre las variables. El valor de r2 es igual a ssreg/sstotal.
En algunos casos, una o varias de las columnas x (supongamos que y y x estn
en columnas) pueden no tener valor predictivo adicional en presencia de las
otras columnas x. En otras palabras, eliminar una o varias columnas x puede
producir valores y pronosticados que son igualmente exactos. En ese caso, estas
columnas x redundantes deberan omitirse del modelo de regresin. Este
fenmeno se denomina colinealidad porque cualquier columna x redundante
se puede expresar como una suma de mltiplos de las columnas x no
redundantes. ESTIMACION.LINEAL comprueba la colinealidad y quita
cualquier columna x redundante del modelo de regresin cuando las identifica.
Puede reconocer las columnas x eliminadas en el resultado de
ESTIMACION.LINEAL como aquellas con coeficientes 0 as como con
valores de 0. Si quita una o varias columnas por redundantes, entonces df se ve
afectado porque df depende del nmero de columnas x usadas con fines

predictivos. Para ms informacin sobre el clculo de df, vea el ejemplo 4. Si


modifica df modifica porque ha quitado las columnas x redundantes, los valores
de sey y F tambin se vern afectados. La colinealidad debera ser relativamente
inslita en la prctica. No obstante, un caso en el que es ms probable que se
produzca es cuando algunas columnas x contienen solo valores 0 y 1 como
indicadores de si un sujeto de un experimento pertenece o no a un grupo en
concreto. Si omite constante o es VERDADERO, ESTIMACION.LINEAL
inserta una columna x adicional de todo unos (1) para dar forma a la
interseccin. Si tiene una columna con un 1 para cada sujeto que sea varn, o 0
si no lo es, y tiene tambin una columna con un 1 para cada sujeto que sea
mujer, o 0 si no lo es, esta ltima columna es redundante porque puede obtener
las entradas de la misma de restar la entrada de la columna "indicador de varn"
de la entrada de la columna adicional de todo unos (1) agregada por
ESTIMACION.LINEAL.

Calcule el valor de df como sigue, no se quite ninguna columna x del modelo


debido a la colinealidad: si hay k columnas de conocido_x y omite constante o
es VERDADERO, entonces df = n k 1. Si constante = FALSO, entonces df
= n - k. En ambos casos, cada columna x quitada debido a la colinealidad
aumenta df en 1.

Debe especificar las frmulas que devuelven matrices como frmulas de matriz.
Nota: En Excel Online no puede crear frmulas de matriz.

Cuando especifique como argumento una constante de matriz (como


conocido_x), use comas para separar los valores contenidos en una misma fila y
puntos y comas para separar las filas. Los caracteres separadores pueden ser
diferentes segn la configuracin regional.
Observe que los valores y pronosticados por la ecuacin de regresin pueden no
ser vlidos si quedan fuera del rango de los valores y empleados para determinar
la ecuacin.
El algoritmo subyacente usado en la funcin ESTIMACION.LINEAL es
diferente del algoritmo subyacente usado en las funciones PENDIENTE e
INTERSECCION.EJE. La diferencia entre estos algoritmos puede producir
resultados distintos cuando los datos son indeterminados y colineales. Por
ejemplo, si los puntos de datos del argumento conocido_y son 0 y los puntos de
datos del argumento conocido_x son 1:
o

ESTIMACION.LINEAL devuelve un valor 0. El algoritmo de la


funcin ESTIMACION.LINEAL est diseado para devolver
resultados razonables para los datos colineales y, en este caso, se puede
encontrar al menos una respuesta.

PENDIENTE e INTERSECCION.EJE devuelven un error #DIV/0!.


El algoritmo de PENDIENTE e INTERSECCION.EJE est diseado
para buscar solo una respuesta y en este caso puede haber varias.

Adems de usar ESTIMACION.LOGARITMICA para calcular estadsticas


para otros tipos de regresin, puede usar ESTIMACION.LINEAL para calcular
un rango de tipos de regresin diferentes escribiendo funciones de las variables x

e y como series x e y para ESTIMACION.LINEAL. Por ejemplo, la frmula


siguiente:
=ESTIMACION.LINEAL(valores y, valores x^COLUMNA($A:$C))
funciona si se dispone de una nica columna de valores y y una nica columna
de valores x para calcular la aproximacin cbica (polinmica de orden 3) de
esta forma:
y = m1*x + m2*x^2 + m3*x^3 + b
Puede ajustar esta frmula para calcular otros tipos de regresin, pero en algunos
casos, es necesario ajustar los valores de salida y otras estadsticas.

El valor de la prueba F que devuelve la funcin ESTIMACION.LINEAL y el


que devuelve la funcin PRUEBA.F son diferentes. ESTIMACION.LINEAL
devuelve la estadstica F, mientras que PRUEBA.F devuelve la probabilidad.

Ejemplos
Ejemplo 1: Pendiente e interseccin con eje y
Copie los datos del ejemplo en la siguiente tabla y pguelos en la celda A1 de una nueva
hoja de clculo de Excel. Para las frmulas que muestren resultados, seleccinelas,
presione F2 y, a continuacin, presione Entrar. Si lo necesita, puede ajustar los anchos
de la columna para ver todos los datos.
Y conocido

X conocido
1.
9
5.
7.

{0}
4.
2.
3.
Resultado (interseccin y)
1.

Resultado (pendiente)
2.
Frmula (frmula de matriz en celdas A7:B7)
=ESTIMACION.LINEAL(A2:A5;B2:B5;;FALSO)

Ejemplo 2: Regresin lineal simple


Copie los datos del ejemplo en la siguiente tabla y pguelos en la celda A1 de una nueva
hoja de clculo de Excel. Para las frmulas que muestren resultados, seleccinelas,
presione F2 y, a continuacin, presione Entrar. Si lo necesita, puede ajustar los anchos
de la columna para ver todos los datos.
Mes
1.
2.

Ventas
$3.100
$4.500

Mes
3.
4.
5.
6.
Frmula
=SUMA(ESTIMACION.LINEAL(B1:B6,
A1:A6)*{9,1})

Ventas
$4.400
$5.400
$7.500
$8.100
Resultado
11000 $
Calcula la estimacin de las ventas en el
noveno mes, basndose en las ventas de
los meses 2 al 6.

Ejemplo 3: Regresin lineal mltiple


Copie los datos del ejemplo en la siguiente tabla y pguelos en la celda A1 de una nueva
hoja de clculo de Excel. Para las frmulas que muestren resultados, seleccinelas,
presione F2 y, a continuacin, presione Entrar. Si lo necesita, puede ajustar los anchos
de la columna para ver todos los datos.
Superficie (x1)
2310
2333
2356
2379
2402
2425
2448
2471
2494
2517
2540

Oficinas (x2)
2
2
3
3
2
4
2
2
3
4
2

Entradas (x3)
2
2
1,5
2
3
2
1,5
2
3
4
3

Antigedad (x4) Valor tasado (y)


20
142000 $
12
144000 $
33
151000 $
43
150000 $
53
139000 $
23
169 000 $
99
126 000 $
34
142 900 $
23
163 000 $
55
169 000 $
22
149 000 $

-234,2371645
13,26801148
0,996747993
459,7536742
1732393319
Frmula (frmula de matriz especificada en A14:A18)
=ESTIMACION.LINEAL(E2:E12;A2:D12;VERDADERO;VERDADERO)

Ejemplo 4: Usar las estadsticas F y r2


En el ejemplo anterior, el coeficiente de determinacin, o r2, es 0,99675 (vea la celda
A17 en el resultado de ESTIMACION.LINEAL), que indicara una relacin estrecha
entre las variables independientes y el precio de venta. Puede usar la estadstica F para
determinar si estos resultados, con este valor r2 tan alto, se produjeron por azar.

Suponga por un momento que en realidad no existe relacin entre las variables, pero
que ha extrado una muestra peculiar de 11 edificios de oficinas que hace que el anlisis
estadstico demuestre una relacin marcada. El trmino "alfa" se usa para la
probabilidad de llegar a la conclusin errnea de que existe una relacin.
Los valores F y df del resultado de la funcin ESTIMACION.LINEAL se pueden usar
para determinar la probabilidad de que se produzca por azar un valor F ms elevado. F
se puede comparar con los valores crticos de las tablas de distribucin F publicadas o
se puede usar la funcin DISTR.F de Excel para calcular la probabilidad de que se
produzca por azar un valor F mayor. La distribucin F apropiada tiene los grados de
libertad v1 y v2. Si n es el nmero de puntos de datos y omite la constante o es
VERDADERO, entonces v1 = n df 1 y v2 = df. Si la constante = FALSO, entonces
v1 = n df y v2 = df. La funcin DISTR.F ( con la sintaxis DISTR.F(F,v1,v2) )
devolver la probabilidad de que se produzca por azar un valor F superior. En este
ejemplo, df = 6 (celda B18) y F = 459,753674 (celda A18).
Suponiendo un valor alfa de 0,05, v1 = 11 6 1 = 4 y v2 = 6, el valor crtico de F es
4,53. Puesto que F = 459,753674 es mucho ms elevado que 4,53, es extremadamente
improbable que un valor F tan elevado se produzca por azar. (Con Alfa = 0,05, la
hiptesis de que no hay relacin entre conocido_y y conocido_x hay que rechazarla
cuando F sobrepasa el nivel crtico, 4,53). Puede usar la funcin DISTR.F de Excel
para obtener la probabilidad de que un valor F tan elevado se produzca por azar. Por
ejemplo, DISTR.F(459,753674; 4; 6) = 1,37E-7, una probabilidad sumamente pequea.
Se puede concluir, bien buscando el nivel crtico de F en una tabla, bien con la funcin
DISTR.F, que la ecuacin de regresin es til para predecir el valor tasado de los
edificios de oficinas de esta rea. Recuerde que es vital usar los valores correctos de v1
y v2 calculados en el prrafo anterior.

Ejemplo 5: Calcular la estadstica t


Otra prueba hipottica determinar si cada coeficiente de la pendiente es til para
calcular el valor tasado de un edificio de oficinas del ejemplo 3. Por ejemplo, para
probar si el coeficiente de antigedad es significativo estadsticamente, divida -234,24
(coeficiente de la pendiente de antigedad) por 13,268 (el error estndar calculado de
los coeficientes de antigedad en la celda A15). El siguiente es el valor t observado:
t = m4 se4 = -234,24 13,268 = -17,7
Si el valor absoluto de t es suficientemente alto, puede deducirse que el coeficiente de la
pendiente es til para calcular el valor tasado del edificio de oficinas del ejemplo 3. La
siguiente tabla muestra los valores absolutos de los 4 valores t observados.
Si consulta una tabla de un manual de estadstica, observar que el valor t crtico, de dos
colas, con 6 grados de libertad y alfa = 0,05 es 2,447. Este valor crtico puede
encontrarse tambin con la funcin DISTR.T.INV de Excel. DISTR.T.INV(0,05,6) =
2,447. Puesto que el valor absoluto de t, 17,7, es superior a 2,447, la antigedad es una
variable importante para calcular el valor tasado de un edificio de oficinas. El
significado estadstico de cada una de las dems variables independientes puede
probarse de forma similar. Los siguientes son los valores t observados para cada una de
las variables independientes.

Variable
Superficie
Nmero de oficinas
Nmero de entradas
Edad

valor t observado
5,1
31,3
4,8
17,7

Todos estos valores tienen un valor absoluto superior a 2,447; por tanto, todas las
variables usadas en la ecuacin de regresin son tiles para predecir el valor tasado de
los edificios de oficinas de esta rea.

También podría gustarte