Está en la página 1de 8

Funcin ESTIMACION.

LINEAL
Mostrar todo
Este artculo describe la sintaxis de la frmula y el uso de la funcin ESTIMACIN.LINEAL en Microsoft Office Excel. Busque
vnculos a ms informacin acerca de cmo crear grficos y realizar un anlisis de regresin en la seccin Vea tambin.
Descripcin
La funcin ESTIMACIN.LINEAL calcula las estadsticas de una lnea utilizando el mtodo de los "mnimos cuadrados" para
calcular la lnea recta que mejor se ajuste a los datos y, a continuacin, devuelve una matriz que describe la lnea. Tambin
puede combinar ESTIMACION.LINEAL con otras funciones para calcular las estadsticas de otros tipos de modelos que son
lineales en los parmetros desconocidos, incluidas series polinmicas, logartmicas, exponenciales y de potencias. Debido a que
esta funcin devuelve una matriz de valores, debe ser especificada como una frmula de matrices. Despus de los ejemplos de
este artculo, se incluyen las instrucciones correspondientes.
La ecuacin para la lnea es:
y = mx + b
o
y = m1x1 + m2x2 + ... + b (si hay varios rangos de valores X)
donde los valores y dependientes son funcin de los valores x independientes. Los valores m son coeficientes que corresponden
a cada valor x, y b es un valor constante. Observe que y, x y m pueden ser vectores. La matriz que devuelve la funcin
ESTIMACION.LINEAL es {mn,mn-1,...,m1,b}. ESTIMACION.LINEAL tambin puede devolver estadsticas de regresin
adicionales.
Sintaxis
LINEST(known_y's, [known_x's], [const], [stats])
La sintaxis de la funcin ESTIMACIN.LINEAL tiene los siguientes argumentos:
Conocido_y Obligatorio. El conjunto de valores y que se conocen en la relacin y = mx+b.
Si el rango de conocido_y ocupa una sola columna, cada columna de conocido_x se interpreta como una variable
separada.
Si el rango de conocido_y ocupa una sola fila, cada fila de conocido_x se interpreta como una variable separada.
Conocido_x Opcional. Un conjunto de valores x que pueden conocerse en la relacin y = mx+b.
El rango de conocido_x puede incluir uno o varios conjuntos de variables. Si se usa una sola variable, conocido_y y
conocido_x pueden ser rangos con cualquier forma, siempre y cuando sus dimensiones sean iguales. Si se usa ms de
una variable, conocido_y tiene que ser un vector (es decir, un rango compuesto por una fila o por una columna).
Si se omite conocido_x, se supone que es la matriz {1;2;3;...} que tiene el mismo tamao que conocido_y.
constante Opcional. Un valor lgico que especifica si se ha de hacer que la constante b sea igual a 0.
Si el argumento constante es VERDADERO o se omite, b se calcula normalmente.
Si constante es FALSO, b se establece como igual a 0 y los valores m se ajustan para adaptarse a y = mx.
estadstica Opcional. Un valor lgico que especifica si se deben devolver estadsticas de regresin adicionales.
Si estadstica es VERDADERO, ESTIMACION.LINEAL devuelve las estadsticas de regresin adicionales, de forma que
la matriz devuelta es {mn,mn-1,...,m1,b;sen,sen-1,...,se1,seb;r2,sey;F,df;ssreg,ssresid}.
Si estadstica es FALSO o se omite, ESTIMACION.LINEAL slo devuelve los coeficientes m y la constante b.
Las estadsticas de regresin adicional son las que se indican a continuacin.
ESTADSTICA DESCRIPCIN
se1,se2,...,sen Los valores de error estndar para los coeficientes m1,m2,...,mn.
seb El valor de error estndar para la constante b (seb = #N/A cuando constante es FALSO).
r2 El coeficiente de determinacin. Compara los valores y calculados y reales, y los rangos con valor de 0 a 1. Si es
1, hay una correlacin perfecta en la muestra , es decir, no hay diferencia entre el valor y calculado y el valor y
real. En el otro extremo, si el coeficiente de determinacin es 0, la ecuacin de regresin no es til para predecir
un valor y. Para obtener informacin sobre el clculo de r2, vea la seccin de "Observaciones" ms adelante en
este tema.
sey El error estndar para el clculo y.
F La estadstica F o valor F observado. Utilice la estadstica F para determinar si la relacin observada entre las
variables dependientes e independientes se produce por azar.
df Grados de libertad. Utilice los grados de libertad para encontrar valores F crticos en una tabla estadstica.
Compare los valores que encuentre en la tabla con la estadstica F devuelta por ESTIMACION.LINEAL para
determinar un nivel de confianza para el modelo. Para obtener informacin sobre el clculo de df, vea la seccin
"Observaciones" ms adelante en este tema. El ejemplo 4 muestra el uso de F y df.
ssreg La suma de regresin de los cuadrados.
ssresid La suma residual de los cuadrados. Para obtener informacin sobre el clculo de ssreg y ssresid, vea la seccin
"Observaciones" ms adelante en este tema.
La ilustracin siguiente muestra el orden en que se devuelven las estadsticas de regresin adicionales.

Observaciones
Puede describir cualquier lnea recta con la pendiente y la intercepcin Y:
Pendiente (m):
Para hallar la pendiente de una lnea, frecuentemente indicada por m, tome dos puntos de la lnea, (x1,y1) y (x2,y2); la
pendiente es igual a (y2 - y1)/(x2 - x1).
Intercepcin Y (b):
La intercepcin Y de una lnea, frecuentemente indicada por b, es el valor de Y en el punto en que la lnea cruza el eje
X.
La ecuacin de una lnea recta es y = mx + b. Cuando conozca los valores de m y b, podr calcular cualquier punto de
la lnea insertando el valor Y o el valor X en esa ecuacin. Tambin puede utilizar la funcin TENDENCIA.
Si slo tiene una variable X independiente, puede obtener los valores de la pendiente y de la intercepcin Y directamente
utilizando las frmulas siguientes:
Pendiente:
=INDICE(ESTIMACION.LINEAL(conocido_y;conocido_x);1)
Intercepcin Y:
=INDICE(ESTIMACION.LINEAL(conocido_y;conocido_x);2)
La exactitud de la lnea calculada por la funcin ESTIMACION.LINEAL depende del grado de dispersin de los datos. Cuanto ms
lineales sean los datos, ms exacto ser el modelo de ESTIMACION.LINEAL. ESTIMACION.LINEAL utiliza el mtodo de los
mnimos cuadrados para determinar el mejor ajuste para los datos. Si slo tiene una variable X independiente, los clculos para m
y b se basan en las frmulas siguientes:


donde x e y son medias de muestras, es decir, x = PROMEDIO(conocido_x) e y = PROMEDIO(conocido_y).
Las funciones de ajuste de lnea y de curva ESTIMACION.LINEAL y ESTIMACION.LOGARITMICA pueden calcular la lnea recta o
la curva exponencial que mejor se ajuste a los datos. Sin embargo, debe decidir cul de los dos resultados se ajusta mejor a sus
datos. Puede calcular TENDENCIA(conocido_y;conocido_x) para una lnea recta o CRECIMIENTO(conocido_y;conocido_x)
para una curva exponencial. Estas funciones, sin el argumento nuevo_x, devuelven una matriz de valores Y pronosticados en la
lnea o curva en los puntos de datos reales. Despus, puede comparar los valores pronosticados con los valores reales. Puede
crear un grfico con ambos para realizar una comparacin visual.
En el anlisis de regresin, Excel calcula para cada punto la diferencia al cuadrado entre el valor Y calculado para ese punto y su
valor Y real. La suma de estas diferencias al cuadrado se denomina suma de los cuadrados residual, ssresid. Excel calcula a
continuacin la suma total de los cuadrados, sstotal. Cuando el argumento constante = VERDADERO, o se omite, la suma total
de los cuadrados es la suma de las diferencias al cuadrado entre los valores Y reales y la media de los mismos. Cuando el
argumento constante = FALSO, la suma total de los cuadrados es la suma de los cuadrados de los valores Y reales (sin restar el
valor Y medio de cada valor Y individual). La suma de regresin de los cuadrados, ssreg, puede hallarse a partir de ssreg = sstotal
- ssresid. Cuanto menor sea la suma residual de los cuadrados, en comparacin con la suma total de los cuadrados, mayor ser el
valor del coeficiente de determinacin, r2, que es un indicador de hasta qu punto la ecuacin resultante del anlisis de regresin
explica la relacin entre las variables. El valor de r2 es igual a ssreg/sstotal.
En algunos casos, una o varias de las columnas X (supongamos que Y y X estn en columnas) pueden no tener valor predictivo
adicional en presencia de las otras columnas X. En otras palabras, eliminar una o varias columnas X puede producir valores Y
pronosticados que son igualmente exactos. En ese caso, estas columnas X redundantes deberan omitirse del modelo de
regresin. Este fenmeno se denomina colinealidad porque cualquier columna X redundante se puede expresar como una
suma de mltiplos de las columnas X no redundantes. ESTIMACION.LINEAL comprueba la colinealidad y quita cualquier
columna X redundante del modelo de regresin cuando las identifica. Las columnas X eliminadas pueden reconocerse en el
resultado de ESTIMACION.LINEAL como aqullas con coeficientes 0 as como con valores se 0. Si una o varias columnas se
quitan por redundantes, entonces df se ve afectado porque df depende del nmero de columnas X utilizadas con fines
predictivos. Para obtener ms informacin sobre el clculo de df, vea el ejemplo 4. Si df se modifica porque se han quitado las
columnas X redundantes, los valores de sey y F tambin se vern afectados. La colinealidad debera ser relativamente inslita en
la prctica. No obstante, un caso en el que es ms probable que se produzca es cuando algunas columnas X contienen slo
valores 0 y 1 como indicadores de si un sujeto de un experimento pertenece o no a un grupo en concreto. Si constante =
VERDADERO o se omite, ESTIMACION.LINEAL inserta una columna X adicional de todo unos (1) para dar forma a la
intercepcin. Si tiene una columna con un 1 para cada sujeto que sea varn, o 0 si no lo es, y tiene tambin una columna con un
1 para cada sujeto que sea mujer, o 0 si no lo es, esta ltima columna es redundante porque las entradas de la misma se pueden
obtener de restar la entrada de la columna "indicador de varn" de la entrada de la columna adicional de todo unos (1) agregada
por ESTIMACION.LINEAL.
El valor de df se calcula de la siguiente manera cuando no se quita ninguna columna X del modelo debido a la colinealidad: si hay
k columnas de conocido_x y constante = VERDADERO u omitida, entonces df = n k 1. Si constante = FALSO, entonces df = n
- k. En ambos casos, cada columna X quitada debido a la colinealidad aumenta df en 1.
Las frmulas que devuelven matrices deben especificarse como frmulas de matriz.
Cuando especifique como argumento una constante matricial como conocido_x, utilice comas para separar los valores
contenidos en una misma fila y puntos y comas para separar las filas. Los caracteres separadores pueden diferir dependiendo de
la configuracin regional que se haya establecido en Configuracin regional y de idioma en el panel de control.
Observe que los valores Y pronosticados por la ecuacin de regresin pueden no ser vlidos si quedan fuera del rango de los
valores Y empleados para determinar la ecuacin.
El algoritmo subyacente utilizado en la funcin ESTIMACION.LINEAL es diferente del algoritmo subyacente utilizado en las
funciones PENDIENTE e INTERSECCION.EJE. La diferencia entre estos algoritmos puede producir resultados distintos cuando los
datos son indeterminados y colineales. Por ejemplo, si los puntos de datos del argumento conocido_y son 0 y los puntos de
datos del argumento conocido_x son 1:
ESTIMACION.LINEAL devuelve un valor 0. El algoritmo de la funcin ESTIMACION.LINEAL est diseado para
devolver resultados razonables para los datos colineales y, en este caso, se puede encontrar al menos una respuesta.
PENDIENTE e INTERSECCION.EJE devuelven un error #DIV/0!. El algoritmo de PENDIENTE e INTERSECCION.EJE
est diseado para buscar slo una respuesta, y en este caso puede haber ms de una respuesta.
Adems de utilizar ESTIMACION.LOGARITMICA para calcular estadsticas para otros tipos de regresin, puede utilizar
ESTIMACION.LINEAL para calcular un rango de tipos de regresin diferentes escribiendo funciones de las variables x e y como
series x e y para ESTIMACION.LINEAL. Por ejemplo, la frmula siguiente:
=ESTIMACION.LINEAL(valores y; valores x^COLUMNA($A:$C))
funciona si se dispone de una nica columna de valores Y y una nica columna de valores X para calcular la
aproximacin cbica (polinmica de orden 3) de esta forma:
y = m1*x + m2*x^2 + m3*x^3 + b
Puede ajustar esta frmula para calcular otros tipos de regresin, pero en algunos casos, es necesario ajustar los
valores de salida y otras estadsticas.
Ejemplo 1
Pendiente e interseccin de eje Y
El ejemplo ser ms fcil de entender si lo copia en una hoja de clculo en blanco.
Cmo copio un ejemplo?

1
2
3
4
5
6
7

A B C
Conocido y Conocido x
1 0
9 4
5 2
7 3
Frmula Frmula Resultado
=ESTIMACION.LINEAL(A2:A5;B2:B5;;FALSO) A7=2, B7=1

IMPORTANTE La frmula del ejemplo debe especificarse como frmula de matriz. Despus de copiar el ejemplo en una hoja de
clculo en blanco, seleccione el rango A7:B7 comenzando por la celda de la frmula. Presione F2 y, a continuacin,
CTRL+MAYS+ENTRAR. Si la frmula no se especifica como frmula de matriz, el resultado nico es 2.
Cuando se escribe como una matriz, se devuelve la pendiente (2) y la intercepcin Y (1).
Ejemplo 2
Regresin lineal simple
El ejemplo ser ms fcil de entender si lo copia en una hoja de clculo en blanco.
Cmo copio un ejemplo?

1
A B C
Mes Ventas
2
3
4
5
6
7
8

9

1 3100
2 4500
3 4400
4 5400
5 7500
6 8100
Frmula Descripcin Resultado
=SUMA(ESTIMACION.LINEAL(B2:B7; A2:A7)*{9,1}) Calcular las ventas del noveno mes 11000

En general, SUMA({m,b}*{x,1}) es igual a mx + b, el valor Y calculado para un valor X dado. Tambin puede utilizar la funcin
TENDENCIA.
Ejemplo 3
Regresin lineal mltiple
Suponga que un programador comercial est pensando en adquirir un grupo de pequeos edificios de oficinas en un distrito
comercial conocido.
El programador puede utilizar el anlisis de regresin lineal mltiple para calcular el valor de un edificio de oficinas en un rea
determinada basndose en las variables siguientes.
VARIABLE INDICA
y Valor tasado del edificio de oficinas
x1 Superficie en metros cuadrados
x2 Nmero de oficinas
x3 Nmero de entradas
x4 Antigedad del edificio en aos
Este ejemplo supone que existe una relacin de lnea recta entre cada variable independiente (x1, x2, x3, y x4) y la variable
dependiente (y), el valor de los edificios de oficinas en esa rea.
El programador elige al azar una muestra de 11 edificios de oficinas de 1.500 edificios posibles y obtiene los datos siguientes.
"Media entrada" significa una entrada slo para entregas.
El ejemplo ser ms fcil de entender si lo copia en una hoja de clculo en blanco.
Cmo copio un ejemplo?


1
2
3
4
5
6
7
8
9
10
11
12
13

14

A B C D E
Superficie (x1) Oficinas
(x2)
Entradas
(x3)
Antigedad
(x4)
Valor tasado
(y)
2310 2 2 20 142.000
2333 2 2 12 144.000
2356 3 1,5 33 151.000
2379 3 2 43 150.000
2402 2 3 53 139.000
2425 4 2 23 169.000
2448 2 1,5 99 126.000
2471 2 2 34 142.900
2494 3 3 23 163.000
2517 4 4 55 169.000
2540 2 3 22 149.000
Frmula
=ESTIMACION.LINEAL(E2:E12;A2:D12;VERDADERO;VERDADERO)

IMPORTANTE La frmula del ejemplo debe especificarse como frmula de matriz. Despus de copiar el ejemplo en una hoja de
clculo en blanco, seleccione el rango A14:E18 a partir de la celda de frmula. Presione F2 y, a continuacin,
CTRL+MAYS+ENTRAR. Si la frmula no se especifica como frmula de matriz, el resultado nico es -234,2371645.
Cuando se especifica como una matriz, se devuelven las siguientes estadsticas de regresin. Utilice esta clave para identificar las
estadsticas deseadas.

Ahora puede obtenerse la ecuacin de regresin mltiple, y = m1*x1 + m2*x2 + m3*x3 + m4*x4 + b, utilizando los valores de la
fila 14:
y = 27,64*x1 + 12.530*x2 + 2.553*x3 - 234,24*x4 + 52.318
Ahora el programador puede calcular el valor tasado de un edificio de oficinas en la misma zona con 2.500 metros cuadrados,
tres oficinas, dos entradas y una antigedad de 25 aos, utilizando la ecuacin siguiente:
y = 27,64*2500 + 12530*3 + 2553*2-234,24*25 + 52318 = 158.261 $
O bien, puede copiar la tabla siguiente a la celda A21 de la hoja de clculo que cre para este ejemplo.
SUPERFICIE
(X1)
OFICINAS
(X2)
ENTRADAS
(X3)
ANTIGEDAD
(X4)
VALOR TASADO (Y)
2500 3 2 25 =D14*A22 + C14*B22 + B14*C22 +
A14*D22 + E14
Tambin puede utilizar la funcin TENDENCIA para calcular este valor.
Ejemplo 4
Usar las estadsticas F y r2
En el ejemplo anterior, el coeficiente de determinacin, o r2, es 0,99675 (vea la celda A17 en el resultado de
ESTIMACION.LINEAL), que indicara una relacin estrecha entre las variables independientes y el precio de venta. Puede utilizar
la estadstica F para determinar si estos resultados, con este valor r2 tan alto, se produjeron por azar.
Suponga por un momento que en realidad no existe relacin entre las variables, pero que ha extrado una muestra peculiar de
11 edificios de oficinas que hace que el anlisis estadstico demuestre una relacin marcada. El trmino "alfa" se utiliza para la
probabilidad de llegar a la conclusin errnea de que existe una relacin.
Los valores F y df del resultado de la funcin ESTIMACION.LINEAL se pueden utilizar para determinar la probabilidad de que se
produzca por azar un valor F ms elevado. F se puede comparar con los valores crticos de las tablas de distribucin F publicadas
o se puede utilizar la funcin DISTR.F de Excel para calcular la probabilidad de que se produzca por azar un valor F mayor. La
distribucin F apropiada tiene los grados de libertad v1 y v2. Si n es el nmero de puntos de datos y la constante = VERDADERO
o se omite, entonces v1 = n df 1 y v2 = df. (Si la constante = FALSO, entonces v1 = n df y v2 = df). La funcin DISTR.F ( con
la sintaxis DISTR.F(F,v1,v2) ) devolver la probabilidad de que se produzca por azar un valor F superior. En este ejemplo, df = 6
(celda B18) y F = 459,753674 (celda A18).
Suponiendo un valor alfa de 0,05, v1 = 11 6 1 = 4 y v2 = 6, el valor crtico de F es 4,53. Puesto que F = 459,753674 es mucho
ms elevado que 4,53, es extremadamente improbable que un valor F tan elevado se produzca por azar. (Con Alfa = 0,05, la
hiptesis de que no hay relacin entre conocido_y y conocido_x hay que rechazarla cuando F sobrepasa el nivel crtico, 4,53).
Puede usar la funcin DISTR.F de Excel para obtener la probabilidad de que un valor F tan elevado se produzca por azar. Por
ejemplo, DISTR.F(459,753674; 4; 6) = 1,37E-7, una probabilidad sumamente pequea. Se puede concluir, bien buscando el nivel
crtico de F en una tabla, bien utilizando la funcin DISTR.F, que la ecuacin de regresin es til para predecir el valor tasado de
los edificios de oficinas de esta rea. Recuerde que es vital utilizar los valores correctos de v1 y v2 calculados en el prrafo
anterior.
Ejemplo 5
Calcular la estadstica t
Otra prueba hipottica determinar si cada coeficiente de la pendiente es til para calcular el valor tasado de un edificio de
oficinas del ejemplo 3. Por ejemplo, para probar si el coeficiente de antigedad es significativo estadsticamente, divida -234,24
(coeficiente de la pendiente de antigedad) por 13,268 (el error estndar calculado de los coeficientes de antigedad en la celda
A15). El siguiente es el valor t observado:
t = m4 se4 = -234,24 13,268 = -17,7
Si el valor absoluto de t es suficientemente alto, puede deducirse que el coeficiente de la pendiente es til para calcular el valor
tasado del edificio de oficinas del ejemplo 3. La siguiente tabla muestra los valores absolutos de los 4 valores t observados.
Si consulta una tabla de un manual de estadstica, observar que el valor t crtico, de dos colas, con 6 grados de libertad y alfa =
0,05 es 2,447. Este valor crtico puede encontrarse tambin utilizando la funcin DISTR.T.INV de Excel. DISTR.T.INV(0,05;6) =
2,447. Puesto que el valor absoluto de t, 17,7, es superior a 2,447, la antigedad es una variable importante para calcular el valor
tasado de un edificio de oficinas. El significado estadstico de cada una de las dems variables independientes puede probarse
de forma similar. Los siguientes son los valores t observados para cada una de las variables independientes.
VARIABLE VALOR T OBSERVADO
Superficie 5,1
Nmero de oficinas 31,3
Nmero de entradas 4,8
Edad 17,7
Todos estos valores tienen un valor absoluto superior a 2,447; por tanto, todas las variables utilizadas en la ecuacin de
regresin son tiles para predecir el valor tasado de los edificios de oficinas de esta rea.

También podría gustarte