Está en la página 1de 11

ESTIMACION LINEAL (funcin ESTIMACION.

LINEAL)
Este artculo describe la sintaxis de la frmula y el uso de la funcin
ESTIMACION.LINEAL en Microsoft Excel. Encontrar vnculos con ms informacin
sobre cmo crear grficos y realizar un anlisis de regresin en la seccin Vea tambin.

Descripcin
La funcin ESTIMACION.LINEAL calcula las estadsticas de una lnea con el mtodo de
los "mnimos cuadrados" para calcular la lnea recta que mejor se ajuste a los datos y
despus devuelve una matriz que describe la lnea. Tambin puede combinar
ESTIMACION.LINEAL con otras funciones para calcular las estadsticas de otros tipos de
modelos que son lineales en los parmetros desconocidos, incluidas series polinmicas,
logartmicas, exponenciales y de potencias. Debido a que esta funcin devuelve una
matriz de valores, debe ser especificada como frmula de matriz. Encontrar las
instrucciones correspondientes tras los ejemplos de este artculo.

La ecuacin para la lnea es la siguiente:

y = mx + b

O bien

y = m1x1 + m2x2 + ... + b

si hay varios rangos de valores x, donde los valores y dependientes son funcin de los
valores x independientes. Los valores m son coeficientes que corresponden a cada valor
x, y b es un valor constante. Observe que y, x y m pueden ser vectores. La matriz que
devuelve la funcin ESTIMACION.LINEAL es {mn,mn-1,...,m1,b}. ESTIMACION.LINEAL
tambin puede devolver estadsticas de regresin adicionales.

Sintaxis
ESTIMACION.LINEAL(conocido_y, [conocido_x], [constante],
[estadstica])

La sintaxis de la funcin ESTIMACION.LINEAL tiene los siguientes argumentos:

Sintaxis
Conocido_y Obligatorio. Es el conjunto de valores y que se conocen en la
relacin y = mx+b.
Si el rango de conocido_y ocupa una sola columna, cada columna de
conocido_x se interpreta como una variable independiente.

Si el rango de conocido_y ocupa una sola fila, cada fila de conocido_x se


interpreta como una variable independiente.

Conocido_x Opcional. Es un conjunto de valores x que pueden conocerse en la


relacin y = mx+b.

El rango de conocido_x puede incluir uno o varios conjuntos de variables. Si


usa una sola variable, conocido_y y conocido_x pueden ser rangos con
cualquier forma, siempre y cuando sus dimensiones sean iguales. Si usa ms
de una variable, conocido_y tiene que ser un vector (es decir, un rango
compuesto por una fila o por una columna).

Si omite conocido_x, se supone que es la matriz {1,2,3,...} que tiene el mismo


tamao que conocido_y.

Constante Opcional. Es un valor lgico que especifica si se fuerza la constante


b para que sea igual a 0.

Si omite el argumento constante o es VERDADERO, b se calcula normalmente.

Si constante es FALSO, b se establece como igual a 0 y los valores m se


ajustan para adaptarse a y = mx.

Estadstica Opcional. Es un valor lgico que especifica si se deben devolver


estadsticas de regresin adicionales.

Si estadstica es VERDADERO, ESTIMACION.LINEAL devuelve las estadsticas


de regresin adicionales, de forma que la matriz devuelta es {mn,mn-
1,...,m1,b;sen,sen-1,...,se1,seb;r2,sey;F,df;ssreg,ssresid}.

Si omite estadstica o es FALSO, ESTIMACION.LINEAL solo devuelve los


coeficientes m y la constante b.

Las estadsticas de regresin adicional son las siguientes.

Estadstica Descripcin

se1,se2,...,sen Los valores de error estndar para los coeficientes m1,m2,...,mn.

seb El valor de error estndar para la constante b (seb = #N/A cuando constante es FALSO).
r2 El coeficiente de determinacin. Compara los valores y calculados y reales, y los rangos con valor de 0 a 1. Si es
1, hay una correlacin perfecta en la muestra, es decir, no hay diferencia entre el valor y calculado y el valor y
real. En el otro extremo, si el coeficiente de determinacin es 0, la ecuacin de regresin no es til para predecir
un valor y. Para obtener informacin sobre el clculo de r2, vea la seccin de "Observaciones" ms adelante en
este tema.

sey El error estndar para el clculo y.

F La estadstica F o valor F observado. Use la estadstica F para determinar si la relacin observada entre las
variables dependientes e independientes se produce por azar.

df Grados de libertad. Use los grados de libertad para encontrar valores F crticos en una tabla estadstica. Compare
los valores que encuentre en la tabla con la estadstica F devuelta por ESTIMACION.LINEAL para determinar un
nivel de confianza para el modelo. Para obtener informacin sobre el clculo de df, vea la seccin
"Observaciones" ms adelante en este tema. El ejemplo 4 muestra el uso de F y df.

ssreg La suma de regresin de los cuadrados.

ssresid La suma residual de los cuadrados. Para obtener informacin sobre el clculo de ssreg y ssresid, vea la seccin
"Observaciones" ms adelante en este tema.

La ilustracin siguiente muestra el orden en que se devuelven las estadsticas de


regresin adicionales.

Observaciones
Puede describir cualquier lnea recta con la pendiente y la interseccin y:

Pendiente (m):
Para hallar la pendiente de una lnea, frecuentemente indicada por m, tome dos puntos
de la lnea, (x1,y1) y (x2,y2); la pendiente es igual a (y2 - y1)/(x2 - x1).

Interseccin y (b):
La interseccin y de una lnea, frecuentemente indicada por b, es el valor de y en el
punto en que la lnea cruza el eje x.

La ecuacin de una lnea recta es y = mx + b. Si conoce los valores de m y b, puede


calcular cualquier punto de la lnea insertando el valor y o x en esa ecuacin. Tambin
puede usar la funcin TENDENCIA.
Si solo tiene una variable x independiente, puede obtener los valores de la
pendiente y de la interseccin y directamente con las frmulas siguientes:

Pendiente:
=INDICE(ESTIMACION.LINEAL(conocido_y,conocido_x),1)

Interseccin y:
=INDICE(ESTIMACION.LINEAL(conocido_y,conocido_x),2)

La exactitud de la lnea calculada por la funcin ESTIMACION.LINEAL depende


del grado de dispersin de los datos. Cuanto ms lineales sean los datos, ms
exacto ser el modelo de ESTIMACION.LINEAL. ESTIMACION.LINEAL usa el
mtodo de los mnimos cuadrados para determinar el mejor ajuste para los datos.
Si solo tiene una variable x independiente, los clculos para m y b se basan en las
frmulas siguientes:

Donde x e y son medias de muestras, es decir, x = PROMEDIO(conocido_x) e y =


PROMEDIO(conocido_y).

Las funciones de ajuste de lnea y de curva ESTIMACION.LINEAL y


ESTIMACION.LOGARITMICA pueden calcular la lnea recta o la curva
exponencial que mejor se ajuste a los datos. Sin embargo, debe decidir cul de
los dos resultados se ajusta mejor a sus datos. Puede calcular
TENDENCIA(conocido_y,conocido_x) para una lnea recta o
CRECIMIENTO(conocido_y,conocido_x) para una curva exponencial. Estas
funciones, sin el argumento nueva_matriz_x, devuelven una matriz de valores y
pronosticados en la lnea o curva en los puntos de datos reales. Despus, puede
comparar los valores pronosticados con los valores reales. Puede crear un grfico
con ambos para realizar una comparacin visual.

En el anlisis de regresin, Excel calcula para cada punto la diferencia al cuadrado


entre el valor y calculado para ese punto y su valor y real. La suma de estas
diferencias al cuadrado se denomina suma de los cuadrados residual, ssresid.
Excel calcula a continuacin la suma total de los cuadrados, sstotal. Si omite el
argumento constante o es VERDADERO, la suma total de los cuadrados es la
suma de las diferencias al cuadrado entre los valores y reales y la media de los
mismos. Cuando el argumento constante = FALSO, la suma total de los
cuadrados es la suma de los cuadrados de los valores y reales (sin restar el valor y
medio de cada valor y individual). Puede hallar la suma de regresin de los
cuadrados, ssreg, a partir de ssreg = sstotal - ssresid. Cuanto menor sea la suma
residual de los cuadrados, en comparacin con la suma total de los cuadrados,
mayor ser el valor del coeficiente de determinacin, r2, que es un indicador de
hasta qu punto la ecuacin resultante del anlisis de regresin explica la relacin
entre las variables. El valor de r2 es igual a ssreg/sstotal.

En algunos casos, una o varias de las columnas x (supongamos que y y x estn en


columnas) pueden no tener valor predictivo adicional en presencia de las otras
columnas x. En otras palabras, eliminar una o varias columnas x puede producir
valores y pronosticados que son igualmente exactos. En ese caso, estas columnas
x redundantes deberan omitirse del modelo de regresin. Este fenmeno se
denomina colinealidad porque cualquier columna x redundante se puede
expresar como una suma de mltiplos de las columnas x no redundantes.
ESTIMACION.LINEAL comprueba la colinealidad y quita cualquier columna x
redundante del modelo de regresin cuando las identifica. Puede reconocer las
columnas x eliminadas en el resultado de ESTIMACION.LINEAL como aquellas
con coeficientes 0 as como con valores de 0. Si quita una o varias columnas por
redundantes, entonces df se ve afectado porque df depende del nmero de
columnas x usadas con fines predictivos. Para ms informacin sobre el clculo
de df, vea el ejemplo 4. Si modifica df modifica porque ha quitado las columnas x
redundantes, los valores de sey y F tambin se vern afectados. La colinealidad
debera ser relativamente inslita en la prctica. No obstante, un caso en el que
es ms probable que se produzca es cuando algunas columnas x contienen solo
valores 0 y 1 como indicadores de si un sujeto de un experimento pertenece o no
a un grupo en concreto. Si omite constante o es VERDADERO,
ESTIMACION.LINEAL inserta una columna x adicional de todo unos (1) para dar
forma a la interseccin. Si tiene una columna con un 1 para cada sujeto que sea
varn, o 0 si no lo es, y tiene tambin una columna con un 1 para cada sujeto que
sea mujer, o 0 si no lo es, esta ltima columna es redundante porque puede
obtener las entradas de la misma de restar la entrada de la columna "indicador de
varn" de la entrada de la columna adicional de todo unos (1) agregada por
ESTIMACION.LINEAL.

Calcule el valor de df como sigue, no se quite ninguna columna x del modelo


debido a la colinealidad: si hay k columnas de conocido_x y omite constante o es
VERDADERO, entonces df = n k 1. Si constante = FALSO, entonces df = n - k.
En ambos casos, cada columna x quitada debido a la colinealidad aumenta df en
1.

Las frmulas que devuelven matrices deben especificarse como frmulas de


matriz.

NOTA En Excel Web App no puede crear frmulas de matriz.

Cuando especifique como argumento una constante de matriz (como


conocido_x), use comas para separar los valores contenidos en una misma fila y
puntos y comas para separar las filas. Los caracteres separadores pueden ser
diferentes segn la configuracin regional.

Observe que los valores y pronosticados por la ecuacin de regresin pueden no


ser vlidos si quedan fuera del rango de los valores y empleados para determinar
la ecuacin.

El algoritmo subyacente usado en la funcin ESTIMACION.LINEAL es diferente


del algoritmo subyacente usado en las funciones PENDIENTE e
INTERSECCION.EJE. La diferencia entre estos algoritmos puede producir
resultados distintos cuando los datos son indeterminados y colineales. Por
ejemplo, si los puntos de datos del argumento conocido_y son 0 y los puntos de
datos del argumento conocido_x son 1:

ESTIMACION.LINEAL devuelve un valor 0. El algoritmo de la funcin


ESTIMACION.LINEAL est diseado para devolver resultados razonables para
los datos colineales y, en este caso, se puede encontrar al menos una
respuesta.

PENDIENTE e INTERSECCION.EJE devuelven un error #DIV/0!. El algoritmo


de PENDIENTE e INTERSECCION.EJE est diseado para buscar solo una
respuesta y en este caso puede haber varias.

Adems de usar ESTIMACION.LOGARITMICA para calcular estadsticas para


otros tipos de regresin, puede usar ESTIMACION.LINEAL para calcular un
rango de tipos de regresin diferentes escribiendo funciones de las variables x e y
como series x e y para ESTIMACION.LINEAL. Por ejemplo, la frmula siguiente:

=ESTIMACION.LINEAL(valores y, valores x^COLUMNA($A:$C))

funciona si se dispone de una nica columna de valores y y una nica columna de


valores x para calcular la aproximacin cbica (polinmica de orden 3) de esta forma:
y = m1*x + m2*x^2 + m3*x^3 + b

Puede ajustar esta frmula para calcular otros tipos de regresin, pero en algunos casos,
es necesario ajustar los valores de salida y otras estadsticas.

El valor de la prueba F que devuelve la funcin ESTIMACION.LINEAL y el que


devuelve la funcin PRUEBA.F son diferentes. ESTIMACION.LINEAL devuelve la
estadstica F, mientras que PRUEBA.F devuelve la probabilidad.

Ejemplos

EJEMPLO 1: PENDIENTE E INTERSECCIN CON EJE Y

Copie los datos del ejemplo en la siguiente tabla y pguelos en la celda A1 de una nueva
hoja de clculo de Excel. Para las frmulas que muestren resultados, seleccinelas,
presione F2 y, a continuacin, presione Entrar. Si lo necesita, puede ajustar los anchos de
la columna para ver todos los datos.

Y conocido X conocido

1 0

9 4

5 2

7 3

Resultado (pendiente) Resultado (interseccin y)

2 1

Frmula (frmula de matriz en celdas A7:B7)

=ESTIMACION.LINEAL(A2:A5;B2:B5;;FALSO)

EJEMPLO 2: REGRESIN LINEAL SIMPLE

Copie los datos del ejemplo en la siguiente tabla y pguelos en la celda A1 de una nueva
hoja de clculo de Excel. Para las frmulas que muestren resultados, seleccinelas,
presione F2 y, a continuacin, presione Entrar. Si lo necesita, puede ajustar los anchos de
la columna para ver todos los datos.

Mes Ventas

1 3100 $

2 4500 $

3 4400 $

4 5400 $

5 7500 $

6 8100 $

Frmula Resultado

=SUMA(ESTIMACION.LINEAL(B1:B6, 11000 $
A1:A6)*{9,1})

Calcula la estimacin de las ventas en el noveno mes, basndose en las ventas


de los meses 2 al 6.

EJEMPLO 3: REGRESIN LINEAL MLTIPLE

Copie los datos del ejemplo en la siguiente tabla y pguelos en la celda A1 de una nueva
hoja de clculo de Excel. Para las frmulas que muestren resultados, seleccinelas,
presione F2 y, a continuacin, presione Entrar. Si lo necesita, puede ajustar los anchos de
la columna para ver todos los datos.

Oficinas Entradas Antigedad Valor


Superficie (x1) (x2) (x3) (x4) tasado (y)

2310 2 2 20 142000 $

2333 2 2 12 144000 $

2356 3 1,5 33 151000 $

2379 3 2 43 150000 $
2402 2 3 53 139000 $

2425 4 2 23 169 000 $

2448 2 1,5 99 126 000 $

2471 2 2 34 142 900 $

2494 3 3 23 163 000 $

2517 4 4 55 169 000 $

2540 2 3 22 149 000 $

-234,2371645

13,26801148

0,996747993

459,7536742

1732393319

Frmula (frmula de matriz especificada en A14:A18)

=ESTIMACION.LINEAL(E2:E12;A2:D12;VERDADERO;VERDADERO)

EJEMPLO 4: USAR LAS ESTADSTICAS F Y R2

En el ejemplo anterior, el coeficiente de determinacin, o r2, es 0,99675 (vea la celda A17


en el resultado de ESTIMACION.LINEAL), que indicara una relacin estrecha entre las
variables independientes y el precio de venta. Puede usar la estadstica F para determinar
si estos resultados, con este valor r2 tan alto, se produjeron por azar.

Suponga por un momento que en realidad no existe relacin entre las variables, pero
que ha extrado una muestra peculiar de 11 edificios de oficinas que hace que el anlisis
estadstico demuestre una relacin marcada. El trmino "alfa" se usa para la probabilidad
de llegar a la conclusin errnea de que existe una relacin.

Los valores F y df del resultado de la funcin ESTIMACION.LINEAL se pueden usar para


determinar la probabilidad de que se produzca por azar un valor F ms elevado. F se
puede comparar con los valores crticos de las tablas de distribucin F publicadas o se
puede usar la funcin DISTR.F de Excel para calcular la probabilidad de que se produzca
por azar un valor F mayor. La distribucin F apropiada tiene los grados de libertad v1 y
v2. Si n es el nmero de puntos de datos y omite la constante o es VERDADERO,
entonces v1 = n df 1 y v2 = df. Si la constante = FALSO, entonces v1 = n df y v2 =
df. La funcin DISTR.F ( con la sintaxis DISTR.F(F,v1,v2) ) devolver la probabilidad de
que se produzca por azar un valor F superior. En este ejemplo, df = 6 (celda B18) y F =
459,753674 (celda A18).

Suponiendo un valor alfa de 0,05, v1 = 11 6 1 = 4 y v2 = 6, el valor crtico de F es


4,53. Puesto que F = 459,753674 es mucho ms elevado que 4,53, es extremadamente
improbable que un valor F tan elevado se produzca por azar. (Con Alfa = 0,05, la
hiptesis de que no hay relacin entre conocido_y y conocido_x hay que rechazarla
cuando F sobrepasa el nivel crtico, 4,53). Puede usar la funcin DISTR.F de Excel para
obtener la probabilidad de que un valor F tan elevado se produzca por azar. Por ejemplo,
DISTR.F(459,753674; 4; 6) = 1,37E-7, una probabilidad sumamente pequea. Se puede
concluir, bien buscando el nivel crtico de F en una tabla, bien con la funcin DISTR.F,
que la ecuacin de regresin es til para predecir el valor tasado de los edificios de
oficinas de esta rea. Recuerde que es vital usar los valores correctos de v1 y v2
calculados en el prrafo anterior.

EJEMPLO 5: CALCULAR LA ESTADSTICA T

Otra prueba hipottica determinar si cada coeficiente de la pendiente es til para


calcular el valor tasado de un edificio de oficinas del ejemplo 3. Por ejemplo, para probar
si el coeficiente de antigedad es significativo estadsticamente, divida -234,24
(coeficiente de la pendiente de antigedad) por 13,268 (el error estndar calculado de
los coeficientes de antigedad en la celda A15). El siguiente es el valor t observado:

t = m4 se4 = -234,24 13,268 = -17,7

Si el valor absoluto de t es suficientemente alto, puede deducirse que el coeficiente de la


pendiente es til para calcular el valor tasado del edificio de oficinas del ejemplo 3. La
siguiente tabla muestra los valores absolutos de los 4 valores t observados.
Si consulta una tabla de un manual de estadstica, observar que el valor t crtico, de dos
colas, con 6 grados de libertad y alfa = 0,05 es 2,447. Este valor crtico puede encontrarse
tambin con la funcin DISTR.T.INV de Excel. DISTR.T.INV(0,05,6) = 2,447. Puesto que
el valor absoluto de t, 17,7, es superior a 2,447, la antigedad es una variable importante
para calcular el valor tasado de un edificio de oficinas. El significado estadstico de cada
una de las dems variables independientes puede probarse de forma similar. Los
siguientes son los valores t observados para cada una de las variables independientes.

Variable valor t observado

Superficie 5,1

Nmero de oficinas 31,3

Nmero de entradas 4,8

Edad 17,7

Todos estos valores tienen un valor absoluto superior a 2,447; por tanto, todas las
variables usadas en la ecuacin de regresin son tiles para predecir el valor tasado de
los edificios de oficinas de esta rea.

También podría gustarte