Está en la página 1de 31

Regresin lineal

Abordaremos en esta pgina las distribuciones bidimensionales. Las observaciones se dispondrn en dos columnas, de modo que en cada fila figuren la abscisa x y su correspondiente ordenada y. La importancia de las distribuciones bidimensionales radica en investigar como influye una variable sobre la otra. Esta puede ser una dependencia causa efecto, por ejemplo, la cantidad de lluvia (causa), da lugar a un aumento de la produccin agrcola (efecto). O bien, el aumento del precio de un bien, da lugar a una disminucin de la cantidad demandada del mismo. Si utilizamos un sistema de coordenadas cartesianas para representar la distribucin bidimensional, obtendremos un conjunto de puntos conocido con el diagrama de dispersin, cuyo anlisis permite estudiar cualitativamente, la relacin entre ambas variables tal como se ve en la figura. El siguiente paso, es la determinacin de la dependencia funcional entre las dos variables x e y que mejor ajusta a la distribucin bidimensional. Se denomina regresin lineal cuando la funcin es lineal, es decir, requiere la determinacin de dos parmetros: la pendiente y la ordenada en el origen de la recta de regresin, y=ax+b. La regresin nos permite adems, determinar el grado de dependencia de las series de valores X e Y, prediciendo el valor y estimado que se obtendra para un valor x que no est en la distribucin.

Vamos a determinar la ecuacin de la recta que mejor ajusta a los datos representados en la figura. Se denomina error ei a la diferencia yi-y, entre el valor observado yi, y el valor ajustado y= axi+b, tal como se ve en la figura inferior. El criterio de ajuste se toma como aqul en el que la desviacin cuadrtica media sea mnima, es decir, debe de ser mnima la suma

El extremos de una funcin: mximo o mnimo se obtiene cuando las derivadas de s respecto de a y de b sean nulas. Lo que da lugar a un sistema de dos ecuaciones con dos incgnitas del que se despeja a y b.

El coeficiente de correlacin es otra tcnica de estudiar la distribucin bidimensional, que nos indica la intensidad o grado de dependencia entre las variables X e Y. El coeficiente de correlacin r es un nmero que se obtiene mediante la frmula.

El numerador es el producto de las desviaciones de los valores X e Y respecto de sus valores medios. En el denominador tenemos las desviaciones cuadrticas medias de X y de Y. El coeficiente de correlacin puede valer cualquier nmero comprendido entre -1 y +1. Cuando r=1, la correlacin lineal es perfecta, directa. Cuando r=-1, la correlacin lineal es perfecta, inversa Cuando r=0, no existe correlacin alguna, independencia total de los valores XeY

Variantes de la regresin lineal

La funcin potencial

y=cxa Se puede trasformar en

Si usamos las nuevas variables X=log x e Y=log y, obtenemos la relacin lineal Y=aX+b. Donde b=log c Ejemplo:
x y 10 1.06 20 1.33 30 1.52 40 1.68 50 1.81 60 1.91 70 2.01 80 2.11

Usar la calculadora para transformar esta tabla de datos en esta otra


X=log x Y=log y 1.0 1.30 1.477 1.60 1.699 1.778 1.845 1.903

0.025 0.124 0.182 0.225 0.258 0.281 0.303 0.324

Calcular mediante el programa regresin lineal los parmetros a y c.

Funcin exponencial

y=ceax Tomando logaritmos neperianos en los dos miembros resulta ln y=ax+ln c Si ponemos ahora X=x, e Y=ln y, obtenemos la relacin lineal Y=aX+b Donde b=ln c.

Ejemplo:
x y 12 930 41 815 93 632 147 487 204 370 264 265 373 147 509 76 773 17

Usar la calculadora para transformar esta tabla de datos en esta otra


X= x Y=ln y 12 6.835 41 6.703 93 6.449 147 6.188 204 5.913 264 5.580 373 4.990 509 4.330 773 2.833

Calcular mediante el programa regresin lineal los parmetros a y c.

La clase Regresion
La clase Regresion que describe la regresin lineal no difiere substancialmente de la clase Estadistica que se ha descrito en la seccin anterior. La diferencia estriba en que los miembros datos son dos arrays x e y que guardan las series de valores X e Y, cuya dependencia funcional deseamos determinar. En los miembros dato pblicos a y b se guarda la pendiente de la recta de regresin y la ordenda en el origen. La funcin miembro lineal, calcula la pendiente a, y ordenada en el origen b de la recta de regresin. Se hace uso de variables auxiliares para guardar resultados intermedios: sx guarda la suma de todas las abscisas, sy la suma de todas las ordenadas, sx2 la suma de los cuadrados de las abscisas, sy2 la suma de las cuadrados de las ordenadas, y pxy, la suma de los productos de cada abscisa por su ordenada. Los valores calculados a partir de las frmulas respectivas, se guardan en los miembros pblicos a y b de la clase Regresion. Para obtener el coeficiente de correlacin hemos de calcular primero el valor medio <x> de la serie de datos X, y el valor medio <y> de Y. No calculamos las desviaciones cuadrticas medias sino que empleamos una expresin equivalente a la dada anteriormente para el coeficiente de correlacin.
public class Regresion { private double[] x; private double[] y; private int n; //nmero de datos public double a, b; //pendiente y ordenada en el origen public Regresion(double[] x, double[] y) { this.x=x; this.y=y; n=x.length; //nmero de datos

} public void lineal(){ double pxy, sx, sy, sx2, sy2; pxy=sx=sy=sx2=sy2=0.0; for(int i=0; i<n; i++){ sx+=x[i]; sy+=y[i]; sx2+=x[i]*x[i]; sy2+=y[i]*y[i]; pxy+=x[i]*y[i]; } a=(n*pxy-sx*sy)/(n*sx2-sx*sx); b=(sy-b*sx)/n; } public double correlacion(){ //valores medios double suma=0.0; for(int i=0; i<n; i++){ suma+=x[i]; } double mediaX=suma/n; suma=0.0; for(int i=0; i<n; i++){ suma+=y[i]; } double mediaY=suma/n; //coeficiente de correlacin double pxy, sx2, sy2; pxy=sx2=sy2=0.0; for(int i=0; i<n; i++){ pxy+=(x[i]-mediaX)*(y[i]-mediaY); sx2+=(x[i]-mediaX)*(x[i]-mediaX); sy2+=(y[i]-mediaY)*(y[i]-mediaY); } return pxy/Math.sqrt(sx2*sy2); } }

Uso de la clase Regresion


Una fbrica de bebidas refrescantes observa que sus temperaturas (x) y las ventas (y) de la calle han sido.
x 5 y 9 7 10 12 16 20 23 27 19 14 9 6 11 15 16 20 24 27 29 22 20 14 9

Los datos los guardamos en dos arrays denominados temperatura y ventas


double[] temperatura={5, 7, 10, 12, 16, 20, 23, 27, 19, 14, 9, 6}; double[] ventas={9, 11, 15, 16, 20, 24, 27, 29, 22, 20, 14, 9};

Creamos un objeto regresion de la clase Regresion, pasndole al constructor los dos arrays..
Regresion regresion=new Regresion(temperatura, ventas);

Se llama desde el objeto regresion a su funcin miembro lineal, para calcular los coeficentes a y b.
regresion.lineal(); System.out.println("Pendiente "+regresion.a); System.out.println("Ordenada en el origen "+regresion.b);

Se llama tambin, a la funcin miembro correlacion, la cual devuelve el coeficiente de correlacin


System.out.println("Indice de correlacin "+regresion.correlacion());

Regresin lineal

Ejemplo de una regresin lineal con una variable dependiente y unavariable independiente.

En estadstica la regresin lineal o ajuste lineal es un mtodo matemtico que modeliza la relacin entre una variable dependienteY, las variables independientes Xi y un trmino aleatorio . Este modelo puede ser expresado como:

donde 0 es la interseccin o trmino "constante", las

son los parmetros respectivos

a cada variable independiente, y pes el nmero de parmetros independientes a tener en cuenta en la regresin. La regresin lineal puede ser contrastada con laregresin no lineal.
Contenido
[ocultar]

1 Historia

1.1 Etimologa

2 El modelo de regresin lineal 3 Supuestos del modelo de regresin lineal 4 Tipos de modelos de regresin lineal

4.1 Regresin lineal simple

4.1.1 Anlisis

4.2 Regresin lineal mltiple

5 Rectas de regresin 6 Aplicaciones de la regresin lineal

o o

6.1 Lneas de tendencia 6.2 Medicina

7 Vase tambin 8 Referencias 9 Bibliografa 10 Enlaces externos

[editar]Historia
La primera forma de regresiones lineales documentada fue el mtodo de los mnimos cuadrados, el cual fue publicado por Legendre en 1805,1 y en dnde se inclua una versin del teorema de GaussMrkov.

[editar]Etimologa
El trmino regresin se utiliz por primera vez en el estudio de variables antropomtricas: al comparar la estatura de padres e hijos, result que los hijos cuyos padres tenan una estatura muy superior al valor medio tendan a igualarse a ste, mientras que aquellos cuyos padres eran muy bajos tendan a reducir su diferencia respecto a la estatura media; es decir, "regresaban" al promedio.2 La constatacin emprica de esta propiedad se vio reforzada ms tarde con la justificacin terica de ese fenmeno. El trmino lineal se emplea para distinguirlo del resto de tcnicas de regresin, que emplean modelos basados en cualquier clase de funcin matemtica. Los modelos lineales son una

explicacin simplificada de la realidad, mucho ms gil y con un soporte terico por parte de la matemtica y la estadstica mucho ms extenso. Pero bien, como se ha dicho, podemos usar el trmino lineal para distinguir modelos basados en cualquier clase de aplicacin.

[editar]El

modelo de regresin lineal

El modelo lineal relaciona la variable dependiente Y con K variables explicativas Xk (k = 1,...K), o cualquier transformacin de stas, que generan un hiperplano de parmetros k desconocidos: (2) donde es la perturbacin aleatoria que recoge todos aquellos factores de la realidad no

controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo su carcterestocstico. En el caso ms sencillo, con una sola variable explicativa, el hiperplano es una recta: (3)Y = 1 + 2X2 + El problema de la regresin consiste en elegir unos valores determinados para los parmetros desconocidos k, de modo que la ecuacin quede completamente especificada. Para ello se necesita un conjunto de observaciones. En una observacin cualquiera i-sima (i= 1,... I) se registra el comportamiento simultneo de la variable dependiente y las variables explicativas (las perturbacionesaleatorias se suponen no observables). (4) Los valores escogidos como estimadores de los parmetros, , son los coeficientes de regresin,

sin que se pueda garantizar que coinciden con parmetros reales del proceso generador. Por tanto, en (5) Los valores son por su parte estimaciones de la perturbacin aleatoria o errores.

[editar]Supuestos

del modelo de regresin lineal

Para poder crear un modelo de regresin lineal, es necesario que se cumpla con los siguientes supuestos:3 1. La relacin entre las variables es lineal. 2. Los errores en la medicin de las variables explicativas son independientes entre s. 3. Los errores tienen varianza constante. (Homocedasticidad) 4. Los errores tienen una esperanza matemtica igual a cero (los errores de una misma magnitud y distinto signo son equiprobables).

5. El error total es la suma de todos los errores.

[editar]Tipos

de modelos de regresin lineal

Existen diferentes tipos de regresin lineal que se clasifican de acuerdo a sus parmetros:

[editar]Regresin

lineal simple

Slo se maneja una variable independiente, por lo que slo cuenta con dos parmetros. Son de la forma:4 (6)Yi = 0 + 1Xi + i donde i es el error asociado a la medicin del valor Xi y siguen los supuestos de modo que iN(0,2) (media cero, varianza constante e igual a un y con ).

[editar]Anlisis
Dado el modelo de regresin simple, si se calcula la esperanza (valor esperado) del valor Y, se obtiene:5 (7)

Derivando respecto a

e igualando a cero, se obtiene:5

(9)

(10) Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente solucin para ambos parmetros:4

(11)

(12) La interpretacin del parmetro 1 es que un incremento en Xi de una unidad, Yi incrementar en 1

[editar]Regresin

lineal mltiple

La regresion lineal nos permite trabajar con una variable a nivel de intervalo o razn, as tambin se puede comprender la relacin de dos o ms variables y nos permitir relacionar mediante ecuaciones, una variable en relacin a otras variables llamndose Regresin mltiple. Constantemente en la prctica de la investigacin estadstica, se encuentran variables que de

alguna manera estn relacionados entre si, por lo que es posible que una de las variables puedan relacionarse matemticamente en funcin de otra u otras variables. Maneja varias variables independientes. Cuenta con varios parmetros. Se expresan de la forma:6 (13) donde i es el error asociado a la medicin i del valor Xip y siguen los supuestos de modo que iN(0,2) (media cero, varianza constante e igual a un y con ).

[editar]Rectas

de regresin

Las rectas de regresin son las rectas que mejor se ajustan a la nube de puntos (o tambin llamado diagrama de dispersin) generada por una distribucin binomial. Matemticamente, son posibles dos rectas de mximo ajuste:7

La recta de regresin de Y sobre X:

(14)

La recta de regresin de X sobre Y:

(15) La correlacin ("r") de las rectas determinar la calidad del ajuste. Si r es cercano o igual a 1, el ajuste ser bueno y las predicciones realizadas a partir del modelo obtenido sern muy fiables (el modelo obtenido resulta verdaderamente representativo); si r es cercano o igual a 0, se tratar de un ajuste malo en el que las predicciones que se realicen a partir del modelo obtenido no sern fiables (el modelo obtenido no resulta representativo de la realidad). Ambas rectas de regresin se intersecan en un punto llamado centro de gravedad de la distribucin.

[editar]Aplicaciones [editar]Lneas

de la regresin lineal

de tendencia

Vase tambin: Tendencia

Una lnea de tendencia representa una tendencia en una serie de datos obtenidos a travs de un largo perodo. Este tipo de lneas puede decirnos si un conjunto de datos en particular (como por ejemplo, el PBI, el precio del petrleo o el valor de las acciones) han aumentado o decrementado en un determinado perodo.8 Se puede dibujar una lnea de tendencia a simple vista fcilmente a partir de un grupo de puntos, pero su posicin y pendiente se calcula de manera ms precisa utilizando tcnicas estadsticas como las regresiones lineales. Las lneas de tendencia son generalmente lneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la lnea.

[editar]Medicina
En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco9 vinieron de estudios que utilizaban la regresin lineal. Los investigadores incluyen una gran cantidad de variables en su anlisis de regresin en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias. En el caso del tabaquismo, los investigadores incluyeron el estado socio-econmico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educacin o posicin econmica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresin.10 11 En el ejemplo del tabaquismo, un hipottico gen podra aumentar la mortalidad y aumentar la propensin a adquirir enfermedades relacionadas con el consumo de tabaco. Por esta razn, en la actualidad las pruebas controladas aleatorias son consideradas mucho ms confiables que los anlisis de regresin.

Regresin Polinomial
Tambin se obtienen grupos de datos que se ajustan a un comportamiento polinomial de la forma y = ao + a1 x + a2 x2 + a3 x3 + ... En estos casos se usa polyfit(x,y,n) con n > 1. Ejemplos de aplicacin Calor especfico del agua El grfico que resulta de los valores experimentales del calor especfico del agua como una funcin de la temperatura, muestra que los datos no se ajustan a una lnea recta. El programa del listado 2 determina la mejor ecuacin de ajuste al ensayar un polinomio de grado cuatro. Para la solucin de este ejemplo se consideran dos posibilidades de ajuste: el lineal (n = 1) y el polinomial (n = 4). El ajuste lineal (ecuacin 1)se incluye para demostrar que no es correcto en este caso. Cp = ao + boT (1) Cp = a + bT + cT2 + dT3 + eT4 (2) T (K) 273 Cp cal/(g K) 1.00738

283 293 303 313 323 333 343 353 363 373

1.00129 0.99883 0.99802 0.99804 0.99854 0.99943 1.00067 1.00229 1.00437 1.00697

Tabla 2. Calor especfico del agua

En el listado 2 aparece la estructura del programa. Se usa polyfit(x,y,n) con n = 4 para el ajuste polinomial. Listado 2 regpolinom.m % Regresin polinomial clear clc % Datos experimentales Cp=[1.00738,1.00129,0.99883,0.99802,0.99804,0.99854,0.99943,1.00067,... 1.00229,1.00437,1.00697]; T=[273,283,293,303,313,323,333,343,353,363,373]; % Clculo de los parmetros de regresin lineal (no es el ajuste correcto) p1=polyfit(T,Cp,1); r2=corrcoef(T,Cp); Cp1=polyval(p1,T); ao=p1(2); bo=p1(1); fprintf('ao =%5.3e\n',ao); fprintf('bo =%5.3e\n',bo); fprintf('r2 =%5.4f\n\n',r2(2,1)); % Clculo de los parmetros de regresin polinomial con n = 4 p2=polyfit(T,Cp,4); a=p2(5); b=p2(4); c=p2(3); d=p2(2); e=p2(1); fprintf('a =%5.3e\n',a); fprintf('b =%5.3e\n',b); fprintf('c =%5.3e\n',c); fprintf('c =%5.3e\n',d); fprintf('d =%5.3e\n\n',e); % Clculo de los nuevos valores de Cp segn la funcin de ajuste T1=linspace(273,373,100); Cp2=polyval(p2,T1); % Tabla de resultados fprintf(' T, K Cp, cal/mol K\n\n'); for i=1:10:length(T1) fprintf('%5.0f',T1(i)); fprintf('%15.5f\n',Cp2(i)); end

% Grfico de los datos experimentales, de la recta y de la funcin de ajuste plot(T,Cp,'*',T,Cp1,T1,Cp2); title('Capacidad calrica del agua') xlabel('T, K'); ylabel('Cp, cal/mol K'); Al correr el programa: ao =9.934e-001 bo =2.485e-005 r2 =0.2397 % Este valor indica que el ajuste no es lineal a =1.117e+001 b =-1.216e-001 c =5.446e-004 c =-1.085e-006 d =8.115e-010 T, K Cp, cal/mol K 273 283 293 303 313 324 334 344 354 364 EDU 1.00722 1.00161 0.99877 0.99778 0.99791 0.99865 0.99968 1.00088 1.00235 1.00438

La representacin grfica de Cp versus T se muestra en la figura 2. Ntese que la regresin lineal no se ajusta a los datos experimentales.

Figura 2. Valores de Cp versus T para las ecuaciones de ajuste 1 y 2

La interpolacin lineal es un caso particular de la Interpolacin general de Newton. Con el polinomio de interpolacin de Newton se logra aproximar un valor de la funcin f(x) en un valor desconocido de x. El caso particular, para que una interpolacin sea lineal es en el que se utiliza un polinomio de interpolacin de grado 1, y se denota de la siguiente manera:

[editar]Interpolacin

lineal de una variable independiente.

Es igual que hacer integrales cerradas. En una tabla se representan algunos valores de la funcin, pero no todos, en ocasiones nos interesa el valor de la funcin para un valor de la variable independiente distinto de los que figuran en la tabla, en este caso podemos tomar el ms prximo al buscado, o aproximarnos un poco ms por interpolacin, la interpolacin casi siempre nos dar un pequeo error respecto al valor de la funcin verdadero, pero siempre ser menor que tomar el valor ms prximo de los que figuran en la tabla, veamos como se calcula al valor de la funcin para un valor de la variable independiente que se encuentre entre dos valores de la tabla por interpolacin lineal.

Por la tabla sabemos que:

Queremos, pues, saber:

Siendo:

La interpolacin lineal consiste en trazar una recta que pasa por (x1,y1) y (x2,y2), y = r(x) y calcular los valores intermedios segn esta recta en lugar de la funcin y = f(x) Para ello nos basamos en la semejanza de tringulos esto es: y

despejando, tenemos:

o lo que es lo mismo:

El valor buscado es:

esto es:

Interpolacin
Para otros usos de este trmino, vase Interpolacin (desambiguacin). En el subcampo matemtico del anlisis numrico, se denomina interpolacin a la obtencin de nuevos puntos partiendo del conocimiento de un conjunto discreto de puntos. En ingeniera y algunas ciencias es frecuente disponer de un cierto nmero de puntos obtenidos por muestreo o a partir de un experimento y pretender construir una funcin que los ajuste. Otro problema estrechamente ligado con el de la interpolacin es la aproximacin de una funcin complicada por una ms simple. Si tenemos una funcin cuyo clculo resulta costoso, podemos partir de un cierto nmero de sus valores e interpolar dichos datos construyendo una funcin ms simple. En general, por supuesto, no obtendremos los mismos valores evaluando la funcin obtenida que si evalusemos la funcin original, si bien dependiendo de las caractersticas del problema y del mtodo de interpolacin usado la ganancia en eficiencia puede compensar el error cometido. En todo caso, se trata de, a partir de n parejas de puntos (xk,yk), obtener una funcin f que verifique

a la que se denomina funcin interpolante de dichos puntos. A los puntos xk se les llama nodos. Algunas formas de interpolacin que se utilizan con frecuencia son la interpolacin lineal, lainterpolacin polinmica (de la cual la anterior es un caso particular), la interpolacin por medio de spline o la interpolacin polinmica de Hermite.

[editar]Interpolacin

Lineal

La lnea azul representa la interpolacin lineal entre los puntos rojos. Artculo principal: Interpolacin lineal

Uno de los mtodos de interpolacin ms sencillos es el lineal.

[editar]
En general, en la interpolacin lineal se utilizan dos puntos, (xa,ya) y (xb,yb), para obtener un tercer punto interpolado (x,y) a partir de la siguiente frmula:

La interpolacin lineal es rpida y sencilla, pero no muy precisa.

) INTERPOLACIN INTRODUCCIN En numerosos fenmenos de la naturaleza observamos una cierta regularidad en la forma de producirse, esto nos permite sacar conclusiones de la marcha de un fenmeno en situaciones que no hemos medido directamente. La interpolacin consiste en hallar un dato dentro de un intervalo en el que conocemos los valores en los extremos. La extrapolacin consiste en hallar un dato fuera del intervalo conocido, pero debe tenerse en cuenta que est prximo a uno de sus extremos, pues en otro caso no es muy fiable el resultado obtenido. 1. Planteamiento general El problema general de la interpolacin se nos presenta cuando nos dan una funcin de la cual solo conocemos una serie de puntos de la misma: (xo, yo), (x1, y1),........., (xn, yn) y se pide hallar el valor de un punto x (intermedio de x0 y xn) de esta funcin. El de la extrapolacin cuando el punto que queremos considerar est a la derecha de xn o a la izquierda de xo. Se desea, por tanto encontrar una funcin cuya grfica pase por esos puntos y que nos sirva para estimar los valores deseados. El tratamiento para ambos problemas es similar se utilizarn los polinomios interpoladores, pero en el caso de la extrapolacin el punto debe estar muy prximo a uno de los extremos. 2. Interpolacin. Eleccin de la interpolacin ms adecuada. Consideremos una funcin de la cual solo conocemos una serie de puntos de la misma: (xo, yo), (x1, y1), .............., (xn, yn) [1]

Deseamos encontrar la expresin analtica de dicha funcin para poder estudiarla en otros puntos.
Ahora bien, por n+1 puntos pasan infinitas funciones, con cul de ellas nos quedamos? Lo ms lgico es recurrir a la ms sencilla. La familia de funciones ms sencillas es la de los polinomios, por tanto buscaremos el polinomio de menor grado que pase por los n+1 puntos dados.

La funcin polinmica de menor grado que pasa por los puntos [1] es en principio de grado n: y= anxn+............+a1x+ao Y se obtiene resolviendo el sistema de n+1 ecuaciones con n+1 incgnitas (sistema que tiene solucin nica ya que el determinante de la matriz de los coeficientes es de Vandermonde y por lo tanto distinto de cero) Se le llama polinomio interpolador correspondiente a esos puntos. Una vez obtenida su expresin dando valores en l se pueden encontrar nuevos puntos de la funcin. Los resultados obtenidos son naturalmenteestimaciones aproximadas. La interpolacin se dir lineal cuando slo se tomen dos puntos y cuadrtica cuando se tomen tres. En este tema nos limitaremos a estos dos tipos de interpolacin.
Ejemplo 1. De una funcin conocemos tres puntos (-3, 5), (1, -1) y (3, 11). qu podemos decir de esa funcin cuando x=0 y cuando x=10? Solucin Calculamos el polinomio interpolador que ser de 2 grado y= ax2 + bx +c, que pase por los tres puntos , Se verifica: 5=a(-3)2+b(-3)+c por pasar por el punto (-3, 5) -1=a+b+c 11=a.3 +b.3+c
2

por pasar por el punto (1, -1) por pasar por el punto (3, 11)

Resolviendo el sistema que se nos plantea nos queda: y= P(x)= Cuando x=0, P(0)=-13/4; si x=10, P(10)=527/4 El primero, una interpolacin, es probablemente una buena aproximacin del valor de la funcin desconocida, en el punto 0. Sin embargo, el valor 527/4 es probable que se parezca poco al valor de la funcin en el punto 10, pues es el resultado de una extrapolacin muy lejana.

No se pueden dar reglas estimacin.

generales para decidir cul es la interpolacin ms

adecuada, pues no siempre al aumentar el grado del polinomio aumenta la precisin en la

Depende siempre del caso concreto a estudiar. A veces la naturaleza del problema nos da una idea de cul es la interpolacin (o extrapolacin) ms conveniente. Por ejemplo si los incrementos de la funcin son proporcionales a los de la variable independiente (o casi proporcionales) podremos usar la interpolacin lineal. Ejercicio 1. Se conoce la poblacin de cierto municipio, para el 31 de diciembre en los aos que se indican: aos Poblacin 1950 827 1960 1058 1970 1304 1980 1582 1990 1836

Efectuar una representacin grfica y observar cul sera en este caso la interpolacin ms conveniente. Ejercicio 2. Un investigador ha observado que la vida media de una bacteria vara con la temperatura media en la siguiente forma Temperatura Vida media Se pide: a) Efectuar una representacin grfica, tomando en abscisas las temperatura s y en ordenadas la vida media. b) Calcular las variaciones de la funcin vida media al variar la temperatura. c) Los resultados anteriores indican que la vida media vara linealmente con la temperatura? d) En caso afirmativo, mediante interpolacin lineal, obtener la vida media para las siguientes temperaturas: 8, 10,2, 14,5 y 15,3 Ejercicio 3. En una facultad universitaria de nueva creacin el nmero de alumnos matriculados evolucion de la siguiente forma: Aos Alumnos matriculados 1 425 2 640 3 941 4 2790 5 6123 6 104,2 9 140,4 12 181,7 15 220,2 16 257,6

a) Efectuar una representacin grfica tomando como abscisas los aos y como ordenadas el n de alumnos. b) Hubiese sido una buena idea obtener el nmero de alumnos matriculados en el tercer curso mediante la interpolacin lineal? c) Cul crees que sera la ms conveniente?

3. Interpolacin lineal Como dijimos, cuando las variaciones de la funcin son proporcionales (o casi proporcionales) a los de la variable independiente se puede admitir que dicha funcin es lineal y usar para estimar los valores la interpolacin lineal..

Sean dos puntos (xo, yo), (x1, y1), la interpolacin lineal consiste en hallar una estimacin del valor y, para un valor x tal que x0<x<x1. Teniendo en cuenta que la ecuacin de la recta que pasa por esos dos puntos es: obtenemos la frmula de la interpolacin lineal.

Ejercicio 4.El nmero de turistas entrados en Espaa en el perodo 1980-1995 sigui la siguiente tendencia: Ao Millones de turistas 1980 24,1 1985 30,1 1990 38,0 1995 43,2

a) Expresar la funcin definida a trozos que dara, por interpolacin lineal, el nmero de turistas en cada ao intermedio. Calcular el nmero de turistas en 1986 b) Hallar la previsin para el ao 1988 (suponiendo fuese lineal).

4. La interpolacin cuadrtica. Frmula de Lagrange


Cuando el polinomio que conviene es de 2 grado la interpolacin recibe el nombre de cuadrtica. El polinomio interpolador es nico, luego como se encuentre da igual., sin embargo, a veces los clculos son muy laboriosos y es preferible utilizar un mtodo que otro. A la vista de los datos se decide.

En el ejemplo 1 se da el mtodo de resolver el sistema para encontrar los valores que determinan a la funcin cuadrtica (a, b y c)
Tambin podemos utilizar la expresin del polinomio interpolador as: y= a + b(x-x0) + c(x-x0)(x-x1), con lo que la bsqueda de los coeficientes es muy sencilla.

Lagrange (1736-1813) dio una manera simplificada de calcular los polinomios interpoladores de grado n Para el caso de un polinomio de 2 grado que pasa por los puntos (x0, y0 ), (x1, y1), (x2, y2):

Que es la frmula de Lagrange para n=2.


Ejercicio 5. El nmero en miles de habitantes, de una determinada ciudad ha evolucionado segn la siguiente tabla: Aos Poblacin que tena la ciudad en 1995 y que tendr en el ao 2000. 1997 53 1998 71 1999 91

Sabiendo que dicha poblacin se ajusta a una funcin cuadrtica, calcular la poblacin

EJERCICIOS PROPUESTOS 1. El nmero de turistas que visitaron Espaa en el periodo 1975-1990 est reflejado en la siguiente tabla:
Aos
Millones de turistas 1975 24,1 1980 30,1 1985 38,1 1990 43,2

Calcular, utilizando un polinomio de interpolacin adecuado (cuadrtico, al menos), el nmero de turistas que visitarn Espaa en 1995. 2. En la tabla siguiente se indica el tiempo (en das) y el peso (en gramos) de tres embriones de cierta especie animal:
Tiempo
Peso 3 8 5 22 8 73

a) Obtener el polinomio de interpolacin de 2 grado correspondiente. b) Determinar, a partir de dicho polinomio, el peso que correspondera a un embrin de 6,5 das. 3. Dada la siguiente tabla, obtener por interpolacin lineal el valor de .
x 0 1 1 1,4142 2 1,7321

(Sol. 0,7514) 4. De una funcin f(x) se conocen los valores f(1)=0, f(2)=4, f(5)=52. Hallar el correspondiente polinomio cuadrtico de interpolacin. Estimar el valor de la funcin en x=3 y en x=6. (Sol. P(x) = 3x2 5x +2, P(3)=14 y P(6)=80) 5. Obtener la ecuacin de la interpolacin cuadrtica que pasa por los puntos A(0,4), B(1,3) y C(-1, 9). (Sol. P(x)= 2x2 3x + 4) 6. El aumento de lneas telefnicas instaladas en Espaa durante los tres ltimos aos fue:
Aos
Millones de lneas 1995 1996 1997 8,457 8,882 9,640

a) Es lineal el aumento producido? b) Calcular el valor esperado en 1998 mediante una extrapolacin cuadrtica. (Sol. 10,731) 7. Dada la tabla de la funcin y = f(x)

x f(x)

1 2

2 -1

3 6

4 0

Calcular el error cometido cuando se calcula f(4) mediante la interpolacin cuadrtica, obtenida usando los otros valores de la tabla. (Sol. 23)

Interpolacin polinmica
En anlisis numrico, la interpolacin polinmica es una tcnica de interpolacin de un conjunto de datos o de una funcin por un polinomio. Es decir, dado cierto nmero de puntos obtenidos pormuestreo o a partir de un experimento se pretende encontrar un polinomio que pase por todos los puntos.
Contenido
[ocultar]

1 Definicin 2 Motivacin del polinomio interpolador 3 Clculo del polinomio interpolador

o o o o

3.1 Mtodo de las diferencias divididas de Newton 3.2 Interpolacin de Lagrange 3.3 Interpolacin de Hermite 3.4 Interpolacin segmentaria

4 Otras formas de interpolacin 5 Temas relacionados 6 Vase tambin 7 Referencias 8 Enlaces externos

[editar]Definicin
Dada una funcin f de la cual se conocen sus valores en un nmero finito de abscisas x0,x1,...,xm, se llama interpolacin polinmica al proceso de hallar un polinomio pm(x) de grado menor o igual a m, cumpliendo .

A este polinomio se le llama Polinomio interpolador de grado m de la funcin f.

[editar]Motivacin

del polinomio interpolador

La interpolacin polinmica es un mtodo usado para conocer, de un modo aproximado, los valores que toma cierta funcin de la cual slo se conoce su imagen en un nmero finito de abscisas. A menudo, ni siquiera se conocer la expresin de la funcin y slo se dispondr de los valores que toma para dichas abscisas. El objetivo ser hallar un polinomio que cumpla lo antes mencionado y que permita hallar aproximaciones de otros valores desconocidos para la funcin con una precisin deseable fijada. Por ello, para cada polinomio interpolador se dispondr de una frmula del error de interpolacin que permitir ajustar la precisin del polinomio.

[editar]Clculo

del polinomio interpolador

Se dispone de varios mtodos generales de interpolacin polinmica que permiten aproximar una funcin por un polinomio de grado m. El primero de estos polinomios es el mtodo de las diferencias divididas de Newton. Otro de los mtodos es la interpolacin de Lagrange, y por ltimo, la interpolacin de Hermite.

[editar]Mtodo
Sea

de las diferencias divididas de Newton


elementos y sea otra variable discreta de elementos los

una variable discreta de

cuales corresponden, por parejas, a la imagen u ordenada y abcisa de los datos que se quieran interpolar, respectivamente, tales que:

Este mtodo es muy algortmico y resulta sumamente cmodo en determinados casos, sobre todo cuando se quiere calcular un polinomio interpolador de grado elevado. El polinomio de grado resultante tendr la forma

definiendo

como

y definiendo

como

Los coeficientes

son las llamadas diferencias divididas.

Una vez se hayan realizado todos los clculos, ntese que hay (muchas) ms diferencias divididas que coeficientes . El clculo de todos los trminos intermedios debe realizarse simplemente

porque son necesarios para poder formar todos los trminos finales. Sin embargo, los trminos usados en la construccin del polinomio interpolador son todos aquellos que involucren a .

Estos coeficientes se calculan mediante los datos que se conocen de la funcin queda definido, como:

Se muestra ahora una tabla mnemotcnica con las diferencias divididas de una cierta funcin dada para construir un polinomio interpolador de grado 2:

[editar]Interpolacin
Sea sean de grado

de Lagrange
las abscisas conocidas de y

la funcin a interpolar, sean

los valores que toma la funcin en esas abscisas, el polinomio interpolador de Lagrange es un polinomio de la forma

donde

son los llamados polinomios de Lagrange, que se calculan de este modo:

Ntese que en estas condiciones, los coeficientes distintos de cero.

estn bien definidos y son siempre

Se muestra en el ejemplo siguiente el clculo de un polinomio interpolador de Lagrange usando interpolacin por Lagrange y diferencias divididas de Newton: Ejemplo: Se quiere hallar el valor de la funcin polinomio interpolador de Lagrange de grado 2. Para ello se usan los siguientes datos: para usando un

Se usa primero el mtodo directo para calcular el polinomio interpolador de Lagrange. Con las condiciones dadas, los polinomios de Lagrange son:

Se calcula ahora el polinomio interpolador de grado 2:

Ahora evaluamos este polinomio en

para obtener un valor aproximado de

Si se usase una calculadora para efectuar el clculo

obtenemos siguiente:

, por lo que el error cometido es el

Se trata de un error del orden del 0.66 %.

Se procede a realizar ahora la interpolacin mediante el mtodo de las Diferencias Divididas de Newton:

Se disea una tabla de Diferencias Divididas esquemtica y se realiza los pertinentes clculos para obtener los siguientes coeficientes:

Ahora se debe tomar de estos coeficientes los que se necesitasen para escribir el polinomio interpolador. Hay que recordar, segn lo apuntado anteriormente, que slo se usan aqullos coeficientes que involucren a Lagrange de grado 2: . De esta forma se obtiene el polinomio interpolador de

Y, como se puede apreciar, se llega al mismo polinomio pero con relativamente menos trabajo.

[editar]Interpolacin

de Hermite

Artculo principal: Interpolacin polinmica de Hermite

La interpolacin de Hermite, llamada as en honor a su inventor Charles Hermite, es similar a la de Newton pero con el aadido de que ahora tambin conocemos los valores que toma la derivada de la funcin f en las abscisas conocidas x0,x1,...,xm.

El Polinomio Interpolador de Hermite de grado 2m + 1 de la funcin f es un polinomio de la forma

con

La interpolacin de Hermite puede extenderse al conocimiento de las derivadas sucesivas de la funcin a interpolar en las abscisas tomadas, de modo que se puede obtener un polinomio cada vez ms ajustado a la funcin real, ya que ste podr cumplir otros requisitos como una determinada monotona, concavidad, etc. En este caso, estaremos hablando de interpolacin de Hermite generalizada y su clculo se llevar a cabo de forma similar a la apuntada, pero obteniendo polinomios de grado cada vez mayor debido a las sucesivas derivadas de los coeficientes .

Notar, pues, que la interpolacin de Lagrange puede considerarse como un caso particular de la interpolacin de Hermite generalizada (el caso en el que "conocemos" cero derivadas de f).

Tal y como ocurra con la Interpolacin de Lagrange, para la interpolacin de Hermite tambin

disponemos una frmula del error de interpolacin que, naturalmente, tiene en cuenta factores relacionados con las derivadas de f. Ms concretamente, se dispone de una frmula del error en el caso en que la funcin f sea 2m+2 veces diferenciable en un intervalo I mediante la siguiente expresin:

para

y donde

La diferencia esencial entre la Interpolacin de Hermite y la Interpolacin de Lagrange reside en el clculo a travs de la construccin de los Polinomios de Lagrange. En este caso, su clculo es rduo, largo y complicado; por lo que el uso de las llamadas diferencias divididas generalizadas simplifica mucho el clculo del polinomio interpolador. Las diferencias divididas generalizadas se construyen de igual modo que las Diferencias Divididas de Newton, salvo que ahora necesitaremos escribir fi tantas veces ms una como derivadas de f conozcamos. Aqu slo veremos el caso en el que conocemos la primera derivada, siendo el resto una generalizacin de este. Como en la Interpolacin de Lagrange, el Polinomio Interpolador de Hermite de grado 2m + 1 se escribir, una vez calculadas las Diferencias Divididas, de este modo

Ntese que, aparentemente, los coeficientes

no estn bien definidos, pues

Sin embargo, podemos tomar lmites y escribir esta expresin as:

Pero esto no es ms que la definicin de la derivada de f en el punto xi, de modo que

Por ello, incluiremos en nuestra tabla de Diferencias Divididas los datos sobre todas las derivadas conocidas de la funcin a interpolar.

[editar]Interpolacin

segmentaria

Existen mtodos de Interpolacin segmentaria que nos permiten aproximar funciones de un modo eficaz. Entre ellos cabe destacar la interpolacin de Taylor y la interpolacin por Splines. La Interpolacin de Taylor usa el Desarrollo de Taylor de una funcin en un punto para construir un polinomio de grado m que se aproxima a la funcin dada. Tiene dos ventajas esenciales sobre otras formas de interpolacin:

Requiere slo de un punto

conocido de la funcin para su clculo, si bien se pide que la

funcin sea suficientemente diferenciable en un entorno de ese punto.

El clculo del Polinomio de Taylor es sumamente sencillo comparado con otras formas de interpolacin polinmica:

Sin embargo, en ocasiones no ser deseable su uso dado que el error de interpolacin puede alcanzar cotas demasiado elevadas. Es especialmente til para emplearse en lugar de mtodos de interpolacin de Hermite generalizada sobre derivadas de orden superior de la funcin f. La Interpolacin por Splines es un refinamiento de la interpolacin polinmica que usa "pedazos" de varios polinomios en distintos intervalos de la funcin a interpolar para evitar problemas de oscilacin como el llamado Fenmeno de Runge. La idea es que agrupamos las abscisas en distintos intervalos segn el grado

del spline que convenga emplear en cada uno. As, un spline ser un polinomio interpolador de grado n de f para cada intervalo. A la postre, los distintos splines quedarn "unidos" recubriendo todas las abscisas e interpolando a la funcin. El principal problema que presenta la interpolacin por splines reside en los puntos que son comunes a dos intervalos (extremos). Por esos puntos deben pasar los splines de ambos intervalos, pero para que la interpolacin sea ajustada, conviene que el punto de unin entre dos splines sea lo ms "suave" posible (ej. evitar puntos angulosos), por lo que se pedir tambin que en esos puntos

ambos splines tengan derivada comn. Esto no ser siempre posible y, a menudo, se emplear otro tipo de interpolacin, quizs una interpolacin no-polinmica.

[editar]Otras

formas de interpolacin

Existen otros mtodos de interpolacin no-polinmica que proporcionan aproximaciones de funciones de las cuales conocemos informacin limitada. En el mismo contexto que la interpolacin polinmica, contamos con la interpolacin racional y la interpolacin trigonomtrica, que consisten en aproximar funciones por cocientes de polinomios y por polinomios trigonomtricos respectivamente. La segunda es especialmente til para funciones con valores en el cuerpo de los nmeros complejos de wavelets(ondaletas). Cuando el conjunto de las abscisas Whittaker-Shannon. Cuando estamos trabajando con funciones de varias variables, disponemos de la interpolacin multivariable para conseguir aproximaciones de las mismas. Entre los mtodos de interpolacin multivariable, destacar la interpolacin bilineal y la interpolacin bicbica para funciones de dos variables y la interpolacin trilineal para funciones de tres variables. es infinito, podemos recurrir a la Frmula de Interpolacin de . Tambin es frecuente el uso