Está en la página 1de 710

Clculo Numrico

y Estadstica Aplicada

LUIS M. SES SNCHEZ

UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA

CLCULO NUMRCO Y ESTADSTICA APLICADA

Quedan rigurosamente prohibidas, sin la


autorizacin escrita de los titulares del
Copyright, bajo las sanciones establecidas
en las leyes, la reproduccin total o
parcial de esta obra por cualquier medio
o procedimiento, comprendidos la reprografa
y el tratamiento informtico, y la distribucin
de ejemplares de ella mediante alquiler
o prstamos pblicos.

Universidad Nacional de Educacin a Distancia


Madrid 2013
www.uned.es/publicaciones
Luis M. Ses Snchez
Todas nuestras publicaciones han sido sometidas
a un sistema de evaluacin antes de ser editadas.
ISBN electrnico: 978-84-362-6654-2
Edicin digital: mayo de 2013

A Mariano, mi padre

Bellos copos de nieve! Nunca caen fuera de ninguna parte


Pang Yun (S. VIII)
Tan malo es vivir en la oscuridad absoluta como bajo la ms
brillante luz: Ambas te dejan ciego

NDICE

Presentacin .....................................................................................................................................................

21

I
MTODOS NUMRICOS
Captulo 1. AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS
DE COLOCACIN Y DE MNIMOS CUADRADOS ..............................................

31

1.1. Introduccin .......................................................................................................................................

32

A. Polinomios de colocacin ............................................................................................................


1.2. Ajustes con polinomios de colocacin.......................................................................
Opciones de ajuste polinmico.........................................................................................
El criterio de colocacin: casos simples ..................................................................
Observaciones de inters ........................................................................................................
1.3. La tabla de diferencias y los polinomios de Newton ...................................
El polinomio de avance de Newton ..............................................................................
El polinomio de retroceso de Newton .......................................................................
Observaciones prcticas ..........................................................................................................
1.4. El polinomio de Lagrange .....................................................................................................
1.5. Otras tcnicas ....................................................................................................................................

34
34
35
36
38
39
40
42
43
44
46

B. Mnimos cuadrados............................................................................................................................
1.6. Concepto y aplicacin al caso lineal ............................................................................
Estudio del caso lineal: determinacin de los coeficientes....................
Unicidad de la solucin............................................................................................................
El carcter de mnimo...............................................................................................................
La bondad del ajuste .............................................................................................................
La utilidad extendida del caso lineal ...........................................................................
Nota adicional sobre el error ..............................................................................................
1.7. Ajustes de mnimos cuadrados de orden superior .........................................
El caso cuadrtico .........................................................................................................................

46
46
47
48
49
50
51
56
56
57

11

CLCULO NUMRICO Y ESTADSTICA APLICADA

El caso general..................................................................................................................................
Observaciones prcticas ..........................................................................................................

58
59

Bibliografa ......................................................................................................................................................

61

Problemas tericos y numricos..................................................................................................

62

Captulo 2. AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES ................

81

2.1. Introduccin .......................................................................................................................................


2.2. El caso discreto: Polinomios de Gram-Tschebyscheff ...............................
El sistema normal de ecuaciones ...................................................................................
Forma de los polinomios de Gram-Tschebyscheff ........................................
2.3. El caso continuo: Producto escalar y distancia entre funciones ......
Producto escalar de funciones ..........................................................................................
Criterios de aproximacin entre funciones...........................................................
Desarrollos en serie de una base completa ...........................................................
El clculo de los coeficientes del desarrollo.........................................................
Observaciones de inters ........................................................................................................
2.4. Caso continuo: polinomios de Legendre .................................................................
Ortogonalizacin constructiva de Gram-Schmidt .........................................
Forma de los polinomios normalizados de Legendre .................................
Forma habitual de los polinomios de Legendre ...............................................
Propiedades adicionales ..........................................................................................................
2.5. Caso continuo: polinomios de Tschebyscheff ....................................................
Definicin ..............................................................................................................................................
Propiedades adicionales ..........................................................................................................
La economizacin de polinomios ..................................................................................
Observaciones de inters ........................................................................................................
2.6. Caso continuo: polinomios de Hermite y de Laguerre ..............................

82
84
85
86
88
89
93
93
94
96
100
100
102
104
105
107
107
109
111
113
114

Bibliografa ...................................................................................................................................................... 117


Problemas tericos y numricos.................................................................................................. 118
Captulo 3. APLICACIONES NUMRICAS BSICAS ................................................................. 129
3.1. Los errores en el clculo numrico ..............................................................................
Errores absoluto y relativo ...................................................................................................
El error de redondeo y conceptos asociados .......................................................
Errores de entrada y cifras significativas fisico-qumicas ................
Consideraciones adicionales ...............................................................................................

12

130
131
132
135
137

NDICE

3.2. Interpolacin y extrapolacin ............................................................................................


Observaciones prcticas en interpolacin: eleccin de grado,
seleccin de puntos de la tabla y tipo de polinomio, tabla
desigualmente espaciada ........................................................................................................
Notas complementarias ...........................................................................................................
El error de interpolacin ........................................................................................................
3.3. Propagacin de los errores en los datos de entrada .....................................
Alternancias de signo en una tabla de diferencias .........................................
Errores de entrada ........................................................................................................................
3.4. Diferenciacin numrica ........................................................................................................
Frmulas de Newton ..................................................................................................................
Frmulas de Stirling ...................................................................................................................
Extrapolacin de Richardson.............................................................................................
3.5. Integracin numrica ................................................................................................................
Regla del trapecio ..........................................................................................................................
Regla de Simpson ..........................................................................................................................
Tcnicas Gaussianas: Gauss-Legendre, Gauss-Hermite
y Gauss-Laguerre ...........................................................................................................................
Tratamiento de integrales singulares .........................................................................
Tratamiento de integrales oscilantes ..........................................................................
Complementos: Tablas para integracin Gaussiana ....................................

139

141
145
146
149
150
151
152
153
155
157
159
159
162
163
168
170
173

Bibliografa ...................................................................................................................................................... 176


Problemas tericos y numricos.................................................................................................. 177
Captulo 4. RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS ........................ 201
4.1. Conceptos preliminares ........................................................................................................... 202
Races (ceros) de ecuaciones no lineales ................................................................. 203
Sistemas de ecuaciones y diagonalizacin ............................................................ 205
A. Ecuaciones no lineales ...................................................................................................................
4.2. Separacin de races reales y estimacin del error .......................................
4.3. Mtodo de biseccin ...................................................................................................................
4.4. Mtodo de la falsa posicin (regula falsi) ................................................................
4.5. Mtodo de Newton-Raphson ..............................................................................................
Definicin del algoritmo .........................................................................................................
Condiciones suficientes de convergencia................................................................
Estimacin del error ...................................................................................................................

206
206
208
210
214
214
215
216

13

CLCULO NUMRICO Y ESTADSTICA APLICADA

La variante Newton-secante ................................................................................................


4.6 Mtodo iterativo de punto fijo..............................................................................................
4.7 El caso de las races mltiples ..............................................................................................
Mtodos para determinar la multiplicidad ...........................................................

217
218
220
221

B. Sistemas de ecuaciones ...................................................................................................................


4.8. Sistema lineal (no homogneo)........................................................................................
Mtodo de Gauss con pivote ...............................................................................................
Estimacin del error ...................................................................................................................
4.9. Sistema no lineal ............................................................................................................................
Mtodo de Newton-Raphson ..............................................................................................
Mtodo del gradiente .................................................................................................................

223
223
225
227
228
228
229

Bibliografa ...................................................................................................................................................... 231


Problemas tericos y numricos.................................................................................................. 232

II
INTRODUCCIN A LA TEORA Y APLICACIONES
DE LA ESTADSTICA
Captulo 5. DISTRIBUCIONES DE PROBABILIDAD ................................................................ 257
5.1. Probabilidad, Estadstica y Qumica...........................................................................
El concepto de probabilidad ...............................................................................................
Breve presentacin axiomtica de la probabilidad .......................................
Otras observaciones y las aplicaciones en la Qumica ...............................
5.2. Variables aleatorias, poblacin y muestra .............................................................
5.3. Funciones de distribucin de probabilidades ....................................................
Variables monodimensionales (discretas y continuas) .............................
Variables monodimensionales derivadas................................................................
5.4. Caracterizacin de una distribucin de probabilidad ................................
Valor medio y desviacin tpica (estndar)...........................................................
Momentos de una distribucin.........................................................................................
Medidas de asimetra y de exceso ..................................................................................
Otros parmetros ...........................................................................................................................
5.5. Ejemplos de distribuciones discretas .........................................................................
La distribucin binomial ........................................................................................................
La distribucin de Poisson ...................................................................................................

14

258
258
261
267
270
274
274
281
284
284
286
288
289
291
291
294

NDICE

La distribucin multinomial ...............................................................................................


5.6. Ejemplos de distribuciones continuas.......................................................................
La distribucin uniforme .......................................................................................................
La distribucin Gaussiana (normal) ...........................................................................
La distribucin logartmico-normal (log-normal)..........................................
5.7. Composicin de variables aleatorias...........................................................................
Valores medios y varianzas de funciones aleatorias ....................................
Suma y producto de variables aleatorias ................................................................
Distribuciones de probabilidad en n dimensiones.........................................

296
298
298
300
305
307
307
310
315

Bibliografa ...................................................................................................................................................... 321


Problemas tericos y numricos.................................................................................................. 322
Captulo 6. MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA ............................. 341
6.1. Muestreo de poblaciones ........................................................................................................
Mtodos generales de muestreo.......................................................................................
Observaciones adicionales ....................................................................................................
6.2. Distribuciones muestrales .....................................................................................................
Media y varianza ............................................................................................................................
Proporciones ......................................................................................................................................
Sumas y diferencias.....................................................................................................................
Mediana ..................................................................................................................................................
6.3. Inferencia estadstica (I) .........................................................................................................
Estimacin por un punto .......................................................................................................
Estimacin por intervalos de confianza ..................................................................
6.4. Inferencia estadstica (II): formulacin y verificacin de hiptesis
estadsticas ...........................................................................................................................................
Cinco pasos a dar en hiptesis estadsticas ..........................................................
Observaciones adicionales ....................................................................................................
Principios de admisin y rechazo de hiptesis .................................................
6.5. Funcin de potencia y curva OC .....................................................................................
6.6. Grficos de control (Shewhart) y aleatoriedad .................................................
6.7. Comparacin de muestras: medias y proporciones......................................
6.8. Teora de pequeas muestras.............................................................................................
Distribucin t de Student .......................................................................................................
Distribucin chi-cuadrado ....................................................................................................
Distribucin F de Fisher..........................................................................................................

342
343
345
347
347
351
351
353
354
355
356
360
360
363
365
366
368
371
374
375
379
382

15

CLCULO NUMRICO Y ESTADSTICA APLICADA

Bibliografa ...................................................................................................................................................... 387


Problemas tericos y numricos.................................................................................................. 388
Captulo 7. CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA .... 407
7.1. Experimentos con ms de una variable aleatoria, correlacin
y regresin ............................................................................................................................................
7.2. Ecuaciones empricas tpicas en dos variables y su reduccin
a forma lineal.....................................................................................................................................
Tipos bsicos con dos parmetros.................................................................................
Tipos con tres y cuatro parmetros..............................................................................
7.3. El coeficiente de correlacin en dos variables ...................................................
Correlacin de poblaciones ..................................................................................................
Correlacin lineal en muestras bivariantes...........................................................
El coeficiente r como estimador estadstico ........................................................
7.4. Aspectos prcticos de la regresin lineal por mnimos cuadrados
7.5. Desestimacin de puntos en el anlisis de datos .............................................
Test de cuartiles con extensin (box-and-whisker plot)......................
Test de distancias ...........................................................................................................................
7.6. Correlacin lineal mltiple ...................................................................................................
7.7. Estadstica no paramtrica ..................................................................................................
Test de signos ....................................................................................................................................
Correlacin por rangos de Spearman ........................................................................

408
411
412
413
418
418
420
425
430
434
435
436
437
440
441
443

Bibliografa ...................................................................................................................................................... 447


Problemas tericos y numricos.................................................................................................. 448

III.
ANLISIS Y PROPAGACIN DE LOS ERRORES
EXPERIMENTALES
Captulo 8. EL TRATAMIENTO DE ERRORES EN DATOS EXPERIMENTALES...... 475
8.1.
8.2.
8.3.
8.4.

16

Introduccin .......................................................................................................................................
Los errores en la medicin experimental ...............................................................
Propagacin del error de escala del aparato .......................................................
Propagacin de los errores sistemticos .................................................................

476
478
480
482

NDICE

8.5. Propagacin de los errores accidentales .................................................................


Variables independientes .......................................................................................................
Variables dependientes.............................................................................................................
La induccin de errores sistemticos .........................................................................
8.6. Un caso de estudio: clculo del error total de un ndice
de refraccin.......................................................................................................................................

485
485
488
489
491

Bibliografa ...................................................................................................................................................... 494


Problemas tericos y numricos.................................................................................................. 495

IV
SIMULACIN DE PROCESOS Y VALIDACION DE MTODOS
Captulo 9. MTODOS AVANZADOS DE CLCULO Y DE SIMULACIN
NUMRICA .............................................................................................................................

511

A. La aproximacin trigonomtrica...........................................................................................
9.1. Polinomios trigonomtricos ................................................................................................
Cambios de variable ....................................................................................................................
Ortogonalidad en el caso de nmero impar de puntos .............................
Ortogonalidad en el caso de un nmero par de puntos ............................
Relaciones tiles .............................................................................................................................
Clculo de los coeficientes ....................................................................................................
Expresiones finales.......................................................................................................................

513
513
514
515
516
516
517
519

B. Simulacin numrica de procesos deterministas ...................................................


9.2. Ecuaciones diferenciales: generalidades .................................................................
9.3. Ecuaciones diferenciales ordinarias............................................................................
Casos de estudio..............................................................................................................................
Existencia y unicidad de la solucin ...........................................................................
9.4. Ecuacin diferencial de primer orden y primer grado (valor
inicial).......................................................................................................................................................
Mtodo de Euler .............................................................................................................................
Estabilidad y error ........................................................................................................................
Predictor-corrector de Euler ...............................................................................................
Mtodos de Runge-Kutta........................................................................................................
9.5. Ecuacin diferencial de segundo orden (valores iniciales) ...................
Mtodo de Runge-Kutta (IV) ..............................................................................................

519
519
522
522
523
524
524
525
526
527
531
531

17

CLCULO NUMRICO Y ESTADSTICA APLICADA

Mtodo predictor-corrector de Adams ...................................................................... 532


9.6. Problemas de valores de frontera ................................................................................... 532
C. Diagonalizacin numrica de matrices reales y simtricas ...........................
9.7. Conceptos generales....................................................................................................................
Teorema bsico para matrices reales y simtricas ........................................
Multiplicidad de races y degeneracin ....................................................................
Observaciones prcticas ..........................................................................................................
9.8. Mtodo del polinomio caracterstico: clculo de autovectores..........
Caso no degenerado ....................................................................................................................
Caso degenerado .............................................................................................................................
9.9. Mtodo de Jacobi ...........................................................................................................................
La transformacin ortogonal .............................................................................................
La construccin de la matriz ortogonal O .............................................................
Observaciones prcticas ..........................................................................................................
9.10. Tests de diagonalizacin y tcnicas complementarias ...........................
Bibliografa ......................................................................................................................................................

533
533
534
535
536
537
537
537
542
542
543
547
548
551

Problemas tericos y numricos.................................................................................................. 552


Captulo 10. MTODOS ESTADSTICOS DE SIMULACIN Y VALIDACIN ............. 589
A. Integracin numrica multidimensional .......................................................................
10.1. Integracin Monte Carlo .....................................................................................................
Aspectos numricos: familias multiplicativas congruentes ...............
Aspectos estadsticos: el error de integracin .................................................

590
590
591
595

B. Aplicaciones de los procesos de minimizacin .........................................................


10.2. Promedios con pesos muestrales.................................................................................
10.3. Ajuste lineal chi-cuadrado de datos ..........................................................................
Aspectos numricos .................................................................................................................
Aspectos estadsticos...............................................................................................................
Observaciones adicionales ...............................................................................................
10.4. Ajuste de datos a distribuciones de probabilidad ........................................
Caso continuo: ajuste Gaussiano ................................................................................
Caso discreto: ajuste binomial .......................................................................................
10.5. Estadstica robusta: ajuste de una lnea recta.................................................

596
596
600
601
603
604
606
606
609
611

C. Anlisis de la varianza .................................................................................................................... 615

18

PRESENTACIN

10.6. Homogeneidad de un conjunto de varianzas muestrales ....................


10.7. Homogeneidad de un conjunto de medias (ANOVA-1) .........................
Estimacin entre muestras ...............................................................................................
Estimacin dentro de la muestra ................................................................................
Observaciones adicionales.................................................................................................
10.8. Anlisis de la varianza con dos factores de variacin independientes (ANOVA-2) ..................................................................................................................
Caso de dos efectos fijos ......................................................................................................
Caso de dos efectos aleatorios .......................................................................................
10.9. Anlisis de la varianza en ajustes de regresin ..............................................

616
617
618
619
619
621
623
624
625

Bibliografa ...................................................................................................................................................... 626


Problemas tericos y numricos.................................................................................................. 627
Apndice I: Tratamiento de datos experimentales mediante computacin (Modelos de Prcticas en Centros Asociados)........................................... 647
Apndice II: La base ortogonal de Fourier.......................................................................... 651
Apndice III: Tablas estadsticas .................................................................................................. 665
Bibliografa general .................................................................................................................................... 669
Glosario de trminos ................................................................................................................................ 679
ndice alfabtico de materias ............................................................................................................. 703

19

CLCULO NUMRICO Y ESTADSTICA APLICADA

20

PRESENTACIN

El presente texto desarrolla los contenidos de la asignatura Clculo Numrico y Estadstica Aplicada, perteneciente al 2.o curso de los Estudios de Grado en Qumica (EEES) por la Universidad Nacional de Educacin a Distancia
(UNED), de carcter obligatorio y con una carga de 5 crditos ECTS. Esta asignatura tiene que ver con la aplicacin prctica de tcnicas matemticas aproximadas a la resolucin de problemas de inters en Qumica. Con independencia de opiniones y de gustos particulares, el lenguaje matemtico es la
herramienta para comprender los procesos naturales tanto cuantitativa como
cualitativamente, es decir, tanto obteniendo los resultados numricos concretos, como aplicando ideas abstractas que revelan caractersticas muy profundas de dichos procesos. La famosa cita de E. P. Wigner sobre la irrazonable efectividad de las Matemticas sirve esplndidamente para subrayar
que el conocimiento matemtico forma parte del consenso sobre las materias
bsicas a conocer que los cientficos han alcanzado hace ya muchos aos.
No obstante, la experiencia docente universitaria viene constatando, desde hace ya bastantes aos, que los conocimientos previos de matemticas
con los que los estudiantes se acercan a las carreras de Ciencias son, en trmino medio, cada vez ms escasos. La proyeccin de esta circunstancia
sobre la formacin de los estudiantes de estas carreras se ve agravada con los
planteamientos globales de los actuales Planes de Estudio del Grado, en
concreto de Qumica, en los que la disminucin en asignaturas, contenidos,
y dedicacin esperada, ligados al estudio de Matemticas es patente, como
pone de manifiesto el hecho de que con respecto a Planes de Estudio anteriores (varios entre 1970 y 2010) la disminucin es prcticamente del 50%.
Es en este complicado contexto donde se enmarca la presente asignatura.
Dentro de esta posicin de principio, si se tiene en cuenta, por otra parte,
que el nmero de problemas en las ciencias naturales que son resolubles
matemticamente de forma analtica en principio exacta es muy reducido,
incluso para los problemas que admiten formulaciones en principio exactas
(la ecuacin de Schrdinger para tomos poli-electrnicos, por ejemplo), el

21

CLCULO NUMRICO Y ESTADSTICA APLICADA

aprendizaje de los mtodos numricos de aproximacin para resolverlos es


crucial. Aadido a lo anterior y en la misma lnea est el carcter experimental de la Qumica, del que se deriva la necesidad de aprender cmo
extraer informacin significativa de colecciones de datos (experimentales o
procedentes de clculos extensos), faceta sta que implica el manejo de
herramientas estadsticas. Por consiguiente, es muy importante que el estudiante de Qumica conozca, no slo los principios matemticos analticos
exactos que se imparten en las asignaturas generales de Matemticas del
Grado, sino tambin cmo realizar en la prctica operaciones matemticas
aproximadas y cmo analizar estadsticamente tales colecciones de datos.
Para satisfacer estas necesidades se tratarn en esta asignatura cuestiones
pertenecientes a dos disciplinas distintas pero conexas. Por una parte, el Clculo Numrico, que se ocupa de reducir la resolucin de complicadas evaluaciones matemticas a combinaciones de operaciones elementales. Por la
otra, la Estadstica Aplicada, que se centra en los aspectos derivados del tratamiento de colecciones de datos.
Como aplicacin inmediata de estos contenidos, resulta claro que el trabajo de laboratorio que realizar el estudiante en las diversas asignaturas de
prcticas se ver sustancialmente mejorado. As, muchas cuestiones prcticas que se presentan en las diferentes ramas de la Qumica (Analtica, Bioqumica, Fsica, Industrial, Inorgnica, Orgnica) podrn dotarse de un
carcter cuantitativo preciso va el uso del anlisis de los resultados experimentales obtenidos en todas ellas. Adems, estos mismos conocimientos
resultarn muy tiles para proseguir estudios de mayor nivel en todas esas
ramas. Todo este aprendizaje redundar en beneficio de la autonoma del
estudiante, tanto en una mejor formacin integral, como en el aumento de
su capacidad para abordar los problemas que tendr que afrontar en el
ejercicio de su futura actividad profesional.
Aunque es cierto que el nivel de profundidad y la cantidad de conocimientos
a impartir tendran que ser siempre los mximos posibles, no es menos cierto
que la limitacin de tiempo a un semestre impone severas restricciones a este
deseo. Por consiguiente, en esta asignatura se presenta una seleccin de ideas
fundamentales sobre determinados temas matemticos tiles, acordes con las
directrices del Libro Blanco para los Estudios del Grado en Qumica (2008).
Estos conocimientos se resumen en los siguientes descriptores generales: (I)
Mtodos Numricos; (II) Introduccin a la Teora y Aplicaciones de la Estadstica;
(III) Anlisis y Propagacin de Errores de Datos Experimentales; (IV) Simulacin

22

PRESENTACIN

y Validacin de Mtodos; (V) Tratamiento de Datos Experimentales Mediante


Computacin. En el primer gran apartado (I) se estudian las cuestiones del
ajuste de funciones mediante desarrollos en bases polinmicas (convencional y
ortogonales mnimos cuadrados-) y sus aplicaciones, abordndose las operaciones numricas bsicas como interpolacin, derivacin, integracin y los
errores asociados, para concluir con la resolucin de sistemas lineales y problemas no lineales tpicos (ecuaciones y sistemas). El segundo gran apartado (II)
se concentra en la introduccin del lenguaje estadstico (funciones de distribucin de probabilidades y sus parmetros), en los aspectos prcticos del anlisis
de muestras (estimaciones, errores, verificacin de hiptesis y teora de pequeas muestras), y se considera el aspecto estadstico de los ajustes de regresin
por mnimos cuadrados, completando lo visto en la primera parte (I) sobre este
ltimo tema. En el tercer apartado (III) se trata la propagacin de errores a travs de ecuaciones matemticas que dan las mediciones indirectas de propiedades, estudiando la propagacin asociada a cada tipo de error (escala, sistemtico, accidental). El cuarto gran apartado (IV) completa con cuestiones
avanzadas aspectos de inters en el clculo numrico y en el tratamiento de
datos, estudindose as: los polinomios trigonomtricos, la resolucin de ecuaciones diferenciales ordinarias, la diagonalizacin de matrices, la integracin
Monte Carlo, algunas aplicaciones de los procesos de minimizacin, y el anlisis de la varianza. En cuanto al quinto apartado (V) dedicado a la computacin,
merece una consideracin ms detenida que se va a hacer a continuacin.
De especial importancia en toda la asignatura es la realizacin de clculos
concretos, aunque, por razones obvias de tiempo, en este curso de introduccin el nivel de sofisticacin no pasar, en general y con las excepciones que
se discutirn ms adelante, de lo que se pueda lograr con una calculadora de
mano o de escritorio. Sin embargo, en los descriptores ya sealados aparecen
dos conceptos: Tratamiento de Datos Experimentales Mediante Computacin,
y Simulacin y Validacin de Mtodos. En ambos casos la computacin es
necesaria y, aunque la presencia de ordenadores personales en los hogares es
amplia, ni todos ellos van a estar preparados con las herramientas de software
adecuadas, ni todos los estudiantes dispondrn de los conocimientos previos
necesarios, como para que puedan ser abordadas sin ms estas tareas computacionales. Hay que sealar, de paso, que no se contempla una asignatura
especfica de Computacin, dedicada al aprendizaje de lenguajes de programacin cientfica, en los Estudios de Grado en Qumica y esto aade unas
graves dificultades al planteamiento general. Se supone as, dentro de dicho

23

CLCULO NUMRICO Y ESTADSTICA APLICADA

planteamiento, que para impartir la presente asignatura los Centros Universitarios estarn dotados tanto de los medios materiales (hardware, PCs,
software correspondiente, etc.), como del personal que instruya en lenguajes de programacin y supervise estas actividades.
Por lo que respecta a la UNED y en cuanto a los medios materiales, pueden
stos darse por satisfechos a efectos prcticos en los Centros Asociados, ya que
prcticamente todos poseen una infraestructura informtica razonablemente
adaptada a esta demanda. La otra cuestin relativa a los lenguajes de programacin y al personal asociado plantea ya muchos problemas por la diversidad
de lenguajes y la escasez de personas preparadas en clculo cientfico y/o en
disposicin de ensearlo (el lenguaje utilizado en este rea sigue siendo por
excelencia el Fortran, aunque cualquier otra opcin que sirva a los mismos
fines es igualmente vlida). Item ms, en este punto hay que recordar la experiencia bien contrastada de que solamente despus de saber cmo se resuelve
un problema a mano es uno capaz de, disponiendo de los conocimientos de
programacin adecuados, abordar el diseo de programas o cdigos para
resolver con el computador los clculos de inters. Hay que notar que la posibilidad de realizar el aprendizaje de un lenguaje de programacin como parte
de la tarea asociada con los crditos Prcticos (1,5) en esta asignatura constituira sin duda un ejercicio de voluntarismo con resultados altamente inciertos. Un lenguaje de programacin es justamente eso, un lenguaje, y su aprendizaje eficaz es demasiado lento para el escaso tiempo disponible.
Una alternativa a esta situacin es la realizacin de Prcticas con la utilizacin de paquetes informticos comerciales (las populares hojas de clculo) que pueden permitir tratar algunas cuestiones de inters en la asignatura, y ello siempre con todos los inconvenientes que plantea un uso
indiscriminado de cajas negras sin una preparacin adecuada. Es evidente que, aunque ciertos tratamientos de datos experimentales pueden realizarse as, otras cuestiones como las de simulacin y validacin, no podran
llevarse a cabo de esta manera. Se dejan a un lado los usos de herramientas
ms sofisticadas (software del tipo de los laboratorios matemticos integrados), pues a este nivel de un segundo curso estn an ms alejadas de los
objetivos que se persiguen. Por otra parte, desde el punto de vista del personal necesario para supervisar determinados tipos sencillos de Prcticas con
los paquetes estndar mencionados antes en los Centros Asociados de
UNED, los problemas son ciertamente menores, pues en definitiva, esto no
es ya computacin, sino que se trata de una Ofimtica avanzada. As, y

24

PRESENTACIN

optando por el menor de dos males, entre la ignorancia absoluta y el (des)


conocimiento parcial, esta alternativa puede resultarle til al estudiante,
abrindole perspectivas desconocidas y motivndole al estudio en profundidad de estos temas con posterioridad. En este sentido, se incluye un Apndice de orientacin con una seleccin de posibles prcticas para que sirvan
como modelo de actividades en este contexto a estudiantes y Tutores.
Para cursar esta asignatura con el mximo aprovechamiento se recomienda haber cursado las asignaturas de Matemticas I y II previas en estos estudios de Grado. En particular sera conveniente para el estudiante refrescar sus
conocimientos, algunos posiblemente adquiridos durante su enseanza secundaria, en los temas que se especifican a continuacin. Anlisis Matemtico:
Funciones reales de una variable real (continuidad, diferenciacin, integracin), funciones de varias variables (derivacin parcial, integracin multidimensional), sucesiones, series numricas y funcionales (Fourier) y ecuaciones
diferenciales ordinarias. lgebra Lineal: Espacios vectoriales, matrices y determinantes. Tambin le ser til recordar conocimientos adquiridos en estudios
anteriores a los universitarios de Probabilidad y Estadstica: Histogramas de
frecuencias, probabilidad, valores medios y dispersiones, distribuciones binomial y Gaussiana. Estos pre-requisitos lo son para el conjunto de la materia y
no resulta posible individualizarlos pormenorizadamente por captulos ms
all de la separacin hecha por bloques temticos y de algunas indicaciones
muy concretas, ya que de una u otra forma todos resultan necesarios para el
estudio que aqu se propone. Las Matemticas son as.
Los matemticos encontrarn este libro ciertamente incompleto, pero
valga en descargo de esta modesta obra que se ha escrito con la esperanza de
prestar un servicio a la comunidad universitaria implicada en la enseanza
de la Qumica en estos tiempos de cambio. Cada uno de los cuatro grandes
apartados tericos del programa est estructurado en captulos. Cada captulo comienza mostrando un sumario con los contenidos principales (los
objetivos generales de conocimiento) y una breve descripcin de ellos. Se
contina con el desarrollo en detalle de los conceptos y las tcnicas, incluyendo ejercicios intercalados para ilustrar unos u otras, y se ofrece en una
seccin independiente una serie representativa de problemas tericos y
numricos. Los problemas marcados con ** son de una mayor dificultad y
pueden ser obviados en una primera lectura. Cada captulo concluye con una
seleccin bibliogrfica de consulta y ampliacin. El texto contiene TRES
apndices, uno para orientacin de prcticas, otro con un repaso de las

25

CLCULO NUMRICO Y ESTADSTICA APLICADA

series de Fourier (Apndice II) por su importante relacin con el Cap. 2 y


parte del Cap. 9, y un tercero que contiene unas breves tablas estadsticas por
completitud del texto. Finalmente se presentan una bibliografa general
comentada, un amplio glosario de trminos, y un ndice alfabtico de materias para facilitar la localizacin de conceptos. Como cuestin adicional se
relacionan en la seccin de Bibliografa General algunas lecturas avanzadas
para que el estudiante interesado pueda considerar los conceptos vertidos en
el texto desde otras perspectivas complementarias. Se ha optado por esta
posibilidad, en vez de recomendar estas actividades por captulo concreto,
para no distraer con trabajo extra al estudiante medio.
El texto est ilustrado con ms de medio centenar de figuras diseadas
en color para facilitar la comprensin y comparacin de conceptos. El lector
encontrar un total de 200 ejercicios y problemas completamente resueltos y
preparados con la intencin de ayudarle con efectividad en el estudio personal, faceta que en el caso de asignaturas de los primeros cursos, como la
presente, cobra una importancia de primera magnitud en lo que debe ser el
trabajo del estudiante en ellas. Slo as podr ste, alcanzada una buena formacin, colaborar con eficacia en trabajos de equipo en un futuro. Como
aplicacin de estas ideas, el momento ms adecuado para los estudiantes de
poner los conocimientos adquiridos en comn y trabajar en grupo ser
durante la realizacin de las Prcticas.
Existen disciplinas en las que puede resultar fcil (y hasta provechoso en
algunos casos) sealar los aspectos ms relevantes para orientar el estudio.
No este el caso de la presente, pues al ser una materia de formacin matemtica bsica todos los conceptos que aqu se discuten son igualmente
necesarios y estn de una u otra forma relacionados, no siendo as aconsejable centrar la atencin en alguno en particular como preponderante, so
pena de cometer un error de juicio importante. Puede, no obstante, resultar
de utilidad indicar el siguiente esquema de influencias entre los diversos
captulos del texto
1 2, 3, 7, 9
2 3, 7,9
3 9, 10
4 7, 9, 10
5 6, 7, 8, 10
6 7, 8, 10
7 1, 10

26

PRESENTACIN

Para no enmaraar innecesariamente este texto, todas las cuestiones relativas a objetivos generales y especficos, competencias y habilidades a adquirir, planificacin del estudio y dems sutilezas pedaggicas, se dejan para las
herramientas complementarias adecuadas, como son las Guas Didcticas del
estudiante y del Tutor, que se incluirn en el Curso Virtual de esta asignatura
a encontrar en la plataforma educativa ALF (http://www.uned.es). El autor ha
intentado eliminar al mximo erratas y errores, pero como es sabido este proceso no converge bien y cabe la posibilidad de que algunos de estos indeseables elementos se hayan deslizado en el material que se presenta. Cualquier indicacin que ayude a eliminarlos ser muy bien recibida.
La escritura de un libro de texto siempre implica una buena cantidad de
renuncias a otros proyectos y actividades por parte del autor, pero tambin
por parte de los miembros de su familia. En el caso presente darles slo las
gracias por su comprensin y nimo se antoja poco, pero al autor ya se le
ocurrir algo al respecto.
Madrid, abril de 2011
Luis M. Ses

27

I
MTODOS NUMRICOS

1. Ajuste de funciones con polinomios: tcnicas de colocacin


y de mnimos cuadrados
2. Ajuste de funciones con polinomios ortogonales
3. Aplicaciones numricas bsicas
4. Resolucin numrica de ecuaciones y sistemas

CAPTULO 1
AJUSTE DE FUNCIONES CON POLINOMIOS:
TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

1.1. Introduccin
A. Polinomios de colocacin
1.2. Ajustes con polinomios de colocacin
1.3. La tabla de diferencias y los polinomios de Newton
1.4. El polinomio de Lagrange
1.5. Otras tcnicas
B. Mnimos cuadrados
1.6. Concepto y aplicacin al caso lineal
1.7. Ajustes de mnimos cuadrados de orden superior
Bibliografa
Problemas tericos y numricos

Se presenta una introduccin operativa de la aproximacin de funciones


reales de variable real. Primero se trata el problema de aproximar mediante
polinomios de colocacin funciones definidas no mediante una expresin analtica sino mediante una tabla numrica (xi, yi), normalmente asociada a un conjunto de resultados experimentales, discutiendo de forma general el problema del
error cometido. Con ello se pone de manifiesto que las operaciones matemticas
aproximadas a realizar quedan reducidas a las meramente aritmticas (suma,
resta, multiplicacin y divisin), lo que redunda en la facilidad de clculo
(manual y con mquina). Por otra parte, el uso de polinomios se ve beneficiado
por el hecho de que las diferenciaciones e integraciones son inmediatas y producen tambin polinomios. Adems sus races son fcilmente calculables y una
alteracin del origen de coordenadas no altera su forma global, ya que slo
cambian sus coeficientes. Se introduce el concepto de tabla de diferencias, muy
til por otra parte en el anlisis de datos (bsqueda de errores de entrada), y se
aplica a la obtencin de dos tipos de polinomios de colocacin clsicos para
datos igualmente espaciados: avance y retroceso de Newton. Seguidamente, se

31

CLCULO NUMRICO Y ESTADSTICA APLICADA

estudia el polinomio de Lagrange, indicado para representar datos no igualmente espaciados. Se contina con la presentacin del problema general de la
aproximacin de mnimos cuadrados en la base polinmica convencional como
una alternativa con propiedades de suavidad a los ajustes polinmicos anteriores.
Las cuestiones tratadas aqu se completarn con detalle en captulos siguientes,
tanto desde el punto de vista numrico como del estadstico.
Colocacin

Mnimos cuadrados

Argumentos
Igualmente espaciados

Argumentos
Desigualmente espaciados

Argumentos
Igual/Desigualmente espaciados

Tablas de diferencias
Pol. Newton
(Pol. Lagrange)

Pol. Lagrange

Casos:
Lineal
(Error RMS)
Orden superior

Caps. 3, 9
Caps. 2, 7

1.1. Introduccin
Supngase un fenmeno fsico o qumico que se describe con dos variables (x, y(x)) como, por ejemplo, una cintica qumica con valores de la concentracin c(t) de un reactivo (o de un producto) en funcin del tiempo t,
(t, c(t)) la posicin x(t) de un mvil unidimensional en funcin del tiempo t, o
la energa de interaccin u(r) de dos tomos en funcin de la distancia entre
ambos, (r, u(r)). La ecuacin exacta del fenmeno en cuestin, en general
y = y(x), pudiera ser conocida o desconocida. Si la funcin es conocida y suficientemente simple, trabajar con ella directamente puede resultar adecuado.
Pero si la funcin es conocida pero complicada y hay que evaluarla muchas
veces, o si la funcin es desconocida y slo viene dada por una tabla finita de
datos (xi, yi), i = 1, 2, 3, , N, entonces la utilizacin de ajustes de datos
numricos particulares de tales funciones utilizando funciones simples conocidas resultan bien muy ventajosos en el caso de la funcin conocida, bien la
forma ms razonable de tratar matemticamente con la funcin desconocida.
Tales ajustes deben claramente seguir criterios definidos que garanticen la
fiabilidad de las manipulaciones que se hagan con los datos.

32

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

Hay una gran variedad de criterios y de funciones simples a utilizar en


este contexto y, dependiendo del problema, algunos son ms adecuados
que otros. Todos ellos y sus diversas aplicaciones forman la disciplina del
Clculo Numrico, de la cul se dice que es tanto una ciencia como un arte,
como puede deducirse fcilmente del comentario anterior. El uso de clculo
con computador est fuertemente ligado a las aplicaciones de esta rama de
las matemticas, mxime teniendo en cuenta que la mayor parte de los problemas de inters en qumica y en fsica no pueden ser resueltos de una
manera analtica exacta. El estudioso de estos temas se ve as en la necesidad
de elaborar estrategias aproximadas para obtener respuestas a los problemas. Estas estrategias se basan en el diseo de los programas de clculo en
lenguajes como fortran, C, pascal, y otros. Aprender estas tcnicas de programacin es un asunto que requiere cursos especializados y no se van a tratar aqu.
La comprensin de la naturaleza de los mtodos numricos puede, no
obstante, lograrse con aplicaciones que no van a mucho ms all de aqullas
que pueden realizarse con calculadoras de escritorio o con el uso de recursos
sencillos en ordenador personal. Esta comprensin es muy importante, pues
capacita al que la posee para analizar los resultados obtenidos y para poder
disear esas estrategias de clculo adecuadas cuando se trata de resolver un
problema nuevo. Como se dice en el argot: Slo cuando se sabe resolver un
problema a mano, se puede empezar a disear bien un programa de clculo. Tal es el objetivo general de este texto: aprender, comprender, y aplicar
estos mtodos en casos suficientemente simples pero a la vez suficientemente ilustrativos. De entre los mtodos utilizados en este campo van a
presentarse en este captulo dos que son bsicos para tratar con funciones
dadas por tablas numricas: los polinomios de colocacin y las aproximaciones de mnimos cuadrados. Los polinomios de colocacin ajustan exactamente los puntos tabulares y forman la base del clculo numrico clsico
(interpolacin, diferenciacin, integracin, etc.). Las aproximaciones de
mnimos cuadrados realizan una suavizacin de los puntos tabulares,
pero como nota distintiva estn relacionados con conceptos fundamentales
para el estudio de sistemas atmicos y moleculares, como son los desarrollos
en serie de funciones ortogonales. Por otra parte, no hay que desdear nunca el uso de representaciones grficas de los datos (xi, yi) que orienten en la
decisin del tipo de ajuste a realizar.

33

CLCULO NUMRICO Y ESTADSTICA APLICADA

A. POLINOMIOS DE COLOCACIN
1.2. Ajustes con polinomios de colocacin
El uso de polinomios p(n) (x) para aproximar funciones (conocidas o no)
tiene una gran cantidad de ventajas, ya que la aproximacin
y( x) p( n) ( x) = a0 + a1 x + a2 x2 + ... + an xn

(1.2.1)

involucra slo potencias xj con j entero positivo, lo que resulta muy conveniente tanto desde el punto de vista del clculo manual como con mquina de calcular. Adems, tanto la derivacin como la integracin de p(n) (x)
son operaciones inmediatas que producen de nuevo polinomios, y las n races de p(n) (x) pueden calcularse con un esfuerzo razonable. Adems, un
mero cambio del origen de coordenadas no afecta a la forma general de la
aproximacin, sino slo a los coeficientes aj. Por brevedad en la notacin,
en adelante y cuando convenga se utilizar [x1, x2] x1 x x2 para denotar un intervalo cerrado y (x1, x2) = x1 < x < x2 para denotar un intervalo
abierto.
Todo esto est relacionado con el hecho de que la base de los polinomios
{xn}n=0, = {1, x, x2, x3,...} es completa sobre cualquier intervalo cerrado [x1, x2],
lo que forma la esencia del conocido teorema de Weierstrass que establece
que cualquier funcin continua arbitraria y(x) puede expresarse con tanta
precisin como se desee mediante un polinomio
y( x) p( n) ( x) = a0 + a1 x + a2 x2 + ... + an xn ; x1 x x2

(1.2.2)

sin ms que ir aadiendo trminos aj xj al desarrollo. Esto implica la acotacin siguiene para la diferencia entre la funcin y la aproximacin en el
intervalo:
y( x) p( n) ( x) <

(1.2.3)

en donde e es una cota prefijada y el orden n a alcanzar depende de tal cota


n = n(e). El anterior es sencillamente el criterio de convergencia uniforme (tiene lugar en todo el intervalo a la vez) y la demostracin debida a Bernstein
(1912) involucra un tipo especial de polinomios que no son muy adecuados
en la prctica para el clculo. No obstante, se pone con todo ello de mani-

34

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

fiesto el carcter completo de la base polinmica como base del espacio vectorial de las funciones continuas en un intervalo finito (la dimensin de este
espacio vectorial es infinita). El uso de un criterio de convergencia diferente,
como el de convergencia en media que se ver ms adelante, lleva naturalmente al concepto de ajuste por mnimos cuadrados. El problema a resolver
en ambos casos es el de la determinacin de los coeficientes aj.

Opciones de ajuste polinmico


Dentro de los ajustes polinmicos hay un buen nmero de opciones,
colocacin, osculacin, splines, etc., pero hay que indicar primero que en la
prctica es preferible utilizar varios polinomios de grado pequeo para
representar secciones de la funcin y(x) en vez de utilizar un nico polinomio de grado elevado que represente a la funcin en su conjunto. Esto
resulta especialmente importante para minimizar el efecto de las fuertes
oscilaciones de los polinomios en los extremos del intervalo de ajuste, que
son tanto ms pronunciadas cuanto mayor es el grado, y pueden destruir la
calidad de una operacin numrica (derivada, integral, etc.).
En esencia la aproximacin por polinomios de grado pequeo (entre 1 y
5) est relacionada con el familiar desarrollo de Taylor en torno a un punto
x = x0, y truncado a un cierto orden, para una funcin (de buen comportamiento) continua con derivadas continuas y finitas:
dy
1 d2 y
1 dn y
y( x) y( x0 ) + ( x x0 ) + 2 ( x x0 )2 + .... + n ( x x0 )n (1.2.4)
2! dx
n! dx
dx 0
0
0
del que se sabe que, cuanto ms cercanos sean x y x0 un grado bajo en el
truncamiento ya realiza una buena aproximacin. En este caso de los polinomios de Taylor la magnitud del error cometido al truncar a un cierto
orden n es, en principio, conocida. Se trata del resto de Lagrange:
Rn+1 ( x) =

y( n+1 ( )
( x x0 )n +1
( n + 1)!

(1.2.5)

en donde x es un punto indeterminado dentro del intervalo abierto definido


por x y x0 y que depende de x, x = x(x), y se denota con y(n+1 a la derivada

35

CLCULO NUMRICO Y ESTADSTICA APLICADA

(n + 1) sima de y(x). Esta expresin, conocida y(x), permite acotar en los


casos adecuados el valor absoluto del error Rn+1(x), una operacin siempre
necesaria, pero que en el caso de la aproximacin polinmica general no va
a ser siempre posible de ser llevada a cabo con la misma exactitud que la de
Taylor.

El criterio de colocacin: casos simples


Si slo se conocen dos datos o puntos (x1, y1) y (x2, y2), con x1 < x2 el grado de la aproximacin a y(x) ser como mximo del tipo lineal, es decir una
lnea recta de la forma
y( x) p(1) ( x); y y1

y2 y1
( x x1 )
x2 x1

(1.2.6)

una representacin que claramente coloca la funcin en los puntos tabulares y(x1) = y1, y(x2) = y2. Se representa as linealmente lo que sucedera con
y(x) para cualquier x1 x x2, algo que se conoce como interpolacin, pero
tambin representa linealmente todo lo que sucedera con y(x) para cualquier x exterior al intervalo de definicin conocido (extrapolacin). La interpolacin tiene sentido, pero la extrapolacin ya no lo tiene y como se ver
ms adelante da, salvo casos muy especiales, estimaciones completamente
errneas del comportamiento de la funcin. Para simplificar la notacin, y
sabiendo que el polinomio es siempre una aproximacin a la funcin exacta
desconocida, en adelante se escribirn convencionalmente con el signo igual
p(1) ( x) = y ; y y1 =

y2 y1
( x x1 )
x2 x1

(1.2.7)

Si hubiera que hacer distinciones entre los valores reales exactos y los
estimados con la aproximacin, se denotarn oportunamente.
El caso siguiente es el de conocer tres datos o puntos, (x1, y1), (x2, y2), y
(x3, y3) con x1 < x2 < x3 lo que va dar una aproximacin de colocacin como
mximo cuadrtica:

p ( 2) ( x ) = y = a0 + a1 x + a2 x 2 ; x1 x x3

36

(1.2.8)

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

debiendo estudiarse la compatibilidad del sistema de ecuaciones lineales


resultante para obtener los coeficientes aj
y1 = a0 + a1 x1 + a2 x12
y2 = a0 + a1 x2 + a2 x22

(1.2.9)

y3 = a0 + a1 x3 + a2 x32
De nuevo se plantea la cuestin de lo que sucede para diferentes valores
de x y la discusin es mutatis mutandi la misma que antes relativa a (1.2.6)
en cuanto a la interpolacin e extrapolacin.
EJERCICIO 1.2.1
Discutir la existencia y unicidad de un polinomio p(2)(x) = a0 + a2x2 que
ajuste una tabla de dos puntos (x1, y1), (x2, y2).
La parbola que se plantea como funcin de ajuste es de eje vertical y con
slo dos incgnitas a0 y a2, lo que dados dos puntos tiene, en principio, sentido. El sistema a resolver es pues
y1 = a0 + a2 x12
y2 = a0 + a2 x22
y para que sea compatible determinado el rango de la matriz de los coeficientes A debe necesariamente ser r(A) = 2 = nmero de incgnitas. Esto
implica el determinante no nulo
1 x12
1 x22

= x22 x12 0

lo que lleva a que el ajuste tiene sentido si se verifican las condiciones x1 x2.
Si las dos abscisas son iguales, x1 = x2, no hay parbola definida con eje vertical que pase por tales puntos, y si las dos abscisas son de signo contrario,
x1 = x2, entonces puede haber infinitas parbolas que pasen por ellos (Fig.
1T.1). De manera que para que exista una nica parbola deben satisfacerse
las condiciones indicadas por la no anulacin del determinante.

37

CLCULO NUMRICO Y ESTADSTICA APLICADA

Figura 1T.1. Ejemplos de la no unicidad en un polinomio de ajuste al no haber condiciones


suficientes. Existen infinitos polinomios de segundo grado p(2)(x) = a0 + a2x2 que pasan
por los puntos (1, 2) y (+1, 2).

Podra pensarse que el problema ha quedado resuelto, pero queda por


analizar un detalle ms relacionado con la naturaleza de la solucin obtenida. Ntese que no se ha hecho ninguna referencia a los valores yk pues no
van a afectar a la existencia de solucin en tanto se cumplan las condiciones
sealadas arriba. Sin embargo, si y1 = y2 entonces
p(2 ) ( x) = a0 + a2 x2 = { a2 = 0} = a0 ; x1 x2
y la solucin final no mantendra la forma cuadrtica inicial. Desde el punto
de vista de la utilidad de la aproximacin en aplicaciones concretas esta circunstancia puede perfectamente representar un problema no deseado. El calculista numrico debe, por consiguiente, estar precavido contra una gran
variedad de efectos que, no siendo errneos matemticamente, s pueden
resultar inconvenientes en las aplicaciones.

Observaciones de inters
En general con N + 1 datos, {(xi, yi)}i=1,N+1, con los valores xi en orden creciente, puede ensayarse en principio un polinomio grado N, p(N)(x) = y = a0 +

38

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

a1x + a2x2 +...+ aNxN, del que habr que estudiar su compatibilidad y las
cuestiones sobre su validez en puntos x arbitrarios. En ausencia de ms
informacin sobre la funcin exacta y(x) el criterio de colocacin suele dar
buenas aproximaciones para el comportamiento global de dicha funcin
siempre que: i) se utilicen grados polinmicos no muy elevados, lo que
implica una segmentacin de la tabla original; y ii) se restrinja su uso a la
regin conocida x1 x xN+1 (interpolacin). La prediccin de lo que puede
suceder fuera de esta regin (extrapolacin) suele ser errnea en la mayor
parte de los casos. Hay que notar que la resolucin de un sistema de ecuaciones, del tipo (1.2.9), para determinar los coeficientes de un polinomio de
grado N, resulta poco eficiente. Es preferible utilizar tcnicas un tanto
ms sofisticadas como: iii) los polinomios de Newton (avance, retroceso),
Everett u otras versiones cuando los datos estn igualmente espaciados
(xk+1 xk = h = constante >0; o iv) el polinomio de Lagrange cuando los
datos estn desigualmente espaciados.

1.3. La tabla de diferencias y los polinomios de Newton


Para una funcin tabular definida por una tabla de datos {(xk, yk)}k=0,N con
los argumentos xk igualmente espaciados xk+1 xk = h = constante > 0 una forma eficiente para poder determinar su polinomio de colocacin viene dada
por la construccin que se muestra en la Tabla 1.1. Esta construccin se
contina por la derecha y hacia abajo hasta agotar todas las posibilidades de
efectuar diferencias entre valores yk y sus magnitudes Dnyk asociadas. Estas
Dnyk se denominan diferencias de avance (de Newton) y su forma general es claramente Dnyk = Dn1yk+1 Dn1yk. El orden mximo n con columna no nula que
puede alcanzarse en este tipo de tabla es, para N + 1 puntos, justamente N.
Puede suceder, sin embargo, que aparezca constancia en una determinada columna n < N, Dnyk = constante, lo que directamente indica que las
diferencias de orden n + 1 van a ser todas nulas. En este caso la funcin
admite una representacin polinmica de grado n mediante el polinomio de
avance de Newton. Si la funcin tabular es en realidad un polinomio, ste
ser el resultado obtenido con el de avance recin mencionado, siempre
que el nmero de datos utilizado as lo garantice, y la representacin ser
exacta. Si la funcin no es polinmica, entonces la representacin obtenida
ser de utilidad para trabajar en la regin de definicin de la tabla.

39

CLCULO NUMRICO Y ESTADSTICA APLICADA

Tabla 1.1. Tabla de diferencias de avance para datos igualmente


espaciados: xk+1 xk = h = constante
k

xk

yk

x0

y0

D2yk

Dyk

D3yk

Dy0 = y1 y0
1

x1

D2y0 = Dy1 Dy0

y1

D3y0 = D2y1 D2y0

Dy1 = y2 y1
2

x2

y2

D y1 = Dy2 Dy1
D3y1 = D2y2 D2y1

Dy2 = y3 y2
3

x3

D2y2 = Dy3 Dy2

y3

D3y2 = D2y3 D2y2

Dy3 = y4 y3
4

x4

D2y3 = Dy4 Dy3

y4
Dy4 = y5 y4

El polinomio de avance de Newton


Para una tabla igualmente espaciada el polinomio de avance de Newton
est dado por
1
1
k( k 1) 2 y0 + k( k 1)( k 2) 3 y0 + ... +
2!
3!
1
+... + k( k 1)...( k n + 1) n y0 + ...
n!

pk = y0 + ky0 +

(1.3.1)

en donde por comodidad se ha utilizado la variable de ordenacin auxiliar k


k=

xk x0
; xk +1 xk = h = constante >0; 0 k N
h

y que est definida incluso para puntos no tabulares pero comprendidos dentro del rango delimitado por los argumentos xk. As los valores k no son
necesariamente enteros, por ejemplo para x0 < x < x1 los valores de esta
variable de orden estaran entre 0 < k < 1 para x1 < x < x2 los valores de esta
variable de orden estaran entre 1 < k < 2, y as sucesivamente. La expresin

40

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

general para el error del ajuste por colocacin recuerda a la del resto de
Lagrange (1.2.5) y para un polinomio de grado n es
y( x) p( n) ( x) =

( x x0 )( x x1 )...( x xn ) ( n+1
y ( )
( n + 1)!

(1.3.2)

en donde x es un punto indeterminado que est dentro del intervalo abierto


definido por x0 y xn pero no puede coincidir con ninguno de los puntos
tabulares. Ms adelante, en el Cap. 3 se tratar con esta expresin en detalle
para las aplicaciones.
EJERCICIO 1.3.1
Obtener la tabla de diferencias para la funcin y(x) = 3x2 + x 1, en el intervalo [1, 1] utilizando un espaciado h = 0,25.
Cualquier otro espaciado h y utilizando un intervalo de tabulacin diferente presentara un resultado anlogo con constancia en las diferencias
segundas, pero no necesariamente con el mismo valor constante.
Tabla 1.2. Ejercicio 1.3.1
Tabla de diferencias de avance para y(x) = 3x2 + x 1; h = 0,25
k

xk

yk

0,75

0,0625

0,5

0,75

Dyk

D2yk

D3yk

1,0625
0,375
0,6875

0
0,375

0,3125
3

0,25

1,0625

0
0,375

0,0625
4

0
0,375

0,4375
5

0,25

0,5625

0
0,375

0,8125
6

0,5

0,25

0
0,375

1,1875
7

0,75

1,4375

0
0,375

1,5625
8

41

CLCULO NUMRICO Y ESTADSTICA APLICADA

EJERCICIO 1.3.2
Obtener los polinomios de avance de Newton para una tabla de diferencias
en la que se tienen los comportamientos: a) D2yk = 0; b) D3yk = 0.
a) El polinomio en este caso ser de grado n = 1 y es sencillamente la
ecuacin de una lnea recta:
pk = y0 + ky0 = y0 +

x x0
y0 = y0 + m( x x0 )
h

b) El polinomio ser ahora de grado n = 2 y es la parbola:


1
k( k 1) 2 y0 =
2!
x x0
1 ( x x0 )( x x0 h) 2
y0 +
y0 +
y0 = a + bx + cx2
2
2!
h
h
pk = y0 + ky0 +

El polinomio de retroceso de Newton


La numeracin de los datos en una tabla igualmente espaciada no tiene
porqu empezar necesariamente en k = 0 y puede hacerse esta operacin
tomando como origen cualquier punto de la tabla. La eleccin anterior es la
natural cuando se va a calcular un polinomio de avance de Newton, pero un
polinomio de diferencias reversivas o de retroceso tomara la numeracin
k = 0 partiendo del dato N y asignando al resto de los datos ndices negativos
correlativos. La situacin se resume en la Tabla 1.3, en la que como antes se
tienen valores xk crecientes al ir hacia abajo.
Como puede comprobarse la tabla es idntica a la anterior de avance, los
resultados para las diferencias se obtienen de la misma forma, solamente la
notacin de cada elemento difiere. Con esta nueva construccin se puede
determinar el polinomio de retroceso de Newton:
1
1
k( k + 1)2 y0 + k( k + 1)( k + 2)3 y0 + ... +
2!
3!
1
+... + k( k + 1)...( k + n 1) n y0 + ...
n!

pk = y0 + ky0 +

42

(1.3.3)

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

Tabla 1.3. Tabla de diferencias de retroceso para datos igualmente espaciados:


xk+1 xk = h = constante >0
k

xk

yk

yk

2yk

3yk

y3 = y3 y4

x3

y3

2y2 = y2 y3
3y1 = 2y1 2y2

y2 = y2 y3
2

x2

2y1 = y1 y2

y2

3y0 = 2y0 2y1

y1 = y1 y2
1

x1

2y0 = y0 y1

y1
y0 = y0 y1

x0

y0

con la definicin de la variable auxiliar k idntica a la de antes, pero cuyos


valores son ahora k 0 al estar el origen en el argumento x mximo de la
x x0
tabla k =
; x0 x.
h
Observaciones prcticas
Hay que tener en cuenta que una tabla finita con N + 1 datos igualmente
espaciados puede representarse igualmente tanto con el polinomio de avance como con el de retroceso. Si se efectan y utilizan todas las diferencias
hasta el orden n mximo posible, ambas representaciones son idnticas, ya
que el polinomio que ajusta una tabla finita es nico (Fig. 1T.2). El utilizar
una u otra versin, avance o retroceso, depende de la aplicacin que vaya a
hacerse. Para una precisin en el clculo prefijada, si la zona de inters
est en la parte superior, puede ser suficiente utilizar una aproximacin de
avance con grado j < n que ya suministre resultados aceptables y evite engorrosas operaciones que no los mejoraran sustancialmente. Lo mismo sucede con el polinomio de retroceso si el inters se concentra en la zona inferior
de la tabla.

43

CLCULO NUMRICO Y ESTADSTICA APLICADA

Figura 1T.2. (a) Polinomio de colocacin de 5 grado a una serie de datos. (b) Ajustes parciales
a los datos anteriores utilizando polinomios de 2 grado consecutivos.

En lnea con la discusin precedente, conviene sealar que existen otros


polinomios de colocacin para tablas igualmente espaciadas y que estn
adaptados para situaciones en las que el inters est en zonas apartadas de
los extremos (Gauss, Everett, etc.). Estas versiones utilizan un origen situado en un punto interior de la tabla y numeran los datos como positivos o
negativos segn sean de mayor o menor argumento xk que el del origen
seleccionado x0. Ms adelante, en el Cap. 3 y al estudiar las aplicaciones, se
considerar con ms detalle este tipo de ajuste central.
En todos los casos de polinomios de ajuste por colocacin se utilizan
determinados operadores de diferencia, como los de avance D o de retroceso
presentados arriba para los polinomios de Newton, o los denominados operadores de diferencia central utilizados en los polinomios de Gauss, Everett,
etc. Estos operadores permiten una formulacin compacta de las expresiones
de estos polinomios y utilizan todos la misma tabla de diferencias, pero
seleccionando puntos de ella adecuados a cada caso. Tambin conviene
insistir de nuevo en que resulta siempre ms ventajoso utilizar polinomios de
grado pequeo que representen segmentos de la tabla, en vez de utilizar
representaciones polinmicas de alto grado que incluyan la tabla completa.
1.4. El polinomio de Lagrange
Cuando la tabla de datos {(xi, yi)}i=1,N+1 no est igualmente espaciada las
tcnicas anteriores no son utilizables y hay que recurrir a otros mtodos. El
ms sencillo, siguiendo el criterio de colocacin de puntos tabulares, es el lla-

44

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

mado polinomio de Lagrange. Si se desea ajustar la tabla completa, esto se


logra con el algoritmo:
N +1

p( N ) ( x) =

i =1

( x xj )

y( xi ); j i j = 1, 2,.., i 1, i + 1,..., N , N + 1
j i ( xi xj )

(1.4.1)

en donde los casos i = 1 e i = N + 1, son simples de interpretar. Esta expresin


se puede reducir utilizando menos puntos para representar segmentos de esa
tabla. La suma incluye tantos sumandos como puntos se utilicen, siendo
cada sumando un producto de N factores, y con j recorriendo los nmeros
entre 1 y N + 1 evitando siempre el caso j = i. Es fcil comprobar que el algoritmo anterior reproduce (coloca) la tabla o su segmento ajustado. La aplicacin de este algoritmo puede parecer un tanto complicada y se va a ilustrar
con un ejemplo numrico concreto en el siguiente Ejercicio.
EJERCICIO 1.4.1
Se conocen las tres parejas de datos temperatura-presin siguientes pertenecientes a la curva de fusin del helio-4:
T(K)
P(kg/cm2)

10
604,2506

13
917,7237

20
1810,5190

Encontrar una representacin polinmica para esta tabla.


Va a tomarse la temperatura como variable independiente y como hay
tres datos el polinomio ser en principio de grado 2: P(2)(T) = a + bT + cT2.
Para determinar los coeficientes podra efectuarse la resolucin del sistema
de ecuaciones (1.2.9) derivado de sustituir los datos. Esto sera esencialmente correcto, pero en general resulta siempre ms eficiente calcular el
polinomio de Lagrange, que en este caso viene dado por
P ( 2 ) (T ) =

(T 10 )(T 13)
(T 13)(T 20)
(T 10 )(T 20)
P2 +
P1 +
P =
(13 10 )(13 20)
(20 10 )(20 13) 3
(10 13)(10 20 )

(T 13)(T 20)
(T 10 )(T 20)
(T 10)(T 13)
604, 2506 +
1810, 5190
917, 7237 +
(10 13)(10 20 )
(20 10)(20 13)
(13 10 )(13 20)
Esta es una expresin muy cmoda para evaluar valores de P en temperaturas comprendidas en el intervalo de definicin (interpolacin).

45

CLCULO NUMRICO Y ESTADSTICA APLICADA

1.5. Otras tcnicas


Todas las estrategias de ajuste anteriores van a considerarse con ms
detalle en el Cap. 3 en conexin con sus aplicaciones. Hay que sealar que no
son las nicas y que existe una gran variedad de tcnicas de colocacin por
polinomios aparte de ellas y conviene mencionar algunas: i) el mtodo de
Aitken, que utiliza polinomios de colocacin con grados crecientes que van
ajustando subconjuntos de los puntos tabulares; ii) la tcnica de las diferencias divididas, que generalizan las diferencias vistas antes construyendo
cocientes de stas entre diferencias de argumentos; iii) los polinomios osculadores, que no slo colocan datos tabulares de la funcin, sino tambin
valores de las derivadas de sta en esos puntos; y iv) los ajustes por splines
cbicos, que utilizan los valores de la funcin y estimaciones de su derivada
segunda para construir aproximaciones cbicas entre cada dos puntos tabulares consecutivos. En este ltimo caso el polinomio de splines toma entre
(xi, yi) y (xi+1, yi+1) la forma
p( 3 ) ( x) = Ayi + Byi +1 + Cyi + Dyi+1

(1.5.1)

en donde
xi+1 x
xi+1 xi

B=

x xi
xi+1 xi

(1.5.2a )

1 3
( A A)( xi+1 xi )2
6

D=

1 3
( B B)( xi+1 xi )2
6

(1.5.2 b))

A=
C=

Se trata de un ajuste aplicable a cualquier tipo de tabla. Una eleccin


comn es y1 = yN = 0 en los extremos de la tabla (splin cbico natural).

B. MNIMOS CUADRADOS
1.6. Concepto y aplicacin al caso lineal
Una tcnica de aproximacin de funciones definidas por una tabla numrica
con N + 1 puntos, {(xi, yi)}i=0,N que no tiene que estar necesariamente igualmente
espaciada, y que es diferente de la de colocacin, es la de mnimos cuadrados.
Aqu el criterio director es el de hacer mnima la suma de los cuadrados de las
diferencias entre cada valor de entrada yi y su valor correspondiente y%i obtenido

46

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

a travs de la expresin que se postula como aproximacin. Para el caso de


una expresin polinmica de grado n esta estimacin vendra dada por
n

y% i = y% ( xi ) =

xm
m i

= a0 + a1 xi + a2 xi2 + ... + an xin

(1.6.1)

m= 0

Para ajustar el conjunto completo de puntos se exige que los coeficientes


am sean tales que
N

S=

[ y( x ) y% ( x )]

= mnimo 0

(1.6.2)

i= 0

Ntese que en mnimos cuadrados la nica relacin existente entre el grado del polinomio n y el nmero de puntos a ajustar N + 1 es que n < N, es
decir que lo habitual es tener un nmero de puntos bastante mayor que el
grado del polinomio de ajuste. Si n = N, entonces S = 0 y se tendra con
(1.6.1) el polinomio de colocacin a la tabla.
La funcin S depende de los coeficientes am como variables y su minimizacin se lleva a cabo de la manera habitual: derivando parcialmente
con respecto a los am, igualando a cero cada una de estas n ecuaciones lineales y resolviendo el sistema resultante. La demostracin general de que
este sistema tiene solucin nica y que efectivamente da un mnimo requiere recursos matriciales fuera del alcance de este curso. Sin embargo, para
entender cmo se procede y, adems por la importancia prctica que presenta, es muy ilustrativo estudiar con detalle el caso del ajuste lineal.

Estudio del caso lineal: determinacin de los coeficientes


La estimacin lineal y%i = y%(xi) = a0 + a1xi lleva a la minimizacin de la funcin
N

S=

[ y( x ) a a x ]
i

1 i

(1.6.3)

i= 0

a travs de las condiciones necesarias


N
S
=

yi
2

a
0a
i= 0

a0

i= 0

i= 0

a1 xi = 0

(1.6.4a)

47

CLCULO NUMRICO Y ESTADSTICA APLICADA

N
S
xi yi
2
=

a
1a
i = 0

a0 xi

i=0

i=0

a1 xi2 = 0

(1.6.4b)

que se reducen finalmente al sistema de dos ecuaciones (normales) con dos


incgnitas a0 y a1 siguiente
N

i= 0

i= 0

yi = ( N + 1) a0 +

xi yi =

i= 0

x a ;
i

b0 = s0 a0 + s1 a1

(1.6.5a)

b1 = s1a0 + s2 a1

(1.6.5b)

i= 0

xi a0 +

i= 0

xi2 a1 ;

en donde las definiciones de los parmetros, b y s, son inmediatas. Las soluciones de este sistema son

s2 b0 s1b1
s b sb
; a1 = 0 1 1 20
2
s0 s2 s1
s0 s2 s1

a0 =

(1.6.6)

Con ello el conjunto inicial de puntos {(xi, yi)}i=0,N se representa mediante


la denominada recta de mnimos cuadrados dada por
y y% = a0 + a1 x ; x0 x xN
Ahora hay que analizar la naturaleza de esta solucin.

Unicidad de la solucin
La solucin anterior es nica, pues el determinante de la matriz de los
coeficientes s es distinto de, y mayor que, 0:
D=

48

s0

s1

s1

s2

= s0 s2 s12 > 0

(1.6.7)

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

Esto puede probarse del modo siguiente:


N

D = ( N + 1)

xi2

i=0

i=0

xi = ( N + 1)
xi2

i=0

x x x x
2
i

( N + 1)

i= 0

2
i

i k

i=0 k i

i=0

x x

i k

i=0 k=0

(1.6.8)

=N

x 2 x x ; i, k = 0,1, 2,..., N
2
i

i k

i=0

i< k

en donde la doble suma completa sobre i y k se ha desdoblado en dos contribuciones i = k e i k. Ntese la abreviatura utilizada para la suma (doble)
restringida i < k

xx

i k

= x0 x1 + x0 x2 + x0 x3 + ... + x0 xN +

i< k

x1 x2 + x1 x3 + ... + x1 xN +
............................ +
xN 1 xN
El paso final es notar que D puede escribirse como una suma de trminos
positivos
D=

i< k

( xi xk )2 = N

x 2 x x
2
i

i= 0

i k

>0

i< k

Se concluye as la compatibilidad del sistema y la solucin nica para


ste (rango = 2 = nmero de incgnitas).
El carcter de mnimo
La siguiente cuestin es la de la naturaleza como mnimo de la solucin.
Sobre bases intuitivas la cuestin parece clara: una suma de cuadrados tiene
como valor mnimo absoluto posible S = 0, y la bsqueda del punto (a0, a1)
que lleve a la situacin estacionaria dada por las ecuaciones (1.6.4) parece
que garantiza ya la del mnimo. Adems, S no parece ser un problema de
mximos, pues por mera construccin una suma de cuadrados no est, en
principio, acotada superiormente.
Es ilustrativo, sin embargo, probar que la solucin encontrada conduce
verdaderamente al mnimo para S consistente con la tabla de datos. Para ello

49

CLCULO NUMRICO Y ESTADSTICA APLICADA

hay que demostrar que el Hessiano H es positivo (existe extremo local para la
funcin S)

H=

2 S
a02

2 S
a0 a1

2 S
a1 a0

2 S
a12

>0

(1.6.9)

y que sus elementos diagonales tambin lo son (el extremo es un mnimo)


2 S
2 S
>
>0
0
;
a02
a12

(1.6.10)

Todo esto equivale a la condicin de que la forma cuadrtica S(a0, a1) sea
definida positiva. De aqu en adelante, y por simplicidad de notacin, se
omitirn cuando no sean necesarias las variables constantes en las derivaciones parciales. Se tienen as las desigualdades
2 S
S
=

= 2( N + 1) = 2 s0 > 0
2
a0 a0 a0
N

2 S
S
=
xi2 = 2 s2 > 0
=2

2
a1 a1 a1
i= 0

(1.6.11a)

(1.6.11b)

Por otra parte, las derivadas cruzadas son


N

2S
2 S
=
=2
xi = 2 s1
a0 a1 a1a0
i= 0

(1.6.12)

y el Hessiano resulta
H=

2 s0

2 s1

2 s1

2 s2

= 4( s0 s2 s12 ) = 4 D > 0

(1.6.13)

quedando as demostrada la cuestin.


La bondad del ajuste
El ltimo punto es de la bondad o adecuacin de la expresin lineal
propuesta y%i = y% (xi) = a0 + a1xi para representar a la tabla de datos. Primero

50

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

ntese que la funcin lineal no pasa, en principio, necesariamente por los


puntos que pretende ajustar y, en general, las desviaciones son yi y%i 0. Se
ha obtenido que la suma de los cuadrados de estas desviaciones, S(n = 1), es
un mnimo, pero deben hacerse dos consideraciones: a) se obtendra una
representacin mejor con un polinomio de mnimos cuadrados de orden
mayor n 2 en el sentido de obtener un valor para S an menor, S(n 2) <
S(n = 1)?; b) tiene sentido realizar tal ajuste ampliado?
Estas dos consideraciones pueden estar incluso relacionadas, ya que si
por argumentaciones tericas se supiera que la relacin esperada debe ser
lineal, entonces carecera de sentido realizar ajustes con n 2. Este tipo de
operacin caso de ser exitosa podra indicarnos un fallo en el modelo terico, aunque esto no suele ser habitual, o bien un problema sistemtico en la
toma de datos tabulares. Si por el contrario, no hay informacin a priori
sobre la frmula a ajustar, entonces la bsqueda con n 2 puede resultar de
gran inters para mejorar al mximo la descripcin emprica del fenmeno
mediante una frmula matemtica manejable, como es la de mnimos cuadrados, y que adems suaviza los posibles errores en los datos de entrada.
Hay que tener presente que la metodologa de mnimos cuadrados puede
ser analizada desde dos puntos de vista complementarios: el del mero clculo
numrico tratado anteriormente, y el de los aspectos estadsticos que se
estudiar posteriormente en este texto (Caps. 5, 7, 10). Todo ello est relacionado con las posibles medidas del error del ajuste y de la significacin
estadstica asociada, temas sobre los que se hablar ms adelante en conexin con el error RMS, el coeficiente de correlacin, y el anlisis de la
varianza. Finalmente, debe sealarse que la tcnica de mnimos cuadrados es
una muy poderosa tcnica general dentro del campo de la optimizacin de
funciones, estando adems en la raz de las aplicaciones de representacin
de funciones con convergencia en media (desarrollos en serie de funciones
ortogonales) que se estudiarn ms adelante (Caps. 2 y 9).

La utilidad extendida del caso lineal


El caso lineal es particularmente interesante por su simplicidad y por las
posibilidades de reducir dependencias funcionales complicadas y = f(x) a
relaciones lineales mediante cambios adecuados de variables. As, por ejemplo, relaciones empricas tpicas reducibles a forma lineal son las siguientes:

51

CLCULO NUMRICO Y ESTADSTICA APLICADA

i) Doble logartmica: y = axm ln y = ln a + m ln x,


que se puede expresar como
Y = ln a + mX ;

Y = ln y ; X = ln x ; A = ln a Y = A + mX

(1.6.14)

con la condicin de que los valores de las variables y y del parmetro a


sean todos mayores que cero y > 0, x > 0, a > 0.
ii) Semilogartmica: y = amx ln y = ln a + x ln m,
que se puede expresar como
Y = ln a + X ln m ; Y = ln y; X = x; A = ln a ; M = ln m Y = A + MX (1.6.15)
con la condicin de que los valores de la variable y y de los dos parmetros
sean todos mayores que cero y > 0, m > 0, a > 0.
iii) Hay otros cambios de variable admisibles (deben ser montonos en el
dominio de variacin de la variable) que incluso pueden hacer uso de puntos
tabulares para simplificar el problema. Por ejemplo, pueden mencionarse

Y = aX + b; ( y 0 )
y

(1.6.16)

X = x x0

y = ax + bx + c ;
y y0 Y = aX + d
Y = x x
0

(1.6.17a)

y=

1
;
ax + b

X = x

Y = 1 /

En (1.6.17) se ha utilizado un punto tabular, (x0, y0), para hacer lineal la


funcin cuadrtica, perdiendo uno de los puntos de entrada y debiendo
realizar el ajuste lineal con N puntos {(xi, yi)}i=1,N y las nuevas variables transformadas X e Y. En estos casos conviene ensayar con varias elecciones del
punto a utilizar para ver la consistencia de los resultados, y una solucin
final razonable (hay otras) suele ser la de tomar los valores medios de los
parmetros a y d resultantes de estos ensayos. No hay que olvidar transformar a las variables originales del problema, que suelen tener asociado un
sentido fsico-qumico, y que en el caso (1.6.17a) puede calcularse con
d = b + 2 ax0 ; c = y0 bx0 ax02

52

(1.6.17b)

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

Una buena comprobacin de que el ajuste tiene sentido y no se han cometido


errores de bulto viene dada por la comparacin entre los valores yi de la tabla
de entrada y aqullos que se pueden estimar con la relacin postulada y%i = yi,est..
iv) El uso de representaciones grficas simples de las funciones ms
comunes (lineal, doble logartmica y semilogartmica) en diferentes tipos de
papel grfico estndar (milimetrado, doble logartmico y semilogartmico) no
debe desdearse, y es siempre una gran ayuda en este asunto. De una manera rpida se puede tener una idea de cul es la forma funcional que esconden
los datos y proceder as a su ajuste numrico final por mnimos cuadrados
con un conocimiento fundado. Relaciones empricas ms generales para el
ajuste de datos que pueden ser mejoradas mediante la tcnica de los mnimos cuadrados se presentarn en el Cap. 7.
v) Por el momento una expresin til del error de ajuste de mnimos cuadrados es el denominado error RMS (root-mean square) que para N + 1
datos se construye como
N

RMS =

( yi yi,est. )2

i= 0

N +1

Smn
N +1

(1.6.18)

que contiene al valor mnimo Smin resultante para S. Esta expresin general
puede utilizarse tambin para los ajustes de mnimos cuadrados de orden
superior n 2.
Muchos de los detalles anteriores pueden verse ilustrados en el siguiente
Ejercicio en el que se presentan someramente algunas ideas bsicas sobre el
error en los clculos.
EJERCICIO 1.6.1
Para los elementos qumicos comprendidos entre Z = 20 (Ca) y Z = 30 (Zn) y
utilizando un equipo de baja precisin se han obtenido los siguientes valores de
las frecuencias de las lneas Ka de sus espectros caractersticos de Rayos-X
Z

( cm1/ 2 )

20

23

25

28

30

5450

6310

6890

7754

8338

Utilizando la tcnica de mnimos cuadrados estimar el valor de la constante


de apantallamiento s para estos elementos sabiendo que la relacin terica

53

CLCULO NUMRICO Y ESTADSTICA APLICADA

aproximada que deben seguir los datos anteriores (Ley de Moseley, 1913) es

= A( Z ). Comparar con el valor de Moseley s = 1,13.


Se trata de un simple ajuste lineal en el que haciendo y = , x = Z,
a0 = As, y a1 = A, se tiene la recta (Fig. 1T.3)
y% = a0 + a1x
Siguiendo la tcnica expuesta antes se plantea el sistema
N

i= 0
N

i= 0

yi = ( N + 1) a0 +

xi yi =

i= 0

i= 0

xi a0 +

xi a1 ;

i= 0

xi2 a1 ;

b0 = s0 a0 + s1a1
b1 = s1 a0 + s2 a1

Figura 1T.3. Ley de Moseley para los elementos qumicos entre el Ca (Z = 20) y el Zn (Z = 30)
con datos del ejercicio 1.6.1. Las diferencias entre la recta dibujada con los datos tabulares y el ajuste
de mnimos cuadrados son inapreciables a la escala del grfico. No obstante, el ajuste de mnimos
cuadrados da mejores resultados cuantitativos al suavizar los errores de entrada.

Para calcular conviene ordenar los datos en la forma siguiente


i
0
1
2
3
4

S
54

xi
20
23
25
28
30
= 126

x2i

yi

xi yi

400
529
625
784
900
3238

5450
6310
6890
7754
8338
34742

109000
145130
172250
217112
250140
893632

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

en donde la ltima fila da los resultados de sumar las columnas correspondientes. El sistema a resolver es
5 a0 + 126 a1 = 34742
126 a0 + 3238 a1 = 893632
y las soluciones son a0 = As = 328,1401274, a1 = A = 288,7515924, con lo
que la constante de apantallamiento es

s +1,1364
Redondeando por exceso a dos decimales se tiene s +1,14. Finalmente
para no recargar la notacin este resultado redondeado se escribe con la convencin de signo igual

s = 1,14
Este resultado es muy prximo al obtenido por Moseley s = 1,13
( A = 0, 76 R , R = 109677,6 cm1). Un paso ms en la comparacin es comprobar la proximidad entre los datos estimados para las frecuencias y los
datos de entrada. La tabla siguiente rene ambos junto con los que pueden
determinarse con la ley de Moseley exacta en unidades de cm1/2).
i

xi = Z

yi =

yi,est. = ,i = A( Z )

,i (Moseley)

20

5450

5446,892

5448,007

23

6310

6313,146

6314,145

25

6890

6890,650

6891,570

28

7754

7756,904

7757,708

30

8338

8334,408

8335,133

La evaluacin de las sumas de cuadrados de desviaciones con respecto a


los resultados de referencia, ms precisos, de Moseley indica
4

Stabla =

(y
i

i =0

,i

Moseley

)2 45, 6

(datos de entrada)

Smn. cuad. =

(
i= 0

,i ,i

Moseley

)2 4, 3

(datos de suavizados)

55

CLCULO NUMRICO Y ESTADSTICA APLICADA

y se ve que, al comparar con los resultados de referencia, el valor de la funcin a minimizar S es un orden de magnitud menor en los clculos de mnimos cuadrados que el mostrado por la tabla de entrada. Esto es una muestra
del proceso de suavizacin de los errores de entrada en una tabla de datos
que, en general, lleva a cabo un ajuste de mnimos cuadrados. Existen medidas del error en mnimos cuadrados mucho ms elaboradas (Cap. 7), si
bien no es errneo realizar comparaciones de proximidad entre los valores
tabulares y los estimados en la forma
4

S=

( yi yi,est. )2 =

i= 0

(y
i

i= 0

,i

mn. cuad.

)2 41, 3

que sirven para construir los estimadores RMS.

Nota adicional sobre el error


En los clculos intermedios del Ejercicio anterior se ha mantenido el
mayor nmero de decimales posibles para evitar redondeos que pueden desvirtuar la solucin final. Sin embargo, en los clculos de magnitudes obtenidas a partir de datos experimentales, como es el presente, no tiene ningn sentido dar todos los decimales obtenidos en la respuesta final, ya que se trata de
dar un resultado fsica o qumicamente significativo. Aqu se han tomado
finalmente dos decimales para dar la solucin a efectos de comparacin con
el dato de Moseley. El asunto del error en los clculos aproximados es
complejo y sucesivamente a lo largo del texto se irn tratando diversas
cuestiones relativas al error y las cifras significativas en los resultados de
operaciones.

1.7. Ajustes de mnimos cuadrados de orden superior


El problema que se presenta a continuacin es el de los ajustes de mnimos cuadrados en la base polinmica convencional y con rdenes crecientes.
Si la representacin lineal no es suficientemente precisa, o si resulta completamente inadecuada, la aproximacin natural dentro de este contexto es
la de aumentar el grado del polinomio de ajuste.

56

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

El caso cuadrtico
La primera extensin es la cuadrtica (n = 2) en la que la tabla de datos
de entrada {(xi, yi)}i=0,N se representa como
y% i = a0 + a1 xi + a2 xi2 ; i = 0,1, 2,..., N

(1.7.1)

y las condiciones de optimizacin para calcular los parmetros vendran


dadas por la igualacin a cero de las derivadas parciales con respecto a los
coeficientes am de la funcin S adecuada para este caso. Se tienen as
N

S=

(y a a x a x )
i

2 2
2 i

1 i

= mnimo >0

(1.7.2)

i= 0

S
= 0 ; m = 0,1, 2
am

(1.7.3)

Las ecuaciones normales (1.7.3) desarrolladas explcitamente son


S
= 0 s0 a0 + s1a1 + s2 a2 = b0
a0
S
= 0 s1a0 + s2 a1 + s3 a2 = b1
a1

(1.7.4)

S
= 0 s2 a0 + s3 a1 + s4 a2 = b2
a2
en donde los smbolos s y b son generalizaciones de los ya vistos en el caso
lineal
N

s0 = N + 1; s1 =

x ;
i

s2 =

i= 0

y ;
i

i= 0

; s3 =

i= 0

b0 =

xi2

x y ;
i i

i= 0

; s4 =

i= 0

b1 =

xi3

4
i

(1.7.5a)

i= 0

b2 =

x y

2
i i

(1.7.5b)

i= 0

Este proceso para n = 2 lleva a una solucin nica {a0, a1, a2} y su naturaleza es la de ser un mnimo para la funcin S. Se omiten las demostraciones y se remite al lector a las observaciones hechas en el caso lineal.

57

CLCULO NUMRICO Y ESTADSTICA APLICADA

El caso general
Los ensayos siguientes n 3 siguen la misma pauta y, en general, para un
grado n arbitrario se tiene que el conjunto de ecuaciones normales que surgen de minimizar
N

S=

(y a a x a x
i

1 i

2
2 i

... an xin )2

i= 0

puede escribirse generalizando la expresin (1.7.4) como


S
= 0 s0 a0 + s1 a1 + s2 a2 + ... + sn an = b0
a0
S
= 0 s1 a0 + s2 a1 + s3 a2 + ... + sn+1 an = b1
a1

(1.7.6)

...................................................................................
S
= 0 sn a0 + sn+1 a1 + sn+ 2 a2 + ... + s2 n an = bn
an
con las definiciones de los trminos s y b
N

sm =

xim ;

bm =

i= 0

m
yi ;
i

m = 0,1, 2,..., 2 n

(1.7.7)

i =0

En forma matricial el sistema anterior se escribe como


s0

s1
s
2
...

sn

s1

s2

...

s2

s3

...

s3

s4

...

...
sn+1

... ...
sn+2 ...

sn a0 b0

sn+1 a1 b1
sn+ 2 a2 = b2

... ... ...

s2 n an bn

A= B

(1.7.8)

con A y B siendo los vectores columna que contienen las soluciones y los trminos independientes, respectivamente.
Desde un punto de vista algebraico formal el sistema puede demostrarse
que tiene solucin nica {a0, a1, ..., an} y que su carcter es de mnimo.

58

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

Podra pues pensarse en una resolucin numrica basada en el clculo de la


inversa de la matriz cuadrada S, A = S1B. Sin embargo, este sera un procedimiento poco til a medida que n crece. Tcnicamente la cuestin est en
que S es proporcional a lo que se denomina una matriz de Hilbert, que es un
tipo de matriz mal condicionada. Por completitud, se muestra la forma de la
matriz de Hilbert de orden n + 1 que es

1
2

1
3
...

n +1

1
2
1
3
1
4
...
1
n+ 2

1
3
1
4
1
5
...
1
n+ 3

...
...
...
...
...

1
n +1

1
n+ 2

1
n+ 3
...

2n + 1

(1.7.9)

El trmino mal condicionada se utiliza para denotar matrices cuyas


inversas poseen elementos muy grandes, por ejemplo de rdenes >1012 para
n = 9, de manera que al operar con ellas las amplificaciones de los errores de
redondeo, obligados por la necesidad de usar un nmero finito de cifras en el
clculo, produciran resultados altamente inestables (pequeas variaciones en
los datos de entrada llevaran a resultados muy diferentes) y, por tanto, los
valores obtenidos para las soluciones am no seran significativos para el problema estudiado.

Observaciones prcticas
No deja de ser una paradoja sorprendente el hecho de que el problema
general de mnimos cuadrados sea superdeterminado (hay ms datos que
incgnitas) y que tenga solucin nica en trminos tericos, y que, no obstante, la resolucin numrica sea en la prctica para n elevados un problema
asociado a una matriz casi singular que da al traste con este tipo de solucin
directa. A pesar de estas observaciones negativas para el mtodo hay que
sealar que para valores bajos, n < 7, el mtodo directo basado en la resolucin del sistema (eliminacin, sustitucin o matricial A = S1B) da resultados
significativos y funciona bien en la mayora de los problemas. Por otra par-

59

CLCULO NUMRICO Y ESTADSTICA APLICADA

te, para rdenes n 7 tambin es posible mantener una forma matricial de


resolver el problema de los mnimos cuadrados, pero debe recurrirse a algoritmos numricos especiales como la descomposicin QR o la descomposicin
de valor singular (SVD).
Aparentemente no parece que la mayora de los ajustes de mnimos cuadrados habituales vayan a necesitar grados n 7 y, adems, la posibilidad de
ajustar segmentos de la tabla de datos con polinomios de mnimos cuadrados de grado bajo (n = 2 3) pudiera ser muy recomendable en muchos
casos. De manera que la discusin anterior sobre la estabilidad podra tomarse como una mera curiosidad matemtica sin grandes repercusiones prcticas. Esto no es as, pues existe una gran variedad de problemas en la modelizacin de datos que puede requerir del uso de n elevados y hay que estar
precavido de los problemas que pueden surgir. Incluso en el caso de ajustes
abordables con la tcnica matricial normal para n 6 la situacin dista de
ser eficiente. Ntese que dada una serie de datos {(xi, yi)}i=0,N y una vez obtenida una representacin polinmica {a0, a1, ..., an} de mnimos cuadrados con
un cierto grado n, en principio ninguno de los coeficientes calculados am servir para construir la representacin siguiente con grado n + 1. Es decir, al
aadir una nueva funcin de base xn+1 nada de lo hecho anteriormente sirve
para este nuevo ensayo, ya que hay que resolver el nuevo sistema normal de
n + 2 ecuaciones desde el principio. Se obtiene entonces una solucin {a*
0, a*
1,
..., a*
n, a*
n+1} en la que generalmente am a*
m.
La ineficiencia del proceso discutido lleva a considerar una alternativa
muy poderosa como es la de los polinomios ortogonales, tcnica que adopta
una buena variedad de formas particulares, pero en la que como base del
desarrollo se utiliza un conjunto de polinomios especiales {fn(x)}n=0, en lugar
de la base polinmica convencional que se ha venido tratando {xn}n=0,. Esta
nueva base ortogonal de desarrollo {fn(x)} transforma el sistema normal de
ecuaciones en un sistema diagonal de resolucin trivial: los elementos de la
matriz S son todos nulos salvo los que se encuentran en su diagonal principal.
Como ventaja evidente est el que ahora se pueden mantener los coeficientes
am del desarrollo al ir aumentando el grado (el nmero de funciones de base)
del desarrollo. Por otra parte, los polinomios ortogonales sirven para introducir conceptos de gran calado en la mayora de las cuestiones que surgen en la
Fsica y la Qumica Tericas. Al concepto de funciones ortogonales y de sus
desarrollos para representar funciones, de los cuales los polinomios ortogonales son un caso representativo, va a dedicarse el captulo siguiente.

60

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

BIBLIOGRAFA
1. SCHEID, F., Anlisis Numrico, McGraw-Hill (serie Schaum), 1972. (Caps. 1, 2, 3,
4, 6, 8, 21). Se mantienen los mismos captulos numerados de consulta en la obra
Numerical Analysis (1988).
2. SES, L. M., Mtodos Tericos de la Qumica-Fsica (Vol. 1), UNED, Madrid,
1994. (Temas 1, 8).
3. PRESS, W. H.; FLANNERY, B. P.; TEUKOLSKY, S. A. y VETTERLING, W. T., Numerical
Recipes, Cambridge University Press, Cambridge, 1986. (Caps. 3, 14).
4. RICE, J. R., Numerical Methods, Software and Analysis, McGraw-Hill, Nueva York,
1983. (Caps. 4, 11).
5. RALSTON, A. y RABINOWITZ, P., A First Course in Numerical Analysis, Dover, Nueva
York, 2001. (Caps. 2, 6).
6. DEMIDOWITSCH, B. P.; MARON, I. A. y SCHUWALOWA, E. S., Mtodos Numricos de
Anlisis, Paraninfo, Madrid, 1980. (Cap. 2).

61

CLCULO NUMRICO Y ESTADSTICA APLICADA

PROBLEMAS TERICOS Y NUMRICOS

Problemas tericos
1.1) Calcular el efecto del operador diferencia de avance D sobre las funciones
tabulares {(xk , yk)} construidas combinando otras dos funciones auxiliares {(xk , uk)} y {(xk , vk)} en las formas: a) yk = c1uk + c2vk (c1, c2 = constantes); b) yk = ukvk; c) yk = uk/vk. Comprobar las analogas entre los operadores D y d/dx al aplicarlos a funciones reales de variable real.
1.2) Calcular el efecto del operador diferencia de avance D sobre las funciones
tabulares: a) {(k, sen k)}; b) {(k, cos k)}; c) {(xk, ln xk)}. Observar las
diferencias con el resultado de aplicar el operador derivada d/dk.
1.3) Demostrar la relacin general para las diferencias de una tabla igualmente espaciada
n

y0 =

(1) i y
i

n i

i =0

n
n!
i = i ! ( n i)!

1.4) Responder a las siguientes cuestiones de aplicacin de las diferencias de


avance:
a) Calcular las diferencias de una funcin tabular {(k, yk)}k=0,1,2... dada por
la relacin yk = 3k4 + 2k 1.
b) Encontrar las funciones yk que satisfacen Dyk = 4yk (k = 0,1,2,...).
c) Idem para D2yk = 4yk (k = 0,1,2,...).
1.5) Se tiene una tabla de datos {(xi , yi, zi)}i=0,N y se desea ajustar un plano de
mnimos cuadrados de la forma z = a + bx + cy. Obtener las ecuaciones
normales que definen a los coeficientes del ajuste.

62

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

Problemas numricos
1.6) Los datos siguientes dan resultados de presiones frente a volmenes para
un gas de van der Waals en la forma P% = f(V% ) en donde

a
P% = P + 2 ; V% = (V b)

V
V% (l.)

5,5

8,25

15

20,3

44,5

62

P%(atm.)

61

35,7

14,7

11

2,6

Discriminar utilizando simplemente representaciones en distintos tipos de


papel grfico (milimetrado, doble logartmico y semilogartmico) si los
datos representan:
a) La ecuacin de una isoterma P% V% = A.
b) La ecuacin de una adiabtica P% V% h = B.
c) La relacin P% = C log10 V% + D.
Notas: las magnitudes A, B, C, D y h, son constantes; 1 atm 1,013 bar =
1,013 105 Pascales.
1.7) La siguiente tabla contiene valores del factor de compresin z = PV/RT de
un fluido cuntico en funcin de la densidad reducida r*N (magnitud
adimensional) a una cierta temperatura T

r*N

0,1

0,2

0,3

0,4

0,5

z = PV/RT

1,354

1,786

2,404

3,283

4,565

Determinar el polinomio de Newton que coloca esta tabla y dar la expresin para el error del ajuste.
1.8) Las energas libres de Gibbs G de un fluido cuntico en unidades de RT
para la isocora (lnea de densidad constante) r*N = 0,4 vienen dadas en funcin de la longitud de onda de de Broglie reducida l*B por la siguiente tabla

l*B
G/RT

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,853 0,028 1,643 3,154 4,593 5,983 7,270 8,411

63

CLCULO NUMRICO Y ESTADSTICA APLICADA

Encontrar la mejor aproximacin de mnimos cuadrados para esta tabla


entre las siguientes opciones:
a) G/RT = a0 + a1l*B
b) G/RT = a0 + a1l*B + a2lB*2
c) exp[G/RT] = clB*m
Utilizar como criterios las evaluaciones de la S mnima alcanzada y del
error RMS.
1.9) A partir de una serie de experimentos se han tabulado los siguientes
valores del potencial de interaccin (energa en unidades de grado absoluto Kelvin) entre dos molculas de metano en funcin de la distancia (en unidades de ) entre sus centros de masa
r/

3,5

V(r)/K

6250,5

440,4

4,5

5,5

128,6 132,0 82,3 55,7 34,1

Utilizando el criterio de mnimos cuadrados decidir la mejor funcin


que representa estos datos entre las siguientes
12 6
a) V ( r ) = 4
r
r

10 5
b) V ( r ) = 4
r
r

Estimar tambin los parmetros del potencial e y s en cada caso (1 =


1010 m; 1 K = 1,380658 1023 J).
SOLUCIONES
Problema 1.1
a) Se trata de la propiedad lineal del operador D
yk = c1uk + c2 vk yk = ( c1uk + c2 vk ) = ( c1uk+1 + c2 vk+1 ) ( c1uk + c2 vk ) =
( c1uk+1 c1uk ) + ( c2 vk+1 c2 vk ) = c1uk + c2 vk

64

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

b) Diferencia de un producto
yk = uk vk yk = (uk vk ) = uk+1vk+1 uk vk = uk +1 vk+1 uk+1vk + uk +1 vk uk vk =
uk+1 ( vk+1 vk ) + (uk +1 uk )v
vk = uk+1vk + vk uk =
uk+1 vk+1 uk vk+1 + uk vk +1 uk vk = uk vk + vk+1uk
c) Diferencia de un cociente
yk =

uk
u
u
u v uk vk+1 uk+1vk uk vk + uk vk uk vk+1
yk = k+1 k = k+1 k
=
=
vk
vk+1 vk
vk vk+1
vk vk +1
=

vk uk uk vk
vk vk+1

Estos tres resultados recuerdan las reglas de derivacin de funciones,


aunque como consecuencia de la no continuidad de la tabla (datos discretos)
presentan algunas sutiles diferencias en los casos b) y c), como pueden
observarse en las faltas de simetra en los ndices (k y k + 1 en vez de k + 1 y
k + 1, por ejemplo) al compararlos con:
a)

d
d
d
c1u( x) + c2 v( x) = c1
u( x) + c2
v( x)
(
dx
dx
dx

b)

d
d
d
u( x) v( x) = u( x)
v( x) + v( x) u( x)
(
dx
dx
dx

c)

d u( x) v( x) ( du / dx) u( x) ( dv / dx)
=
dx v( x)
v2 ( x)

Ambos operadores D y d/dx son lineales (propiedad a)).

Problema 1.2
Se procede como en el ejercicio anterior y se utilizan algunas relaciones trigonomtricas en los casos a) y b) para simplificar las expresiones resultantes.
a) (sen k) = sen ( k + 1) sen k = 2 cos

k + 1+ k
k + 1 k
sen
=
2
2

2 cos( k + 1 / 2) sen(1/2)

65

CLCULO NUMRICO Y ESTADSTICA APLICADA

b) (cos k ) = cos ( k + 1) cos k = 2 sen

k + 1+ k
k +1 k
=
sen
2
2

2 sen( k + 1 / 2) sen(1/2)
Es importante sealar en conexin con a) y b) que los argumentos de las
funciones trgonomtricas son adimensionales y que en computacin por
defecto siempre se expresan en radianes. En los clculos con calculadora de
escritorio hay que cerciorarse de que se utiliza el modo adecuado para no
cometer errores introduciendo radianes cuando el modo est en grados
sexagesimales o viceversa.
c) ln xk = ln xk+1 ln xk = ln

xk+1
x +h
= ln k
= ln 1 + h / xk ; xk > 0
xk
xk

en donde se ha supuesto la tabla igualmente espaciada.

Problema 1.3
Se demostrar por induccin: supuesta cierta la relacin para un orden
dado n, hay que comprobar que tambin es cierta para el orden siguiente
n + 1 es decir que
n

y0 =

i =0

n +1

n
( 1) yn i n+1 y0 = n y1 n y0 =
i

i= 0

n + 1
(1)i
y
i n+1 i

Hay que dar forma a Dny1 lo que puede hacerse utilizando la expresin
para Dny0 con un sencillo cambio en los ndices. Se tienen as
n

y0 =

(1) i y
i

n i

i =0

y1 =

(1) i y
i

n
n
n
= yn yn1 + yn 2 + ... + (1)n y0
n
1
2

n +1 i

i= 0

n
n
= yn+1 + ( 1 yn + (1)2 yn1 + ...
1
2

Con ello se puede escribir la diferencia de orden n + 1


n

n+1 y0 =

i= 0

66

n
(1)i yn+1 i
i

(1) i y
i

n i

i= 0

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

Para poder incluir todo dentro de la misma sumatoria hay que transformar ligeramente los subndices de la primera del modo siguiente:
a) Extrayendo yn+1 (i = 0)
n

y1 =

i= 0

n
(1) yn+1 i = yn+1 +
i
i

(1) i y
i

n+1 i

i=1

b) Renumerando los ndices i = 1,2,3,...n j = i 1 = 0,1,2,...,n 1 y se


llega a
n1

y1 = yn+1 +

(1)

j +1

n
j + 1 yn j

j =0

c) Como los ndices de sumacin son mudos, es decir elementos para


llevar el orden en el conteo, puede escribirse
n

n y0 =

j= 0

n
(1) j yn j =
j

n 1

(1) j y
j

n j

j =0

n
+ (1)n y0
n

con lo que se obtiene


n1

n+1

y0 = y1 y0 = yn+1 +

(1)

j +1

j= 0

n1

yn+1

n n

(1) j + 1 + j y
j

n j

j=0
n

yn+1

(1)
i =1

n
j + 1 yn j

n1

(1) j y
j

n j

j=0

n
(1) n y0 =
n

n n n + 1
n
(1)n y0 = i = j + 1 ,
=
+ =
n
j + 1 j j + 1

i1 n + 1

i yn i+1 ( 1) y0 = yn+1 +
n+1

n + 1
yn i+1 + (1)n+1 y0 =

(1)
i

i =1

n + 1
y
i n+1 i

(1)
i

i =0

que era la relacin buscada. Este tipo de manipulaciones matemticas formales son muy tiles en un buen nmero de cuestiones dentro de la Qumica-Fsica (Mecnica y Qumica Cunticas) y conviene estar familiarizado con
ellas.

67

CLCULO NUMRICO Y ESTADSTICA APLICADA

Problema 1.4
a) La funcin yk = 3k4 + 2k 1 es un polinomio de grado 4 y por tanto
D yk = cte, Dnyk = 0, n > 4. Las primeras diferencias vienen dadas por
4

yk = yk+1 yk = 3( k + 1)4 3 k 4 + 2( k + 1) 2 k 1 + 1 = 12 k3 + 18 k2 + 12 k + 5
Las segundas diferencias se construyen a partir de las anteriores como
2 yk = yk+1 yk = 12( k + 1)3 12 k3 + 18( k + 1)2 18 k2 + 12( k + 1)
12 k + 5 5 = 36 k2 + 72 k + 42
Anlogamente se obtienen las diferencias terceras y cuartas
3 yk = 2 yk+1 2 yk = 36( k + 1)2 36 k 2 + 72( k + 1) 72 k + 42 42 = 72 k + 108
4 yk = 3 yk+1 3 yk = 72( k + 1) 72 k + 108 108 = 72
b) Dyk = 4yk es una ecuacin en diferencias de primer orden. Su resolucin tendr pues un parmetro libre, al igual que sucede en las ecuaciones
diferenciales de primer orden con la constante de integracin. La solucin
puede encontrarse mediante la recurrencia siguiente
yk = 4 yk = yk +1 yk 5 yk = yk+1
De manera que si se toma para k = 0 el valor arbitrario y0, se tiene
y1 = 5 y0
y2 = 5 y1 = 52 y0
y3 = 5 y2 = 53 y0
...............................
yk = 5 yk1 = 5k y0
El valor y0 concreto en una aplicacin vendr dado por las condiciones que
deba satisfacer ese problema y todos los yk se expresan en funcin de tal valor.
c) Para D2yk = 4yk se tendrn dos parmetros libres, es decir dos constantes de integracin finita. El proceso es similar al anterior pero un poco
ms complicado

2 yk = yk + 2 2 yk +1 + yk = 4 yk yk + 2 = 2 yk +1 + 3 yk

68

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

Si se toman y0 e y1 como valores iniciales, se encuentran las relaciones


y2 = 2 y1 + 3 y0
y3 = 2 y2 + 3 y1 = 7 y1 + 6 y0
y4 = 2 y3 + 3 y2 = 20 y1 + 21y0
y5 = 2 y4 + 3 y3 = 61y1 + 60 y0
.................................................
Las soluciones a estos problemas son, en general, esquemas recursivos
que desde el punto de vista de la programacin de clculos en computador
resultan muy cmodos, incluso sin que sea necesario conocer la ley general
que puedan seguir. Estas leyes generales pudieran ser muy complicadas de
obtener o no existir frmulas cerradas para ellas.

Problema 1.5
Procediendo como de costumbre, minimizando con respecto a los parmetros a, b, y c, la funcin
N

S=

(z a bx cy )

i= 0

se obtiene el sistema normal siguiente


N

zi = a( N + 1) + b

i =0

xi + c

i= 0

z x = a x + b
i i

i =0

i= 0

i= 0

i =0

xi2

xy

+c

i i

i= 0

z y = a y + b x y + c y
i i

i =0

i= 0

2
i

i i

i =0

i= 0

Puede verse fcilmente que es similar al sistema de la parbola de mnimos cuadrados (1.7.4) en la que se sustituyen: y z, x2 y.

69

CLCULO NUMRICO Y ESTADSTICA APLICADA

Problema 1.6
Este es un problema que ilustra cmo unas simples y rpidas representaciones grficas buscando lneas rectas pueden ayudar a decidir el comportamiento de una serie de datos experimentales obtenidos en el laboratorio. En casos favorables las grficas indican el tipo de relacin matemtica
que puede ser despus refinada mediante un ajuste de mnimos cuadrados.
a) En el caso de la isoterma la relacin a probar

% % = A P% = A = x = 1 = A x
PV
V%
V%
es una sencilla lnea recta representando P% frente a inversos de V% en papel
milimetrado. Hay que calcular los inversos de V% y la grfica se muestra en la
Fig. 1EP.1 (a), en la que se han utilizado diferentes escalas en cada eje: las
presiones tienen una escala en la que 1 cm 4 atm.; en tanto que los inversos de los volmenes se han multiplicado por 100, para poder representarlos

Figura 1EP.1 (a) Representaciones grficas para los datos del problema 6 utilizando: a) papel
milimetrado; b) papel doble logartmico; c) papel semi-logartmico. Las rectas dibujadas en los casos
a) y c) no son significativas y slo sirven para realzar las respectivas faltas de alineacin de los datos.

70

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

con comodidad, y aqu 1 cm 0,01l1. Esta representacin muestra una


recta tentativa que podra razonablemente representar a los puntos, pero la
dispersin de stos alrededor de tal lnea hace sospechar que esta relacin no
va a ser la que describe a los datos de la tabla.
b) En el caso de la adiabtica la relacin responde a una representacin
doble-logartmica, en la que tomando logaritmos en base 10 se encuentra
una dependencia lineal entre log10 P% y log10 V% :
% % = B log P% = log V% + log B
PV
10
10
10
Utilizando papel doble logartmico se obtiene la Fig. 1EP.1 (b). Este
papel muestra en ambos ejes escalas logartmicas en las que aparecen marcados los valores de las variables P% y V% con las separaciones respectivas en
forma logartmica. As, aqu no hay que calcular los logaritmos de las variables
que intervienen: sencillamente se llevan los datos de la tabla sobre los valores

Figura 1EP.1 (b) Representaciones grficas para los datos del problema 6 utilizando: a) papel
milimetrado; b) papel doble logartmico; c) papel semi-logartmico. Las rectas dibujadas en los casos
a) y c) no son significativas y slo sirven para realzar las respectivas faltas de alineacin de los datos.

71

CLCULO NUMRICO Y ESTADSTICA APLICADA

correspondientes en los ejes coordenados y se dibujan los puntos. La figura


muestra una alineacin prcticamente perfecta entre los logaritmos de
ambas variables y todo indica que esta va a ser la relacin que siguen los
puntos de la tabla. Adems tambin muestra cmo uno de los puntos
(V% = 15, P% = 14,7) se separa un tanto de la recta definida por los dems. Esto
indica que este dato posiblemente no ha sido bien evaluado y que conviene
repetir su medicin experimental (el resto de los datos ya sugiere su valor
corregido, que puede leerse de la grfica P% 16,5 atm.).
c) La tercera relacin se correspondera con una representacin semilogartmica, en la que hay una dependencia lineal entre P% y log10 V% :
P% = C log10 V% + D
Este es un caso intermedio entre los dos anteriores y tampoco hay que realizar ninguna evaluacin extra. Claramente, hay que decidir la construccin del
eje de las P% y en la Fig. 1EP.1 (c) se ha tomado como escala 1 cm 5 atm. Des-

Figura 1EP.1 (c) Representaciones grficas para los datos del problema 6 utilizando: a) papel
milimetrado; b) papel doble logartmico; c) papel semi-logartmico. Las rectas dibujadas en los casos
a) y c) no son significativas y slo sirven para realzar las respectivas faltas de alineacin de los datos.

72

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

pus sencillamente se llevan los valores de los datos sobre los ejes y se dibujan
los puntos. La grfica muestra de nuevo una recta tentativa para poner de
manifiesto la falta de alineacin de los puntos experimentales.
En resumen: la relacin que satisfacen los datos experimentales es la de
una adiabtica de gas de van der Waals, caso (b), y hay un dato que debe de
corregirse. El tratamiento por mnimos cuadrados con la relacin (b), midiendo primero de nuevo el dato que se escapa de la recta eliminndolo del ajuste, dara la recta ptima. No obstante, y de modo aproximado, los parmetros
de esta recta doble logartmica se pueden determinar del modo siguiente.
La pendiente es negativa y su valor es justamente h. De modo que al no
haber hecho en este caso ningn cambio de escala en las variables, ya que se
han llevado los datos tal cules son sobre los ejes del papel doble logartmico, la pendiente buscada es sencillamente el cociente entre las distancias en
centmetros (medidas con una regla) definidas entre dos puntos cualquiera
de la recta de ajuste a lo largo del eje y (log10 P%) y a lo largo del eje x
(log10 V% ). En la figura, tomando ya h positivo, se encuentra con los puntos 2
y 4 de la tabla la estimacin grfica y la estimacin numrica

log10 35, 7 log10 11


log10 P%2 log10 P%4
4, 2
= 1, 29 ;
=
= 1, 31
%
%
3, 25
log10 V4 log10 V2 log10 20, 3 log10 8, 25

que dentro de la imprecisin propia del mtodo seguido muestran una muy
buena concordancia. Una estimacin aproximada de la constante de la adiabtica (ordenada en el origen log10 B) puede hacerse con alguno de estos
datos anteriores y uno de los puntos de la recta (pueden probarse varios y
calibrar el efecto), por ejemplo el segundo, y se obtiene
B P%2V%2 = 35, 7 8, 251,29 = 543,12
Hay que insistir en que la determinacin grfica anterior de h con distancias en cm slo puede hacerse como se ha indicado si los datos no se han
transformado, por comodidad de visualizacin, al volcarlos en el papel (anlogo a lo realizado en el apartado a)). En estos casos hay que utilizar los
mdulos de las escalas para poder realizar esta operacin, pero por razones de
espacio no se va a tratar aqu este asunto. En cualquier caso, la segunda
determinacin de h utilizando los valores reales de las coordenadas de los puntos, medidos sobre la recta de ajuste (o tomados de la tabla si la dispersin es
muy pequea), ser siempre conceptualmente correcta y es la recomendada.

73

CLCULO NUMRICO Y ESTADSTICA APLICADA

Es cierto que todas estas manipulaciones grficas son muy imprecisas,


pero tienen la ventaja de ser muy sencillas y de dar una orientacin muy
rpida de las caractersticas del fenmeno que se estudia.
Problema 1.7
El primer paso es construir la tabla de diferencias
Tabla. Problema 1.7
k

r*N

zk

0,1

1,354

0,2

1,786

0,3

2,404

Dzk

D2zk

D3zk

D4zk

0,432
0,186
0,618

0,075
0,261

0,879
3

0,4

3,283

0,067
0,142

0,403
1,282

0,5

4,565

* 0,1
el polinomio de avance de
0,1
grado 4 se construye con los datos subrayados en la tabla
Utilizando la variable auxiliar k =

p( 4 ) ( k ) = 1, 354 + 0, 432 k +
+

0,186
0, 075
k( k 1) +
k( k 1)( k 2) +
2!
3!

0, 067
k( k 1)( k 2)( k 3)
4!

La expresin del error de ajuste viene dada por


z p( 4 ) =

( * 0* )( * 1* )( * 2* )( * 3* )( * 4* ) (5
z ( ) =
5!
k( k 1)( k 2)( k 3)( k 4)
(0,1)5 z(5 ( )
5!

en donde x es un punto indeterminado que no coincide con los r* de la tabla


pero que est dentro del intervalo que stos definen.

74

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

Problema 1.8
Analizando caso por caso se tienen los siguientes resultados
a) G/ RT = a0 + a1 B* y = G/RT , x = B*
N

i =0
N

i =0

yi = ( N + 1) a0 +

xi yi =

i= 0

x a ;
i

b0 = s0 a0 + s1a1

i= 0

xi a0 +

i= 0

xi2 a1 ;

b1 = s1a0 + s2 a1

s0 = 8 ; s1 = 4, 4 ; s2 = 2, 84
b0 = 29, 229 ; b1 = 22, 2018
a0 = 4, 36832 ; a1 = 14, 58536 ; Smn = 0, 43180 ; RMS 0, 232
Una comparacin de datos de entrada frente a estimados con la relacin
de mnimos cuadrados, redondeados a tres decimales, que es con la precisin
que vienen dados los datos de entrada, est en la siguiente tabla
Tabla (a). Problema 1.8
l*B

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

G/RT estim.

1,451

0,007

1,466

2,924

4,383

5,841

7,300

8,758

G/RT tabla.

1,853

0,028

1,643

3,154

4,593

5,983

7,270

8,411

b) G/ RT = a0 + a1 B* + a2 B*2 y = G/ RT , x = B*
Aqu se tiene la parbola de mnimos cuadrados y hay que resolver el sistema normal (1.7.4)
s0 a0 + s1a1 + s2 a2 = b0
s1 a0 + s2 a1 + s3 a2 = b1
s2 a0 + s3 a1 + s4 a2 = b2
y se obtienen los resultados siguientes
s0 = 8 ; s1 = 4, 4 ; s2 = 2, 84 ; s3 = 2, 024 ; s4 = 1, 5332
b0 = 29, 229 ; b1 = 22, 2018 ; b2 = 17, 03064
a0 = 5, 61966 ; a1 = 20, 09125 ; a2 = 5, 00536 ; Smn = 0, 01090 ; RMS 0, 037
75

CLCULO NUMRICO Y ESTADSTICA APLICADA

Una comparacin de datos de entrada frente a estimados con la relacin de


mnimos cuadrados, redondeados a tres decimales, est en la siguiente tabla
Tabla (b). Problema 1.8
l*B

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

G/RT estim.

1,802

0,043

1,616

3,175

4,633

5,992

7,250

8,408

G/RT tabla.

1,853

0,028

1,643

3,154

4,593

5,983

7,270

8,411

c) exp(G/ RT ) = c B* m . Haciendo los cambios y = G/RT. ln c = a0, m = a1,


x = ln l B* se tiene entonces una recta de mnimos cuadrados del tipo habitual
y = a0 + a1x
y la resolucin del sistema normal lleva a los siguientes resultados
s0 = 8 ; s1 = 5, 61885 ; s2 = 5, 80894 ; b0 = 29, 229 ; b1 = 7, 73172
a0 = ln c = 8, 47961 ; a1 = m = 6, 87113 ; Smn = 1, 84653 ; RMS 0, 480
En este caso la ecuacin de ajuste es
exp(G/RT ) = c *Bm = exp(8, 47961) *B6 ,87113 ,
en donde no todos los dgitos son significativos, pero se incluyen para evitar
efectos no deseados derivados del redondeo en los resultados calculados
con la expresin.
Una comparacin de datos de entrada frente a estimados con la relacin de
mnimos cuadrados, redondeados a tres decimales, est en la siguiente tabla
Tabla (c). Problema 1.8
l*B

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

G/RT estim.

2,579

0,207

2,184

3,717

4,970

6,029

6,946

7,756

G/RT tabla.

1,853

0,028

1,643

3,154

4,593

5,983

7,270

8,411

La conclusin de este ejercicio es que el mejor ajuste de mnimos cuadrados es el de la parbola b), ya que presenta errores de ajuste (RMS)
mucho menores que los de las otras dos opciones. Ntese que a efectos de
comparacin no es necesario dar muchos decimales en los errores RMS.

76

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

Problema 1.9
a) El problema puede reducirse en los dos casos a un ajuste lineal de
mnimos cuadrados sin ms que hacer unos cambios de variable. En el primer caso
12 6
V ( r ) = 4
r
r

1
se empieza haciendo el cambio de variable x = 6 y la ecuacin resultante
r
es
V ( r ) = 4 12 x2 4 6 x
Si ahora se divide por x, que no toma valores nulos en los datos de entrada, y se define la variable y como el cociente
y = V ( r )/ x,
se tiene la ecuacin de una lnea recta
y = Ax + B ; A = 4 12 ; B = 4 6
El sistema normal a resolver es (N + 1 = 7)
N

i= 0
N

i= 0

yi = ( N + 1) B +

xi yi =

i= 0

x A;
i

b0 = s0 B + s1A

i= 0

xi B +

i= 0

xi2 A;

b1 = s1 B + s2 A

Manteniendo un gran nmero de cifras para evitar redondeos en las


operaciones finales que podran desvirtuar el clculo final, se encuentra
s0 = 7 ; s1 = 2, 40186 103 ; s2 = 2, 25757 106 ; b0 = 675374, 76406 ; b1 = 6258, 2
A = 4527535642,15205 ; B = 1
1649983, 62734375
Smn = 81,1084 ; RMS 3, 40

77

CLCULO NUMRICO Y ESTADSTICA APLICADA

Los valores de los parmetros en este modelo del potencial son

6 =

A
A
;=
B
4 12

que redondeados a un nmero de decimales tpico en estos clculos fisicoqumicos resultan ser s 3,742 (redondeo a tres decimales); e 150,3 K
(redondeo a un decimal) o alternativamente con la convencin que ya tiene
en cuenta que el dato est redondeado

= 3, 742 = 3, 742 10 10 m ; = 150, 3 K = 150, 3 1, 380658 10 23 J


Una comparacin de datos calculados redondeados a un decimal frente a
entradas se muestra en la tabla siguiente
Tabla (a). Problema 1.9
r/

3,5

4,5

5,5

V-entrada (K)

6250,5

440,4

128,6

132,0

82,3

55,7

34,1

V-estim. (K)

6256,0

442,2

133,0

133,0

87,1

53,7

33,3

En esta tabla es de notar que los datos definen un mnimo de potencial


de forma concordante en ambos conjuntos.
b) Procediendo como antes con la ecuacin
10 5
V ( r ) = 4
r
r

1
se empieza haciendo el cambio de variable x = 5 y la ecuacin resultante
r
es
V ( r ) = 4 10 x2 4 5 x
Si ahora se divide por x, que no toma valores nulos en los datos de entrada, y se define la variable y como el cociente
y = V ( r )/ x,
se tiene la ecuacin de la una lnea recta
y = Ax + B ; A = 4 10 ; B = 4 5

78

AJUSTE DE FUNCIONES CON POLINOMIOS: TCNICAS DE COLOCACIN Y DE MNIMOS CUADRADOS

El sistema normal a resolver es formalmente como el anterior y los resultados son


s0 = 7 ; s1 = 8,184976 103 ; s2 = 2,196596 10 5 ; b0 = 572235, 8156 ; b1 = 6258, 2
A = 450900377, 3202 ; B = 445481, 84232
Smn = 336622, 381 ; RMS 219, 29
Los valores de los parmetros en este modelo del potencial son

5 =

A
A
;=
B
4 10

en donde con las convenciones dichas en el clculo anterior se escribir

= 3, 991 = 3, 99110 10 m ; = 110, 0 K = 110, 0 1, 380658 10 23 J


(El ltimo cero del resultado e es significativo con el redondeo utilizado y
tiene sentido escribirlo).
Una comparacin de datos de entrada frente a los calculados redondeando a un decimal se muestra en la tabla siguiente
Tabla (b). Problema 1.9
r/

3,5

4,5

5,5

V-entrada (K)

6250,5

440,4

128,6

132,0

82,3

55,7

34,1

V-estim. (K)

5802,8

786,4

5,0

109,0

96,4

70,7

49,8

Aqu las definiciones del mnimo potencial no son concordantes en


ambos conjuntos de datos.
Los resultados muestran inequvocamente que la mejor opcin es la a).
Se trata del conocido como potencial Lennard-Jones (12,6) y tiene una forma
general que se aplica muy bien para estudiar gases, lquidos y slidos, monoatmicos o compuestos de molculas poliatmicas apolares con simetra
esfrica.

79

CAPTULO 2
AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

2.1.
2.2.
2.3.
2.4.
2.5.
2.6.

Introduccin
El caso discreto: polinomios de Gram-Tschebyscheff
El caso continuo: producto escalar y distancia entre funciones
Caso continuo: polinomios de Legendre
Caso continuo: polinomios de Tschebyscheff
Caso continuo: polinomios de Hermite y de Laguerre

Bibliografa
Problemas tericos y numricos

Se profundiza aqu sobre la tcnica de los mnimos cuadrados desde las perspectivas numrica y analtica. Siguen considerndose funciones reales de una
variable real y continuas en un intervalo por sus potenciales aplicaciones en los
ajustes de datos experimentales y en los desarrollos con conjuntos ortonormales
tan comunes en las aplicaciones de la Mecnica Cuntica. La deduccin del sistema normal de ecuaciones en un caso de orden arbitrario, con datos sin errores
de entrada, lleva a la consideracin de los problemas asociados con este planteamiento directo (orden de la aproximacin y eficiencia en los clculos, inestabilidad) y a la solucin va polinomios ortogonales. Se aborda primero el caso
discreto con los polinomios de Gram-Tschebyscheff. Por su inters general se
consideran despus cuestiones generales del caso continuo, introduciendo los
conceptos bsicos de funcin de peso, producto escalar y distancia entre funciones. Se particulariza a los polinomios de Legendre y los polinomios de
Tschebyscheff (propiedades de error igual) y se incide en sus propiedades
como bases para expresar de forma exacta (desarrollar) y aproximar funciones en
intervalos finitos. La misma discusin pero para funciones en intervalos infinitos
se realiza tambin con los polinomios ortogonales de Hermite (relacionados
con la vibracin molecular) y de Laguerre (relacionados con los orbitales atmicos del tomo de hidrgeno). Esta lnea de procedimiento se completar posteriormente con las sumas trigonomtricas de Fourier (Cap. 9). Los conceptos que
se discuten aqu son complejos, pero resultan fundamentales y de aplicacin

81

CLCULO NUMRICO Y ESTADSTICA APLICADA

imprescindible cuando se desea obtener el mejor ajuste a una serie de datos, o


la mejor aproximacin a una funcin complicada, o incluso calcular una integracin numrica con gran precisin y muy bajo costo en nmero de operaciones.
Mnimos cuadrados

Aproximacin en media

Caso discreto

Caso continuo

Pol. Gram-Tschebyscheff
Ortogonalidad

Producto Escalar
Bases Completas
Ortogonalidad, etc.
Pol. Legendre
Pol. Tschebyscheff
Pol. Hermite
Pol. Laguerre

Cap. 9

Caps. 3, 7

2.1. Introduccin
Vistos los problemas que presenta la tcnica de mnimos cuadrados en la
base convencional {xn}n=0, se considera a continuacin la alternativa basada
en los polinomios ortogonales, ya que resulta muy prctica cuando se necesitan rdenes de aproximacin creciente. La funcin continua, y = f(x), a
representar en un intervalo a x b puede venir definida por una tabla
numrica o por una funcin analtica, pudiendo adems en este ltimo caso
ser muy complicada para manejarla directamente, o incluso desconocida a
priori (la solucin de una ecuacin diferencial, por ejemplo). La idea general
es sustituir el desarrollo de f(x) en la base {xn}n=0, por otro en una base polinmica equivalente {fn(x)}n=0,
f ( x) a0 + a1x + a2 x2 + ... + an x n f ( x) c00 ( x) + c11 ( x) + c22 ( x) + ... + cn n ( x) (2.1.1)

de manera que el sistema normal asociado se transforme del modo siguiente


s0 a0 + s1a1 + s2 a2 + ... + sn an

= b0

s1 a0 + s2 a1 + s3 a2 + ... + sn+1 an

= b1

.................................................................
sn a0 + sn+1a1 + sn+ 2 a2 + ... + s2 n an = bn

82

= 0

e0 c0
e1c1

= 1

...................................
en cn = n

(2.1.2)

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

de donde cada coeficiente ci se despeja sin dificultad, ci = Wi/ei. El adjetivo


ortogonal utilizado para designar las posibles familias {fn(x)}n=0, no es una
casualidad y responde a la familiar imagen de perpendicularidad (ortogonalidad) entre vectores de un espacio vectorial. Conviene tener en cuenta que
las familias de funciones ortogonales estn compuestas de funciones que son
linealmente independientes, lo que est conectado con su capacidad para
efectuar operaciones de aproximacin como la (2.1.1). As, todo el lenguaje
habitual de los espacios vectoriales finito-dimensionales convencionales,
como son los {k, } de vectores k-dimensionales (k-tuplas) sobre el cuerpo
de los nmeros reales, se utiliza sin modificaciones dentro de este contexto
de funciones y, aunque requiere matizaciones importantes, conserva un
mismo significado general. La idea directriz, en definitiva, es la misma que la
que inspira los desarrollos continuos en serie de Fourier utilizando la base de
funciones seno y coseno (el lector puede repasar esta cuestin en el Ap. II).
Se comenzar analizando el caso discreto con los polinomios ortogonales
de Gram-Tschebycheff para representar una tabla de datos. A continuacin,
dada una funcin continua f(x) definida en un intervalo (finito o infinito) van
a buscarse aproximaciones a ella utilizando conjuntos de funciones de base
ortogonales de tipo polinmico, pero que van a ser por tanto diferentes de la
base convencional {xn}n=0,. Se tratarn primero los casos de las funciones
continuas dentro de un intervalo cerrado finito [a, b] = a x b, analizando
las aproximaciones con los polinomios de Legendre y de Tschebyscheff.
Estas dos familias de polinomios estn definidas de forma estndar en el
intervalo [1, +1] pero un sencillo cambio lineal de variable x u permite
transformar el intervalo arbitrario a x b en el intervalo 1 u +1
(Fig. 2T.1) y viceversa
u = 1+

2
( x b)
b a

(2.1.3)

Esta transformacin no es ms que la ecuacin de la recta que pasa por


los puntos (a, 1) y (b, +1) en el plano xu. Utilizando (2.1.3) la funcin original puede as expresarse
f(x) = f(x(u)) = g(u)

(2.1.4)

y cualquier operacin va a poder realizarse en el intervalo 1 u +1, siendo la recuperacin de la informacin en trminos de la variable x siempre
posible sin ms que deshacer el cambio de variable anterior.

83

CLCULO NUMRICO Y ESTADSTICA APLICADA

Figura 2T.1. Cambio lineal de variable para transformar el intervalo 1 u 1


en el intervalo 1 x 4.

Finalmente, se estudiarn dos familias de polinomios ortogonales definidas en intervalos infinitos: Hermite definida en < x < , y Laguerre definida en 0 x < . Es muy importante recalcar que en todos los casos mencionados existe la denominada funcin de peso v (x), con respecto a la cul
se formula el concepto de ortogonalidad.
Los polinomios de Tschebyscheff son especialmente tiles en el clculo
numrico en general por sus propiedades de error de oscilacin igual, en
tanto que las otras tres familias de polinomios, aparte de su valor intrnseco
en el clculo como tal (especialmente en integracin numrica Gaussiana),
presentan aplicacin en muchas cuestiones de la Mecnica y Qumica Cunticas de tomos y molculas. Ms adelante, en el Cap. 9, se completar todo
este asunto considerando el tema relacionado de los ajustes trigonomtricos
(sumas de Fourier) vistos desde la perspectiva de conjuntos de funciones
ortogonales.

2.2. El caso discreto: polinomios de Gram-Tschebyscheff


Dada una tabla de N + 1 valores {(xk, yk)}k=0,N igualmente espaciados en
la variable x, por simplicidad del tratamiento, y de los que se supone que
los yk no vienen afectados de error, se desea representarla mediante una

84

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

aproximacin en la forma de combinacin lineal de polinomios Gn,N(k)


(cuyo grado = n) como
m

y( k) p( m) ( k) = c0G0,N ( k) + c1G1,N ( k) + c2G2,N ( k) + ... + cm Gm,N ( k) =

c G
j

j , N ( k)

(2.2.1)

j =0

en donde m es el grado de la aproximacin y se utiliza la variable auxiliar


nmero de orden k de las tablas igualmente espaciadas, que en realidad
denota aqu una variable continua k = (x x0)/h 0. Si se sigue la tcnica de
los mnimos cuadrados habr que minimizar la funcin
N

( y

S=

c0 G0, N ( k) c1G1, N ( k ) c2 G2 , N ( k) ... cmGm, N ( k )

(2.2.2)

k=0

lo que se lleva a cabo calculando las derivadas parciales S/cj e igualndolas


a cero y resolviendo el sistema normal de ecuaciones para calcular los coeficientes del desarrollo cj.

El sistema normal de ecuaciones


La forma de las ecuaciones de este sistema es
N

S
= 2
yk c0G0 , N ( k) c1G1, N ( k) c2G2, N ( k) .... cmGm , N ( k) G j , N ( k) = 0 (2.2.3)
c j
k =0

y las expresiones de los polinomios Gj,N(k) van a deducirse de manera constructiva. Para ello el sistema se plantea como
N

j = 0 c0

G0,N ( k )G0,N ( k ) +c1

k =0

k= 0

j = 1 c0

0,N

( k)G1,N ( k) +c1

k =0

1,N

...
N

0, N ( k)Gm ,N ( k) +c1

k =0

( k)G1,N ( k) + ... + cm

m, N

y G

k 1,N

( k)

...
N

m ,N ( k)Gm, N ( k) =

k =0

(2.2.4)

k= 0

...

1,N ( k)Gm, N ( k) + ... + cm

k =0

( k)G1,N ( k) =

k= 0

...

k 0, N ( k )

y G
k =0

k= 0

...

Gm,N ( k)G0,N ( k ) =

k =0

j = m c0

G1,N ( k)G0 ,N ( k) + ... + cm

...
N

y G

k m, N ( k )

k= 0

85

CLCULO NUMRICO Y ESTADSTICA APLICADA

y los polinomios {Gj,N(k)}j=0,m van a ser tales que los elementos no diagonales
del sistema (2.2.4) se anulen
N

i , N ( k )Gj , N ( k )

= 0; i j (ortogonalidad)

(2.2.5)

k =0

Con ello la resolucin del sistema es directa


N

y G
k

cj =

j,N

( k)

k=0

; j = 0,1, 2,..., m

j,N

(2.2.6)

( k )Gj , N ( k )

k= 0

El sistema normal se ha reducido a forma diagonal y la magnitud S


toma el valor mnimo

y2k +
Smn. =

k =0
N

c2j Gj , N ( k)2

j =0

y2k +

k =0

+ G
k =0

c2j

j =0

c2j Gj ,N ( k)2

j =0

j,N

c y G

( k) 2

k =0

j =0

yk2

cj ciGj , N ( k)Gi,N ( k) =

j<i

(2.2.7.)
yk c j Gj ,N ( k) =

y k c j G j , N ( k) + 2

j =0

j =0

k= 0

j,N

( k) =

G
yk2

k =0

c2j

j =0

j ,N

( k)2

k= 0

en donde se han utilizado las relaciones de ortogonalidad y las definiciones


de los cj.

Forma de los polinomios de Gram-Tschebyscheff


Los polinomios que cumplen estas condiciones se denominan de GramTschebyscheff y se definen mediante la ecuacin general
j

Gj , N ( k ) =

i=0

86

j j + i k( k 1)( k 2)...( k i + 1)
i N ( N 1)( N 2)...( N i + 1)

(1) i

(2.2.8)

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

en donde se ha utilizado la notacin de los nmeros combinatorios


j
j!
i = i!( j i)!

(2.2.9)

La deduccin de (2.2.8) es un tanto compleja y se deja para un ejercicio. Hay que indicar que cada polinomio Gj,N(k) es un polinomio de grado
j y que, adems, el conjunto {Gj,N(k)} est en cada caso adaptado al problema que se trate, ya que depende del nmero N + 1 y de los argumentos
de los puntos en la tabla de datos de entrada {(xk, yk)}k=0,N. Se dice as
que los polinomios {Gj,N(k)} son ortogonales sobre el conjunto de N + 1
argumentos k o {xk}k=0,N. El paso a la variable original xk es trivial, pero se
recomienda siempre trabajar con la variable ndice k por su mayor comodidad y generalidad. Siempre que sea posible tambin est recomendado
utilizar un nmero impar (N + 1) de puntos. Los primeros polinomios
Gj,N(k) son los siguientes
G0 , N ( k ) = 1
2k
N

(2.2.10b)

6 k 6 k( k 1)
+
N N ( N 1)

(2.2.10c)

12 k 30 k( k 1) 20 k( k 1)( k 2)
+

N
N ( N 1)
N ( N 1)( N 2)

(2.2.10d)

G1, N ( k) = 1

G2, N ( k ) = 1

G3, N ( k ) = 1

(2.2.10a)

La gran ventaja de utilizar estos polinomios es la ya mencionada caracterstica de que si se desea aumentar el nivel de aproximacin del ajuste a los
N + 1 datos de la tabla, incluyendo ms trminos Gj,N(k) hasta un cierto
orden n, entonces todos los coeficientes ya calculados para cualquier orden
inferior m < n, p(m)(x) son automticamente vlidos y slo habr que calcular
los adicionales cm+1, cm+2, , cn Se tiene as que
f ( x) p( n) ( x) = p( m ) ( x) + cm+1Gm+1,N ( x) + cm+ 2Gm+ 2,,N ( x) + ... +

(2.2.11)

cnGn,N ( x); n > m

87

CLCULO NUMRICO Y ESTADSTICA APLICADA

2.3. El caso continuo: Producto escalar y distancia entre funciones


Se considera ahora la aproximacin de una funcin continua y = f(x) en
un intervalo cerrado [a, b] = a x b. La clave aqu es que el conjunto de
todas las funciones continuas {f(x)} en [a, b] es un espacio vectorial sobre el
cuerpo de los nmeros reales . En esencia esto significa que ese conjunto de
funciones es cerrado con respecto a la suma algebraica y tambin con respecto al producto de una funcin por un nmero real (escalar) l, es decir que
el resultado de estas operaciones y sus combinaciones es de nuevo una funcin continua en [a, b]. Una definicin ms rigurosa contiene el hecho de que
el conjunto {f(x)} debe ser un grupo conmutativo con respecto a la suma y
que, adems, al considerar el producto por escalares, deben satisfacerse leyes
distributivas (de productos sobre sumas), una ley asociativa en el producto de
dos escalares y una funcin, y una ley identidad 1.f(x) = f(x). Se recomienda al
lector que revise estos conceptos y otros conexos (combinaciones lineales,
base de un espacio vectorial, etc.) en un texto de lgebra. Las funciones {f(x)}
con soporte en [a, b] se comportan entonces como vectores de un espacio vectorial de dimensin infinita y una base de este espacio es la de los monomios
{xn}n=0, que se ha estado utilizando anteriormente. Estos monomios son funciones linealmente independientes y el ya mencionado teorema de Weierstrass pone de manifiesto su carcter de base como conjunto mnimo de funciones que pueden generar cualquier funcin del espacio considerado.
El concepto de independencia lineal de funciones es anlogo al de vectores, pero con la particularidad de que si el espacio que expanden es infinito
hay que precisar un poco ms el concepto. As, un conjunto {fn(x)}n=0, =
{f0(x), f1(x), f2(x), f3(x),...} es linealmente independiente (l.i.) cuando cualquier combinacin lineal de sus elementos que sea idnticamente nula presenta necesariamente nulos todos sus coeficientes (nmeros reales)
{n ( x)} n= 0,` es l.i. si: c00 ( x) + c11 ( x) + c22 ( x) + ... + cmm ( x) =

(2.3.1)

0 c0 = c1 = ... = cm = 0
en donde hay que reparar que el trmino combinacin lineal lleva aparejado
el de un nmero finito de trminos en ella. Esta precisin es innecesaria en
espacios finitos, pero conviene hacerla en espacios infinitos para evitar confusiones con los desarrollos en serie infinitos habituales en ellos. Si en alguna combinacin lineal del tipo (2.3.1) no se cumpliera la anulacin simult-

88

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

nea indicada, entonces el conjunto de funciones {fn(x)}n=0, sera linealmente


dependiente. Un criterio til para identificar la independencia lineal de un
conjunto de funciones es el del Wronskiano. Para un conjunto finito
{jn(x)}n=1,j de funciones, derivables hasta orden j 1 inclusive y definido en un
intervalo abierto a < x < b, el Wronskiano es el determinante siguiente formado por las derivadas sucesivas de cada funcin

W ( x) =

1 ( x)

2 ( x)

...

j ( x)

1( x)

2 ( x)

...

j ( x)

...

...

...

...

; a< x< b

(2.3.2)

1( j 1 ( x) 2( j 1 ( x) ... (j j 1 ( x)
y se tiene que
a) Si W(x) 0 (en al menos un valor x), entonces el conjunto {jn(x)}n=1,j es
linealmente independiente.
b) Si W(x) = 0 para todo a < x < b, entonces el conjunto {jn(x)}n=1,j es linealmente dependiente en el intervalo de definicin mencionado, pero siempre
que las funciones tengan derivadas continuas y que al menos uno de los
menores de la fila j no se anule en a x b.
c) En consecuencia, es interesante resaltar que W(x) = 0 en todo a < x < b,
es una condicin necesaria pero no suficiente para tener dependencia lineal.
Igualmente, si W(x) = 0 en valores aislados x = xi no necesariamente se tiene
dependencia lineal en {jn(x)}n=1,j.

Producto escalar de funciones


El paso siguiente es dotar de un producto escalar al espacio vectorial de
las funciones continuas, sobre el cuerpo y definidas en [a, b], lo que se
hace generalizando el concepto habitual utilizado para vectores de {n, }.
Este ltimo producto escalar para una pareja de estos vectores viene dado
por la expresin familiar de suma de productos de componentes
n

v1 v 2 = ( v11 , v12 ,..., v1n ) ( v21 , v22 ,..., v2 n ) =

1k

v2 k

(2.3.3)

k= 0

89

CLCULO NUMRICO Y ESTADSTICA APLICADA

El producto escalar anterior tiene como resultado un nmero real y


cumple una serie de propiedades
i) v1 v 2 = v 2 v1

(2.3.4a)

ii) ( v1 + v 2 ) v 3 = v1 v 3 + v 2 v 3

(2.3.4b)

iii) ( v1 ) v 2 = ( v1 v 2 )

(2.3.4c)

iv) v1 v1 0; (= 0 cuando v1 = 0)

(2.3.4d)

Figura 2T.2. Representacin grfica del producto escalar. Dadas dos funciones continuas f y g en el
intervalo [1, 2] y con funcin de peso v(x) = 1, el producto escalar de ambas es el rea total
encerrada entre la funcin producto y el eje x. Ntese que aparecen dos contribuciones de diferente
signo a este rea y que deben sumarse algebraicamente (con sus signos respectivos) para obtener el
valor del producto escalar.

Para dos de las funciones continuas que se estn considerando aqu el


producto escalar se define como la integral (una suma infinita) siguiente
(Fig. 2T.2)
f,g =

f ( x) g( x) dx = lim

xl 0

f ( x ) g( x )x ;
l

x1 = a, x` = b

(2.3.5)

l =1

y se recomienda al lector que verifique para esta definicin las propiedades


i) a iv) listadas arriba. En particular, la magnitud f, f es un nmero no
negativo y sirve para definir la norma o longitud Nf del vector f(x) en una
forma anloga a la de los vectores convencionales

N f = f ( x) =

90

1/ 2

f ( x) dx
(
a

( f,f )

1/ 2

< +`

(2.3.6)

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

de manera que f(x) = Nf1f(x) es una funcin con norma unidad y se dice que
est normalizada (vector unitario, Fig. 2T.3). Dos funciones f(x) y g(x) se dice
que son ortogonales (perpendiculares) en [a, b] si su producto escalar es
nulo
f,g =

f ( x) g( x) dx = 0 ; f g

(2.3.7)

lo que no es ms que la contrapartida continua al caso de ortogonalidad


entre vectores en {n, }, v1 v2 = 0 (Fig. 2T.4). En este contexto conviene
notar que: i) las funciones linealmente independientes pueden transformarse para formar funciones que sean ortogonales entre s; ii) las funciones
ortogonales son ya automticamente independientes.
Antes de seguir adelante conviene enunciar algunas propiedades bsicas
de una norma:
i) f ( x) 0, con f ( x) = 0 si y slo si f ( x) = 0

(2.3.8a)

ii) f ( x) = f ( x)

(2.3.8b)

iii)

f ( x) g( x) f ( x) g( x) (desigualdad de Schwarz)

iv) f ( x) + g( x) f ( x) + g( x) (desigualdad de Minkowski)

(2.3.8c)
(2.3.8d)

Figura 2T.3. Significado grfico de la normalizacin de una funcin. La funcin f(x) = + 2x


definida en el intervalor [0, 1] y con funcin de peso v(x) = 1, est normalizada ya que su cuadrado
[f(x)]2 = 2x encierra con el eje de las x un rea unidad.

91

CLCULO NUMRICO Y ESTADSTICA APLICADA

Figura 2T.4. Significado grfico de la ortogonalidad de funciones. Las funciones x2 y x5, definidas
en el intervalo simtrico respecto del origen [1, 1] y con la funcin de peso v(x) = 1, son ortoganales:
el rea encerrada por su producto, la funcin x7, y el eje de las x es nula. Incidentalmente,
ntese tambin que la funcin x5 es ortogonal a la funcin f(x) = 1.

Todas las definiciones anteriores se pueden generalizar al caso de funciones de peso w (x) 0, definidas en [a, b], no triviales. As la definicin
bsica de producto escalar entre funciones quedara en la forma
f,g =

f ( x) g( x) ( x) dx

(2.3.9)

y es con respecto a v (x) que se define la ortonormalidad de las funciones en


una forma similar a lo hecho anteriormente. En lo que sigue se mantendr la
funcin de peso trivial utilizada arriba v (x) = 1 por simplicidad de notacin,
y ms adelante al tratar con las familias de polinomios ortogonales de
Tschebyscheff, Hermite y Laguerre, se considerar el papel de cada v (x)
explcitamente.
El conjunto de funciones continuas en [a, b] es un espacio vectorial infinito-dimensional sobre el cuerpo de los nmeros reales. Tal conjunto dotado
del producto escalar (2.3.5), que induce la norma (2.3.6), es un espacio
denominado de pre-Hilbert, el cul mediante un proceso adecuado se transforma en la estructura completa denominada espacio de Hilbert, en el que
toda sucesin fundamental o de Cauchy debe necesariamente ser convergente. Los espacios de Hilbert juegan un papel fundamental en la Teora
Cuntica (Mecnica y Qumica) de tomos, molculas, y de sistemas mucho
ms complejos, como son aqullos compuestos de muchas partculas.

92

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Criterios de aproximacin entre funciones


Todava se puede dotar al espacio vectorial de las funciones continuas en
[a, b] con una mtrica o distancia entre funciones, si bien hay ms de una
posibilidad de realizar esto. Las ms habituales en el clculo numrico son
las dos siguientes. La primera es la distancia definida como el valor absoluto de la diferencia entre dos funciones (sup = mximo).
d1 ( f , g ) = sup f ( x) g( x) ; a x b

(2.3.10)

y la segunda se define a travs de la norma de la diferencia entre las dos


funciones

d2 ( f , g ) = f ( x) g( x) =

1/ 2

f ( x) g( x) dx
(
a

0; a x b

(2.3.11)

Ambas definiciones cumplen las propiedades exigibles a una distancia,


que esencialmente son: ser no negativa, simtrica, y verificar la desigualdad
triangular. Aqu se debe estar precavido de que en la segunda definicin
d2(f, g) = 0 no implica necesariamente que f(x) = g(x) en todos los puntos
a x b, sino que f(x) = g(x) en casi todos los puntos del intervalo. Se
excluyen as a los posibles conjuntos de puntos aislados que tengan medida
(en este caso longitud) nula, y la definicin de d2 se admite como una distancia de pleno derecho. Todo ello encuentra una formulacin general satisfactoria en la denominada teora matemtica de la medida en la que la llamada integral de Lebesgue juega un papel fundamental, pero aqu por
razones obvias no van a tratarse estos aspectos avanzados.
Es inmediato ver que ambas distancias proporcionan los dos criterios de
aproximacin de funciones con los que ya se ha tratado en el captulo 1:
a) d1 = sup f g se utiliza en la aproximacin de convergencia uniforme,
b) d2 = f g se utiliza en la aproximacin de convergencia en media
(mnimos cuadrados).
Desarrollos en serie de una base completa
Como el espacio de funciones es de dimensin infinita y la base polinmica {xn}n=0, se sabe que es completa en el intervalo [a, b], esto significa que

93

CLCULO NUMRICO Y ESTADSTICA APLICADA

se puede desarrollar en serie cualquier funcin continua en ese intervalo en


la forma
f ( x) = lim p( m ) ( x) = lim [ a0 + a1 x + a2 x2 + ... + am xm ]; a x b
m `

m `

(2.3.12)

Ntese que el smbolo de aproximacin utilizado en (2.1.1) se ha sustituido por el igual = aqu, y su significado est relacionado con las propiedades de convergencia presentes. Por otra parte, como la base de un espacio
vectorial no es nica, sino que existen infinitas bases equivalentes, {xn}n=0,
{fn(x)}n=0, {yn(x)}n=0, ..., que mantienen la propiedad de completitud, se
puede escribir en general
f ( x) = lim m ( x) = lim [ c00 ( x) + c11 ( x) + c22 ( x) + ... + cm m ( x)];
m`

m`

(2.3.13)

a xb
y se dice que la sucesin de funciones {Fm} converge hacia f(x) si, prefijada
una cantidad positiva y arbitrariamente pequea e > 0, siempre se puede
encontrar un valor del ndice m, que depende de e, m(e), o en definitiva
una Fm, tal que
a) f ( x) m ( x) < ; a x b (convergencia uniforme)

(2.3.14)

b) f ( x) m ( x) < ; a x b (convergencia en media)

(2.3.15)

Hay que precisar que el criterio uniforme garantiza la convergencia en


cada punto del intervalo, con la misma cota de error para todos ellos, y
tambin garantiza la convergencia en media con una medida del error global
sobre [a, b] siempre que cada Fm sea integrable. Sin embargo, la convergencia en media no garantiza necesariamente la convergencia en cada punto del
intervalo, ya que suaviza los detalles.

El clculo de los coeficientes del desarrollo


Es interesante resear que la definicin de los coeficientes ci resulta de
multiplicar en ambos miembros de la aproximacin funcional (serie) por la
funcin cuyo coeficiente quiere determinarse e integrar seguidamente. En
muchos casos conviene utilizar una base de desarrollo ortonormal, es decir

94

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

que cumpla para cada posible pareja de funciones del conjunto las dos condiciones siguientes que se formulan con la delta de Kronecker dij
{i ( x)} i=0 ,` es ortonormal si y slo si:

1 si i = j
i ( x) j ( x) dx = ij =
a
0 si i j
b

(2.3.16)

Por ejemplo, utilizando una base ortonormal el clculo de un coeficiente


cj cualquiera de (2.3.13) se realizara as
`

f ( x) =

c ( x) f ( x) ( x) = c ( x) (x)
i

i=0

b
a

i= 0

f ( x) j ( x) dx =

i= 0

b
a

(2.3.17)

ci i ( x) j ( x) dx =

c
i

ij

= cj

i= 0

En resumen, si la base es ortonormal, se tiene


cj =

b
a

f ( x) j ( x) dx

(2.3.18a)

y si la base slo es ortogonal, entonces la expresin anterior hay que modificarla como (recurdese que v (x)=1)

c =

b
a
b
a

=
( x) ( x) ( x) dx

f ( x) j ( x) ( x) dx
j

b
a
b
a

f ( x) j ( x) dx

(2.3.18b)

j ( x) j ( x) dx

Las operaciones de conmutacin anteriores de sumas infinitas con integraciones son lcitas cuando se trabaja con bases completas en estos espacios. En particular hay que resear que la completitud de una base de desarrollo equivale a decir
`

f ( x) =

c ( x) f ( x) =
2

i i

i= 0

b
a

( f ( x))

dx =

2
i

i= 0

(2.3.19)

(identidad de Parseval)
(la implicacin es doble, va en los dos sentidos). Es decir un conjunto de funciones es completo si y slo s se verifica la identidad de Parseval para toda

95

CLCULO NUMRICO Y ESTADSTICA APLICADA

f(x) de tal conjunto. Esto no es ms que una generalizacin del teorema de


Pitgoras a un espacio de dimensin infinita: la suma de los cuadrados de las
coordenadas de un vector (en una base ortonormal) es justamente el cuadrado de su mdulo.

Observaciones de inters
Es interesante sealar que en el caso de una serie de funciones que converge uniformemente a f(x) la integracin trmino a trmino es tambin
siempre posible. Esto exige que tanto f(x) como su derivada f (x) sean al
menos continuas a trozos en el intervalo de definicin. Lo mismo se exige,
generalmente, para la diferenciacin trmino a trmino de este tipo de
series.
Con la convergencia en media de funciones continuas sucede lo mismo,
pero hay que observar el comportamiento de la serie ortogonal en los extremos del intervalo de representacin: si en ellos hay discontinuidad, entonces
el valor de la serie (compuesta de funciones continuas) no va a coincidir
obviamente con el de la funcin. El anlisis de lo que sucede en los extremos
del intervalo es siempre algo recomendado en todo tipo de problemas que
implican desarrollos en serie.
Ntese que a efectos prcticos el desarrollo en serie va generalmente a
truncarse en un cierto orden m que sirva para obtener una representacin
aproximada de la funcin (esta aproximacin de orden finito es ya una
combinacin lineal). Incluso en este caso los coeficientes del desarrollo se
calculan como ya se ha expresado en (2.3.18)
m

f ( x)

cii ( x); ci =

i =0

b
a

f ( x)i ( x) dx

(2.3.20)

Esto puede visualizarse muy bien desde la perspectiva de mnimos cuadrados a partir de la aproximacin finita a f(x) y la minimizacin de una funcin S similar a la ya vista anteriormente
S=

96

b
a

f ( x)

i= 0

cii ( x) = mnimo

(2.3.21)

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

El clculo de las derivadas parciales de S con respecto a los coeficientes


del desarrollo ci lleva a un sistema lineal de ecuaciones y, tras aplicar las relaciones de ortogonalidad, se obtienen los coeficientes en la forma indicada
(aqu se utiliza normalizacin de la base tambin). En los siguientes pargrafos se estudiarn ejemplos concretos de este procedimiento. Finalmente,
la cuestin del error en el ajuste por truncamiento de la serie, medido por la
consabida magnitud cuadrtica S, puede formularse como sigue

Smn =

b
a

b
2
f ( x)
cii ( x) =
f ( x) dx
(
a

i =0
(desigualdad de Bessel)
m

2
i

i =0

(2.3.22)

resultado que se obtiene aplicando la relacin de Parseval (2.3.19) y las


relaciones de ortonormalidad de las funciones de base (2.3.16).
EJERCICIO 2.3.1
Un ejemplo familiar de conjunto completo es la base trigonomtrica de
Fourier definida en el periodo 0 < x < 2p y que est formada por las funciones
{1, cos nx, sen nx}n=1, = 1, cos x, sen x, cos 2x, sen 2x,... (todas admiten un
periodo 2p). a) Obtener las relaciones de ortogonalidad para estas funciones (la
funcin de peso es v (x) = 1). b) Obtener las expresiones generales para calcular
los coeficientes del desarrollo infinito (serie de Fourier). c) Desarrollar en serie
de Fourier la funcin peridica f(x) = x, 1 < x < +1.
a) Las relaciones de ortogonalidad (2.3.7) son en este caso las siguientes
;
sen kx sen jx dx = kj
0
0 ;
2
kj ;
cos kx cos jx dx =
0
2 ;

k0
k=0 j=0
k0
k= j=0

sen kx cos jx dx = 0; para todo k, j , enteros

Convencionalmente estas funciones de base no se utilizan de partida en


forma normalizada:

97

CLCULO NUMRICO Y ESTADSTICA APLICADA

f ( x) =

a0 `
+ ( a cos nx + bn sen nx)
2 n=1 n

b) Los coeficientes se obtienen aplicando (2.3.18b) y resultan ser


a0
1 2
=
f ( x) dx
; j=0
2 2 0
1 2
aj =
f ( x) cos jx dx ; j = 1, 2, 3,...
0
1 2
bj =
f ( x) sen jx dx ; j = 1, 2, 3,...
0

c) Para la funcin f(x) = x; 1 < x < +1 definida con periodo 2 hay primero que transformarla a periodo 2p. Podra hacerse la transformacin
1 < x < +1 0 < z < 2p, pero va a resultar ms ventajoso el cambio de
variable que transforma 1 < x < +1 p < z < p, que tambin mantiene
periodo 2p y permite utilizar la simetra en las integrales con lo que se ahorran clculos. Las series (desarrollos infinitos) obtenidas en 0 < z < 2p y en
p < z < p son completamente equivalentes en el sentido de que ambas convergen a la funcin f(x) = x, y hay que indicar que son iguales trmino a
trmino.
El cambio de variable que aprovecha la simetra es x = z/p, y la funcin a
desarrollar resulta ser impar sobre un intervalo simtrico en torno al origen
f(x) = f(x(z)) = g(z) = z/p ;

p < z < +p

de manera que en su desarrollo de Fourier slo habr funciones impares


(seno)
g ( z) =

a0
+
2

( an cos nz + bn sen nz) =

n =1

sen nz

n=1

pues todos los coeficientes aj van a ser nulos por la simetra de las integrales.
Se tiene entonces

bn =

g( z) sen nz dz = 1 g( z) sen nz dz = 1 z sen nz dz =


2
2
sen nz dz

98

1 sen nz z cos nz
2(1)n+1
=

n
n
2 n2

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Ntese que las frmulas anteriores para el clculo, ortogonalidad y coeficientes, slo requieren cambiar los lmites de integracin para poderlas
aplicar en el intervalo simtrico p < z < p. El conjunto {1, cos nz, sen nz}n=1,
es igualmente una base de desarrollo en este intervalo. El desarrollo es pues
g ( z) =

z
=

n (1)

n+1

sen nz; < z <

n=1
`

f ( x) = x =

n (1)
2

n +1

sen n x; 1 < x < 1

n =1

Figura 2T.5. Grficos de la serie Fourier truncada a dos y cinco trminos para
la funcin (impar) del Ejercicio 2.3.1.

En la Fig. 2T.5 pueden verse las aproximaciones del desarrollo truncadas


a 2 y 5 trminos. Ntese que para x = 1(z = p) la serie toma el valor 0, que
es el valor promedio de la funcin original en esas discontinuidades: la
funcin se repite peridicamente de modo que, por ejemplo, en x = 1 la
funcin f toma por la izquierda el valor +1 y por la derecha el valor 1. No se
incluyen as los extremos del intervalo en el desarrollo en este caso.

99

CLCULO NUMRICO Y ESTADSTICA APLICADA

2.4. Caso continuo: polinomios de Legendre


Ya se ha discutido que la aproximacin con el criterio de mnimos cuadrados de una funcin y = g(u) en trminos de la base polinmica convencional {f n(u)}n=0, = {un}n=0,
y = g(u) a0 + a1u + a2u2 +...+ anun;

1 u +1

(2.4.1)

lleva a una buena serie de problemas ligados con la determinacin de los


coeficientes ai. Sin embargo, como tal base est naturalmente compuesta de
elementos linealmente independientes, stos pueden ortonormalizarse
siguiendo un mtodo constructivo denominado de Gram-Schmidt y utilizando la funcin de peso trivial v (u) =1 definida en el intervalo 1 u +1.
Ntese que esto equivale a definir u = cos q en el dominio 0 q p, un
cambio de variable que se utiliza mucho en las aplicaciones de estos polinomios.

Ortogonalizacin constructiva de Gram-Schmidt


El proceso comienza fijando como primer vector el vector f0(u) = 1 de
la base polinmica convencional: Q0(u) = f 0(u) = 1. Su normalizacin se
hace de acuerdo con el producto escalar de funciones (2.3.7) en el intervalo 1 u +1
N0 = Q0 , Q0

1/ 2

= Q0 (u) = 1 =

1/ 2

11 du
1

+1

= 2

(2.4.2)

con lo que esta funcin normalizada es


P0 ( u) = N01Q0 (u) =

1
2

(2.4.3)

que representa al vector unitario en la direccin n = 0.


El siguiente paso es ortonormalizar la segunda funcin de {un}n=0,,

f1(u) = u, con respecto a P 0(u) restndole primero lo que le sobra (la proyeccin sobre la direccin n = 0).

100

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Q1 (u) = 1 ( u)

Q0 (u) , 1 (u)
Q0 (u), Q0 (u)

1
1 ( u) P0 (u), 1 (u) P0 (u) = u
2

Q0 (u) =
(2.4.4 )
1
=u
u du
1
2
+1

y normalizando despus
N1 = Q1 , Q1

1/ 2

= Q1 (u) = u =

P1 (u) = N11Q1 ( u) =

1/ 2

u udx
1

+1

2
3

(2.4.5)

3
u
2

(2.4.6)

Este es el vector unitario en la direccin n = 1.


A continuacin se ortonormaliza f2(u) = u2 a los dos polinomios anterio

res P 0 y P 1
Q2 (u) = 2 ( u)

Q0 ( u), 2 ( u)

Q0 (u)

Q0 (u), Q0 (u)

Q1 (u), 2 (u)
Q1 (u), Q1 (u)

Q1 ( u) =

2 ( u) P0 (u), 2 (u) P0 (u) P1 (u), 2 (u) P1 ( u) =


1
u2
2

u2 du
1
2

+1

+1

(2.4.7)

3
3
1
u u2 du
u = u2
2
3
2

La normalizacin lleva a

N2 = Q2 , Q2

1/ 2

1
= Q2 (u) = u =
3
2

P2 (u) = N21Q2 (u) =

1/ 2

( u 2u / 3 + 1/ 9 ) dx =
1

+1

8
45

(2.4.8)

1 5
(3u2 1)
2 2

que es el vector unitario en la direccin n = 2.

101

CLCULO NUMRICO Y ESTADSTICA APLICADA

Los clculos siguen de la misma manera con el resto de las funciones. As


para f3(u) = u3 se tiene
2

Q3 (u) = 3 (u)

P (u), (u) P (u) = u 5 u


3

(2.4.9)

m= 0

que normalizado es
N3 = Q3 , Q3

1/ 2

= Q3 (u) =

8
1 7
; P3 (u) = N31Q3 (u) =
(5u3 3u)
175
2 2

(2.4.10)

y representa al vector unitario en la direccin n = 3.


El proceso puede verse que se generaliza sin dificultad. Conocidos los
polinomios ortogonales Q hasta un cierto orden n, el siguiente polinomio
Qn+1 se determina restando a fn+1 las proyecciones sobre cada eje Qm ya
determinado
n

Qn+1 (u) = n+1 ( u)

P (u),
m

n +1

(u) Pm (u)

(2.4.11)

m =0

y su normalizacin se formula como


Nn+1 = Qn+1 , Qn+1

1/ 2

= Qn+1 (u) =

Pn+1 (u) =

+1

(Q
1

n +1 ( u)

du;

(2.4.12)

Nn+11Qn+1 ( u)

Forma de los polinomios normalizados de Legendre

Estos polinomios P m(u) son los denominados polinomios ortonormalizados de Legendre, relativos a la funcin de peso unidad v (x) = 1, y son
alternativamente funciones pares o impares segn va marcando su grado m

102

m = 0, 2, 4, 6, .... Pm ( u) = Pm ( u), par

(2.4.13)

m = 1, 3, 5, 7, .... Pm ( u) = Pm ( u), impar

(2.4.14 )

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Por construccin verifican la relacin de ortonormalidad


1 si m = n
Pm (u) Pn ( u) du = mn =
1
0 si m n

+1

(2.4.15)

y son un conjunto completo en 1 u +1 que sirve para desarrollar en


serie, convergente en media, cualquier funcin continua g(u) definida en ese
intervalo en la forma
`

y = g ( u) =

m Pm (u);

1 u +1

(2.4.16)

m= 0

con los coeficientes dados por


cm =

+1
1

Pm ( u) g(u) du

(2.4.17)

En la forma dicha anteriormente se pueden expresar aproximaciones a


g(u), usando slo un nmero n finito de trminos, como la combinacin
lineal
y = g( u) gn ( u) = c0 P0 ( u) + c1P1 (u) + c2 P2 (u) + ... + cn Pn (u)

(2.4.18)

y los coeficientes estn dados por (2.4.17). La aproximacin anterior suministra la mejor aproximacin de orden n, en el sentido de los mnimos cuadrados, como puede comprobarse minimizando la correspondiente funcin
S que viene dada por

S = d2 ( g, gn )

1/ 2
2

+1

( g(u) g (u))
1

(2.4.19)

La precisin de la aproximacin (2.4.18) puede aumentarse aadiendo


ms trminos al desarrollo utilizando polinomios de grado progresivamente
creciente (n + 1, n + 2,...) y con sus coeficientes dados por (2.4.17). El error
del ajuste viene dado por el valor (mnimo) que tome la funcin S.
EJERCICIO 2.4.1
Comprobar que la minimizacin de (2.4.19) con respecto a los coeficientes
cj de (2.4.18) lleva a las definiciones (2.4.17).

103

CLCULO NUMRICO Y ESTADSTICA APLICADA

El sistema normal de ecuaciones asociado a la minimizacin es


m=0

S
= 0 c0
c0

m = 1

S
= 0 c0
c1

...
m = n

...

+1
1

+1
1

P0 P0 du + c1

P1P0 du + c1

...

S
= 0 c0
cn

+1
1

+1
1

P0 P1du + ... + cn

P1P1du + ... + cn

...
+1

Pn P0 du + c1

...

+1
1

+1
1

+1
1

P0 Pn du =

P1Pn du =

...

Pn P1du + ... + cn

+1
1

P0 g du

+1
1

P1 g du

...
+1
1

Pn Pn du =

(2.4.20)

...

+1
1

Pn g du

y su solucin es trivial por ser todas las integrales de productos P iP j, salvo las
diagonales, nulas por ortogonalidad
+1

cm =

1 Pm ( u) g(u) du = +1 P (u) g(u) du


1 m
+1
1 Pm (u) Pm (u) du

Forma habitual de los polinomios de Legendre


Los polinomios de Legendre, tambin llamados funciones esfricas, han
sido ampliamente estudiados y poseen un buen nmero de relaciones matemticas tiles que los relacionan. Sus expresiones normalizadas son las

dadas arriba para los P m(u), pero convencionalmente se utilizan sus formas no normalizadas Pm(u) que no coinciden exactamente con las de las funciones Qm(u) que surgen del proceso de Gram-Schmidt mostrado (hay otras
muchas opciones, obviamente), sino que son proporcionales a ellas. La rela
cin estndar que liga P m(u) con Pm(u) es
Pm (u) =

2m + 1
Pm ( u)
2

(2.4.21)

con lo que la frmula de normalizacin habitual en la bibliografa es

+1

2
2
Pm (u) du =
2m + 1

(2.4.22a )

o de forma compacta suele expresarse la ortonormalidad, relativa a v (x) =1,


como

+1

104

Pm (u) Pn (u) du =

2m + 1 mn

(2.4.22b)

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Adems, los Pm(u) se pueden obtener directamente de la frmula de


Rodrigues
Pm (u) =

m
1
dm
2
u

1
; m = 0,1, 2,...
2 m m! dum

(2.4.23)

Los primeros de estos polinomios Pm(u) son (Fig. 2T.6)


P0 (u) = 1

P1 (u) = u

P2 ( u) =

1
(3u2 1)
2

1
(5u3 3u)
2

(2.4.24a )

1
(35u4 30 u2 + 3)
8

(2.4.24 b )

P3 (u) =

P4 (u) =

P5 (u) =

1
(63u5 70u3 + 15u)
8

(2.4.24c)

Figura 2T.6. Grficos de los cuatro primeros polinomios de Legendre Pm(x).

Propiedades adicionales
Las siguientes son algunas propiedades de estas funciones no normalizadas que merecen destacarse.

105

CLCULO NUMRICO Y ESTADSTICA APLICADA

i) Los Pm(u) son soluciones de la ecuacin diferencial de segundo orden


(Legendre)

d2
d
2
2u
+ m( m + 1) Pm (u) = 0; 1 u +1
1 u
2
du
du

(2.4.25)

y cualquiera de ellos tiene todas sus m races reales todas simples y contenidas en [1, +1], valores stos de las races que juegan un papel fundamental
en la integracin numrica de funciones. Como detalle interesante: entre
dos races consecutivas de Pm(u) hay una, y slo una, raz de Pm1(u), lo que es
una propiedad general para todas las familias de polinomios ortogonales.
ii) Una recurrencia especialmente til es la relacin siguiente
( m + 1)Pm+1 (u) = (2m + 1)uPm (u) mPm1 (u); m 1

(2.4.26)

pues lleva a generarlos todos a partir de los dos primeros y, adems, permite calcular Pm+1(u) numricamente en 1 u +1 sin una prdida sustancial
de cifras significativas.
iii) Los Pm(u) en [1, +1], toman valores entre +1 y 1 con las propiedades Pm(1) = +1, Pm(1) = (1)m.
iv) Estos polinomios estn muy estrechamente relacionados con los
clculos en los que interviene el inverso de la distancia entre dos partculas
(potencial de interaccin culombiano, por ejemplo), lo que est contenido
en su funcin generatriz
1
1 + t 2t cos
2

= {u = cos } =

P (u)t ; 1 u +1;
n

t <1

(2.4.27)

n= 0

en donde se ha desarrollado en serie de t en torno a t = 0. La frmula anterior representa al inverso de la distancia entre un punto A, interior a una
esfera de radio unidad, y un punto cualquiera B de la superficie de sta, siendo t la distancia entre A y el centro de la esfera.
v) Utilizando la ecuacin diferencial (2.4.25) y la funcin generatriz
(2.4.27) se pueden deducir tambin las relaciones de ortogonalidad que
verifican estos polinomios.

106

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

EJERCICIO 2.4.2
Expresar cos 4 q como un desarrollo de los polinomios de Legendre
Pn(cos q).
Una posibilidad de realizar esto sera calcular los coeficientes del desarrollo de la funcin cos 4q en la base de los polinomios de Legendre aplicando (2.4.17). Sin embargo, se puede hacer esto de un modo abreviado,
dadas las caractersticas del problema. As, si primero se expresa cos 4q en
trminos de las potencias de x = cos q, utilizando nmeros complejos se
tiene que
4 4
[exp(i )]4 = (cos + i sen )4 = cos 4 j i j sen j
j =0 j

[exp(i )]4 = exp(i4 ) = (cos 4 + i sen 4 )


Identificando las dos partes reales se establece
cos 4q = 8 cos4 q 8 cos2 q + 1 = 8x4 8x2 + 1;

1 x +1

Se pueden ahora utilizar las relaciones que ligan Pn(x) con las potencias
x de manera que se disponga de
n

1 = P0 ( x); x2 =

1
1
[ P0 ( x) + 2 P2 ( x)]; x4 =
[7 P0 ( x) + 20 P2 ( x) + 8 P4 ( x)]
3
35

Sustituyendo directamente se llega a


cos 4 =

64
16
1
P4 ( x)
P2 ( x) P0 ( x); 1 x +1
35
21
15

El resto de los coeficientes del desarrollo son evidentemente nulos.

2.5. Caso continuo: polinomios de Tschebyscheff


Definicin
Los polinomios de Tschebyscheff presentan unas propiedades de error
acotado muy deseables en el ajuste y representacin de funciones y tienen

107

CLCULO NUMRICO Y ESTADSTICA APLICADA

una funcin de peso no trivial v (u) 1. Por tanto hay que recordar que en
este caso, y en otros similares de familias ortogonales {fn(u)}n=0,, la definicin del producto escalar ampliado hay que tomarla segn (2.3.9)

i (u), j ( u)

b
a

i (u) j (u) (u) du = N j2ij

(2.5..1)

El intervalo natural de definicin de los polinomios de Tschebyscheff es


[1, +1] y su funcin de peso es

( u) =

1
+ 1 u2

; 1 u +1

(2.5.2)

Cualquier otro intervalo puede tratarse mediante el adecuado cambio de


variable (2.1.3). La definicin viene dada por la expresin trigonomtrica
Tn(u) = cos (n arc cos u) = cos nq ;

q = arc cos u;

0qp

(2.5.3)

y los primeros son (Fig. 2T.7)


T0 ( u) = 1

T3 (u) = 4 u3 3u

(2.5.4a )

T1 (u) = u

T4 (u) = 8u4 8u2 + 1

(2.5.4 b)

T2 (u) = 2u2 1

T5 (u) = 16 u5 20u3 + 5u

(2.5.4c )

Figura 2T.7. Grficos de los cuatro primeros polinomios de Tschebyscheff Tn(x).

108

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Estas expresiones explcitas pueden obtenerse haciendo uso de relaciones


trigonomtricas. Por ejemplo, para n = 2
T2(u) = cos 2q = cos2 q sen2 q = {u = cos q} = 2u2 1
No obstante, a medida que aumenta el orden n este es un proceso tedioso y resulta ms sencillo generarlos todos a partir de los dos primeros utilizando la igualdad
cos (n + 1)q + cos (n 1)q = 2 cos q cos nq

(2.5.5)

que da la recurrencia
Tn+1(u) = 2uTn(u) Tn1(u);

n1

(2.5.6)

De lo anterior es fcil ver que el trmino conductor de Tn(u) tiene, para


n 3, por coeficiente 2n1. Tambin puede observarse que estas funciones son
alternativamente pares o impares de acuerdo con su ndice o grado n
Tn(u) = (1)n Tn(u)

(2.5.7)

Estos polinomios tambin poseen una frmula de Rodrigues para generarlos, pero es un tanto complicada y se va a omitir aqu.

Propiedades adicionales
i) Las n races de Tn(u) son todas reales simples y estn dentro del intervalo de definicin [1, +1]. Sus valores son
uk = cos ((2k + 1)p/(2n)) con k = 0, 1, 2, ..., n 1

(2.5.8)

Entre cada dos races consecutivas de Tn(u) cae una y slo una raz de
Tn1(u).
ii) Los polinomios Tn(u) oscilan a lo largo de 1 u +1 mantenindose
(u)
T
n 1 y alcanzado valores mximo +1 y mnimo 1 en los puntos
uk = cos (kp /n), k = 0, 1, 2, ..., n. Presentan as n + 1 extremos de igual
amplitud, propiedad que hace de estos polinomios una herramienta muy til
por suministrar aproximaciones de oscilacin igual mximo-mnimo en el
error del ajuste.

109

CLCULO NUMRICO Y ESTADSTICA APLICADA

iii) La ortonormalidad en 1 u +1 se formula como

+1 T (u)T ( u)
i
j

1 u2

= arc cos u

du = Ti , Tj =
du
d =
1 u 2

(2.5.9)

cos i cos j d = Ni2 ij

en donde la constante de normalizacin toma los valores


N02 = ; Ni20 =

(2.5.10 )

El conjunto ortonormal es pues


T0 (u) =

2
T (u), n 1
n

; Tn (u) =

(2.5.11)

iv) Una funcin generatriz para los Tn(u) es


1 tu
1 2tu + t 2

T (u) t ;
n

t < 1;

u 1

(2.5.12)

n= 0

y la ecuacin diferencial de la que son solucin es

d2
d
2
+ n2 Tn (u) = 0; 1 u +1
(1 u ) 2 u
du
du

(2.5.13)

v) Dado el carcter completo de {Tn(u)}n=0, cualquier funcin continua en


[1, +1] puede desarrollarse en serie como
`

f (u) =

c T ( u)
n n

(2.5.14 )

n= 0

y ste es un desarrollo que converge en media hacia f(u) (Smn 0, n ).


Por truncamiento de la serie pueden obtenerse aproximaciones de orden fini-

110

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

to m que son acordes con el criterio de mnimos cuadrados y los coeficientes,


que son idnticos a los correspondientes de (2.5.14), vienen dados por
m

f (u)

cnTn (u);

cn =

n= 0

1
Nn2

+1

f (u)

Tn (u)
1 u2

du; n = 0,1, 2,..., m

(2.5.15)

cuya medida del error viene dada por el valor que tome Smn > 0.

La economizacin de polinomios
Una propiedad que merece consideracin aparte es que, para funciones
continuas y de variacin acotada en [1, +1] el desarrollo en serie (2.5.14)
converge no slo en media, sino tambin uniformemente (sobre todo el
intervalo a la vez con la misma velocidad en todos los puntos). Este doble
carcter convergente confiere a los polinomios {Tn(u)} una gran versatilidad
de uso. Ntese que en una aproximacin del tipo (2.5.15) el error cometido a
partir de un orden m adecuado est esencialmente dominado por el siguiente trmino no incluido
m

f ( u)

c T (u) ~ c
n n

m+1Tm+1 ( u)

cm+1 ; 1 u +1

(2.5.16)

n= 0

expresin en la que el smbolo ~ indica que la contribucin m + 1 es del mismo


orden que la diferencia de la izquierda. Este error es as tal que muestra una
muy razonable uniformidad sobre todo el intervalo, como consecuencia de la
propiedad de oscilacin igual ya mencionada. Esto no es naturalmente la
convergencia uniforme, sino slo una consecuencia til de tal hecho particular en este caso. Obtener tal convergencia es en la prctica un asunto generalmente fuera de alcance y se sustituye por una tcnica de aproximacin ms
avanzada denominada mini-max. En esta tcnica se hace mnimo el valor
mximo de la diferencia absoluta entre f(u) y su aproximante, el cul toma la
forma de una funcin racional como cociente de dos polinomios (pueden
ser stos del tipo Tn(u), entre otras opciones). Este es un asunto muy especializado que no va a tratarse aqu. Sin embargo, la propiedad anterior de acotacin del error al trabajar con los {Tn(u)} puede explotarse para generar
aproximaciones econmicas a una funcin. Esta es la conocida como operacin de economizacinde polinomios y va describirse a continuacin.

111

CLCULO NUMRICO Y ESTADSTICA APLICADA

Supngase que para una funcin conocida y de difcil evaluacin f(u) se


ha generado una aproximacin de Taylor de orden m con potencias un en
torno a u = 0
f(u) a0 + a1u + a2u2 + ... + amum;

1 u +1

(2.5.17)

Es sabido que esta aproximacin funcionar muy bien en las cercanas


del origen del desarrollo, pero que presentar error creciente a medida que
u 1. Para corregir este efecto habra que incluir ms trminos, n > m, en
el desarrollo de Taylor y esto pudiera no ser una buena opcin por resultar
anti-econmica. La alternativa que brindan los polinomios de Tschebyscheff es la de sustituir los monomios un por sus representaciones en trminos
de {Tn(u)}n=0,
j

u =

c T (u);

j = 0,1, 2,..., m

jn n

(2.5.18)

n= 0

con lo que
m

f ( u) a0 + a1T1 (u) + a2

T ( u) + ... + am

2n n

n= 0

T (u) =

mn n

n= 0

b T (u);
n n

n= 0

(2.5.19 )

1 u +1
Aunque evidentemente las aproximaciones (2.5.17) y (2.5.19) son idnticas, la forma (2.5.19) permite despreciar, generalmente, el ltimo trmino de
orden m manteniendo un error de aproximacin similar al que se obtendra
con el desarrollo original
m1

f ( u)

n =0

anun

b T (u);
n n

1 u +1

(2.5.20
0)

n= 0

As, la aproximacin de Tschebyscheff de orden (m 1) mantiene un


error mximo del orden de bn y uniformemente distribuido sobre el intervalo, eliminndose las fuertes discrepancias en los extremos al precio de
empeorar ligeramente las estimaciones en las cercanas de u = 0. El resultado de orden (m 1) con los polinomios {Tn(u)}n=0,m1 es un polinomio muy cercano (pero no idntico generalmente) al de mnimos cuadrados de ese mismo
orden (m 1).

112

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Observaciones de inters
Los polinomios {Tn(u)}n=0, aqu tratados son los denominados Tschebyscheff de tipo I (hay varios tipos de polinomios de Tschebyscheff). Su utilidad puede ser extendida a intervalos generales [a, b]x sin ms que hacer
uso del pertinente cambio de variable, como ya se ha sealado. Este cambio funciona en los dos sentidos: a) se transforma [a, b]x [1, +1]u con
f(x) f(x(u)) = g(u) y se trabaja con los polinomios {Tn(u)}; b) se transforma [1, +1]u [a, b]x con Tn(u) T*n(x) y se trabaja con los ltimos
para directamente ajustar f(x). En este caso b) las relaciones que se verifican para los {Tn(u)} cambian al pasar a los {T *n(x)} y pudiera resultar poco
til esta posibilidad. En ambos casos, a) y b), se recomienda extremar el
cuidado al efectuar estimaciones numricas para evitar que el delicado
balance que muestran los {Tn(u)} en [1, +1]u se deteriore al pasar a [a, b]x.
Finalmente los desarrollos en la base {Tn(u)} para [1, +1] estn estrechamente relacionados con las series de Fourier (AP. II) y las aproximaciones trigonomtricas a tablas de datos que van a considerarse ms adelante
(Cap. 9). Convencionalmente se escribe
f ( u) =

1
c +
2 0

c T (u);
n n

u = cos ; 1 u +1

(2.5.21)

n=1

f (u) = f (cos ) = g( ) =

1
c +
2 0

c cos n
n

(2.5.22)

n=1

que es la forma de una serie de Fourier en cosenos para una funcin par y
peridica. Los polinomios Tn(u) verifican relaciones de ortogonalidad discretas utilizando como argumentos las n races uk de uno de ellos. As para
las n races del polinomio Tn(u), dos polinomios cualesquiera Ti(u) y Tj(u),
con i, j < n, cumplen
0

si i j

Ti (uk ) Tj (uk ) = n / 2 si i = j 0

k=0
si i = j = 0
n
n 1

(2.5.23)

una relacin que puede probarse notando que las n races estn repartidas
simtricamente en [1, +1]. Esta interesante propiedad permite generar
aproximaciones de mnimos cuadrados para datos tabulares {(ul, yl)}l=0,N, si

113

CLCULO NUMRICO Y ESTADSTICA APLICADA

bien obliga a describirlos utilizando las abcisas raz uk y no los valores ul de


la tabla. Esto fuerza a estimar de algn modo (colocacin u otro) los correspondientes valores yk asociados. El resultado suele ser muy til ya que produce la suavizacin propia de los mnimos cuadrados.
EJERCICIO 2.5.1
Evaluar las dos integrales siguientes con polinomios de Tschebyscheff

a)
b)

+1

+1

T1 ( x) T2 ( x) dx
P3 ( x) T4 ( x)
1 x2

dx; P3 ( x) = polinomio de Legendre

En ninguno de los dos casos es necesario calcular explcitamente las


integrales pedidas.
En el caso a) se tiene un producto de dos polinomios de Tschebyscheff,
uno impar T1 y otro par T2 resultando simetra impar en el integrando.
Como el intervalo de integracin es finito y simtrico con respecto al origen:
la integral a) es idnticamente nula por simetra. Esto no es la ortogonalidad
de T1 y T2, sino simplemente un resultado de simetra.
En el caso b) el polinomio de Legendre P3(x) se puede expresar como una
combinacin de las potencias de x: x, x3. A su vez estas potencias de x se pueden expresar como combinaciones de los polinomios de Tschebyscheff T1 y
T3, de manera que al ser cada uno de ellos ortogonal a T4(x), la integral b) es
idnticamente nula. El lector puede desarrollar las expresiones oportunas y
verificar ambos resultados.

2.6. Caso continuo: polinomios de Hermite y de Laguerre


Las dos familias de polinomios ortogonales que se presentan a continuacin se definen sobre intervalos de integracin infinitos: i) Gauss-Hermite,
v (x) = exp(x2), < x < ; y ii) Gauss-Laguerre, v (x) = exp(x), 0 x < . En
ambos casos son necesarias las funciones de peso para forzar la convergencia de las integrales y algunas de sus conexiones con la Mecnica Cuntica estn en el estudio de la vibracin molecular (Hermite {Hn(x)}n=0,) o en

114

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

el estudio de las funciones de onda del tomo de hidrgeno (Laguerre


{Ln(x)}n=0,). Por otra parte, las dos familias juegan un papel central en
muchos problemas de integracin numrica.
Los polinomios ortogonales respectivos pueden generarse a partir de
sus frmulas de Rodrigues (n = 0, 1, 2, ...)

dn
Hn ( x) = ( 1)n exp ( x2 ) n exp ( x2 )

dx
Ln ( x) =

exp ( x) d n n
n x exp ( x)
n! dx

(2.6.1)

(Hermitte)

(Laguerrre)

(2.6.2)

o de las frmulas de recurrencia correspondientes


H0(x) = 1;

H1(x) = 2x

Hn(x) = 2xHn1(x) 2(n 1)Hn2(x);


L0(x) = 1;

(2.6.3a)
n2

L1(x) = 1 x

(n + 1)Ln+1(x) = (2n + 1 x)Ln(x) nLn1(x);

(2.6.3b)
(2.6.4a)

n1

(2.6.4b)

Las relaciones de ortonormalidad que verifican son las siguientes

exp ( x2 )Hn ( x)Hm ( x) dx = 2n n! nm

exp ( x) Ln ( x) Lm ( x) dx = nm

(2.6.5)
(2.6.6)

EJERCICIO 2.6.1
Aplicando las recurrencias (2.6.3b) y (2.6.4b) escribir los cinco primeros
polinomios de Hermite y de Laguerre. Comparar sus caractersticas de simetra
y discutir cmo afectara, una vez obtenidos, un cambio de signo en uno de
ellos a su normalizacin y a sus relaciones de ortogonalidad con el resto.
Las expresiones son fciles de determinar y se llega a
H0(x) = 1

L0(x) = 1

H1(x) = 2x

L1(x) = x + 1
1
L2(x) = (x2 4x + 2)
2

H2(x) = 4x2 2

115

CLCULO NUMRICO Y ESTADSTICA APLICADA

1
(x3 + 9x2 18x + 6)
6
1 4
H4(x) = 16x4 48x2 + 12
L4(x) =
(x 16x3 + 72x2 96x + 24)
24
1
H5(x) = 32x5 160x3 + 120x L5(x) =
(x5 + 25x4 200x3 + 600x2 600x + 120)
120
Como puede observarse los polinomios de Hermite presentan simetras respecto del origen x = 0: los de ndice n = par = 2m son funciones pares H2m(x) =
H2m(x); los de ndice n = impar = 2m + 1 son funciones impares H2m+1(x) =
H2m+1(x). Los polinomios de Laguerre no presentan ninguna simetra con respecto al origen, pues no estn definidos para valores x < 0. No obstante, se observa la alternancia de signos en sus expresiones siendo positivo si el trmino es de
grado par (n = 0 incluido), o siendo negativo si el trmino es de grado impar.
H3(x) = 8x3 12x

L3(x) =

Claramente a la vista de (2.6.5) y de (2.6.6) el cambio de signo en uno


cualquiera de ellos no afecta para nada a sus propiedades de normalizacin
o de ortogonalidad con cualquiera de los dems. Este resultado se extiende a
la familia completa de los polinomios correspondientes, y lo mismo para un
nmero arbitrario de funciones que cambien de signo. Esta es una propiedad
muy importante para las aplicaciones de la Mecnica Cuntica en las que las
funciones ortogonales intervienen construyendo funciones de onda, pues
el sentido fsico habitual relacionado con una probabilidad no se coloca en la
funcin como tal, sino en el cuadrado (del mdulo) de tal funcin con lo que
un cambio de signo resulta irrelevante.
EJERCICIO 2.6.2
En la teora cuntica de perturbaciones del estado fundamental del oscilador armnico aparecen integrales sobre polinomios de Hermite de la forma

exp ( x2 )Hn ( x) x3 H0 ( x) dx; n = 0,1, 2, 3,...

Discutir bajo qu condiciones de simetra se anulan estas integrales.


Todo depende de la paridad del integrando: H0 es par, x3 es impar y
exp(x2) tambin es par. El producto de estos tres factores es por tanto
impar. As, las integrales nulas por simetra son todas aqullas en las que
Hn(x) n sea par: n = 0, 2, 4, 6, ... Aunque el intervalo es infinito, la convergencia est garantizada por la exponencial.

116

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

BIBLIOGRAFA
1. SCHEID, F., Anlisis Numrico, McGraw-Hill (serie Schaum), 1972. (Cap. 21). Se
mantiene el mismo captulo numerado de consulta en la obra Numerical Analysis
(1988).
2. SES, L. M., Mtodos Tericos de la Qumica-Fsica (Vol. 1), UNED, Madrid,
1994. (Tema 4).
3. PRESS, W. H.; FLANNERY, B. P.; TEUKOLSKY, S. A. y VETTERLING, W. T., Numerical
Recipes, Cambridge University Press, Cambridge, 1986. (Cap. 5).
4. RICE, J. R., Numerical Methods, Software and Analysis, McGraw-Hill, Nueva York,
1983. (Cap. 11).
5. RALSTON, A. y RABINOWITZ, P., A First Course in Numerical Analysis, Dover, Nueva
York, 2001. (Caps. 2, 6, 7).

117

CLCULO NUMRICO Y ESTADSTICA APLICADA

PROBLEMAS TERICOS Y NUMRICOS

Problemas tericos
2.1) Desarrollar en la base de los polinomios de Legendre {P n(z)} n=0,,
1 z +1, la funcin f(x) = sen x definida en el intervalo [p, p]. Utilizar
un desarrollo hasta orden n = 3 y comparar numricamente con el desarrollo de Taylor hasta mismo orden, realizado en torno a x0 = 0, tomados
ambos en x = p/2.
2.2) La funcin de onda de una partcula en una caja de potencial de longitud
2L se prepara para que sea de la forma
x2 2
+ x; 0 x 2 L

f ( x) = L2 L
0
en otro caso

a) Desarrollar esta funcin en serie de Fourier utilizando la base convencional de senos y cosenos.
b) Haciendo uso de que el conjunto de funciones n ( x) = sen

n x
, n = 1,,
2L

, 2, 3,,`, forma un conjunto completo en 0 x 2L, desarrollar f(x)


en esta base y comparar con el resultado anterior.
`

c) Sumar la serie

( 1) n

(2n + 1) .
3

n= 0

2.3)** Se define la funcin d de Dirac mediante su actuacin sobre funciones f(x) con buen comportamiento (continuas y con derivada continua,
por ejemplo). Estas condiciones se expresan y visualizan con

`
`

( x a) f ( x) dx = f ( a);

0 si x a
( x a) dx = 1; ( x a) =

`
` si x = a
`

Desarrollar d (x) en serie de los polinomios de Legendre en (1, +1).

118

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Problemas numricos
2.4) Encontrar el ajuste de mnimos cuadrados de grado 2 con los polinomios
de Gram-Tschebyscheff para la tabla dada en el Problema 1.7.
2.5) Determinar el orden de un desarrollo de Taylor en torno a x 0 = 0
para garantizar 9, 5, 3, y 2 cifras decimales correctas en el resultado de
sen x para valores 1 x +1.
2.6) Expresar sen x mediante la serie de Taylor en torno a x0 = 0 y con la economizacin de Tschebyscheff (1 x +1) obteniendo al menos dos cifras

correctas. Comparar los valores de ambas aproximaciones en x = .


4
2.7) Estudiar grficamente la funcin generatriz de los polinomios de Legendre
evaluada en t = 0,6
f ( u) =

1
2

1 + t 2tu

P (u)t

= P0 (u) + tP1 (u) + t 2 P2 (u) + ... + t m Pm ( u)

n= 0

llegando hasta los grados m = 2, 5, en el desarrollo.

SOLUCIONES
Problema 2.1
El cambio de variables que pasa de [p, p]x [1, +1]z es z = x/p. Con ello
la funcin se expresa
f(x) = f(x(z)) = g(z) = sen p z
y el desarrollo en serie de polinomios de Legendre no normalizados es
+1

g( z) = sen z =

c P (z);
n n

n= 0

cn =

1 Pn ( z) sen z dz = 2n + 1
1 ( Pn ( z) )
+1

dz

+1

1 Pn ( z) sen z dz

119

CLCULO NUMRICO Y ESTADSTICA APLICADA

En este desarrollo el carcter impar de g(z) en el intervalo 1 z +1 va a


anular, por simetra, todas las integrales con ndice par n = 0, 2, 4, 6, ... (se
incluye el 0), pues el polinomio correspondiente va a ser una funcin par.
Esta condicin de paridad no se va a cumplir para los coeficientes con n = 1,
3, 5, 7, ... y sus valores van a ser no nulos. En este caso se necesitan los coeficientes c1 y c3 cuyos valores son
3
c1 =
2
c3 =

7
4

+1
1

+1

3 sen z z cos z
3
=

z sen z dz =

2
2

1
1

+1

(5z3 3z )sen z dz =
+1

6 z z3
sen z z cos z
15 1
14 3z2 6
5
cos

5 2 4 sen z 3
= 7 3 +

2
3
4

Se tiene entonces que la aproximacin de tercer orden, con los polinomios de Legendre y la serie de Taylor, son
Legendre: sen z = gL ( z)

105 7 1
3
z + 3 + 5z3 3z

Taylor: sen z = gT ( z) z

3 z3
3!

Para x = p/2 z =1/2 y los valores de estas aproximaciones junto con el


valor exacto de la funcin seno en este punto redondeados a 6 decimales (se
omiten los smbolos en lo que sigue) son
gL(1/2) = 0,984196
gT(1/2) = 0,924832
gexacto(1/2) = sen (p/2) = 1
y puede comprobarse como, a igualdad de grado, la aproximacin de Legendre es mucho ms precisa que la obtenida con el polinomio de Taylor.

120

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Problema 2.2
a) El desarrollo de Fourier de esta funcin es formalmente idntico al del
Apndice II, Ejercicio A.II.-2 (b). El cambio de variable ahora es x = Lz/p y se
tiene entonces aqu
x
x
2 4
2 = f ( x) = 2

L
L
3

1
2

cos

n=1

n
x; 0 x 2L
L

b) Utilizando el conjunto completo de funciones sinusoidales

n ( x) = sen

n x
el desarrollo se expresa
2L
`

f ( x) =

bn sen

n =1

n x
n
= cn =
b sen cn x
=
2L
2 L n =1 n

en donde se ha introducido la definicin de constantes cn por brevedad en la


notacin. Haciendo igualmente A = 1/L2 y B = 2/L, se tiene que los coeficientes del desarrollo son
2L

bn =

( Ax

2L

+ Bx sen cn x dx
sen 2 cn x dx

1 2L
Ax2 + Bx sen cn x dx
L 0

El clculo de la integral lleva a


2L

2L

sen c x

2 x2
n
+
Ax + Bx sen cn x dx = A
2
x
+

cos
c
x

n
2
3
cn
0
cn cn
2

2L

sen c x x cos c x

1 16 L3
8 L3
n
n
n
n
=
1

1
(
)
+
(

1
)
+B

2
cn
n
L2 n3 3

cn
0
0
si n = par
16 L
2 4 L2

n
n

(1) = 3 3 1 (1) = 32 L

L n
n
3 3 si n = impar

El desarrollo es pues

121

CLCULO NUMRICO Y ESTADSTICA APLICADA

x
x
1
n x
32
sen
2 = f ( x) = 3
; 0 x 2L

3
L
L
2L
n =1,3 ,5,7,... n

Ambos desarrollos a) y b) son equivalentes en el lmite n , y las diferencias se aprecian si se truncan las series en algn orden n finito.
c) Haciendo x = L en el desarrollo b) se obtiene
32
32
1
1 1
1 = 3 1 3 + 3 3 + ... = 3

3 5 7

( 1) n

(2n + 1)

n= 0

y la suma de la serie es p 3/32.

Problema 2.3**
El desarrollo formal de la d de Dirac es
+1

( x) =

c P ( x); 1 x +1; c
n n

n= 0

1 ( x) Pn ( x) dx = 2n + 1 P (0)
1 ( Pn ( x))
+1

dx

lo que indica que slo sobreviven los coeficientes con n par, pues para n
impar Pn(0) = 0. Con esta restriccin la serie puede escribirse renumerando
los ndices como m = 0, 1, 2, 3, ..., n = 2m, y se tiene
`

( x) =

P ( x);

2m 2m

1 x +1

m= 0

Los valores que van tomando estos coeficientes dependen de los de los
polinomios en x = 0, pues se tiene la recurrencia (2.4.26)
Pn+1 (0) =
y se encuentran los resultados

122

n
P (0); n 1
n + 1 n 1

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

1 3 5
m = 3 P2 m = P6 (0 ) =
2 4 6
1 3 5 7
m = 4 P2 m = P8 (0 ) =
2 4 6 8

m = 0 P2 m = P0 (0) = 1
m = 1 P2 m = P2 (0) = 1 / 2
1 3
m = 2 P2 m = P4 (0) =
2 4

La frmula general para los grados pares, exceptuando el grado nulo, es

P2 m (0 ) = ( 1

m (2 m 1)!!
1.3.5.7....(2m 1)
= ( 1
; m 1
(2 m)!!
2.4.6.8....2 m

en donde se ha introducido la notacin doble factorial !!. Con ello los coeficientes del desarrollo en polinomios pares resultan
c0 =

1
2

c2 m = ( 1

4 m + 1 (2m 1)!!
; m 1
(2m)!!
2

Un punto muy delicado en este tipo de problemas, y en general en las


soluciones en serie a diversos problemas, es el de la validez del desarrollo en
los extremos del intervalo. Lo hecho anteriormente es vlido en 1 < x < +1 y
ahora habra que cerciorarse de que la serie numrica resultante en x = 1
tiene sentido para la funcin que se ha desarrollado, es decir si la serie tiene que tomar los mismos valores que la funcin en esos extremos. La
demostracin de estos hechos requiere recursos fuera del alcance de este
curso y no se presentar aqu

Problema 2.4
La tabla es
Tabla (a). Problema 2.4
r*N

0,1

0,2

0,3

0,4

0,5

z = PV/RT

1,354

1,786

2,404

3,283

4,565

123

CLCULO NUMRICO Y ESTADSTICA APLICADA

y se trata de realizar un ajuste con los polinomios de Gram-Tschebyscheff


llegando hasta orden 2 con los N + 1 = 5 puntos.
Los tres primeros polinomios de este tipo son
G0 , N ( k) = 1
2k
N
6 k 6 k( k 1)
G2, N ( k ) = 1
+
N N ( N 1)
G1, N ( k) = 1

en donde N = 4. La aproximacin a la tabla toma la forma


p(2)(k) = c0G0,N(k) + c1G1,N(k) + c2G2,N(k)
La funcin a minimizar S es en este caso
N

S=

{z

c0 G0 , N ( k ) c1G1, N ( k) c2G2 , N ( k)

k=0

y los coeficientes cj se calculan como


4

cj =

zk Gj ,4 ( k)

k=0
4

( Gj , 4 ( k ))

; j = 0,1, 2

k=0

Los resultados redondeados a cuatro decimales (se omiten los smbolos


en lo que sigue) son
c0 = 2,6784; c1 = 1,5838; c2 = 0,2801
y el error dado por la Smn alcanzada es 4,77 103. Una comparacin de los
resultados estimados, redondeados a tres decimales, con los tabulares est en
la tabla siguiente
Tabla (b). Problema 2.4

124

k
r*N

0,1

0,2

0,3

0,4

0,5

z = PV/RT tabular

1,354

1,786

2,404

3,283

4,565

z = PV/RT estim.

1,375

1,746

2,398

3,330

4,542

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Problema 2.5
El desarrollo de Taylor en torno a x0 = 0 para la funcin del problema es
y = f ( x) = sen x = x

x3 x5 x7
+

+ ...; ` < x < `


3 ! 5! 7 !

Esta funcin es continua y todas sus derivadas, de cualquier orden, son


finitas y continuas para cualquier valor real. El resto de Lagrange da el error
cometido al truncar la serie a un cierto orden n y utilizar un polinomio pT(n).
y pT( n) =

f ( n +1 ( )
x x0
( n + 1)!

n +1

xn +1 d n +1sen x
( n + 1)! dxn +1 x =

con x siendo un punto interior del intervalo abierto definido por x0 y el


valor concreto x que se est considerando.
Tanto la funcin seno como sus derivadas estn siempre acotadas en
valor absoluto como +1, y utilizando una tolerancia e se puede escribir la
acotacin siguiente
y pT( n)

xn +1
<
( n + 1)!

Teniendo en cuenta que 1 x +1 en las condiciones del problema, si se


quieren 9 cifras correctas, entonces e = 0,5 109 y el nmero de trminos
puede obtenerse de
xn+1
1
<
< 0, 5 10 9 n + 1 = 13
( n + 1)! ( n + 1)!
Como en el desarrollo no hay potencias pares, n = 12 no es posible, y el
orden hay que fijarlo justamente en n = 13.
Para el resto de las cuestiones se procede de manera similar utilizando:
e = 5 106 para 5 cifras correctas; e = 5 104 para 3 cifras correctas; y
e = 5 103 para 2 cifras correctas. Con ello se tienen los rdenes
5 cifras correctas n = 9
3 cifras correctas n = 7
2 cifras correctas n = 5

125

CLCULO NUMRICO Y ESTADSTICA APLICADA

En los casos n = 9,7 sucede la misma circunstancia que en el de 9 cifras


correctas, ya que no hay potencias pares hay que quedarse con el orden
por exceso. Hay que tener en cuenta, adems, que estos rdenes son estimaciones de seguridad que garantizan los resultados pedidos para cualquier x del intervalo sealado, y pueden resultar ms que suficientes para
clculos en algunos valores x de l. Ntese tambin que e se formula como
media unidad sobre la ltima cifra exigida.
Problema 2.6
Del Problema anterior sabemos que para (1 x +1) se pueden obtener
2 cifras correctas con un desarrollo de Taylor para el seno utilizando n = 5,
es decir con
sen x x

x3 x5
+
3! 5!

Los polinomios de Tschebyscheff que van a intervenir en la economizacin de este polinomio de Taylor van a ser los tres primeros impares
T1(x) = x; T3(x) = 4x3 3x; T5(x) = 16x5 20x3 + 5x;
y con ellos se pueden determinar las expresiones de las potencias de x
x = T1 ; x3 =

T3 + 3T1 5 T5 + 5T3 + 10T1


;x =
4
16

en donde para simplificar la notacin se han eliminado las dependencias de


x en los Ti.
El economizado del polinomio de Taylor se realiza sustituyendo estas
ltimas expresiones y despreciando la contribucin de orden ms alto
sen x x

1
1
x3 x5
+
= T1
T3 + 3T1 +
T + 5T3 + 10T1
3! 5!
24
5!16 5
7
1
1
1
+
T1
T3

8 12 16
24 24 16

T5
. Los resultados que se obtie5! 16
nen, redondeados a 6 decimales, para x = p/4 son los siguientes
en donde se ha despreciado el trmino

126

AJUSTE DE FUNCIONES CON POLINOMIOS ORTOGONALES

Tabla. Problema 2.6


n

sen(p/4) Tscheb.

sen(p/4) Taylor

0,691314

0,785398

0,707654

0,704653

0,707143

0,707143

El resultado exacto a 6 decimales es sen(p /4) = 0,707107 (se omite el


smbolo ) y es de notar la mucha mejor aproximacin que ya con n = 3 realiza la economizacin de Tschebyscheff. Evidentemente, los resultados con
n = 5 son idnticos en ambos casos. Por otra parte, y en conexin con el problema anterior, se comprueba que la estimacin n = 5 para dos cifras correctas es ms que suficiente en el caso x = p /4.

Problema 2.7
Las representaciones aproximadas pedidas son las siguientes
m = 2 f (u) =

m = 5 f ( u) =

1
2

1 + t 2tu

1
2

1 + t 2tu

P0 (u) + t P1 (u) + t 2 P2 (u)

P0 (u) + t P1 (u) + t 2 P2 (u) + t3 P3 (u) + t 4 P4 (u) + t5 P5 (u)

Haciendo t = 0,6 en estas expresiones se obtiene el grfico siguiente


(Fig. 2EP.1) en el que se aprecia la mejora sustancial que representa el desarrollo m = 5 con seis polinomios sobre el obtenido con slo tres polinomios m = 2. El ajuste en la escala del grfico es aparentemente muy bueno
con m = 5, pero la exactitud completa requerira del lmite m . Este problema slo pretende ilustrar cmo aadiendo ms y ms trminos en la
aproximacin con un nmero finito de trminos del desarrollo en serie de
una funcin utilizando funciones ortogonales el resultado se aproxima con
efectividad al exacto.

127

CLCULO NUMRICO Y ESTADSTICA APLICADA

Figura 2EP.1. Convergencia del desarrollo en serie de polinomios de Legendre para su funcin
generatriz tomada en t = 0,6. El ajuste con los seis primeros polinomios da unos resultados muy
buenos al compararlos con los exactos en la escala del grfico.

128

CAPTULO 3
APLICACIONES NUMRICAS BSICAS

3.1.
3.2.
3.3.
3.4.
3.5.

Los errores en el clculo numrico


Interpolacin y extrapolacin: cuestiones prcticas y estimacin del error
Propagacin de los errores en los datos de entrada
Diferenciacin numrica
Integracin numrica
Complementos: tablas para integracin Gaussiana

Bibliografa
Problemas tericos y numricos

Se aplican los conceptos vistos en los dos captulos anteriores a la realizacin


de las operaciones numricas bsicas con funciones definidas por tablas de
datos: interpolacin, extrapolacin, derivacin, e integracin. Se presta atencin al problema de la importancia de los posibles errores (de entrada, algoritmo
y redondeo) en la obtencin de resultados numricos, y se enfatiza el diferente
comportamiento de interpolacin y extrapolacin en este aspecto. La interpolacin es una operacin razonablemente segura, en tanto que la extrapolacin casi
siempre es una operacin muy poco recomendable. El estudio de la interpolacin
se amplia considerando polinomios de colocacin de diferencias centrales (Stirling, Everett). Se estudian diversas tcnicas numricas de derivacin (Newton, Stirling, Richardson) y de integracin, analizndose las formas de evaluar
el error que se comete con estas aproximaciones. En integracin se presentan
tcnicas tanto para tratar casos discretos como casos continuos de funciones
que o no pueden integrarse analticamente, o pudiendo serlo resultan muy complicadas. As se tratan las tcnicas de: trapecios, Simpson y Gauss-Legendre
para trabajar con intervalos finitos, y las de Gauss-Laguerre y Gauss-Hermite
para trabajar con intervalos infinitos. Tambin se discuten las ideas bsicas
para calcular numricamente integrales con singularidades y con factores
oscilantes en el integrando.

129

CLCULO NUMRICO Y ESTADSTICA APLICADA

Errores numricos

Absoluto y Relativo
Redondeo
Entrada
Algoritmo

Operaciones fundamentales
Interpolacin

Diferenciacin

Integracin

Pol. Newton
Pol. Everett
Pol. Stirling
Pol. Lagrange
+
(Extrapolacin, etc.)

Pol. Newton
Pol. Stirling
Ext. Richardson

Trapecios
Simpson
Gauss-Legendre
Gauss-Hermite
Gauss-Laguerre
+
Integrales singulares
Integrales oscilantes

Caps. 9, 10

3.1. Los errores en el clculo numrico


En el captulo anterior se ha tratado el problema de la aproximacin de
una funcin, bien analtica, bien dada mediante una tabla de datos discretos, y se han utilizado desarrollos en bases de funciones especiales y adecuadas a diversas circunstancias. En muchas aplicaciones prcticas tales
desarrollos estn truncados en un nmero finito de trminos, con lo que se
comete un inevitable error numrico en la representacin que se denomina
error de truncamiento, o ms generalmente de algoritmo. Este tipo de error
est ligado al criterio de convergencia numrica utilizado. Por otra parte, la
aproximacin a una funcin puede servir para evaluar derivadas, integrales,
u otras magnitudes ligadas a la funcin y es, por tanto, de la mayor importancia analizar cmo influyen los errores de truncamiento sobre todas
estas magnitudes.
Aparte de los errores derivados de una mala formulacin del problema o
de las operaciones a resolver y que, evidentemente, no se van a tratar aqu,
existen otras fuentes de error adicionales en el trabajo numrico. Las principales son los errores de redondeo y los errores con que los datos de entrada
pueden venir afectados conocidos como errores de entrada. Los errores de
redondeo, con los que ya se tomado contacto en los dos captulos preceden-

130

APLICACIONES NUMRICAS BSICAS

tes, surgen de la imposibilidad de calcular en la prctica con infinitos decimales: 1/3 es un nmero racional exacto, pero su representacin decimal
0,3333333.... al ser truncada a un nmero finito de dgitos ya no lo va a ser.
Los errores de entrada son aqullos con los que los datos de partida vienen
afectados como consecuencia de las mediciones experimentales involucradas
en su obtencin, o como consecuencia de otras posibles imprecisiones inherentes a tales datos. Un tratamiento completo del anlisis del error en el clculo numrico desborda los lmites de este curso y se centrar la atencin
slo en los aspectos ms elementales.

Errores absoluto y relativo


Dada una cantidad exacta Q y una aproximacin A a ella, se definen los
errores absoluto e 0 y relativo d 0 mediante los valores absolutos siguientes

= Q A ; =

(3.1.1)

Se suele utilizar normalmente e para dar el error, aunque se opta por el


uso de d cuando Q toma valores muy grandes. En la mayora de las aplicaciones el valor Q se desconoce, por lo que el objetivo ser siempre el de
dar cotas razonables para el error cometido en la estimacin de Q. Dependiendo de la magnitud del error absoluto e el error relativo d suele darse
en % (100 d), en tanto por mil (1000 d), e incluso cuando e es bastante
menor que la magnitud a la que afecta se utiliza d expresado en partes por
milln (ppm) : d (ppm) = 106 d.
El error absoluto e en general est relacionado con la precisin con la que
se conoce un dato, resultado, medicin, etc. As, Q puede venir dado a travs
de una serie de N medidas o clculos Ai de los que se toma el valor medio
Q (1/N)S Ai como estimacin de tal cantidad. La determinacin de e suele
i

hacerse con ayuda de la desviacin estndar de los Ai (Cap. 6). Cuanto menor
es este error, ms preciso es el resultado, en el sentido de que el valor que
acota (A e A e < Q < A + e) est mucho mejor definido al pertenecer a
un intervalo ms estrecho. Por otra parte, la situacin anterior de acotacin
para Q es ideal pues pudiera suceder, por problemas experimentales o de clculo, que los valores Ai estuvieran muy apartados del valor real que intentan
estimar. Esta situacin se califica de poca exactitud. De manera que puede

131

CLCULO NUMRICO Y ESTADSTICA APLICADA

haber resultados muy precisos, pero poco exactos u otras combinaciones de


ambas caractersticas. La situacin ideal combinara gran precisin y gran
exactitud, pero esto no es algo siempre posible. En cualquier caso, conviene
distinguir entre los conceptos sealados de precisin y exactitud, cuestiones
sobre las que se volver ms adelante (Cap. 8) al tratar con razonamientos
estadsticos.

El error de redondeo y conceptos asociados


El primer tipo de error numrico a considerar con ms detalle es el de
redondeo, y est asociado con los conceptos de cifras significativas y
cifras exactas en el resultado de una serie de clculos. En muchos lugares
ambos conceptos suelen identificarse, por simplicidad o porque no hay
necesidad de mantener la diferenciacin, y en otros incluso se utilizan con
sentidos intercambiados. As, en obras modernas dedicadas al clculo numrico se suele hablar nicamente de cifras significativas, con una tendencia
creciente a evitar el uso de este concepto al menos con el sentido tradicional
(la computacin accesible hoy tiene mucho que ver en esto). Por otra parte,
en obras de ciencia experimental se suelen mantener ambos trminos. Aqu
se va a seguir esta ltima posicin.
Las cifras significativas de un nmero definido son todas aquellas que
entran en su expresin, con la salvedad de que si se trata de la cifra 0 entonces slo se contabilizarn stas si se encuentran dentro del nmero o se
encuentran a la derecha. As, el nmero 0,056 tiene dos cifras significativas
(5 y 6), la constante de Boltzmann expresada como kB = 1,3807 1023 J/K tiene 5 cifras significativas (1, 3, 8, 0 y 7), la carga del electrn expresada
como e = 1,60 1019 C tiene 3 cifras significativas (1, 6 y 0), y la velocidad de
la luz expresada como c = 2,9979 1010 cm/s = 0,0029979 = 1013 cm/s tiene
5 cifras significativas (2, 9, 9, 7 y 9) en ambos casos.
La cuestin de la exactitud de un nmero es un asunto un poco ms
delicado, ya que en la mayora de los casos de inters el valor exacto de una
magnitud definida como combinacin de otras no va a poder conocerse
completamente; recurdese lo dicho antes sobre la representacin decimal
de fracciones o la presencia de errores en los datos del clculo. Aqu, desde el
punto de vista numrico, el concepto de cifras exactas est relacionado con
el de redondeo y hay que indicar que existen diversos criterios para definirlos.

132

APLICACIONES NUMRICAS BSICAS

Un ejemplo puede ayudar a aclarar este asunto. Sea el resultado final de un


clculo Q = 1,574563551 Redondeando correctamente a dos cifras decimales resulta Q(2) 1,57 o con la convencin habitual, que con mencin
expresa del redondeo se aplicar cuando convenga desde aqu en adelante,
Q(2) = 1,57. Si el redondeo lo es a tres decimales, se tiene Q(3) = 1,575. Si el
redondeo lo es a siete decimales, se tiene Q(7) = 1,5745636. En definitiva,
siguiendo el criterio de redondeo por exceso, un redondeo a n cifras decimales
se considera correcto cuando
Q Q ( n ) 0, 5 10 n

(3.1.2)

de manera que todo dgito de un nmero redondeado correctamente es


exacto. Existen otros criterios, como el de utilizar el redondeo por defecto
(Q(4) = 1,5745) o el de tomar el ltimo dgito retenido siempre par o siempre impar, u otros. En cualquier caso, una vez elegido un criterio, hay que
ser consistente con l hasta el final de los clculos a realizar para llegar al
resultado Q. Por otra parte, no hay que confundir el nmero de cifras decimales exactas con el nmero total de cifras exactas de un resultado, si bien la
distincin es trivial y no se descender ms en comentarla. Adems, el concepto de redondeo puede aplicarse a magnitudes como las constantes fsicas
mencionadas arriba, estando entonces implicado el denominado orden de
magnitud, as la velocidad de la luz puede redondearse a c 3 1010 cm/s =
300 000 Km/s: en el primer caso el orden de magnitud es 1010 (unidades cm/s
y en el segundo 105 (unidades Km/s). Todas estas operaciones son un asunto
de conveniencia para la aplicacin concreta que se est llevando a cabo y puede resultar suficiente utilizar una aproximacin que retenga menos cifras significativas, lo que pudiera estar relacionado con las unidades elegidas para
describir el problema. La convencin hoy es utilizar unidades del Sistema
Internacional (SI o MKS), pero muchas veces resulta muy til utilizar unidades adaptadas al problema, como el (= 1010 m) cuando se tratan cuestiones de distancias atmicas, el cm1 ( 1,986 1016 erg = 1,986 1023 J)
cuando se tratan energas vibracionales moleculares, etc.
Una observacin principal en todo este contexto es que, a medida que
aumenta el nmero de operaciones aritmticas a realizar, deben extremarse
las precauciones para evitar las acumulaciones de errores de redondeo parciales en las sucesivas operaciones. Estas acumulaciones pueden producir
resultados para Q muy alejados de su valor real. Casos tpicos y problemticos

133

CLCULO NUMRICO Y ESTADSTICA APLICADA

en las operaciones con nmeros aproximados son: a) cuando interviene la


resta de nmeros en la que stos son de valores muy prximos; o b) cuando se
efectan divisiones por nmeros muy pequeos. En ambos casos hay que
poner un especial cuidado. En consecuencia, una norma de seguridad necesaria indica que toda la secuencia de clculos debe realizarse siempre con el
mayor nmero de dgitos posible y, adems, que se debe proceder al redondeo cuando al final de todos los clculos se da la respuesta para Q. Esta
medida puede parecer muy extrema y, en realidad, salvo para clculos simples, slo se puede poner en prctica en clculos programados en un computador. No obstante, es una buena gua de procedimiento y un poco de sentido comn puede ayudar a reducir el volumen de esta tarea y a enfocarla
adecuadamente cuando las posibilidades de clculo son limitadas (manual o
con calculadoras de escritorio). Un sencillo anlisis de los errores relativos
lmites puede ayudar en esta tarea.
As, si los clculos son moderados y abordables con una calculadora de
mano o de escritorio, la propia naturaleza de Q y el contexto del problema
indicarn el nmero mnimo de dgitos a utilizar para no desvirtuar la respuesta final. ste es el caso de los problemas en los que Q debe obtenerse
con un error prefijado, de los que se han visto ejemplos en los problemas del
captulo anterior, o aqullos en los que estn involucrados datos que vienen
dados con una cierta precisin (generalmente caracterizada por el nmero
de decimales), para los que no tiene ningn sentido que la respuesta final
tenga ms cifras significativas que los datos de los que depende. Otro ejemplo ayudar a comprender todo este proceso y a visualizar la regla general a
aplicar en estos casos. Sea la operacin final entre dos nmeros aproximados
y bien redondeados 6,4 2,86 = 18,304. Este resultado anterior est comprendido entre los dos casos extremos siguientes: 6,35 2,855 = 18,12925 y
6,45 2,865 = 18,47925 y es fcil ver que nicamente las dos primeras cifras
van a ser significativas, con lo que la operacin como tal tendra slo dos
cifras significativas 18, si bien muchas veces al dar el resultado se mantiene
la primera no significativa 18,3 por completitud y suele escribirse a veces
como 18,3. Este ltimo tipo de notacin no va a utilizarse aqu. Como regla
general: el resultado no puede pues tener ms cifras significativas que las que
tenga el factor que interviene en su clculo con el menor nmero de ellas. El
mismo tipo general de consideracin puede emplearse para otras operaciones aritmticas, aunque ms adelante se ver cmo precisar esto en mayor
medida utilizando las cotas de error.

134

APLICACIONES NUMRICAS BSICAS

Si los clculos son ms largos y tediosos, lo adecuado es utilizar calculadoras programables o computadoras en las que se puede programar la
secuencia de los clculos, disminuyendo las posibilidades de cometer errores
de operacin y trabajando con todos los dgitos que ofrezcan esos medios de
clculo. En estos casos, cuando los clculos son extremadamente largos (miles
de millones de operaciones, por ejemplo), los aumentos en la precisin son
muy recomendables: para clculos con nmeros reales se tienen las denominadas precisin sencilla con 8 dgitos, precisin doble con 16 dgitos, precisin
cudruple con 32 dgitos, etc. Por otra parte, el programa (o cdigo) de clculo
debe ser comprobado para garantizar que est libre de errores (lgicos o de
procedimiento). A este respecto hay que decir que siempre puede saberse
que un programa es incorrecto, pero en las aplicaciones importantes casi
nunca puede afirmarse que el programa es completamente correcto! El ensayo de algoritmos diferentes, con programas de clculo y con compilaciones
diferentes para tratar el mismo problema, es usualmente una gran ayuda en
todo este asunto (la compilacin hace entendible el programa, escrito en un
determinado lenguaje matemtico como fortran, C, etc., por el sistema computacional). Aunque todos estos aspectos computacionales avanzados quedan
fuera de los objetivos de este texto, como puede deducirse de los comentarios
anteriores el clculo numrico es una disciplina compleja y muy verstil.

Errores de entrada y cifras significativas fisico-qumicas


Siguiendo con la magnitud evaluada en un clculo numrico Q y alcanzada, en su caso, la convergencia en el resultado, si su valor final est correctamente redondeado a n cifras exactas tal y como se ha discutido antes,
entonces todas las cifras que se muestran son significativas desde el punto de vista numrico formal. Sin embargo, desde el punto de vista fsicoqumico la cuestin de las cifras que tienen sentido en el resultado (cifras
significativas fisico-qumicas) requiere una respuesta ms matizada que viene dada por la naturaleza del problema estudiado como ya se ha sealado
antes. Dejando aparte los errores de truncamiento, de los que se tratar en
detalle en este captulo, lo anterior conduce la discusin a la consideracin
detallada de los errores de entrada en los datos.
Por ejemplo, si se est calculando el valor de una magnitud Q que depende de un conjunto de variables independientes {x1, x2, ..., xm} que toman

135

CLCULO NUMRICO Y ESTADSTICA APLICADA

determinados valores concretos afectados de errores (absolutos) de entrada


xi0 e i0, la estimacin del error que tendr el valor Q0 (x10, x20, xm0 ) viene dada,
normalmente, por el desarrollo de Taylor a primer orden en la forma
m

0
0 = (Q0 ) = Q( x1 , x2 , ..., xm ) Q0 ( x10 , x20 , ..., xm
)

i =1

Q 0
x i
i 0

(3.1.3)

en donde es de resaltar que las contribuciones al error procedentes de cada


variable se toman en valor absoluto (los errores se suman). Si algn valor
xi0 fuera exacto, entonces su error e i0 = 0. Ahora bien, si xi0 fuera una magnitud conocida, pero sujeta a un error de magnitud desconocida, entonces convencionalmente se toma como su e i0 media unidad sobre su ltima cifra
conocida. Por ejemplo, xi0 = 3,24 e i0 = +0,005 xi0 = 3,24 0,005. Es claro
que esta decisin pudiera desvirtuar el resultado del error final cometido en
la estimacin de Q, pero a falta de ms informacin es una manera muy
razonable de proceder. Por otra parte, en algunos casos pudiera ser necesario retener trminos de orden superior en (3.1.3) para dar estimaciones fiables del error.
En definitiva, el valor de e (Q0) es el que en circunstancias normales va a
decidir el nmero de cifras con sentido fsico-qumico que tendr Q0.
Esto va a depender fuertemente de la tcnica experimental o del mtodo terico empleados para estimarla, que son los que van a dar la magnitud del
error. Aunque no hay un acuerdo general estricto sobre estos asuntos (cifras
significativas versus cifras exactas, etc.), las diferencias de criterios para
decidir sobre ellos son ciertamente menores. Aqu se va a seguir un criterio
que intenta uniformar ambas. As, para el caso considerado arriba Q0 =
1,574563551, un error e (Q0) = 3 103 indica que la tercera cifra decimal es
dudosa:
Q0 + (Q0 ) = 1, 577563551...

Q0 (Q0 ) = 1, 571563551...

de manera que la respuesta final habitual es


Q0 (Q0 ) = 1, 575 3 103
en donde se ha redondeado por exceso a tres decimales, no teniendo ya
sentido dar muchas ms cifras (esto est considerado como una notable
falta de conocimiento en quien lo hace). En este caso el nmero de cifras
denominadas exactas numricamente por redondeo y significativas

136

APLICACIONES NUMRICAS BSICAS

para la aplicacin fisico-qumica es pues el mismo e igual a tres, Q0 = 1,57, lo


que es consistente con 3 103 > 5 104, es decir, e 0 es mayor que media
unidad sobre la ltima cifra escrita (5) para Q0. Tal cifra es ya no exacta y
puede considerarse como no significativa, pero es un asunto de eleccin
conservarla o no al escribir el resultado. Con relacin a esta ltima convencin el lector debe tener en cuenta la siguiente observacin.
Hay que indicar que en la literatura cientfica una notacin muy utilizada al dar el valor de una magnitud o constante es la de dar un nmero, del
que la primera cifra se escribe por delante de la coma decimal, multiplicado
por una potencia de 10, expresando el error con el aadido, al final de las
cifras escritas, de normalmente dos nmeros entre parntesis que denotan el
error absoluto (o la desviacin estndar) como la incertidumbre en las dos
ltimas cifras de la cantidad. Por ejemplo, el nmero de Avogadro suele
encontrarse dado como
N0 = 6, 0221367(36) 1023 N0 = 6, 0221367 10 23 0, 0000036 10 23
lo que seala la incertidumbre en las dos ltimas cifras 67 como 36. A efectos de clculo con N0 el valor a utilizar es el dado por todas las cifras escritas
tras la coma N0 = 6,0221367 1023.

Consideraciones adicionales
Los tres tipos de error bsicos en clculo numrico, truncamiento, entrada, y redondeo, estn fuertemente entremezclados y la tarea es siempre dar
estimaciones de ellos que permitan establecer mrgenes de fiabilidad para
los resultados finales. El anlisis de estos errores presenta adems aspectos
estadsticos y es un asunto ciertamente complejo. Por otra parte, con los
medios de computacin actuales, que permiten trabajar con un gran nmero de dgitos (incluso en calculadoras), los problemas de redondeo en
muchas aplicaciones prcticas no son determinantes. Hay, no obstante, que
mencionar algunas excepciones notables a esta expectativa tan favorable, ya
que en ellas los errores de redondeo son crticos pudiendo originar comportamientos anmalos o inestables (matrices de Hilbert, ecuaciones diferenciales inestables, clculo de races de polinomios de grado muy elevado,
etc.). Con ocasin del estudio de los errores experimentales y su tratamiento
que se ver ms adelante el tema general del error volver a ser considerado

137

CLCULO NUMRICO Y ESTADSTICA APLICADA

y completado desde una perspectiva estadstica (Caps. 6 y 8). Por el momento, y para las aplicaciones puramente numricas de esta primera parte, la
atencin va a centrarse en el tratamiento de los errores de entrada y de
algoritmo.
EJERCICIO 3.1.1
Obtener las expresiones operativas de los errores absolutos y relativos de
las cuatro operaciones aritmticas elementales: a) Q = q1 + q2; b) Q = q1 q2;
c) Q = q1q2; d) Q = q1/q2. Las magnitudes q1 y q1 se consideran independientes y
vienen afectadas de errores absolutos e1 y e2 (>0) respectivamente.
Utilizando (3.1.3) con dos variables para proceder con las derivaciones
parciales es inmediato establecer
a) Q = q1 + q2 (Q ) = 1 + 2 > 0 ; (Q ) =

(Q ) 1 + 2
=
>0
Q
q1 + q2

b) Q = q1 q2 (Q ) = 1 + 2 > 0 ; (Q ) =

(Q ) 1 + 2
>0
=
Q
q1 q2

c) Q = q1q2 ( Q) = q2 1 + q1 2 > 0 ; (Q) =

d) Q = q1 q2 (Q ) =

1
q2

q1 2
q2

> 0 ; (Q ) =

( Q) q2 1 + q1 2
= 1 + 2 > 0
=
q1q2
Q

( Q)
=
Q

q
1
+ 1 22
q2
q2
q1 q2

= 1 + 2 > 0

en donde los errores relativos correspondientes se definen positivos como en


(3.1.1): di = ei /qi. Es interesante observar que: i) los errores procedentes de
variables independientes siempre se suman; ii) la forma de d (Q) en b) indica
claramente los problemas esperados cuando se restan dos nmeros aproximados muy cercanos en valor; iii) la forma de d (Q) en d), que indica la
amplificacin de errores en la divisin por un nmero q2 muy pequeo.
Estas expresiones se generalizan sin dificultad a un nmero arbitrario de trminos o factores.

138

APLICACIONES NUMRICAS BSICAS

EJERCICIO 3.1.2
Estimar los errores absoluto y relativo de la cantidad Q = ln N! N ln N N
(aproximacin simple de Stirling) en donde N es el nmero de partculas de un
sistema macroscpico, para el caso en el que N sea el nmero de Avogadro
N0 = 6,0221367(36) 1023.
Utilizando (3.1.3) para una sola variable se tiene
d
dQ

( Q0 )
( N0 ) =
( N ln N N )
( N0 ) = ln N0 ( N0 )

dN
N =N
dN N = N
0

y sustituyendo valores
Q0 323, 7193517 1023

(Q0 ) 1, 9711764 1019


( Q0 )
6 107
0 =
Q0
Se tiene por tanto para Q0 el resultado
Q0 3, 2371935(20 ) 10 25 ; ( Q0 ) 0, 0000020 1025 ; 0 6 10 7 = 0, 6 ppm
Ntese que la variable nmero de partculas N vara de uno en uno y no
continuamente, pudindose cuestionar la validez de las operaciones realizadas. Sin embargo, el rango de valores de N en estas aplicaciones es tan
grande que para muchos efectos prcticos N se comporta como una variable
continua, como revela el hecho de que DN/N0 = 1/N0 ~ 1024. De ah que se
haya utilizado la regla normal de derivacin en la aplicacin anterior. El lector puede comprobar cmo definiendo el salto de la funcin Q de N a N + 1
y operando con incrementos la diferencia con el resultado anterior es despreciable para grandes valores de N y no altera la conclusin alcanzada.
3.2. Interpolacin y extrapolacin
Una vez calculada la aproximacin p(x) a una funcin y = f(x) dada en
forma de tabla con N + 1 datos {xk, yk}k=0,N, ordenada con argumentos xk
crecientes, hay dos tipos de operaciones que pueden realizarse de forma
inmediata: la interpolacin, que es la estimacin del valor de la funcin en

139

CLCULO NUMRICO Y ESTADSTICA APLICADA

puntos no tabulares determinados xi y dentro del intervalo de definicin


x0 < xi < xN, y la extrapolacin, que es la prediccin de valores de la funcin
para puntos xe fuera de los lmites de tal intervalo. Una interpolacin extensiva para la funcin, utilizando un espaciado mucho ms fino que el de la
tabla original, para determinar muchos puntos interiores al intervalo de
definicin, es un caso especial que se suele denominar subtabulacin, pero es
claro que no requiere una consideracin aparte. En todos estos casos la
sustitucin de xi o de xe en la aproximacin dar la estimacin buscada, p(xi)
o p(xe). En lo que sigue se considerar siempre que la interpolacin tiene sentido, no ya desde un punto de vista matemtico, sino por encima de todo
desde un punto de vista fsico-qumico.
Una cuestin principal es la del error cometido en estas estimaciones.
Supuesto que la funcin original f(x) toma valores razonables en x0 < x < xN
es decir se comporta de manera continua y suave (sin divergencias, ni saltos,
ni variaciones excesivamente bruscas), los errores de interpolacin puede
esperarse que permanezcan controlados. No sucede lo mismo con la extrapolacin, que es una operacin siempre afectada de gran incertidumbre, salvo en el caso en el que haya coincidencia p(x) f(x), una circunstancia que
debe venir garantizada por argumentos fisico-qumicos y por tanto ajenos al
clculo numrico como tal. En general, la extrapolacin es una operacin
muy poco recomendable, salvo en el caso sealado antes, y su utilidad queda restringida como mucho a indicar tendencias de la funcin original en las
regiones exteriores muy prximas a los extremos del intervalo de ajuste x0 y
xN. Su error no puede pues evaluarse con certeza (Fig 3T.1).

Figura 3T.1. Conceptos de interpolacin directa e inversa y de extrapolacin. La extrapolacin es una


operacin que carece de sentido en la mayor parte de los casos.

140

APLICACIONES NUMRICAS BSICAS

Observaciones prcticas en interpolacin


i) Eleccin de grado
Si la funcin tabular a interpolar {xk, yk}k=0,N, est igualmente espaciada,
h = xk+1 xk = cte > 0, y se elige un polinomio de colocacin para representarla, suele ser conveniente utilizar nicamente los datos prximos al valor a
interpolar xi en lugar de emplear la tabla completa. Esto, como ya se seal
en el Cap. 1, es representar la funcin mediante segmentos de curva. As,
aproximaciones lineales (dos datos), cuadrticas (tres datos) o cbicas (cuatro datos), que ahorquillen el valor xi pueden dar ya muy buenas estimaciones yi al valor buscado, siendo tanto mejores cuanto ms pequeo sea el
espaciado h con el que viene definida la tabla de entrada. Espaciados h muy
pequeos en los datos de entrada permiten realizar interpolaciones lineales
suficientemente precisas para muchas aplicaciones. Por otra parte, para
valores xi alejados de los extremos de la tabla x0 y xN puede mejorarse la precisin en la estimacin aumentando el grado de la aproximacin. Para estimaciones cercanas a tales extremos ya se ha comentado que este aumento de
grado no es adecuado (oscilaciones de los polinomios) y lo razonable aqu es
mantener el grado razonablemente bajo. En este sentido, observar cmo
vara el resultado yi al ir aumentando el grado n del polinomio puede ser una
gran ayuda, pues se espera que las correcciones sucesivas que experimenta yi
con n deban ir decreciendo, pero si esto no es as, entonces todo indicar que
los clculos y las hiptesis hechas presentan algn problema que no ha sido
considerado. Todas estas ideas hay que tomarlas como guas tiles a la hora
de realizar interpolaciones, pero siempre puede existir algn caso en el que
no sean suficientes y es tarea del analista numrico identificarlo para encontrar la mejor estrategia de interpolacin. Aqu es interesante sealar que las
aproximaciones de interpolacin conseguidas con grados cada vez mayores
en el polinomio de colocacin, en tablas de determinadas funciones analticas
con nmero de puntos tendiendo a infinito, presentan lo que se denomina una
convergencia asinttica, en la que se observa inicialmente como las diferencias de orden creciente van disminuyendo siguiendo una aparente convergencia, para a partir de un cierto orden mostrarse divergentes.
ii) Seleccin de puntos de la tabla y tipo de polinomio
Una vez elegido el grado n del polinomio a utilizar se seleccionan los
puntos de la tabla con los que se va a calcular de manera que xi ocupe un

141

CLCULO NUMRICO Y ESTADSTICA APLICADA

lugar aproximadamente central. Por ejemplo, si se deseara utilizar un


polinomio de avance de Newton de grado n = 3 la situacin puede esquematizarse as
... < xm1 < xm < xi < xm+1 < xm+ 2 ... ... < x% 0 < x%1 < xi < x%2 < x% 3 ...

(3.2.1)

en donde se han tomado dos argumentos a la izquierda y dos a la derecha


del de interpolacin y se han renumerado por comodidad. Utilizando el
polinomio de avance de grado 3 en trminos de la variable auxiliar k% referida
a x%0 se llega a la expresin de interpolacin
1
1
p( 3 ) ( ki ) = y0 + k%i y0 + k%i ( k%i 1) 2 y0 + k%i ( k%i 1)( k%i 2) 3 y0 ;
3!
2!
x x%0
k%i = i
>0
h

(3.2.2)

El proceso es fcilmente generalizable a grados ms elevados utilizando


ms argumentos, o al caso de un polinomio de retroceso sin ms que tener
en cuenta que x%0 sera entonces el valor ms alto de entre las x seleccionadas
y que k%i < 0.
El ejemplo anterior es ilustrativo de la manera de proceder y resulta
muy adecuado para interpolar en argumentos situados cerca de los extremos
de la tabla x0 xN. En estos casos, x0 < xi < x1 x1 < xi < x0 lo habitual es utilizar polinomios de Newton y tomar los tres puntos con argumentos x0, x1 y
x2 ( x0, x1 y x2), y como recomendacin general no ms de cuatro puntos.
Sin embargo, cuando el argumento implicado est situado lejos de los extremos, aunque el proceso descrito es formalmente correcto manteniendo diferencias de orden elevado, resulta mucho ms conveniente utilizar polinomios
de colocacin de diferencias centrales utilizando as menos diferencias y
logrando precisiones adecuadas. Ya se ha considerado someramente esta
cuestin en el Cap. 1 y ahora van a darse algunos detalles prcticos conectados con la interpolacin.
Los polinomios de colocacin basados en diferencias centrales (Stirling,
Gauss, Everett, etc.) sitan el origen de la tabla k% = 0 en uno de los argumentos xm originales de la tabla contiguo al punto de interpolacin xi y
asignan ndices k% positivos hacia argumentos crecientes y negativos hacia los
decrecientes. As en el caso del origen tomado en el argumento inmediatamente inferior al de interpolacin (3.2.1) se reformula como

142

APLICACIONES NUMRICAS BSICAS

... < xm 2 < xm1 < xm < xi < xm+1 < xm +2 ... ...
... < x% 2 < x% 1 < x% 0 < xi < x%1 < x% 2 ...; x% 0 = xm

(3.2.3)

y anlogamente para el caso del argumento inmediatamente superior. Por


razones de espacio y por las de utilizaciones posteriores van a tratarse nicamente los casos de los polinomios de Stirling (grado par) y de Everett (grado impar).
En el caso de polinomio de Stirling la colocacin se realiza sobre un
intervalo de la tabla original simtrico en torno al origen seleccionado. Para
una eleccin como (3.2.3) esto es
x% n/ 2 < ... < x% 2 < x% 1 < x% 0 < xi < x%1 < x%2 < ... < x% n/2 ; x% 0 = xm

(3.2.4 )

lo que indica que el polinomio es de grado par n (= 2j) y son necesarios n + 1


puntos, un nmero impar (2j + 1) datos de la tabla de entrada. La formulacin compacta de este polinomio se realiza utilizando operadores de diferencia central que no van a considerarse aqu, pero pueden escribirse expresiones equivalentes utilizando el ya conocido operador de diferencia de
avance D. Para orden n = 4 (2 k% 2) el polinomio de Stirling se escribe
como
( y0 + y1 ) % 2 y1 % 2
(4 )
pStirling
( k% ) = y0 +
k+
k +
2
2
( 3 y1 + 3 y2 ) ( k% + 1) k%( k% 1) 4 y2 k% 2 ( k% 2 1)
+
3!
2
3!
4

(3.2.5)

y la interpolacin en xi se realiza sustituyendo k% por k%i = (xi x%0)/h. En el caso


del polinomio de Everett la colocacin se realiza sobre un intervalo de la
tabla original asimtrico en torno al origen seleccionado. De nuevo, para una
eleccin como (3.2.3) esto es
x% j < ... < x% 2 < x% 1 < x% 0 < xi < x%1 < x%2 < ... < x% j < x% j+1 ; x% 0 = xm

(3.2.6 )

lo que indica que el polinomio es de grado impar n (= 2j + 1), y son necesarios n + 1 puntos, un nmero par (2j + 2), de la tabla de entrada. La formulacin compacta de este polinomio tambin se realiza utilizando operadores
de diferencia central, pero pueden escribirse expresiones equivalentes utili-

143

CLCULO NUMRICO Y ESTADSTICA APLICADA

zando D. Para orden 2j + 1 = 5 el polinomio de Everett (2 k% 3) incluye


solamente diferencias de orden par y se escribe como
% %2
% %
%
( 5)
% ( k% 1) y + k( k 1) 2 y k( k 1)( k 2) 2 y +
pEverett
( k% ) = ky
1
0
0
1
3!
3!
k% ( k% 2 1)( k% 2)( k% 3) 4
k% ( k% 2 1)( k% 2 4) 4
y1
y2
5!
5!

(3.2.7)

Al igual que antes la interpolacin en xi se realiza sustituyendo k% por


k%i = (xi x%0)/h. Las dos expresiones anteriores pueden utilizarse para definir
los polinomios de grado inferior, pero prestando atencin al nmero de
puntos de la tabla necesarios para construirlos. Estos tipos de polinomios
centrales describen en principio de mejor manera el hbito o comportamiento de las funciones alrededor del punto de inters xi, y tambin permiten obtener la misma precisin en una interpolacin utilizando menos trminos que los que deberan usarse con los polinomios de Newton (se
recuerda la necesidad de situar el origen de forma contigua a xi),
iii) Tabla desigualmente espaciada
Cuando la interpolacin debe hacerse con una tabla {xk, yk}k=0,N no igualmente espaciada, xk+1 xk cte, una herramienta de colocacin a utilizar es la
del polinomio de Lagrange. La estrategia es similar a la anterior en cuanto a
la eleccin de grado de polinomio y regin de la tabla a emplear, pero se pierde la facilidad de poder mejorar el resultado previo aadiendo un grado ms
simplemente con la suma del trmino de diferencia D siguiente, no tenindose
as la rapidez de verificacin de la convergencia observando las aproximaciones sucesivas. En el caso del polinomio de Lagrange una vez construido el
polinomio, con grado n y por tanto con n + 1 puntos, la interpolacin en xi se
realiza por sustitucin de este valor en la expresin y se tiene
n ( x x% )
i
j

y
( xi ) =
% m x% j ) m
(
x

m= 0 j m

( n)

(3.2.8)

y es fcil ver que una ampliacin del grado implica recalcular de nuevo los
factores que acompaan a las ym. Un algoritmo alternativo al de Lagrange
que permite observar la convergencia con adiciones de puntos sucesivos es el
de Aitken (interpolacin iterada), pero no se va a tratar aqu.

144

APLICACIONES NUMRICAS BSICAS

EJERCICIO 3.2.1
Expresar la ecuacin (3.2.8) para un ajuste lineal, n = 1 y para un ajuste
cuadrtico n = 2.
n = 1 p(1) ( xi ) =
n = 2 p(2 ) ( xi ) =

( xi x%1 )
( x x%0 )
y0 + i
y
( x%0 x%1 )
( x%1 x%0 ) 1

( xi x%1 )( xi x%2 )
( x x%0 )( xi x%2 )
y0 + i
y +
( x% 0 x%1 )( x% 0 x% 2 )
( x%1 x%0 )( x%1 x%2 ) 1
( xi x% 0 )( xi x%1 )
y
( x% 2 x% 0 )( x%2 x%1 ) 2

(3.2.9 )

(3.2.10 )

Notas complementarias
Conviene insistir en que el polinomio de colocacin a una serie de datos
es nico. Por tanto, si ante un problema de interpolacin en una tabla extensa igualmente espaciada se fija la atencin slo en una regin concreta
km k kn, para con todos sus datos (agotando todas las diferencias accesibles) utilizar en ella un polinomio de diferencias centrales, sus resultados
seran los mismos que los de la utilizacin de un polinomio de Newton para
interpolar en ese mismo intervalo situando su origen k = 0 en km. Por otra
parte, los polinomios de diferencias centrales son ms tiles que los de
Newton en aplicaciones como la diferenciacin numrica y otras y tal vez sea
esta la principal razn para su estudio. Hay pues equivalencia algebraica
entre ambas opciones. Ms adelante al considerar el problema del error de
interpolacin se considerarn algunos detalles ms sobre este asunto.
Para tablas igualmente espaciadas el polinomio de Lagrange coincide con
cualquier otra versin de colocacin sobre el intervalo elegido (de nuevo: el polinomio que ajusta una serie completa de datos es nico). Por otra parte, el polinomio de Lagrange puede utilizarse para utilizar interpolaciones inversas, es
decir, conocido el valor de la funcin yi en un punto no tabular determinar el
valor del argumento xi que le corresponde. Esto se realiza sencillamente intercambiando los papeles de x e y en (3.2.8) as como en el proceso descrito antes
(Fig. 3T.1).
Si el ajuste a la tabla no es de colocacin sino de mnimos cuadrados en
cualquiera de sus versiones (base polinmica convencional, base ortogo-

145

CLCULO NUMRICO Y ESTADSTICA APLICADA

nal, etc.), el proceso de interpolacin suavizada sigue las pautas anteriores


sustituyendo el valor del argumento a interpolar en la expresin obtenida
para el ajuste.
El error de interpolacin
En el polinomio de colocacin el error de algoritmo viene dado en valor
absoluto por la expresin ya conocida
y( x) p( n) ( x) =

( x x0 )( x x1 )...( x xn ) ( n+1
y ( )
( n + 1)!

(3.2.11)

en donde x0 < x < xn, x xi (i = 0, 1, 2, ,,,. n). y(x) se considera que es continua
y con sus n primeras derivadas tambin continuas, y el punto x est dentro
del intervalo de definicin x0 x xn. Esta frmula se obtiene por aplicacin
reiterada del teorema de Rolle y permanece vlida para puntos x fuera de este
intervalo de definicin, indicando un comportamiento desmesurado para el
error de extrapolacin. El valor de x es desconocido en general y la determinacin precisa de los errores de interpolacin no es posible en la mayor parte de los casos. De hecho, desde un punto de vista prctico, al emplear tablas
de diferencias por ejemplo, se procede aadiendo sucesivamente trminos
con diferencias sucesivas hasta observar cmo el resultado se estabiliza a la
precisin que se exija en el clculo. No obstante, la frmula anterior es muy
til para producir acotaciones de valor en muchos problemas, pues puede permitir utilizar las propiedades del producto de monomios (x xi) para controlar el error. Como el espaciado h viene ya dado normalmente, este producto
es muchas veces el nico elemento de control disponible y uno de sus usos se
ilustra en el siguiente Ejercicio para una tabla igualmente espaciada.
EJERCICIO 3.2.2
Acotar el error de interpolacin lineal de un polinomio de Newton para el
que se han utilizado dos puntos de una tabla con argumentos x0 y x1.
Siguiendo la ecuacin (3.2.11) el error absoluto de este ajuste lineal es
y( x) p(1) ( x) =

146

( x x0 )( x x1 ) ( 2
k( k 1) 2 ( 2
y ( ) =
h y ( )
2!
2!

APLICACIONES NUMRICAS BSICAS

Esta expresin puede acotarse notando que el polinomio k(k 1) toma,


en 0 k 1, en valor absoluto su mximo en k = 1/2 (el mnimo) que es
kmn(kmn 1) = 1/4. Con ello el error de interpolacin est acotado como
y( x) p(1) ( x) =

k( k 1) 2 (2
h2 (2
h y ( )
y ( ) ; 0 k 1; x0 x x1
2!
8

(3.2.12)

Si la funcin y(x) es conocida a priori, como sera el caso de la tabulacin


de una funcin complicada de manejar y que debe utilizarse muchas veces,
la acotacin de la derivada segunda y(2(x) es en principio siempre posible y,
por tanto, el error de algoritmo quedar bien caracterizado. Si la funcin no
es conocida, entonces esto no es posible y las estimaciones que pueden
hacerse de la acotacin de y(2(x) y por tanto del error sern siempre dudosas.
Hay que resaltar algunos detalles en este asunto del error de interpolacin
con colocacin de datos. El primero es notar que el error en los puntos tabulares es nulo, obviamente. El segundo es que, una vez fijado el nivel de aproximacin (el grado n), el error de truncamiento disminuye si se puede hacer disminuir el espaciado h de la tabla. El tercero es que dependiendo del polinomio
de colocacin equiespaciado elegido la expresin del error (3.2.11), aunque
bsicamente la misma (se trata de una traslacin del origen), conviene transformarla. Por ejemplo, para un polinomio de Everett de grado n = 2j + 1 = 3, el
error viene dado por la expresin (comprese con (3.2.7)) y acotacin siguientes
k% ( k% 2 1)( k% 2) 4 ( 4
(3 )
y( x) pEverett
( k% ) =
h y ( ); 1 k% 2; x1 x x2 (3.2.13a )
4!
3 4 (4
(3 )
y( x) pEverett
( k% )
h y ( ); 0 < k% < 1; x0 x x1
128

(3.2.13b )

como puede comprobarse fcilmente repitiendo el anlisis del Ejercicio 3.2.2


en este caso. La acotacin restringida (3.2.13b) ya apunta la utilidad de este
polinomio de diferencia central en interpolacin.
Por ltimo, si se ha utilizado un algoritmo de mnimos cuadrados para
generar una aproximacin que permita interpolar con suavidad en una
tabla, ya se han discutido en el captulo anterior las medidas de error globales, Smn y RMS, que dan idea de la bondad del ajuste y siempre pueden
estimarse los errores cometidos individualmente en cada punto, aunque
esto suele ser de menor valor.

147

CLCULO NUMRICO Y ESTADSTICA APLICADA

EJERCICIO 3.2.3
Comparar grficamente el comportamiento del producto de monomios en
(3.2.11) expresado en la variable auxiliar k si se utiliza un polinomio de Newton de grado 7 con origen en k = 0 y un polinomio de Stirling de grado 4 con
origen centrado en k = 5(k% = 0).
El polinomio de colocacin de Newton va a utilizar 8 datos de la tabla
correspondiente 0 k 7, en tanto que el de Stirling va a utilizar slo 5 datos
En sus errores de ajuste respectivos la magnitud a analizar con vistas al comportamiento del error pedido en (3.2.11) es el polinomio o en definitiva la
forma asociada en la correspondiente variable 2 k% 2(3 k 7). En cada
caso esta funcin toma las formas siguientes
Newton ( n = 7) : k( k 1)( k 2)( k 3)( k 4)( k 5)( k 6))( k 7)
Stirling ( n = 4 ) : ( k% 2)( k% 1) k% ( k% + 1)( k% + 2)
Las representaciones grficas de estas funciones se muestran en las Figs
3T.2a y 3T.2b. En la Fig 3T.2a se comprueba cmo el comportamiento de
Stirling en las cercanas del punto de inters k% = 0(k = 5) es despreciable comparado con el de Newton, el cual oscila fuertemente en los extremos del
intervalo 0 k 7. En la Fig 3T.2b puede verse en una escala apropiada la
magnitud del error de Stirling, un polinomio cuyo uso est recomendado

Figura 3T.2a. Comparacin de las contribuciones del factor polinmico al error de interpolacin
(3.2.11), en las cercanas de k = 5, utilizando: un polinomio de Newton de sptimo grado con origen
en k = 0, y un polinomio de Stirling de cuarto grado con origen en k = 5.

148

APLICACIONES NUMRICAS BSICAS

Figura 3T.2b. Detalle del error del polinomio de Stirling de Fig. 3T.2a.

para el rango de valores 0,25 k% 0,25. Incidentalmente, obsrvese como


tambin el polinomio de Stirling oscila fuertemente en los extremos de su
intervalo de colocacin, en comparacin con su hbito en el resto de tal
intervalo. Todo ello pone de manifiesto la importancia de poder manipular el
polinomio que aparece en la expresin del error de interpolacin y, tambin,
el tremendo peligro asociado con las extrapolaciones en las que la continuacin del polinomio fuera del intervalo indica cmo el error se dispara
grandemente. Hay que sealar que un anlisis completo de estas situaciones
requerira del estudio anterior combinado con los comportamientos de hn e
y(n(x) aunque lo ltimo no va a resultar siempre posible por el desconocimiento de la verdadera y(x).

3.3. Propagacin de los errores en los datos de entrada


Hasta aqu se ha considerado que los datos tabulares {xk, yk}k=0,N estaban
libres de error en los valores de la funcin yk. Va a tratarse ahora con el caso
en el que la tabla venga dada con tales errores de entrada {xk, yk ek}k=0,N y en
donde los argumentos xk estn libres de error. El asunto es de nuevo complicado y hay que distinguir al menos dos circunstancias importantes. Primero,
la propagacin de errores casuales en una tabla, su identificacin y correccin, y segundo la evaluacin global del efecto de los ek, ahora inherentes a los
datos, sobre un resultado obtenido a partir de la tabla.

149

CLCULO NUMRICO Y ESTADSTICA APLICADA

Alternancias de signo en una tabla de diferencias


El primer caso lo originan generalmente los tpicos errores de transcripcin o copiado de datos, o los redondeos excesivos y poco cuidadosos. As,
una tabla que de haber estado construida con datos correctos mostrara un
comportamiento razonable (por ejemplo, diferencias constantes a partir de
un cierto orden n que indicaran una funcin polinmica), al contener alguno de estos errores fortuitos muestra un comportamiento errtico, con alternancias de signo que llevan a una mala definicin de la aproximacin p(n)(x).
El caso de un nico dato errneo ilustra muy bien esta situacin como se
muestra en la Tabla 3.1, en donde slo se representan los errores con y4
como el dato errneo afectado del error +e. Se observa como la propagacin
del error se produce siguiendo un esquema de coeficientes binmicos y con
Tabla 3.1. Propagacin de un error en una tabla de diferencias
k

yk

Dyk

D2yk

D3yk

D4yk

0
1

0
0

+e

0
3

+e

0
+e

+e

2e

+e

150

+e

0
0
0
0

4e
e

0
7

+6e
+3e

0
6

4e
3e

e
5

+e

APLICACIONES NUMRICAS BSICAS

alternancias de signo. Cuando en una tabla de diferencias se observan patrones de alternancias de signo en las columnas Dnyk puede sospecharse que
sean debidas a un problema (o problemas) de error en la entrada de datos.
Hay que advertir, no obstante, que:
i) No todas las alternancias de signo que aparecen en una tabla deben
estn necesariamente ligadas a errores de entrada, ya que pueden ser genuinas de la funcin en s (funciones oscilantes).
ii) Los esquemas de alternancia pueden ser muy complicados y no
tan claros como en el ejemplo mostrado, como es el caso de varios datos
errneos.
A la hora de abordar uno de estos problemas hay mucho espacio para la
creatividad en la bsqueda de soluciones. Debe pues identificarse correctamente la situacin, ensayando diversas posibilidades y asegurndose de que
el problema de la existencia de datos errneos es real. Esta tarea brinda de
nuevo muchas opciones que pueden explotarse, como por ejemplo: a) estudiar por separado el comportamiento de los datos pares y de los datos impares, buscando regularidades en ellos; y b) comparar el esquema de signos
obtenido con los mapas de comportamiento hipotticos si hubiese uno, dos,
tres o ms errores en la tabla. Una vez identificados los datos errneos hay
que dar marcha a tras en los clculos y regenerar los datos correctos que den
sentido a la tabla. En funciones polinmicas, con grado conocido y suficientes datos de entrada, el proceso descrito lleva prcticamente siempre a
solucionar estos problemas. No obstante en otros tipos de funcin, que suele ser desconocida, no puede garantizarse con certeza el resultado de estas
operaciones y el anlisis requiere esfuerzos desde varios frentes diferentes
(revisin cuidadosa, ensayos de significacin, etc.).

Errores de entrada
En cuanto al segundo caso, la evaluacin global del efecto de errores
inherentes a los datos de entrada, normalmente procedentes de mediciones
experimentales, la cuestin es ms directa y puede tratarse siguiendo la
lnea del desarrollo de Taylor ya mencionada. Para un ajuste polinmico
conviene reescribir p(n)(x)en la forma de Lagrange (3.2.8), que es la que uti-

151

CLCULO NUMRICO Y ESTADSTICA APLICADA

liza directamente los valores yk y que puede visualizarse como una suma
ponderada de estos valores
n
n ( x x% )
i
j

y =
d y ; x%0 x x% n
( xi ) =
( x% m x% j ) m m= 0 m m

m =0 j m

( n)

(3.3.1)

Los coeficientes dm estn libres de error y a efectos de evaluar el error


cometido en la estimacin la diferencia entre el valor real P y p(n)(x) se estima, en general, mediante el primer trmino del desarrollo de Taylor (el nico en este caso) tomando en valor absoluto cada una de las contribuciones,
y se encuentra
n

P p( n) ( xi ; y0 , y1 ,..., yn )

m=0

(d y ) m =
dm m
ym m m
m= 0

(3.3.2)

La cota de error as obtenida es ciertamente conservadora, pero permite


proceder con seguridad, aplicando de nuevo la conocida regla bsica de
que el error de la suma algebraica est dado por la suma de los valores
absolutos de los errores de cada sumando. Todava puede darse una cota
superior al error previo si se conoce que todos los em son tales que estn acotados superiormente em e y se determina un valor D que acote la suma de
todos los pesos dm, S dm D, obteniendo
P p( n) ( xi ; y0 , y1 ,..., yn ) D

(3.3.3)

En determinados clculos concretos los errores em podran cancelarse


parcialmente unos con otros, en cuyo caso las cotas de error anteriores
seran excesivamente conservadoras, o por el contrario, los errores em podran reforzarse mutuamente unos con otros y las cotas de error obtenidas seran ms prximas a lo que sucede en realidad. En cualquier caso, en estos
asuntos siempre conviene ir sobre seguro y, si no se sabe con certeza lo que
est pasando, la postura conservadora es siempre preferible.

3.4. Diferenciacin Numrica


El clculo del valor numrico de las derivadas de una funcin y(x) con
expresin analtica conocida no plantea, en principio, grandes problemas. La

152

APLICACIONES NUMRICAS BSICAS

particularizacin del valor xi en el que se desea calcular tal valor dentro de la


derivada buscada, y(xi), yn(xi), etc., dar este resultado. En algn caso pudieran aparecer dificultades en las cercanas de puntos singulares, pero estos
puntos de divergencia se pueden conocer a la vista de las ecuaciones de las
derivadas y siempre se pueden tomar medidas para tratar esta informacin
(las singularidades puede ser del tipo evitable, los errores de redondeo pueden minimizarse, etc.).
Sin embargo, el clculo de las derivadas numricas de una funcin dada
por una tabla {xk, yk}k=0,N es un asunto que presenta bastantes incertidumbres.
Quiz sea este uno de los problemas ms crticos del clculo numrico y no es
difcil entender las causas. La cuestin est en la necesidad de aproximar la
funcin tabular mediante una expresin analtica prefijada (un polinomio, una
expresin trigonomtrica, etc,) y, aunque el error de este ajuste puede ser
hecho muy pequeo, no sucede lo mismo en general con el error entre las derivadas correspondientes, que son las pendientes de las funciones que se derivan. As, por ejemplo, se puede aproximar y(x) = exp(x) mediante
p(x) = 1 + x dentro de un cierto intervalo muy pequeo a < x < a en torno a x
= 0, pero esa proximidad y(x) p(x) se destruye al considerar las derivadas
pues y(x) = y(x) = y(x) = ... = exp(x), en tanto que p(x) = 1, p(x) = p(x) = ...
= 0. Podra pensarse que se mejorara la situacin aumentando el grado de la
aproximacin polinmica, pero hay que recordar los problemas de oscilacin en los extremos del intervalo con las aproximaciones polinmicas de
grado finito creciente, de modo que esta accin no tiene que mejorar necesariamente la calidad del resultado (ntese que exp(x) viene dado por una serie
infinita). Por lo tanto, en una derivacin numrica las tres fuentes de error
habituales, entrada, algoritmo y redondeo, pueden visualizarse a travs de la
incertidumbre que generan en el comportamiento de la pendiente. En la discusin siguiente van a considerarse tablas igualmente espaciadas lo que
resulta muy conveniente en diferenciacin por la simetra en el conocimiento
de la funcin alrededor de cada argumento . Se asumir que las y(n existen.

Frmulas de Newton
La aproximacin directa al clculo numrico de una derivada la da cualquiera de los polinomios de colocacin. Por ejemplo, con el polinomio de
avance de Newton expresado en trminos de la variable k = (x x0)/h visua-

153

CLCULO NUMRICO Y ESTADSTICA APLICADA

lizada como continua, para las dos primeras derivadas resultan las expresiones

dp( k )
1
3k2 6 k + 2 3
y0 + ...
= y0 + k 2 y0 +
dk
2
6

(3.4.1)

d 2 p( k )
6 k2 18 k + 11 4
2
3
=
+

y
k
1

y
+
y0 + ...
(
0
0
12
dk2

(3.4.2)

p ( k ) =

p( k ) =

o en trminos de la variable original x


p ( x ) =

p( x) =

dp dp dk 1
=
= p ( k )
dx dk dx h

d2 p
dx2

d dp 1
=
p ( k)
dx dx h2

(3.4.3)

(3.4.4))

Estas son las expresiones de derivacin apropiadas para argumentos


cercanos al origen x0 de la tabla. Las generalizaciones a rdenes de diferenciacin superiores y para argumentos cercanos al extremo final de la tabla xN
(polinomio de retroceso) son sencillas de obtener.
Un detalle importante a observar aqu es que cualquier error de entrada
en los datos yk ek se va a ver fuertemente amplificado por el espaciado h de
la tabla. Es lgico pensar que las evaluaciones de las derivadas numricas
sern tanto mejores cuanto menor sea este espaciado h, pues las derivadas
son lmites cuando h 0. Por una parte, esto obliga a disponer de tablas
estrechamente espaciadas, 0 < h < 1, pero por otra las divisiones por factores
hm < 1 darn nmeros elevados con el consiguiente aumento en el error de
la operacin, que va a ser tanto mayor cuanto mayor sea m. Adems, con
respecto a los errores de redondeo cabe decir lo siguiente. En el clculo
manual estn fuertemente relacionados con los errores de entrada y se debe
estar precavido contra sus efectos negativos en el resultado. En el clculo
automtico con computador, y dependiendo del problema, conviene utilizar
tantos dgitos como sea posible en los clculos intermedios para minimizar
tales efectos no deseados.

154

APLICACIONES NUMRICAS BSICAS

EJERCICIO 3.4.1
a) Estudiar el error de algoritmo en la primera derivada calculada con un
polinomio de avance de Newton de primer orden; b) observar y discutir el
papel del espaciado en este clculo; c) comparar con el resultado que se obtendra con un polinomio de retroceso; y d) tomando como origen k = 0 en un
punto interior de la tabla de datos, comparar los resultados de la derivacin al
aplicarla en k = 0 utilizando los puntos: k = 1(y1 avance) y k = 1(y1 retroceso).
a) En este caso el error viene dado por
y '( x) ( dp(1) ( x)/ dx) =

2 k 1 (2
k2 k 2 dy(2 ( )
hy ( ) +
h
2
2
dx

que suponiendo continuidad en la segunda derivada y tomando k = 0 resulta

y( x) dp(1) ( x) / dx

k= 0

h (2
y (0 )
2

(3.4.5)

b) Es interesante observar aqu que los errores de algoritmo pueden


reducirse disminuyendo h, lo que obliga a construir una tabla ms estrechamente espaciada. Este comportamiento es general para rdenes de derivacin mayores y resulta contrario al de los errores de entrada. As una
eleccin adecuada de h puede minimizar los errores de este tipo de clculos
c) El mismo resultado general se obtendra con un polinomio de retroceso en el intervalo 1 k 0 como cabe esperar de la simetra del problema.
Las diferencias estn en el factor desconocido que depende de x0.
d) Para el mismo punto k = 0 las derivadas de avance y de retroceso van
a ser en general muy diferentes, pues una es la pendiente de la recta que pasa
por los puntos en k = 0 y en k = 1, y otra la pendiente de la recta que pasa
por los puntos en k = 1 y k = 0.

Frmulas de Stirling
A la vista de lo discutido en el Ejemplo anterior, apartado d), una opcin
simtrica para calcular derivadas en puntos interiores de la tabla debe ser
ms prxima a lo que ocurre en realidad en el comportamiento de la funcin. Una buena estrategia es utilizar en estos casos el polinomio de Stirling.
Para las dos primeras derivadas, reteniendo los dos primeros trminos (poli-

155

CLCULO NUMRICO Y ESTADSTICA APLICADA

nomio de segundo grado) y particularizando en el punto de inters para el


clculo que se sita en k = 0, se encuentra
dp(2 )
y1 y1
dy
Stirl.
;

dx
2h
dx x
x0

(3.4.6a )

d
d y
2
dx x dx
0
2

(2)
pStirl.

y1 2 y0 + y1
h2

(Stirling 2 grado)

(3.4.6b)

El error de truncamiento para la primera derivada es

k k2 1
3 k2 1 2 ( 3
dy( 3 (*)
y( x) dp ( x) / dx =
h y (*) +
h3
6
6
dx

(2 )

(3.4.7)

que para k = 0 con continuidad en la tercera derivada se reduce a

y( x0 ) dp( 2 ) ( x)/dx

x0

h2 ( 3 *
y (0 )
6

(3.4.8)

Comparando con la expresin (3.4.5) del ajuste lineal anterior se observa


que el factor h2 va a contribuir en la disminucin del error, pues h2 < h < 1.
Para valores h suficientemente pequeos se espera que las derivadas y(2 (x0) e
y(3 (x*0) no dominen el comportamiento del error. Tambin, si las funciones
son razonablemente suaves, la pendiente de la secante simtrica (Stirling)
que pasa por los puntos k = 1 y k = +1 se espera que sea ms prxima a la
pendiente de la tangente en el punto k = 0 que las de las secantes no simtricas (Newton) que pasan por k = 1 y k = 0 y por k = 0 y k = +1. Esto hace
que las frmulas de Stirling anteriores sean muy tiles en los clculos de
derivadas numricas (Fig. 3T.3).
Hay todava ms oportunidades para la mejora de la derivacin numrica.
La reduccin en el espaciado h puede ser de ayuda en este empeo, pero pueden encontrarse complicaciones derivadas de los redondeos, de la magnificacin de los errores de entrada, y de la proximidad de los puntos que van a
intervenir en el clculo. Por ejemplo, la primera derivada (3.4.6a) se resume
en un cociente de dos nmeros que pueden ser, para h pequeos, muy pequeos, de manera que los redondeos pueden entonces jugar un papel muy
negativo. Sin embargo, se puede sacar un gran partido jugando con el espaciado con el que se construye la tabla y utilizando la conocida como extra-

156

APLICACIONES NUMRICAS BSICAS

Figura 3T.3. Comparacin de las aproximaciones a la derivacin numrica (primera derivada) en el


punto k% = kS = 0 utilizando solamente dos puntos para el clculo: la frmula simtrica (3.4.6a) de
Stirling basada en un polinomio de segundo grado, y la frmula asimtrica (3.4.1) de Newton basada
en un polinomio lineal. Como puede verse la secante simtrica de Stirling da una mejor
aproximacin a la pendiente de la tangente en kS = 0. Tambin es interesante darse cuenta de que al
evaluar la derivada numrica en kS = 2 hay que proceder con mucho ms cuidado, ya que hay en la
funcin un cambio de curvatura cercano, y se deberan utilizar puntos simtricos con respecto a
aquel mucho ms prximos que los mostrados. Esto podra implicar la determinacin adicional de
tales puntos (va numricamente o va experimentalmente) si no se dispusiera de ellos en la
tabulacin.

polacin de Richardson. A continuacin se discutir el caso de la primera


derivada utilizando el esquema ms sencillo que considera nicamente dos
espaciados, h1 y h2 menores que la unidad y tales que h1 = ah2 (a < 1).

Extrapolacin de Richardson
En general, el desarrollo de Taylor en torno al punto central x0 en el
que se quiere calcular la derivada se comporta a derecha e izquierda de ese
punto como
y( x0 + h) = y( x0 ) + hy ( x0 ) +

h2
h3
y( x0 ) +
y ( x0 ) + ...
2!
3!

(3.4.9 )

y( x0 h) = y( x0 ) hy ( x0 ) +

h2
h3
y( x0 )
y ( x0 ) + ...
2!
3!

(3.4.10 )

157

CLCULO NUMRICO Y ESTADSTICA APLICADA

de donde es inmediato establecer


y( x0 + h) y( x0 h)
y( x0 ) =
+
2h

i=1

y(2 i+1 ( x0 ) 2 i
h
(2i + 1)!

(3.4.11)

El primer trmino de (3.4.11) es justamente la aproximacin de Stirling a


la primera derivada, en tanto que el segundo trmino puede considerarse
como el error cometido al aceptar como derivada el primer trmino. De
hecho para h 0 es un error asinttico y su primera contribucin es proporcional a h2. Por comodidad de notacin la ecuacin anterior se escribir
`

D = Di +

a h

j
j i

; j = 2j

(3.4.12)

j =1

en donde D es el valor real de la derivada en x0, Di es la aproximacin a D


con el espaciado hi y los nmeros aj no dependen de hi. Para el caso de dos
espaciados se tiene el sistema de dos ecuaciones
`

D = D1 +

a1 h12

a h

j
j 1

(3.4.13)

j =2
`

D = D2 + a1 h22 +

a h

j
j 2

(3.4.14)

j =2

Al haberse obtenido la estimacin D1 con un espaciado menor, se espera


que sea mejor que la estimacin D2. Eliminando el coeficiente a1 se encuentra
D=

D1 2 D2
1 2

j =2

j 2

aj h2 j ; < 1, j = 2 j
2
1

(3.4.15)

Esta expresin (3.4.15) muestra ya en su primer trmino una mejor


aproximacin an a la verdadera derivada D = y(x0) combinando informacin obtenida con los dos espaciados h1 y h2, ya que el trmino de error
comienza con h2g 2 = h42. La primera derivada se aproximar as mediante la
frmula
y ( x0 ) = D

158

D1 2 D2
1 2

; < 1, h1 = h2

(3.4.16)

APLICACIONES NUMRICAS BSICAS

en donde cada aproximacin a la derivada viene dada por


D1 =

y( x0 + h1 ) y( x0 h1 )
y( x0 + h2 ) y( x0 h2 )
; D2 =
2 h2
2 h1

(3.4.17)

El proceso anterior puede iterarse para eliminar sucesivamente los coeficientes aj, para lo que es necesario disponer de informacin con espaciados
h an menores h < h1. Igualmente puede procederse con las derivadas de
orden superior mejorando la precisin en sus clculos. Hay que notar adems que convenientemente adaptada esta tcnica de extrapolacin puede
aplicarse a otro tipo de evaluaciones (integraciones y funcionales en general).
Finalmente, si los datos de entrada vienen afectados de fuertes errores
suele ser ventajoso encontrar un ajuste suavizador de mnimos cuadrados
(con polinomios convencionales o trigonomtricos) y obtener las derivadas
numricas a partir de tal ajuste.

3.5. Integracin numrica


El siguiente tema a tratar es el de la evaluacin numrica de integrales
definidas. Existe una gran variedad de tcnicas en este contexto que son de
aplicacin tanto a funciones definidas por una tabla {xk, yk}k=0,N como a funciones definidas por expresiones analticas en un intervalo a x b pero que
pudieran resultar bien imposibles de integrar (por no poseer primitiva),
bien de integracin difcil y/o costosa. Como las operaciones anteriormente
tratadas, en la integracin numrica se presentan los tres tipos habituales de
errores: entrada, algoritmo y redondeo. Sin embargo, en general, sus efectos
son menos severos que en derivacin. Por lo que respecta a los errores de
redondeo, se mantienen las mismas observaciones generales ya dadas en
otros lugares de este texto. A continuacin se presentan las tcnicas bsicas
y se consideran algunos problemas que requieren tratamientos especiales.
Siempre se consider convergencia en la integral a calcular.

Regla del trapecio


Dada una funcin y = y(x) definida en un intervalo x0 = a x b = xN
mediante una tabla de valores igualmente espaciados (si la funcin es anal-

159

CLCULO NUMRICO Y ESTADSTICA APLICADA

tica, se elige un espaciado h y se discretiza calculando N + 1 puntos), el clculo de su integral definida entre a y b puede aproximarse mediante una funcin lineal entre cada dos puntos consecutivos definiendo una lnea poligonal
que puede integrarse con sencillez. Estos segmentos de recta, construidos
entre los puntos k = 0 k = 1, k = 1 k = 2, , k = N 1 k = N, son los que
dan el nombre a este algoritmo: la regla del trapecio. La evaluacin de la integral (un rea) queda as reducida a sumar las reas parciales de N trapecios
consecutivos con la misma altura (horizontal) h = xk+1 xk = cte > 0. El rea
del primer trapecio viene dada por (Fig. 3T.4)

x1

p1(1) ( x) dx =

x0

x1

y0 +
x0

x x0
h
y0 dx = ( y0 + y1 )
h
2

(3.5.1)

El rea del segundo trapecio se obtiene de forma anloga

x2
x1

p2(1) ( x) dx =

x2
x1

x x1
h
y1 + h y1 dx = 2 ( y1 + y2 )

(3.5.2)

y as sucesivamente. Sumando todas las contribuciones se tiene la aproximacin

b
a

b= xN
xN 1

y( x) dx

x1
a = x0

pN(1) ( x) dx =

p1(1) ( x) dx +

x2
x1

p2(1) ( x) dx + ... +

h
( y + 2 y1 + 2 y2 + ... + 2 yN 1 + yN )
2 0

(3.5.3)

Figura 3T.4. Esquema grfico de la aplicacin de la regla del trapecio para integrar la funcin f(x)
con un espaciado h = 0,5 entre 0,5 x 3,5.

160

APLICACIONES NUMRICAS BSICAS

El error de truncamiento de este algoritmo est dado por la suma de los


errores de las N contribuciones a la integral. Para la primera contribucin se
tiene

(
x1

x0

y( x) p1(1) ( x) dx =

h3 (2
h2
y ( );
k( k 1) y(2 (1 ) hdk =
2
12

(3.5.4 )

x0 < < x1
en donde se ha supuesto un comportamiento continuo de la derivada segunda y(2 en el intervalo y se ha aplicado un teorema de valor medio, dado que
k(k 1) no cambia de signo en dicho intervalo. Extendiendo este resultado a
todo el intervalo (cerrado) de integracin, con y(2 continua y acotada, y por
tanto verificando y(2(x) M, entonces puede escribirse para el error total la
expresin

b= xN
a = x0

( y( x) p

trap. ( x) dx =

h3
( b a) 2 ( 2
Ny(2 ( ) =
h y ( );
12
12

(3.5.5)

x0 < < xN
que por simplicidad de notacin no se escribe como valor absoluto. Hay que
notar que este algoritmo puede utilizarse perfectamente eligiendo diferentes
espaciados para representar a la funcin en diferentes regiones del intervalo
de integracin (la tabla pudiera no estar igualmente espaciada), pero esto
obliga a modificar adecuadamente la frmula de integracin (3.5.3) superponiendo y sumando las contribuciones con diferentes valores de h.
En cuanto a los errores de entrada yk ek al contrario que en derivacin,
este algoritmo no los amplifica si se utilizan diferentes espaciados y el efecto que alcanzan sobre el resultado permanece siempre acotado e igual, independientemente del valor h, tenindose

entrada ( x0 xN E = ( b a) E;

k E, k = 0,1, 2,..., N

(3.5.6 )

como puede comprobarse con facilidad.


Otra particularidad especial de este algoritmo es que al hacer tender
h 0 se obtiene justamente la definicin de integral definida (Riemann) y el
error de truncamiento 0 en tanto y(2 se mantenga acotada como se indic
antes. En la integracin de funciones analticas complicadas, que no presentan errores de entrada, esta caracterstica hace de la regla del trapecio un

161

CLCULO NUMRICO Y ESTADSTICA APLICADA

mtodo muy apreciado y robusto en computacin, pues: es sencillo de programar, el esfuerzo de clculo lo realiza el computador, y permite obtener
estimaciones muy precisas (se observa como se repiten y mantienen cifras
significativas en el resultado) con la disminucin de h y que tienden al valor
exacto. Por otra parte, existen modificaciones de esta sencilla regla que presentan menores errores de truncamiento, pero que pueden involucrar: valores no contenidos en el intervalo de integracin (trapecio-Bessel), el conocimiento de las derivadas de orden impar en los extremos del intervalo de
integracin (Euler-McLaurin), etc.

Regla de Simpson
El siguiente algoritmo de integracin es la popular regla de Simpson y est
basada en ajustes polinmicos con parbolas cada tres puntos consecutivos de
la tabla de datos igualmente espaciados. As se tienen las ternas k = 0 k = 1
k = 2, k = 2 k = 3 k = 4, , k = N 2 k = N 1 k = N. Esto impone
una restriccin al nmero de puntos a utilizar en las aplicaciones de esta
regla: N + 1 debe necesariamente ser impar. La discusin de esta regla es similar a la del trapecio, pero considerando aqu polinomios parciales de segundo
grado. Cualquier resultado parcial es anlogo al de la primera terna de puntos
que resulta ser

x2

y( x) dx

x0

x2
x0

p1( 2 ) ( x) dx =

h
( y + 4 y1 + y2 )
3 0

(3..5.7)

con lo que el resultado global para una tabla igualmente espaciada es

b= xN
a = x0

h
( y + 4 y1 + 2 y2 + 4 y3 + 2 y4 + ... + 2 yN 2 + 4 yN 1 + yN )
3 0

y( x) dx

(3.5.8)

El error de truncamiento es en este caso


b= xN

( y( x) p
a= x0

Simpson ( x)

a)
h y
) dx = (b180

4 (4

( ); a = x0 < < b = xN

(3.5.9)

Los errores de entrada tampoco se ven amplificados con este algoritmo


por la eleccin del espaciado h y la expresin de la acotacin de este error es
idntica a la del trapecio (3.5.6) en condiciones anlogas.

162

APLICACIONES NUMRICAS BSICAS

Los dos algoritmos, trapecios y Simpson, son convergentes, es decir llevan


al resultado exacto al hacer h 0 en tanto las derivadas correspondientes
y(2 (x) e y(4 (x) se mantengan acotadas. Como nota de atencin, h muy pequeos implican un elevado nmero de operaciones y habra que vigilar el problema de los redondeos. Ambos algoritmos pertenecen a los denominados
esquemas de Newton-Cotes en versin cerrada. Existen sus paralelos en versin abierta, en la que los extremos del intervalo de integracin no forman
parte del clculo. No obstante, estas ltimas, salvo en algunas circunstancias
especiales en integracin (singularidades en los extremos, ecuaciones diferenciales ordinarias), no presentan grandes ventajas frente a los esquemas
cerrados y no van a tratarse aqu. La integracin con polinomios de grado
superior a los presentados arriba no siempre es ventajosa. En particular,
utilizando ajustes cbicos especiales a trozos (splines cbicos) los resultados son generalmente bastante buenos (aparece una regla del trapecio con
correcciones). Con grados de polinomio crecientes los ya mencionados problemas en los bordes del intervalo de integracin (problema de Runge) pueden echar a perder la estimacin de la integral y su uso no est recomendado.

Tcnicas Gaussianas
Aunque las reglas anteriores pueden aplicarse siempre, dependiendo de
las circunstancias puede resultar conveniente seleccionar puntos de la funcin a integrar adaptados a las particularidades del problema. El objetivo es
conseguir una elevada exactitud en el resultado utilizando un nmero reducido de puntos y una funcin de peso v (x) dentro de la integral. Esta es la
idea directora de la integracin Gaussiana, en la que tanto los coeficientes ci
de la suma discretizada como los argumentos xi se fijan utilizando informacin de los polinomios ortogonales adecuados al intervalo de integracin
considerado. Por su importancia en las aplicaciones van a tratarse aqu los
tres tipos de integracin Gaussiana siguientes: a) Gauss-Legendre, v (x) = 1,
1 x +1; b) Gauss-Hermite, v (x) = exp(x2), < x < ; c) Gauss-Laguerre,
v (x) = exp(x), 0 x < . En los tres casos la integracin numrica se plantea
como una suma discreta sobre N puntos de la forma:

b
a

y( x) ( x) dx =

i =1

i y( xi ) =

c y( x )
i

(3.5..10 )

i =1

163

CLCULO NUMRICO Y ESTADSTICA APLICADA

expresin en la que deben determinarse tanto los coeficientes ci (o pesos v i)


como las abcisas xi para lo que puede seguirse el denominado mtodo de los
coeficientes indeterminados y que consiste en exigir que la aproximacin
(3.5.10) sea exacta para los polinomios 1, x, x2, ..., obtenindose un sistema
de ecuaciones del que se pueden calcular aqullas incgnitas. En el caso
Gauss-Legendre se ilustrar explcitamente esta manera de proceder. Tambin existe la posibilidad de realizar integracin numrica Gaussiana con los
polinomios de Tschebyscheff, algo que se deja para un problema. Como
antes, en estas integraciones la convergencia a la precisin deseada se consigue con el aumento del nmero de puntos N en (3.5.10) y observando el
nmero de cifras estables que permanecen en el resultado.
Como advertencia necesaria en este contexto, hay que cerciorarse de
que la aplicacin del algoritmo se comporta adecuadamente, lo que va a
depender de la funcin a integrar. Si la funcin a integrar y(x) no tiene
cambios de signo en el intervalo de integracin, entonces la aplicacin directa de estos algoritmos no presenta problemas. Sin embargo, si estos cambios
de signo existen, el tratamiento de la integral es ms complejo, pues el efecto de cancelacin de reas pudiera no ser tenido en cuenta completamente
con una o varias selecciones de argumentos fijos, y esto podra afectar negativamente a la precisin del resultado. Debe pues prestarse atencin a esta
posible circunstancia para disear una estrategia de evaluacin correcta,
estudiando el problema por intervalos y/o aumentando el nmero de puntos
de integracin, o a veces cambiar de idea y utilizar una regla sencilla como la
del trapecio con espaciados ms y ms finos (aqu sera necesaria computacin) u otras tcnicas (ver ms adelante el caso de funciones oscilantes).
i) Gauss-Legendre
En este caso los polinomios involucrados son los de Legendre no normalizados
{Pm(x)}m=0, definidos con (x) = 1, 1 x +1, lo que significa que el intervalo de
integracin original y su variable deben transformarse al intervalo natural de estos
polinomios. En lo que sigue se supone que esta transformacin ha sido realizada y
hay que evaluar

IN =

+1

y( x) ( x) dx

c y( x )
P
i

P
i

(Gauss-Legeendre ;P )

(3.5.11)

i =1

en donde deben determinarse las incgnitas ciP y xiP, i = 1, 2, ..., N. El criterio


a seguir se denomina de coeficientes indeterminados y requiere exactitud

164

APLICACIONES NUMRICAS BSICAS

para las funciones y(x) = 1, x, x2, ... As para N puntos hacen falta 2N ecuaciones y, por tanto, hay que llegar hasta y(x) = x2N1 en las condiciones anteriores, lo que significa que la frmula (3.5.11) va a ser exacta para funciones
polinmicas de grado 2N 1. Para N = 2, por ejemplo, hacen falta cuatro
ecuaciones y hay que llegar hasta y(x) = x3, obtenindose el sistema
y( x) = 1 2 = c1P + c2P
y( x) = x 0 = c1P x1P + c2P x2P
2
= c1P ( x1P )2 + c2P ( x2P )2
3
y( x) = x3 0 = c1P ( x1P )3 + c2P ( x2P )3

y( x) = x2

que resuelto da los valores c1P = c2P = 1, x1P = x2P = +

1
.
3

EJERCICIO 3.5.1
Determinar los coeficientes y argumentos de una integracin Gauss-Legendre con tres puntos N = 3.
En este caso hacen falta seis ecuaciones y debe llegarse hasta y(x) = x5
obtenindose el sistema
y( x) = 1 2 = c1P + c2P + c3P
y( x) = x 0 = c1P x1P + c2P x2P + c3P x3P
2
= c1P ( x1P )2 + c2P ( x2P )2 + c3P ( x3P )2
3
y( x) = x3 0 = c1P ( x1P )3 + c2P ( x2P )3 + c3P ( x3P )3
y( x) = x2

2
= c1P ( x1P )4 + c2P ( x2P )4 + c3P ( x3P )4
5
5
y( x) = x 0 = c1P ( x1P )5 + c2P ( x2P )5 + c3P ( x3P )5
y( x) = x4

que resuelto da los valores c1P = c3P =

5 P 8 P
3 P
, c2 = , x1 = x3P = +
, x = 0.
9
9
5 2

Este proceso para obtener coeficientes y argumentos puede continuarse


para valores N crecientes, pero resulta tedioso y complicado. En este caso exis-

165

CLCULO NUMRICO Y ESTADSTICA APLICADA

te un camino ms sofisticado y compacto que utiliza directamente los polinomios de Legendre y determina los coeficientes y los argumentos para la integracin. Por razones de espacio no va a darse esta formulacin ms avanzada
aqu. El resultado fundamental de todas estas operaciones es que los puntos de
integracin xiP son justamente las races de los polinomios {Pm(x)}m=0,. As, en
los ejemplos desarrollados arriba los valores x1P = x2P = + 1 / 3 son las races (o ceros) de P2(x) y los valores x1P = x3P = + 3 / 5 , x 2P = 0, son las races
de P3(x). En general para N puntos de integracin se tiene que los coeficientes y los argumentos son
PN ( xiP ) = 0; ciP =

2 1 ( xiP )2

N PN 1 ( xiP )
2

; i = 1, 2, 3,..., N

(3.5.12)

Existen tabulaciones de estos datos {xiP, ciP}i=1,N para valores del parmetro
N, por lo que el clculo de integrales siguiendo este esquema slo requiere la
evaluacin de la funcin a integrar en los puntos xiP y calcular la suma
(3.5.11). Una seleccin de estos datos tiles para integracin Gauss-Legendre, calculados a travs de las races de los polinomios correspondientes, se
muestra en los Complementos de este captulo. A observar la simetra en los
datos con respecto al origen. La comparacin con resultados sucesivos obtenidos aumentando N ya da una idea de la precisin que se est alcanzando
en la evaluacin, pues se observa como el nmero de cifras obtenidas que se
conservan en el resultado va aumentando con N.
El error de truncamiento en este caso viene dado por la expresin

trunc. (P ) =

y( 2 N ( )
(2 N )!

+1
1

( x) dx =

22 N +1 ( N !)4
3

(2 N + 1) (2N )!

y( 2 N ( ); 1 < < +1 (3.5.13)

en donde x es un valor indeterminado dentro del intervalo de integracin y


N

N ( x) = ( x xi ). Una estimacin razonable del error en este caso para


i =1

funciones suaves, que utiliza el valor calculado para la integral IN (3.5.11),


viene dada por la frmula de Lanczos
1
Lanczos ( P ) =
y( +1) + y(1) IN
2N + 1

166

i=1

ciP xiP y ( xiP )

(3.5.14 )

APLICACIONES NUMRICAS BSICAS

ii) Gauss-Hermite y Gauss-Laguerre


La integracin de funciones sobre intervalos infinitos puede llevarse a
cabo utilizando reglas sencillas como la del trapecio o Simpson, pero esto
implica determinar los lmites prcticos para la integracin, bien acotando,
o bien aadiendo ms y ms puntos a la regla de integracin hasta obtener la
precisin deseada. Normalmente recurrir al clculo con computador es la
manera de realizar esto. Las dos tcnicas que se presentan a continuacin
tratan con intervalos de integracin infinitos y, utilizando un pequeo nmero de puntos, suelen evitar tales servidumbres. Ambas utilizan familias de
polinomios ortogonales ya conocidas: 1) Gauss-Hermite, v (x) = exp(x2),
< x < ; y 2) Gauss-Laguerre, v (x) = exp(x), 0 x < . Las funciones de
peso son aqu necesarias para forzar la convergencia de las integrales. El
mtodo constructivo visto en la integracin de Legendre para generar las
aproximaciones con N puntos a las integrales a evaluar sigue siendo vlido,
si bien resulta aqu mucho ms complicado de llevar a cabo. Al igual que
antes, es mejor obtener estos algoritmos mediante un razonamiento que
involucra a las familias ortogonales mencionadas, pero por brevedad se van
a dar nicamente los resultados principales. Las aproximaciones al clculo
de integrales son similares a (3.5.11)
IN =

IN =

`
`

exp( x2 ) y( x) dx

H
y( xiH )
i

(Gauss-H
Hermite ;H )

(3.5.15)

i =1

exp( x) y( x) dx

c y( x )
L
i

L
i

(Gauss-Lag
guerre ; L)

(3.5.16)

i =1

Los errores de truncamiento respectivos se obtienen de la frmula general

trunc. =

y(2 N ( )
(2 N )!

`
B

( x) ( x) dx; B = ` ( H ), B = 0( L); B < < `

(3.5.17)

que se reduce a las expresiones

trunc. ( H ) =

N!
2 N (2 N )!

y(2 N ( ); trunc. ( L) =

( N !)2 ( 2 N
y ( )
(2 N )!

(3.5.18)

en donde y(2N denota la derivada 2N sima. Para las integraciones Gaussianas correspondientes los valores de los argumentos xiH y xiL son de nuevo las

167

CLCULO NUMRICO Y ESTADSTICA APLICADA

races de los polinomios empleados, y los coeficientes de integracin se calculan en las formas
ciH =

2 N +1 N !

( dH /dx )

( N !)2

; ciL =

x=( xiH )

xiL

( dL /dx )
N

(3.5.19)

x=( xiL )

Todos estos valores estn tabulados para poder efectuar las integraciones
numricas con un nmero N creciente de puntos.
Estas dos aplicaciones (3.5.15) y (3.5.16) pueden ser artificialmente
extendidas a la integracin numrica de funciones y(x) arbitrarias (con las
observaciones de comportamiento adecuado mencionadas arriba), sin ms
que utilizar las variaciones siguientes
IN =

`
`

y( x) dx =

exp( x ) y( x) exp( x ) dx

H
y( xiH ) exp
i

(( x ) )
H 2
i

i=1

(Gauss-Hermite H)
IN =

y( x) dx =

exp( x) y( x) exp( x) dx

c y( x ) exp( x )
L
i

L
i

L
i

i =1

(Gauss-Laguerre L)
Una seleccin de datos tiles para las integraciones Gauss-Hermite y
Gauss-Laguerre, calculados a travs de las races de los polinomios correspondientes, se muestra tambin en los Complementos de este captulo. A
observar la simetra en los datos Gauss-Hermite con respecto al origen.

Tratamiento de integrales singulares


Un caso importante en las aplicaciones de integracin numrica es el de
la integracin de funciones analticas conocidas que presentan singularidades. Estas son puntos xS del intervalo de integracin en los que la funcin, o
sus derivadas, divergen. Como ya se ha visto en todas las frmulas anteriores
de evaluacin del error, ste muestra una dependencia de las derivadas de la
funcin a integrar. Esto hace que en ciertos casos las singularidades de
tales derivadas ocasionen problemas que una aproximacin polinmica no

168

APLICACIONES NUMRICAS BSICAS

puede controlar. De ah su inclusin anterior como causa de problemas. Por


otra parte, el hecho de que una funcin contenga singularidades no significa que su integracin deba necesariamente ser divergente. Por ejemplo, la
x entre 0 y 1 presenta una singularidad en
integral (impropia) de f(x) = +1/
xS = 0, f(xS) , pero su valor puede obtenerse analticamente, mediante el
conocido paso al lmite, resultando ser 2. En lo que sigue se tratar con
integrales singulares convergentes y se discutirn algunos mtodos generales para abordarlas desde la perspectiva numrica. Tipos de singularidades
importantes en integracin son las siguientes: i) x1/2 en xS = 0, ii) (1 x2)1/2
en xS = 1, y iii) [x/(1 x)]1/2 en xS = 1. Alguna de ellas ya ha aparecido en el
contexto de los polinomios de Tschebyscheff Tn(x), pero como se ver a
continuacin puede tratarse adecuadamente sin hacer referencia explcita a
ella. Si hubiera varias singularidades en el integrando conviene irlas resolviendo separadamente aislndolas en intervalos y expresando la integral
como la suma de las contribuciones resultantes.
1) Un primer mtodo es el de ignorar la singularidad. Para singularidades del tipo i) x1/2 en xS = 0 una estrategia en esta lnea que lleva a resultados
convergentes consiste en plantear algoritmos de trapecios o de Simpson
con espaciados h cada vez ms pequeos, incluyendo ms y ms puntos
xi xS del intervalo sobre el que integrar.
2) Un segundo mtodo es el cambio de variable en la integral. Si puede
encontrarse un cambio aceptable, x = x(t), que haga desaparecer la singularidad inicial de la integral sobre f(x(t)), entonces el problema queda resuelto.
Esto es lo que suceda en el caso de los polinomios Tn(x) en los que la singularidad es del tipo ii) y se resuelve con x = cos q (0 q p). Una situacin
aparte, pero relacionada con este mtodo general, es la de integrales sobre
intervalos x infinitos, en las que cambios de variable adecuados (que transformen el intervalo en uno finito) pueden en ciertos casos aliviar el problema
de tratar la singularidad. Conviene recordar que un cambio de variable aceptable en integracin, x = x(t) con a x b, se consigue si x(t) es continua y
estrictamente montona (creciente o decreciente, con derivada continua) en
el intervalo transformado t1 t t2.
3) Un tercer mtodo consiste en utilizar desarrollos en serie (generalmente de Taylor) de todo o parte del integrando de modo que la singularidad
desaparezca o pueda ser tratada convenientemente (la regla de LHpital,
simplificacin, etc.), para despus integrar trmino a trmino. Aqu hay que
prestar atencin a la convergencia de la serie integrada y sus cuestiones

169

CLCULO NUMRICO Y ESTADSTICA APLICADA

conexas. Una condicin suficiente para poder realizar esta operacin es la de


la convergencia uniforme de la serie final obtenida y que va a ser integrada
as. Una medida de la convergencia numrica del resultado la van dando los
resultados parciales que van incluyendo cada vez ms trminos de la serie.
4) Un cuarto mtodo es el fraccionamiento de la integral original en
dos partes, de modo que una de ellas contenga la singularidad pero pueda
integrarse exactamente, en tanto que la otra parte est libre de singularidades en la funcin y se pueda evaluar numricamente. Esto pudiera ocasionar
que la segunda parte todava contuviera singularidades en la(s) derivada(s)
de su integrando y, en ese caso, puede resultar ventajoso transformarla a su
vez desplazando las singularidades a derivadas de orden superior. Cmo
hacer esto depende de cada caso particular y, a veces, sumar y restar cantidades adecuadas constantes en el numerador de la funcin a integrar puede
efectuar esta operacin.
5) Otras variantes de ataque a este problema incluyen algn tipo de frmula abierta de Newton-Cotes (regla del punto medio para singularidades en
los extremos del intervalo), las series asintticas, o la diferenciacin con
respecto a parmetros.
Tratamiento de integrales oscilantes
Este tipo de integrales definidas contiene en su integrando un factor
oscilante del tipo sen nx o cos nx Requieren un tratamiento especial y estn
relacionadas con las operaciones de transformacin de Fourier de gran trascendencia en la teora y prctica de la difraccin de radiacin y del anlisis
de seales, pero que no se van a considerar aqu. La presentacin siguiente
va a limitarse a ilustrar los rudimentos de este asunto utilizando de nuevo la
tcnica de coeficientes indeterminados en un par de casos que se discuten
como ejemplos desarrollados.
EJERCICIO 3.5.2
Determinar los tres coeficientes F de la aproximacin para evaluar la integral oscilante

170

y( x) sen nx dx F0 y(0) + F1 y( ) + F2 y(2 )

(3.5.20 )

APLICACIONES NUMRICAS BSICAS

Para ello se exigir que la aproximacin sea exacta para y(x) = 1, x, x2,
disponiendo as de tres ecuaciones para poder determinar los coeficientes F0,
F1, y F2. Esto no es ms que una nueva aplicacin del mtodo general de los
coeficientes indeterminados. El sistema de ecuaciones en este caso resulta ser
2

y( x) = x I =

y( x) = 1 I0 =

sen nx dx = 0 = F0 + F1 + F2

2
= 0 F0 + F1 + 2 F2
n
0
2
4 2
x2 sen nx dx =
= 0 F0 + 2 F1 + 4 2 F2
y( x) = x2 I2 =
n
0
2

x sen nx dx =

y una vez resuelto da los resultados


F0 = 1/n; F1 = 0; F2 = 1/n
con lo que la frmula de tres puntos (3.5.20) queda reducida a

y( x) sen nx dx

1
[ y(0 ) y(2 )]
n

(3.5.21)

Ntese que la parte oscilante ha sido integrada y no interviene directamente en la expresin del algoritmo que slo tiene en cuenta a dos valores de y(x).
EJERCICIO 3.5.3
Proponer una expresin de tres puntos para evaluar la integral oscilante

y( x) cos nx dx F0 y(0 ) + F1 y( ) + F2 y(2 )

(3.5.22)

Exigiendo que la aproximacin sea exacta para y(x) = 1, x, x2, el sistema


de ecuaciones para F0, F1 y F2 es

y( x) = x I =

y( x) = 1 I0 =
1

y( x) = x2 I2 =

0
2

cos nx dx = 0 = F0 + F1 + F2
x cos nx dx = 0 = 0 F0 + F1 + 2 F2

x2 cos nx dx =

4
2

= 0 F0 + 2 F1 + 4 2 F2

171

CLCULO NUMRICO Y ESTADSTICA APLICADA

y la frmula de tres puntos queda reducida a

y( x) cos nx dx

n2

[ y(0 ) 2 y( ) + y(2 )]

(3.5.23)

Las frmulas (3.5.21) y (3.5.23) son versiones simples de las denominadas


frmulas de Filon que se pueden generalizar a los casos tericos muy importantes en las aplicaciones con intervalos de integracin semi-infinitos

y( x) sen nx dx;

y( x) cos nx dx

Cuando al tender x se tiene el comportamiento y(x) 0 muy rpidamente, entonces se puede sustituir el lmite superior por un valor finito
x xC < . Las frmulas generales del error en estos casos son bastante
complicadas y no van a considerarse aqu. Como indicacin de este error
siempre est la que puede extraerse de la utilizacin de ms y ms puntos en
la evaluacin numrica. Este tipo de enfoque permite alcanzar resultados
significativos incluyendo un nmero mucho ms pequeo de puntos que los
que seran necesarios utilizando reglas simples como las del trapecio o de
Simpson.

172

APLICACIONES NUMRICAS BSICAS

COMPLEMENTOS
Tablas para integracin Gaussiana (hasta N = 8)
Gauss-Legendre (P): v (x) =1, 1 x +1
(Datos redondeados a siete decimales)
N

xPi

vi

xPi

vi

0,5773503

1,0000000

0,9491079

0,1294850

0,5773503

1,0000000

0,7415312

0,2797054

0,7745967

0,5555556

0,4058452

0,3818301

0,8888889

0,4179592

0,7745967

0,5555556

0,4058452

0,3818301

0,8611363

0,3478548

0,7415312

0,2797054

0,3399810

0,6521452

0,9491079

0,1294850

0,3399810

0,6521452

0,9602899

0,1012285

0,8611363

0,3478548

0,7966665

0,2223810

0,9061798

0,2369269

0,5255324

0,3137066

0,5384693

0,4786287

0,1834346

0,3626838

8
5

0,5688889

0,1834346

0,3626838

0,5384693

0,4786287

0,5255324

0,3137066

0,9061798

0,2369269

0,7966665

0,2223810

0,9324695

0,1713245

0,9602899

0,1012285

0,6612094

0,3607616

0,2386192

0,4679139

0,2386192

0,4679139

0,6612094

0,3607616

0,9324695

0,1713245

173

CLCULO NUMRICO Y ESTADSTICA APLICADA

Gauss-Hermite (H): v (x) =exp(x2), < x <


(Datos redondeados a siete decimales)
N

xHi

vi

xHi

vi

0,7071068

0,8862269

2,6519614

0,0009718

0,7071068

0,8862269

1,6735516

0,0545156

1,2247449

0,2954090

0,8162879

0,4256073

1,1816359

0,8102646

1,2247449

0,2954090

0,8162879

0,4256073

1,6506801

0,0813128

1,6735516

0,0545156

0,5246476

0,8049141

2,6519614

0,0009718

0,5246476

0,8049141

2,9306374

0,0001996

1,6506801

0,0813128

1,9816568

0,0170780

2,0201829

0,0199532

1,1571937

0,2078023

0,9585725

0,3936193

0,3811870

0,6611470

8
5

0,9453087

0,3811870

0,6611470

0,9585725

0,3936193

1,1571937

0,2078023

2,0201829

0,0199532

1,9816568

0,0170780

2.3506050

0,0045300

2,9306374

0,0001996

1.3358491

0,1570673

0,4360774

0,7246296

0,4360774

0,7246296

1.3358491

0,1570673

2.3506050

0,0045300

174

APLICACIONES NUMRICAS BSICAS

Gauss-Laguerre (L): v (x) =exp(x), 0 x


(Datos redondeados a siete decimales)
N

xLi

vi

xLi

vi

3,4142136

0,1464466

19,3957279

0,0000000

0,5857864

0,8535534

12,7341803

0,0000159

6,2899451

0,0103893

8,1821534

0,0010740

2,2942804

0,2785177

4,9003531

0,0206335

0,4157746

0,7110930

2,5678767

0,1471263

9,3950709

0,0005393

1,0266649

0,4218313

4,5366203

0,0388879

0,1930437

0,4093190

1,7457611

0,3574187

22.8631317

0,0000000

0,3225477

0,6031541

15,7406786

0,0000008

12,6408008

0,0000234

10,7585160

0,0000908

7,0858100

0,0036118

7,0459054

0,0027945

8
5

3,5964258

0,0759424

4,2667002

0,0333435

1,4134031

0,3986668

2,2510866

0,1757950

0,2635603

0,5217556

0,9037018

0,4187868

15,9828740

0,0000009

0,1702796

0,3691886

9,8374674

0,0002610

5,7751436

0,0103992

2,9927363

0,1133734

1,1889321

0,4170008

0,2228466

0,4589647

175

CLCULO NUMRICO Y ESTADSTICA APLICADA

BIBLIOGRAFA
1. SCHEID, F., Anlisis Numrico, McGraw-Hill (serie Schaum), 1972. (Caps. 3, 12,
13, 14, 15, 16). Se mantienen los mismos captulos numerados de consulta en la
obra Numerical Analysis (1988).
2. SES, L. M., Mtodos Tericos de la Qumica-Fsica (Vol. 1), UNED, Madrid,
1994. (Tema 2).
3. PRESS, W. H.; FLANNERY, B. P.; TEUKOLSKY, S. A. y VETTERLING, W. T., Numerical
Recipes, Cambridge University Press, Cambridge, 1986. (Caps. 3, 4).
4. RICE, J. R., Numerical Methods, Software and Analysis, McGraw-Hill, Nueva York,
1983. (Caps. 3, 5, 7).
5. RALSTON, A. y RABINOWITZ, P., A First Course in Numerical Analysis, Dover, Nueva
York, 2001. (Caps. 1, 3, 4).

176

APLICACIONES NUMRICAS BSICAS

PROBLEMAS TERICOS Y NUMRICOS

Problemas tericos
3.1) Aplicar el mtodo de los coeficientes indeterminados para obtener las
frmulas de Gauss-Tschebyscheff con las que evaluar la integral:

+1

y( x)
2

+ 1 x

dx

c y( x )
T
i

T
i

i =1

para valores n = 2, 3.
3.2) Aplicar el mtodo de los coeficientes indeterminados para aproximar la
integral siguiente en la forma que se indica

y( x) dx c1 y(0 ) + c2 y(1) + c3 y(0 ) + c4 y(1)

en donde se utilizan los valores de la funcin y de su primera derivada en


ambos extremos del intervalo de integracin.
3.3) Eliminar las singularidades de la siguiente integral utilizando cambios de
variable

exp(3 x 2 )
dx
(2 x )1/ 2

Problemas numricos
3.4) La constante conocida como masa de Planck est dada por la expresin
mP =

c
G

en donde las constantes fsicas fundamentales que intervienen en su


formulacin son los siguientes valores que incluyen su error como

177

CLCULO NUMRICO Y ESTADSTICA APLICADA

nmeros entre parntesis al final de las cifras escritas (c est libre de


error)
= constante de Planck - Dirac = 1, 05457266(63)1027 erg s
G = constante de gravitacin universal = 6, 67259(85)10 11 m3 kg 1 s2
c = velocidad de la luz = 299792, 458 Km s1
Determinar el valor de mP y sus errores absoluto y relativo (1 erg = 107 J).
3.5) La siguiente tabla contiene valores de las energas rotacionales EJ de la
molcula 14N16O en funcin del nmero cuntico J
J

EJ(cm1)

3,414

10,242

20,484

34,140

51,210

10

EJ(cm1)

73,694

94,592

122,004 153,630 187,770

Tres de los valores EJ son errneos. Localizarlos, corregirlos y calcular el


polinomio cuadrtico en J que ajusta la tabla correcta. (1 cm1 = 1,98645
1023 Julios).
3.6) El calor especfico a volumen constante Cv de un fluido cuntico a una
densidad reducida r*N = 0,3 y en funcin de la longitud de onda de de Broglie reducida l*B toma los siguientes valores

l*B

0,116

0,2

0,3

Cv /R

1,526

1,544

1,566

0,4

0,5

0,6

1,588 1,610

1,632

0,7
1,654

a) Interpolar el valor de Cv en l*B = 0,15 y l*B = 0,45.


b) Calcular por integracin numrica la variacin de entropa a volumen
constante entre los estados definidos por l*B = 0,116 y l*B = 0,7.
Dar los resultados en unidades de R (constante de los gases).
Datos:

B* =

a
T 1/ 2

a = constante, T = temperatura absoluta.

178

APLICACIONES NUMRICAS BSICAS

Cv
dT ;
T
v = volumen (constante).
dS =

3.7) Para una cintica de isomerizacin cis-trans A B se conocen los siguientes datos de concentracin del ismero trans B, como porcentajes en la
mezcla A + B, en funcin del tiempo
t(s)

135

c(%)

25,505

180
31,740

225
37,101

270
41,709

315
45,670

Estimar numricamente la velocidad de esta reaccin v = dc/dt en el instante t = 225s y compararlo con el resultado exacto 0,110341%/s.
3.8) La tabla que se da a continuacin rene datos de las energas electrnicas
U de la molcula de fluoruro de hidrgeno en su estado fundamental en
funcin de la separacin internuclear
R()

0,8768

0,8868

0,8968

0,9068

U(cm1) 425,404907 233,968368 101,681613 24,859130


R()

0,9268

U(cm1)

23,779348

0,9368

0,9468

0,9168
0

0,9568

93,040164 204,785500 356,171012

en donde se ha tomado el origen de energas en la distancia de equilibrio


R0() = 0,9168. Utilizando dos espaciados h1 = 0,01 y h2 = 0,02 utilizar la
extrapolacin de Richardson para
a) Estimar la fuerza F del enlace en los puntos tabulares en los que sea
dU
.
posible esta determinacin sabiendo que F =
dR
b) A partir de los datos de estas fuerzas estimar la constante de fuerza del
2

enlace que viene dada por k0 = d U


en el punto de equilibrio.
2

dR 0
Dar este resultado redondeado a cuatro cifras significativas (1 cm1 =
1,98645 1023 Julios; 1 = 1010 m).

179

CLCULO NUMRICO Y ESTADSTICA APLICADA

3.9) La teora de Debye para el calor especfico a volumen constante de slidos a baja temperatura da la expresin (por mol) siguiente
Cv =

9R
u3D

u4 exp( u)

uD

( exp(u) 1))

du

en donde uD = qD /T con T = temperatura absoluta, qD la temperatura de


Debye (parmetro caracterstico del slido), y R la constante de los
gases = 8,3145 J/(mol K). Utilizando para el germanio slido el valor
qD = 360 K calcular el Cv molar a la temperatura T = 3 K.
3.10) Tratar la siguiente integral con singularidad utilizando el mtodo del de
1 cos x
dx
sarrollo en serie
0
x5/ 2
Calcular el valor de la integral garantizando al menos 2 decimales exactos.

SOLUCIONES
Problema 3.1
La aplicacin del mtodo de los coeficientes indeterminados a

+1

y( x)
+ 1 x

dx

c y( x )
T
i

T
i

i =1

consiste en hacer la aproximacin anterior exacta para y(x) = 1, x, ..., x2n1.


De esta manera se tiene un sistema de ecuaciones del que despejar los coeficientes cTi y las abcisas xTi . Como es de esperar por la presencia de la funcin
de peso de los polinomios ortogonales de Tschebyscheff, los resultados van a
ser similares a los discutidos en el captulo para las otras familias de polinomios ortogonales.
Para el caso n = 2 el sistema de ecuaciones resultante es
y( x) = 1 = c1T + c2T
y( x) = x 0 = c1T x1T + c2T x2T

= c1T ( x1T )2 + c2T ( x2T )2


2
y( x) = x3 0 = c1T ( x1T )3 + c2T ( x2T )3

y( x) = x2

180

APLICACIONES NUMRICAS BSICAS

en donde se han tenido en cuenta los resultados de las integraciones analticas exactas

+1
1

dx
1 x

= ;

+1

x
1 x

dx =

+1

x3
1 x

dx = 0;

+1

x2

1 x

dx =

Las integrales de las funciones potencia impar de x son idnticamente


nulas por simetra impar en el intervalo simtrico alrededor de x = 0, en tanto que las otras dos integrales se evalan con facilidad utilizando el consabido cambio de variable (que elimina las singularidades) que se detalla a
continuacin
x = cos u, dx = sen u du, x = 1 u = , x = 1 u = 0
La solucin del sistema da los resultados
c1T = c2T =

2
; x1T = x2T =
2
2

en donde los valores de las abcisas de integracin son justamente los ceros
del polinomio de Tschebyscheff T2(x) = 2x2 1.
Del mismo modo se trata el caso n = 3 obteniendo el sistema de ecuaciones
y( x) = 1 = c1T + c2T + c3T
y( x) = x 0 = c1T x1T + c2T x2T + c2T x3T

= c1T ( x1T )2 + c2T ( x2T )2 + c3T ( x3T )2


2
y( x) = x3 0 = c1T ( x1T )3 + c2T ( x2T )3 + c3T ( x3T )3

y( x) = x2

3
= c1T ( x1T )4 + c2T ( x2T )4 + c3T ( x3T )4
8
5
y( x) = x 0 = c1T ( x1T )5 + c2T ( x2T )5 + c3T ( x3T )5

y( x) = x4

Ahora se encuentran los resultados


c1T = c2T = c2T =

3
; x1T = x3T =
; x2T = 0
3
2

siendo las abcisas las races del polinomio T3(x) = 4x3 3x.

181

CLCULO NUMRICO Y ESTADSTICA APLICADA

El resultado general para una frmula de este tipo con n puntos es fcil
de imaginar
c1T = c2T = c3T = ... = cnT =

2i 1

, i = 1, 2, 3,..., n
; xiT = cos
n
2n

Como informacin til adicional, el error de truncamiento para esta


nueva frmula Gaussiana viene dado por
error =

2 y( 2 n ( )
2n

2 (2 n)!

; 1 < < 1; = arc cos x = coss 1 x

Problema 3.2
Esta aplicacin ilustra la versatilidad del mtodo de los coeficientes indeterminados para proponer algoritmos de integracin. Se procede como ya se
ha indicado en otros lugares, haciendo que el algoritmo sea exacto para
y(x) =1, x, x2, x3, con lo que se obtendrn cuatro ecuaciones de las que poder
determinar los cuatro coeficientes incgnita. As partiendo de

y( x) dx c1 y(0) + c2 y(1) + c3 y(0 ) + c4 y(1)

se plantean las ecuaciones


y( x) = 1, y ( x) = 0

1 = c1 + c2

y( x) = x, y( x) = 1

y( x) = x2 , y( x) = 2 x
x) = 3 x2
y( x) = x3 , y (x

1
=
2
1

=
3
1

=
4

c2 + c3 + c4
c2 +

2 c4

c2 +

3 c4

La solucin es un algoritmo que contiene a la regla del trapecio ms un


trmino correctivo
c1 = c2 =

182

1
1
; c3 = c4 =
2
12

APLICACIONES NUMRICAS BSICAS

y( x) dx

1
1
y(0) + y(1) + ( y (0) y(1)
(
2
12

y se trata de la versin ms simple del algoritmo de integracin de EulerMcLaurin. Para la expresin del error en estos casos se remite al lector a las
referencias especializadas.

Problema 3.3
Esta integral
I=

exp(3 x2 )
(2 x)1/2

dx

tiene una singularidad en x = 2 y la situacin va a resolverse a travs de dos


cambios de variable. El primer cambio de variable propuesto es
t = x/2 dt = dx/2; x = 0 t = 0, x = 2 t = 1
y la integral se expresa
1

I=

exp( 12t 2 )
2 dt
(1 t )1/ 2

con lo que de nuevo aparece una singularidad, ahora en t = 1. Un segundo


cambio de variable que elimine esta singularidad es el siguiente
t = sen 2 dt = 2 sen cos d ; t = 0 = 0, t = 1 = / 2
y la integral pasa a escribirse como
I=2 2

/2

exp[ 12 sen 4 ] sen d

que ya no contiene singularidades en el integrando y puede ser evaluada


numricamente.

183

CLCULO NUMRICO Y ESTADSTICA APLICADA

Problema 3.4
El primer paso a dar es reducir todas las constantes al mismo sistema de
unidades (MKS). Slo es necesario hacerlo con h y c y se consigue multiplicndolas por los factores adimensionales correspondientes
J
= 1, 05457266(63)10 34 J s
erg
m
c = 299792, 458 km s1 = 299792, 458 km s1 1000
= 299792458 m s1
km
G = 6, 67259(85)10 11 m3 kg 1 s2
= 1, 05457266(63)10 27 erg s 10 7

Ntese que estas multiplicaciones son esencialmente multiplicaciones


por la unidad. Por ejemplo,
1 J = 107 erg 1 = 107

erg
J

1 = 10 7

J
erg

Esto es muy til para realizar cambios de unidades en general sin cometer errores.
Se tienen entonces los datos de entrada para el clculo
= 1, 05457266(63)10 34 J s ; () = 0, 00000063 1034 J s
G = 6, 67259(85)10 11 m3 kg 1 s2 ; (G) = 0, 00085 10 11 m3 kg 1 s2
c = 299792458 m s1 ; ( c) = 0 m s1
Un primer tanteo para el valor de la masa de Planck da ahora
mP =

1, 05457266 10 34 299792458
= 2,176714074 10 8 kg
6, 67259 10 11

Evidentemente todas las cifras escritas no se van a mantener como significativas una vez que se evale el error. Este error absoluto viene dado por
la aplicacin de (3.1.3)

( mP )

184

mP
mP
mP
mP
mP
( ) +
(G ) +
( c) =
( ) +
(G )
0
G 0
0
G 0
c 0

APLICACIONES NUMRICAS BSICAS

con los valores absolutos de las derivadas parciales calculados con los datos
de entrada que se han utilizado ya en la primera estimacin de mP. Las
derivadas parciales necesarias llevan a
1 c
mP
22
= 2 G = 10320, 36083 10

0
0
1 c
mP
= 163,1086335
=

G
3
2 G 0
0
Tomando valores absolutos multiplicados por sus errores correspondientes y sumando las dos contribuciones se obtiene
mP = 2,176714074 10 8 0, 00013929252 10 8
El error relativo es por tanto

( mP )
= 0, 000064 ; 64 ppm
mP

y as, finalmente, eliminando decimales superfluos se determina la estimacin


buscada como
mP = 2,17671108 0, 00014 10 8 = 2,17671(14 )10 8 kg

Problema 3.5
Se disponen los datos en forma de tabla (Tabla (a)) y se calculan las
diferencias. Se observa alternancia de signos a partir de las terceras diferencias y tambin se observa que empiezan a aparecer diferencias constantes
en los primeros resultados de las diferencias segundas. De todo ello se puede
inferir que los posibles datos errneos son los subrayados 6, 7, y 8. No obstante esto no es siempre un asunto claro y hay que proceder formulando
hiptesis y comprobndolas. A continuacin se presentan posibles modos de
ataque a este problema.

185

CLCULO NUMRICO Y ESTADSTICA APLICADA

Tabla (a). Problema 3.5


J

EJ

DEJ = EJ+1 EJ

D2EJ

D3EJ

D4EJ

3,414
1

3,414

3,414
6,828

10,242

3,414
10,242

20,484

3,414
13,656

34,140

3,414

51,210

5,414

73,694

1,586

94,592

6,514

10,4
2,3

122,004

4,214
31,626

15,1
8,1

27,412
8

9
7

20,898
7

2
2

22,484
6

0
0

17,070
5

0,6
1,7

153,630

2,514
34,140

10

187,770

a) Hiptesis D2 = 3,414 = constante.


Si la hiptesis es correcta, entonces los datos son correctos hasta E(J = 5),
DE(J = 5). Dando marcha atrs en los clculos se encuentran para J 6 los
resultados que se detallan a continuacin

186

J = 6:

E( J = 5) = E( J = 4) + 2 = 17, 070 + 3, 414 = 20, 484


E( J = 6) = E( J = 5) + E( J = 5) = 51, 210 + 20, 484 = 71, 694

J = 7:

E( J = 6 ) = E( J = 5) + 2 = 20, 484 + 3, 414 = 23, 898


E(( J = 7) = E( J = 6 ) + E( J = 6) = 71, 694 + 23, 898 = 95, 592

J = 8:

E( J = 7) = E( J = 6) + 2 = 23, 898 + 3, 414 = 27, 312


E(( J = 8) = E( J = 7) + E( J = 7) = 95, 592 + 27, 312 = 122, 904

J = 9:

E( J = 8) = E( J = 7) + 2 = 27, 312 + 3, 414 = 30, 726


E( J = 9) = E( J = 8) + E( J = 8) = 122, 904 + 30, 726 = 153, 630
2

J = 6:

E( J = 5) = E( J = 4) + 2 = 17, 070 + 3, 414 = 20, 484


E( J = 6) = E( J = 5) + E( J = 5) = 51, 210 + 20, 484 = 71, 694

J = 7:

23, 898 NUMRICAS BSICAS


E( J = 6) = E( J = 5) + 2 = 20, 484 + 3, 414A=PLICACIONES
E(( J = 7) = E( J = 6 ) + E( J = 6 ) = 71, 694 + 23, 898 = 95, 592

J = 8:

E( J = 7) = E( J = 6) + 2 = 23, 898 + 3, 414 = 27, 312


E(( J = 8) = E( J = 7) + E( J = 7) = 95, 592 + 27, 312 = 122, 904

J = 9:

E( J = 8) = E( J = 7) + 2 = 27, 312 + 3, 414 = 30, 726


E( J = 9) = E( J = 8) + E( J = 8) = 122, 904 + 30, 726 = 153, 630

J = 10 : E( J = 9) = E( J = 8) + 2 = 30, 726 + 3, 414 = 34,140


E( J = 10) = E( J = 9 ) + E( J = 9 ) = 153, 630 + 34,140 = 187, 770
Los valores calculados para J = 9 y 10 coinciden con los originales de la
tabla. Recalculando la tabla de diferencias con estos nuevos valores se observa que aparecen segundas diferencias constantes D2 = 3,414. Hay pues tres
datos errneos que corregidos son
E( J = 6 ) = 71, 694; E( J = 7) = 95, 592; E( J = 8) = 122, 904
El polinomio que ajusta exactamente toda la tabla es de segundo grado y
puede expresarse con la frmula de avance de Newton
EJ = a + bJ + cJ 2 = E0 + JE0 +

E0 = 0
1
J ( J 1) 2 E0 =
=
2
2
E0 = E0 = 3, 414

1
3, 414 J ( J + 1)
2
De esta informacin, que se puede medir experimentalmente con espectroscopia de microondas, se puede obtener el parmetro rotacional B de la
molcula de NO por comparacin con la expresin del modelo cuntico del
rotor rgido E = BJ(J + 1) y con B calculado con el valor del momento de
inercia molecular I (d = distancia internuclear entre los tomos de N y de O).
B=

h
8 Ic
2

mN mO 2
3, 414
( cm1 ); I = d 2 =
d
2
mN + mO

b) Alternativas de procedimiento para casos ms complicados.


Una alternativa til en muchos casos, cuando hay suficientes datos en la
tabla, es la de estudiar separadamente conjuntos de datos, por ejemplo los
datos pares por un lado y los datos impares por el otro. Cuando se sabe con
certeza que la funcin es polinmica, si en uno de los dos casos aparece
constancia de signo en las diferencias de algn orden (no cercano en valor al

187

CLCULO NUMRICO Y ESTADSTICA APLICADA

del nmero de puntos de la tabla, por seguridad de identificacin), ese valor


y en ese mismo orden debe ser el que debera mostrar la otra secuencia de
datos, ya que el polinomio de ajuste es nico. En este caso se puede ya
determinar el polinomio que ajusta toda la tabla. Utilizando el valor obtenido de diferencias constantes y dando marcha atrs en los clculos en la
sub-tabla con errores pueden corregirse los errores. Si estos errores fueran
muchos y no se pudiera garantizar ninguno de los valores de entrada como
exacto para poder hacer la operacin descrita, entonces el problema se
reduce a utilizar el polinomio anterior que ajusta la otra sub-tabla libre de
errores e interpolar en l los valores de la tabla errnea.
Otra alternativa es la comparacin del patrn de signos en la tabla de
diferencias (la global o las parciales recin descritas) con patrones modelo, y
a partir de ah proceder a la identificacin y correccin de valores errneos.
Por ejemplo, dividiendo los datos del problema en pares e impares la tabla
de impares es
Tabla (b). Problema 3.5
J

EJ

3,414

DEJ = EJ+1 EJ

D2EJ

D3EJ

D4EJ

17,070
3

20,484

13,656
30,726

51,210

1
12,656

43,382
7

94,592

+4
+3

15,656
59,038

153,630

Como patrones de propagacin de errores, considerando slo un dato


errneo, pueden proponerse tantos como entradas y con posibilidad doble,
segn que el error sea por exceso e > 0 o por defecto e < 0. Dos posibles
patrones son los que se muestran abajo, el primero con error e > 0 en el dato
de entrada J = 1, y el segundo con error e > 0 en el dato J = 7. El resto de los
patrones se dejan al lector para su confeccin.

188

APLICACIONES NUMRICAS BSICAS

Tabla (c). Problema 3.5


J

error

D2

D3

D4

e
3

e
e

0
5

0
0

e
0

0
0

Tabla (d). Problema 3.5


J

error

D2

D3

D4

0
3

0
0

e
3e

e
7

4e

e
2e

e
e

La comparacin con la propagacin de error en la tabla real de datos


impares indica que el error est en el dato J = 7 con un patrn de signos
opuesto al de la Tabla (d), y que el resto de los datos son correctos. Ahora
hay que proceder por tanteo sabiendo que el error es por defecto. Esto quiere decir que E(J = 7) > 94,592 lo que implica que D2(J = 3) > 12,656. Como
primera hiptesis se formula que D2 = 13,656 pues el resto de los resultados
estn contaminados por el error y, adems, esto est de acuerdo con la
observacin previa. Sustituido este valor se llega a la conclusin de que
efectivamente E(J = 7) > 94,592 y la nueva tabla de datos impares es completamente consistente.

189

CLCULO NUMRICO Y ESTADSTICA APLICADA

Si ahora en la tabla parcial de los datos pares se toma tambin


D = 13,656 (lo que corrobora su primera diferencia de segundo orden) se
pueden corregir los datos errneos y resultan los valores correctos ya conocidos E(J = 6) = 71,694 y E(J = 8) = 122,904.
2

Hay que insistir en que la aparicin de una alternancia de signos en una


tabla no necesariamente implica que en sta haya errores de entrada. Se sabe
con certeza que s los hay si por argumentos tericos, como es en este caso,
la tabla tiene una funcin polinmica que la representa. Una ltima cuestin
es la de la interpolacin/extrapolacin: en este problema de rotor rgido
slo tienen sentido valores J enteros J 0. No ha lugar la interpolacin en
valores J intermedios, pues esta operacin carece de sentido fsico-qumico.
Por otra parte, ste es uno de esos casos en los que la extrapolacin a valores
J > 10 enteros puede realizarse con toda fiabilidad, una vez que se disponga
del polinomio correcto que representa la tabla. La ley que describe es completamente general y vlida para todo J 0.

Problema 3.6
a) La interpolacin en l*B = 0,15 puede efectuarse bien con interpolacin
lineal o con el polinomio de Lagrange de segundo grado. La interpolacin
lineal en el intervalo [0,116, 0,2] es sencillamente la regla de tres con partes
proporcionales y redondeando a tres decimales que son los que traen los
datos de entrada, se encuentra
Cv / R = 1, 526 +

0, 034 0, 018
= 1, 533
0, 084

(como ha venido hacindose no se utiliza el smbolo ).


La interpolacin de Lagrange de segundo grado en l*B = 0,15 viene
impuesta por el hecho de que los datos al principio de la tabla no estn
equiespaciados y se tiene
Cv / R =

190

(0,15 0, 2)(0,15 0, 3)
(0,15 0,116)(0,15 0, 3)
1, 526 +
1, 544
(0,116 0, 2)(0,116 0, 3)
(0, 2 0,116)(0, 2 0, 3)
(0,15 0,116 )(0,15 0, 2)
+
1, 566 = 1, 533
(0, 3 0,116 )(0, 3 0, 2)

APLICACIONES NUMRICAS BSICAS

Una vez redondeados a los tres decimales que se muestran los dos resultados son idnticos, lo que sugiere que la tabla representa con toda probabilidad una dependencia funcional lineal. Esto queda ms claro estudiando
la tabla de diferencias para datos l*B 0,2 en la que se aprecia constancia en
las diferencias primeras
Tabla. Problema 3.6
l*B

Cv /R

0,2

1,544

0,022
0,3

1,566
0,022

0,4

1,588
0,022

0,5

1,610
0,022

0,6

1,632
0,022

0,7

1,654

Aunque queda la incertidumbre de lo que puede ocurrir para valores


l*B < 0,2 l*B > 0,7, en el sentido de pequeas variaciones que pudieran dar
sentido a dependencias de grado superior a la unidad, todo indica que la
dependencia funcional va a ser lineal, y la desviacin en l*B = 0,116 se atribuye a efectos de redondeo en el dato. Consecuentemente, la interpolacin del
valor central en l*B = 0,45 no va a ser necesario hacerla con polinomios centrales (Stirling, Everett, etc.) y puede realizarse con un polinomio de Newton
de primer orden (o una regla de tres como antes en el intervalo [0,4, 0,5] ya
que la representacin va a ser exacta con los datos conocidos. Se tiene as
Cv /R = 1, 544 +

0, 45 0, 2
0, 022 = 1, 599
0,1

en donde se ha tomado como origen el punto en l*B = 0,2.

191

CLCULO NUMRICO Y ESTADSTICA APLICADA

b) El clculo de la variacin de entropa va a requerir alguna elaboracin


previa de la integral para expresarla en trminos de la variable l*B. Se tiene
as

Cv (T )
*
a

dT = B* = aT 1/ 2 d B* = 3/ 2 dT = B dT =
2T
T
T
T1
2T

*B ( 2 ) 2C ( * )
0 ,7 C ( * )
Cv( B* )

v
B
v
B
*
*
*
d B = 2
d B = f ( B ) =

= 2
*B (1)
0 ,116

B*
B*
B*

S =

T2

0 ,7
0 ,116

f ( B* ) d B*

Hay que realizar una tabulacin de la nueva funcin a integrar f(l*B) y la


integracin puede plantearse con la regla del trapecio dividindola en dos
partes: [0,116, 0,2] y [0,2, 0,7]. Numerando desde 0,116 con ndices k = 0 6
se encuentran entonces

0 ,2

0 ,116

f ( B* ) d B* = R

0, 2 0,116
[ f0 + f1 ] = 0, 87676 R;
2

f0 = f ( B* = 0,116 ), f1 = f ( B* = 0, 2)

0 ,7

0 ,2

f ( B* ) d B* = R

0,1
[ f + 2 f2 + 2 f3 + 2 f4 + 2 f5 + f6 ] = 2, 01714 R
2 1

y el resultado final es redondeando a tres decimales


DS = 5,788 R
resultado que indica una disminucin de entropa consistente con el hecho
de que se pasa de l*B = 0,116 l*B = 0,7, es decir de un estado con temperatura ms alta y ms desordenado (mayor S) a otro estado con temperatura
menor y que est por tanto ms ordenado (menor S). Otras opciones de integracin se dejan como ejercicio para el lector.

Problema 3.7
Los datos equiespaciados con h1 = 45 s se renumeran como
t2 = 135, t1 = 180, t0 = 225, t1 = 270, t2 = 315

192

APLICACIONES NUMRICAS BSICAS

La primera estimacin de la derivada pedida viene dada por los puntos


contiguos
c c
dc
41, 709 31, 740
= 0,110767%/s
c1(t0 = 225) = 1 1 =
2 45
2 h1
dt 0
Para mejorar esta estimacin se utiliza la extrapolacin de Richardson.
Hay que calcular primero la estimacin con el espaciado doble h2 = 90 s, con
lo que h1 = ah2 a = 0,5.
c c
dc
45, 670 25, 505
= 0,112028%/ s
c2 ( t0 = 225) = 2 2 =
2 90
dt
2
h
0
2
Combinando ambos resultados en el algoritmo de Richardson
c 2 c2 0,110767 0, 52 0,112028
dc
= 0,110346%/s
c (t0 = 225) = 1
=
dt 0
1 0, 52
1 2
Este resultado se compara muy bien con el exacto redondeado a seis
decimales 0,110341, la discrepancia es de unas 5 partes en 106 (5 ppm) frente a unas 420 partes en 106 (420 ppm) que da la derivada tomada con el espaciado ms pequeo. Ntese que se han mantenido 6 decimales en los resultados a efectos de comparacin de las potencias relativas de las tcnicas de
derivacin.

Problema 3.8.
Hay que notar que la tabla est igualmente espaciada y que el clculo de
las derivadas dU/dR y d2U/dR2 puede hacerse con respecto a la variable auxiliar x = R R0 = R 0,9168. As se tienen
dU dU
=
;
dR dx

d 2U
dR2

d 2U
dx2

Conviene dar ndices de orden a los puntos de entrada

193

CLCULO NUMRICO Y ESTADSTICA APLICADA

Tabla. Problema 3.8


i

R()

0,8768

0,8868

0,8968

0,9068

0,9168

U(cm1)

425,404907

233,968368

101,681613

24,859130

0,9268

0,9368

0,9468

0,9568

23,779348

93,040164

204,785500

356,171012

R()
1

U(cm )

a) Con el espaciado h1 = 0,01 se estiman las fuerzas en todos los puntos


salvo en los extremos utilizando la frmula
F1( i )

Ui+1 Ui1
; 3 i3
2 h1

Anlogamente para el espaciado ms grande h2 = 0,02 y, por tanto con


menos evaluaciones posibles, se calculan
F2( i )

Ui+ 2 Ui 2
; 2 i 2
2 h2

Con estos datos, y teniendo en cuenta que h1 = a h2 a = 0,5, los valores


finales de las fuerzas se estiman con
F

(i )

F1( i ) 2 F2( i )
1 2

; 2 i2

Los resultados en unidades de cm1/ se resumen en la tabla siguiente


Tabla (a). Problema 3.8

194

F1(h1 = 0,01)

F2(h2 = 0,02)

F Richardson

16186,164657

10455,461913

10635,122665

10395,574996

5084,080673

5254,725504

5027,199063

53,989094

216,036239

0,026620

+1

4652,008195

4498,159255

4703,291176

+2

9050,307604

8904,275307

9098,985036

+3

13156,542419

APLICACIONES NUMRICAS BSICAS

Se observa en esta tabla cmo las fuerzas intramoleculares son positivas


cuando los tomos se acercan por debajo de la distancia de equilibrio, y
negativas cuando se alejan por encima de la distancia de equilibrio. El valor
exacto de la fuerza en x = 0, la distancia de equilibrio, debe ser F(0) = 0, y puede comprobarse como con slo una aplicacin de la extrapolacin de
Richardson ya se obtiene una mejora apreciable en la estimacin sobre las
obtenidas con los espaciados utilizados, que estn bastante alejadas del
valor esperado. El proceso puede continuarse para mejorar an ms la calidad del clculo de F(0), pero no se va a considerar aqu.
b) Con los resultados anteriores de F la tabla de segundas derivadas de U
para 1 i 1 puede construirse de manera similar utilizando h1 = 0,01 y
h2 = 0,02. Se tienen as las ecuaciones (a = 0,5) siguientes
d 2U d 2U
dF
dF
=
=
=
2
2
dR
dx
dR
dx
(i )

d1( i)

d 2U
F ( i+1) F ( i1)

=
; 1 i 1

2 h1
dR2 h
1

(i )

d2( i)

d 2U
F ( i+ 2 ) F ( i 2 )

=
; i=0

2 h2
dR2 h
2

Tabla (b). Problema 3.8


d1 = (d2U/dR2)h

dU/dR = F

10395,574996

5027,199063

519780,080831

0,026620

486524,511913

+1

4703,291176

454947,920782

+2

9098,985036

d2 = (d2U/dR2)h

487364,000807

que para el valor i = 0 llevan a


d 2U
k0 =

dR2

(0)

d1( 0 ) 2 d2( 0 )
1

= 486244, 682282 cm 1/ 2

195

CLCULO NUMRICO Y ESTADSTICA APLICADA

Transformando este resultado se obtiene el valor redondeado con cuatro


cifras significativas
k0 = 9, 659 10 3 dinas/ = 9, 659 10 8 Newtons/ = 9, 659 10 +2 Newtons/m
Hay que notar que las estimaciones de la segunda derivada podran
haberse obtenido tambin por extensin del mtodo de Richardson utilizando directamente
y( x0 + h) 2 y( x0 ) + y( x0 h)

y( x0 )

h2

variando el espaciado h y utilizando la expresin general del algoritmo, en el


que ahora en la expresin (3.4.16) del texto hay que tomar D = y. Esto se
deja como ejercicio al lector.
Problema 3.9
Van a darse tres vas de solucin a este clculo: a) Utilizando la expresin
original se realizar integracin Gauss-Legendre; b) a travs de una integracin intermedia se simplificar la integracin numrica y se realizar con b1)
Gauss-Legendre y b2) trapecios. La integral no tiene singularidad en u = 0.
a) Hay que transformar primero el intervalo [0, uD]u [1, +1]v, lo que
se logra con el cambio de variable u v
v +1=

u
u
2
(u 0 ) u = D ( v + 1) du = D dv
uD
2
2

Con ello la integral para este caso a) se reformula como


Cv (a ) =
9R 2
A
23

9R
uD3
+1

uD

u4 exp(u)

( exp(u) 1))

u
du = A = D =
2

(1 + v)4
dv =
exp ( A + Av + exp ( ( A + Av) 2

9 R

(1 + v)4
2
3 A
f ( v) =
+

2
+
exp
A
Av
exp
(
A
Av
)
2
(
(

c f (v )
P
i

P
i

i =1

Los resultados se resumen en la tabla que se da ms adelante.

196

APLICACIONES NUMRICAS BSICAS

b) La integracin analtica intermedia implica una integracin por


partes

Cv =

9R
uD3

uD

u exp(u)

( exp(u) 1))

u% = u4

exp(u) du
du = %
dv =

( exp(u) 1)

uD4
9R
36 R
+ 3
3
uD (1 exp(uD )
uD

du% = 4u3 du

1
=
v% =
1 exp( u)

u3
du
exp
p(u) 1

uD

Para la integracin Gauss-Legendre hay que cambiar la variable de manera similar a lo hecho arriba. La expresin final resultante para el clculo
b1) es
Cv ( b1) =

uD4
9R
36 R
+ 3
3
uD (1 exp( uD )
uD

9 RuD
36 R
+ 3
1 exp(uD ) uD
9 RuD
9 RuD
+
1 exp(uD )
4

+1

uD

uD

u3
du =
exp( u) 1

u3
du =
exp( u) 1

(1 + v)3
dv =
uD

exp
( v + 1) 1

9 RuD
9 RuD
+
1 exp(uD )
4

c f%( v )
P
i

P
i

i =1

Para la integracin b2) la expresin a utilizar es


Cv ( b2) =

9 RuD
36 R
+ 3
1 exp(uD ) uD

uD

u3
du
exp( u) 1

y se aplicar la regla del trapecio a la integral indicada.

197

CLCULO NUMRICO Y ESTADSTICA APLICADA

Los resultados se resumen en la tabla siguiente


Tabla. Problema 3.9.
Gauss-Legendre

Trapecios

Cv(a) J/(mol K)

Cv(b1) J/(mol K)

1,04219 10 8

1,64390 10 9

1000

1,13528 10 3

1,04903 10 3

5,03507 10 4

3000

1,12834 10 3

2,16127 10 3

2,09634 10 3

5000

1,12695 10 3

1,01447 10 3

1,46841 10 3

10000

1,12591 10 3

10

8,56580 10 4

9,53740 10 4

20000

1,12539 10 3

12

1,12290 10 3

1,00627 10 3

100000

1,12498 10 3

14

1,16693 10 3

1,11645 10 3

10000000

1,12487 10 3

Cv(b2) J/(mol K)

Se observa la lenta convergencia del mtodo de los trapecios (clculos


realizados en computador), que, sin embargo, se sabe que va a converger al
resultado exacto, y las buenas aproximaciones que se pueden obtener con las
integraciones Gaussianas utilizando comparativamente muy pocos puntos.
Tambin se observa como un poco de trabajo analtico, realizando integracin por partes, puede ayudar a acelerar la precisin del clculo final.
Problema 3.10
La integral
I=

1 cos x

x5/ 2

dx

presenta singularidad en x = 0 pues aplicando el desarrollo de Taylor del


coseno en torno a x = 0 (siempre convergente para cualquier valor de x)
1 cos x =

x2 x4 x6 x8

+
+ ... ; ` < x < +`
2! 4 ! 6 ! 8!

se tiene
lim+

x 0

198

1 cos x
x2
lim

=`
5/ 2
x 0+ 2 ! x
x5 / 2

APLICACIONES NUMRICAS BSICAS

y la integral se expresa
I=

x2 x4 x6 x8

x5/ 2

+ ... dx =

2 ! 4 ! 6 ! 8!

x1/ 2 x3 / 2 x7 / 2 x11/ 2

2 ! 4 ! + 6 ! 8 ! + ... dx

Ahora hay que notar algunos detalles.


i) El primero es que la serie a integrar puede escribirse en la forma
1 x2 x4 x6 x8

x1/ 2 x3 / 2 x7/ 2 x11/ 2 x15/ 2 x19/ 2


x1/ 2
...

+ ... =
x 3/ 2 +
+
2!
4!
6!
8!
10 ! 12!
2!
4 ! 6 ! 8! 10 ! 12!

ii) El segundo es que, aunque el primer trmino presenta singularidad en


x = 0, se puede integrar analticamente dando como resultado p1/2.
iii) Y el tercero es que la serie entre corchetes, para poderla integrar trmino a trmino en el intervalo marcado, debe ser uniformemente convergente (existe continuidad de esa funcin en el intervalo). Esto lo cumple, ya
que se puede encontrar una serie numrica convergente mayorante (en
valor absoluto) de la serie de potencias. Este es el criterio M de Weierstrass y
en este caso tal serie es

2( n1)
x2( n1)

; n = 1, 2, 3,...; 0 x
(2 n + 2)! (2 n + 2)!
La integracin puede por tanto hacerse trmino a trmino y lleva a

1 2 5 /2 1 2 9 /2 1 2 13 / 2
I = x1/ 2
x +
x
x
+ ...
4! 5
6! 9
8 ! 13

0
El resultado con dos decimales exactos, sin redondear, es I 1,52. El
valor numrico obtenido con cuatro trminos, y redondeado a cuatro decimales es I 1,5277, y una estimacin razonable del error puede obtenerse
con el valor del quinto trmino que se ha despreciado en el clculo anterior
y que es 5,45245 104 5,5 104. Ntese que la integracin pedida es una
operacin exacta y el nmero de cifras a dar para I en el resultado depender
de los fines a los que este se destine. Si I va a ser utilizado en una pequea
cadena de clculos con resultado final de precisin prefijada, entonces pueden estimarse cuantas cifras de I van a ser necesarias para lograr tal precisin. Si I va a ser reutilizado en una larga cadena de clculos sucesivos,

199

CLCULO NUMRICO Y ESTADSTICA APLICADA

entonces habr que conservar todas las cifras decimales posibles, lo que no
es un problema en clculos con computador. Si I es el final del clculo, la
precisin la da la aplicacin de la que forma parte; as, si bastaran cuatro
decimales la solucin con los datos presentados se escribira, utilizando
una cota razonable de error, como
I 1,5277 (0,0005)

200

CAPTULO 4
RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

4.1. Conceptos preliminares


A. Ecuaciones no lineales
4.2. Separacin de races reales y estimacin del error
4.3. Mtodo de biseccin
4.4. Metodo de la falsa posicin (regula falsi)
4.5. Mtodo de Newton-Raphson
4.6. Mtodo iterativo de punto fijo
4.7. El caso de las races mltiples
B. Sistemas de ecuaciones
4.8. Sistema lineal (no homogneo)
4.9. Sistema no lineal
Bibliografa
Problemas tericos y numricos
Se presentan los fundamentos de la resolucin numrica de ecuaciones no
lineales y de los sistemas de ecuaciones (lineales no homogneos y no lineales).
Estos son problemas que normalmente se asocian con la determinacin de las energias de orbitales moleculares o de las frecuencias de las vibraciones moleculares,
pero tambin aparecen en otros contextos como son los de la minimizacin (u
optimizacin) de funciones en general, y una buena cantidad de problemas particulares conexos (la determinacin del punto crtico, momentos principales inercia
moleculares, etc.). Se analiza primero cmo separar las races en intervalos, para
luego aplicar con garantas mtodos iterativos que conduzcan a las correspondientes
soluciones. Se estudia el clculo de races simples aplicando los mtodos de: biseccin, la regula falsi, Newton, y la iteracin de punto fijo. El siguiente asunto es el
tratamiento de las races mltiples asociadas con la degeneracin en los problemas
de diagonalizacin, tema que se considerar en detalle ms adelante (Cap. 9). Se
concluye con el estudio de los sistemas de ecuaciones considerando el caso de
ecuaciones lineales (mtodo de Gauss con seleccin de pivotes para controlar los
errores numricos) y el caso de ecuaciones no lineales en dos variables (mtodos de
Newton y del gradiente).

201

CLCULO NUMRICO Y ESTADSTICA APLICADA

Ecuaciones no lineales

Sistemas

Races simples

Races mltiples

Lineal (no homog.)

No lineal

Separacin
Biseccin
Regula-falsi
Newton-Raphson
Newton-Secante
Punto fijo

Identificacin
Algoritmos
modificados

Gauss (con pivote)

Newton-Raphson
Gradientes

Caps. 7, 9, 10

4.1. Conceptos preliminares


En este captulo van a abordarse los problemas numricos asociados
con la resolucin de ecuaciones no lineales, sistemas de ecuaciones lineales
y sistemas de ecuaciones no lineales. Estos temas presentan puntos de contacto con la denominada diagonalizacin de matrices y con los problemas
generales de minimizacin (optimizacin) de funciones en una o en varias
variables. Todos ellos resultan centrales en muchas aplicaciones de las Mecnica y Qumica Cunticas para el estudio de tomos y molculas, por ejemplo en el clculo de energas y orbitales moleculares, en el de los momentos
de inercia que definen los estados rotacionales y son parte de la interpretacin de los espectros de microondas, etc. Estas aplicaciones van a desarrollarse aqu con valores reales, omitiendo las cuestiones relacionadas con la
aritmtica compleja.
El teorema que permite disear estrategias bsicas de clculo para determinar las races reales de una ecuacin no lineal, como x3 = a sen x, x3 x2 = 1, es
el teorema de Bolzano. Para una funcin real de variable real f(x), continua
en un intervalo cerrado [a, b] y con f(a)f(b) < 0, es decir que cambia de signo
en el intervalo, est garantizada la existencia al menos de un punto (raz) x,
a < x < b, en el que f(x) = 0. Si, adems, existe la derivada y = f(x) en a < x <
b y sta mantiene signo constante en tal intervalo, entonces la raz (tambin
llamada cero) x de la funcin es nica. Todo ello indica la posibilidad de aco-

202

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

tar (o separar) las races reales de f(x) = 0 en diferentes intervalos en los que
f(x) sea continua. La casustica es, sin embargo, bastante ms complicada de
lo que pudiera parecer a primera vista: las ecuaciones pueden estar mal
condicionadas (anmalas), pueden aparecer races complejas, pueden aparecer races mltiples, etc. De manera que antes de entrar en el estudio de
estas cuestiones es conveniente hacer una serie de observaciones e introducir la nomenclatura habitual.

Races (ceros) de ecuaciones no lineales


i) Las ecuaciones no lineales del tipo trascendente contienen funciones
que pueden desarrollarse en serie infinita y pudieran tener infinitas soluciones (por ejemplo, x = tan x). Normalmente, por razones de tipo fsico-qumico, el inters pudiera estar centrado slo en algunas de ellas y sera preciso hacer el correspondiente anlisis para identificarlas.
ii) Para ecuaciones no lineales de tipo polinmico con coeficientes ci
reales, p(n)(x) = c0 + c1x + c2x2 + ... + cnxn = 0, el grado n del polinomio indica
el nmero total de races (teorema fundamental del lgebra). Ahora bien,
estas races pueden ser: a) todas reales; b) todas complejas; y c) reales y complejas. En este sentido, si hay races complejas, stas aparecen como pares

conjugados, z = a bi (i = 1) lo que indica que en el caso b), todas complejas, debe suceder que n = 2m, es decir el grado debe ser par. El inters se
centrar en este curso en el caso de races todas reales. Hay que sealar tambin que, al igual que las ecuaciones cuadrticas, las ecuaciones polinmicas
cbicas y curticas pueden resolverse por radicales, pero este tipo de solucin
no es posible para la funcin polinmica general p(n)(x) = c0 + c1x + c2x2 + ... +
cnxn = 0 de grado n 5 (se excluyen los casos particulares como p(n)(x) = c0 +
cnxn = 0 por ejemplo, en los que evidentemente la solucin por radicales
pudiera resultar posible).
iii) En las ecuaciones polinmicas anteriores un punto especialmente
importante es el de la multiplicidad de una raz xR. Una raz es simple (multiplicidad j = 1) si aparece como un factor (x xR) en la descomposicin factorial del polinomio p(n)(x) = (x xR)p(n1)(x). Una raz con multiplicidad j 1
aparece como p(n)(x) = (x xR)jp(nj)(x). As en la ecuacin p(4)(x) = (x + 1)(x
7)3 = 0, la raz xR = 1 tiene multiplicidad j = 1 y la raz xR = 7 tiene multiplicidad j = 3. La existencia de races mltiples en problemas atmico-molecu-

203

CLCULO NUMRICO Y ESTADSTICA APLICADA

lares est asociada con los fenmenos de degeneracin de estados, siendo la


identificacin de esta circunstancia un asunto fundamental.
iv) Las soluciones de las ecuaciones no lineales se obtienen numricamente de forma iterativa. As, partiendo de un valor inicial adecuado xR(0) se
generar mediante un mtodo de bsqueda (biseccin, Newton-Raphson,
etc.) una sucesin de aproximaciones sucesivas xR(1), xR(2), ..., xR(m), hasta alcanzar convergencia en el resultado, es decir hasta alcanzar un cierto nmero de
cifras significativas que van a permanecer invariables en el proceso al
aumentar m. Alcanzada la precisin fijada el ltimo valor se identificar
como la raz buscada xR1. El mtodo utilizado, complementado con la informacin que pudiera extraerse de la derivada f(x), puede aplicarse de nuevo
para determinar el resto de las races de la ecuacin xR2, xR3, ... En el caso de
que la funcin sea un polinomio, una vez encontrada una raz xR con multiplicidad j, lo anterior puede aplicarse a la ecuacin cociente p(n)(x)/(x xR)j =
0, operacin que se denomina deflacin (o supresin), y as sucesivamente
para localizar el resto de las races reales. Aqu habra que estar precavido del
posible efecto negativo que los errores de redondeo pudieran tener sobre la
deflacin y el consiguiente deterioro en la estimacin de las races.
v) Es muy importante indicar que la eleccin de una buena aproximacin inicial xR(0) debe hacerse cuidadosamente al objeto de poder garantizar la
convergencia significativa del proceso, ya que ste pudiera bien ser divergente, bien conducir a una raz diferente de la realmente significativa para el
problema buscada en ese intento. Esto, ms la nota anterior sobre los redondeos, trae a colacin dos problemas: a) el estudio de la convergencia de los
clculos y el error cometido con la estimacin encontrada; y b) la eficiencia
o rapidez del mtodo seleccionado. Ambos son asuntos muy complejos y su
tratamiento detallado desborda los lmites de este curso de introduccin, por
lo que se darn slo algunas ideas bsicas.
vi) En cuanto a la convergencia, una vez acotados los intervalos en los
que se encuentran las races, cada mtodo a aplicar presenta sus propias
particularidades relativas a su velocidad y a la eleccin de xR(0). A veces puede
resultar conveniente iniciar el clculo con un mtodo y completarlo con otro
ms rpido que ahorre iteraciones. Por lo que respecta al asunto del error,
una medida til en la prctica cuando hay convergencia est relacionada con
el valor absoluto de la diferencia entre dos valores sucesivos xR(n+1) xR(n), a la
que se exige normalmente que sea menor que una cierta cota de tolerancia e.

204

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

Esta condicin, xR(n+1) xR(n) < e, una vez alcanzada da un conjunto de cifras
estables en la solucin identificndose entonces la raz con xR= xR(n+1). De nuevo hay que insistir en el papel negativo de los errores de redondeo sobre el
proceso iterativo: truncar de forma poco cuidadosa los decimales de xR(m) para
obtener xR(m+1) es una muy mala prctica.
Por otra parte, siempre puede existir el caso de una ecuacin no lineal
anmala, o mal condicionada, en la que incluso los inevitables redondeos,
debidos a la precisin interna propia de la mquina de clculo, pueden llegar
a destruir la verdadera naturaleza de las races calculadas. Esto sucede en
determinadas ecuaciones polinmicas de grado elevado, en las que las estimaciones para races que se sabe son reales pueden aparecer en el clculo
como nmeros complejos. Para combatir estos efectos hay que ampliar la
precisin (programacin en computador con doble precisin, cudruple precisin, etc.) y utilizar recursos de clculo ms potentes.

Sistemas de ecuaciones y diagonalizacin


Por lo que respecta a los sistemas de ecuaciones hay que distinguir entre
los no lineales y los lineales. A su vez para los lineales en el caso compatible
hay que diferenciar los sistemas homogneos y los no homogneos.
vii) La resolucin de sistemas no lineales puede llevarse a cabo generalizando alguno de los mtodos para ecuaciones no lineales (Newton-Raphson,
por ejemplo) o proponiendo nuevas alternativas como son las minimizaciones por gradientes. Aqu la seleccin del punto de partida de los clculos iterativos es en muchos casos crucial para obtener la solucin significativa
para el problema. En el caso de una ecuacin no lineal en una variable la
bsqueda de la raz se realiza en un espacio de dimensin unidad (la recta
real), pero en sistemas de ecuaciones la dimensin del espacio de bsqueda,
igual al nmero de variables, aumenta pudiendo presentarse ms de una
regin compatible en principio con las condiciones del problema y es fundamental saber si la solucin obtenida es la significativa para el problema
fsico-qumico estudiado.
viii) La resolucin de sistemas lineales presenta tambin algunas particularidades dignas de consideracin. Para sistemas compatibles determinados
(no homogneos) la solucin basada en el clculo de determinantes (la

205

CLCULO NUMRICO Y ESTADSTICA APLICADA

conocida regla de Cramer), a pesar de su elegancia formal, no resulta adecuada desde el punto de vista de la eficiencia pues requiere muchas ms operaciones de las que hay que realizar con otros mtodos menos costosos
(Gauss con seleccin de pivotes, por ejemplo).
ix) Los sistemas lineales homogneos compatibles (con soluciones diferentes de la trivial) estn directamente relacionados con los problemas de
valores y vectores propios de una matriz (diagonalizacin). Este es un tema
que posee una importancia capital en muchas cuestiones de inters fsicoqumico (estructura atmico-molecular, espectroscopia, etc.) y est estrechamente emparentado con el de los valores y funciones propias de una
ecuacin diferencial (Cap. 9).

A. ECUACIONES NO LINEALES
4.2. Separacin de races reales y estimacin del error
Esta es la primera operacin a realizar para poder hacer una bsqueda
ordenada de las soluciones. Las ideas esenciales van a presentarse analizando un caso de ejemplo. Sea la ecuacin polinmica
p(3)(x) = x3 6x2 + 3x + 10 = 0
que tiene tres races. En principio, si las tres son reales, hay que determinar
tres intervalos a < x < b en los que la funcin cambie de signo f(a)f(b) < 0.
Hay que tantear dando valores a x y observar el signo de p(3)(x) y una posible
tabla que rene esta informacin es la siguiente
x
sgn p(3)(x)

6 3

(4.2.1)

Los cambios de signo indican que las races deben estar en 3 < x1 < 0, 0
< x2 < 3, y 3 < x3 < 6. Quedan descartadas as las dos posibles races complejas que pudiera tener un polinomio de tercer grado y, adems, queda claro
que las tres races son simples. La tabla anterior puede afinarse analizando la
primera derivada dp(3)(x)/dx = 3x2 12x + 3, ya que es continua y tiene sus

ceros localizados en x = 2 3. Estos ltimos valores marcan posiciones de


mximo y mnimo de p(3)(x) los cuales junto con los signos en (4.2.1) producen

206

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

x
sgn p(3)(x)

2 3

2 + 3

(4.2.2)

Los cambios de signo estn ahora definidos con mayor precisin y las ra

ces estn en 3 < x1 < 0, 2 3 < x2 < 3, y 2 + 3 < x2 < 6, en los que hay que
notar la constancia de signo de la derivada dentro de cada subintervalo
(raz nica). Todo esto puede verse grficamente en la Fig. 4T.1.

Figura 4T.1. Ceros xR de una funcin polinmica f(x) y representaciones grficas de esta funcin y de
sus dos primeras derivadas.

Este es un ejercicio muy simple que sirve para ilustrar la manera general
de proceder. No obstante, se pueden anticipar las soluciones sin mucho
esfuerzo, ya que al ser entero el trmino independiente (+10) las posibles races reales enteras pueden buscarse entre sus divisores enteros, y en este caso
tan favorable resultan ser xR1 = 1, xR2 = 2, y xR3 = 5. Tambin hay que sealar que existen sistemticas mucho ms poderosas para separar las races de
una ecuacin no lineal, como son las sucesiones de Sturm, pero no se van a
tratar aqu. Por otra parte, si hay posibilidad de realizar con computacin
una tabulacin extensa de la funcin, con bsqueda automtica de cambios
de signo y de situaciones especiales, como por ejemplo las de tangencia de la
funcin con el eje x (races de multiplicidad par), la tarea queda muy bien
preparada para la bsqueda precisa final con cualquiera de los mtodos que
se discutirn despus. Igualmente, ayudarse de un sencillo grfico de la
funcin cuando es posible realizarlo, tambin sirve al mismo propsito.

207

CLCULO NUMRICO Y ESTADSTICA APLICADA

Una cota general del error cometido al aproximar una raz de una
ecuacin no lineal f(x) = 0 puede darse siempre que la primera derivada
exista y est acotada inferiormente en valor absoluto dentro del intervalo
de separacin
` > f ( x) d1 > 0 ; a x b

(4.2.3)

Por el teorema del valor medio puede escribirse para la raz xR y su aproximacin xR(n), ambas en a < x < b, la relacin

) (

) (

f ( xR f xR( n) = xR xR( n ) f ( ;

xR < < xR( n ) xR( n ) < < xR

(4.2.4)

Como f(xR) = 0, se tiene entonces para el error la acotacin


xR

xR( n )

( )

f xR( n )
f (

( )

f xR( n )

(4.2.5)

d1

En la presentacin que sigue sobre los mtodos de clculo de races xR se


considerar primero la determinacin de races simples y se completar
despus con el estudio de races mltiples.

4.3. Mtodo de biseccin


Este es un mtodo conceptualmente simple, pero muy robusto, para
localizar una raz real de f(x) = 0 separada en un intervalo a0 = a < x < b = b0.
Consiste en explotar la propiedad del cambio de signo de f(x) en sucesivas
subdivisiones del intervalo original [a0, b0]. As, el primer paso consiste en
dividir en dos partes iguales este intervalo, obteniendo [a0, (a0 + b0)/2] y
[(a0 + b0)/2, b0]. Entonces, si f((a0 + b0)/2) = 0, la raz es xR = (a0 + b0)/2 y se ha
resuelto el problema. Si como es de esperar f((a0 + b0)/2) 0 se localiza el
subintervalo en el que f(x) cambia de signo, sea para concretar el primero [a0,
(a0 + b0)/2] = [a1, b1], f(a1)f(b1) < 0, y se repite el proceso de subdivisin a partir de l. Se obtienen as [a1, (a1 + b1)/2] y [(a1 + b1)/2, b1] repitindose el proceso anterior, y as sucesivamente. De esta manera, y en el supuesto general
de no localizacin de la raz en un punto intermedio de subdivisin, se va
construyendo la siguiente sucesin de intervalos cerrados encajados ( =
inclusin)

208

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

a0 , b0 ' a1 , b1 ' a2 , b2 ' ... ' an , bn ' ... ; f ( aj ) f (bj ) < 0 , j = 0,1, 2, 3... (4.3.1)
que van a tener un punto comn en el lmite n  (Bolzano-Weierstrass) y
que va a ser justamente la raz buscada. La comprobacin de este resultado
es sencilla: se han generado dos sucesiones de nmeros reales {an} y {bn}, la
primera montona creciente aj aj+1 y acotada superiormente, y la segunda
montona decreciente bj bj+1 y acotada inferiormente. Ambas poseen por
tanto lmite cuando n , {an} a y {bn} b, siendo a = b ya que
bn an =

1
( b a) lim bn an = = 0 =
n `
2n

(4.3.2)

Como f(x) es continua en [a, b] es inmediato establecer

)(

lim f ( an ) f ( bn ) = f lim an . f lim bn = f ( ) 0 f ( ) = 0 xR =


n `
n `
n `

(4.3.3)

Normalmente el mtodo de biseccin es un mtodo de convergencia lenta a la raz xR, pero tal convergencia est garantizada (robustez del mtodo).
Es simple de aplicar y de programar en un computador y una estimacin del
error cometido al dar la raz xR en un nmero finito de pasos mediante xR(n)
viene dada por la longitud del intervalo en el que se encuentra
0 xR xR( n ) <

1
( b a)
2n

(4.3.4)

pudindose dar la raz como xR an xR bn. Una mejor aproximacin a la


raz es la dada por el punto medio xR (an + bn)/2 del intervalo n, que presenta un error mximo igual a la mitad de la longitud de tal intervalo (la
mitad de (4.3.4)).
EJERCICIO 4.3.1
Se sabe que la funcin de distribucin radial del estado 2s del tomo de
hidrgeno es
2

r
r
( r ) = Cr 1
exp ;

2 a0
a0
2

C, a0 = constantes

209

CLCULO NUMRICO Y ESTADSTICA APLICADA

y que tiene un nico mximo (de probabilidad) dentro del intervalo 4 r/a0 6.
Realizar cinco iteraciones con el mtodo de biseccin para estimar la posicin
de este mximo.
Por comodidad se define la variable adimensional r* = r/a0 (a0 = radio de
la primera rbita de Bohr). La derivada de F(r) es

d
r 4
= C exp[ r ] 2r 4 r 2 + 2r 3

dr
4

y de su igualacin a cero se tiene ecuacin auxiliar relativa al problema del


mximo
f(r*) = r*3 8r*2 + 16r* 8 = 0
con la que se puede realizar la discusin de este ejercicio.
Se divide el intervalo de bsqueda [4,6], en el que efectivamente hay
cambio de signo de la funcin, f(r* = 4) < 0 y f(r* = 6) > 0, en dos partes iguales [4,5] y [5,6]. De ellas es en la segunda [5,6] en la que se verifica el cambio
de signo, f(r* = 5) f(r* = 6) < 0, por lo que se divide en dos [5, 5,5] y [5,5 ,6]
para continuar la bsqueda, y as sucesivamente. El algoritmo construye la
cadena de intervalos encajados, cada uno dentro del anterior, siguiente
[4(), 6(+)] [5,(), 6(+)] [5(), 5,5(+)] [5(), 5,25(+)]
[5,125(), 5,25(+)] [5,1875(), 5,25(+)] ...
en donde se han indicado los signos de la funcin en cada extremo. A cinco
pasos la estimacin de la raz puede ponerse como el punto medio del quinto intervalo r* 5,21875, y su error vendr dado por la mitad de la longitud
del ltimo intervalo fijado en el que se encuentra e = 0,03125. El resultado
exacto, redondeado a 6 decimales, es r* = 5,236068 y puede comprobarse
como efectivamente el mtodo de biseccin es de convergencia lenta: a cinco pasos produce slo la primera cifra decimal exacta.

4.4. Mtodo de la falsa posicin (regula falsi)


Se trata de un mtodo sencillo de aplicar y que siempre converge para
cualquier funcin f(x) continua al buscar una raz real xR de f(x) = 0 adecuadamente separada en un intervalo [a, b]. El proceso comienza constru-

210

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

yendo la secante a f(x) que pasa por (a, f(a)) y (b, f(b)), determinndose
seguidamente el corte de esta secante con el eje x y obtenindose as una
primera aproximacin a la raz xR(1). Es fcil ver que esto es un proceso de
interpolacin inversa, el valor x que hace y = f(x) = 0, y puede continuarse
sin ms que aplicar la propiedad del cambio de signo de f(x) en los subintervalos que se van definiendo. La sistematizacin no es complicada. Partiendo del intervalo de separacin inicial [a0, b0] y una vez determinada xR(1)
como
x(R1) =

f ( b0 )
f ( a0 )
a0 +
b
f ( b0 ) f ( a0 )
f ( a0 ) f ( b0 ) 0

(4.4.1)

se analiza el cambio de signo de f(x) en [a0, xR(1)] y en [xR(1), b0] y se repite la


operacin en aqul en el que esto tenga lugar. Sea, por concrecin, el segundo que se renombra como [xR(1), b0] = [a1, b1], f(a1)f(b1) < 0, y se determina xR(2)
con la nueva secante en la forma
xR( 2 ) =

f ( b1 )
f ( a1 )
a1 +
b
f ( b1 ) f ( a1 )
f ( a1 ) f ( b1 ) 1

(4.4.2)

y as sucesivamente. Se genera de esta forma una sucesin de aproximaciones que converge a la raz buscada. Es importante en este punto resaltar
algunos detalles de inters.
i) Este mtodo puede visualizarse como una generalizacin del de biseccin, con la divisin del intervalo en partes proporcionales a las ordenadas
de la funcin en los extremos en la proporcin f(an)/f(bn).
ii) Al igual que el mtodo de biseccin, la regula falsi puede no mantener
necesariamente, en principio, ningn punto fijo a lo largo del proceso, y
ambos mtodos se denominan no estacionarios.
iii) En conexin con lo anterior, si f(x) en alguno de los intervalos definidos por la regula falsi [aj, bj] mantiene el signo de su curvatura constante,
f(x) > 0 f(x) < 0, entonces este mtodo presentar en las sucesivas etapas,
j + 1, j + 2, ..., siempre fijo uno y el mismo de los extremos del intervalo j. En
este caso la regula falsi se convierte en un mtodo estacionario. Esta es la
situacin final que cabe esperar para la mayora de las funciones continuas, pues en las cercanas de xR el signo de la curvatura no debera de
cambiar. Las diferentes posibilidades que se pueden presentar se tratan de

211

CLCULO NUMRICO Y ESTADSTICA APLICADA

forma anloga y para mejor visualizar este proceso se analiza a continuacin


un ejemplo ilustrativo de este caso estacionario.
EJERCICIO 4.4.1
Alcanzado con la regula falsi, en su caso, el comportamiento estacionario en
[aj, bj] con constancia de signo en la curvatura, f(x) > 0 (concavidad hacia las
y crecientes), discutir su aplicacin para calcular la raz de f(x) = 0.
En este caso se toma como punto fijo, desde el que radiarn las secantes,
aqul en el que f(x) > 0, y sea ste bj. Las iteraciones a partir de aqu siempre
sern de la forma
xR( n +1) =

f ( xR( n ) )
f ( xR( n ) ) f (bj )

bj +

f (bj )
f ( bj ) f ( xR( n ) )

xR( n ) = x(Rn )

f ( xR( n ) )
f ( xR( n ) ) f (bj )

(x

(n )
R

bj

(4.4.3)

en donde n = j + 1, j + 2, ... La sucesin de aproximaciones {xR(n)} resultante es


montona creciente y est acotada superiormente y, por tanto, tendr lmite cuando n , {xR(n)} a. Este lmite es justamente el valor de la raz buscada, pues tomando lmites en el algoritmo (4.4.3) se encuentra

f ( )
bj f ( ) = 0 xR =
f ( ) f ( bj )

Un ejemplo grfico de esta aplicacin estacionaria puede verse en la


Fig. 4T.2 en la que se representa el clculo del Ejercicio 4.3.1.

Figura 4T.2. Aplicacin de la regula falsi con trazado de secantes para el Ejercicio 4.3.1.

212

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

El siguiente apartado a considerar es el de la estimacin del error y las


cuestiones conexas relativas a la rapidez de convergencia del mtodo.
Aunque el error en general siempre puede estimarse con la acotacin ya
dada en (4.2.5), es muy til disponer de estimaciones del error relacionadas con aproximaciones sucesivas, xR(n+1) xR(n), pues dan una indicacin
directa del nmero de cifras significativas que van asentndose como
estables en el resultado, siendo adems algo muy sencillo de evaluar. As
cuando en una aplicacin estacionaria f(x) es continua y mantiene signo
constante en el intervalo de localizacin de la raz y, adems, satisface la
doble acotacin
0 < d1 f ( x) D1 < ` ; a x b

(4.4.4)

entonces se verifica la desigualdad


xR xR( n )

D1 d1 ( n )
xR xR( n 1 )
d1

(4.4.5)

En particular, para el caso en el que se pueda tomar D1 2d1 y con el


intervalo [a, b] suficientemente pequeo, fijada una tolerancia e se tiene
xR xR( n ) x(Rn ) xR( n 1) <
Por otra parte, una relacin entre los errores de dos aproximaciones
sucesivas puede escribirse como (bj fijo)
xR xR( n ) = xR xR( n 1 ) . xR bj .

f "(n 1 )
;
f (n 1 )

xR( n 1) < n1 < bj

(4.4.6)

La demostracin de stas y de otras relaciones se proponen como ejercicios tericos de este captulo.
La regula falsi es tambin un mtodo de convergencia lenta (lineal) y, en
principio, no es siempre necesariamente ms rpido que el de biseccin,
pues esta velocidad va a depender de la forma de f(x). Existen variantes
ms eficaces que optimizan el trazado de las secantes (mtodos Illinois y
Pegasus), y tambin otras alternativas que utilizan interpolaciones cuadrticas inversas que involucran tres estimaciones sucesivas de la raz (mtodo
de Mller). Los mtodos de biseccin y de la regula falsi discutidos aqu

213

CLCULO NUMRICO Y ESTADSTICA APLICADA

pertenecen a los denominados mtodos iterativos de dos puntos, pues hacen


falta dos puntos para obtener cada estimacin.

4.5. Mtodo de Newton-Raphson


Siguiendo con la determinacin de races simples xR para la ecuacin no
lineal f(x) = 0 el mtodo de Newton-Raphson (o simplemente de Newton) es
posiblemente el ms popular y por un buen nmero de razones. Se trata de
un mtodo de iteracin de slo un punto, es decir slo es necesario conocer
una estimacin de la raz xR(n) para determinar la siguiente xR(n+1). En las condiciones adecuadas la convergencia a la raz es cuadrtica, con lo que se
dobla el nmero de cifras estables del resultado en cada nueva iteracin. Es
as mucho ms rpido que los dos mtodos anteriores. Por otra parte, el
mtodo de Newton-Raphson forma la base de algoritmos muy tiles en la
resolucin de sistemas de ecuaciones no lineales, como se ver ms adelante.

Definicin del algoritmo


En esencia el mtodo de Newton-Raphson sustituye a la secante a f(x) de
la regula falsi por la tangente a f(x) en un punto y el algoritmo es como
sigue. Separada la raz simple xR en el intervalo [a, b] en el que se mantienen
continuas f(x), f(x) y f(x), y adems f(x) y f(x) son no nulas y tienen signo
constante, el desarrollo de Taylor cerca de la raz buscada puede escribirse
como
0 = f ( xR ) = f ( xR + h0 ) + f ( xR + h0 )( h0 ) +

1
f "( xR + h0 ) h02 + ...
2

(4.5.1)

en donde el centro de desarrollo se ha tomado en xR(0) = xR + h0, y h0 puede ser


positivo o negativo. Despreciando trminos de segundo orden y superiores es
inmediato obtener una primera aproximacin a xR
xR x(R1 ) = xR(0 )

f ( xR(0 ) )
f ( xR(0 ) )

(4.5.2)

El proceso se repite con xR(1) como nuevo centro de desarrollo, xR(1) = xR +


h1, de nuevo con h1 pudiendo ser positivo o negativo, y se obtiene una nue-

214

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

va aproximacin a xR, y as sucesivamente. La expresin general del algoritmo es


xR( n +1) = xR( n )

f ( xR( n ) )
f ( xR( n ) )

; n = 0,1, 2, 3,...

(4.5.3)

Esta ecuacin es justamente el resultado de calcular el punto de interseccin de la tangente a f(x) en (xR(n), f(xR(n))) con el eje x, de manera que la
aproximacin a la raz tiene lugar a travs del trazado de tangentes sucesivas
a f(x) en los puntos de abcisas xR(n).
Cada iteracin slo necesita informacin de la anterior para seguir adelante (tcnica de un punto). Sin embargo, es crucial prestar atencin al problema de la convergencia a la raz buscada. En particular, la eleccin del
punto de partida xR(0) puede ser determinante. Ntese, por ejemplo, que la primera derivada f(xR(0)) aparece en el denominador y que valores xR(0) con tangente horizontal (f = 0) haran de este algoritmo uno intil para su propsito. Lo mismo sucede en iteraciones sucesivas con las derivadas f(xR(n)), por lo
que no slo hay que prestar atencin a la condicin exigida en el planteamiento del problema, f(xR(n)) 0, sino tambin a los casos en los que f(xR(n))
0, es decir de puntos intermedios con tangente casi horizontal, pues los
errores de redondeo pueden echar a perder el clculo. Adems de esta contingencia prctica la situacin puede ser todava ms compleja y es muy conveniente disponer de criterios suficientes para seleccionar el iniciador xR(0).

Condiciones suficientes de convergencia


En las condiciones ya sealadas, la raz simple xR separada en el intervalo
[a, b] en el que se mantienen continuas f(x), f(x) y f(x), y adems f(x) y f(x)
son no nulas y tienen signo constante, una eleccin que garantiza la
convergencia

{x } x ,
(n )
R

n `

es partir de un punto a xR(0) b en el que

f(xR(0)) f(xR(0)) > 0. Un ejemplo grfico de esta aplicacin se muestra en la Fig.


4T.3 para el clculo del Ejercicio 4.3.-1. Otras opciones podran fcilmente
conducir a divergencias o a races situadas fuera del intervalo de inters [a,
b]. Las demostraciones de estos hechos se dejan para los ejercicios tericos
propuestos. Tambin hay que indicar que existen ms condiciones suficientes que garantizan convergencia en otras situaciones, y muchas de ellas

215

CLCULO NUMRICO Y ESTADSTICA APLICADA

pueden anticiparse sin ms que realizar un sencillo grfico aproximado de la


funcin y viendo si los cortes de las tangentes sucesivas con el eje x van a llevar a la raz. Por ejemplo, en la Fig. 4T.3 partiendo de un punto que no verifica la condicin suficiente anterior, como es rR*(0) = 5, para el que f(5)f(5) < 0,
tambin se alcanzara la raz, pues ya el primer trazado de tangente conducira a una situacin en la que el corte rR*(1) s cumplira la condicin mencionada antes.

Figura 4T.3. Aplicacin del mtodo de Newton-Raphson con trazado de tangentes para el
Ejercicio 4.3.1.

Estimacin del error


Por ltimo hay que considerar la estimacin del error cometido al hacer
xR xR(n).La expresin general del error (4.2.5) puede afinarse notando que

f ( xR( n ) ) = f ( xR( n 1) ) + f ( xR( n1) ) xR( n ) xR( n 1)) +

1
f "(n 1 ) xR( n ) xR( n 1 )
2

(4.5.4)

en donde xn1 est incluido en el intervalo cerrado definido por xR(n1) y xR(n).
Los dos primeros trminos de (4.5.4) son justamente la definicin del algoritmo y por lo tanto
f ( xR( n ) ) =

216

1
f "(n 1 ) xR( n ) xR( n 1)
2

(4.5.5)

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

Tomando la acotacin de f con su valor mximo en el intervalo abierto


(a, b), f(x) D2 < , se puede escribir
xR x(Rn )

2
D2 ( n )
xR xR( n 1 )
2 d1

(4.5.6)

una expresin que da el error en funcin de dos estimaciones sucesivas y que


ya indica la convergencia cuadrtica en cada paso de este mtodo (comprese con (4.4.5)). Para probar el resultado (4.5.6) se utiliza el desarrollo de
Taylor en torno a xR(n1) para estimar xR

0 = f ( xR ) = f ( x(Rn1) ) + f ( xR( n 1 ) ) xR xR( n1 ) +

1
f "(n1 ) xR xR( n 1 )
2

(4.5.7)

en donde xn1 est incluido en el intervalo cerrado definido por xR(n1) y xR.
Combinando (4.5.7) con (4.5.3) aplicado para obtener xR(n) se obtiene con facilidad
2
1 f "(n 1 )
( n 1 )
(4.5.8)
xR xR( n ) =
x

x
2 f ( xRn1 ) R R

Este ltimo resultado indica cmo el error en la iteracin n es proporcional


al cuadrado del error en la iteracin previa n 1. Como a partir de un n dado
estas cantidades son menores que la unidad, es claro que el nmero de cifras
significativas estables alcanzadas para xR en una determinada iteracin crece
grandemente en la siguiente (aproximadamente el doble). La velocidad de
este mtodo es as mucho mayor que la de los precedentes y de ah su utilidad.

La variante Newton-secante
Una variante de este mtodo evita el clculo de la derivada f(xR(n)) sustituyndolo por el cociente de incrementos
f ( xR( n ) )

f ( xR( n ) ) f ( x(Rn1) )

(4.5.9)

xR( n ) xR( n 1 )

con lo que este algoritmo, denominado de Newton-secante, pierde su carcter de un punto pasando a ser ya de dos puntos y se expresa
xR( n+1) = xR( n )

f ( xR( n ) )
f ( xR( n ) )

f ( xR( n 1) )

(x

(n )
R

x(Rn1)

(4.5.10)

217

CLCULO NUMRICO Y ESTADSTICA APLICADA

4.6. Mtodo iterativo de punto fijo


El siguiente mtodo de bsqueda de races es de nuevo de los denominados de un punto. Se le denomina de punto fijo atendiendo a su formulacin, ya que consiste en expresar f(x) = 0 en una forma equivalente del tipo
f(x) = x F(x) = 0, generando aproximaciones xR(n) a la raz dentro de [a, b]
mediante el algoritmo
xR( n+1) = F ( xR( n ) ) ; n = 0,1, 2, 3,...

(4.6.1)

En la teora matemtica de aplicaciones continuas F(x) la existencia de


puntos fijos, que se definen como aquellos en los que el punto x coincide con
su imagen F(x), x = F(x), juega un papel importante, y de esta nomenclatura
proviene el nombre del presente mtodo no lineal. Hay que sealar que no
todas las particiones f(x) = x F(x) van a ser adecuadas para que se produzca la convergencia a la raz del algoritmo (4.6.1) y esto est estrechamente
ligado a la eleccin de la aproximacin inicial xR(0).
El anterior proceso iterativo puede visualizarse como el del clculo del
punto de corte de dos funciones y = x e y = F(x). Si se selecciona xR(0) razonablemente prxima a xR, xR d xR(0) xR + d, y en ese intervalo la derivada
F(x) est acotada en la forma
F ( x) L < 1 ; xR x xR +

(4.6.2)

entonces, independientemente del xR(0) seleccionado en el intervalo mencionado, el proceso ser convergente a la raz que adems va a ser nica. Es
fcil ver que va a producirse el resultado indicado, ya que
F ( x) F ( x ) = F ( )( x x ) ;

xR x < < x xR +

(4.6.3)

de donde utilizando la acotacin de F se obtiene la condicin de Lipschitz


F ( x) F ( x ) L x x

(4.6.4)

A partir de aqu se establece que


xR xR( n ) = F ( xR ) F ( xR( n 1) ) L xR xR( n 1) < xR xR( n1 )

218

(4.6.5)

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

Al ser L < 1, xR(n) estar ms prxima a xR que xR(n1). En consecuencia, el


proceso iterativo no escapa del intervalo. Se tiene entonces
xR xR( n ) L xR x(Rn 1) L 2 xR xR( n 2 ) ... L n xR xR(0 )

(4.6.6)

y por tanto
lim xR xR( n ) = 0 xR = lim xR( n )

n `

n `

(4.6.7)

Geomtricamente, si F(x) tiene tangentes con inclinacin f < 45 entonces el proceso ser convergente. De nuevo hay que sealar que sta es una
condicin suficiente de convergencia de utilidad para cualquier tipo de funcin F(x). La condicin de Lipschitz (4.6.4) resulta ms prctica y menos restrictiva. En este sentido la Fig. 4T.4 muestra situaciones de convergencia y de
divergencia en la aplicacin de este mtodo a la ecuacin x x3 = 0 con la particin obvia x = F(x) = x3. Aqu es interesante notar que cualquier valor de partida xR(0) dentro de 0 < x < 1 va a llevar a convergencia a la raz xR = 0, aunque
la derivada F = 3x2 en ese intervalo pueda tomar valores 1. Por otra parte,
cualquier valor de partida xR(0) > 1 va a llevar a divergencia, y la raz xR = 1
slo podr obtenerse con esta particin si se parte de ella misma en las iteraciones.

Figura 4T.4. Aplicacin del mtodo iterativo de punto fijo al caso x x3 = 0. La situacin de
convergencia a xR = 0 se da para cualquier valor de partida xR(0) < 1. Se obtiene divergencia para
valores xR(0) > 1.

219

CLCULO NUMRICO Y ESTADSTICA APLICADA

Tambin hay que notar que en este mtodo las trayectorias de convergencia a, o divergencia de, la raz pueden tomar formas diversas (montonas,
en espiral, etc.). Adems, el algoritmo que se est considerando es muy lento, pues el error en un paso n es simplemente proporcional al error en el
paso previo n 1 y se dice que presenta convergencia lineal. Esto es similar a
lo que sucede en la regula falsi, pero distinto de la convergencia cuadrtica de
Newton-Raphson. Una estimacin del error en un paso puede obtenerse a
partir simplemente de la estimacin obtenida en l y resulta ser

xR

xR( n )

f ( xR( n ) )
d1

xR( n ) F ( x(Rn ) )
1 L

f ( x) = x F ( x)

(4.6.8)

en donde se ha aplicado la acotacin


f ( x) = 1 F ( x) 1 F ( x) 1 L = d1 > 0

(4.6.9)

4.7. El caso de las races mltiples


Supngase que utilizando el mtodo de Newton-Raphson o su variante de
la secante para resolver una raz de f(x) = 0 dentro de un intervalo [a, b], se
observa una convergencia anmala a la raz buscada xR, que pudiera manifestarse como
i) Valores de f(xR(n)) muy pequeos con n creciente, en tanto que xR(n)
x
permanece relativamente grande.
(n1)
R

ii) La velocidad de convergencia de xR(n) xR(n1) 0 se muestra excesivamente lenta, es decir que tras muchas iteraciones no se alcanza un resultado razonablemente estable.
Todo ello apunta hacia la posibilidad de que xR sea una raz con multiplicidad j > 1. Estas observaciones pueden verse complementadas con el estudio
del signo de la funcin en las cercanas de la raz que se calcula (Fig. 4T.5).
Una raz xR con multiplicidad j indica que f(x) puede escribirse como
f ( x) = ( x xR ) j g( x)

220

(4.7.1)

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

Figura 4T.5. Comportamientos tpicos de las funciones polinmicas alrededor de una raz con
multiplicidad par y multiplicidad impar. Se observan alrededor de la raz mltiple comportamientos
que recuerdan (no son) las simetras par e impar: la multiplicidad par no cambia de signo, la impar s.

Para j > 1 esto implica en general las siguientes relaciones para las derivadas sucesivas de f(x)
f ( xR ) = f ( xR ) = f "( xR ) = ... = f ( j 1) ( xR ) = 0 ;

f ( j ) ( xR ) 0

(4.7.2)

y adems se considerar en adelante que g(x) 0 en un entorno pequeo de


xR. La condicin f(xR) = 0 ya muestra que los mtodos de Newton van a presentar problemas en la evaluacin de races mltiples. A continuacin se
revisan algunas ideas para abordar este problema.

Mtodos para determinar la multiplicidad


1) Un tratamiento directo del caso j > 1 se basa en la observacin de que
la funcin auxiliar cociente j(x) = f(x)/f(x) tiene a xR como raz simple. As,
se encuentra
( x xR ) j g( x)
f ( x)
;
( x) =
=
f ( x) j ( x xR ) j 1 g( x) + ( x xR ) j g ( x)

( x) = 1

f ( x) f "( x)
f ( x)

; lim ( x) =
x xR

( xR ) = 0

1
0 , j >1
j

(4.7.3)

(4.7.4)

221

CLCULO NUMRICO Y ESTADSTICA APLICADA

Este resultado muestra que j(x) no presentar problemas en su derivada


al aproximarse a xR, por lo que el mtodo de Newton (o su variante) puede
aplicarse directamente a j(x)
xR( n+1 )

xR( n)

( xR( n ) )
( xR( n ) )

; n = 0,1, 2, 3,...

(4.7.5)

en donde ayudar la utilizacin de la condicin suficiente de convergencia


j(xR(0))j(xR(0)) > 0.
2) Otra posibilidad ms sencilla, siguiendo con el mtodo de NewtonRaphson, es hacer la aproximacin g(x) constante llegando entonces a
(4.7.6)

f ( x) = ( x xR ) j g( x) cte.( x xR ) j ; j > 1

de manera que f(x)/f(x) (x xR)/j, y el ciclo iterativo (4.5.3) se convierte en


xR( n +1) = xR( n ) j

f ( xR( n ) )
f ( xR( n ) )

; n = 0,1, 2, 3, ... ; j > 1

(4.7.7)

Anlogamente, para la variante Newton-secante se encuentra la expresin


corregida
xR( n +1 ) = x(Rn ) j

f ( xR( n ) )
f ( xR( n ) ) f ( xR( n 1 ) )

(x

(n)
R

xR( n 1)

(4.7.8)

3) En la aplicacin de las opciones (4.7.7) y (4.7.8) anteriores la cuestin


est en el desconocimiento previo de j, con lo que debe disponerse de una
estimacin de esta multiplicidad para poder aplicar (4.7.7) y (4.7.8). Una
posibilidad obvia es utilizar (4.7.4) para estimar j con un valor aproximado
xR. Otra es la del tanteo bien dirigido. Supngase que se ha utilizado un
valor de prueba incorrecto para j, sea j1 y que lleva a una razonable estimacin de xR, xR(1), pero tras un gran nmero de iteraciones. Se puede estimar
una multiplicidad mejor j2 tomando dos valores x y x separados de xR y efectuando las aproximaciones

(1 ) j
f ( x) , cte.( x x (1 ) ) j2
ln ( f ( x) / f ( x)
f ( x) ( x x R ) 2
R
,
j2 ,
(4.7.9)

j2
(
1
)
(1)
(1)
(1 ) j2
f
x
(
)

x
x
(
)

ln ( x xR ) / ( x xR )
f ( x ) , cte.( x x R )
R
A partir de aqu se repiten los clculos con el mtodo de Newton utilizando como valor j2 el resultante del cociente de logaritmos neperianos en

222

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

(4.7.9), se determina una nueva aproximacin a xR y se sigue con el proceso


hasta obtener consistencia en la respuesta.
4) Desde otro punto de vista, en muchas ocasiones la multiplicidad de
una raz viene dada de antemano por razonamientos de tipo fsico-qumico,
como son las relaciones simetra-degeneracin presentes en muchos problemas (orbitales moleculares, vibraciones moleculares, etc.), de los que se
tratarn algunas cuestiones elementales en el Cap. 9. Pero claramente esto
requiere conocimientos ajenos al puro clculo numrico.

B. SISTEMAS DE ECUACIONES
4.8. Sistema lineal (no homogneo)
Con ocasin del estudio de la aproximacin de mnimos cuadrados ya se
ha considerado una posibilidad de sistema lineal de ecuaciones (Cap. 1). El
problema era del tipo mal condicionado al llevar asociadas matrices de
Hilbert y una solucin alternativa muy poderosa era la suministrada por los
polinomios ortogonales. A continuacin va a tratarse el problema general de
un sistema de ecuaciones lineales no homogneo y compatible determinado.
La resolucin numrica de este tipo de sistemas puede abordarse con una
buena serie de mtodos y hay que prestar atencin a los posibles problemas
derivados principalmente de los redondeos.
Un sistema lineal no homogneo tiene la forma
a11x1 + a12 x2 + a13 x3 + ... + a1n xn = b1 = a1, n+1
a21 x1 + a22 x2 + a23 x3 + ... + a2n xn = b2 = a2, n +1
.... ....

.... ....
.... .... .... ....
an1 x1 + an2 x2 + an3 x3 + ... + ann xn = bn = an, n +1

(4.8.1)

en donde las n incgnitas se denotan por xi, los coeficientes por aij, y los trminos independientes (no todos nulos) por bi = ai,n+1. En forma matricial el
sistema (4.8.1) se expresa como
Ax = b

(4.8.2)

con A una matriz cuadrada (n n), y x y b vectores columna (n 1).

223

CLCULO NUMRICO Y ESTADSTICA APLICADA

a11 a12

a
a
A = 21 22
... ...

an1 an2

x1
b1
a1n



... a 2 n
x2
b

; x=
; b = 2

... ...
...
...



... ann
xn
bn
...

(4.8.3)

El teorema del lgebra que garantiza la solucin nica para el sistema


establece que el rango de la matriz A, r(A) = orden del mayor menor complementario no nulo, debe necesariamente ser igual al de A ampliada con
la columna b de trminos independientes, r(Ab), y adems al nmero de
incgnitas
r(A) = r(Ab) = n (compatible determinado)

(4.8.4)

Si sucediera que r(A) = r(Ab) < n, entonces existe solucin, pero no es nica (compatible indeterminado), pues n r(A) incgnitas pueden ser fijadas
arbitrariamente y el resto se definen en funcin de ellas: se trata de una solucin multiparamtrica. Si finalmente r(A) r(Ab), entonces el sistema no tiene solucin (incompatible).
Centrando la atencin en los sistemas compatibles determinados, podra
pensarse que la forma natural de resolverlos sera calcular las n incgnitas xi
haciendo uso de la conocida regla de Cramer. Sin embargo, y a pesar de su
elegancia formal, este mtodo es poco prctico, pues el nmero de operaciones a realizar resulta muy elevado (~n!) comparado con sencillos mtodos
de eliminacin (~n3/3) Por otra parte, el efecto acumulativo de los errores de
redondeo ser tanto mayor cuanto mayor sea el nmero de operaciones a
realizar, y estos errores pueden llevar a resultados muy alejados de los
autnticos.
Otra fuente de complicaciones es la propia naturaleza de la matriz de
coeficientes que se pueden resumir en: a) sus elementos aij pudieran venir
afectados de errores de entrada dij y habra que intentar acotar su efecto final
ei sobre las soluciones obtenidas, xi ei; b) muchos de los elementos aij
pudieran ser nulos (matriz dispersa), o por el contrario muy pocos; c) la
matriz A puede ser mal condicionada en el sentido de que, siendo su
determinante A 0, su inversa A1 presenta algunos elementos muy grandes en valor absoluto. Este es un tema muy delicado y slo van a darse
aqu unas ideas bsicas sobre cmo abordar los problemas ms sencillos.

224

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

Mtodo de Gauss con pivote


La idea general de este mtodo directo es la de reducir ordenadamente,
mediante eliminacin de incgnitas, el sistema original a un sistema triangular superior. En este sistema triangular la primera ecuacin mantiene
las n incgnitas (x1, x2, x3, ..., xn), la segunda ecuacin presenta n 1 incgnitas (x2, x3, ..., xn), la tercera ecuacin n 2 incgnitas (x3, ..., xn), y as sucesivamente hasta llegar a la penltima ecuacin, la (n 1)-sima con dos incgnitas (xn1, xn), y la ltima n con slo una incgnita (xn). La solucin va de
abajo arriba, despejando el valor de la incgnita xn de la ltima ecuacin,
sustituyndola en la penltima ecuacin para obtener xn1, y as hasta determinar todas las incgnitas. Si no hubiese errores de redondeo, las soluciones
seran perfectamente correctas y exactas, al igual que sucedera con cualquier otro mtodo directo como el de Cramer. Como estos errores son en
general inevitables, una forma de minimizarlos es combinar el mtodo de
Gauss con la tcnica conocida como la de seleccin de pivote: de entre todos
los coeficientes en cada paso de eliminacin se elige aquel coeficiente que
difiera de cero lo mximo posible, para que al dividir por l los errores de
redondeo permanezcan lo ms controlados posible. Estas operaciones de
pivoteo implican la reordenacin del sistema a medida que se van realizando, lo que normalmente requiere de computacin. La descripcin de
este proceso en detalle para un caso sencillo que sirve de ilustracin se desarrolla como ejercicio a continuacin.
EJERCICIO 4.8.1
Describir las etapas del mtodo de Gauss con seleccin de pivote para
resolver el sistema lineal (3 3) siguiente
a11x1 + a12x2 + a13x3 = a14
a21x1 + a22x2 + a23x3 = a24
a31x1 + a32x2 + a33x3 = a34
El primer paso es seleccionar el elemento aij con mayor valor absoluto,
sea ste a11 0. Se elimina la incgnita x1 de las dos ecuaciones finales (i = 2
y 3) restndolas la primera multiplicada por el cociente ai1/a11 y se tiene la
primera reduccin

225

CLCULO NUMRICO Y ESTADSTICA APLICADA

a11 x1 + a12 x2 + a13 x3 = a14


(1 )
(1 )
(1
1)
a22
x2 + a23
x3 = a24
; aij(1) = aij a1j
(1 )
(1 )
(1 )
x2 + a33
x3 = a34
a32

ai1
a11

; i = 2, 3 ; j = 2, 3, 4

El siguiente paso es buscar de nuevo el elemento de mayor valor absoluto entre los aij(1), para con l eliminar una de las dos variables, x2 o x3, de las
(1)
0. En este caso la tercera
dos ltimas ecuaciones. Sea este elemento el a33
ecuacin queda como est y a la segunda se la resta la tercera multiplicada
(1) (1)
/a33 . Se obtiene as
por el cociente a23
a11 x1 + a12 x2 + a13 x3 = a14
(2 )
a22
x2

(2 )
(2 )
(1 )
(1 )
= a24
; a22
= a22
a32

(1 )
(1 )
(1 )
a32
x2 + a33
x3 = a34

(1 )
a23

(1 )
(2 )
(1 )
(1 ) a23
;
a
=
a

a
24
24
34
(1 )
(1 )
a33
a33

Por sustitucin reversiva pueden determinarse ya las soluciones: primero


x2 de la segunda ecuacin, segundo x3 de la tercera, y por ltimo x1 de la primera. El proceso es de notacin un tanto complicada, pero resulta muy eficaz. En los casos de rdenes n elevados conviene ir reorganizando el sistema
que se va obteniendo en cada paso para darle forma triangular progresiva.
Esto obliga a ir renombrando los coeficientes y las incgnitas. En el caso que
se est tratando estas operaciones se esquematizan como sigue
a11 x1 + a12 x2 + a13 x3 = a14 a11 x1 + a12 x2 + a13 x3 = a14
(2 )
a22
x2

(2 )
(1 )
(1 )
(1 )
x2 + a23
x3 = a24
= a24
a22

(1 )
(1 )
(1 )
(2 )
(2 )
x3 = a34
a33
a32
x2 + a33
x3 = a34

y en donde las equivalencias deberan resultar claras


x1 = x1 , x2 = x3 , x3 = x2
a11 = a11 , a12 = a13 , a13 = a12 , a14 = a14
(1 )
(1 )
(1 )
(1 )
(1 )
(1 )
a22
= a34
= a33
= a32
, a23
, a24
(2 )
(2 )
(2 )
(2 )
= a22
, a34
= a24
a33

226

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

Estimacin del error


Este tipo de clculos para rdenes n > 4 hay que realizarlos en computadora. A las soluciones calculadas se las denotar por x1s, x2s, x3s, ..., xns, y se
las dispondr en forma de vector columna xS (n 1) Una medida del error
cometido en la resolucin del sistema lineal viene dada por el vector residuo
dado como matriz columna (n 1)
R = b AxS

(4.8.5)

Si R = 0 es decir todas las componentes Ri = 0, la solucin xS es exacta.


En la mayora de las aplicaciones esto no sucede y, entre otros criterios, una
eleccin razonable es la de dar una cota de tolerancia e(~10-6, 108, etc.)
para el clculo de manera que, si se satisface para el cociente de normas
(norma = mdulo = longitud) la relacin siguiente
n

R
b

2
i

i =1
n

<

(4.8.6)

bi2

i =1

entonces la solucin xS (n 1) se da como aceptable. Si, por otra parte, los


coeficientes vienen afectados de errores aij eij, hay que resolver los sistemas
resultantes de tomar las situaciones ms extremas y, por comparacin con
los resultados xS obtenidos sin considerar errores, poder calibrar el efecto
global.
Para concluir este apartado, hay que indicar que a veces la seleccin de
pivote en el mtodo de Gauss conviene efectuarla tras haber dividido cada
ecuacin por su coeficiente respectivo de mayor valor absoluto, lo que es en
definitiva una normalizacin de cada ecuacin (pivoteo implcito). Por
otra parte, para tratar casos difciles existe una buena serie de mtodos
muy elaborados para resolver numricamente sistemas lineales de ecuaciones, como la descomposicin LU, los mtodos iterativos (Gauss-Seidel),
etc., que complementados con operaciones de refinamiento del error cometido producen muy buenos resultados. Obviamente, todos ellos requieren de
computacin y no van a considerarse aqu.

227

CLCULO NUMRICO Y ESTADSTICA APLICADA

4.9. Sistema no lineal


En este apartado por simplicidad va a considerarse nicamente la resolucin de sistemas no lineales de dos ecuaciones con dos incgnitas
f ( x, y) = 0
(4.9.1)

g( x, y) = 0
La extensin a casos de ms ecuaciones e incgnitas puede hacerse siguiendo las mismas lneas generales que se presentarn aqu. El sistema (4.9.1) puede visualizarse como ligado al problema de encontrar puntos de interseccin
de dos superficies tridimensionales z = f(x, y) y z = g(x, y). Las funciones f y g

van a ser no lineales, como por ejemplo f = x + cos y, g = x + y. Van a estudiarse dos mtodos de resolucin: a) el mtodo de Newton-Raphson; y b) el
mtodo de gradientes. El primero es la extensin directa de lo visto anteriormente en 4.5, en tanto que el segundo es una aplicacin de los mtodos
de minimizacin (optimizacin) general de funciones.

Mtodo de Newton-Raphson
La idea es utilizar el consabido mtodo del desarrollo de Taylor en dos
variables tomando un punto de partida inicial (x0, y0) como centro de los desarrollos. Truncando a primer orden se tiene la aproximacin operativa
f
f
f ( x, y) f ( x0 , y0 ) + ( x x0 ) + ( y y0 ) = 0
x 0
y 0

(4.9.2)

g
g
g( x, y) g( x0 , y0 ) + ( x x0 ) + ( y y0 ) = 0
y 0
x 0
con las derivadas parciales tomadas en (x0, y0). Resuelto (4.9.2) para x e y se
obtienen los valores x1 e y1, punto que sirve como nuevo punto de desarrollo
para estimar una solucin mejorada x2 e y2, y as sucesivamente hasta alcanzar convergencia. Denotando fx = (f/x), fy = (f/y), etc., omitiendo por brevedad los smbolos que indican la variable que permanece constante en la
derivacin, el proceso puede esquematizarse como sigue
xn+1 = xn + hn f ( xn , yn ) hn f x ( xn , yn ) + kn f y ( xn , yn )

; n = 0,1, 2, 3,... (4.9.3a)

yn+1 = yn + kn g( xn , yn ) hn gx ( xn , yn ) + kn g y ( xn , yn )

228

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

en donde hay que determinar los incrementos que sufre cada variable, hn y
kn, siendo el resto de los elementos del sistema meros valores numricos definidos en cada punto origen (xn, yn). Ntese que a efectos prcticos el sistema
(4.9.3a) debe ser tratado como
xn +1 = xn + hn f ( xn , yn ) = hn f x ( xn , yn ) + kn f y ( xn , yn )

; n = 0,1, 2, 3,... (4.9.3b)

yn +1 = yn + kn g( xn , yn ) = hn g x ( xn , yn ) + kn gy ( xn , yn )
Evidentemente se exige que las derivadas parciales indicadas existan en
estos puntos. Al igual que en el caso monodimensional la convergencia del
mtodo es cuadrtica y se necesita, tambin, una buena aproximacin inicial
(x0, y0) para garantizar la convergencia adecuada del mtodo. En otro caso, el
mtodo (4.9.3) pudiera bien ser divergente, bien conducir a una solucin
diferente de la que interese encontrar.
Mtodo del gradiente
En este mtodo, para resolver el sistema (4.9.1), se minimiza la funcin
idnticamente nula
S = (f(x, y))2 + (g(x, y))2 = 0

(4.9.4)

siendo ste el valor mnimo que se alcanzar cuando f = g = 0. Ntese que


puede haber ms de un mnimo! La minimizacin puede lograrse utilizando
el gradiente de S
grad S = S =

S
S
i+
j
x
y

(4.9.5)

que es un vector perpendicular a la superficie S, en este caso un contorno


en el plano, que marca la direccin de mxima pendiente tomada en el punto (x, y) en el que se est evaluando. De acuerdo con ello, grad S marcar la
direccin de descenso ms rpido hacia el mnimo. Tomando una aproximacin inicial (x0, y0) se determina un primer punto (x1, y1) haciendo
S
x1 = x0 0
x 0
S
y1 = y0 0
y 0

; 0 > 0

(4.9.6)

229

CLCULO NUMRICO Y ESTADSTICA APLICADA

en donde las derivadas parciales se toman en (x0, y0) y l0 es un nmero que


efectivamente hace S(x0, y0) > S(x1, y1). Ntese que valores grandes de l0
pudieran forzar situaciones indeseadas, efectuando un salto demasiado
largo y situando la estimacin fuera de la regin razonable en la que el gradiente tiene sentido. Esto hara perder al mtodo su utilidad y hay que prestar atencin a la eleccin de un buen l0 (una serie de tanteos ayuda en
ello). Una vez determinado el punto (x1, y1) se utiliza ste para obtener el
siguiente (x2, y2) siguiendo el mismo proceso, y as sucesivamente. Este
proceso se esquematiza en
S
xn +1 = xn n
x n
S
yn +1 = yn n
y n

; n > 0 ; n = 0,1, 2, 3,...

(4.9.7)

con los valores ln adecuadamente elegidos y con las derivadas parciales calculadas en cada (xn, yn). Se genera as un camino de descenso en la magnitud S a travs de puntos del plano xy caracterizado por una sucesin
decreciente de valores S
S( x0 , y0 ) > S( x1, y1 ) > S( x2 , y2 ) > ... > S( xn , yn ) > ...

(4.9.8)

La convergencia del proceso a la solucin significativa para el problema


no est garantizada sin ms. La ruta de descenso puede extraviarse hacia
regiones de S(x, y) en las que se alcancen otros mnimos, generalmente
locales (relativos) o incluso tan absolutos como el buscado. El proceso puede quedar entonces atrapado en tales regiones y hay que analizar cuidadosamente los resultados para verificar su fiabilidad. En cuanto al error, el
valor de S en cada etapa es ya una buena medida del error cometido, pudiendo indicar tambin aquellas situaciones con convergencias no deseadas
como las de los mnimos locales (valores S significativamente mayores que
cero y que permanecen estables con n crecientes).

230

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

BIBLIOGRAFA
1. SCHEID, F., Anlisis Numrico, McGraw-Hill (serie Schaum), 1972. (Caps. 25,
26). Se mantienen los mismos captulos numerados de consulta en la obra Numerical Analysis (1988).
2. SES, L. M., Mtodos Tericos de la Qumica-Fsica (Vol. 1), UNED, Madrid,
1994. (Tema 5).
3. PRESS, W. H.; FLANNERY, B. P.; TEUKOLSKY, S. A. y VETTERLING, W. T., Numerical
Recipes, Cambridge University Press, Cambridge, 1986. (Caps. 9, 10).
4. RICE, J. R., Numerical Methods, Software and Analysis, McGraw-Hill, Nueva York,
1983. (Caps. 6, 8).
5. RALSTON, A. y RABINOWITZ, P., A First Course in Numerical Analysis, Dover, Nueva
York, 2001. (Caps. 8, 9).

231

CLCULO NUMRICO Y ESTADSTICA APLICADA

PROBLEMAS TERICOS Y NUMRICOS

Problemas tericos
4.1) Discutir la aplicacin de la regula falsi para encontrar una raz simple xR
de f(x) = 0, localizada en un intervalo [a, b] en el que f(a) > 0, f(b) < 0, y
f(x) < 0.
4.2) Demostrar la frmula que acota el error en el mtodo de la regula falsi
para la determinacin iterativa estacionaria de una raz simple xR de f(x)
= 0, localizada en el intervalo [a, b], en funcin de la diferencia entre dos
aproximaciones sucesivas
xR xR( n )

D1 d1 ( n )
xR x(Rn 1 )
d1

Supngase que f (x) cumple en el intervalo: i) continuidad; ii) signo


constante; y iii) la doble acotacin (4.4.4).
4.3) Demostrar la convergencia del proceso Newton-Raphson para localizar
una raz simple xR de f(x) = 0, localizada en el intervalo [a, b], en el que
f(x) y f(x) son continuas, no nulas y con signo constante, cuando se inician las iteraciones con un xR(0) tal que a xR(0) b y f(xR(0)) f(xR(0)) > 0.
4.4) Demostrar que si una raz xR de f(x) = 0 tiene multiplicidad j > 1, la
derivada de la funcin cociente auxiliar j(x) = f(x)/f(x) se comporta en xR
en la forma
1
lim ( x) = ; j > 1
x xR
j

232

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

Problemas numricos
4.5) Un potencial aproximado V(r) para describir la interaccin entre dos
tomos de helio en funcin de su distancia internuclear (r > 1,5 ) viene
dado por la expresin

0, 014932
17
V ( r ) = 7, 700516 exp ( 4, 592034 r
10 Julios
6
r

en donde r se expresa en unidades de . Determinar numricamente la


distancia de equilibrio re <  dada por la condicin de anulacin de la
fuerza a lo largo de la direccin radial F = dV/dr = 0, y la profundidad del
pozo de potencial V(re). Utilizar los mtodos de: a) Newton-Raphson;
b) punto fijo. (1 = 1010 m).
4.6) Determinar numricamente los mximos y mnimos de la funcin de
2
(r) del estado 2s del tomo de hidrgeno
distribucin radial F2s(r) = r2R2s
dado por el orbital

r
r
R2 s ( r ) = C2 s 1
exp

2 a0
2 a0
Las magnitudes C2s y a0 son constantes (a0 = radio de la primera rbita de
Bohr = 0,529177249 ). Utilizar el mtodo de Newton-Raphson y expresar
los resultados en unidades de a0
4.7) Una ecuacin emprica para determinar el volumen crtico VC de un
gas es
f(VC) = VC3 + 4AVC2 + 9BVC + 16C = 0
en donde A = 0,243672, B = 0,029859, C = 0,002451.
Calcular VC redondeando el resultado a cuatro decimales. Las unidades de
volumen consistentes con los datos son l/mol.

233

CLCULO NUMRICO Y ESTADSTICA APLICADA

4.8) Los momentos principales de inercia de una molcula poliatmica de n


tomos son las tres races Ij de la ecuacin secular
Ixx I
P ( I ) = I yx

Ixy
I yy I

Izx

Izy

Ixz
I yz = 0
Izz I

en donde los elementos numricos del determinante vienen dados por


las expresiones
n

Ixx =

mi ( yi2 + zi2 ) Ixy = I yx =

i =1

mi ( xi2

zi2 )

Ixz = Izx =

i =1

m xz

i i i

i =1

Izz =

i i i

i =1

I yy =

m x y
n

mi ( xi2

yi2 )

I yz = Izy =

i =1

m y z

i i i

i =1

En ellas mi es la masa del tomo i y las coordenadas de cada tomo r(x, y, z)


se expresan como relativas a las del centro de masa molecular RCM(X, Y, Z)
xi = X i X CM

yi = Yi YCM

zi = Zi ZCM

mi X i

miYi

mi Zi

X CM =

mi
i

YCM =

mi
i

ZCM =

mi
i

Las coordenadas (X, Y, Z) se refieren a un sistema de referencia ortogonal


fijo en el espacio.
Determinar numricamente los momentos principales de inercia de las
molculas siguientes:
a) Ozono O3, con la geometra molecular d(O O) = 1,278 , f(O O
O) = 11649. m(O) = 15,9994 uma.
b) Amonaco NH3, con la geometra molecular piramidal de base regular
con vrtice en el tomo N:d(N H) = 1,008 , f(H N H) = 107,3.
m(N) = 14,0067 uma, m(H) = 1,007825 uma. (1 = 1010 m).

234

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

4.9) Un oscilador armnico bidimensional se mueve sujeto a una doble perturbacin sinusoidal de acuerdo con el potencial
V ( x, y) =

2
1
1
0, 5 ( x 2 sen x sen y + 0, 75 ( y 3
2
2

Utilizando el mtodo de Newton-Raphson encontrar los puntos en los que


la fuerza F es nula utilizando diferentes valores de l = 0,1, 0,2, 0,5, en las
cercanas del punto (x0, y0) = (2, 3).
F = V =

V
V
i
j
x
y

SOLUCIONES
Problema 4.1
Se cumple la condicin necesaria f(a)f(b) < 0 y como la segunda derivada
de f(x) tiene signo constante en el intervalo, f(x) < 0 (convexidad dirigida
hacia las y crecientes, como en y = x2) se est en rgimen estacionario. En
estas condiciones el punto desde el que se radian las secantes es (b, f(b)).
Ntese que f(b) < 0 y que el esquema iterativo es
xR(0 ) = a
xR(1 ) = a

f ( a)
( a b)
f ( a) f ( b )

f ( xR(1 ) )

xR(2 )

xR(1 )

f ( xR(1 ) )

f ( b)

( xR(1 ) b)

....
xR( n +1)) = xR( n )

f ( xR( n ) )
f ( xR( n ) ) f ( b)

( xR( n ) b)

La sucesin {xR(n)} es montona creciente y est acotada superiormente,


pues xR(n) < b para todo n. Tiene por tanto lmite a y coincide con la raz buscada

235

CLCULO NUMRICO Y ESTADSTICA APLICADA

lim
n `

xR( n +1 )

= lim

n `

xR( n )

f (lim xR( n ) )
n

f (lim xR( n ) ) f ( b)

(lim xR( n ) b)
n `

n `

f ( )
( b) f ( ) = 0 = xR
f ( ) f ( b)

Problema 4.2
Sea para concretar (b, f(b)) el punto fijo en el que f(b) > 0, teniendo adems f(x) > 0. El algoritmo es
xR( n ) = xR( n 1 )

f ( xR( n 1 ) )
f ( xR( n 1 ) )

f ( b)

( xR( n 1) b)

de donde se puede escribir la relacin equivalente (f(xR) = 0)


f ( xR )

f ( xR( n 1 ) )

f ( xR( n1 ) ) f ( b)
xR( n 1 )

( xR( n ) xR( n 1) )

Aplicando el teorema del valor medio (teorema de Lagrange) se tienen las


dos igualdades
f ( xR ) f ( xR( n 1 ) ) = ( xR xR( n 1) ) f (n 1 ) ;

xR( n 1) < n 1 < xR

f ( xR( n1 ) ) f ( b) = ( xR( n 1) b) f (n 1 ) ;

xR( n 1) < n 1 < b

y de ah se obtiene
( xR xR( n 1) ) f (n 1 ) = f (n 1 )( xR( n ) xR( n 1) )
de donde, sumando y restando xR(n) en el miembro de la izquierda, se llega a
( xR xR( n ) ) =

f (n 1 ) f (n1 ) ( n )
( xR xR( n 1) )
f (n1 )

Como los puntos x estn ambos en [a, b], y f(x) no cambia de signo y
verifica la doble acotacin, la expresin anterior puede en valor absoluto acotarse como

236

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

xR xR( n )

D1 d1 ( n )
xR xR( n 1)
d1

que es la frmula que se quera demostrar. Ntese que la diferencia de derivadas en el numerador de la ltima igualdad tiene que ser menor o igual, en
valor absoluto, que la diferencia entre los valores mximo D1 y mnimo d1 de
la doble acotacin de partida. Adems, el cociente de derivadas indicado
debe ser menor o igual que (D1/d1 1) al sustituir el denominador por un
nmero d1 menor o igual que l.

Problema 4.3
Sea para concretar el caso definido por las condiciones siguientes en [a, b]
f(a) > 0, f(b) < 0, f(x) < 0, f(x) < 0
El iniciador xR(n) debe ser tal que f(xR(0)) < 0. Entonces a partir de xR(0) = b se
generan las aproximaciones sucesivas
xR( n +1 ) = xR( n )

f ( xR( n ) )
f ( xR( n ) )

El desarrollo en serie de Taylor en torno a xR(n) para estimar f(xR) = 0 y


hasta segundo orden, con punto x indeterminado, pero interior al intervalo
definido por xR(n) y xR, resulta ser
0 = f ( xR ) = f ( xR( n ) ) + f ( xR( n ) )( xR xR( n ) ) +

1
f "( ) ( xR xR( n ) )2
2

De aqu, por ser f(x) < 0, se deduce la desigualdad


f(xR(n)) + f(xR(n))(xR xR(n)) > 0
que combinada con el algoritmo del clculo de las races indica que (f < 0)
xR < xR( n )

f ( xR( n ) )
f

( xR( n ) )

= xR( n+1 )

237

CLCULO NUMRICO Y ESTADSTICA APLICADA

un resultado que se cumple para cualquier valor n = 0, 1, 2, ... La sucesin


{xR(n)} est entonces acotada inferiormente. Por otra parte, es claro del algoritmo generador que xR(n+1) < xR(n), y esto combinado con el resultado anterior
implica que existe lmite a, el cul coincidir con la raz
lim

n `

xR( n +1 )

= lim

n `

xR( n )

f (lim xR( n ) )
n `

f ( lim

n `

xR( n ) )

f ( )
f ( ) = 0 xR =
f ( )

El resto de las posibilidades alternativas a las condiciones del problema y


compatibles con f(xR(0))f(xR(0)) > 0, se demuestran de forma anloga a la presentada.

Problema 4.4
La funcin puede escribirse como
f(x) = (x xR)j g(x)
y la funcin auxiliar y su primera derivada se escriben como

( x) =

( x xR ) j g( x)
f ( x)
; j >1
=
f ( x) j ( x xR ) j 1 g( x) + ( x xR ) j g ( x)

( x) = 1

f ( x) f "( x)
f ( x)

La segunda derivada de f(x) se calcula de manera directa


f "( x) = j ( j 1)( x xR ) j 2 g( x) + 2 j ( x xR ) j 1 g ( x) + ( x xR ) j g "( x)
Con ello la derivada buscada queda

( x) = 1

( x xR )2 j 2 j ( j 1) g( x)2 + 2 jg( x) g ( x)( x xR ) + g( x) g "( x)( x xR )2

( x xR )2 j 2 j 2 g( x)2 + 2 jg( x) g ( x)( x xR ) + g ( x)2 ( x xR )2

y por tanto el lmite cuando x xR resulta

238

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

lim ( x) = 1

x xR

j ( j 1) 1
= ; j >1
j
j2

que es la relacin que se quera demostrar.

Problema 4.5
Por comodidad de notacin se escribe el potencial en la forma
V (r )
c
= V ( r ) = a exp ( b r 6 ; a = 7, 700516 , b = 4, 592034 , c = 0, 014932
17
10
r

con lo que la ecuacin a resolver, anulacin de la fuerza, se expresa

dV
c
F =
= ab exp br + 6 7 = 0
dr
r

y las dos primeras derivadas de la fuerza son

c
dF
d 2V
c
d2 F
d3V
F =
= 2 = ab2 exp br 42 8 ; F " = 2 = 3 = ab3 exp br + 3366 9
dr
r
dr
r
dr
dr

Un tanteo de signos para F indica que la raz est contenida en el intervalo [2,75, 3]
a) Newton-Raphson
El algoritmo iterativo es en este caso
rn +1 = rn

ab exp brn + 6 c rn7


ab2 exp brn 42c rn8

Tomando los dos puntos de inicio siguientes, r0 = 2,75 y r0 = 3, se encuentran las sucesiones siguientes (resultados redondeados a 8 decimales)

239

CLCULO NUMRICO Y ESTADSTICA APLICADA

r0 = 2,75

r0 = 3

r1 = 2,86921560

r1 = 2,94294376

r2 = 2,93393827

r2 = 2,95164988

r3 = 2,95089819

r3 = 2,95190775

r4 = 2,95190462

r4 = 2,95190797

r5 = 2,95190797

r5 = 2,95190797

r6 = 2,95190797
En los dos puntos iniciales, mantenindose los comportamientos adecuados de la funcin y sus dos primeras derivadas, slo el primero cumple
con la condicin suficiente mencionada F(r0 = 2,75))F(r0 = 2,75) > 0, pero se
ve cmo ambos llevan a la solucin correcta (un grfico como el mostrado
en la Fig. 4EP.1 ayuda a comprender porqu).
El resultado es re = 2,95190797 2,952 = 2,952.1010 m y se trata efectivamente de un mnimo (F(re) > 0, no puede ser otra cosa como se comprueba en la Fig. 4EP.1, y su profundidad es V(re) = 1,25789 1022 Julios.
Con los 8 decimales de la solucin re el valor de la fuerza en ese punto es del
orden F(re) 1030 J/ = 1020 J/m, y a efectos prcticos se tiene F(re) = 0.

Figura 4EP.1. Energa potencial de interaccin y fuerza actuantes entre dos tomos de helio-4 con el
potencial del Problema 5.

b) Mtodo iterativo de punto fijo.


La ecuacin a resolver es

240

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

ab exp br + 6

c
=0
r7

y una posible manera de descomponerla para aplicar este mtodo podra ser
r=

6 c exp[ br ]
6 c exp[ brn ]
= f ( r ) rn+1 =
6
ab
ab
r
rn6

Ahora bien hay que analizar las propiedades de f(r) para ver si habra
convergencia. As, partiendo de un r0 adecuado sera suficiente para la convergencia que
df
<1
dr

6 c ( br 6)
exp[ br ] < 1
ab
r7

en un entorno de la raz buscada. Tanteando se observa que df/dr se mantiene positiva y menor que la unidad para distancias r > r1 1,31, y que se
mantiene as hasta valores r < r2 2,19, tomando valores mayores que la unidad para r > r 2,19. Como la raz se sabe que est localizada en [2,75, 3]
esta particin de la ecuacin no va a ser til para calcularla. Se puede comprobar como aplicaciones que parten de puntos de ese intervalo llevan a
rpidas divergencias en la solucin.
Pueden ensayarse otras particiones de la ecuacin a resolver. Por ejemplo, dado que r > 0, una alternativa tomando logaritmos es
ab exp br + 6

6c
c
6c
1
= 0 r 7 exp[ br ] =
r = 7 ln r ln = f ( r )
7
ab
b
ab
r

En este caso la condicin suficiente es


df
7
=
<1
dr
rb
y se cumple para cualquier valor r > 7/b 1,524. De manera que cualquier
valor entre estos llevar a buen trmino el proceso iterativo. Este proceso
junto con resultados redondeados a 8 decimales, partiendo de cuatro posiciones r0 diferentes y adecuadas, se resumen a continuacin

241

CLCULO NUMRICO Y ESTADSTICA APLICADA

rn +1 =

6c
1
7 ln rn ln
b
ab

r0 = 2

r0 = 2,5

r0 = 3,5

r0 = 7,5

r1 = 2,35846031

r1 = 2,69861564

r1 = 3,21152684

r1 = 4,37331310

r5 = 2,89926795

r5 = 2,93225863

r5 = 2,96894581

r5 = 3,02202379

r10 = 2,94993979

r10 = 2,95118155 r10 = 2,95253007 r10 = 2,95442356

r15 = 2,95183564

r15 = 2,95188129 r15 = 2,95193081 r15 = 2,95200028

r20 = 2,95190532

r20 = 2,95190699 r20 = 2,95190881 r20 = 2,95191136

r32 = 2,95190797

r30 = 2,95190797 r29 = 2,95190797 r31= 2,95190797

y se tiene de nuevo el resultado conocido re = 2,95190797 2,952 .


En estos clculos iterativos es importante observar que la convergencia
funciona segn lo esperado, de ah que se haya exigido convergencia a 8
decimales. Esto ayuda a no cometer errores derivados de malas apreciaciones sobre la funcionalidad elegida para iterar. Como puede verse el criterio de seleccin del punto de partida es una condicin suficiente que
garantiza la convergencia. Esta convergencia es extremadamente lenta,
pero se dirige con seguridad hacia la raz re. Otros puntos de partida no
necesariamente llevan a convergencia. Por ejemplo: se obtienen divergencias partiendo de r0 = 0,1, 0,5, 0,6; y se obtienen, sin embargo, convergencias
a la raz partiendo de r0 = 0,7, 0,75.
Problema 4.6
La funcin de distribucin radial desarrollada es
2

2 s (r ) = r R (r ) =

C22s r 2 1

r
r
exp ; r 0
2 a0
a0

Utilizando la variable reducida r* = r/a0 se escriben F2s y su derivada


dF2s/dr* como
2
r
2 s ( r ) = C r 1 exp r ;
2

242

d2 s
dr

r 4

= C exp r 2 r 4 r 2 + 2r 3
4

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

en donde se ha hecho C = C22sa20. La anulacin de la derivada para localizar


los mximos y mnimos indica que F2s(r* ) = 0, la funcin se anula
(valor mnimo) en el infinito, y los valores finitos de r* en los que cabe
esperar extremos vienen dados por
8r* 16r*2 + 8r*3 r*4 = 0
Una de las races es pues
r*1 = 0 F2s(0) = 0, mnimo
y las otras tres races son las soluciones de la ecuacin auxiliar
f(r*) = r*3 8r*2 + 16r* 8 = 0
Las dos primeras derivadas de f(r*) son
f(r*) = 3r*2 16r* + 16;

f(r*) = 6r* 16

Esta funcin f(r*) presenta un mnimo en r* = 4 y un mximo en r* = 4/3.


Teniendo en cuenta que esta funcin slo est definida para valores no
negativos de r* una tabla de signos de f(r*) es
r*
sgn f(r*)

4/3
+

6
+

8
+

y las tres races (simples) estn localizadas en los intervalos [0, 4/3], [4/3, 4]
y [4, 6]. La aplicacin del mtodo de Newton requiere del algoritmo
rn+1 = rn

rn3 8 rn2 + 16 rn 8
3 rn2 16 rn + 16

En el intervalo [0, 4/3] un punto de partida que va a llevar a convergencia


es r*0 = 0, pues f(0)f(0) > 0. En el intervalo [4/3, 4] ninguno de los dos extremos son vlidos para efectuar el proceso iterativo, ya que anulan el denominador. Un valor de prueba como r*0 = 3 no cumple la condicin suficiente
utilizada antes, pues f(3)f(3) < 0, pero esta no es la nica condicin suficiente y la funcin es tal que tambin partiendo de r*0 = 3 se llega a una rpida convergencia a la raz. En el intervalo [4, 6] el extremo r*0 = 6 cumple la
condicin suficiente y lleva a convergencia a la raz. Estas discusiones pueden completarse con una inspeccin de la Fig. 4EP.2. Los resultados se
resumen en las secuencias que se dan a continuacin (datos redondeados a 8
decimales).

243

CLCULO NUMRICO Y ESTADSTICA APLICADA

Figura 4EP.2. Grficos de la funcin de distribucin radial y de su derivada para el estado 2s del
tomo de hidrgeno (Problema 6).

Intervalo [0, 4/3]

Intervalo [4/3, 4]

Intervalo [4, 6]

r*2,0 = 0

r*3,0 = 3

r*4,0 = 6

r*2,1 = 0,5

r*3,1 = 2

r*4,1 = 5,42857143

r*2,2 = 0,71428571

r*3,2 = 2

r*4,2 = 5,25315615

r*2,3 = 0,76158624

r*4,3 = 5,23622139

r*2,4 = 0,76392636

r*4,4 = 5,23606799

r*2,5 = 0,76393202

r*4,5 = 5,23606798

r*2,6 = 0,76393202
Ntese que la raz r* = 2 podra haberse anticipado, al ser este valor
un divisor entero del trmino independiente de f(r*) que verifica adems
la ecuacin. Los resultados finales para las races y sus caracterizaciones
son

244

r*1 = 0 (mnimo)

F2s(r*1) = 0

r*2 = 0,76393202 0,764 (mximo relativo)

F2s(r*2) = 0,10383952C

r*3 = 2 (mnimo)

F2s(r*3) = 0

r*4 = 5,23606798 5,236 (mximo absoluto)

F2s(r*4) = 0,38193583C

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

Aqu los valores redondeados son de carcter simplificador para visualizar. Represe en que a0 viene ya definido con 9 cifras decimales y que el
modelo matemtico utilizado para los orbitales atmicos es exacto.

Problema 4.7
La ecuacin para determinar el volumen es
f(V) = V3 + 4AV2 + 9BV + 16C = 0
La funcin f(V) slo presenta un cambio de signo. Se trata de una cbica
que posee un mximo y un mnimo, pero ambos puntos poseen f(V) < 0, lo
que combinado con los comportamientos asintticos, f(V )  y f(V
) , indican que slo hay una raz real. Una localizacin de esta raz es
en el intervalo [0,6(), 0,7(+)], en donde se incluyen los signos de f(V) en los
extremos. La aplicacin del mtodo de Newton partiendo de V0 = 0,6 se
resume a continuacin (datos redondeados a 8 decimales)
Vn+1 = Vn

Vn3 + 4 AVn2 + 9 BVn + 16 C


3Vn2 + 8 AVn + 9 B

V0 = 0,6
V1 = 0,67182184
V2 = 0,65704295
V3 = 0,65625117
V4 = 0,65624895
V5 = 0,65624895
El volumen crtico es pues VC 0,6562 l/mol.

245

CLCULO NUMRICO Y ESTADSTICA APLICADA

Problema 4.8
a) La molcula de ozono es plana y lo primero ser determinar su centro
de masa. Una disposicin geomtrica conveniente es aquella en la que los
tres tomos estn en el plano con las coordenadas siguientes (Fig. 4EP.3)

Fig. 4EP.3. Diagrama de la orientacin espacial de partida para la molcula de ozono en un sistema
de ejes fijo en el espacio (Problema 8).

Tabla (a1). Problema 4.8


TOMO - O

X()

Y()

Z()

1,278

1,140557

0,576553

Las coordenadas anteriores estn redondeadas a 6 decimales, y se ha


utilizado el ngulo b = 116,8167 90 = 26,8167 para calcular las proyecciones (coordenadas) del tomo 3 sobre los ejes. Prstese atencin,
dependiendo de la mquina de clculo, a la eleccin de grados o radianes
(1 radin = 180/p grados sexagesimales). Con estos datos y de nuevo redondeando a 6 decimales se obtienen las coordenadas del centro de masa molecular
XCM = 0, YCM = 0,380186, ZCM = 0,233816
Las coordenadas de los tomos relativas a este nuevo origen, r = R RCM,
son

246

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

Tabla (a2). Problema 4.8


TOMO - O

x()

y()

z()

0,380186

1,044184

0,380186

0,233816

0,760371

0,810369

Ntese que al ser los tres tomos iguales las sumas parciales de las coordenadas deberan ser Sxi = Syi = Szi = 0, pero que los redondeos utilizados
en la tabla no van a preservar esta propiedad. Este tipo de detalle podra en
algunos casos afectar a la calidad de los resultados para los momentos de
inercia calculados con los datos de la tabla. Para minimizarlo, los clculos
que se detallan a continuacin se han efectuado en doble precisin, pero el
lector puede realizar pruebas con el nmero de decimales que elija y observar el efecto de estos redondeos, que en el caso de 6 decimales no es determinante.
La evaluacin de los elementos de la matriz (o el tensor) de inercia lleva
a los siguientes resultados (con 6 decimales)
I xx = 42, 701365

I yy = 28, 825936

I yz = Izy = 14, 787796

Izz = 13, 875429

Ixy = I yx = Ixz = Izx = 0

El determinante secular queda entonces

(3)

42, 701365 I
0
0
(I) =
0
28, 825936 I
14, 787796 = 0
0
14, 787796
13, 875429 I

que se factoriza directamente en una solucin I1 = 42,701365 uma. 2 y un


determinante secular (2 2)
P (2) =

28, 825936 I
14, 787796
=0
14, 787796
13, 875429 I

que lleva a una ecuacin de segundo grado de la que se pueden determinar


las otras dos soluciones.

247

CLCULO NUMRICO Y ESTADSTICA APLICADA

Sin embargo, esto no es lo que va a suceder en general y aqu se seguir


el proceso basado en la determinacin de las tres races del polinomio de tercer grado tal cual
P(3)(I) = I3 + aI2 + bI + c
en donde los parmetros toman los valores
a = 85,40273034

b = 2004,699924357

c = 7741,47298685

Un estudio previo de los cambios de signo de P(3)(I), teniendo en cuenta


que I > 0, arroja la tabla siguiente
I

10

20

35

40

45

sgn P(3)(I)

de manera que las tres races (simples) estn en los intervalos [4, 10], [35, 40]
y [40, 45]. La utilizacin del mtodo de Newton se resume en el algoritmo y
resultados siguientes
In +1 = In

In3 + aIn2 + bIn + c


3 In2 + 2 aIn + b

Intervalo [4, 10]

Intervalo [35, 40]

Intervalo [40, 45]

I1,0 = 4

I2,0 = 35

I3,0 = 45

I1,1 = 4,74854573

I2,1 = 37,27705105

I3,1 = 43,33654163

I1,2 = 4,78082248

I2,2 = 37,86261809

I3,2 = 42,77629818

I1,3 = 4,78088144

I2,3 = 37,91989891

I3,3 = 42,70264698

I1,4 = 4,78088144

I2,4 = 37,92048366

I3,4 = 42,70136556

I2,5 = 37,92048372

I3,5 = 42,70136517

I2,6 = 37,92048372

I3,6 = 42,70136517

Redondeados a 6 decimales los resultados finales son


I1 = 4,780881 uma. 2,

I2 = 37,920484 um. 2,

I3 = 42,701365 uma. 2

La molcula de ozono pertenece al grupo de molculas trompo asimtricas, pues sus tres momentos principales de inercia son diferentes. Comprobaciones adicionales de estos resultados son la sustitucin en la ecuacin
P(3)(I) = 0, o la observacin de la invariancia de la suma de los elementos dia-

248

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

gonales del tensor de inercia que debe ser igual a la suma de las tres races
calculadas (85,402703). Ms pruebas se estudian en el Cap. 9.
Como siempre hay que insistir en que, aunque no todos los decimales
con los que se ha trabajado son significativos, conviene mantener todos los
posibles en el clculo intermedio, sobre todo si van a ser utilizados para
otros clculos posteriores, como por ejemplo en espectroscopia de rotacin.
De esta manera se evitarn efectos indeseados derivados de los redondeos
que puedan alterar la calidad de los resultados finales (frecuencias de rotacin molecular, etc.).
b) La molcula de amonaco tiene cuatro tomos y tiene forma piramidal
con la base definida por los tres hidrgenos equiltera. El clculo de coordenadas es ahora ms complicado. Un posible mtodo es el siguiente (Fig.
4EP.4). Se disponen inicialmente los tomos en una geometra razonablemente cmoda para determinar sus coordenadas (X, Y, Z): el N(1) se sita en
el origen de coordenadas, un tomo H(2) en el plano ZY, con el eje de simetra vertical al plano de los tres tomos H y todos ellos con coordenadas Z <
0. De esta forma una rotacin de 120 en sentido horario alrededor de este
eje, vista desde arriba, va a transformar la posicin de H(2) en la del tomo
H(3), la de H(3) en la de H(4), y la de H(4) en la de H(2). Con una nueva rotacin de 120 en sentido horario, el resultado final de las dos rotaciones se
resume en los cambios de posicin: H(2) H(3) H(4), H(3) H(4)
H(2), H(4) H(2) H(3). En todo este proceso las coordenadas Z negativas

Fig. 4EP.4. Diagrama de la orientacin espacial de partida para la molcula de amonaco, en un


sistema de ejes fijo en el espacio (Problema 8).

249

CLCULO NUMRICO Y ESTADSTICA APLICADA

de los tomos H permanecen idnticas; las coordenadas X e Y estn relacionadas mediante las consabidas matrices de rotacin bidimensionales y se
pueden generar a partir de las de H(2). Las coordenadas de H(2) son
H(2) = (X2, Y2, Z2) = (0, 1,008 cos 17,3, 1.008 sen 17,3)
y las coordenadas XY de H(3) [q = 120] y H(4)[q = 240 120] se obtienen
de las relaciones
X = X2 cos q + Y2 sen q

q en sentido horario (+)

Y = X2 sen q + Y2 cos q
Efectuando estas operaciones se tienen las coordenadas iniciales (redondeos a 6 decimales)
Tabla (b1). Problema 4.8
TOMO

X()

Y()

Z()

N(1)

H(2)

0,962399

0,299754

H(3)

0,833462

0,481199

0,299754

H(4)

0,833462

0,481199

0,299754

La posicin del centro de masa es pues


XCM = 0, YCM = 0, ZCM = 0,053217
y las coordenadas relativas (x, y, z) a esta posicin CM son
Tabla (b2). Problema 4.8

250

TOMO

X()

Y()

Z()

N(1)

0,053217

H(2)

0,962399

0,246537

H(3)

0,833462

0,481199

0,246537

H(4)

0,833462

0,481199

0,246537

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

La matriz de inercia tiene por elementos


Ixx = 1,623625

Iyy = 1,623625

Izz = 2,800378

Ixy = Iyx = Ixz = Izx = Iyz = Izy = 0


La eleccin de geometra ha factorizado el determinante y los momentos
principales de inercia son los valores diagonales. Como antes, y para ilustrar
situaciones de inters en el caso de races mltiples de orden par, va a procederse siguiendo el modo general determinando las races del polinomio de
tercer grado
P(3) = I3 + aI2 + bI + c

a = 6,047627

b = 11,729681

c = 7,382235

La tabla de signos es muy particular. Una primera tabulacin sencilla


produce
I

10

15

sgn P(3)(I)

y espaciados ms finos indican que slo hay un cambio de signo localizado


entre 2 < I < 3. Hay una raz en ese intervalo y como debe haber tres en total
y todas reales, por ser la matriz de inercia simtrica (Cap. 9), las dos que faltan deben constituir una raz doble. Este comportamiento es el mismo que
en x2 = 0, en donde no hay cambio de signo en la funcin alrededor de x = 0.
Utilizando el algoritmo de Newton se encuentran los resultados siguientes
In + 1 = In j

In3 + aIn2 + bIn + c


3 In2 + 2 aIn + b

I1,0 = 2 (j = 2)

I3,0 = 5 (j = 1)

I1,1 = 1,507926

I3,1 = 4,044867

I1,2 = 1,618668

I3,2 = 3,431206

I1,3 = 1,623614

I3,3 = 3,059689

I1,4 = 1,623625

I3,4 = 2,869179

I1,5 = 1,623625

I3,5 = 2,807222
I3,6 = 2,800456
I3,7 = 2,800378
I3,8 = 2,800378

251

CLCULO NUMRICO Y ESTADSTICA APLICADA

La molcula de amonaco es del tipo trompo-simtrico y sus momentos


de inercia a 6 decimales son
I1 = I2 = 1,623625 amu. 2,

I3 = 2,800378 amu. 2

La determinacin de las direcciones de los ejes principales de inercia se


realiza resolviendo un sistema de ecuaciones en una forma similar a lo
mostrado en el Cap. 9 (diagonalizacin).

Problema 4.9
La condicin de anulacin de la fuerza F implica que las dos componentes deben ser simultneamente nulas. Se tiene as

f ( x, y) =

g( x, y) =

V
= 0, 5 ( x 2) cos x sen y = 0
x
V
= senx cos y + 0, 75 ( y 3) = 0
y

y las derivadas parciales necesarias para la aplicacin del mtodo son


fx = 0,5 + l sen x sen y

fy = l cos x cos y

gx = l cos x cos y

gy = l sen x sen y + 0,75

Utilizando el mtodo de Newton los resultados, redondeados a 6 decimales, se resumen a continuacin.


f ( xn , yn ) = hn fx ( xn , yn ) + kn f y ( xn , yn )
xn+1 = xn + hn

; n = 0,1, 2, 3,...

yn+1 = yn + kn
g( xn , yn ) = hn gx ( xn , yn ) + kn g y ( xn , yn )
a) l = 0,1

252

(x0, y0) = (2, 3)

V0 = 0,012832

(x1, y1) = (1,978977, 2,880857)

V1 = 0,018228

(x2, y2) = (1,979575, 2,881759)

V2 = 0,018228

(x3, y3) = (1,979575, 2,881759)

V3 = 0,018228

RESOLUCIN NUMRICA DE ECUACIONES Y SISTEMAS

b) l = 0,2
(x0, y0) = (2, 3)

V0 = 0,025664

(x1, y1) = (1,940279, 2,761546)

V1 = 0,046972

(x2, y2) = (1,946540, 2,768950)

V2 = 0,047002

(x3, y3) = (1,946558, 2,768963)

V3 = 0,047002

(x4, y4) = (1,946558, 2,768963)

V4 = 0,047002

c) l = 0,5
(x0, y0) = (2, 3)

V0 = 0,064160

(x1, y1) = (1,720251, 2,376382)

V1 = 0,177081

(x2, y2) = (1,831897, 2,483578)

V2 = 0,188336

(x3, y3) = (1,839050, 2,489175)

V3 = 0,188369

(x4, y4) = (1,839076, 2,489196)

V4 = 0,188369

(x5, y5) = (1,839076, 2,489196)

V5 = 0,188369

Si no hubiera perturbacin, l = 0, el mnimo del potencial V(l = 0) = 0


estara en (x0, y0) = (2, 3). El efecto de esta perturbacin es desplazar el
mnimo hacia posiciones ms prximas al origen de coordenadas. En estos
resultados hay que notar la ms rpida convergencia relativa del valor del
potencial que la de la posicin del mnimo.

253

II
INTRODUCCIN A LA TEORA Y APLICACIONES
DE LA ESTADSTICA

5. Distribuciones de probabilidad
6. Muestreo, estimacin y decisin estadstica
7. Correlacin, regresin y estadstica no paramtrica

CAPTULO 5
DISTRIBUCIONES DE PROBABILIDAD

5.1.
5.2.
5.3.
5.4.
5.5.
5.6.
5.7.

Probabilidad, Estadstica y Qumica


Variables aleatorias, poblacin y muestra
Funciones de distribucin de probabilidades
Caracterizacin de una distribucin de probabilidad
Ejemplos de distribuciones discretas
Ejemplos de distribuciones continuas
Composicin de variables aleatorias

Bibliografa
Problemas tericos y numricos

La Qumica como tal est plagada de aplicaciones, tanto experimentales como


tericas, en las que los razonamientos estadsticos que involucran variables aleatorias y distribuciones de probabilidad son indispensables tanto para entender y
formular los problemas, como para obtener soluciones aceptables de ellos. Para
ilustrar todas estas interrelaciones se da primeramente una discusin en la que se
presentan los conceptos bsicos de probabilidad, del razonamiento estadstico, y
de las aplicaciones en la Qumica de estas herramientas matemticas. Se dan
seguidamente las definiciones bsicas de variables aleatorias, de poblacin y
muestra, y se pasa a discutir las funciones de distribucin de probabilidades
(densidad e integral) en los casos discreto y continuo para variables monodimensionales. Despus se estudian los parmetros que permiten caracterizar una
poblacin (valor medio, desviacin tpica, etc.) y se contina con el estudio de
ejemplos discretos en una dimensin: la distribucin binomial (til para estudiar
situaciones divalentes, como las redes de espines ); la distribucin de Poisson
(til para estudiar fluctuaciones en volmenes pequeos o la desintegracin de sustancias radiactivas), y la distribucin multinomial que generaliza la binomial. El
punto siguiente es el de los ejemplos de distribuciones continuas en una dimensin: la distribucin uniforme (sorteos al azar), y la omnipresente distribucin
Gaussiana (ley de errores y de las velocidades moleculares en un gas Maxwell), de la que se resalta su importancia general como ley lmite (teorema cen-

257

CLCULO NUMRICO Y ESTADSTICA APLICADA

tral del lmite). Por ltimo, se considera la composicin de variables aleatorias y


los valores medios y dispersiones de estas composiciones, concluyendo con una
breve nota sobre las distribuciones multidimensionales en general y sobre la
descripcin de stas mediante la representacin en cluster.
Variables aleatorias

Poblacin

Muestra

Funciones densidad e integral


CASOS MONODIMENSIONALES: DISCRETO Y CONTINUO
Parmetros
Media
Varianza
Momentos en general

Ejemplos
Caso discreto:
Binomial
Poisson
Multinomial

Caso continuo:
Uniforme
Gaussiana (normal)
Log-normal

Variables derivadas
Transformaciones simples
Composicin

CASO N-DIMENSIONAL
Independencia
Dependencia
Covarianza
Clusters

Caps. 6, 7, 8, 10

5.1. Probabilidad, Estadstica y Qumica


El concepto de probabilidad
Los primeros intentos conocidos de cuantificar en trminos matemticos
las posibilidades de que determinados sucesos de entre un conjunto de ellos
pudieran observarse tuvieron lugar hacia mediados del s. XVII y estaban
ligados a los juegos de azar. Al concepto emergente detrs de esta cuantificacin del azar (o aleatoriedad) se le denomin probabilidad y en su clarificacin inicial intervinieron matemticos de primera lnea como Pascal y Fermat (s. XVII), Bernouilli (1713), de Moivre (1718, 1756), hasta culminar en
Laplace (1812). El desarrollo conceptual de la Teora de Probabilidades no
acab entonces, pues fue entremezclndose paralelamente con el desarrollo
de la Estadstica hasta bien entrado el s. XX. Ambas disciplinas forman hoy
parte obligada de los estudios cientficos tanto en su vertiente pura, en lo que
se suelen llamar ciencias duras (Matemticas, Fsica, Qumica, etc.), como
en la vertiente aplicada en las ciencias sociales.

258

DISTRIBUCIONES DE PROBABILIDAD

Inicialmente, la probabilidad de aparicin de un suceso S1 en un juego


acab identificndose como el cociente del nmero de casos favorables para
la presentacin del suceso entre el nmero total de casos posibles que se
podran dar en la realizacin del juego en cuestin. La probabilidad quedaba as definida como un nmero que forzosamente quedaba comprendido
entre 0 y 1
0 p( S1 ) =

nmero decasos favorables


1
nmero decasoss posibles

(5.1.1)

Esta es la conocida como definicin clsica de probabilidad. Hay que


notar que hubo necesidad de tener que identificar con claridad cada uno de
los dos factores del cociente anterior. En juegos sencillos con resultados
excluyentes, como el de arrojar una moneda, con dos resultados (cara y
cruz), o un dado cbico, con seis resultados uno por cada cara, ambos factores resultaban en principio evidentes. Sin embargo, en juegos ms complicados en los que intervenan decisiones lgicas con posibilidades no
necesariamente excluyentes (lanzamientos sucesivos de varios dados o juegos de naipes con extracciones, todos ellos dependientes de condiciones
diversas, etc.) estos factores dejaban de ser tan fcilmente identificables.
Todo ello forz el desarrollo del anlisis combinatorio como una manera fiable de efectuar recuentos (se suele definir esta disciplina como el arte de
contar sin contar).
Es muy importante reparar en que dentro de la definicin clsica (5.1.1)
est contenido un elemento de simetra subyacente que implica que, a falta
de informacin adicional, todos los sucesos posibles son igualmente probables. Este es el denominado principio de igualdad de probabilidades a priori y
se trata de una definicin que plantea la dificultad de incluir lo definido (probabilidad) en la definicin. Por otra parte, si un dado est cargado y favorece la salida de una cualquiera de sus caras sobre las dems, o si la baraja
de naipes est trucada, o si existe alguna causa no necesariamente fraudulenta que haga desaparecer la simetra aludida, entonces (5.1.1) deja de ser
aceptable como definicin de probabilidad. Por ejemplo, ante la eleccin del
primer plato de un men por los componentes de un grupo de personas desconocidas entre una oferta de cuatro posibilidades, un observador imparcial
asignara una probabilidad de un 25% a cada uno de los platos, asignacin
que podra ser mucho ms precisa si el observador conociera informacin
adicional sobre los hbitos de los sujetos. La consecuencia es pues que la

259

CLCULO NUMRICO Y ESTADSTICA APLICADA

definicin (5.1.1) es una formulacin ideal de la cuantificacin de la posibilidad: el dado se considera perfecto, uniforme y homogneo, la baraja sin
trucos, los comensales absolutamente impredecibles, etc. Su aplicacin queda restringida a lo que se denominan espacios equiprobables.
Por otra parte, los inicios de la Estadstica como ciencia realmente cuantitativa comenzaron en el s. XVIII con la incorporacin de los conceptos probabilistas existentes mencionados al anlisis de muchas cuestiones que
podan investigarse estudiando grandes poblaciones humanas. Las respuestas obtenidas fueron de gran valor, lo que explica el gran auge en aquellos
tiempos de los estudios de las relaciones edad-mortalidad y del desarrollo de
los consiguientes seguros de vida. La extensin de este tipo de razonamientos fue rpida y no ha cesado. Hoy es comn saber de estudios de los controles estadsticos de calidad en la produccin de bienes y servicios, o de
estudios de las poblaciones humanas para averiguar los hbitos de consumo,
aficiones y dems, que contribuyen a dinamizar (aunque no siempre) la
actividad econmica.
Paralelamente al desarrollo del concepto ideal expresado en (5.1.1) se fue
observando que en condiciones controladas las frecuencias relativas fr de los
sucesos tendan hacia los correspondientes valores indicados por (5.1.1) al
aumentar el nmero de ensayos. As, al arrojar un dado cbico, tan perfecto
como poda conseguirse, el nmero de veces m que se presentaba una cualquiera de sus caras dividido por el nmero total de veces n que se arrojaba el
dado se acercaba a la razn simtrica esperada fr = m/n 1/6 (n creciente),
y tanto ms cuanto mayor se haca n. Lo mismo se observ en otros muchos
casos de diferente naturaleza y este efecto de estabilidad de las frecuencias
relativas ofreci finalmente la alternativa de expresar la probabilidad de un
suceso como la frecuencia relativa de ste al realizar un nmero muy grande
de ensayos. La generalizacin natural como paso al lmite de infinitos ensayos da una nueva definicin de probabilidad de naturaleza estadstica
p = lim fr = lim
n `

n `

m
n

(5.1.2)

en la que, a efectos prcticos, interviene explcitamente la consideracin de


grandes nmeros. Sin embargo, desde un punto de vista matemtico formal
esta definicin, aunque de gran valor operativo, tampoco resulta completamente satisfactoria, pues hay que definir cmo realizar una secuencia infi-

260

DISTRIBUCIONES DE PROBABILIDAD

nita de experimentos en la que se mantengan ciertas condiciones fijas durante un tiempo ilimitado, de manera que el lmite expresado tenga sentido.
Todo esto no es hoy un problema pues se ha construido una teora de la probabilidad que permite una presentacin axiomtica ligada a la teora de
conjuntos.

Breve presentacin axiomtica de la probabilidad


Se define la probabilidad p de un suceso como un nmero 0 p 1 tal
que
p(Sk ) = 0

Sk = suceso imposible

p(Sk ) = 1

Sk = suceso seguro (cierto)

(5.1.3)

Se denomina espacio muestral S al conjunto de todos los sucesos (resultados), S1, S2, ..., Sk,... que pueden aparecer en un experimento aleatorio, en
donde la definicin precisa del experimento delimita los sucesos que pueden
presentarse. Estos espacios pueden ser discretos o continuos. Los espacios
discretos a su vez pueden ser finitos (las seis caras de un dado que pueden
salir al arrojarlo), o infinitos pero numerables, es decir que admitan una
ordenacin, incluyendo el 0, con los nmeros naturales: 0, 1, 2, 3, ,..., n, ...
(por ejemplo, para un dado descargado en una de sus caras el nmero de
tiradas necesarias hasta que aparezca sta pudiera ser n ). Los espacios
continuos no son numerables, como son los resultados dentro del rango
marcado por un intervalo de nmeros reales, por ejemplo 0 < x < 1. Los sucesos pueden ser mutuamente excluyentes o no y, adems, pueden componerse
entre s para dar otros nuevos sucesos. La exclusin implica que no hay
solapamientos entre ellos, o aparece uno o aparece el otro, pero no los dos a
la vez. Las operaciones de composicin bsicas son la suma (unin) y el
producto (interseccin). Para dos sucesos mutuamente excluyentes la probabilidad de su suma se formula
p(S1 + S2 ) = p( S1 ) + p(S2 )

(5.1.4)

y representa la probabilidad de que aparezca S1 o S2 (la ocurrencia de al


menos uno de los dos). Una posibilidad adicional es la de sucesos independientes (o no). Si dos sucesos son independientes (o estocsticamente inde-

261

CLCULO NUMRICO Y ESTADSTICA APLICADA

pendientes), la probabilidad de su producto, o aparicin conjunta de


ambos S1 y S2, se formula
p(S1S2 ) = p(S1 ) p( S2 )

(5.1.5)

y cuando los sucesos son mutuamente excluyentes se tiene que p(S1S2 ) = 0.


Las anteriores son circunstancias muy particulares y, en general, se tienen las dos relaciones bsicas siguientes que tienen en cuenta los posibles
solapamientos y la no independencia de sucesos
p( S1 + S2 + S3 + ...) p(S1 ) + p( S2 ) + p(S3 ) + ...

(5.1.6)

p( S1S2 ) = p(S1 S2 ) p( S2 )

(5.1.7)

en donde el signo < en (5.1.6) expresa la posibilidad de que una o ms parejas de sucesos tengan tales solapamientos, y (5.1.7) expresa la posibilidad de
que aparezca S1 cuando se sabe que S2 ya ha ocurrido. La cantidad p(S1S2)
es la probabilidad condicional asociada a este ltimo hecho y se reduce a
(5.1.5) para sucesos independientes. Cuando por otra parte un conjunto de n
sucesos verifica
p(S1 + S2 + S3 + ... + Sn ) = p(S1 ) + p(S2 ) + p(S3 ) + ... + p( Sn ) = 1

(5.1.8)

se dice que los n sucesos forman un sistema completo S = S1 + S2 + S3 +...+ Sn

y se define el suceso complementario S k de uno dado Sk como aquel que consiste en que Sk no aparezca, verificndose
Sk = S Sk = S1 + S2 + ... + Sk 1 + Sk +1 + ... + Sn

(5.1.9a)

p(Sk ) = 1 p( Sk ) Sk = suceso complemetario de Sk

(5.1.9b)

Por completitud, se considerar tambin la operacin general resta de


sucesos, en la que S1 = S2 S3 es el suceso que resulta de eliminar de S2 todo
aquello que pueda tener en comn con S3, y la probabilidad se expresa
p(S1 ) = p( S2 S3 ) = p( S2 + S3 ) p(S3 ) = p(S2 ) p(S2 S3 )

262

(5.1.10)

DISTRIBUCIONES DE PROBABILIDAD

es decir, la probabilidad de que se presente S2 eliminando toda traza de que


S3 lo haga a la vez. Todas estas relaciones junto con diagramas de conjuntos
(Venn) permiten obtener los principales resultados del lgebra de probabilidades. No se pretende aqu dar una presentacin exhaustiva de este tema,
sino slo suministrar los conceptos bsicos que permitan comprender lo
que sigue, aunque en los ejercicios siguientes se dan algunas ampliaciones. Se
remite al lector a referencias especializadas para ampliar detalles.
EJERCICIO 5.1.1
Deducir la expresin general de la probabilidad para la suma de un conjunto de tres sucesos arbitrarios. Generalizar la expresin al caso de n sucesos.
La probabilidad pedida es p(S1 + S2 + S3) que representa la probabilidad
de que al menos uno de los tres sucesos ocurra. Por la propiedad asociativa
de la suma de sucesos puede escribirse p(S1 + S2 + S3) = p((S1 + S2) + S3) =
p(S12 + S3). Es sencillo darse cuenta de que para la suma de slo un par de
sucesos arbitrarios su probabilidad debe ser
p(A + B) = p(A) + p(B) p(AB)
en donde el trmino p(B) se introduce para evitar contar dos veces una misma cosa debida al solapamiento (interseccin) de A y B. Si este solapamiento fuera nulo, ambos sucesos seran excluyentes y la expresin se reducira a
la ecuacin (5.1.4). Por tanto, utilizando la propiedad distributiva del producto sobre la suma, se pueden escribir las relaciones
p(S1 + S2 + S3 ) = p(S12 + S3 ) = p(S12 ) + p(S3 ) p( S12S3 )
p(S12 ) = p(S1 ) + p( S2 ) p(S1S2 )

p(S12 S3 ) = p (S1 + S2 )S3 = p S1S3 + S2 S3 = p(S1S3 ) + p(S2 S3 ) p(S1S2 S3 )


en donde p(S1S2S3) es la probabilidad de que los tres sucesos ocurran a la
vez. Todo ello conduce finalmente a la expresin
p(S1 + S2 + S3 ) = p( S1 ) + p(S2 ) + p( S3 ) p(S1S2 ) p(S1S3 ) p(S2 S3 ) + p(S1S2 S3 )
Esto puede generalizarse sin dificultad para un nmero n arbitrario de
sucesos

263

CLCULO NUMRICO Y ESTADSTICA APLICADA

p( S1 + S2 + S3 + ... + Sn ) = p(S1 ) + p(S2 ) + p( S3 ) + ... + p( Sn )


p(S1S2 ) p( S1S3 ) ... p( S2S3 ) ... p(Sn 1Sn )

+ p(S1S2S3 ) + p(S1S2S4 ) + ... + p( Sn 2Sn1Sn ) + ... + ( 1

n 1

p( S1S2 S3 ...Sn )

EJERCICIO 5.1.2
En un determinado proceso industrial una fbrica produce viales con disoluciones de una sal de hierro que deben satisfacer ciertos controles de calidad.
La produccin de un da se distribuye en N cajas iguales y para contrastar su
calidad se envan estas cajas a cuatro laboratorios diferentes: NA cajas al laboratorio A, NB cajas al laboratorio B, NC cajas al laboratorio C, y ND cajas al
laboratorio D (N = NA + NB + NC + ND). Cada laboratorio utiliza un equipamiento y mtodo no destructivo distintos para decidir si las disoluciones son o
no aceptables. Por experiencia pasada, se sabe que las aceptaciones de viales
por cada laboratorio son: A acepta un 95%, B acepta un 90%, C acepta un
97%, y D acepta 92%. De vuelta todas las cajas en la fbrica se elige al azar una
de ellas y de sta a su vez un vial, tambin al azar. Si una vez analizado su contenido resulta defectuoso, cul es la probabilidad de que el anlisis lo haya realizado el laboratorio A?
Esta es una aplicacin del conocido teorema de Bayes. Suponiendo simetra entre las cajas de la produccin, la caja seleccionada al azar tendr las
siguientes probabilidades a priori de procedencia

A =

NB
NA
; B =
;
N A + NB + NC + ND
N A + NB + NC + ND

C =

NC
ND
; D =
.
N A + NB + NC + ND
N A + NB + NC + ND

Por otra parte, las probabilidades condicionales de que el vial sea defectuoso en funcin de cada caja son
pA = 1 pA = 1 0, 95 = 0, 05;

pB = 1 pB = 1 0, 90 = 0,10;

pC = 1 pC = 1 0, 97 = 0, 03; pD = 1 pD = 1 0, 92 = 0, 08

264

DISTRIBUCIONES DE PROBABILIDAD

que se obtienen como las complementarias de las de las aceptaciones respectivas.


El suceso Q vial defectuoso es la suma de cuatro sucesos compuestos
mutuamente excluyentes:
elegir una caja de las analizadas por el laboratorio A y elegir un vial
defectuoso (Q)
elegir una caja de las analizadas por el laboratorio B y elegir un vial
defectuoso (Q)
elegir una caja de las analizadas por el laboratorio C y elegir un vial
defectuoso (Q)
elegir una caja de las analizadas por el laboratorio D y elegir un vial
defectuoso (Q)
Q = SA Q + SB Q + SC Q + SD Q
y su probabilidad es
p(Q ) = p(SA Q ) + p(SB Q) + p( SC Q) + p(SD Q )
Ahora bien, cada una de estas probabilidades p(SkQ) implica un elemento condicional
p(QSk ) = p(Sk Q) = p( Sk ) p(Q Sk ) = p( Q) p(Sk Q)
y en las condiciones del problema se tiene
p(Sk ) = k ;

p(Q Sk ) = pk ; k = A, B, C , D

As, la probabilidad de Q resulta


p(Q ) = A pA + B pB + C pC + D pD
y la probabilidad de p(SkQ) es sencillamente

265

CLCULO NUMRICO Y ESTADSTICA APLICADA

qk = p( Sk Q ) =

p(Sk ) p(Q Sk )
p(Q )

k pk
A pA + B pB + C pC + D pD

(teorema de Bayes)

Por tanto, la probabilidad de que el anlisis lo haya realizado el laboratorio A es


qA =

NA pA
A pA
=
=
A pA + B pB + C pC + D pD N A pA + N B pB + NC pC + ND pD
0, 05. N A
0, 05 . NA + 0,10 . NB + 0, 03 . NC + 0, 08 . ND

lo que se puede visualizar como en correspondencia con la definicin clsica de probabilidad (5.1.1) que utiliza la simetra como argumentacin, sin
ms que considerar con relacin al resultado de vial defectuoso: el numerador como proporcional al nmero de casos favorables al resultado, y el
denominador como proporcional al nmero total de casos posibles para el
resultado (un pequeo diagrama en rbol con trayectorias excluyentes ayuda a visualizar todo el razonamiento anterior, Fig. 5.T1). Conviene reparar
en que el clculo de probabilidades anterior se corresponde tambin con la
determinacin de una probabilidad a posteriori de que la caja haya sido
analizada por el laboratorio A, habiendo considerado la hiptesis de partida
de que se conoce que el vial es defectuoso.

Figura 5T.1. Diagrama en rbol para la aplicacin del teorema de Bayes del Ejercicio 5.1.2.

266

DISTRIBUCIONES DE PROBABILIDAD

Otras observaciones y las aplicaciones en la Qumica


El enfoque probabilista es deductivo y de prediccin en general a priori, y
con las condiciones de simetra (o asimetra) bien definidas puede aplicarse a
un objeto individual. Se trata de dar respuestas probabilistas a los sucesos
potencialmente posibles, es decir antes de que ocurran. El razonamiento
matemtico deductivo, con la obtencin de leyes ideales de referencia, juega
un papel fundamental en las ciencias naturales (por ejemplo, la desintegracin de sustancias radiactivas). En Qumica (y en Fsica) una disciplina terica bsica, de naturaleza probabilista, para la comprensin de las propiedades de la materia es la Qumica Cuntica, o en general la Mecnica
Cuntica. Tras mucha discusin sobre su naturaleza, probabilista versus
estadstica, desde su creacin (Heisenberg, 1925, 1927; Schrdinger, 1926),
hoy se sabe que el tratamiento cuntico es probabilista, es decir que puede
aplicarse a un solo objeto: un electrn, un tomo, una molcula, etc., y produce resultados consistentes y comprobables experimentalmente en el laboratorio. La validez de este tipo de tratamiento matemtico para estudiar, por
ejemplo, tomos y molculas como tales, no est as ligada a la consideracin de un gran nmero de objetos y a la realizacin de evaluaciones estadsticas sobre ellos.
Por otra parte, el enfoque estadstico presenta varias alternativas a considerar: inductiva, descriptiva, y terica. Aunque las tres alternativas pueden aparecer mezcladas en muchas aplicaciones, las dos primeras son las
que suelen identificarse automticamente con los estudios estadsticos de
conjuntos de datos y estn ligadas principalmente a la experimentacin en
todas sus formas (incluso numrica) y ensayos de relaciones empricas, en
tanto que la tercera est fuertemente enraizada en el trabajo terico y requiere muchas ms manipulaciones matemticas de corte analtico.
La estadstica inductiva realiza predicciones a posteriori (inferencia estadstica). Aqu, primero hay que realizar los ensayos o experimentos para
poder despus extraer las conclusiones de los datos obtenidos, cuantificadas
mediante probabilidades, y relativas a los sucesos que han ocurrido o que
cabe esperar que se presenten en circunstancias ms amplias (una extrapolacin guiada). En muchas circunstancias un nmero elevado de objetos
se someten a estudio, pero las conclusiones no se aplican a ninguno de ellos
en particular, son propiedades del conjunto. Como el estudio de grandes
poblaciones no es posible de llevarlo a cabo al detalle, objeto por objeto, se

267

CLCULO NUMRICO Y ESTADSTICA APLICADA

selecciona un grupo representativo (muestra) para estudio y a partir de los


resultados obtenidos con tal grupo se infiere lo que puede suceder en la
poblacin global, dando respuestas en forma de porcentajes probabilistas
que se espera sean significativos. No obstante, tambin pueden estudiarse
muestras pequeas con ayuda de la Teora de pequeas muestras. Todo
esto conlleva ciertos elementos de incertidumbre que deben valorarse adecuadamente para dar los mrgenes de fiabilidad del estudio. Esta es la
manera habitual de proceder en el trabajo experimental en un laboratorio
qumico (o de cualquier otra ciencia experimental), en el que se determinan
valores de magnitudes y sus errores, se contrastan hiptesis para decidir
sobre el control de calidad de productos, etc. Por otra parte, la estadstica
descriptiva (o deductiva) se ocupa de estudiar las caractersticas de un conjunto dado de objetos o datos, sin pretender inferir a partir de los resultados
obtenidos lo que sucedera en otras circunstancias ms amplias. Tambin es
utilizada como herramienta de ayuda en el trabajo experimental de laboratorio.
Pero hay todava ms que decir del enfoque estadstico en las ciencias
experimentales, en particular en Qumica y en Fsica, y es el hecho de la
emergencia de leyes muy generales e independientes del sistema concreto
estudiado. Estas leyes estn ligadas a la existencia de grandes nmeros (grandes poblaciones), como es el caso del estudio de sistemas compuestos de
muchas partculas. Estos grandes nmeros son tpicamente N ~ 1023 1024,
del orden del nmero de Avogadro (N0 6.1023), una cantidad que no es infinita, pero que a efectos prcticos puede tomarse como tal N en muchas
aplicaciones. Lo mismo sucede obviamente con nmeros mayores de partculas e incluso con otros significativamente menores como N ~ 1018, etc. Es
aqu donde entra de lleno lo que se ha denominado antes estadstica terica.
Un ejemplo muy conocido de este tipo de tratamiento es el de la Teora
Cintica de Gases con su distribucin clsica de velocidades (Maxwell, 1863,
1875; Boltzmann, 1868), que utiliza la denominada y omnipresente distribucin Gaussiana. En esta aplicacin efectivamente no se puede decir la
velocidad concreta que lleva una molcula de un gas a una temperatura (y
densidad) dada, pero s se puede responder a cuestiones como la del porcentaje de molculas que poseen el mdulo de su velocidad entre lmites prefijados, u otras muchas. Estas leyes tan generales surgen del razonamiento
matemtico abstracto una vez fijados determinados axiomas o condiciones
previas, y su validez puede contrastarse en el laboratorio. En este sentido,

268

DISTRIBUCIONES DE PROBABILIDAD

para la Qumica y la Fsica las disciplinas que permiten estudiar tericamente (tambin hay que utilizar el Clculo Numrico!) sobre bases estadsticas los sistemas compuestos de muchas partculas son la Mecnica y la Termodinmica Estadsticas (Boltzmann, 1896-1898; Gibbs, 1902), de las que la
Teora Cintica es una sencilla aplicacin.
Es dentro de este contexto, quiz, donde el concepto de probabilidad tiene su mxima expresin en la caracterizacin de fenmenos irreversibles.
Por ejemplo, un objeto abandonado a s mismo en un campo gravitatorio cae
hasta alcanzar una situacin estable (mnimo de energa potencial). Este es
un hecho natural y observado siempre. Sin embargo, el fenmeno contrario,
es decir, el ascenso sin causa aparente del objeto hasta la posicin de la que
cay no se observa. Se dice que es un suceso imposible. Por otra parte,
nada impide que en una extraa fluctuacin las molculas de aire empujen
al objeto justamente de esa manera fantasmal y lo eleven en el aire. La
cuestin est en que la probabilidad de este chocante suceso es minscula,
de una entre 10N, con N igual al nmero de molculas. Slo para N igual al
nmero de Avogadro tal probabilidad ya es un nmero despreciable que
indica que se debera esperar un tiempo del orden de la edad del Universo o
mayor para observar este fantstico fenmeno. Se dice entonces que en
probabilidad determinados sucesos son altamente o muy improbables, no
imposibles.
A la vista de toda la potencialidad anterior es fcil comprender que el
enfoque estadstico puede ayudar a comprender y manejar con provecho
situaciones o problemas extremadamente complicados. Renunciando al
conocimiento objetivo completo, en principio accesible, de lo que le sucede
a cada objeto, se obtienen resultados prcticos de gran valor. Por ejemplo, y
elaborando un poco ms el caso mencionado de las molculas de un sistema
termodinmico, un gas o un lquido a una determinada temperatura y densidad, conocido el potencial intermolecular que acta entre una pareja de
molculas (despreciando efectos de deslocalizacin cuntica) se puede estudiar el movimiento de stas resolviendo las ecuaciones de Newton (Cap. 9) y
determinar sus trayectorias. Esto suministrara el conocimiento completo del
estado del sistema termodinmico. Sin embargo esta tarea para un sistema
de ~1023 partculas desborda las capacidades de clculo y, adems (aparte de
problemas numricos), la ingente cantidad de informacin resultante, caso
de poderse obtener, sera muy complicada de manejar y por ello poco til.
Sin embargo, el estudio estadstico en el sentido mencionado arriba, renun-

269

CLCULO NUMRICO Y ESTADSTICA APLICADA

ciando a conocer con detalle la trayectoria de cada partcula, permite obtener numricamente los valores promedio significativos de las propiedades
del sistema, propiedades que junto con sus fluctuaciones pueden medirse
experimentalmente. Esto es abordable y gratificante, pues resulta ms que
suficiente para realizar estudios de gran valor tanto para el avance del conocimiento como para las aplicaciones prcticas (diseo de nuevos materiales:
cristales fotnicos, nanotubos, etc.).
Finalmente, los enfoques probabilista y estadstico no son necesariamente excluyentes. Siguiendo con los ejemplos de inters en Qumica, el
estudio de sistemas compuestos por muchas partculas a temperaturas suficientemente bajas (menores de unas pocas decenas de grados K), condiciones en las que las caractersticas cunticas de la materia se manifiestan de
manera significativa (a densidades crecientes se intensifican), los dos enfoques, el probabilista y el estadstico, son necesarios y complementarios. La
disciplina que se ocupa del estudio de estos fenmenos se llama Mecnica
Estadstica Cuntica.
5.2. Variables aleatorias, poblacin y muestra
Los conceptos desarrollados en el epgrafe anterior permiten hacerse
una idea de lo que se entiende por un suceso aleatorio. Un experimento o
ensayo se denomina aleatorio cuando no puede establecerse por anticipado
el resultado que se va a obtener, pues sobre l influyen muchas y muy
diversas causas cuyos efectos o no pueden cuantificarse, o son tantos que
esta operacin no resulta prctica y se prefiere simular la situacin mediante algn diseo estadstico. Los resultados que se obtienen son generalmente diferentes cada vez que se realiza el experimento y existe pues una componente de azar en todo el proceso. Aunque no siempre estos resultados van
a estar relacionados con valores numricos, tpicos de las operaciones de
conteo, en muchos casos nada impide adoptar convenciones para caracterizar cada uno de estos resultados mediante uno o varios valores numricos. A
la magnitud que puede tomar todos estos valores se la define como la variable aleatoria asociada al experimento. Por sencillez se discutirn aqu las
variables aleatorias X que quedan definidas mediante un solo nmero
(monodimensionales), como por ejemplo la variable continua que describe la
posicin x de una partcula que se mueve a lo largo de la recta real (o de un
segmento de ella), o la variable discreta que toma los valores de un conjunto

270

DISTRIBUCIONES DE PROBABILIDAD

numerable como el nmero de tomos radiactivos que se desintegran en un


tiempo dado. Los dominios de estas variables pueden evidentemente ser
finitos (caso discreto) o infinitos (casos discreto y continuo). Tambin puede
darse el caso de una variable aleatoria mixta que presente a la vez las dos
caractersticas, discreta y continua, en cuyo caso su dominio presentar
una parte discreta y otra continua. Un ejemplo de este ltimo caso discretocontinuo es la energa de un electrn en el campo creado por un ncleo atmico (carga positiva): cuando el electrn est ligado al ncleo su energa
toma valores discretos (estados estacionarios), pero si se ioniza la energa
toma valores continuos (estados de colisin). No se tratarn estos casos
especiales mixtos aqu. El concepto de variable aleatoria se generaliza con
facilidad al caso multidimensional expresando la variable aleatoria como un
vector que se denotar en negrita X, de la que pueden ser ejemplos el vector
de velocidad V = (vx, vy, vz) de una partcula browniana que se mueve en tres
dimensiones sujeta a fuerzas fluctuantes, o la variable que describe la desintegracin de dos sustancias radiactivas v = (v1, v2).
Desde la perspectiva ms general de la estadstica terica la cuestin
central est en conocer la probabilidad de que la variable aleatoria X tome
los valores de su dominio de definicin. As, en el caso discreto habr que
conocer todas las probabilidades P(X = vi) = pi de todos y cada uno de los
sucesos posibles vi, mientras que en el caso continuo la cuestin hay que
reformularla como el conocimiento de todas las probabilidades en intervalos
P(xi < X xj) con xi y xj arbitrarios y pertenecientes al dominio de la variable.
Cuando se conocen estas probabilidades se dice que se conoce la distribucin
de probabilidad de la variable aleatoria correspondiente, y el clculo analtico que esta distribucin permitir obtener todas las propiedades significativas del experimento estudiado (muchas veces denominado el sistema) a travs de una serie de parmetros caractersticos. Estos parmetros responden
a preguntas como las siguientes: cul es el valor de la variable que ocupa
una posicin central en la distribucin (la media, la mediana, la moda)?,
cul es el valor ms probable de la variable (la moda)?, cmo es la distribucin de probabilidades alrededor del valor central: simtrica, asimtrica, muy estrecha, muy dispersa, etc.?, y otras muchas. El caso terico
trata directamente con toda la poblacin relativa al fenmeno que se estudia,
poblacin que tiene un gran tamao en nmero de objetos (o individuos), lo
que hace viable y significativo el tratamiento estadstico. Es importante
notar que los parmetros poblacionales (media, desviacin tpica, etc.) estn

271

CLCULO NUMRICO Y ESTADSTICA APLICADA

perfectamente definidos mediante las correspondientes operaciones matemticas analticas y no son variables aleatorias. Ambos, la poblacin y el
fenmeno, estn contenidos y cuantificados en la distribucin de probabilidades. Por ejemplo, en el caso de un gas clsico de molculas, si se investigan cuestiones sobre sus velocidades, la poblacin es el conjunto de todas las
molculas del gas y la distribucin de probabilidades para sus velocidades es
la ley de Maxwell-Boltzmann.
Sin embargo, en las otras dos opciones de esquema estadstico, la inferencial (inductiva) y la descriptiva, se trabaja con conjuntos finitos de objetos
y datos de los que exactamente no se conoce de antemano la distribucin de
probabilidad relativa al fenmeno estudiado para la poblacin. En el caso
ms interesante, el inferencial, los datos se determinan a partir de una seleccin de objetos o individuos (muestra) tomada de un conjunto muy grande
(poblacin). Una cuestin de nomenclatura conviene ser tenida en cuenta
aqu: en el lenguaje qumico corriente se habla de muestra y de las muestras
que pueden formar esta muestra. Es importante no confundir ambos trminos y conviene insistir en que: muestra es el conjunto de elementos, objetos,
individuos, especimenes, etc., seleccionados para el anlisis estadstico; a su
vez, los objetos de este conjunto son las muestras; por otra parte, se puede
hablar de diferentes muestras en el primer sentido, es decir, como diferentes
conjuntos independientes de objetos que van a ser analizados.
El tamao de la muestra (nmero de individuos) es mucho ms pequeo
que el de la poblacin y siempre se plantea el problema de la representatividad de tal muestra. Como en el caso discutido arriba, tambin se definen
aqu parmetros caractersticos, como el valor medio de la variable (la media
aritmtica de los valores observados), medidas que indican la dispersin de la
variable en torno a su valor medio (desviacin tpica o estndar, desviacin
media, etc.). Si la muestra es representativa de la poblacin, sus parmetros
muestrales calculados sern muy prximos a los parmetros poblacionales,
que son en realidad desconocidos. Cabe esperar que cuanto mayor sea el
tamao de la muestra, mejor sern las estimaciones de los parmetros
poblacionales, aunque esto slo la experiencia con comparaciones exhaustivas es la ltima fuente de comprobacin. Garantizar la representatividad de
la muestra elegida es un asunto delicado que implica determinar los lmites
de fiabilidad de los parmetros, y como se ha sealado en muchas ocasiones
se requiere utilizar la estrategia ensayo-error hasta llegar a poder despejar las
dudas de procedimiento en la seleccin de muestras para una aplicacin

272

DISTRIBUCIONES DE PROBABILIDAD

concreta. Todos estos asuntos se tratarn en detalle ms adelante (Cap.6).


Por el momento, el punto importante aqu es sealar que los parmetros
muestrales son tambin en s mismos variables aleatorias, pues estn sujetos
a variaciones impredecibles a priori y que dependen de la muestra seleccionada, de los mtodos seguidos para la toma de datos, de la posibilidad de
errores humanos, etc. Lo dicho en este prrafo se aplica a la estadstica
descriptiva de un conjunto de datos, salvo en todo aquello que hace referencia a la inferencia poblacional. Un pequeo ejemplo adicional puede ayudar
a visualizar estas dos ltimas situaciones de corte ms prctico.
EJERCICIO 5.2.1
Discutir los conceptos anteriores considerando el problema de la extraccin
industrial de un mineral en el que se desea averiguar la riqueza en un determinado elemento metlico.
Del total de las toneladas extradas en un da (la poblacin), siguiendo
determinados protocolos establecidos, se toman N pequeas porciones para
su anlisis qumico. Este conjunto de N objetos es la muestra, cuyo tamao
es N. Realizada la determinacin del contenido de metal en cada objeto, la
estadstica descriptiva se contentara con calcular los parmetros (valor
medio, desviacin tpica, etc.), e incluso podra realizar ajustes a determinadas distribuciones tericas o leyes empricas. No obstante, la verdadera
potencia del enfoque estadstico est en el paso inferencial con el que, a
partir de la muestra, se ampliaran los resultados descriptivos anteriores
determinando de los lmites de fiabilidad (confianza) dentro de los que cabe
esperar que se encuentren los parmetros poblacionales correspondientes a
todas las toneladas extradas. El proceso puede afinarse ms y ms, tomando diversas muestras (no necesariamente iguales en tamao) y contrastando
los resultados obtenidos en todas ellas. Entran aqu los estudios de la homogeneidad de la muestra, la significacin de las variaciones en los resultados
entre diversas muestras, el contraste de hiptesis y la toma de decisiones estadsticas, los lmites de tolerancia, y otras operaciones que conducen a la
evaluacin de las etapas y de la viabilidad del proceso industrial.
Una nota final sobre la notacin con la que se designan los parmetros de
las distribuciones poblacionales y muestrales. La convencin general es la de
utilizar letras griegas para designar los parmetros poblacionales (la media
m, la deviacin tpica s, etc.) y, por otra parte, utilizar letras latinas para los

273

CLCULO NUMRICO Y ESTADSTICA APLICADA

parmetros muestrales (la media x, la desviacin tpica s, etc.). Otra convencin, coexistente con la anterior y habitual en el trabajo en Qumica y
Fsica Tericas con funciones de distribucin analticas conocidas, es utilizar
el smbolo ... para designar los valores medios poblacionales de una variable X o de otras magnitudes que se definen a partir de ella: la media de X se
escribe como X x, el valor medio de X2 como X2 x2, etc. En este captulo por razones formales se mantendr el convenio de denotar con carcter
en mayscula a la variable, y con minscula a los valores concretos que
puede tomar, aunque ms adelante dependiendo del contexto podr optarse
por una notacin menos rgida. El objetivo presente es la formulacin analtica poblacional que sirve de base conceptual para todos los desarrollos posteriores del trabajo estadstico con muestras.
5.3. Funciones de distribucin de probabilidades
Variables monodimensionales (discretas y continuas)
Una imagen muy conveniente para visualizar toda la formulacin matemtica de las funciones de distribucin es la del reparto de una masa unidad, la probabilidad total, entre el conjunto de los valores que toma la
variable aleatoria. En el caso discreto, con la tabla de probabilidades ordenada segn valores crecientes X = vk de la variable, {(vk, pk)}k=0,1,2,..., la visualizacin es trivial pues en cada valor vk se sita una masa de probabilidad
pk, siendo pk = 1. Esto se puede representar grficamente en el denomina
k

do diagrama o esquema de probabilidad, en el cual sobre cada punto vk en el


eje de abcisas se lleva un segmento de ordenada con altura pk 0 (Fig. 5T2).
Otra posibilidad es la de dar la denominada funcin de distribucin cumulativa de probabilidades F, que para cada punto vk se define como
F ( k ) =

p = p + p + p + ... + p ;
i

k = 0,1, 2, 3,...

(5.3.1a)

i k

y que consiste en llevar sobre cada punto vk la masa de probabilidad acumulada desde el primer punto de la variable (ndice i = 0) hasta el considerado (ndice i = k). La representacin grfica es escalonada pues por convencin se construyen tramos horizontales con altura F(vk) entre cada dos
valores sucesivos vk y vk+1. Con esto se define con ms generalidad la funcin
de distribucin cumulativa en la forma

274

DISTRIBUCIONES DE PROBABILIDAD

F( X ) =

i X

pi

(5.3.1b)

que resulta as una funcin continua y con la que se puede responder directamente a la cuestin de cul es la probabilidad de que la variable tome cualquier valor menor o igual que uno dado, u otras cuestiones similares. Ntese que F(v < v0) = 0 y que en esquemas finitos de tamao N: F(v vN) = 1. En
muchas ocasiones a los diferentes vk se les denomina estados del sistema.

Figura 5T.2. Esquema de probabilidad para una distribucin discreta en un espacio de 10 estados.
Esencialmente esto es un histograma de frecuencias relativas.

Un esquema de probabilidad {(vk, pk)}k=0,1,2,... da una medida de la incertidumbre global asociada al experimento que representa . Esta incertidumbre
en esquemas N finitos siempre se puede caracterizar mediante un nmero H
denominado entropa del esquema y que se define como
N

H=

p ln p
k

(5.3.2)

k =1

de modo que a mayor incertidumbre se tiene una mayor entropa (o un


mayor desorden), y a menor incertidumbre se tiene una menor entropa (o un
mayor orden). El mximo valor de H para un esquema de N probabilidades es
ln N y resulta de que todos los sucesos son igualmente probables pk = 1/N. El
valor mnimo de H es H = 0 y aparece cuando una de las pk = 1 y el resto son

275

CLCULO NUMRICO Y ESTADSTICA APLICADA

todas nulas. En algunas ocasiones, entre dos o ms esquemas correspondientes a diferentes mtodos de anlisis de un mismo problema, se puede
estar interesado en seleccionar aqul con menor incertidumbre global y H
sirve bien a este propsito. Aunque la seleccin as hecha no tiene necesariamente que ser la del mtodo mejor desde un punto de vista experimental
y/o de rendimiento, la informacin extrada de aqu puede resultar muy
valiosa al complementarla con otras pruebas adicionales.
EJERCICIO 5.3.1
Si se fija la atencin en un sub-volumen pequeo de un cierto gas contenido en un recipiente, el nmero de molculas X que pueden encontrarse en
dicho sub-volumen tiene asociada la probabilidad dada por la expresin matemtica p( X = ) =

2
exp( 2) (distribucin de Poisson). Obtener la funcin
!

cumulativa de probabilidades entre 0 v 6. Redondear todos los clculos a


cuatro decimales.
La primera operacin es determinar las probabilidades para v = 0, 1, 2, 3,
4, 5, 6 molculas. Se encuentra as que
p(0 ) =

20
21
exp( 2) 0,1353; p(1) = exp(2) 0, 2707;
0!
1!

p(2) =

22
exp(2) 0, 2707; etc.
2!

Teniendo en cuenta que F(v < 0) = 0 los tres primeros valores acumulados
son por tanto
F (0 ) = 0,1353; F (1) = 0,1353 + 0, 2707 = 0, 4060;
F (2) = 0,1353 + 0, 2707 + 0, 2707 = 0, 6767
en donde utilizando la convencin ya mencionada se ha utilizado el signo
= para los valores F sabiendo que proviene de magnitudes redondeadas a
cuatro decimales. Adems est la particularidad de que considerando los
valores intermedios que la variable no puede tomar se conviene en representar

276

DISTRIBUCIONES DE PROBABILIDAD

F (0 < 1) = 0,1353; F (1 < 2) = 0, 4060; F (2 < 3) = 0, 6767


y as sucesivamente para el resto de los valores v del problema.
Los resultados discretos se resumen en la tabla siguiente
Tabla. Ejercicio 5.3.1
v

p(v)

0,1353

0,2707

0,2707

0,1804

0,0902

0,0361

0,0120

F(v)

0,1353

0,4060

0,6767

0,8571

0,9473

0,9834

0,9954

El caso continuo requiere un ataque diferente y la imagen de la masa


de probabilidad a manejar es la de una masa unidad repartida a lo largo de
una varilla infinitamente delgada, el dominio de la variable X, de acuerdo
con una determinada densidad lineal f(x). La barra puede ser de longitud
finita, y entonces se tiene el dominio en un intervalo finito a < X < b, o de
longitud infinita y se tiene el dominio en uno de los posibles intervalos <
X < , < X < b, a < X < . En consecuencia, la cantidad de masa situada
en un punto concreto xi es necesariamente nula pues un punto no tiene longitud, es decir se tiene la probabilidad p(X = xi) = 0. La densidad de masa
(la densidad de probabilidad) f(x), sin embargo, no es necesariamente nula en
ese punto f(xi) 0, y la cantidad de masa situada en el intervalo infinitesimal
xi < x < xi + dx, de longitud dx, es f(xi)dx densidad lineal longitud =
masa. Esto no es otra cosa que la probabilidad de que la variable aleatoria
tome valores dentro de tal intervalo infinitesimal, lo que formalmente se
escribe por convencin sin incluir el extremo derecho del intervalo en la
forma
p( xi < X < xi + dx) = f ( xi ) dx

(5.3.3)

A la funcin densidad de probabilidad f(x) tambin se la denomina funcin de frecuencia, y es la generalizacin en el caso continuo de la coleccin
de probabilidades discretas pk vistas anteriormente. Las propiedades que
debe cumplir f(x) se resumen a continuacin.
i) Ser no negativa, lo que implica f(x) 0 para todo x del dominio de la
variable.

277

CLCULO NUMRICO Y ESTADSTICA APLICADA

ii) Ser normalizable, lo que implica

`
`

f ( x) dx = C < + `.

(5.3.4)

En general y por razones de comodidad se trabaja con f(x) en la forma


normalizada, C = 1, lo que se puede conseguir siempre de una funcin densidad arbitraria que cumpla la condicin i) dividindola por C en caso necesario. Se ha utilizado con toda generalidad el intervalo < X < , pues la
formulacin se mantiene sustituyendo en los lmites de la integral los extremos del intervalo correspondiente en otro caso. Por ejemplo, ntese que,
para un dominio de longitud finita a < X < b, la densidad de probabilidad
fuera de l puede definirse f(x) = 0 y (5.3.4) se reduce a la integracin sobre
este dominio finito particular.
iii) Ser funcin continua o que presente un conjunto de puntos aislados en
los que existan discontinuidades, lo que se ha denominado en otra parte
(Cap. 2) un conjunto de medida nula (longitud cero). Una manera sencilla de
visualizar esta situacin favorable, til en muchas aplicaciones, es la de que en
cualquier intervalo finito del dominio de la variable X el nmero de puntos de
discontinuidad sea forzosamente finito. Recursos matemticos ms avanzados
(integral de Lebesgue, medida de conjuntos, etc.) permiten ampliar la simple
imagen anterior, pero por su naturaleza no pueden ser tratados aqu.
El clculo de probabilidades con f(x) normalizada es consecuencia de
(5.3.3). As, la probabilidad de que X tome valores entre x0 y xn viene dada
por la integral
p( x0 < X xn ) =

xn

f ( x) dx

(5.3.5)

x0

y en particular se deduce de aqu que p(X = xi) = 0. Este hecho hace que desde el punto de vista de la probabilidad no haya diferencias entre intervalos
abiertos, cerrados, y semiabiertos.
El siguiente concepto en el caso continuo es el de la funcin integral o
cumulativa y que no es ms que la generalizacin al caso discreto del concepto paralelo expresado en las frmulas (5.3.1). Se define as F(x) como la
integral sobre la funcin densidad f(x)
F ( x) = p( X x) =

278

f (u) du

(5.3.6)

DISTRIBUCIONES DE PROBABILIDAD

en donde se ha renombrado como u a la variable x dentro de la integral para


evitar confusiones con el lmite superior. Claramente, (5.3.6) representa la
probabilidad contenida entre y el valor x considerado (la masa de la
varilla en el recorrido entre esos lmites). Las propiedades de F(x) son consecuencia de las indicadas para f(x)
dF ( x)
dx

(5.3.7)

ii) F ( x) 0; F ( x + ` ) = 1

(5.3.8)

i) f ( x) =

iii) Para un dominio de definicin de X finito (a, b) la continuidad de F


implica que
F ( x a) = 0; F ( x b) = 1
iv) p( x0 < X xn ) =

xn
x0

f ( x) dx = F ( xn ) F ( x0 )

(5.3.9)
(5.3.10)

La propiedad i) se considera con ms detalle en el ejercicio siguiente y la


iv) es otra manera de formular (5.3.5) (Fig. 5T 3).

Figura 5T.3. Ejemplo de distribucin continua de probabilidades con densidad f(x) definida no nula
en 0 < x < 1. Ntense las tres regiones de definicin para la funcin integral F(x).

279

CLCULO NUMRICO Y ESTADSTICA APLICADA

EJERCICIO 5.3.2
La funcin densidad de probabilidad de las longitudes x de unas piezas alargadas y estrechas de metal, inicialmente todas con longitud L, una vez sometidas a un proceso de corrosin responde con muy buena aproximacin a la
expresin
f(x) = exp(2x) ; 0 < x < L
a) Normalizar la distribucin; b) determinar la funcin integral; c) de un
conjunto de N = 600 piezas obtener el nmero de ellas con longitudes entre L/4
y 3L/4.
a) Ante una posible funcin densidad lo primero es identificarla como
aceptable, es decir, que sea no negativa y adems normalizable. En este caso
es no negativa, pues f(x) 0 para todos sus valores x (en realidad es f(x) > 0 y
esto es ya suficiente para esta condicin). Por otra parte, el dominio de la
variable est entre 0 y L y el enunciado dice que no se sale de esos lmites
(f(x) = 0 fuera del dominio). As, la integral de f(x) siguiente
C=

f ( x)dx =

f ( x) dx =

L
0

1
1
exp(2 x) dx = exp(2 x) = (1 exp(2L )
2
2
0

indica que la constante C no es infinita y tampoco es igual a la unidad, de


manera que la distribucin original es normalizable sin ms que redefinirla
como
f ( x) =

1
2
f ( x) =
exp(2 x); 0 < x < L
C
(1 exp(2 L)

resultando ahora que el rea encerrada entre 0 y L (la masa de probabilidad


total) es

`
`

f ( x) dx =

f ( x) dx = 1

La funcin f(x) tiene su mximo en x = 0 f(0) = 1/C y su mnimo en x


= L f(L) = exp(2L)/C.
b) La funcin integral de probabilidades se define en tres secciones: <
x < 0, 0 x < L, y L x < . Se tiene entonces

280

DISTRIBUCIONES DE PROBABILIDAD

F(x) = 0, < x < 0


F ( x) =

1
C

exp( 2u) du =

1 exp(2 x)
; 0 x< L
1 exp( 2 L)

F ( x) = 1; L x < `
En el resultado anterior hay que notar que F(x) es continua, conservndose as en los puntos de empalme de la definicin las relaciones: F(0) = 0 y
F(L) = 1. Sin embargo, ntese que no es derivable en tales puntos de empalme. Desde un punto de vista prctico esto no plantea mayores problemas en
general, pues la probabilidad en un punto concreto es nula.
c) El nmero de varillas pedido necesita del conocimiento de la probabilidad asociada. Esta probabilidad se puede calcular como
p( L / 4 x 3 L / 4 ) =
=

3L / 4
L/4

L exp( L / 2)
3L
1
1
F =
=
exp(2 x) dx = F

C
4
4 1 + exp( L ) 2 cosh ( L / 2

Con ello el nmero de varillas pedido viene dado por


n = Np( L / 4 X 3 L / 4 ) =

300
cosh ( L / 2

en donde se ha utilizado el coseno hiperblico (cosh) que se define como


cosh u =

exp(u) + exp( u)
.
2

Variables monodimensionales derivadas


Dada una variable aleatoria X se pueden construir a partir de ella otras
nuevas variables aleatorias a travs de relaciones funcionales Y = Y(X), de
modo que a cada valor X = xi se le haga corresponder Y = yi = Y(xi). El problema ahora es si conocidas las distribuciones de probabilidad de X, dadas
por f(x) F(x), se pueden determinar a partir de ellas las correspondientes de
Y, g(y) y G(y). Aunque para algunos propsitos relacionados con la determinacin de los parmetros caractersticos de Y, esta nueva informacin no es

281

CLCULO NUMRICO Y ESTADSTICA APLICADA

realmente necesaria a priori como se ver despus, conviene analizar algn


caso para observar cmo proceder en general. Existen recursos matemticos
avanzados (d de Dirac) para efectuar esta operacin basando todo el clculo
en la transformacin f(x) g(y), pero se escapan de este curso. Por tanto, la
discusin se va a mantener en un nivel elemental haciendo uso slo de la
funcin integral y el caso continuo para obtener como ejemplos las distribuciones de probabilidad de Y = aX + b e Y = X2.

Figura 5T.4 (a) y (b). Diagramas para la transformacin de distribuciones de probabilidad con una
dependencia lineal y = ax + b en funcin del signo de a.

La relacin lineal Y = aX + b, con X definida en < X < y conocida


F(x) = p(X x), puede transformarse como sigue. Hay que considerar dos
posibles casos separados dependiendo del signo de a. El caso a = a > 0 est
representado en la Fig. 5T.4a, en donde por claridad de explicacin se particulariza la discusin en el punto concreto (xi, yi). La situacin G(y) = p(Y yi),
es equivalente a p(X xi), siendo entonces claro que
y b
p(Y yi ) = p( X xi ) = F ( xi ) = F i
a

(5.3.11)

Por otra parte, el caso a = a < 0 se representa en la Fig. 5T.4b y se


observa que p(Y yi) es equivalente a p(X xi), con lo que utilizando el suceso complementario se tiene
y b
p(Y yi ) = p( X xi ) = 1 p( X xi ) = 1 F ( xi ) = 1 F i
a

282

(5.3.12)

DISTRIBUCIONES DE PROBABILIDAD

En general, el resultado para G(y) es


y b
a>0
F
;
a
G( y) = p(Y y) =
1 F y b ; a < 0
a

`< y<`

(5.3.13)

El resultado para la funcin densidad se obtiene por derivacin y se


encuentra
dF dx f ( x) 1 y b
.
=
= f
; a>0

a
a a
dG dx dy
=
g( y) =
dy dF dx
f ( x)
1 y b
.
f
; a<0

=
=
dx dy
a
a a

lo que se compacta en la expresin global


g( y) =

1 y b
f
;
a a

`< y<`

(5.3.14)

EJERCICIO 5.3.3
La funcin de distribucin cumulativa de una variable aleatoria X viene
dada por las tres relaciones siguientes: F(x) = 0 para < x < 0, F(x) = x/C para
0 < x < C, F(x) = 1 para x C. Determinar las funciones densidad e integral de
la variable aleatoria Y = X2.
En este caso se tiene yi = xi2 y la regin interesante para analizar es 0 < xi
< C 0 < yi < C2. Se encuentra as que
G( y) = 0; ` < y < 0

) (

G( y) = p(Y yi ) = p( X xi ) = p X + yi = F + yi =

+ yi
C

; 0 y < C2

G( y) = 1; C 2 y < `
Con ello la funcin densidad se expresa

283

CLCULO NUMRICO Y ESTADSTICA APLICADA

g( y) = 0; ` < y < 0
g( y) =

( )

2C + y

0 < y < C2

g( y) = 0; C 2 < y < `
Ntese que hay dos de puntos de discontinuidad en g(y), pero este
nmero es finito y tal circunstancia resulta irrelevante, y que en general
para y = Y(x) se tiene g(y) = Y(x)1 f(x).
5.4. Caracterizacin de una distribucin de probabilidad
Valor medio y desviacin tpica (estndar)
Al trabajar con una distribucin de probabilidad para una variable aleatoria X conviene caracterizarla mediante un pequeo nmero de parmetros
que indiquen, en su caso, la posicin de un centro alrededor del cul est
concentrada la mayor parte de la masa de probabilidad, los grados de dispersin y de asimetra en torno a ese centro, etc. Hay que recordar que se
est tratando con la poblacin del problema y esto permite visualizar fcilmente la distribucin y ayuda a comprender el objeto de estudio que describe. Adems, todos los conceptos que se presentan en este epgrafe tienen
su traduccin en el tratamiento estadstico de una coleccin de datos experimentales discretos, de los que se desconoce su distribucin exacta de probabilidades, pero se tiene informacin de sus frecuencias relativas de aparicin. Siguiendo con la analoga de la masa unidad, dos parmetros
importantes en cualquier distribucin lineal de masa son la posicin de su
centro de masa, y el valor del momento de inercia con respecto a un eje perpendicular a la lnea y que pase por el centro de masa. Estas dos imgenes
mecnicas tienen sus equivalentes estadsticos en el lenguaje de las distribuciones de probabilidad.
Para una distribucin discreta {(vk, pk)}k=0,1,2,3,... la posicin del centro de
masa en el eje X viene dada por la media ponderada de los valores vk

1 = X =

k = 0,1,2 ,...

284

pk k

(5.4.1)

DISTRIBUCIONES DE PROBABILIDAD

valor que se denomina la media de la distribucin y se representa convencionalmente como m1 = m. Ntese que este valor no tiene porqu coincidir con
alguno de los vk pudiendo tomar cualquier valor real entre los valores extremos del conjunto de los vk. Por otra parte, el momento de inercia de la
coleccin lineal de masas puntuales pk, cuya suma es la unidad y estn
situadas en las abcisas vk, con respecto a un eje ortogonal que pase por X = m
viene dado por

2 =

k = 0 ,1,2 ,...

pk ( k )2 =

pk 2k 2

k = 0 ,1,2 ,...

pk k + 2

k = 0 ,1,2 ,....

pk =

k = 0 ,1,2,...

pk 2k 2 (5.4.2a)

k = 0 ,1,2 ,...

es decir: la media de los cuadrados de las desviaciones con respecto a m es


igual a la media de los cuadrados menos el cuadrado de la media. Hay varios
smbolos consagrados por el uso para el parmetro anterior

2 = Var ( X ) = 2 =

( X )

= X2 X

(5.4.2b)

parmetro que se denomina en el lenguaje estadstico varianza de X y es una


magnitud no negativa. Esta varianza es una medida de la dispersin de la distribucin o, en el lenguaje del smil mecnico que se est utilizando, una
medida de la resistencia a la rotacin alrededor de un eje perpendicular
que pase por X = m que ofrece la distribucin de masa (el momento de inercia). Es interesante darse cuenta de que m tiene las dimensiones de X y que
Var(X) las tiene de X2, por lo que debido a razones de homogeneidad se
define como medida de la dispersin alrededor de X = m la magnitud llamada
desviacin tpica o estndar s dada por

= + Var ( X )

(5.4.2c)

Las generalizaciones al caso continuo de los conceptos anteriores y de las


frmulas (5.4.1) y (5.4.2) son inmediatas sin ms que transformar las sumas
en integrales y sustituir pk f(x)dx y vk x. As, la media, la varianza s2 y la
desviacin tpica s > 0 de una variable aleatoria continua X definida en <
x < y con densidad de probabilidad normalizada f(x) pueden determinarse
a partir de las ecuaciones siguientes

= 1 = X =

`
`

x f ( x) dx

(5.4.3)

285

CLCULO NUMRICO Y ESTADSTICA APLICADA

2 = Var ( X ) = 2 =

( X )

( x )

f ( x) dx = X 2 X

(5.4.4)

en donde el valor medio de X2 se define como

2 = X 2 =

(5.4.5)

x2 f ( x) dx

Con independencia del tipo de distribucin la desviacin estndar s presenta una propiedad altamente interesante y que contiene la clave de su utilidad. Esto est contenido en el teorema de Tschebyscheff que establece, para
una distribucin arbitraria con media m y desviacin tpica s, una cota superior para la cantidad de probabilidad que queda fuera del intervalo m ks X
m + ks, con k un nmero arbitrario estrictamente mayor que 0 (k > 0). As, la
probabilidad de que X tome un valor tal que X m > ks est acotada por

1
p X > k = p ( X < k + p ( X > + k < 2
k

(5.4.6)

lo que indica que esta probabilidad decrece tanto ms cuanto mayor es k.


Claramente, s es pues una buena herramienta para medir la concentracin
(o la dispersin) de probabilidades de una distribucin alrededor de su posicin media m. Por otra parte, utilizando la media y la desviacin tpica de
una variable puede definirse una nueva variable auxiliar, denominada tipificada, como
Z=

(5.4.7)

que presenta la particularidad de poseer media cero y desviacin tpica unidad. Se volver sobre ella ms adelante.

Momentos de una distribucin


En las aplicaciones anteriores han aparecido cantidades que se han
denotado como los valores medios X, X2 y (X m)2, referidos a la distribucin f(x) pk. Son ejemplos de lo que se conocen como momentos de una
distribucin: los dos primeros son los momentos con respecto al origen X = 0
de primer y de segundo orden, respectivamente; el tercero es el momento

286

DISTRIBUCIONES DE PROBABILIDAD

central, es decir con respecto a la media X = m, de segundo orden. En general,


para un orden entero n = 1,2,3,..., y con distribuciones normalizadas se
definen estos momentos como

n = X n =

`
`

xn f ( x)dx, (caso continuo); n = X n =

pk kn , (caso discreto) (5.4.8)

k = 0 ,1, 2,...

n = ( X )n =
n = ( X )

`
`

( x )n f ( x) dx, (caso continuo);

(5.4.9)
n

pk ( k ) , (caso discretto)

k = 0 ,1,2 ,...

Hay que indicar que se pueden definir momentos del tipo an con respecto a puntos arbitrarios X = a m, pero los ms tiles son los centrales (5.4.9).
En particular, el momento de segundo orden con respecto a un punto alcanza su valor mnimo cuando tal punto es la media m de la distribucin: la
varianza es pues la mnima de entre todas las posibilidades resultantes de elegir tales puntos de referencia. Otra observacin adicional es que los dos
conjuntos {mk} y {ak} contienen la misma informacin, pudindose pasar de
uno a otro con relativa facilidad

1 = 0
2 = 2 = 2 12

(5.4.10)

3 = 3 3 12 + 2 13
4 = 4 4 13 + 6 12 2 3 14
.....

La determinacin de estos momentos a partir de las relaciones (5.4.8) y


(5.4.9) implica que las integrales o las posibles k-series resultantes deben ser
absolutamente convergentes. Esta es la condicin necesaria y suficiente para
la existencia de los momentos y, por ejemplo, para los valores medios se formula como

`
`

x f ( x) dx < `, (caso continuo) ; =

pk k < `, (caso discreto) (5.4.11)

k = 0,,1, 2,...

condiciones que se cumplirn en casos sencillos como aqullos en los que


una aceptable f(x) sea no nula en un intervalo de definicin finito, o en los
que la suma sobre k conste de un nmero finito de trminos. Otras conside-

287

CLCULO NUMRICO Y ESTADSTICA APLICADA

raciones ms complejas de las teoras de series y de integrales caen fuera del


alcance de este curso y no se discutirn aqu.
Es tambin interesante mencionar que conocida una coleccin infinita de
momentos mn ( an) habr una y slo una distribucin de probabilidades asociada con ellos si la siguiente serie de potencias en un parmetro arbitrario t
1
1
( t ) = exp (tX ) = 1 + tX + t 2 X 2 + t 3 X 3 + ... =
2!
3!

n! t

(5.4.12)

n= 0

se puede demostrar que converge para algn valor t 0. En este caso a y(t)
se la denomina funcin generatriz de la distribucin de probabilidades.

Medidas de asimetra y de exceso


Los momentos centrales a3 y a4 pueden utilizarse para caracterizar la asimetra y el exceso (o apuntamiento) de una distribucin de probabilidades
f(x) pk. Hay varias definiciones de los conceptos que siguen y aqu van a
darse las posiblemente ms utilizadas. La asimetra (Fig. 5T.5) suele valorarse mediante el coeficiente de sesgo

1 =

(5.4.13)

que es una magnitud adimensional. Si g1 > 0 la distribucin se dice de asimetra positiva de sesgo positivo y la grfica de la distribucin muestra una
cada lenta (cola alargada) en el sentido de los valores X crecientes. Si g1 < 0
la distribucin se dice de asimetra negativa de sesgo negativo y la grfica de
la distribucin muestra una cada lenta (cola alargada) en el sentido de los
valores X decrecientes. Finalmente, si g = 0 la distribucin es simtrica.
Por otra parte, el exceso valora cmo est de destacada la zona central de
la distribucin con respecto al resto y se utiliza el denominado coeficiente de
curtosis (o apuntamiento) que se define como

2 =

4
4

(5.4.14)

Valores g2 > 0 indican apuntamientos altos en la regin del mximo y la


distribucin se califica como leptocrtica. Valores g2 < 0 indican apunta-

288

DISTRIBUCIONES DE PROBABILIDAD

Figura 5T.5. Densidad de probabilidad con asimetra: sesgo g1 positivo.

mientos bajos en la regin del mximo, con la forma de la distribucin


achatada, y la distribucin se califica como platicrtica. Finalmente, si g2 = 0,
la distribucin se califica como mesocrtica (la distribucin normal o Gaussiana ya mencionada). Ms adelante al tratar con ejemplos concretos de
distribuciones se volvern a considerar estos conceptos.

Otros parmetros
En ocasiones se presentan algunas distribuciones de probabilidad f(x)
pk que pueden no tener un valor medio m (problemas de convergencia), o que
estn tan irregularmente dispersas que tal posicin de referencia y, por tanto s, son parmetros poco tiles. Conviene entonces utilizar otras medidas
de la posicin como la mediana o la moda.
La mediana es la posicin que divide a la distribucin de probabilidad en
dos partes iguales, con una masa total de 1/2 en cada lado. En una distribucin continua esto significa que el 50% de la probabilidad queda a la
derecha y que el otro 50% queda a la izquierda de la mediana. Para una distribucin discreta la mediana separa el 50% de los datos a derecha e izquierda. La moda es el valor X = xM ms probable, es decir aquel en el que se alcanza el mximo de la distribucin.

289

CLCULO NUMRICO Y ESTADSTICA APLICADA

Las explicaciones anteriores pueden parecer superfluas, pero sirven


para ilustrar que estos nuevos parmetros presentan algunas dificultades,
pues pudieran no ser nicos y, adems, sus propiedades matemticas son
menos flexibles que las de m. En cuanto a la unicidad, en el caso de la
mediana de una distribucin discreta puede aparecer una indefinicin entre
los puntos de un cierto intervalo continuo de la variable vk < X < vk+1 al
intentar situar este parmetro, y como solucin se acepta el punto medio de
ese intervalo como mediana. Una manera prctica de realizar esta separacin con la identificacin de la mediana es utilizar la funcin integral,
fijando el valor de la ordenada en F(x) = 1/2 y efectuando la interpolacin
inversa que lleva al valor x de la mediana. Para la moda tambin pudieran
existir varios mximos en la distribucin y habra que elegir el mximo
absoluto, pero esto pudiera resultar poco significativo dependiendo de los
valores relativos de tales mximos y de las caractersticas de simetra presentes. En cuanto a la flexibilidad matemtica se ver con detalle ms adelante lo que esto significa, pero por el momento baste sealar algo muy
sencillo de comprobar con (5.4.1) y (5.4.3). La media m de la suma de dos distribuciones, por ejemplo f(x) + g(x), es la semisuma de las medias (mf + mg)/2
de cada distribucin, algo que no tiene que suceder necesariamente con la
mediana y con la moda. Por otra parte, en muchas aplicaciones prcticas al
tratar con el muestreo de poblaciones (Cap. 6) se pueden utilizar estas ltimas magnitudes de manera ventajosa.
Como parmetros complementarios en estos casos, y en los otros ms
generales, pueden utilizarse los denominados: rango, o los cuartiles, deciles,
percentiles, etc.. El rango es la diferencia entre los valores mximo y mnimo
de X (el recorrido o dominio de esta variable). Los tres cuartiles z1, z2 y z3 son
aqullos valores de X que efectan una divisin de la distribucin en cuatro
partes iguales (25% de la masa en cada una de ellas): i) p(X < z1) = 0,25; ii)
p(z1 < X < z2) = 0,25; iii) p(z2 < X < z3) = 0,25; iv) p(z3 < X) = 0,25. La cantidad
z3 z1 se denomina rango intercuartlico y, dado que z2 = mediana = Med(X),
suele utilizarse el rango semi-intercuartlico (z3 z1)/2 como una medida
alternativa de la dispersin. En distribuciones discretas los cuartiles primero
y tercero se fijan de manera anloga a lo indicado antes para la mediana.
Definiciones anlogas pueden hacerse para los deciles (del 1 al 9) y los percentiles (del 1 al 99) que dividen la distribucin en 10 en 100 partes iguales
(10% 1% de la masa respectivamente en cada una de estas partes). El
smbolo Med(X) para la mediana es particular de este texto.

290

DISTRIBUCIONES DE PROBABILIDAD

Por ltimo, utilizando la media m, la desviacin tpica s y bien la mediana z2 o bien la moda, se definen otras medidas de la dispersin y del coeficiente de sesgo
a) Dispersiones con desviaciones medias (en valor absoluto) con respecto a m o con respecto a z2
X

X 2

(5.4.15)

b) Coeficientes de sesgo con moda o con mediana

moda

3 ( mediana

(5.4.16)

que se conocen como los coeficientes de sesgo primero y segundo de Pearson.

5.5. Ejemplos de distribuciones discretas


La distribucin binomial
La distribucin binomial (o binmica) es una distribucin discreta con slo
dos puntos y convencionalmente se denotan los dos resultados del experimento binomial como X = 0,1, lo que resulta muy prctico ya que X se corresponde con la variable aleatoria asociada a que un suceso se presente (X = 1) o
a que no se presente (X = 0). Pueden imaginarse un gran nmero de experimentos en los que se buscan dilucidar las dicotomas SI-NO, CIERTO-FALSO,
etc., y el problema requiere nada ms del conocimiento de la probabilidad de
una de esas dos opciones generales. Se suele representar mediante p a la probabilidad de que el suceso se presente, es decir X = 1, y por q = 1 p a la probabilidad del suceso complementario X = 0. En algunas ocasiones se denomina estados a los sucesos X = 0 y X = 1. La utilidad de esta distribucin es
an mayor de lo que cabra esperar con base en la consideracin anterior, ya
que sirve como punto de partida para desarrollar otras distribuciones ms
generales, como son la de Poisson y la Gaussiana.
Normalmente no se est interesado en realizar un nico ensayo, sino en la
repeticin de este ensayo un nmero N de veces, independientes unas de
otras, y en el planteamiento de cuestiones probabilistas relacionadas con

291

CLCULO NUMRICO Y ESTADSTICA APLICADA

ello. Se tiene as un problema combinatorio con pesos probabilistas y el problema a investigar es el de la probabilidad de observar v veces, en N ensayos,
el resultado X = 1 (la situacin es perfectamente reversible con X = 0). Una
presentacin heurstica ayuda a comprender la resolucin de este problema.
Para N = 1 la situacin X = 1 es trivial y se tiene: v = 0 p0 = q; v = 1
p1 = p. Para N = 2 las posibilidades crecen pues v = 0, 1, 2. En cada uno de
estos casos se encuentra

= 0 X = 0, 0 P0 = q q = q 2
= 1 X = 1, 0 o X = 0, 1 P1 = p q + q p = 2 pq
= 2 X = 1, 1 P2 = p p = p2
en donde se ha utilizado que los sucesos son mutuamente excluyentes y/o
independientes. Para N = 3 las posibilidades aumentan y se encuentra

= 0 X = 0, 0, 0 P0 = q q q = q3
= 1 X = 1, 0, 0 o X = 0, 1, 0 o X = 0, 0, 1 P1 = 3 pq2
= 2 X = 1, 1, 0 o X = 0 , 1, 1 o X = 1, 0, 1 P2 = 3 p2 q
= 3 X = 1, 1, 1 P3 = p p p = p3
El proceso puede continuarse para N crecientes y se observa que la probabilidad de que X = 1 aparezca v veces en N ensayos independientes est
dada por
N
N!
P = p q N =
p q N ; 0 N
! ( N )!

(5.5.1)

expresin que contiene el nmero de combinaciones de N objetos tomados


de v en v y, que puede demostrarse por induccin, es vlida para valores
arbitrarios 0 v N. Cuando hay que trabajar con valores grandes de N los
factoriales en (5.5.1) conviene tratarlos mediante la aproximacin de Stirling
y operar con logaritmos
N ! ~ 2 N N N exp( N ) ln N ! ~

1
ln (2 N + N ln N N
2

aproximacin que es tanto mejor cuanto mayor es N.

292

(5.5.2)

DISTRIBUCIONES DE PROBABILIDAD

Es interesante notar que al ser p + q = 1 resulta

( p + q)

=0

N N
=
p q

P =1

(5.5.3)

=0

una relacin general que sirve de ayuda para obtener los parmetros de
esta distribucin.
El valor medio m y la varianza son

= Np; 2 = Npq

(5.5.4)

y los coeficientes de sesgo y de curtosis estn dados por

1 =

q p
+ Npq

2 =

1 6 pq
Npq

(5.5.5)

De estas relaciones anteriores es interesante destacar que g1 y g2 0 con


N y adems que la dispersin relativa de la distribucin alrededor de la

media se comporta como s/m ~ 1/ N cantidad que da una idea de la fluctuacin de los resultados del experimento alrededor del valor medio. Las demostraciones de estas relaciones se dejan como ejercicios y problemas.
EJERCICIO 5.5.1
Obtener la expresin del valor medio de la distribucin binmica dada en
(5.5.4).
El clculo se desarrolla en la forma
N

P = (

=0
N

=0

Np ( (1)!( N) )! p

N!

p q N =
! N !

( 1)!(((N 1)) ( 1))! p

Np

N 1 !

1 N

=1

1 ( N 1) ( 1)

N 1 !

= Np

=1

en donde hay que notar que en la divisin por v se elimina el sumando v = 0


y que la suma final desde v = 1 N es la unidad, pues se corresponde con la
probabilidad total de N 1 ensayos.

293

CLCULO NUMRICO Y ESTADSTICA APLICADA

EJERCICIO 5.5.2
Para determinar si la acidez de unas disoluciones est entre 4 < pH < 5, se
utiliza un p-hachmetro que presenta un error sistemtico de funcionamiento
que hace que identifique incorrectamente las disoluciones dentro de los lmites
anteriores en un 10% de los casos. En un anlisis de una muestra total de N =
500 disoluciones determinar la media, la varianza, el coeficiente de sesgo y el
coeficiente de curtosis para las disoluciones identificadas correctamente.
La probabilidad de identificacin incorrecta es q = 0,1 y la de identificacin correcta es p = 0,9. Con ello los parmetros pedidos son redondeando a
dos decimales y utilizando la convencin del signo igual

= Np = 500 0, 9 = 450
= + Npq = + 500 0, 9 0,1 = 6, 71
q p 0,1 0, 9
=
= 0,12
6, 71

1 6 pq 1 6 0,1 0, 9
= 0, 01 > 0
=
2 =
45
2

1 =

La asimetra es negativa y la cola de la distribucin est situada a la


izquierda. Por otra parte, la distribucin es muy ligeramente leptocrtica.

La distribucin de Poisson
Esta distribucin discreta se obtiene como lmite de la binomial cuando
la probabilidad p se hace muy pequea y el nmero N de repeticiones del
ensayo se hace muy grande mantenindose finito el valor medio, es decir, el
producto Np = l = finito > 0. De lo dicho se deduce que su aplicacin est
indicada en las situaciones en las que se produce un fenmeno poco frecuente o cuya probabilidad de aparicin es proporcional a la longitud de un
intervalo (espacial, temporal). En estos casos se est interesado en cuantificar la probabilidad del nmero de veces que se registra o aparece el
fenmeno. Ejemplos fsico-qumicos tpicos son las probabilidades de que
en un pequeo subvolumen de un gas muy diluido se encuentren v = 0, 1,
2, ... molculas (Ejercicio 5.3.-1), o las probabilidades de que para un

294

DISTRIBUCIONES DE PROBABILIDAD

material radiactivo en un tiempo dado se hayan producido las desintegraciones de v = 0, 1, 2, ... tomos.
La distribucin de Poisson se expresa mediante la relacin
p =

exp( ); = 0, 1, 2, 3,..., N ,...


!

(5.5.6)

y tcnicamente es el siguiente lmite matemtico de la distribucin binomial


N
p = lim Pv = lim p q N =
p 0 N `
p0 N `
= Np = finito

= Np = finito

( Np)

lim

p 0 N `
= Np = finito

Np
1
N
!

(1 p)

1 N
i =1

de donde se obtiene (5.5.6) notando que para cada valor fijo n se verifica

Np
lim 1
p 0 N `
N

= exp( );

lim (1 p

p 0

= 1;

(5.5.7a)

= Np = finito
1

lim

N `

1 Ni = lim 1 N1 1 N2 ... 1 N 1 = 1
N `

i =1

(5.5.7b)

La suma de todas las probabilidades pv es la unidad como se comprueba


fcilmente
`

=0

p =

=0

exp( ) = exp( ) exp( ) = 1


!

(5.5.8)

y haciendo uso de esta relacin se pueden determinar los parmetros de esta


distribucin. La media y la varianza estn dadas por

= ; 2 =

(5.5.9)

y los coeficientes de sesgo y de curtosis estn dados por

1 =

1
+

2 =

(5.5.10)

295

CLCULO NUMRICO Y ESTADSTICA APLICADA

Ntese que para valores v crecientes ms y ms alejados de m = l se tiene


pv 0. De nuevo la demostracin de las frmulas anteriores queda para ejercicios y problemas.
EJERCICIO 5.5.3
Obtener las expresiones de la media y varianza de la distribucin de Poisson
dadas en (5.5.9).
El clculo de la media se plantea de la forma usual
`

1
=
p =

exp( ) = exp( )
= exp( ) exp( ) =
!
1)!
=1 (
=0
=0

Anlogamente la varianza puede evaluarse como sigue


`

2 =

=0

=0

exp( )

=0

2
2 + 2 =
!

( ) p = exp( )

2
exp( )
2 + exp( )
=
!

!
=0
=0

1
1
2
exp( )
exp( )
2 2 + exp( )
=
( 1)!
( 1)!
!
=1
=0
=1

= 2 + 2 2 + 2 =
en donde se han tenido en cuenta (5.5.8), el resultado para m y la relacin
`


1
exp( )
= { = 1} = exp( ) ( + 1) = 2 +
!
( 1)!
=1
= 0

La distribucin multinomial
Esta nueva distribucin discreta es una generalizacin de la distribucin binomial que se utiliza cuando el nmero de posibilidades que aparecen como resultado de un experimento es tres o ms. Son problemas tpi-

296

DISTRIBUCIONES DE PROBABILIDAD

cos los de distribuciones de molculas entre un conjunto de estados con


diferentes probabilidades de presentarse (estadstica de Maxwell-Boltzmann), o la consideracin de alternativas que no se limitan a la dicotoma
CIERTO-FALSO que caracteriza a la distribucin binomial. As, para un
conjunto de n opciones (o estados) que se pueden asociar con una variable
aleatoria X = 1, 2, 3, ..., N, con probabilidades p1, p2, ... pn, se debe cumplir
la relacin

(p + p
1

+ ... + pn

=1

(5.5.11)

y a partir de ella, aplicando el desarrollo de la potencia N-sima se obtiene la


expresin de cada una de las probabilidades asociadas con cada uno de los
diferentes sucesos de observacin (u ocupacin) de X

(p + p
1

+ ... + pn

1 , 2 ,..., n

N!

p1 1 p22 ... pnn ; 1 + 2 + ... + n = N (5.5.12)


1 !2 !... n !

de manera que la probabilidad de que en N ensayos se observe X = 1 un


nmero entero v1 de veces, X = 2 un nmero entero v2 de veces, etc., es

P 1 , 2 ,..., n =

N!

p1 p 2 ... pnn ;
1 ! 2 !... n ! 1 2

1 + 2 + ... + n = N (5.5.13)

El factor combinatorio en (5.5.13) es el nmero de permutaciones con


repeticin de N elementos (ensayos = nmero de estados que se pueden
repetir) tomados de v1 en v1, v2 en v2, ..., y vn en vn veces.
EJERCICIO 5.5.4
Obtener todos los grupos de nmeros de ocupacin resultantes de repartir
N = 4 partculas, del mismo tipo y distinguibles, entre tres estados con energas
diferentes (n = 3) y que tienen diferentes probabilidades de ocupacin Cuntos
modos de reparto hay?
Hay que determinar todos los nmeros de ocupacin v1, v2 y v3 compatibles con las restricciones

1 + 2 + 3 = 4;

0 k 4

297

CLCULO NUMRICO Y ESTADSTICA APLICADA

De momento no importa la partcula concreta que est en un nivel, slo


el nmero total de partculas que lo ocupan. Hay 15 posibles grupos de tres
enteros que cumplen lo anterior y que se enumeran en la tabla siguiente.
Ejercicio 5.5.4
v1

v2

v3

Como puede verse todos los estados se tratan por igual. Cada columna es
un grupo que se presenta un nmero de veces mayor o igual a 1. Por ejemplo, la terna (4, 0, 0) se presenta una vez, y la terna (1, 2, 1) se presenta 12
veces, de acuerdo con los factores combinatorios
4!
= 1;
4 ! 0! 0 !

4!
= 12
1! 2! 1!

En un desarrollo de (x + y + z)4 estos nmeros de ocupacin se corresponden con los trminos de potencias que se indican: (4, 0, 0) x4; (1, 2, 1)
xy2z. Resultados anlogos pueden establecerse para el resto de las posibilidades. En total hay 81 = 34 posibilidades repartidas del modo

{(4, 0, 0),(0, 4, 0),(0, 0, 4)}


3 6 = 18 {(2, 2, 0 ),, (2, 0, 2),(0, 2, 2)}
6 4 = 24 {(3,1, 0),(3, 0,1),(1, 3, 0 ),(1, 0, 3),(0,1, 3),(0, 3,1)}
3 12 = 36 {(2,1,1),(1, 2,1),(1,1, 2)}
3 1= 3

5.6. Ejemplos de distribuciones continuas


La distribucin uniforme
Esta distribucin continua representa la distribucin equiprobable en un
intervalo finito a < x < b y se define mediante la distribucin rectangular de
densidad de probabilidad

298

DISTRIBUCIONES DE PROBABILIDAD

1 si a < x < b
f ( x) =
0 en otro caso

(5.6.1)

Su normalizacin es trivial y lleva a


1
si a < x < b

f ( x) = b a
0
en otro caso

(5.6.2)

La determinacin de sus parmetros caractersticos no presenta dificultades


a) media =

b+ a
2

xf ( x) dx =

b) varianza =
2

b
a

( x )

(5.6.3)

( b a)
=

f ( x) dx = X

(5.6.4)

12

c) coeficiente de sesgo

1 =

3
3

b
a

( x )

f ( x) dx

= 0; por simetra en torno a x = m

(5.6.5)

6
3 = ; (platicrttica)
5

(5.6.6)

d) coeficiente de curtosis

2 =

b
a

( x )

f ( x) dx

sta es una distribucin simple, pero muy til pues describe la situacin
de resultados al azar sin ningn tipo de preferencias. Es pues importante en
el diseo de muestreos de una poblacin (muestreo al azar) y, por tanto, en la
generacin de nmeros aleatorios. El lector puede deducir sin complicaciones la frmula de la funcin integral para este caso. Se volver sobre esta distribucin uniforme y sus aplicaciones ms adelante (Caps. 6 y 10).

299

CLCULO NUMRICO Y ESTADSTICA APLICADA

La Distribucin Gaussiana (normal)


Esta es la distribucin ms universal de probabilidades, pues cuando
en un fenmeno influyen un gran nmero de causas aleatorias diferentes e
independientes, cada una con una contribucin muy pequea, tal fenmeno
va a poder describirse con muy buena aproximacin mediante una distribucin de este tipo, Gaussiana o normal. El enunciado anterior se formula
matemticamente en el lmite de infinitas causas (variables) aleatorias y se
conoce como el Teorema Central del Lmite de Laplace. Adems, la Gaussiana, bajo ciertas condiciones, es el lmite de distribuciones ms sencillas
como la binomial, sirve para generar formas ms complejas (desarrollos
asintticos, distribucin log-normal, etc.), y juega un papel destacado en una
gran variedad de aplicaciones fisico-qumicas (distribucin de velocidades
moleculares en un gas, clculos ab-initio de orbitales moleculares, etc.).
La funcin densidad de una variable aleatoria X que se distribuye normalmente se escribe en general como
f ( x) =

( x )2
exp
; ` < x < `
2 2
2

(5.6.7)

en donde m es el valor medio y s2 la varianza de X


X = ; 2 = Var ( X ) = X 2 X

(5.6.8)

La tipificacin de X lleva a la variable Gaussiana universal tipificada Z


con media cero y varianza unidad (Fig. 5T.6)
Z=

f ( z) =

x
;

Z = 0; Z2 = 1

z2
exp ;
2
2
1

`< z<`

(5.6.9)

(5.6.10)

Como la probabilidad total est normalizada a la unidad, las descripciones con f(x) f(z) son completamente equivalentes, lo que hace que f(z) sea
tremendamente prctica en las aplicaciones, pues una vez tabulada permite
obtener de manera muy rpida las probabilidades buscadas. Hay que notar,

300

DISTRIBUCIONES DE PROBABILIDAD

Figura 5T.6. Campana de Gauss o distribucin de densidad de probabilidades normal tipificada


(universal).

por otra parte, que el clculo analtico de integrales con f(x) f(z) no es siempre posible y el recurso a estas tabulaciones numricas es una gran ayuda.
En cualquier caso es til disponer de las expresiones exactas siguientes que
contienen a la Gaussiana dentro del smbolo integral (a > 0):

`
`
`

z2 n exp az2 dz =

) } = 1. 3 .5....(2n 1)

( 2n + 1 / 2

exp az2 + bz dz =

( 2 n +1)/ 2

( 2 n +1)/ 2

2 a

b2

exp
a
4a

; n = 1, 2, 3,... (5.6.11)

(5.6.12)

b2 b

z exp az2 + bz dz =
exp
a
`
4 a 2a

(5.6.13)

b2 1

b2
exp 1 +
z2 exp az2 + bz dz =
a
`
4a 2a 2a

(5.6.14)

Como la funcin f(z) es simtrica en torno a z = 0, las integraciones del


tipo (5.6.11) con potencias impares z2n+1 son idnticamente nulas. Notablemente, los coeficientes de sesgo y de curtosis para la Gaussiana son ambos
nulos g1 = g2 = 0. El resultado para g1 es consecuencia de la simetra aludida,

301

CLCULO NUMRICO Y ESTADSTICA APLICADA

en tanto que el de g2 explica la definicin (5.4.14) que separa los comportamientos leptocrticos de los platicrticos.
En (5.6.11) se ha introducido la funcin gamma G de Euler que juega un
papel muy importante en muchas aplicaciones de inters (ntese que G(1/2)

= p). En particular, en (5.6.11) se han tomado valores semienteros x = (2n +


1)/2. Para valores enteros las definiciones son muy sencillas
( n + 1) = n!;

n = 0,1, 2,...

( n + 1)
; n = 1, 2, 3,...
n

( n) =

(5.6.15a)
(5.6.15b)

Ntese que para enteros n < 0 n!= . Adems, la definicin de G(x)


se extiende a cualquier valor real x de su argumento y se remite al lector a la
bibliografa para estos detalles generales.
La funcin integral cumulativa en este caso no puede evaluarse analticamente y se expresa mediante la relacin
1

F ( z) = p( Z z) =

u2
exp du; ` < z < `
`
2

(5.6.16)

en donde se ha utilizado una variable auxiliar u para evitar confusiones. La


expresin anterior da origen a dos variantes conocidas como la funcin de
error erf(z) y la funcin complementaria de error erfc(z) que se definen como
erf ( z) =

( )

exp u2 du; erfc( z) = 1 erf ( z)

(5.6.17)

Ambas funciones estn directamente relacionadas con la magnitud conocida como nivel de significacin, convencionalmente denotada por a, en
los ensayos de hiptesis estadsticas con la distribucin Gaussiana como
base (Cap. 6). Ntese que erf(z)=erf(z).
El clculo de probabilidades se realiza de acuerdo con (5.3.10)

p( a < Z b =

302

1
2

b
a

u2
exp dz = F ( b) F ( a)
2

(5.6.18)

DISTRIBUCIONES DE PROBABILIDAD

y para ello se utilizan las tablas estndar que suelen presentarse generalmente en dos formas. Una de ellas da los valores acumulados F(z) de modo
que se emplea la relacin ms a la derecha de (5.6.18) y el proceso se esquematiza en la Fig. 5T.7. La segunda forma es la que utiliza la simetra de f(z)
de manera que para calcular (5.6.18) con el rea integral se aplica la relacin

f ( z) dz =

f ( z) dz ; a > 0

(5.6.19)

hacindose el clculo total con las reas desde 0 al valor z considerado


como

p( a < Z b) =

f (z) dz
f ( z) dz
f (z) dz

f ( z) dz +

si a < 0 y b > 0

(5.6.20)

si a < 0 y b < 0 o a > 0 y b > 0

lo que significa que las reas parciales se suman si los signos de a y de b


son opuestos, y se restan tomando los valores absolutos si estos signos son
iguales. De nuevo ntese que la inclusin de los extremos es irrelevante ya
que p(Z = z) = 0.

Figura 5T.7. Clculo de probabilidades con la distribucin Gaussiana. Ntese el papel que juega la
simetra de esta funcin en este tipo de clculo.

303

CLCULO NUMRICO Y ESTADSTICA APLICADA

Existen tres situaciones simtricas con respecto a Z = 0 que se utilizan


como referencia en muchos estudios y que son conocidas como intervalos
1s, 2s y 3s, cuyas probabilidades son
p( < Z < )

= 0, 6827 68, 27%

p( 2 < Z < 2 ) = 0, 9545 95


5, 45%

(5.6.21)

p( 3 < Z < 3 ) = 0, 9973 99, 73%


y que encierran los porcentajes de poblacin indicados. A efectos prcticos se
suele considerar que todo aquello fuera del intervalo 3s es despreciable.
La Gaussiana es el lmite de la binomial cuando el nmero de ensayos
N y la probabilidad del suceso p se mantiene constante. En condiciones
normales con valores elevados de N, pero no infinito, el clculo binmico
resulta poco prctico. Sin embargo, se puede aproximar muy bien este clculo mediante una determinacin Gaussiana cuando se da la circunstancia
de que Np, Nq > 5, siendo la aproximacin tanto mejor cuanto mayores
sean estas dos cantidades. La tipificacin a utilizar es fcil de anticipar con
los valores de media y varianza binomiales

= Np; = Npq Z =

(5.6.22)

Hay que considerar adems un hecho importante cual es el que se ha


pasado de una distribucin discreta X = v con saltos unitarios a una distribucin continua Z que vara infinitesimalmente. Para tener en cuenta
este efecto de manera adecuada hay que introducir la denominada correccin de continuidad utilizando las llamadas marcas de clase alrededor de
cada entero X = v. La convencin natural es tomar 0,5 sobre cada v con lo
que v X equivale a v 0,5 X < v + 0,5 (la posicin del signo igual es asunto de eleccin). Este pequeo cambio tiene su importancia en la evaluacin de probabilidades Gaussianas, pues el intervalo continuo a considerar
es diferente del resultante con valores puramente enteros. As, aunque la tipificacin mantiene la forma (5.6.22) hay que prestar especial atencin a los
lmites de X en cada problema. Esto se aclara en el Ejercicio 5.6.1.
Tambin hay que sealar que cuando en una distribucin de Poisson l es
un nmero muy grande, el inters se concentra en valores v cercanos a l y en
estos casos la distribucin de Poisson se puede aproximar muy bien mediante una Gaussiana con parmetros m = l y s2 = l.

304

DISTRIBUCIONES DE PROBABILIDAD

EJERCICIO 5.6.1
La probabilidad binomial para la ocurrencia de un determinado suceso es
p = 0,6. Si se realizan 100 ensayos independientes, cul es la probabilidad de
que el suceso aparezca un nmero de veces entre 58 v < 65?
La distribucin binomial puede representarse mediante una Gaussiana
pues Np = 60 y Nq = 40 y ambos son >5. La media y la desviacin tpica son

m = Np = 60 y s = Npq 4,899. Por otra parte, el intervalo 58 v < 65 al


pasar a continuidad se debe expresar como el intervalo 57,5 X < 64,5 y los
valores de la variable tipificada resultan
Z1 =

57, 5 60
64, 5 60
= 0, 51; Z2 =
= 0, 92
4, 899
4, 899

en donde se ha redondeado a dos decimales para efectuar las entradas en un


tabla de reas bajo la curva normal (5.6.18). La probabilidad pedida es
p(58 < 65) = p(57, 5 X < 64, 5) = p(0, 51 Z < 0, 92) =
p(0 < Z 0, 51) + p(0 Z < 0, 92) = 0,1950 + 0, 3212 = 0, 5162
Se deja al lector que compruebe las diferencias al utilizar el intervalo
58 X < 65 as como las resultantes de otros problemas similares como 58 < v
65, etc.

La Distribucin Logartmico-normal (log-normal)


Se tratar ahora con una variante de la distribucin normal denominada logartmico-normal (log-normal) que aparece con cierta frecuencia en la
estadstica de fenmenos caracterizados por una variable aleatoria X en los
que influyen muchas causas, independientes entre s, pero cuyos efectos
individuales no slo se suman sino que, adems, cada uno es proporcional
al valor de X. Ejemplos tpicos son el tamao de las partculas coloidales
que aparecen en la formacin de aerosoles, o la concentracin de anticuerpos en el suero de la sangre humana. La idea bsica es utilizar una nueva variable Y = ln X que se distribuye normalmente para sustituir, con muy
buena aproximacin, a la distribucin no normal y asimtrica f(x) correspondiente a la variable original X. Cuando esta operacin es aplicable se

305

CLCULO NUMRICO Y ESTADSTICA APLICADA

produce una simplificacin notable y se recomienda trabajar con la variable


transformada Y.
La forma de la distribucin log-normal para X puede determinarse a
partir de la de Y, Gaussiana con media m y desviacin tpica s, que se
escribe
f ( y) =

( y )2
exp
; ` < y < `
2 2
2

F ( y) = p(Y y) =

u
(
exp
`
2 2

du; ` < y < `

(5.6.23a)

(5.6.23b)

La distribucin de X = exp(Y) se obtiene notando las igualdades siguientes


G( x) = P ( X x) = P (Y y) = F ( y) = F (ln x); 0 < x < `

(5.6.24)

pues exp(y) y ln(x) son ambas funciones crecientes. Se tiene entonces

y
ln x
(
1
exp
G( x) = p( X x) = 2 `
2 2

0 si x 0

dy; 0 < x < `


(5.6.25)

La funcin densidad g(x) se calcula como la derivada dG(x)/dx algo que


hay que hacer con cuidado al ser la integral en (5.6.25) dependiente del
parmetro x. Utilizando la regla de Leibnitz (Prob. 4) se obtiene

ln x
(
1
exp
dG
g( x) =
= x 2

2 2
dx
0 si x 0

; 0< x<`

(5.6.26)

y su forma puede verse en la Fig. 5T.8.


Los dos parmetros principales de la distribucin log-normal, media y
varianza, se expresan en trminos de los de Y resultando

306

DISTRIBUCIONES DE PROBABILIDAD

2
X = exp +
; 2X = Var ( X ) = X

exp( 2 ) 1

(5.6.27)

La comprobacin de estos resultados se deja como un problema y ejercicio para el lector.


Si el cambio de variable hubiera sido Y = ln(X a), la expresin (5.6.26)
permanece sin ms que sustituir x (x a), y tener en cuenta que g(x) = 0
para x a y g(x) 0 para a < x < . Una observacin adicional es la de que en
algunas ocasiones el cambio de variable se toma en base decimal Y = log10 X,
lo que no presenta ninguna diferencia cualitativa (recurdese que log10 X =
log10 e ln X.

Figura 5T.8. Densidad de probabilidades de una distribucin logartmico-normal.

5.7. Composicin de variables aleatorias


Valores medios y varianzas de funciones aleatorias
A partir de una variable aleatoria X con distribucin de probabilidad
conocida, f(x) F(x), se ha visto cmo determinar la correspondiente distribucin, g(y) G(y), asociada a Y = Y(X). Con g(y) pueden determinarse los
parmetros de Y, pero existe una posibilidad de hacer esto utilizando el
clculo directo con la variable original X. Como es de esperar debe estar
garantizada la convergencia absoluta de las integrales series que aparezcan.

307

CLCULO NUMRICO Y ESTADSTICA APLICADA

En general, el valor medio de una funcin Y(X) relativo a la distribucin


continua aceptable f(x) se define como

( X ) =

`
`

( x) f ( x) dx

(5.7.1)

f ( x) dx

en donde se tiene en cuenta que f(x) pudiera no estar normalizada (si lo estuviera el denominador sera =1). Para el caso discreto se tendra la definicin
anloga reemplazando integrales por sumas. La extensin al caso Y = Y(X)
para valor medio y varianza es directa y tomando distribuciones normalizadas las expresiones son
`
`
y g( y) dy =
( x) f ( x) dx

`
Y = ( X ) = `
yk pk , y = ( xk ) pk, x
k
k

Y2 = Var (Y ) = Y 2 Y

(5.7.2)

`
( x) ( X )

= `
( xk ) ( X )
k

(
(

) f ( x)dx
)p
2

(5.7.3)

k, x

En las integrales anteriores se ha tenido en cuenta que: i) dy/dx dx/dy =


1; y ii) g(y)Y(x) = f(x).
Las ecuaciones anteriores son la forma exacta de proceder. Sin embargo,
cuando Y(x) y Y(x) son continuas y no nulas en las cercanas de X = m, se
pueden obtener buenas aproximaciones tomando la parte lineal del desarrollo de Taylor en torno a m
1
( x) = ( ) + ( x ) ( ) + ( x )2 ( ) + .... ( ) + ( x ) ( ) (5.7.4)
2
y se obtienen
2

Y = ( X ) ( ); Y2 ( ) X2

308

(5.7.5)

DISTRIBUCIONES DE PROBABILIDAD

es decir, la media de la funcin se aproxima por el valor de la funcin en la


media de la variable original, y la varianza de la funcin se aproxima
mediante el producto de una constante por la varianza de la variable original. Conviene insistir en que las relaciones enunciadas en (5.7.5) son en
general aproximaciones, que resultarn tanto mejores cuanto ms pequeos
sean los trminos del desarrollo de Taylor despreciados (5.7.4). En particular, las relaciones (5.7.5) son exactas para relaciones lineales Y = aX + b
Y = aX + b = a X + b; Y2 = a2 X2 ; Y = a X

(5.7.6)

Ntese que el valor medio de una constante es ella misma b = b. La


comprobacin de estas afirmaciones es trivial y se deja para el lector. Finalmente, la frmula aproximada para la varianza dada en (5.7.5) forma la
base de lo que se conoce como la ley de propagacin de errores, un asunto
sobre el que se volver ms adelante (Cap. 8). En ciertos casos para mejorar
la precisin en la estimacin de s2Y siguiendo esta lnea puede ser conveniente retener trminos en el desarrollo (5.7.4) de rdenes superiores.
EJERCICIO 5.7.1
Dada la variable aleatoria X con densidad de probabilidad f(x) equiprobable
en 0 < x < 1, calcular los valores medios y las dispersiones de las funciones: a)
Y = 2X + 1; b) Y = 3X2 + 2. Comparar estos resultados con los que se pueden
deducir aplicando las relaciones (5.7.5) y (5.7.6).
El valor medio y la varianza de la distribucin equiprobable normalizada
f(x) = 1 en 0 < x < 1 pueden obtenerse de (5.6.3) y (5.6.4) resultando
X = = 1 / 2; 2X = 1 / 12
En el caso a) se tiene
Y = 2 X + 1 =

Y2 =

( 2 X + 1)

2 X + 1

xdx +

dx = 2 X + 1 = 0
1
= ( 2 x + 1) f ( x) dx = ( 2 x + 1) dx =

( 2 x + 1) f ( x) dx = 2
1

309

CLCULO NUMRICO Y ESTADSTICA APLICADA

cumplindose exactamente las relaciones (5.7.6)


Y = ( X ) =

( X ) = ( ) = 2

X +1 = 0

2
2 1
1
= Y = +2 X
Y2 = ( ) 2X = ( 2 )
12 3

En el caso b) la situacin va a ser diferente, pues la relacin cuadrtica


no va a poderse aproximar linealmente
Y = 3X2 + 2 =

= 3X + 2

x2 dx + 2

2
Y

3X + 2

dx = 3 X + 2 = 3

= ( 3 x + 2) dx (3 x + 2) dx = 9 X

(3 x2 + 2) f ( x) dx = 3
1

2
4
X2 =
5

Y = +2 / 5
Ahora los resultados obtenidos con (5.7.5) son prximos a los anteriores,
pero no idnticos, como se comprueba fcilmente
Y =

( X ) = 3

+2=

2
3 4
11
3; Y2 = ( ) 2X = 36 2 2X =
4 5
4

Suma y Producto de Variables Aleatorias


Van a considerarse a continuacin situaciones generales que involucran
a variables aleatorias X (escalares o vectoriales) que dependen de un conjunto de n variables X1, X2, ..., Xn. La caracterizacin de X necesitar de funciones de distribucin conjuntas, densidad f(x1, x2, ..., xn) o de esquema de
probabilidad integral F(x1, x2, ..., xn), que son las generalizaciones de las
vistas en el caso monodimensional. En estos casos la imagen de la distribucin de masa es igualmente aplicable. Por su importancia y, adems, por la
simplicidad de notacin, va a comenzarse estudiando la suma y el producto
de un par de variables aleatorias X1 y X2 que dan origen a una nueva variable
sencilla X = X1 + X2 X = X1X2. Se tratar nicamente el caso continuo,
siendo el discreto la traduccin directa de integrales sobre la funcin densidad conjunta por sumas sobre las probabilidades en puntos concretos de una
malla plana. La visualizacin de f(x1, x2) 0 normalizada como la densidad

310

DISTRIBUCIONES DE PROBABILIDAD

de probabilidad en el diferencial dx1dx2 hace que f(x1, x2)dx1dx2 sea la masa de


probabilidad contenida en el intervalo bidimensional x1 < X1 < x1 + dx1, x2 <
X2 < x2 + dx2, y por tanto la probabilidad en un intervalo arbitrario viene
dada por la integral

p ( a1 < X1 b1 ; a2 < X 2 b2 =

b1
a1

dx1

b2
a2

dx2 f ( x1 , x2 )

(5.7.7)

a) En el caso de X = X1 + X2 se puede calcular el valor medio de X extendiendo la definicin ya conocida (5.7.2)


X = X1 + X2 =

`
`
`
`

x1dx1

`
`

`
`

dx1

dx2 f ( x1 , x2 ) +

x1 f1( x1 ) dx1 +

`
`

dx2 ( x1 + x2 ) f ( x1, x2 ) = f ( xj ) =
`

`
`

x2 dx2

dxi f ( xi , xj ) =
`

(5.7.8)

dx1 f ( x1 , x2 ) =

x2 f2 ( x2 )dx2 = X1 + X2 = 1 + 2

en donde se han introducido las denominadas distribuciones marginales,


f1(x1) y f2(x2), asociadas con cada variable cuyas definiciones estn contenidas en el desarrollo de (5.7.8) y se visualizan como las distribuciones de
probabilidad resultantes de integrar parcialmente la distribucin conjunta sobre la variable que no se contempla. As, la media de la suma es la
suma de las medias, tanto si las variables son dependientes como si son
independientes.
b) El caso del producto X = X1 X2 es un poco ms complicado, pues f(x1, x2)
no podr en general distribuirse en contribuciones separadas de cada variable. Se tiene as que
X = X1 X2 =

x1dx1

dx2 x2 f ( x1 , x2 )

(5.7.9)

No obstante, si X1 y X2 son independientes, se tiene la factorizacin de las


funciones de distribucin conjuntas
f ( x1 , x2 ) = f1 ( x1 ) f2 ( x2 ); F ( x1 , x2 ) = F1 ( x1 ) F2 ( x2 )

(variables
independientes)

(5.7.10)

y el valor medio se expresa

311

CLCULO NUMRICO Y ESTADSTICA APLICADA

X = X1 X 2 =

x1 f1 ( x1 ) dx1

x2 f2 ( x2 )dx2 = X1 X 2 = 12

(5.7.11)

con lo que en el caso de variables independientes la media del producto es el


producto de las medias. Relacionado con esto est el clculo del momento
central de orden uno con respecto a cada variable (los momentos aqu se
definen de modo anlogo a (5.4.8) y (5.4.9))

11 =

(X

1 ( X 2 2

dx1

dx2 ( x1 1 ( x2 2 f ( x1 , x2 )

(5.7.12)

y que teniendo en cuenta las propiedades de la integral puede desarrollarse


simblicamente como

11 =

(X

1 ( X 2 2

(X X

1 X2 2 X1 + 12

= X1 X 2 12 (5.7.13)

Esta cantidad especial se denomina la covarianza de X1 y X2 y mide el grado de correlacin entre dos variables aleatorias, de manera que
0 si X1 y X2 son independienttes
Cov( X1 , X 2 ) = X1 X 2 12 =
11 si X1 y X 2 son dependientes

(5.7.14)

Hay que advertir que una covarianza nula no implica necesariamente la


independencia de las variables. Se volver sobre esta cuestin al tratar el
tema de la correlacin y regresin de variables (Cap. 7).
c) Otro asunto de inters es la evaluacin de la varianza de la suma X = X1
+ X2. El clculo se efecta como de costumbre y simblicamente se expresa

2X = X 2 X

(X

+ X2

X1 + X 2

= 2X + X2 + 2Cov ( X1 , X 2
1

(5.7.15)

y que para variables independientes se convierte en la importante relacin

2X = 2X + 2X variables independientes
1

(5.7.16)

d) La determinacin de la funcin de distribucin de X = X1 + X2 para


variables X1 y X2 independientes es un asunto de especial trascendencia en

312

DISTRIBUCIONES DE PROBABILIDAD

muchas aplicaciones, en particular en el anlisis de seales mediante equipamiento electrnico. En estos anlisis la medicin de una propiedad de un
sistema arroja una seal (grfica) que se compone de la suma de dos efectos
en principio independientes: la seal genuina del experimento y la seal
originada por el ruido del aparato. Ambas seales parciales se presentan
mezcladas en lo que se conoce con el trmino de convolucin. El conocimiento de este concepto es fundamental para entender el principio por el
que la seal medida debe ser limpiada de efectos indeseados y obtener as
una imagen fiable del fenmeno.
El clculo de f(x) y de F(x) se realiza igual que como se ha visto en casos
anteriores. Por brevedad se analizar el caso continuo. De las condiciones del
problema se puede plantear
F ( x) = p( X x) = p( X1 + X 2 x)

f ( x) = f1 ( x1 ) f2 ( x2 )

(5.7.17)

y por tanto
F ( x) =

f ( x) dx =

dx1dx2 f1( x1 )f2 ( x2 ) =

x1 + x2 x

f1 ( x1 ) dx1

x x1

f2 ( x2 ) dx2 (5.7.18)

en donde se ha reorganizado la regin de integracin debajo de la recta x1 +


x2 = x en el plano X1X2. La funcin densidad se calcula derivando con respecto al parmetro x utilizando la regla de Leibnitz con el resultado
f ( x) =

dF
=
dx

f1 ( x1 ) f2 ( x x1 ) dx1 =

f2 ( x2 ) f1 ( x x2 ) dx2

(5.7.19)

en donde se observa la simetra subyacente a la operacin de convolucin.


Esta operacin presenta conexiones muy interesantes con la denominada
transformacin de Fourier, que de hecho constituye un medio prctico muy
poderoso de realizar el clculo (5.7.19) en las aplicaciones, pero su estudio
desborda los contenidos de este curso y no se va a tratar aqu.
e) Los resultados anteriores se generalizan directamente al caso continuo
o discreto de n variables f(x1, x2, ..., xn). De particular inters son las especializaciones siguientes
n

X = X1 + X 2 + ... + X n =

i =1

X =

(5.7.20a)

i =1

313

CLCULO NUMRICO Y ESTADSTICA APLICADA

a1 X1 + a2 X 2 + ... + an X n =

a
i

(5.7.20b)

i =1

X = X1 X 2 ... X n =

X =

i =1

2 ( X ) = 2X ( X1 + X2 + ... + X n =

(a X
1

(variables indepeendientes)

(5.7.21)

i =1

i =1

+ a2 X2 + ... + an X n =

2
Xi

(variables independientes) (5.7.22a)

a
2
i

i =1

2
Xi

(variablees independientes) (5.7.22b)

En consecuencia, si se construye una nueva variable aleatoria X como la


media aritmtica de n variables aleatorias independientes X1, X2, ..., Xn,
todas con la misma media m y la misma varianza s2 se encuentra
X =

X1 + X 2 + ... + X n
n
=
=
n
n

X + X 2 + ... + X n n 2 2

2X = 2 1
= 2 =
X =

n
n
n

(5.7.23)

(5.7.24)

Las relaciones (5.7.23) y (5.7.24) son extremadamente importantes en


las aplicaciones, pues se corresponden con la realizacin de un mismo
experimento estadstico un nmero n de veces independientes unas de
otras. Los resultados indican que la media de todos ellos, la media poblacional m, va a poderse determinar con un error sX tan pequeo como se fije
sin ms que aumentar n. Aunque la convergencia es lenta n1/2, el lmite terico sX 0 est garantizado. Ms adelante se vern las cuestiones prcticas ligadas a estos resultados en el trabajo con muestras de poblaciones
(Cap. 6).
Algunos resultados adicionales exactos relativos a la variable X que se
construye como suma de variables independientes X = X1 + X2 +...+ Xn se
mencionan a continuacin.

314

DISTRIBUCIONES DE PROBABILIDAD

i) Si las variables Xi son Gaussianas, con medias mi y varianzas s2i no


necesariamente iguales, entonces su suma X tambin se distribuye normalmente con media y varianza
n

;
i

=
2

i =1

2
i

(5.7.25)

i =1

ii) Si las variables Xi son del tipo de Poisson, con parmetros li no necesariamente iguales, entonces su suma X tambin se distribuye con el tipo de
Poisson con parmetro
n

(5.7.26)

i =1

iii) Evidentemente, aunque el caso i) en el lmite de grandes valores de n


podra pensarse que es una aplicacin del teorema central del lmite ya mencionado, ambas situaciones no son equivalentes. El teorema citado no exige
comportamiento necesariamente normal a las variables independientes Xi
para que su suma se distribuya segn una Gaussiana, slo exige que n sea
suficientemente grande; se dice entonces que X es asintticamente normal y
se verifican igualmente para ella las relaciones contenidas en (5.7.25). En el
caso i) la situacin es consecuencia de las propiedades algebraicas de la
funcin Gaussiana, y la situacin est mucho ms determinada desde el
principio, pues n no influye para nada en la consecucin del comportamiento normal.

Distribuciones de Probabilidad en n Dimensiones


Para una variable aleatoria n dimensional X la extensin de los conceptos
anteriores es directa y, de nuevo, la analoga de la masa puede utilizarse con
aprovechamiento si se desea. La funcin integral es la masa de probabilidad
acumulada

F ( x1 , x2 ,..., xn ) = p X1 x1 , X 2 x2 ,..., X n xn

(5.7.27)

y con las propiedades correspondientes, F 1 con x1, x2, ..., xn , F 0 con


alguna xi y el resto mantenidas constantes, etc. La funcin densidad en el

315

CLCULO NUMRICO Y ESTADSTICA APLICADA

caso continuo debe necesariamente ser f(x1, x2, ..., xn) 0 y adems normalizable, es decir que una vez dividida por la constante apropiada se tiene

dx1

dx2 ...

dxn f x1 , x2 ,..., xn = 1

(5.7.28)

La masa diferencial de probabilidad est dada por

f x1 , x2 ,..., xn dx1dx2 ... dxn = probabilidad de x1 < X1 < x1 + dx1 , ..., xn < X n < xn + dxn

(5.7.29)
Para el caso discreto el esquema de probabilidades requiere una notacin
ms complicada al tener que utilizar varios ndices: p1i,2j,3k,...,nr = probabilidad
de X1 = v1i, X2 = v2j, ..., Xn = vnr, con la consabida normalizacin
(1)

(2 )

(3)

( n)

... p

1i ,2 j , 3 k ,..., nr

=1

(5.7.30)

en donde i recorre todos los valores que puede tomar X1, j recorre todos los
valores que puede tomar X2, etc.
Las distribuciones marginales se definen como en (5.7.8). Por ejemplo,
para X1
f1 ( x1 ) =

dx2

p1i =

`
`

dx3 ...

(2)

(3 )

( n)

dxn f ( x1 , x2 ,..., xn )

... p

1i , 2 j ,3 k ,..., nr

(5.7.31a)

(5.7.31b)

Los valores medios Xi de cada variable se pueden calcular con sus fi(xi)
anlogamente a lo mostrado en (5.7.8).
Si las variables son independientes, se tienen las factorizaciones

316

F ( x1 , x2 ,..., xn ) = F1 ( x1 )F2 ( x2 )...Fn ( xn )

(5.7.32a)

f ( x1 , x2 ,..., xn ) = f1 ( x1 ) f2 ( x2 )... fn ( xn )

(5.7.32b)

p1i,2 j ,3 k,..., nr = p1i p2 j p3 k ... pnr

(5.7.32c)

DISTRIBUCIONES DE PROBABILIDAD

En cuanto al clculo de probabilidades es tambin la extensin directa de


la ya visto. As la probabilidad de que a1 < X1 < b1, a2 < X2 < b2, ..., an < Xn < bn,
est dada por la integral mltiple

p a1 < X1 < b1 , a2 < X 2 < b2 ,..., an < X n < bn =

b1
a1

dx1

b2
a2

dx2 ...

bn
an

dxn f x1 , x2 ,..., xn

(5.7.33)

Finalmente, para distribuciones generales f(x1, x2, ..., xn) una manera de
representarlas que pone de manifiesto las diferentes correlaciones entre sus
variables es el denominado desarrollo en cluster. Por ejemplo, para n = 3
este desarrollo toma la forma

f x1 , x2 , x3 = f1 ( x1 ) f2 ( x2 ) f3 ( x3 ) + f1 ( x1 ) g2 ( x2 , x3 ) + f2 ( x2 ) g2 ( x1 , x3 ) +
f3 ( x3 ) g2 ( x1 , x2 ) + g3 ( x1 , x2 , x3 )

(5.7.34)

en donde las funciones g2 contienen las desviaciones asignables a las correlaciones entre pares, y la funcin g3 contiene las correlaciones conjuntas
entre las tres variables. Este tipo de desarrollo es un recurso muy utilizado
en el estudio de sistemas de muchas partculas, en los que las correlaciones
ms importantes en general suelen ser las de dos y tres cuerpos (hay excepciones, claro).
EJERCICIO 5.7.2
La distribucin de velocidades de Maxwell para las molculas de un gas
monoatmico clsico en equilibrio est dada por la densidad de probabilidad
m 2

f ( vx , vy , vz ) = C exp
vx + vy2 + vz2 ; ` < vi < `, i = x, y, z
2

en donde m es la masa del tomo, b = 1/kBT es el inverso de la temperatura


absoluta (kB = constante de Boltzmann), y C es una constante. Determinar: a)
las distribuciones marginales de cada componente; b) la constante de normalizacin; c) el valor medio del vector velocidad V = (vx, vy, vz) y las desviaciones
tpicas de cada componente; d) la funcin densidad para la distribucin del
mdulo de la velocidad; e) la moda de la distribucin de mdulos.
a) Por simple inspeccin se ve que las tres componentes de la velocidad
actan como variables independientes y, adems, lo hacen de manera formalmente idntica. Se tiene entonces que

317

CLCULO NUMRICO Y ESTADSTICA APLICADA

m 2

f ( vx , vy , vz ) = C exp
vx + v2y + vz2 =
2

m 2
m 2
m 2
= C exp
vx exp
vy exp
v
2

2 z
y cada distribucin marginal toma la forma
m 2
fi ( vi ) = C1/ 3 exp
v ; i = x, y, z
2 i
f ( vx , vy , vz ) = fx ( vx ) f y ( vy ) fz ( vz )
b) C es la constante de normalizacin y se calcula a travs de
C

dvx dvy dvz f ( vx , vy , vz ) = C

m 2 2 2
v + v + v =1
dvx dvy dvz exp
2 x y z
`

Por ello, se tiene entonces


C

m 2

dvx dvy dvz exp


vx + v2y + vz2 = C
`
2

m 2
dvx exp
v =1
2 x
`
`

y utilizando (5.6.12) se obtiene


m
C=
2

3/ 2

Esta no es la normalizacin habitual, que se hace a nmero de molculas por unidad de volumen, pero tal hecho no representa un cambio significativo.
c) El valor medio de la magnitud aleatoria vectorial se formula como
V =

(v , v , v ) = ( v
x

, vy , vz

y de nuevo se observa que por simetra los tres valores medios, uno por
cada componente, van a ser iguales y, adems, nulos. Por ejemplo, para vx se
obtiene

318

DISTRIBUCIONES DE PROBABILIDAD

vx = C

m 2 2 2
dvx dvy dvz vx exp
vx + vy + vz = C1/ 3
2

m 2
vx exp
v dv = 0
2 x x

Las medias de cada componente y el vector velocidad medios son pues


vx = vy = vz = 0 V = 0
Las desviaciones tpicas tambin van a coincidir entre s por simetra.
La correspondiente a la componente x, por ejemplo, se evala como
(5.6.14)

2x = vx2 vx

= v2x = C1/ 3

m 2
1
v2x exp
vx dvx =
m
2

y las desviaciones tpicas son

x = y = z =

kBT
m

es decir crecen con la temperatura absoluta y disminuyen con la masa del


tomo.
d) La distribucin del mdulo de la velocidad v es sencilla de obtener
notando que
v2 = v2x + v2y + vz2 ;

dvx dvy dvz = v2sen dvd d

en donde se ha utilizado el paso a coordenadas polares esfricas en el espacio de velocidades (es anlogo a las conocidas coordenadas polares esfricas
espaciales)
0 v < `; 0 ; 0 < 2
Con ello se tiene
m 2
m 2

f ( v) = C exp
vx + v2y + vz2 = C exp
v
2

que normalizada adecuadamente (de nuevo a la unidad) resulta

319

CLCULO NUMRICO Y ESTADSTICA APLICADA

v2 dv

sen d

m 2
d exp
v =C
2

m 2
v2 exp
v dv
2

sen d

d = 1

de donde resulta el valor de la nueva constante de normalizacin para esta


distribucin
m
C = 4
2

3/ 2

Esta distribucin no es simtrica y se escribe en la forma final


3

m 2 2
m 2
f ( v) = 4
v exp
v

2
2

Se dejan al lector los clculos de los coeficientes de asimetra y exceso.


e) La moda es el valor ms probable y se obtiene derivando f(v) e igualando a cero (clculo del mximo) El resultado es
vMx =

2 kB T
m

resultado que indica que el valor mximo del mdulo crece con la temperatura absoluta y disminuye con la masa.

320

DISTRIBUCIONES DE PROBABILIDAD

BIBLIOGRAFA
1. SPIEGEL, M. R.; SCHILLER, J. y ALU SRINIVASAN, R., Probabilidad y Estadstica, 3.a
Edicin (Serie Schaum), McGraw-Hill, Madrid (2010). (Caps. 1, 2, 3, 4).
2. SPIRIDONOV, V. P. y LOPATKIN, A. A., Tratamiento Matemtico de Datos Fsico-qumicos, Mir, Mosc, 1973. (Caps. 1, 2).
3. SES, L. M., Mtodos Tericos de la Qumica-Fsica (Vol. 1), UNED, Madrid,
1994. (Temas 6, 7).
4. PRESS, W. H.; FLANNERY, B. P.; TEUKOLSKY, S. A. y VETTERLING, W. T., Numerical
Recipes, Cambridge University Press, Cambridge, 1986. (Caps. 6, 13).
5. TURNER, J. C., Matemtica Moderna Aplicada, Alianza (Madrid), 1993. (Caps. 1, 2,
3, 4).
6. CRAMR, H., Elementos de la Teora de Probabilidades, Aguilar, Madrid, 1968.
(Caps. 5, 6, 7, 9, 10).
7. SPIEGEL, M. R.; LIU, J. y ABELLANAS, L., Frmulas y Tablas de Matemtica Aplicada,
McGraw-Hill, 2.a Edicin Revisada (Serie Schaum), Madrid (2005).

321

CLCULO NUMRICO Y ESTADSTICA APLICADA

PROBLEMAS TERICOS Y NUMRICOS

Problemas tericos
5.1) Determinar las posiciones de los tres cuartiles de la distribucin de probabilidades con densidad
x si 0 < x < 1
f ( x) =
0 en otro caso
5.2) Deducir la expresin para la varianza de una distribucin binomial.
5.3) Deducir la expresin para el momento central de tercer orden y el coeficiente de sesgo de una distribucin de Poisson.
5.4) Obtener la forma de la densidad log-normal por derivacin (Leibnitz) de la
frmula de su funcin integral

(y
ln x
1
exp

G( x) = 2 `
2 2

0
, si x 0

dy,

si 0 < x < `

5.5) Calcular el valor medio de la distribucin log-normal en funcin de la


media y varianza de la variable normal auxiliar Y.
5.6) Una propiedad muy til de la funcin Gaussiana que se emplea en clculos de orbitales moleculares es la de que el producto de dos Gaussianas,
con centros y desviaciones estndar no necesariamente iguales, es una
nueva Gaussiana. Ilustrar esta propiedad con el producto de las dos Gaussianas monodimensionales no normalizadas

2
2
exp a x xa exp b x xb ; a, b > 0

identificando los parmetros de la Gaussiana resultante.

322

DISTRIBUCIONES DE PROBABILIDAD

Problemas numricos
5.7) La determinacin del contenido en 87Rb de una coleccin de muestras
slidas de leucita se ha realizado mediante tres tcnicas diferentes A, B y
C. En cada una de ellas y tras la determinacin las citadas muestras
pueden ser aceptadas (p) directamente para posterior procesamiento,
rechazadas (q) como inservibles, o reutilizadas (r) para otros fines. Los
esquemas de probabilidad son los siguientes
Tcnica

Aceptacin p

Rechazo q

Reutilizacin r

0,40

0,31

0,29

0,30

0,32

0,38

0,28

0,35

0,37

Cul es la tcnica que en conjunto presenta la menor incertidumbre


(menor entropa)? Es necesariamente tal tcnica la mejor desde un
punto de vista qumico?
5.8) Con los datos del Ejercicio 5.5.2 para una muestra de 20 disoluciones elegidas al azar determinar la probabilidad de que exactamente 2 sean defectuosas. Utilizar las distribuciones binomial y de Poisson.
5.9) La distribucin de Poisson para un fenmeno aleatorio que se produce
un nmero de veces en un intervalo de tiempo t toma la forma

(t)
p (t ) =

exp ( t

En el caso de la desintegracin radiactiva l es una constante con dimensiones de (tiempo)1. La frmula anterior se reduce a la expresin convencional de esta distribucin haciendo x = lt. Aplicar la forma anterior
dependiente del tiempo para responder a las siguientes cuestiones relativas al nmero de tomos radiactivos de una muestra que se desintegran
en un tiempo t.
a) Con qu probabilidad se habr desintegrado al menos un tomo?
b) Para la desintegracin 93Sr 93Y la constante de desintegracin
radiactiva es l = (ln 2)/T (minutos)1 con T = 8 minutos. Construir la

323

CLCULO NUMRICO Y ESTADSTICA APLICADA

tabla reducida de probabilidades con 0 v 5 tomos desintegrados de


93
Sr en los tiempos t = T, 2T. En esos tiempos, cuntos tomos de
una muestra inicial de N quedan sin desintegrar?
c) Estudiar la evolucin temporal de la distribucin b) considerando
sus parmetros caractersticos m, s, g1 y g2.
5.10) Un conjunto de espines independientes s = 1/2 se encuentran en equilibrio trmico en un campo magntico B. La componente z de estos espines puede orientarse de dos maneras con respecto a B: paralela o antiparalelamente. Si la probabilidad de orientarse paralelamente es p = 0,7
y considerando un conjunto de N = 300 de estos espines, obtener las probabilidades de los sucesos siguientes.
a) Nmero de espines paralelos sea v 200. Evaluar el efecto de considerar o no correcciones de continuidad y tambin el efecto de
tomar un redondeo a dos tres decimales en la variable tipificada.
b) Nmero de espines paralelos sea v < 225.
c) Nmero de espines paralelos est entre 195 v 215.
d) Nmero de espines antiparalelos est entre 70 < v < 100.
Redondear a dos decimales las evaluaciones finales de la variable tipificada en los casos b), c) y d).
5.11) Un anlisis del contenido en 238U de una serie de muestras de carnotita
lleva a aceptar directamente para posterior procesamiento el 35%, a
rechazar el 45%, y a reutilizar el resto en otros fines. En un conjunto de
N = 10 muestras elegidas al azar determinar las probabilidades siguientes.
a) Aceptar 5, rechazar 2 y reutilizar 3.
b) Aceptar todas.
c) Rechazar todas.
d) Reutilizar todas.
e) Si el conjunto est compuesto por N = 1000, estimar la probabilidad
de aceptar 500, rechazar 200 y reutilizar 300.
f) Si el nmero de elementos de la muestra es N = 1000, calcular la probabilidad de que sean aceptables en un primer ensayo al menos 300.

324

DISTRIBUCIONES DE PROBABILIDAD

5.12) La longitud en de la unidad monomrica de un polmero se distribuye


uniformemente entre 20 < L < 25, no salindose de tales lmites. Determinar los cuatro momentos centrales de esta distribucin, la asimetra y
el exceso. Para una cadena lineal de N = 500 unidades, supuestas independientes, obtener la longitud media y la desviacin tpica. Dar una respuesta final significativa para la longitud.

SOLUCIONES
Problema 5.1
La funcin densidad no est normalizada, hay que normalizarla y calcular despus la funcin integral de probabilidades. La constante de normalizacin C se calcula travs de
C

f ( x) dx =C

xdx =

C
= 1 C = 2
2

La funcin densidad normalizada es pues


2 x si 0 < x < 1
f ( x) =
0 en otro caso
La funcin integral est definida en tres partes
0
si ` < x < 0
x

F ( x) = 2 u du = x2 si
0 x <1
0
si
1 x
1

Con F(x) la determinacin de los cuartiles es inmediata, ya que esta funcin representa la probabilidad total encerrada entre y x. Para el primer
cuartil x = z1, F(z1) encierra un 25% de la masa de probabilidad; para el
segundo cuartil x = z2, F(z2) encierra un 50% de la masa de probabilidad; y
para el tercer cuartil x = z3, F(z3) encierra un 75% de la masa de probabilidad. Es entonces inmediato establecer

325

CLCULO NUMRICO Y ESTADSTICA APLICADA

F (1 ) = 12 = 0, 25 1 = + 0, 25 = 0, 5
F ( 2 ) = 22 = 0, 5 2 = + 0, 5 0, 7071
F ( 3 ) = 32 = 0, 75 3 = + 0, 75 0, 8660

Problema 5.2
El clculo de la varianza de una distribucin binmica se efecta como
sigue
N

2 =

( ) P =
2

=0

2 P 2 =

( 1)!( N )! p q
N!

=0

=0

( Np

N!
p q N ( Np
!( N )!

) = { = 1;
2

N = N 1 =

=1

( + 1) N ! p q

!( N )!

Np

( Np

=Np

= 0

N !

+ Np
p q N ( Np

!( N )!
= 0

N !

p q N +

!( N )!
= 0

2
N !

p q N +Np ( Np) =

!( N )!
= 0

=Np

= Np ( N 1 p + Np N 2 p2 = Np (1 p = Npq
en donde se han tenido en cuenta: el valor medio p = (N 1)p y la normalizacin de la distribucin con ensayos.

Problema 5.3
El clculo del momento central de tercer orden de una distribucin de
Poisson se realiza como sigue

326

DISTRIBUCIONES DE PROBABILIDAD

3 =

( )

p =

=0

( )

=0

exp( ) =
!

`
`
`

+1
`
+2
+ 3
3
2
exp( )

+3

!
!
!
!
=0
=0
=0

= 0

Del clculo del valor medio y de la varianza de esta distribucin, junto


con la relacin de normalizacin, la expresin de a3 se reduce a calcular el
momento de tercer orden con respecto al origen
`

3 =

exp( ) 3 + 2 + 3 2 3 =
3
exp( ) 3 2 3

!
=0
=0

+ 1)
exp( ) = 3 + 3 2 +
exp( ) = 2
exp( ) =
(
!

1
!

(
)
=0
=1
= 0

Se encuentran as

3 = ; 1 =

( )

1
+

Problema 5.4
La funcin densidad se calcula por derivacin con respecto al parmetro
x en la integral del enunciado

(y
ln x
1
exp

G( x) = 2 `
2 2

0
, si x 0

dy,

si 0 < x < `

La regla de Leibnitz para derivar con respecto a un parmetro u no es


la variable de integracin! del que depende una integral, se expresa en
general

327

CLCULO NUMRICO Y ESTADSTICA APLICADA

d
du

2 ( u )

1 ( u )

H (t , u) dt =

2 ( u)

1 ( u)

d
d
H (t , u)
dt +H 2 ( u), u 2 H 1 (u), u 1
u
du
du

En el caso presente se tienen las equivalencias


( y )2
H ( t, u) H ( y, x) = H ( y) = exp

2 2

H H
= 0; H 2 ( u), u H ln x ; H 1 ( u), u H ` 0

u x
El clculo lleva a

ln x
(
1
d ln x

=
exp
dG( x) H (ln x)

g( x) =
=
dx
2 2
x 2
dx

0, si x 0

, si 0 < x < `

Problema 5.5
El clculo del valor medio log-normal se plantea como
X =

xg( x)dx =

( ln x
x
exp

2 2
x 2

z
(
exp

` 2
2 2

exp( z)

exp( )

dx = z = ln x
=

dx = exp( z) dz

dz = t = z =

dz = dt

t2

2
exp 2 + t dz = exp +

2
`
2

Problema 5.6
Unas sencillas manipulaciones algebraicas conducen a

328

DISTRIBUCIONES DE PROBABILIDAD

2
2
exp a x xa exp b x xb =

ax + bxb
2
ab

xa xb exp ( a + b x a
exp
a + b

a+ b

El primer trmino es una constante y el segundo trmino es ya la funcin


Gaussiana resultante del producto, que tiene su centro (de gravedad) en la
media ponderada de los centros xa y xb

axa + bxb
a+ b

y con varianza dada por la varianza reducida de las varianzas s2a = 1/2a y
s2b = 1/2b

2 =

2 2
1
1
=
= 2a b 2
1
1
2( a + b
a + b
+ 2
2
a b

La normalizacin de la expresin resultante se deja como ejercicio al lector.

Problema 5.7
La evaluacin de la funcin entropa H para cada tcnica da los siguientes resultados redondeados a cuatro decimales
H A = 0, 4 ln 0, 4 0, 31ln 0, 31 0, 29 ln 0, 29 = 1, 0886
H B = 0, 3 ln 0, 3 0, 32 ln 0, 32 0, 38 ln 0, 38 = 1, 0935
HC = 0, 28 ln 0, 28 0, 35 ln 0, 35 0, 37 ln 0, 37 = 1, 0917
La mxima entropa para este sistema de tres estados es la correspondiente a la distribucin equiprobable y tiene el valor
1 1 1 1 1 1
HEq. = ln ln ln = ln 3 = 1, 0986
3 3 3 3 3 3

329

CLCULO NUMRICO Y ESTADSTICA APLICADA

y la mnima entropa toma el valor cero y corresponde a la distribucin en la


que uno de los estados se presenta con p = 1.
A la vista del valor de la entropa mxima, las pequeas diferencias
entre valores de entropa son significativas. Ntese que un redondeo a dos
decimales en los resultados no discriminara entre las tres tcnicas. Por
tanto, aunque los tres valores de la entropa estn aparentemente prximos
entre s, la tcnica con menor incertidumbre global es la A. Naturalmente,
esto no significa necesariamente que A sea la mejor tcnica de las tres, algo
que depender de un gran nmero de circunstancias ajenas al clculo anterior (la riqueza relativa de la mena de leucita encontrada, los errores de las
tcnicas, etc). No obstante, el anlisis de la entropa da una buena informacin sobre la muestra y sobre las tcnicas utilizadas a complementar con
otras consideraciones.

Problema 5.8
a) El clculo binmico con p = 0,1 y q = 0,9 lleva redondeando a cuatro
decimales a
20
20 !
P2 = 0,12 0, 918 =
0,12 0, 918 = 0, 2852
2 ! 18!
2
b) Utilizando la distribucin de Poisson como aproximacin a la binomial, tomando l = Np = 20 0,1 = 2, se obtiene con cuatro decimales
p2 =

2
22
exp( ) =
exp(2) = 0, 2707
2!
2!

La aproximacin p2 a P2 tiene un error de 5%.


Este tipo de aproximacin resulta tanto mejor cuanto ms pequeas son
p y l. En trminos cuantitativos esta mejora se observa para valores p 0,1 y
l 5.

Problema 5.9
a) La distribucin de Poisson con los dos parmetros temporales es

330

DISTRIBUCIONES DE PROBABILIDAD

(t)
p (t) =

exp ( t

y la probabilidad de que al menos se haya desintegrado un tomo en un


tiempo t puede obtenerse utilizando la probabilidad del suceso complementario (ningn tomo desintegrado)

p ( 1 = p1 (t ) + p2 ( t ) + ... + pN (t ) + ... = 1 p0 (t ) = 1 exp ( t

b) En el caso de la desintegracin 93Sr 93Y la distribucin es

t ln 2

( t exp t = 8 exp 1 t ln 2
p ( t ) =
(
8

!
!

Para t = T = 8 y t = 2T = 16 se tienen
1 ( ln 2
p (8) =
2 !

1 ( ln 4
p (16 ) =
4 !

Los esquemas de probabilidad resultantes hasta v = 5 y con redondeo a


cuatro decimales se incluyen en la tabla.
Tabla. Problema 5.9
v

pv(8)

1
2

ln 2
2

pv(16)

1
4

ln 4
4

pv(8)

0,5

pv(16)

0,25

( ln2)2

( ln 2)3

(ln 2)4

( ln 2)5

12

48

240

( )

( )

( )

( )5

0,3466

8
0,1201

24
0,0278

96
0,0048

480
0,0007

0,3466

0,2402

0,1110

0,0385

0,0107

ln 4

ln 4

ln 4

ln 4

El nmero de tomos sin desintegrar en cada caso es


n8 = Np0 (8) = N / 2;

n16 = Np0 (16) = N / 4

331

CLCULO NUMRICO Y ESTADSTICA APLICADA

Esto da el sentido fsico de T que es el tiempo en el que se han desintegrado la mitad de los tomos radiactivos presentes.
c) Es de notar en la tabla anterior que la distribucin de probabilidades
de v cambia con el tiempo. Se observa cmo hay un desplazamiento hacia la
derecha al crecer t, lo que est de acuerdo con el hecho de que son ms y
ms probables un mayor nmero de desintegraciones. Esto puede cuantificarse globalmente estudiando el cambio en los parmetros caractersticos.
As se obtienen

(t ) = x =

t
ln 2; crecimiento de la media lineal con el tiempo
8

(t ) =

crecimiento de la desviacin tipica ms suave, con la raz


t
ln 2 ; cuadrada del tiempo
8

1 (t ) =

8
; decrecimiento del sesgo con la raz cuadrada del tiempo
t ln 2

2 (t) =

8
; decrecimiento de curtosis ms rpido, con el inverso del tiempo
t ln 2

La asimetra y la curtosis son positivas y tienden a cero con t , de


manera que en ese lmite la distribucin es simtrica y el exceso pasa de ser
del tipo leptocrtico a mesocrtico (gaussiano).

Problema 5.10.
La evaluacin de Np y Nq indica que el problema puede tratarse con una
distribucin Gaussiana, pues
Np = 300 0, 7 = 210 > 5; Nq = 300 0, 3 = 90 > 5
siendo la media y la desviacin tpica

= Np = 210; = Npq = 63 7, 937


Al transformar la distribucin discreta (binomial) en continua (Gaussiana) conviene utilizar las llamadas correcciones de continuidad, que en defi-

332

DISTRIBUCIONES DE PROBABILIDAD

nitiva son una manera de definir las marcas de clase. Por ejemplo, el
nmero entero v = 175 se corresponde con el intervalo definido con 0,5
sobre la ltima cifra significativa escrita: 174,5 x < 175,5. Se ha elegido
incluir el lmite inferior, aunque podra haberse tomado el superior. Esto
obliga a ajustar las cuestiones formuladas en consonancia con esta definicin para determinar los valores de la variable normal tipificada Z. Los valo
res de la variable tipificada pueden determinarse perfectamente con s = 63
en los clculos con calculadora utilizando todos los decimales que sta
ofrezca, esto no representa ningn engorro y es siempre conveniente (utilcese una memoria libre para almacenar este dato o combnense adecuadamente las operaciones). No obstante, el lector puede utilizar la expresin
decimal truncada, cerciorndose siempre de que se garantiza la precisin
requerida por el problema o la aplicacin que est investigando. En las condiciones pedidas el valor 7,937 resulta suficiente. En adelante se utilizar el
signo = en vez de cuando convenga.
a) El caso v 200 equivale a X 199,5 con correccin de continuidad
z=

x 199, 5 210
=
= 1, 3229

63

Sin correccin de continuidad X 200


z=

x 200 210
=
= 1, 2599

63

Con dos decimales de redondeo en Z

p( 2 ) ( X 199, 5 = p ( Z 1, 32 = p ( 1, 32 Z < 0 + p ( Z 0 =
= 0, 4066 + 0, 5 = 0, 9066
y anlogamente

p( 2 ) ( X 200 = p ( Z 1, 26 = 0, 8962
Con tres decimales de redondeo se tiene la condicin Z 1,323 y la
probabilidad es

333

CLCULO NUMRICO Y ESTADSTICA APLICADA

p( 3 ) ( X 199, 5 = p ( Z 1, 323 = p( Z 0 ) + p (0 < Z 1, 323 =


= 0, 5 + 0, 40708 = 0, 9071
Para obtener la probabilidad p(0 < Z 1,323) se ha interpolado linealmente
en las entradas de la tabla p(0 < Z 1,32) = 0,4066 y p(0 < Z 1,33) = 0,4082

p ( 0 < Z 1, 323 = p (0 < Z 1, 32 +

0, 003 0, 0016
= 0, 4066 + 0, 00048 = 0, 4071
0, 01

Comparando resultados se observa que de no haber tomado la correccin


de continuidad (con dos decimales): p(2)(X 200) = 0,8962 y p(2)(X 199,5) =
0,9066, hay pues una pequea diferencia del 1,15% de la primera estimacin con respecto a la segunda ms precisa. En cuanto al redondeo con
correccin de continuidad incluida: p(2)(X 199,5) = 0,9066 y p(3)(X 199,5) =
0,9071, una diferencia de 5,104 realmente pequea (0,055%) que puede
despreciarse sin afectar significativamente el resultado.
b) En este caso v < 225 equivale a X < 224,5 y la variable tipificada
toma el valor redondeado a dos decimales
z=

224, 5 210
63

= 1, 83

p ( X < 224, 5 = p ( Z < 1, 83 = p( Z < 0) + p (0 Z < 1, 83 = 0, 5 + 0, 4664 = 0, 9664


c) Ahora la condicin 195 v 215 es equivalente a 194,5 X < 215,5 y
los valores lmites de la variable tipificada son con redondeo a dos decimales
z1 =

194, 5 210
63

= 1, 95;

z2 =

215, 5 210
63

= 0, 69

La probabilidad es entonces (Fig. 5EP.1)

p (194, 5 X < 215, 5) = p ( 1, 95 Z < 0, 69 ) = p ( 0 < Z 1, 95) +


+ p(0 Z < 0, 69) = 0, 4744 + 0, 2549 = 0, 7293

334

DISTRIBUCIONES DE PROBABILIDAD

Figura 5EP.1. Diagrama para el clculo de probabilidad para el Problema 10 apartado c).

d) Ahora conviene ver el problema desde el punto de vista complementario, es decir, el de los espines antiparalelos, para el cul p = q y q = p. En
este caso la media cambia, pero no la desviacin tpica

= Np = 300 0, 3 = 90;

= Npq

La situacin pedida es 70 < v < 100 y es equivalente a 70,5 X < 99,5 con
lo que los valores lmites de la variable tipificada Z son
z1 =

70, 5 90
63

= 2, 4568 2, 46; z2 =

99, 5 90
63

= 1,1969 1, 20

Utilizando el redondeo a dos decimales la probabilidad es entonces

) (

) (

p 70, 5 X < 99, 5 = p 2, 46 Z < 1, 20 = p 0 < Z 2, 46 +

+ p 0 Z < 1, 20 = 0, 4931 + 0, 3849 = 0, 8780

Problema 5.11
La aplicacin de la distribucin multinomial da los resultados con tres
dgitos significativos (casos a) al d))

335

CLCULO NUMRICO Y ESTADSTICA APLICADA

a) P(5, 2, 3) =

10 !
0, 355 0, 452 0, 23 = 0, 0214 = 2,14 10 2
5! 2! 3!

b) P(10, 0, 0) =

10 !
0, 3510 0, 450 0, 20 = 2, 76 10 5
10 ! 0 ! 0 !

c) P(0,10, 0 ) =

10 !
0, 350 0, 4510 0, 20 = 3, 4110 4
0 ! 10 ! 0 !

d) P(0, 0,10) =

10 !
0, 350 0, 450 0, 210 = 1, 02 107
0 ! 0 ! 10 !

e) Esta es una evaluacin ciertamente complicada de llevar a cabo


P(500, 200, 300 ) =

1000 !
0, 35500 0, 45200 0, 2300
500 ! 200 ! 300 !

y conviene utilizar la aproximacin de Stirling para el factorial de nmeros


grandes. La idea es calcular el logaritmo neperiano de la aproximacin y luego tomar antilogaritmos para tener una estimacin de la probabilidad.
N ! ~ 2 N N N exp( N ) ln N ! ~

1
ln (2 N + N ( ln N 1
2

Se tiene entonces que


ln P = ln 1000 ! ln 500 ! ln 200 ! ln 300 !+ 500 ln 0, 35 + 200 ln 0, 45 + 300 ln 0, 2
El resultado es negativo y el antilogaritmo resulta ser una cantidad muy
pequea
ln P ~ 144, 78331 P ~ 1, 32 10 63
f) En este caso hay que visualizar el problema como una distribucin
binomial en la que 300 o ms sean aceptables, lo que tiene asociada una
probabilidad p = 0,35, con lo que la probabilidad de que no sea aceptable
para procesar en primera instancia resulta q = 0,65. El clculo binomial
sera

336

DISTRIBUCIONES DE PROBABILIDAD

10
000

P( 300) =

1000
1000
300
700
0, 35 0, 651000 =
0, 35 0, 65 +

300

= 300

1000
0, 35301 0, 65699 + ...
+

301
Este es de nuevo un clculo ciertamente complejo que conviene abordar
utilizando la distribucin Gaussiana, pues Np = 1000 0,35 = 350 > 5; Nq =
1000 0,65 = 650 > 5. La media y la desviacin tpica son
= 1000 0, 35 0, 65 = 227, 5 . 15, 083
= Np = 1000 0, 35 = 350; = Npq
y la probabilidad pedida resulta P(v 300) = P(X 299,5) en donde se ha
tomado la convencin de las marcas de clase como en el problema 8:
299,5 (X = 300) < 300,5. El valor de la variable Z es redondeado a dos
decimales
X
299, 5 350
Z =
z =
= 3, 35

227, 5
y por tanto la probabilidad resulta

P ( 300) = P ( X 299, 5) = P Z 3, 35 = 0, 4996 + 0, 5 = 0, 9996


Los mismos comentarios hechos en el Prob. 10 con respecto a la divisin
por s se aplican aqu.

Problema 5.12
Hay primero que plantear la funcin densidad de probabilidad en forma
normalizada. Es del tipo rectangular y resulta
1

f ( x) = 1 si 20 < x < 25 normalizacin


n f ( x) = 5

0 en otro caso
0

si 20 < x < 25
en otro caso

en donde la constante de normalizacin se ha determinado haciendo

337

CLCULO NUMRICO Y ESTADSTICA APLICADA

25

f ( x) dx = C

20

25

dx = 5C = 1 C = 1 / 5

20

El clculo del valor medio es trivial y su resultado fcil de anticipar por la


simetra de la distribucin

= L =

25

20

25

1
x2
x dx =
5
10

= 22, 5
20

Los momentos centrales (con respecto a m) se calculan directamente

1 =

25

( x ) f ( x) dx = 0

20

2 = 2 =

25

20

( x )

2 ,5

2,5

3 =

4 =

25

25

20

20

( x )

( x )

f ( x) dx = u = x ; du = dx =
u2

f ( x) dx =

f ( x) dx =

2 ,5

2 ,5

u2 f (u + ) du =

1
2
du = 2, 53 2, 0833 2
5
15
2 ,5
2,5

u3 f (u + ) du =

2 ,5
2,5

2,5

1
u3 du = 0 (por simetra impar)
5
2 ,5

u4 f (u + ) du =

2 ,5

2,5

u4

1
2, 55
2 7, 8125 4
du =
5
25

Los coeficientes de sesgo y de curtosis se evalan a partir de los resultados anteriores

1 =

= 0; 2 =

4
4

3 = 1, 2

dando medidas cuantitativas de lo que se sabe por simple inspeccin de


f(x) que la asimetra es nula y que la curtosis es completamente plana. Estos
resultados coinciden obviamente con los que se hubieran obtenido aplicando las frmulas (5.6.3) a (5.6.6).
Para 500 unidades independientes la longitud total es la suma de las
longitudes medias de cada unidad, y la varianza la suma de las varianzas de
cada unidad. Al ser todas las unidades equivalentes se tiene

338

DISTRIBUCIONES DE PROBABILIDAD

LT = N = 500 . 22, 5 = 11250

T2 = N 2 = 500

2
2, 53 1041, 6667 T 32, 275
15

Con estos resultados se escribira para la longitud en de la cadena


polimrica los intervalos
1 11250 32
2 11250 65
3 11250 97
en donde se ha redondeado a dos cifras la semianchura de cada intervalo.

339

CAPTULO 6
MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

6.1.
6.2.
6.3.
6.4.
6.5.
6.6.
6.7.
6.8.

Muestreo de poblaciones
Distribuciones muestrales
Inferencia estadstica (I)
Inferencia estadstica (II)
Funcin de potencia y curva OC
Grficos de control (Shewhart) y aleatoriedad
Comparacin de muestras: medias y proporciones
Teora de pequeas muestras

Bibliografa
Problemas tericos y numricos

Se consideran cuestiones estadsticas de corte prctico, como son: el muestreo de poblaciones, la estimacin de parmetros poblacionales, y la formulacin y validacin de hiptesis estadsticas. Se comienza con unas ideas generales de los tipos de muestreo (al azar, estratificado, con y sin remplazamiento)
y de las distribuciones muestrales (de medias, de varianzas, de proporciones, de
diferencias y sumas). Con ello se pretende ilustrar cmo adquirir informacin
general sobre una poblacin y hasta el epgrafe 6.7 se considerar que la muestra
es suficientemente grande y puede tratarse as mediante una distribucin Gaussiana. El paso siguiente es la Inferencia Estadstica que se divide en dos partes.
La primera se dedica a las estimaciones de los parmetros de la poblacin (verdaderos valores) a partir de las aproximaciones que dan los denominados estadsticos de la muestra, centrando la discusin en las estimaciones por punto y
por intervalos de confianza. La segunda parte de la Inferencia considera el problema de la toma de decisiones a partir de los anlisis anteriores efectuados
sobre muestras extradas de una poblacin formulando y verificando hiptesis
estadsticas sobre las distribuciones de probabilidad de la poblacin. Estas
verificaciones de hiptesis tienen una amplia utilidad en la seleccin de procesos
mejores que los existentes, cuestiones de buen funcionamiento de una operacin,
etc., y se identifican los dos tipos de errores que pueden cometerse en las tomas

341

CLCULO NUMRICO Y ESTADSTICA APLICADA

de decisin (tipo I y tipo II). Se presentan despus algunas construcciones grficas: la funcin de potencia, la curva caracterstica de operacin (OC), y los
grficos de control. Estas construcciones resultan muy tiles pues muestran
grficamente detalles importantes del proceso y ayudan a detectar problemas de
funcionamiento en ste. Se estudian los mtodos de comparacin de muestras y,
finalmente, se presta atencin a la teora de pequeas muestras analizando las
tres distribuciones tpicas: t de Student, chi-cuadrado y F de Fisher.

Muestreo / Muestra
Distribuciones Muestrales / Estimadores
Inferencia estadstica

Teora de pequeas muestras

Estimacin por punto

Distribuciones:
t de Student
chi-cuadrado
F de Fisher

Estimacin por intervalo


Verificacin de hiptesis
Errores Tipo I y II
Grficos OC
Grficos Shewhart
Comparacin de muestras

Caps. 7, 8, 10

6.1. Muestreo de poblaciones


En el Cap. 5 ya se avanzaron algunas ideas sobre la operacin de muestreo estadstico de poblaciones. El muestreo es, en definitiva, la manera
prctica de conocer las caractersticas generales de una poblacin utilizando
una seleccin finita de sus objetos, artculos, elementos, individuos o especmenes, que son los nombres con los que se suelen denotar los objetos que
la forman y que se utilizarn en lo que sigue de manera indistinta. Esta seleccin es obligada por razones econmicas y temporales, se la denomina
muestra y debe elegirse de manera adecuada para que sea representativa de
la poblacin. Como ya se ha sealado, aqu hay que estar precavido de que a
veces la nomenclatura consagrada suele hablar de muestras (en plural) y
toma de muestras para denotar a un conjunto de medidas diferentes en un
experimento o ensayo, y de ello se sigue que al tratar del muestreo estads-

342

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

tico la muestra en este caso est formada por un conjunto de muestras (los
elementos o especmenes). Las confusiones derivadas de este uso pueden ser
evitadas haciendo caso del contexto. Hay que recordar adems que las
poblaciones pueden ser infinitas o finitas y que, por otra parte, cuando la
poblacin es finita pero muy grande suele ser una muy buena aproximacin
tomarla como infinita.

Mtodos Generales de Muestreo


Hay una gran variedad de mtodos de muestreo de poblaciones y toda
una teora matemtica sobre ellos. Estas operaciones presentan muchas
aplicaciones que resultan decisivas en los denominados controles de calidad
de procesos. Por razones obvias se van a dar aqu slo los principios fundamentales. En la operacin de muestreo, o la toma de una muestra (coleccin
de objetos), hay que considerar el tamao que debe tener (nmero de elementos) que estar en relacin directa con el coste econmico (monetario/temporal) del proceso de toma y la precisin que se desea obtener finalmente. Tambin hay que garantizar que la imagen obtenida a partir de la
muestra sea suficientemente buena para representar a la poblacin. Para esto
ltimo hay que seleccionar los especimenes de una forma objetiva y completamente al azar. Esto significa que el mtodo de seleccin no puede depender
de la voluntad o impulsos inconscientes de un operador que elija tales especmenes, lo que se consigue haciendo igualmente probable la eleccin de
cualquiera de los elementos de la poblacin (la distribucin uniforme del
Cap. 5).
Siguiendo esta lnea de pensamiento la versin ms sencilla es la conocida como muestreo sencillo aleatorio que da origen a la muestra sencilla aleatoria, pudindose realizar de una manera prctica mediante un modelo de
lotera: se ordenan numricamente los elementos de la poblacin (supuesta
numerable) y mediante un sorteo en el que se homogeneizan los nmeros
de orden (papeletas o bolas numeradas) se obtiene la muestra del tamao
deseado. Pueden imaginarse muchos modos de realizar este proceso de sorteo, pero un modo muy simple es el de utilizar la denominada tabla de
nmeros aleatorios, en la que estn las cifras del 0 al 9 repetidas muchas
veces y repartidas uniformemente en forma de cuadro (filas/columnas). Se
toma un punto de entrada en esta tabla (una cualquiera de las cifras) y a par-

343

CLCULO NUMRICO Y ESTADSTICA APLICADA

tir de all se van tomando los nmeros (con una cifra, con dos cifras, etc.,
segn las necesidades) que aparecen hacia la derecha (en la fila) o hacia abajo (en la columna), continuando hasta agotar el tamao de la muestra.
Una versin ms elaborada y eficaz se denomina muestreo aleatorio estratificado. Esta puede realizarse cuando los elementos de la poblacin pueden
ser organizados por estratos (clases o grupos) de acuerdo con ciertas caractersticas que poseen. Una vez separada la poblacin en estos estratos se procede a seleccionar muestras sencillas aleatorias en cada uno de ellos. Todas
estas muestras parciales por estratos forman la muestra aleatoria estratificada. Si de la poblacin con NP elementos se quiere tomar una muestra de
tamao n, hay que estratificarla en m estratos de manera que cada uno
contenga Nm elementos (su suma debe coincidir con NP y la versin ms eficaz de muestreo consiste en extraer nm elementos de cada estrato, de modo
que se tenga
n1
n
n
n
= 2 = ... = m =
; n = n1 + n2 + ... + nm ; NP = Nm
N1 N2
Nm NP
m

(6.1.1)

Este mtodo recibe el nombre de muestreo estratificado proporcional.


Otra posibilidad surge cuando se desea una muestra aleatoria de una
poblacin, pero de acuerdo con una cierta variable aleatoria X con funcin
de distribucin cumulativa de probabilidades F(x) dada. En este caso, como
0 F 1, el proceso se puede realizar eligiendo primero un nmero aleatorio
0 yi 1, uniformemente distribuido en [0,1] y calculando despus su imagen xi = F1(yi). El conjunto de estos valores {xi} es la muestra del problema.
Hay dos casos especiales en los que esto puede hacerse con ayuda de tablas
preparadas al efecto: el caso uniforme y el caso Gaussiano.
EJERCICIO 6.1.1
Utilizando tablas de nmeros aleatorios discutir cmo extraer una muestra
al azar de: a) una distribucin uniforme definida en a < x < b; b) una distribucin Gaussiana con media m y desviacin tpica s.
a) Utilizando la tabla de nmeros aleatorios se forma un nmero decimal en 0 < di < 1 con tantos decimales como requiera la aplicacin. El paso
siguiente es transformarlo al intervalo pedido mediante xi = a + di(b a),
repitindose el proceso para el resto de los valores que se necesiten.

344

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

b) Utilizando la tabla de desviaciones normales aleatorias se forma una


secuencia del tamao que se pida de valores zi ledos en ella (mtabla = 0, stabla = 1)
y con ellos se determinan los valores buscados
Estas operaciones anteriores as realizadas son muy eficaces para tamaos relativamente pequeos, pero cuando hay que utilizar muestras muy
grandes (del orden de millones o mayores) como es el caso de ciertas aplicaciones tericas (simulacin Monte Carlo de fluidos), entonces deben utilizarse simuladores de nmeros aleatorios, algo que se tratar en el Cap. 10.
Por otra parte, en lo anterior est implcita la consideracin de las marcas de
clase al tratar con variables continuas (ver Cap. 5) y esto puede obligar a
tener que afinar en el nmero de decimales. Finalmente, una representacin
grfica de la muestra en la que se represente la frecuencia de aparicin de un
elemento (o clase) frente a la numeracin de tales elementos, es decir el bien
conocido histograma de frecuencias, puede resultar muy til para hacerse una
idea rpida de la distribucin de la muestra extrada.

Observaciones adicionales
a) En la discusin anterior sobre muestreo se daba por supuesto que la
poblacin constaba de elementos discretos o que se poda aproximar
mediante una coleccin discreta de elementos. Pudiera sin embargo darse el
caso de que el muestreo no se ajustara a ninguno de estos modelos, como
sera el caso del anlisis de un material (slido o lquido, por ejemplo). Si
este material fuera perfectamente homogneo, su anlisis slo requerira una
pequea porcin extrada de l (test incremental). Ahora bien, la presencia de
gradientes de concentracin en un lquido, o de diferentes composiciones en
diferentes regiones de un slido, induciran la prdida de homogeneidad y el
mtodo de muestreo incremental anterior dejara de ser vlido. La deteccin
de estos fenmenos no homogneos puede resultar crucial en muchos casos
y el anlisis correspondiente necesitara de la toma de muestras en diferentes partes del material, siguiendo mtodos similares a los descritos antes y
que recorriesen regiones de aqul definidas de antemano (celdas).
b) Una distincin til entre mtodos de muestreo es la de los basados en
atributos (cualitativos) y en variables (cuantitativos). Esto es una gran ayuda
en la definicin de los planes de muestreo a realizar con la indicacin del
tamao de muestra a utilizar, los grficos OC y de potencia, etc.

345

CLCULO NUMRICO Y ESTADSTICA APLICADA

c) Las operaciones de muestreo con elementos numerables pueden ser


con remplazamiento o sin remplazamiento. En el primer caso cada elemento
de la poblacin puede ser elegido ms de una vez en la muestra, en tanto que
en el segundo caso cada elemento slo se elige una vez como mximo.
Poblaciones finitas con muestreos con remplazamiento son as, en la prctica, tericamente infinitas. Por otra parte, poblaciones finitas muy grandes
pueden visualizarse tambin como infinitas en la prctica, algo que ya se ha
sealado antes. Represe en que en la toma de muestras y las mediciones
posteriores el elemento seleccionado pudiera tener que ser destruido (ensayo destructivo) y esto ya fuerza a que el muestreo sea sin remplazamiento.
d) Con la muestra de tamao N extrada pueden calcularse las magnitu
des muestrales media X y varianza s2 de la propiedad estudiada siguiendo
expresiones matemticas que van a definirse en el epgrafe siguiente y que
recuerdan la discretizacin de las integrales continuas para m y s2. Es importante sealar que por lo que respecta a la varianza muestral sta tiene dos
contribuciones: la que depende de las diferencias entre los elementos de la
muestra y la que depende de los errores aleatorios que afectan a cada medida. La tcnica del anlisis de varianza (ANOVA) permite separar ambas
contribuciones e interpretar mejor los resultados (Cap. 10).
e) Igualmente pueden realizarse ms evaluaciones de parmetros a partir de la muestra, todo ello para caracterizar la poblacin de la que procede.
Adems, pueden combinarse informaciones de diferentes muestras, procedentes bien de la misma poblacin o de diferentes poblaciones, para obtener
nuevos datos de inters estadstico. As, el objetivo general del muestreo de
poblaciones es el de inferir las caractersticas poblacionales, operacin en la
que juegan un papel central las tcnicas de estimacin por intervalos y de
verificacin de hiptesis estadsticas. Esto confiere un carcter probabilista
a todos los resultados que se obtienen aplicando estas tcnicas.
e) En todo el estudio del muestreo de poblaciones hay que distinguir los
casos en los que el tamao de la muestra es grande (N 30, N 100,
dependiendo del propsito) que se tratan con ayuda de la distribucin
Gaussiana, de los casos con muestras pequeas que se tratan con distribuciones especiales.
f) Este es un captulo eminentemente prctico y slo van a darse algunas
demostraciones sencillas relativas a las formulaciones que siguen. Se remite
al lector a la bibliografa recomendada para este tipo de detalles formales.

346

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

6.2. Distribuciones muestrales


Media y Varianza
Una vez tomada una muestra de tamao N y obtenidos independientemente unos de otros los valores {xi}i=1,N de la propiedad X (variable aleatoria)
a estudiar se pueden calcular las caractersticas muestrales (media, varianza,
y momentos en general) para utilizarlos como aproximaciones a los correspondientes parmetros poblaciones (m, s 2, ...). Por su especial importancia

van a considerarse primero la media X y la varianza s2 muestrales que se calculan mediante las expresiones
1
X=
N
1
s =
N 1
2

x =
i

i=1

i =1

( xi X )2 =

x1 + x2 + ... + xN
N

( x1 X )2 + ( x2 X )2 + ... + ( xN X )2
N 1

(6.2.1a)

(6.2.1b)

en donde es de notar que los denominadores de ambas expresiones son


diferentes. Tambin hay que insistir en que cada elemento de la muestra
contribuye a las sumas indicadas; es decir, si apareciera uno o ms valores xi
repetidos (frecuencias mayores que la unidad) en la muestra extrada, habra
que considerar a todos y cada uno de ellos en los clculos (N en total).
Como cada valor medido xi es un resultado aleatorio, distribuido con media m

y varianza s 2, tanto X como s 2 sern tambin variables aleatorias y es de inters conocer sus distribuciones, algo que puede simplificarse al conocimiento de sus correspondientes valores medios y varianzas en una primera toma
de contacto que suele ser suficiente a efectos prcticos. Se habla as de las
distribuciones muestrales asociadas con estos parmetros (u otros de orden
superior): la distribucin de medias muestrales (con sus propias media,
varianza y otros momentos), la distribucin de varianzas muestrales (con sus
propias media, varianza y otros momentos), etc. A las expresiones (6.2.1) se
las denomina estadsticos o estimadores muestrales y presentan unas propiedades que requieren consideracin aparte. Tambin hay que sealar que en

cuanto a la notacin para la media muestral se utilizar indistintamente X


o x una eleccin que va a depender del contexto y de las convenciones gene
ralmente aceptadas. As, en este captulo la notacin preferida ser la de X
pero se cambiar a x en otros lugares (Caps. 7, 8 y 10) cuando convenga.

347

CLCULO NUMRICO Y ESTADSTICA APLICADA

Igualmente, es interesante indicar que en la prctica al utilizar muestras se


utilizan diferentes estimadores de la varianza, cada uno adecuado a distintos
propsitos como se ver ms adelante con las tcnicas de mxima verosimilitud y del anlisis de la varianza (Cap. 10).

a) Por lo que respecta a la media X hay que indicar que en general para

una muestra se va a tener X m, y adems:


a.1) Repescando resultados del Cap. 5 se encuentra fcilmente que

X = = X

(6.2.2)

es decir, que el valor medio del parmetro media muestral sobre su distribucin de probabilidades coincide con el valor medio poblacional, independientemente del tamao de la muestra N y de la poblacin concreta bajo
estudio.
a.2) Igualmente para todas las muestras de tamao N se encuentra

X =

( X )2 =

(6.2.3)

es decir, que la desviacin tpica de la media muestral es la desviacin estndar poblacional dividida por la raz cuadrada del tamao de la muestra. A sX

se la denomina error tpico de X. Hay que indicar que se ha considerado aqu


una poblacin efectivamente infinita.
a.3) Como una aplicacin del teorema central del lmite (Cap. 5), para

tamaos de muestra N 30 la distribucin de la media X puede aproximarse mediante una Gaussiana de media m y varianza sX2. Sin embargo, para
tamaos menores N < 30 esta aproximacin deja de ser vlida y hay que utilizar las denominadas distribuciones de pequeas muestras. Evidentemente, si

la poblacin es ya Gaussiana de partida, entonces X es ya automticamente


normal.
a.4) Si se tuviera un muestreo sobre una poblacin finita (con NP elementos) y sin remplazamiento la expresin (6.2.3) se escribira como

X =

348

NP N
; NP > N
NP 1

(6.2.4)

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

b) El caso de la varianza muestral s2 presenta las particularidades


siguientes:
b.1) Una definicin de esta magnitud acorde con la definicin de s 2
como un valor medio sera
s 2 =

1
N

i=1

1
( xi X ) =
N
2

i =1

1
( xi + X ) =
N
2

(x )

( X )2

(6.2.5)

i=1

No obstante, teniendo en cuenta las relaciones que se obtienen de (6.2.3)


( xi )2 = 2 ;

( X )2 = 2X =

2
N

(6.2.6)

y notando que todos los valores xi son formalmente equivalentes, se obtiene


sin dificultad
s

1
=
N

(x )

( X )2 =

i =1

N 1 2

(6.2.7)

relacin que pone de manifiesto que s2 s 2, resultando entonces que el


valor medio de la varianza muestral estimada a travs de (6.2.7) es s 2 corregida con un factor que depende del tamao de la muestra N. Aunque para
tamaos grandes la correccin tiende a la unidad, debe mantenerse en evaluaciones con valores pequeos de N.
b.2) En consecuencia, la estimacin de la varianza muestral debe hacerse con la magnitud corregida tal y como se indic en (6.2.1b), y que con
(6.2.7) puede comprobarse que tiene un valor medio igual al valor poblacional s2 = s 2. El estimador preferido para la desviacin tpica muestral es
pues
s=

1
N 1

(x X )

(6.2.8)

i=1

b.3) Los desarrollos de b.1) y b.2) sirven para introducir someramente el


concepto de grados de libertad en una estimacin. Ntese que entre (6.2.1b) y
(6.2.5) la diferencia est en que el denominador de la ltima (N 1) es una
unidad inferior. Esta cantidad se denomina nmero de grados de libertad,

349

CLCULO NUMRICO Y ESTADSTICA APLICADA

n = N 1, y puede visualizarse como el resultante de restarle al nmero ini


cial de datos N la ligadura que representa el introducir el valor previo X
(6.2.1a) s en la estimacin de s2 (6.2.1b).
b.4) En cuanto a los errores de la desviacin tpica y de la varianza
muestrales se tiene para tamaos N 100 que las distribuciones respectivas
son muy cercanas a normales y se pueden demostrar las aproximaciones

2N

; s2 2

2
N

(6.2.9)

Como es fcil de comprender, cuanto mayor es N tanto mejores son


estas dos aproximaciones. Otras versiones de ellas incluyen en los denominadores (N 1) en lugar de N, aunque con muestras muy grandes
1/(N 1) @ 1/N. Si la poblacin es normal, las ecuaciones (6.2.9) son
exactas
b.5) Si la poblacin no es normal, o no pueden utilizarse las relaciones
(6.2.9), entonces se utilizan las expresiones

4 22
4 22
; s2
4 N 2
N

(6.2.10)

en donde intervienen los momentos centrales a4 y a2 = s 2. Si estos valores


son desconocidos, pueden utilizarse los correspondientes estimadores muestrales discretizados a4 y a2 (ver Problema 1).
Como nota final relacionada con lo anterior, si los parmetros poblacionales son desconocidos y la muestra extrada es suficientemente grande,
entonces se pueden utilizar los correspondientes parmetros muestrales

como substitutos: X m, s2 s 2, etc. A este respecto, los resultados centrales obtenidos


X = ;

s2 = 2

(6.2.11)

confieren a los estimadores X y s2 la cualidad denominada de ser insesgados,


que denota que sus valores medios coinciden con los poblacionales. Los
estimadores que no cumplen esta condicin, como es el caso de s 2 se denominan sesgados. Como cuestin de principio conviene utilizar siempre estimadores insesgados en los clculos estadsticos.

350

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Proporciones
Esta una aplicacin de la distribucin binomial para una poblacin en la
que se denota la probabilidad del suceso X (xito) por p, y la probabilidad del
suceso complementario (fracaso) por q = 1 p. Si de la poblacin infinita se
extraen todas las muestras de tamao N y se obtiene la proporcin de xitos
en cada una, la variable aleatoria presenta una distribucin muestral
cuyas media y varianza se obtienen a travs de frmulas ya conocidas. Planteando el problema como antes, se tienen N variables aleatorias independientes 1, 2, ..., N, la proporcin media de xitos en una muestra de tamao N es obviamente p y por tanto se tiene

= 3 1 = 3 2 = ... = 3 N = p

(6.2.12)

32 = 32 = ... = 32 = pq

(6.2.13)

Con estos resultados se establece sin dificultad


3 =

=
2
3

3 1 + 3 2 + ... + 3 N
Np
=
=p
N
N

32 + 32 + ... + 32
1

Npq
N

pq
N

(6.2.14)

(6.2.15)

En el caso de una poblacin finita con NP elementos y utilizando muestreo sin remplazamiento las ecuaciones son como las mostradas para la
distribucin de la media

3 = p ; 3 =

pq
N

NP N
NP 1

(6.2.16)

Sumas y Diferencias
Cuando se realiza un muestreo conjunto de dos poblaciones infinitas
diferentes caracterizadas cada una por las variables X e Y, de manera que la
toma de las parejas de especmenes se realiza de forma independiente y, adems, la seleccin de un xi no afecta en modo alguno la de yi, puede desearse

351

CLCULO NUMRICO Y ESTADSTICA APLICADA

calcular las propiedades de las magnitudes X + Y y X Y. Estas nuevas


variables son muy tiles en el estudio comparativo de poblaciones y de
cuestiones de inferencia estadstica. Utilizando la independencia estadstica
sealada y las medias y varianzas de X e Y, suponiendo poblaciones infinitas,
es sencillo obtener
X +Y = X + Y ;

X Y = X Y

(6.2.17a)

Var ( X + Y ) = 2X + Y = 2X + Y2

(6.2.17b)

Var ( X Y ) = 2X Y = 2X + Y2

(6.2.17c)

en donde hay que notar que las varianzas parciales siempre se suman.
El problema puede ampliarse si se consideran dos estadsticos generales
asociados con las poblaciones respectivas, SX (obtenido con una muestra NX)
y SY (obtenido con una muestra NY) y sus combinaciones SX SY. En las mismas condiciones de independencia sealadas anteriormente y poblaciones
infinitas o muy grandes se encuentra anlogamente
SX + SY = SX + SY ;

SX SY = SX SY

Var (SX + SY ) = Var (SX SY ) = S2 + S2


X

(6.2.18)
(6.2.19)

Esto se aplica de manera inmediata a magnitudes muestrales concretas.


Por ejemplo, para medias muestrales
X Y = X Y = X Y
Var ( X Y ) = 2X + Y2 =

X Y =

2X Y2
+
N X NY

2X Y2
+
N X NY

(6.2.20)

(6.2.21a)

(6.2.21b)

en donde mX, mY, sX, y sY son los parmetros poblacionales (medias y desviaciones tpicas) de X e Y respectivamente.
Como detalles de inters hay que indicar que: a) para las distribuciones
muestrales de diferencias de medias (o de proporciones) pueden tomarse

352

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

aproximaciones Gaussianas siempre que NX, NY 30; b) los resultados anteriores se mantienen para poblaciones finitas con remplazamiento; c) en el
caso de poblaciones finitas con muestreo sin remplazamiento hay que corregir las expresiones anteriores (6.2.20) y (6.2.21) en una forma anloga a lo ya
sealado en (6.2.16).

Mediana
Para concluir este apartado se indican resultados bsicos para la mediana, que divide en dos partes iguales la distribucin original con media m y
desviacin tpica s. Para muestras N 30 la distribucin muestral de la
mediana tambin puede tomarse como normal con parmetros
2
Mediana = ; Med
.

2N

(6.2.22)

En este punto es muy importante notar que la mediana de una muestra


{xi} de tamao N se define del modo siguiente
x( N +1)/ 2

Mediana = Med ( X ) = 1
( xN / 2 + x( N / 2 )+1 )
2

si N es impar
si N es par

(6.2.23)

Al parecer no hay un smbolo universal para denotar a la mediana (el


segundo cuartil) y aqu se utilizar como abreviatura la ya incluida en el Cap.
5 Med(X). Si aparecieran valores repetidos en la muestra, hay que considerarlos a todos como independientes y una vez ordenados proceder con ellos
de acuerdo con (6.2.23). Por ejemplo para una muestra de 10 datos, x1, x5, x2,
x2, x3, x1, x3, x3, x4, x3, se reordenara x1, x1, x2, x2, x3, x3, x3, x3, x4, x5, y se tiene
como mediana el valor z2 = Med(X) = x3, la media aritmtica de los datos
quinto y sexto, que deja 5 datos a cada lado (50% de la muestra). Las definiciones de los cuartiles primero z1 y tercero z3 presentan problemas con esta
muestra de 10 datos, pero el lector puede comprobar que con una muestra
ms amplia que consistiera, por ejemplo, de 20 datos la situacin estara
bien determinada. Esto indica que si se quisieran utilizar estos parmetros:
a) habra que tenerlo en cuenta en la seleccin del tamao en la toma de
muestras; b) habra que definir los cuartiles con ayuda de la funcin

353

CLCULO NUMRICO Y ESTADSTICA APLICADA

cumulativa de frecuencias relativas interpolando inversamente en F(x) =


0,25 x = z1, y en F(x) = 0,75 x = z3. En el caso de la interpolacin mencionada queda claro que hay que hacer una eleccin de la funcin interpolatoria o efectuar una operacin grfica, y ambas posibilidades llevan inherente elementos de incertidumbre en la definicin de los cuartiles.

6.3. Inferencia Estadstica (I)


Hasta aqu se ha considerado el problema de cmo caracterizar una
muestra extrada de una poblacin. El paso siguiente es el de poder inferir
informacin poblacional utilizando tales muestras. Esto es lo que se denomina inferencia estadstica y se persigue dar estimaciones, fijando su fiabilidad, de los parmetros poblacionales utilizando los estadsticos muestrales.
En lo que sigue van a considerarse muestras grandes, N 30, para las cuales
va a resultar posible utilizar la aproximacin Gaussiana.
Una primera forma de inferencia estadstica es la conocida como estimacin por punto, en la que el valor poblacional viene dado mediante el valor
obtenido con un estimador de la muestra. Ya se ha tomado contacto con ello
en los epgrafes previos (estimadores sesgados, insesgados, etc.) y aqu se va
a profundizar un poco ms en este asunto. Una segunda forma de inferencia
es la estimacin por intervalo (o por dos puntos), en la que el parmetro
poblacional se localiza dentro de un intervalo dado. Esta segunda forma da
una medida de la precisin con la que cabe confiar en la estimacin propuesta y es ms potente que la primera forma. Ambas formas son la base de
la denominada Estimacin Estadstica.
Hay todava una tercera forma de inferencia estadstica denominada decisin estadstica en la que se formulan hiptesis sobre la poblacin que son
aceptadas o rechazadas en base a los resultados muestrales complementados
con manipulaciones elaboradas que requieren el uso de tablas estadsticas
especficas. Esto es la base de la denominada Decisin Estadstica.
Las tres formas o tcnicas estn ntimamente conectadas y, siguiendo un
orden de presentacin de complejidad creciente, en este epgrafe van a considerarse las estimaciones por punto y por intervalo, dejndose para el epgrafe siguiente todas las cuestiones de la decisin estadstica.

354

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Estimacin por un punto


En las estimas de un punto los estimadores estadsticos pueden clasificarse atendiendo a ciertas caractersticas. Se tienen as los estimadores sesgados e insesgados, siendo los insesgados aquellos en los que la media de su
distribucin muestral coincide con el correspondiente parmetro poblacional

(X = m),y los sesgados aquellos en los que esto no sucede.


Una clasificacin adicional es la de estimadores insesgados eficientes y no
eficientes, aunque como este es un criterio comparativo puede hablarse de

estimadores ms o menos eficientes. As, para los estimadores media X y

2
.
Mediana, ambos insesgados, se dice que X es ms eficiente porque s X2 < s Med
En consecuencia, si se obtienen todos los estimadores de una magnitud y se
ordenan de acuerdo con sus varianzas, aquel estimador que presente la
varianza mnima se denomina el ptimo, nombrndose en general al resto
como estimadores no eficientes.
Otra caracterstica muy deseable en un estimador insesgado es la conocida como consistencia, en virtud de la cual un estadstico muestral de este
tipo presenta una varianza que tiende a cero con el tamao creciente de la
2
.
muestra. Es el caso de s X2 y s Med
En general, conviene utilizar estadsticos muestrales insesgados, eficientes y consistentes. Sin embargo, en ciertas ocasiones y por razones de
comodidad se emplean estadsticos no eficientes. Esto sucede en controles
de calidad cuando para estimar dispersiones se emplean los rangos (distancias entre el mximo y el mnimo) de las propiedades medidas en lugar
de las desviaciones tpicas. Este uso redunda en el ahorro de tiempo y clculos y, normalmente, no presenta una prdida significativa de eficacia en
el proceso.
Una cuestin adicional es la del diseo de estimadores que utilicen informacin de varias muestras de una misma poblacin. Aunque esto se tratar
desde un punto de vista ms general en el Cap. 10, es conveniente aqu
indicar un modo de realizar esto en un caso sencillo. Se han tomado dos
muestras, con tamaos N1 y N2 de una misma gran poblacin caracterizada

por (m, s 2) y se han determinado los valores (X 1, s12) y (X 2, s22). Los estimadores mejorados que pueden construirse para la media X y la varianza s2 (ntese el acento circunflejo sobre los smbolos) vienen dados por las mezclas
(pooling)

355

CLCULO NUMRICO Y ESTADSTICA APLICADA

N1 X1 + N2 X 2
( N1 1) s12 + ( N2 1) s22
2

X=
; s =
N1 + N2
N1 + N2 2

(6.3.1)

Ambos estimadores son claramente insesgados pues


X =

N1 X1 + N2 X 2
N1 + N2

( N1 1) s12 + ( N2 1) s22
N1 + N2 2

(6.3.2)

=2

(6.3.3)

Ntese que el denominador (N1 + N2 2) en el clculo de la varianza


mejorada s2 puede visualizarse como el nmero de grados de libertad disponibles para evaluarla: del total de datos disponibles (N1 + N2) hay que sus

traer dos, ya que hay dos ligaduras, la de X 1 y la de X 2. La estimacin (6.3.3)


puede tambin utilizarse para estimar el valor de una varianza comn a diferentes poblaciones pero que no poseen la misma media, como sera por
ejemplo el caso de un mismo mtodo experimental general (calorimetra, viscosimetra, etc.) que se aplica a diferentes sistemas qumicos para determinar alguna de las propiedades del mtodo.

Estimaciones por intervalos de confianza


Seguidamente se pasa a las estimas por intervalos de confianza. Interesa
ahora dar unos mrgenes entre los que se va a encontrar probabilsticamente la propiedad poblacional estudiada, algo que va a hacerse utilizando

2
.
un estadstico muestral insesgado M de un punto, con media M y varianza sM
Se utilizar la aproximacin Gaussiana para muestras N 30, y as se tienen

2
2
mM = M = M, y s M
sM
. Manteniendo la notacin utilizada en el Cap.5, en
lo que sigue z representar a los valores que puede tomar la variable tipificada gaussiana Z con media nula y desviacin estndar unidad. Como ya se
ha sealado en otra parte del texto, es claro que en muchos casos por simplicidad de notacin se tiende a utilizar ambos smbolos indistintamente
(Z y z, X y x, etc.) mantenindose la diferenciacin slo en los casos que
pudieran presentar conflicto de interpretacin.

356

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

De las propiedades de la distribucin normal es inmediato conocer la

probabilidad p con la que el valor muestral estimado M va a estar contenido


en intervalos centrados en el valor poblacional mM
p( M z M M M + z M ) p( M zsM M M + zsM )

(6.3.4))

en donde z es la variable tipificada (media =0, desviacin tpica =1). La


expresin anterior es directamente invertible cambiando los papeles de mM y

M a travs de unas sencillas operaciones


p( M zsM M M + zsM ) = p( M zsM M 0 M + zsM M) =
p( zsM M M zsM M ) = p( M zsM M M + zsM )

(6.3.5))

ya que la distribucin Gaussiana es simtrica con respecto al origen (Fig.


6T1). Ntese que se estn manejando dos distribuciones normales con la

misma desviacin tpica sM: la centrada en mM y la centrada en M. Este resultado da un intervalo de confianza del 100 p% para el valor real del parmetro

mM. Los extremos M zsM son los lmites de confianza (superior +, inferior )
del intervalo.

Figura 6T1. Intervalos de confianza para las medias poblacional y muestral utilizando la distribucin
Gaussiana. Ntese como la simetra fuerza la equivalencia (6.3.5) de las dos descripciones, la
centrada en la media poblacional y la centrada en la media muestral. Ambas distribuciones tienen
la misma desviacin tpica.

De toda la discusin anterior es importante reparar en que mM es una cantidad fija, no aleatoria, y que son los extremos o lmites de confianza las ver-

357

CLCULO NUMRICO Y ESTADSTICA APLICADA

daderas variables aleatorias de este planteamiento del problema. Esto significa que el intervalo de confianza presentar tambin una distribucin muestral y el resultado (6.3.5) indica as que si se efectuasen tomas de un gran
nmero de muestras diferentes, aparecera una distribucin de intervalos de
confianza de la que se podra afirmar en probabilidad que el porcentaje
100 p% de intervalos contendran al valor poblacional mM.
Las siguientes frmulas dan algunos de los estadsticos ms utilizados en
el estudio de poblaciones infinitas (o finitas con remplazamiento) con tamaos de muestra N 30.

a) Media poblacional m con estimador de un punto X


N

X z X = X z

X z

( xi X )2
i =1

N ( N 1)

(6.3.6)

b) Proporcin con estimador de un punto


3 z 3 = 3 z

pq
; q = p 1; p 3
N

(6.3.7)

c) Diferencia de medias poblacionales m1 m2 con estimador de un punto

X 1 X 2 y muestras independientes de tamaos N1 y N2 extradas de poblaciones infinitas

2 2
= ( X1 X 2 ) z 1 + 2 poblaciones diferentes (1 2)
N1 N2

( X1 X 2 ) z
(6.3.8)

1
1
( X1 X 2 ) zs N + N misma poblacin (1 = 2)
1
2

con s dado en (6.3.1). s 21 y s 22 se estiman con s21 y s22.


d) Diferencia de proporciones poblacionales extradas de dos poblaciones infinitas (1 y 2 valores muestrales)
31 3 2 z
en donde p1 1, p2 2, etc.

358

p1 q1 p2 q2
+
N1
N2

(6.3.9)

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

e) Desviacin tpica poblacional s con estimador de un punto s


N

s z s = s z

2N

s z

( xi X )2
i=1

2 N ( N 1)

(6.3.10)

Si las poblaciones son finitas (tamao NP) y no hay remplazamiento en el


muestreo, hay que corregir las frmulas anteriores. Por ejemplo, en los
casos ms utilizados como son la media poblacional y la proporcin, se tienen las expresiones
f) Media m
Xz

NP N
NP 1

(6.3.11)

NP N
; p3
N 1

(6.3.12)

g) Proporcin
3 z

pq
N

Dos precisiones ms antes de concluir este epgrafe. Una definicin til


en este contexto es la de error probable del estadstico M y que viene dado por
0,6745 sM. Ntese que M 0,6745 sM encierra alrededor de M en una distribucin Gaussiana el 50% de la poblacin. La otra precisin se refiere al
concepto intervalo de tolerancia, que no debe ser confundido con el intervalo
de confianza. Aunque pudieran coincidir en algn caso, el concepto de confianza se refiere a una incertidumbre sobre la localizacin del valor poblacional de una magnitud, en tanto que el concepto de tolerancia se refiere a
una medida (tambin con incertidumbre) de los mrgenes entre los que va a
estar una determinada fraccin de una poblacin. Esto ltimo resulta muy
importante para fijar lo que se est dispuesto a aceptar como vlido en un
proceso de produccin o de fabricacin de determinados bienes o servicios
con vistas a su comercializacin en el mercado. Tiene pues el de tolerancia
un criterio, entre otros, marcadamente econmico, en tanto que el de confianza es de carcter principalmente probabilista.

359

CLCULO NUMRICO Y ESTADSTICA APLICADA

6.4. Inferencia Estadstica (II): formulacin y verificacin


de hiptesis
La formulacin y verificacin subsiguiente de hiptesis estadsticas
con la pertinente toma de decisiones representa un estadio ms avanzado
de la inferencia estadstica. La relacin con los conceptos previos de la
estimacin es muy estrecha, sobre todo con los intervalos de confianza. En
esencia se va a tratar aqu de tomar decisiones sobre la viabilidad o correccin de un proceso, y/o sobre cual de dos mtodos que se proponen para
un proceso es el mejor. Estas decisiones conllevan una cierta probabilidad
no nula de equivocarse y elegir as la opcin incorrecta, si bien tal probabilidad va a estar siempre cuantificada, hecho ste que hace de esta versin
de la inferencia estadstica una herramienta muy poderosa. Para centrar
ideas va a analizarse a continuacin un caso tpico introduciendo paso a
paso las etapas.
EJERCICIO 6.4.1
Un proceso de fabricacin de piezas polimricas plsticas va a evaluarse de
acuerdo con la resistencia media a la rotura de cada una de tales piezas, magnitud que est fijada por la especificacin tcnica mR = R = R0. En este anlisis se va a tomar una muestra N de piezas fabricadas y con ella se va a decidir
si la partida de la que procede es o no aceptable (o equivalentemente: si el
proceso lo es). En el primer caso, aceptable, las desviaciones observadas con
respecto al valor de referencia R0 se catalogarn como fluctuaciones inherentes
al proceso, en tanto que en el segundo caso tales desviaciones (que van a ser
ms grandes que las anteriores) se tomarn como una indicacin de que existen problemas en la fabricacin. Ntese que para analizar la poblacin se ha
tomado una variable aleatoria (propiedad) R de aquella de la que se supone
conocida su distribucin de probabilidades. La discusin se estructura en cinco pasos que se describen a continuacin.

Cinco pasos a dar en hiptesis estadsticas


Paso 1: Formulacin de hiptesis
Se formulan la hiptesis nula H0 en la que el proceso se supone aceptable, y la hiptesis alternativa H1 que seala al proceso como no aceptable.

360

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Ambas hiptesis se cuantifican con la propiedad elegida escribindose el


esquema
H0: R = R = R0 , proceso aceptable

(6.4.1)

H1: R = R R0 , proceso no aceptable

(6.4.2)

Hay que notar que (6.4.2) tal y como se ha formulado implica mR > R0 o
mR < R0, lo que se conoce con el nombre de ensayo o contraste bilateral (o de
dos colas, o de dos lados). Un caso ms simple hubiera sido el ensayo unilateral (o de una cola, o de un lado) si se hubiera exigido slo una de las dos
condiciones (H1 : mR = R > R0. por ejemplo). Tomar una de las hiptesis
como cierta implica necesariamente rechazar la otra.
Paso 2: Fijar el nivel de significacin
El segundo paso consiste en elegir la probabilidad con la que rechazar H0
lo que se conoce como el nivel de significacin y que se denota convencionalmente mediante a. Normalmente se suelen tomar valores a = 0,05, 0,01,
0,001, para realizar los tests de significacin (contraste de hiptesis). Por
ejemplo, una eleccin a = 0,05 indica que
a) Se aceptar H0 con un 95% de probabilidad
b) Se rechazar H0 con un 5% de probabilidad, an en el caso en que
fuera correcta.
Se dice entonces que hay un 95% de confianza en que se est tomando la
decisin adecuada H0 y que se rechaza esta hiptesis nula con un 5% (0,05)
de nivel de significacin. Claramente a debe ser fijado antes de la toma de la
muestra.
Paso 3: Fijar el tamao de la muestra
El siguiente paso es elegir el tamao N de la muestra. Aqu intervienen
razones muy variadas, como las econmicas, el mantenimiento de condiciones constantes, las consecuencias de tomar decisiones incorrectas, etc. No
es este el lugar para entrar en estos detalles y en el anlisis de la resistencia
que se est presentando se va a considerar una muestra grande N 30 que
garantice la distribucin normal para la propiedad media estudiada. Una vez

361

CLCULO NUMRICO Y ESTADSTICA APLICADA

tomada la muestra y utilizando las relaciones generales (6.2.1) hay que calcu
lar los estimadores R y R = sR / N .
Paso 4: Contraste de hiptesis (docimasia)
A continuacin hay que contrastar las hiptesis para lo que hay que elegir una variable aleatoria con distribucin de probabilidades conocida. Tal
propiedad recibe el nombre de dcima y a la operacin de contraste se la
denomina docimasia, trminos que proceden de una palabra griega que significa ensayo. La dcima no tiene porqu ser necesariamente la misma magnitud utilizada en la formulacin (6.4.1), aunque debe existir una conexin
unvoca entre ambas. En el caso que se considera de la resistencia a la rotu
ra puede tomarse cmo dcima la variable tipificada z = (R mR)/sR. Si bien

la distincin entre ambas magnitudes z y R es trivial, esta eleccin facilita el


clculo con las tablas de la distribucin Gaussiana.
Paso 5: Determinacin de regiones
El quinto paso consiste en determinar las regiones de aceptacin y de
rechazo de H0. Conocidos a, N y z el proceso es directo utilizando la curva
Gaussiana universal para la variable z(m = 0, s = 1). Un nivel a bilateral indica las regiones que se muestran en la Fig. 6T.2. Ntese que las reas de
rechazo son de magnitud a/2, que el rea de aceptacin es 1 a, y que por
tanto estas regiones se consiguen a un valor crtico z = zC que se encuentra en
las tablas. As, en el ensayo bilateral si z < zC z > zC se rechaza H0 y se dice

Figura 6T2. Regiones de aceptacin y de rechazo en un tpico ensayo bilateral de hiptesis


con la distribucin Gaussiana al nivel de significacin a = 0,05.

362

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

que los resultados son significativos al nivel a. Por otra parte, si zC < z < zC se
acepta H0 o no se toma decisin alguna en primera instancia (caso dudoso)
quedando el problema para ser reanalizado de nuevo con ms datos.

Observaciones adicionales
a) La docimasia unilateral se realizara de modo anlogo, pero suprimiendo una de las dos colas. Una de las dos situaciones posibles en este caso
se resume en la Fig. 6T.3 con un ensayo unilateral a la derecha. Para los tres
niveles de significacin a habituales los valores normalmente utilizados de
los coeficientes crticos zC que se suelen redondear por exceso a dos decimales en muchas aplicaciones, se dan en la Tabla 6.1 para ensayos unilaterales y bilaterales con la distribucin Gaussiana como base. Otros valores
{a, zC} pueden determinarse con facilidad con las tablas estndar de la distribucin Gaussiana.

Figura 6T3. Regiones de aceptacin y de rechazo en un tpico ensayo unilateral de hiptesis


con la distribucin Gaussiana (cola de la derecha) al nivel de significacin a = 0,05.

Tabla 6.1. Valores {a, zC} para ensayos con la distribucin normal
a

zC unilateral

zC bilateral

0,001

99,9

3,091 3,09

3,291 3,29

0,01

99

2,326 2,33

2,576 2,58

0,05

95

1,645

1,960

363

CLCULO NUMRICO Y ESTADSTICA APLICADA

b) En la verificacin de hiptesis estadsticas hay dos posibilidades de


cometer error que se resumen en el rechazo cuando habra que aceptar
(tipo I), y aceptacin cuando habra que rechazar (tipo II). En concreto y con
respecto a la situacin estndar con la hiptesis nula como base:
El error tipo I se comete cuando se rechaza H0 y debera aceptarse.
Viene cuantificado por a.
El error tipo II se comete cuando se acepta H0 y debera rechazarse.
Viene cuantificado por la distribucin asociada con H1.
En el epgrafe siguiente se elaboran con detalle estos dos importantes
conceptos de error que estn relacionados con el hecho de que en probabilidad siempre pueden suceder sucesos improbables.
c) El siguiente ejercicio ilustra numricamente lo dicho hasta aqu y
presenta una situacin de las denominadas dudosas. Despus se describe un
procedimiento prctico para reanalizar una toma de decisin en tales casos
dudosos.
EJERCICIO 6.4.2
Contrastar la hiptesis de validez de un proceso bilateral como el descrito
en los cinco pasos anteriores para a = 0,05, 0,01, y los datos de una muestra

de N = 50 piezas que lleva a los estimadores R = 16 y sR = 6 (unidades arbitrarias), sabiendo que la especificacin exige R0 = 14. Qu diferencias se observan
entre los dos niveles de significacin y qu repercusiones tienen sobre la toma
de decisiones?

La varianza muestral de R es R = 6 / 50 0, 849 con lo que la tipificacin resulta redondeando a dos decimales
z=

R R0
= 2, 36
R

Como para un ensayo bilateral con a = 0,05 el valor z = 2,36 no cae dentro del intervalo [1,96, 1,96] hay que rechazar la hiptesis H0 al nivel de significacin 0,05. Es decir el proceso de fabricacin se decide como no correcto, pero hay un 5% de probabilidad de que se haya cometido un Error del
Tipo I (el proceso es en realidad correcto y se ha rechazado); o lo que es lo

364

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

mismo, existe un 95% de confianza de que se ha tomado la decisin adecuada (el proceso no es correcto).
El caso a = 0,01 es diferente, pues z = 2,36 cae dentro del intervalo
[2,58, 2,58] de manera que a este nivel de significacin hay que aceptar que
el proceso es correcto y cumple las especificaciones tcnicas.
Ahora bien, al disminuir la significacin se est forzando la situacin a
aceptar casi todo, en este ejemplo todo menos el 1%, y esto puede llevar
tambin a tomar decisiones errneas. Lo normal podra ser no tomar decisin alguna con base en el resultado a = 0,01 o reanalizar el problema.

Principios de admisin y rechazo de hiptesis


A continuacin se recapitulan los principios generales de procedimiento
en la verificacin de hiptesis estadsticas.
1) Admisin de la hiptesis H0 :
Si se utiliza a 0,05 y el ensayo o contraste indica que H0 hay que
tomarla como cierta, entonces se concluye que H0 concuerda con los datos
muestrales estudiados.
Si H0 hay que tomarla como cierta utilizando 0,01 < a < 0,05, entonces H0
puede admitirse o ponerse en duda. Es conveniente repetir la toma de los
datos muestrales y efectuar un estudio ms completo.
Si el contraste se realiza con a < 0,01 no puede admitirse H0.
2) Rechazo de la hiptesis H0 :
Si H0 se rechaza con a 0,01 entonces se concluye que H0 no concuerda
con los datos muestrales estudiados.
Si H0 hay que rechazarla utilizando 0,01 a 0,05, entonces H0 puede
rechazarse o ponerse en duda. Es conveniente repetir la toma de los datos
muestrales y efectuar un estudio ms completo.
Si el contraste se realiza con a 0,05, el rechazo de H0 no est fundamentado.
Como puede observarse las situaciones descritas en 1) y en 2) son complementarias.

365

CLCULO NUMRICO Y ESTADSTICA APLICADA

6.5. Funcin de potencia y curva OC


Una forma sencilla pero ms amplia para visualizar toda la discusin
anterior, considerando un ensayo unilateral por simplicidad, se representa
en la Fig. 6T.4 superponiendo las funciones de distribucin de probabilidades asociadas con cada una de las dos hiptesis del ensayo {H0, f0(z)} y
{H1, f1(z)}. Para la situacin mostrada existir un punto intermedio z = zC en
el que se localiza la distincin verdadero/falso para las hiptesis
z < zC H0 es verdadera (se rechaza H1).
z > zC H1 es verdadera (se rechaza H0).

Figura 6T4. Explicacin grfica del sentido de un contraste de hiptesis estadsticas. a es el nivel de
significacin y est asociado con la hiptesis nula H0 con distribucin de probabilidades f0 y es la
probabilidad de cometer el error del tipo I. b es la probabilidad de cometer un error del tipo II y,
estando asociada con la hiptesis alternativa H1 con distribucin de probabilidades f1, viene
determinada por la posicin del valor crtico para a en la distribucin f0 relativa a f1.

Ahora bien, tal punto crtico zC es desconocido a priori y lo ms que


puede hacerse es dar una eleccin ptima de l. Adems, con independencia
de la eleccin zC, dado el solapamiento de las dos distribuciones siempre va a
existir una probabilidad no nula de tomar la hiptesis incorrecta como verdadera. As, si {H0, f0(z)} es verdadera, la probabilidad de rechazarla y tomar
incorrectamente {H1, f1(z)} como verdadera o cierta (Error Tipo I) viene
dada por el rea a encerrada bajo f0(z) siguiente

= pI = p(Error Tipo I) = p ( zC < z < `

366

`
zC

f0 ( z) dz

(6.5.1)

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Anlogamente, si es {H1, f1(z)} la hiptesis verdadera, la probabilidad de


rechazarla y tomar incorrectamente {H0, f0(z)} como verdadera (Error Tipo
II) estar dada por el rea encerrada bajo f1(z) que se escribe a continuacin

= pII = p(Error Tipo II) = p ( ` < z < zC

=
1

zC
`

f1 ( z) dz

(6.5.2)

Con esta distincin puede formularse el siguiente concepto importante en


este contexto: la cantidad 1 pII = 1 b representa la probabilidad de rechazar {H0, f0(z)} cuando sta es realmente falsa, y a esta cantidad se la denomina (funcin de) potencia del criterio estadstico.
Recapitulando, se tiene que

a = pI = nivel de significacin
1 b = 1 pII = potencia del criterio estadstico
y es de notar que si se hace disminuir a automticamente aumentar b disminuyendo as la potencia del criterio estadstico. Este comportamiento da
una clave prctica para abordar problemas con funciones de distribucin
conocidas f0 y f1 va la optimizacin de la posicin de zC a travs de la minimizacin de una combinacin lineal de pI y pII. Cuando estas distribuciones
no se conocen se sigue un procedimiento alternativo basado en operaciones
que utilizan nicamente una funcin f0(z) postulada para H0. Estas optimizaciones desbordan los contenidos del curso y no se van a considerar aqu.
Los dos conceptos anteriores a y b permiten disear herramientas muy
tiles en la verificacin de hiptesis estadsticas y operaciones de control de
calidad (planes de muestreo). Estas son la curva caracterstica de operacin (OC) y la curva de potencia. La curva OC se construye representado b
frente a la propiedad elegida para realizar el test de significacin. La curva
de potencia es equivalente a la anterior y en ella se representa 1 b frente a
dicha propiedad elegida. Es claro que las formas de ambas curvas van a
resultar opuestas una de otra. Un ejemplo de construccin prctica de
estas curvas se deja para un problema numrico.

367

CLCULO NUMRICO Y ESTADSTICA APLICADA

6.6. Grficos de control (Shewhart) y aleatoriedad


Se va a considerar ahora un mtodo grfico muy sencillo y prctico
que puede utilizarse para disear reglas de decisin en el control de calidad
y en el estudio de la homogeneidad de conjuntos de datos. Se trata de los
denominados grficos de control o grficos de Shewhart. Un ejemplo ilus
trativo es el del anlisis de la media muestral X de una propiedad X de la
que se conoce que la poblacin responde a una distribucin normal (m, s).
De este hecho es inmediato establecer que para una muestra de tamao N
se tiene

< X < +3

; (99, 73% de probabilidad )

(6.6.1
1)

lo que no es ms que el intervalo de confianza tres sigma 3s X. Para una


coleccin de muestras i = 1, 2, ..., n extradas de la poblacin y fijando un criterio de clasificacin que organice los datos en subgrupos racionales (muestras obtenidas en el mismo da y a lo largo de una semana, o por diferentes
operarios, u obtenidas en diferentes mquinas, etc.) se puede confeccionar

un grfico de control con las medias muestrales X tal y como se indica en la


Tabla 6.2.
El grfico mencionado es muy detallado y podra limitarse slo a los
lmites 3s , pero se da en esta forma la Tabla 6.2 para dar una idea de la
complejidad que puede alcanzarse con los grficos de control. Si los valores

X caen dentro de los lmites prefijados (6.6.1), puede aceptarse la hiptesis


de que el proceso est controlado y que la produccin no presenta dudas

razonables sobre su calidad. Si algn X muestral cae fuera de los lmites


(6.6.1), entonces hay fundamento para pensar que algo pudiera estar funcionando incorrectamente en la produccin y habra que investigarlo. As en

las mquinas M-2 y M-4 las medias X 21 y X 44 sugieren que algo incorrecto
pudiera suceder en aquellas. Claro es que la presencia de estas dos excepciones pudieran ser debidas a fluctuaciones normales del proceso, pero al
ser poco probables (0,07%) la comprobacin de que todo funciona bien es

necesaria. Por otra parte, si el nmero de las X i fuera de (6.6.1) resultara ser
comparativamente grande, la conclusin de que algo no est bien, con
indicacin de la fuente del problema (da, mquina, etc.), sera una informacin muy til.

368

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Tabla 6.2. Ejemplo de grfico de Shewhart


M1

Mquina
X < 3

M2

X 21

N < X < 2

N < X <

N < X < +

N < X < + 2

+ 2

N < X < + 3

+ 3

N<X

M3


X 11 X 12

M4

X 31

X 22 X 23 X 24

X 32

X 33

X 34 X 35

X 13

X 14

N
N

X 25

X 26


X 41 X 42

X 43

X 44

En (6.6.1) se han tomado lmites tres sigma, que son los generalmente
adecuados, pero otros lmites de confianza menos restrictivos pueden adoptarse dependiendo de las necesidades u otros criterios. Adems, ntese que
cuanto ms detallado sea el grfico, incluyendo subdivisiones en das, operarios, etc., ms fcil ser detectar la posible causa de los problemas, en su caso.
Todo ello aumenta la flexibilidad y potencia de este simple mtodo de control.
Otra aplicacin de estos grficos, un tanto ms elaborada que la anterior,
es la de la evaluacin de la homogeneidad de muestras. Este es un requisito
necesario para poder extraer inferencias significativas sobre la poblacin. Se
trata de establecer la aleatoriedad en las extracciones de los elementos que
forman la muestra y, para ello, se organiza la muestra de datos {xm}m=1,M en
subgrupos racionales atendiendo bien a un criterio de clasificacin como se
ha mostrado antes, o bien, si esto no fuera posible, formando K pequeos
subgrupos (j = 1, 2, ..., K) iguales en tamao NS de entre 3 y 6 elementos consecutivos de la muestra original (M = KNS). El anlisis consiste en realizar el

grfico de control para las medias parciales X j por subgrupo de la propiedad


utilizando como herramienta auxiliar los rangos parciales (rango)i de cada

subgrupo. Se calculan los valores {X j, (rango)j}j=1,K y se estima la desviacin


ng

o sobre los subgrupos


tpica poblacional s X en funcin del rango medio ra
y del nmero de elementos por subgrupo 3 NS 6
rango
1

=
d2,N
d2 ,N K
S

(rango)

(6.6.2)

j =1

369

CLCULO NUMRICO Y ESTADSTICA APLICADA

El rango medio da una medida de la variabilidad de los datos dentro de los


subgrupos. Conviene insistir en que el factor d2,NS depende del tamao NS de
los subgrupos. Dado que la relacin entre d2,NS y el tamao de una muestra es
muy general [se considera que los datos proceden de una distribucin Gaussiana m, s ], en la Tabla 6.3 se dan valores de este parmetro para una seleccin de valores NS ms amplia que la que se necesita en el mtodo de Shewhart. La ecuacin (6.6.2) es as una relacin muy til para estimar s a
partir del rango de un conjunto de N datos muestrales (NS N).
Si la media poblacional m es desconocida, cuando existen suficientes

datos puede emplearse la media muestral X para representarla y, por ejemplo para un 99,73% de probabilidad, se tiene una expresin parecida a

(6.6.1) que debera ser satisfecha por las medias parciales X j

NS

< Xj < + 3

NS

X 3

rango
d2,N

NS

< Xj < X + 3

rango
d2,N

(6.6.3)

NS

es decir, que aproximadamente el 99,73% de los K valores X j deberan de


estar contenidos en el intervalo final marcado en (6.6.3). Si esto no fuera as,
entonces los promedios parciales estaran mucho ms dispersos de lo que
indica la variabilidad dentro de los subgrupos (medida a partir del rango
medio) y hay muchos motivos para sospechar que puede existir una falta de
aleatoriedad en la muestra. El diagrama de control en estos casos de sospecha resulta muy til pues ayuda a mostrar tendencias sistemticas, como
situaciones cclicas u otras (correlaciones en serie), que ayudan a descartar
situaciones no homogneas de una forma sencilla.
Tabla 6.3. Factores d2,NS en funcin del tamao del subgrupo/muestra
NS N (redondeo a dos decimales)
NS
d2,N

10

20

30

100

1,13

1,69

2,06

2,33

2,53

2,70

2,85

2,97

3,08

3,73

4,09

5,02

El anlisis Shewhart puede ampliarse an ms con el grfico de control


para los rangos, pero este es ya un asunto que no va a tratarse aqu. Ms
adelante se considerarn un mtodo complementario (grficos CUSUM) y
otras tcnicas para investigar la homogeneidad y variabilidad de los datos
(Caps. 8 y 10).

370

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

6.7. Comparacin de muestras: medias y proporciones


Ahora van a estudiarse dos tipos de verificacin de hiptesis relativas a la
comparacin de muestras diferentes. El primero es el de la comparacin de
medias muestrales y el segundo el de la comparacin de proporciones muestrales.
Para la comparacin de medias se consideran dos poblaciones infinitas
con medias y desviaciones estndar dadas por las parejas (m1, s 1) y (m2, s 2) y
de las que se extraen dos muestras independientes de tamaos N1 y N2 respectivamente. Las correspondientes medias muestrales para la propiedad

estudiada son X 1 y X 2 y la hiptesis de comparacin tpica es la de si las dos


medias poblacionales son iguales, m1 = m2, a un nivel de significacin a dado.
Para ello hay que repescar resultados del epgrafe 6.2 y considerar la variable
aleatoria diferencia D de medias muestrales
D = X1 X 2

(6.7.1)

En muestras de gran tamao se sabe que D va a distribuirse normalmente


con media y desviacin tpica dadas por

D = 1 2 ; D =

12 22
+
N1 N2

(6.7.2)

y la tipificacin lleva a la dcima (variable de trabajo)


zD =

D D
D

(6.7.3)

Elegido un nivel de significacin a el ensayo de la hiptesis m1 = m2 se


plantea en un ensayo bilateral como sigue:
H0 : m1 = m2 y las diferencias observadas son fluctuaciones naturales.
H1 : m1 m2 y las diferencias observadas son significativas.
Ntese que si el ensayo fuera unilateral, habra que plantear H1 : m1 > m2
H1 : m1 < m2. En cualquier caso, H0 : m1 = m2 implica que mD = 0 y hay que evaluar si zD = D/sD cae o no dentro del intervalo de confianza que delimita la
condicin a. El procedimiento a emplear es anlogo al ya discutido anteriormente y se va a ejemplificar con un sencillo ejercicio.

371

CLCULO NUMRICO Y ESTADSTICA APLICADA

EJERCICIO 6.7.1
Se analizan dos muestras de recipientes llenos de leche procedentes de dos
zonas distintas de una comarca en busca del nivel de 90Sr presente, midindose la actividad radiactiva en microcuries de 90Sr por gramo de Ca. La primera
muestra consta de 55 unidades y el nivel radiactivo se caracteriza con un
valor medio de 5,5, con una desviacin tpica muestral de 0,8. Para la segunda
muestra que consta de 68 unidades se obtiene un valor medio de 5,7 con desviacin tpica 0,6. Existen diferencias significativas entre los niveles radiactivos de ambas muestras al nivel de significacin a = 0,05?
La hiptesis nula es la igualdad de los valores medios poblacionales y hay
que contrastarla frente a la alternativa de que sean diferentes sin importar
cul es mayor o menor. Se trata por tanto de un ensayo bilateral y se tomarn las distribuciones muestrales implicadas como Gaussianas, en concreto

aquella para D = X 1 X 2, H0 implica as mD = 0 y la desviacin tpica mD


resulta (resultados redondeados a dos decimales)

D =

0, 82 0, 62
+
= 0,13
55
68

y tipificando se tiene
zD =

5, 5 5, 7
= 1, 54
D

El ensayo bilateral con a = 0,05 lleva a considerar el intervalo [1,96,


1,96]. Como el valor 1,54 cae dentro de este intervalo, las dos muestras no
pueden ser consideradas como significativamente diferentes a ese nivel.
Hay que aceptar H0 y, por tanto, concluir que las dos poblaciones poseen el
mismo valor medio.
El caso de la comparacin de proporciones 1 y 2 procedentes de dos
grandes muestras, de tamaos N1 y N2 extradas de dos poblaciones infinitas
con proporciones desconocidas p1 y p2 se analiza de manera anloga. El
planteamiento de las hiptesis es el siguiente:
H0 : p1 = p2 y las diferencias observadas son fruto del azar.
H1 : p1 p2 y las diferencias observadas son significativas.

372

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Se ha planteado un ensayo bilateral y se aplica la misma discusin que


antes en el caso del ensayo unilateral. La variable diferencia D = 1 2 se va
a distribuir con media y desviacin tpica dadas por

1 32

= 0; 3

13 2

1
N13 1 + N2 3 2
1
p(1 p)
+
; p =
N1 + N2
N1 N2

(6.7.4)

en donde se ha utilizado (6.3.2) para estimar p, pues p1 = p2 por hiptesis.


La tipificacin conduce a
zD =

3 1 3 2 3

13 2

1 3 2

31 3 2
3 3
1

(6.7.5)

y la aplicacin prctica discurre a lo largo de las ideas ya vistas.


EJERCICIO 6.7.2
Una marca de galletas efecta un estudio de uno de sus productos en dos
ciudades A y B. Se selecciona una muestra de 250 habitantes de A de los cuales
el 45% manifiesta que el producto es de su agrado. Para la ciudad B la muestra
consiste de 320 individuos de los que el 52% tambin manifiesta que el producto es de su agrado. Puede decirse que efectivamente el producto gusta
ms en la ciudad B a un nivel de significacin a = 5%?
Ahora se tiene un ensayo unilateral con hiptesis:
H0 : pA = pB y el producto gusta por igual en ambas ciudades.
H1 : pB > pA y el producto gusta ms en B.
Utilizando la distribucin normal para la variable tipificada
zD =

3B 3A
3 3
B

habr que rechazar H0 si zD > 1,645 y aceptarla si zD < 1,645.


Ntese que pueden presentarse casos (valores calculados de la dcima prximos a los crticos) en los que los redondeos intermedios pueden alterar las
conclusiones y esto conviene evitarlo. Como ya se ha indicado, se puede y es lo

373

CLCULO NUMRICO Y ESTADSTICA APLICADA

preferible utilizar el resultado de la desviacin tpica obtenido con la calculadora, tras su almacenamiento en una memoria, para calcular zD. Sin embargo,
para ilustrar, aqu van a utilizarse expresiones decimales en los clculos intermedios, manteniendo un nmero de ellos alto, pues no resulta gravoso con las
calculadoras que se utilizan. El redondeo final sin haber perdido datos significativos por el camino es obligado. As, se tiene (A = 0,45; B = 0,52) que
p = 0,489298 1 p = 0,510702

sAB = 0,042195
y la tipificacin con tres decimales de redondeo es
zD =

0, 52 0, 45
= 1, 659
0, 042195

Como zD est fuera de la zona crtica (1,645 < 1,659 hay que rechazar H0
concluyendo entonces que el producto gusta ms en la ciudad B al nivel del
0,05. El lector puede comprobar con cuantos decimales en el denominador
de zD se mantiene la conclusin alcanzada. Si se opta por este procedimiento hay que tener cuidado al introducir los datos en los clculos sucesivos.
6.8. Teora de pequeas muestras
En todo el desarrollo precedente se han considerado muestras de gran
tamao N 30 y como consecuencia las distribuciones muestrales de un
buen nmero de (estimadores) estadsticos pueden describirse muy bien
mediante distribuciones normales. Sin embargo, para muestras pequeas
N < 30 esta descripcin Gaussiana deja de cumplirse, y tanto ms cuanto
ms pequeo es el tamao N. En estos casos hay que utilizar opciones que
pertenecen a la Teora de Pequeas Muestras, que suministra alternativas
muy tiles para la estimacin estadstica. Aqu van a revisarse tres distribuciones bsicas, cada una adaptada especialmente a una circunstancia diferente. Estas tres distribuciones son por orden de presentacin: la t de Student, de utilidad en las estimaciones de medias poblacionales; la c 2
(chi-cuadrado), de utilidad en las estimaciones de desviaciones tpicas poblacionales; y por ltimo la F de Fisher, de utilidad en la validacin de comparaciones de varianzas muestrales y por ende de la homogeneidad de muestras. En los tres casos se supone que las pequeas muestras se extraen de
poblaciones normales.

374

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Las operaciones anteriormente mostradas con intervalos de confianza y


ensayos de hiptesis y significacin tienen su traduccin directa en este
nuevo contexto de las pequeas muestras. El punto de relevancia ahora es el
concepto de grados de libertad n con el que se ha tomado ya someramente
contacto. Para un estadstico este importante parmetro representa la diferencia entre el nmero de observaciones realizadas N y el nmero de parmetros poblacionales que, estimados previamente con tales N datos, intervienen en el clculo del estadstico. En lo que sigue se va a utilizar el
estimador s (6.2.8) para la desviacin estndar poblacional s procedente del
estimador insesgado s2 definido en (6.2.1b). El lector debe estar atento al
consultar la bibliografa sobre la notacin utilizada para este parmetro. Por
otra parte, en los ensayos de hiptesis el nmero de decimales a mantener en
los valores de las dcimas (t, c 2, F), al igual que en el caso Gaussiano visto
antes, suele venir impuesto por la precisin con la que estn construidas las
tablas correspondientes en estos casos (normalmente dos o tres decimales).

Distribucin t de Student
El estadstico asociado a la media poblacional m de una propiedad X
que se quiere estimar utilizando muestras de tamao N < 30, extradas de
una poblacin normal (o aproximadamente normal), viene dado por la
expresin
t=

X
N; ` < t < `
s

(6.8.1)

en donde X es la media muestral y s est dado por (6.2.8). La distribucin


muestral de t est dada por la familia de funciones de distribucin densidad
f (t ) =

[( + 1)/2]

( +1)/ 2
[ /2] (1 + t / )
2

; = N 1

(6.8.2)

expresin siempre simtrica en torno a t = 0 (Fig. 6T.5) y que cumple los


requisitos generales fn(t) 0 y normalizacin

f (t ) dt = 1

(6.8.3)

375

CLCULO NUMRICO Y ESTADSTICA APLICADA

Figura 6T5. Formas tpicas de distribuciones densidad t de Student para algunos valores de los
grados de libertad. Ntese que son funciones simtricas en torno a t = 0.

Tambin son de notar las propiedades siguientes


a) Media: t = 0
b) Varianza: Var (t ) =

( 2)

c) Lmite Gaussiano: ` f (t)

1
2

exp( t 2 / 2)

d) En ensayos bilaterales con nivel de significacin a el valor crtico tC


cumple por simetra

tC
tC

f (t ) dt = 1 ; = 1, 2, 3, ... Para ensayos unilaterales

se tiene la condicin anloga con la integracin entre < t < tC. En ambas
situaciones todo es similar a lo dicho para la distribucin Gaussiana.
La funcin Gaussiana tipificada depende de una variable z, pero la distribucin de Student depende de dos variables t y n de manera que para diferentes valores de los grados de libertad n se tienen diferentes distribuciones
(la familia aludida arriba). Para facilitar su uso estas funciones de Student
estn tabuladas atendiendo a diferentes criterios de confianza que son los
ms habituales en la prctica. La definicin de intervalos de confianza es
similar a la ya mostrada anteriormente, pero utilizando estas tabulaciones
con los percentiles t.

376

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Por ejemplo, para una confianza del 95% bilateral hay que dejar fuera un
2,5% en cada cola y esto implica, por simetra, tomar los percentiles crticos
t0,025 = t0,975 y t0,975 de la tabulacin con n grados de libertad. El estadstico
tipificado en este caso est contenido en
t0 ,975 < t < t0,975 t0 ,975 <

X
N < t0 ,975 ; = N 1
s

(6.8.4)

y la media poblacional por tanto cabe esperar con un 95% de confianza


que est en el intervalo centrado en la media muestral
X t0 ,975

s
N

< < X + t0 ,975

s
N

; = N 1

(6.8.5)

La extensin de los argumentos de verificacin de hiptesis estadsticas


es directa.
La t de Student est muy bien adaptada a los problemas de medias de
poblaciones y de comparaciones de estas medias. En particular, para la
diferencia de medias entre pequeas muestras de una misma poblacin con
varianzas muestrales s12 y s22 se utiliza el estadstico t en la forma
t=

X1 X 2
1
1
s
+
N1 N2

; = N1 + N2 2

(6.8.6)

en donde s est dado por + s 2 que puede verse en (6.3.1) y el nmero de


grados de libertad n para el problema es como cabe esperar el total de los
datos menos las dos ligaduras presentes. La aplicacin de este estadstico
requiere que las dos varianzas muestrales no difieran significativamente
(ver distribucin F de Fisher ms adelante y el test de Bartlett en Cap. 10).
EJERCICIO 6.8.1
Una muestra de medidas del tamao (dimetro) de 10 partculas de

ceniza atmica porosa de CO 3Ca dio un valor medio f = 840 micras


(1 micra = 106 mm) con una desviacin tpica muestral s = 24 micras.
Determinar los lmites de confianza del 95% y del 99% para el verdadero
valor medio f del tamao de la poblacin de estas partculas.

377

CLCULO NUMRICO Y ESTADSTICA APLICADA

Los lmites de confianza con la t de Student para n grados de libertad y


con bilateralidad vienen dados por
s

t1 / 2

< < + t1 / 2

s
N

; = N 1

o utilizando la versin sesgada s2 (6.2.5) para estimar s se tendra la en la forma ligeramente diferente pero equivalente

t1 / 2

s
N 1

< < + t1 / 2

s
N 1

; = N 1

Los percentiles hay que buscarlos en las tablas al efecto y ello para un
nmero de grados de libertad n = N 1 = 10 1 = 9. Se tienen as los valores

= 0, 05 t0 ,975 ( = 9) = 2, 26
= 0, 01 t0 ,995 ( = 9 ) = 3, 25
Redondeando las semi-anchuras a entero los intervalos de confianza son
pues

= 0, 05 840 2, 26

24

= 0, 01 840 3, 25

24

10

10

< < 840 + 2, 26

24

< < 840 + 3, 25

24

10

10

; = 9 840 17 micras

; = 9 840 25 micras

Un caso ms complicado se presenta cuando se quiere analizar la diferencia de medias entre pequeas muestras y no se puede considerar que las
varianzas muestrales s12 y s22 sean significativamente prximas. Aqu hay
que utilizar

t=

378

X1 X 2
s12
s2
+ 2
N1 N2

; redondeo a entero de

s2
s22
1
+

N1 N2
s14
N12 ( N1 1)

s24
N22 ( N2 1)

(6.8.7)

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

en donde se ha aplicado la aproximacin (6.2.21b) en el denominador de t y


el nmero de grados de libertad n para el problema es una expresin aproximada cuyo resultado debe truncarse a numero entero (por ejemplo, si el
resultado de la operacin es n 5,3, puede tomarse para el clculo estadstico n = 5). Esta expresin para n y el criterio de redondeo no son nicos y
pueden encontrarse otros en la bibliografa.
Una aplicacin adicional de esta distribucin es la del test de comparacin de parejas de datos, que resulta muy til para detectar si los resultados
obtenidos por dos mtodos de anlisis difieren significativamente. Hay que
tener en cuenta que en la obtencin de los resultados que van a formar las
muestras influyen las variaciones entre los especmenes analizados, las
variaciones debidas a las diferentes naturalezas de ambos mtodos y, por
supuesto, los errores aleatorios. Las dos primeras variaciones, entre especmenes y entre mtodos, van entremezcladas cuando se utiliza un test de
comparacin de medias y este no resuelve la cuestin que se plantea. El
modo de aislar los efectos debidos a la diferencia de mtodos es efectuar el
test de las diferencias de los valores de parejas de datos muestrales. Dadas las
dos muestras de igual tamao N, {xi}i=1,N y {yi}i=1,N, se calculan las diferencias
de parejas Di = xi yi, i = 1, 2, ..., N, y para esta muestra derivada se evalan

su media D y su varianza sD aplicando las consabidas relaciones generales


(6.2.1). Como antes se considera que la poblacin de las diferencias es Gaussiana con media nula. El proceso es similar a lo ya descrito y se utiliza
como estadstico la t de Student definida del modo siguiente
t=

D
sD

N ; = N 1

(6.8.8)

Este mtodo puede aplicarse a situaciones ms generales que la indicada


con dos muestras de igual tamao de datos procedentes de mediciones simples, pero no se van a considerar aqu.

Distribucin chi-cuadrado
El estadstico muestral en este caso se define como

2 =

( N 1) 2 1
s = 2
2

( X X )

(6.8.9)

i =1

379

CLCULO NUMRICO Y ESTADSTICA APLICADA

de utilidad para describir la extraccin de muestras de tamao N de una


poblacin normal (m, s). La funcin densidad para la variable aleatoria c2
depende del nmero de grados de libertad n = N 1 y de nuevo es una
familia de distribuciones densidad
f ( 2 ) =

( )

1
2
/2
2 ( / 2)

( 2 )/ 2

2
2
exp
; = 1, 2, 3, ...; 0 < `
2

(6.8.10)

La expresin anterior puede rescribirse notando que c 2 es efectivamente


un cuadrado y utilizar = + 2 , pero pedaggicamente parece mejor mantener la notacin c 2 o cambiarla ligeramente por c2 = x. Estas distribuciones
cumplen fn(c 2) 0 y son asimtricas (Fig. 6T6). Sus propiedades bsicas se
resumen a continuacin
a) Normalizacin:

f ( 2 ) d 2 = 1; = 1, 2, 3, ...

b) Media: c 2 = n
c) Varianza: Var(c 2) = 2n
d) A valores bajos de n la asimetra de fn(c 2) es dominante (positiva
g 3 > 0) pero para valores crecientes de n se pierde esta caracterstica. Para

n se recupera el lmite Gaussiano ( , 2 ) . Para n 30 se encuentra que


la variable z = 2 2 2 1 se distribuye ya aproximadamente de forma
normal con (m = 0, s = 1).

Figura 6T6. Formas tpicas de distribuciones densidad c2 (chi-cuadrado) para algunos valores
de los grados de libertad.

380

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

e) En ensayos unilaterales con nivel de significacin a el valor crtico cC2


cumple:

C2

f (t ) dt = 1 ; = 1, 2, 3, ... Para ensayos bilaterales se tiene la

condicin anloga, pero sin la simetra que se indicaba en la t de Student.


Como antes se pueden definir intervalos de confianza y formular y
verificar hiptesis estadsticas, pero ahora el objeto de atencin es la desviacin estndar poblacional a. De nuevo, las funciones fn(c 2) estn tabuladas convenientemente siguiendo los percentiles c 2 ms habituales. Por
ejemplo, si se quiere obtener el intervalo de confianza del 99% para c 2 hay
2
y
que dejar un 0,5% en cada cola de la distribucin y los percentiles c 0,005
2
c 0,995 van a tomarse de la tabulacin con n grados de libertad, de manera
que se tiene

02,005 < 2 < 02,995 02,005 <

( N 1)

s2 < 02,995 ; = N 1

(6.8.11)

y con ello se determina el intervalo de confianza del 99% para la s poblacional como
s

( N 1)

2
0 ,995

< < s

( N 1)

02,005

; = N 1

(6.8.12)

Conviene insistir en que tambin en este caso s se calcula como la raz


cuadrada de la estima insesgada s2. En cuanto a la formulacin de hiptesis
se siguen las lneas generales ya expuestas.
EJERCICIO 6.8.2
La desviacin tpica de la velocidad de cada de partculas coloidales obtenida con una muestra de 15 de ellas resulta s = 70 cm/s, Calcular los lmites de
confianza del 95% y del 99% para la desviacin tpica poblacional.
Los lmites de confianza para s utilizando la distribucin chi-cuadrado
responden a la expresin general
s

( N 1)
( N 1)
< < s
; = N 1
2
1 /2
2 / 2

381

CLCULO NUMRICO Y ESTADSTICA APLICADA

Los percentiles hay que buscarlos en las tablas de c 2 con un nmero de


grados de libertad n = N 1 = 15 1 = 14 y resultan ser

= 0, 05 02,975 ( = 14 ) = 26,1

02,025 ( = 14) = 5, 63

= 0, 01 02,995 ( = 14 ) = 31, 3

02,005 ( = 14) = 4, 07

Redondeando las semi-anchuras a un decimal los intervalos de confianza


son pues
95% ( = 0, 05) = 14 70

14
14
< < 70
; 51, 3 < (ccms 1 ) < 110, 4
26,1
5, 63

99% ( = 0, 01) = 14 70

14
14
< < 70
; 46, 8 < (ccms 1 ) < 129, 8
31, 3
4, 07

Distribucin F de Fisher
Cuando se tienen dos muestras independientes, tomadas de una misma
distribucin normal con el mismo o con distinto mtodo, y se determinan
con cada una las estimaciones s21 con tamao N1 y grados de libertad
n1 = N1 1, y s22 con tamao N2 y grados de libertad n2 = N2 1, el siguiente
estadstico
F , =
1

s12
s22

; s1 s2

(6.8.13)

sigue la distribucin de Fisher y sirve para ensayar la hiptesis de igualdad


de varianzas poblacionales s 21 = s 22 es decir si s 21 = s 22 y las dos muestras
pueden considerarse homogneas en el sentido de que proceden de la misma
poblacin. En la definicin anterior es muy importante reparar en la condicin s1 s2 que fuerza necesariamente Fn1,n2 1.
La distribucin de F es como puede pensarse una doble familia de funciones, pues depende de dos parmetros, los grados de libertad n1 y n2. La
funcin densidad tiene la forma general

382

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

+
1 2
1 / 2
( 2 )/ 2
2 1
F 1
f , ( F ) =
; 0<F<`
1 + 2
1 2
1 2 2

1 2
2 2
1 + F
2

(6.8.14)

De la definicin se ve claramente que la distribucin no es simtrica en los


parmetros fn1,n2 fn2,n1 y de ah que se utilice la convencin establecida en
(6.8.13) que hace Fn1,n2 1 y con la que el problema queda unvocamente fijado. Algunas de sus propiedades elementales se resumen a continuacin
(Fig. 6T.7)
a) Normalizacin:

b) Media: F =

1 ,2

( F ) dF = 1; 1 , 2 = 1, 2, 3, ...

2
; 2 > 2
2 2

c) Varianza: Var ( F ) = F

2(1 + 2 2)
; 2 > 4

1 (2 4)

El uso ha consagrado a F como la notacin para la variable de esta distribucin y no debe confundirse con el smbolo, tambin F, utilizado en el
Cap. 5 para denotar la funcin integral de una distribucin arbitraria de probabilidades.

Figura 6T7. Formas tpicas de distribuciones densidad F de Fisher para algunas parejas de valores
de los grados de libertad.

383

CLCULO NUMRICO Y ESTADSTICA APLICADA

El anlisis de la hiptesis H0 : s 12 = s 22 se realiza notando que si fuera cierta, entonces el estadstico formulado con las varianzas poblacionales tomara el valor Fn1,n2 = 1. Las diferencias con respecto a este valor de referencia
cuando se utilizan muestras pueden deberse bien al azar (diferencias pequeas y fluctuaciones naturales), bien a causas significativas (diferencias grandes). La cuestin est en decidir entre ambos casos y se utilizan para ello las
tablas correspondientes en las que hay que localizar el valor crtico FnC1,n2
que depende de: los dos parmetros n1 y n2 el nivel de significacin a (= 0,05,
0,01, etc.), y el tipo de ensayo. En el ensayo unilateral se est interesado en
cual de las dos muestras/mtodos es mejor, mientras que en el ensayo bilateral slo se busca si existen diferencias significativas entre ambas muestras/mtodos.

Figura 6T8. Regiones de aceptacin y de rechazo en un tpico ensayo unilateral (a la derecha) de


hiptesis con la distribucin F de Fisher al nivel de significacin a.

Los principios de trabajo con esta distribucin en la verificacin de hiptesis son similares a los vistos en c 2. Para un ensayo unilateral a nivel a, por
ejemplo, se calcula el valor F (6.8.13) y se determina el valor crtico FnC1,n2(a).
Seguidamente se comparan ambos valores y se decide de acuerdo con la
regla (Fig. 6T.8)
Si F < FnC1,n2(a), se acepta H0 : s12 = s22, y se concluye que las muestras
son homogneas al nivel de significacin a.
Si F > FnC1,n2(a), se rechaza H0 : s12 = s22, y se concluye que existen diferencias significativas entre las dos muestras al nivel de significacin a.

384

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

En el ltimo caso, de rechazo, se puede optar por ensayar un nivel de significacin menor a < a . Se repetira el contraste, pero ahora con un valor
crtico diferente FnC1,n2( a ). Si tras esto se tiene F < FnC1,n2( a ), entonces
H0 : s12 = s22 no puede rechazarse a un nivel de significacin a . La conclusin es que H0 : s12 = s22 no puede ser admitida ni rechazada con seguridad
y lo adecuado sera repetir las mediciones. Los valores habituales de los
niveles de significacin en esta discusin son a = 0,05 y a = 0,01.
El convenio de notacin que se utiliza en este texto es el de caracterizar F
mediante el nivel de significacin a y no mediante su complementario 1 a.
Al consultar bibliografa el lector debe estar precavido de este detalle. La distribucin F forma la base de una tcnica muy poderosa conocida como
anlisis de la varianza (ANOVA) que se considerar ms adelante (Cap. 10).
EJERCICIO 6.8.3
Dos anlisis independientes del agua de lluvia cada en un da se realizan para
medir el nmero de desintegraciones radiactivas por minuto y por litro de agua
recogida. El primer anlisis utiliza una muestra de tamao N1 = 9 y conduce a
(media desviacin tpica s) = 240 20, en tanto que el segundo con una muestra de tamao N2 = 6 lleva a 240 8. Es el segundo anlisis ms preciso que el
primero a los niveles de significacin a = 0,05, 0,01? Discutir los resultados.
Se trata de un ensayo unilateral con los grados de libertad n1 = N1 1 =
9 1 = 8, n2 = N2 1 = 6 1 = 5. Se forma el cociente mayor que la unidad de
varianzas muestrales
F , =
1

s12
s22

; s1 s2 F8,5 =

20 2
= 6, 25
82

C
C
(a = 0,05) = 4,82 y F8,5
(a = 0,01) = 10,29.
y se compara con los valores crticos F8,5
Se encuentra entonces que la posibilidad de admitir H0 lleva a que

FC8,5 = 6,25 > FC8,5(a = 0,05) = 4,82 y por tanto habra que rechazar H0
resultando el segundo anlisis ms preciso que el primero al
nivel 0,05.
Por otra parte, la posibilidad de rechazar H0 lleva a que
FC8,5 = 6,25 < FC8,5(a = 0,01) = 10,29 y por tanto no cabra rechazar H0
resultando ambos anlisis igualmente precisos al nivel 0,01.

385

CLCULO NUMRICO Y ESTADSTICA APLICADA

En estas circunstancias, podra utilizarse un nivel de significacin intermedio para contrastar la hiptesis de nuevo, pero lo adecuado es realizar un
conjunto de mediciones adicionales y reinvestigar la cuestin.
Finalmente, y como resultado de inters para posibles ensayos bilaterales,
se tiene la relacin
F

1 , 2

386

( ) =

2 ,1

1
(1 )

(6.8.15)

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

BIBLIOGRAFA
1. SPIEGEL, M. R.; SCHILLER, J. y ALU SRINIVASAN, R. Probabilidad y Estadstica, 3 Edicin (Serie Schaum), McGraw-Hill, Madrid (2010). (Caps. 5, 6, 7).
2. SPIRIDONOV, V. P. y LOPATKIN, A.A. Tratamiento Matemtico de Datos Fisico-qumicos, Mir, Mosc, 1973. (Caps. 2, 3).
3. SES, L. M. Mtodos Tericos de la Qumica-Fsica (Vol. 1), UNED, Madrid, 1994.
(Tema 7).
4. PRESS, W. H.; FLANNERY, B. P.; TEUKOLSKY, S. A. y VETTERLING, W. T. Numerical
Recipes, Cambridge University Press, Cambridge, 1986. (Caps. 6, 13).
5. TURNER, J.C. Matemtica Moderna Aplicada, Alianza (Madrid), 1993. (Caps. 5, 6,
7).
6. CRAMR, H. Elementos de la Teoria de Probabilidades, Aguilar, Madrid, 1968.
(Caps. 11, 12, 13, 14, 15,16).
7. SPIEGEL, M. R.; LIU, J. y ABELLANAS, L. Frmulas y Tablas de Matemtica Aplicada,
McGraw-Hill, 2 Edicin Revisada (Serie Schaum), Madrid (2005).

387

CLCULO NUMRICO Y ESTADSTICA APLICADA

PROBLEMAS TERICOS Y NUMRICOS

Problemas tericos
6.1) Escribir las expresiones de los momentos muestrales a2 y a4 como discretizaciones simples de los poblacionales a2 y a4 dados por integrales sobre
funciones densidad.
6.2) Demostrar que s2 = s 2.
6.3) Escribir los estimadores insesgados para la media X y la varianza s2 que
resultaran de la informacin procedente de cuatro muestras indepen
dientes {Ni, X i, si2}i=1,4 procedentes de una misma poblacin.

Problemas numricos
6.4) Una empresa cosmtica va a lanzar un producto en una ciudad con un
milln de clientes potenciales (NP). Atendiendo a diferentes rangos de
edad se estratifica esta poblacin en 10 estratos, cada uno con el siguiente nmero Ni de componentes
estrato 1:

300.000

estrato 6:

20.000

estrato 2:

150.000

estrato 7:

100.000

estrato 3:

50.000

estrato 8:

24.000

estrato 4:

100.000

estrato 9:

76.000

estrato 5:

80.000

estrato 10: 100.000

Si la muestra global va a consistir de n = 1500 elementos, cuntos (ni)


habr que tomar en cada estrato?
6.5) La siguiente secuencia consiste de 10 nmeros aleatorios entre 0 y 99 ledos de una tabla de nmeros aleatorios uniformemente distribudos
y = 06, 82, 98, 78, 43, 28, 19, 52, 72, 79

388

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Calcular con ellos 10 nmeros aleatorios xi distribuidos segn la funcin


densidad f(x) = x, 0 < x < 1, (f(x) = 0 en otro caso). Redondear los resultados a 5 decimales.
6.6) De una extraccin minera se toman 700 piezas de roca de molibdenita
que presentan una vez analizadas un contenido medio en Re por pieza de
0,0105 g y con una desviacin tpica 0,0025 g. Si se extrae de esta poblacin una muestra al azar (sin remplazamiento) de 150 especmenes,
cul es la probabilidad de que la cantidad total de Re sea inferior a 1,5 g?
6.7) Un sistema en equilibrio trmico consta de N = 1000 subsistemas independientes cada uno con NS = 500 espines . Estos espines se orientan
con respecto a un campo magntico externo paralelamente con probabilidad p = 0,6 o antiparalelamente con probabilidad q = 0,4. En cuntos
subsistemas el nmero de espines paralelos al campo estar entre 280 y
325, ambos inclusive? Considerar poblacin infinita para este problema
de proporciones.
6.8) Se toman dos muestras independientes de brotes de abeto en dos zonas
apartadas de un pas. La radiactividad medida en micro-rontgen/hora
que desprende cada una viene dada por (valor medio desviacin tpica)
15010 y 758. Calcular la media y la desviacin tpica de la suma y de la
diferencia de estas actividades.
6.9) De una partida de ostras se toma una muestra de tamao N = 7 para
investigar la radiactividad debida al istopo 65Zn. Los valores observados
medidos en unidades de 1015 Curies/g son los siguientes
124, 118, 106, 127, 131, 132, 129
a) Suponiendo que la muestra se ha extrado de una poblacin normal,
determinar los lmites de confianza del 95% y del 99% para la actividad de esta partida.
b) El mismo anlisis se realiza para otra partida procedente del mismo
banco de pesca. La muestra consta de N = 10 especmenes y las actividades observadas son
130, 126, 120, 135, 138, 129, 120, 122, 121, 119
Existen diferencias significativas entre las actividades medias de ambas
muestras al nivel de significacin a = 0,05 Y al de a = 0,01?

389

CLCULO NUMRICO Y ESTADSTICA APLICADA

6.10) Un proceso de fabricacin de ampollas de vidrio con banda cermica en


la embocadura (color-break autorrompible) presenta una distribucin
normal en sus propiedades y se sabe que da una desviacin tpica para
el esfuerzo de rotura de cada ampolla s = 32 (unidades arbitrarias). Se
introduce una modificacin en el proceso para disminuir s con la condicin de que debe mantenerse s > 10. Se toma entonces una muestra
de N = 12 ampollas que presentan los siguientes valores para el esfuerzo de rotura (unidades arbitrarias)
250, 272, 281, 240, 251, 261, 268, 275, 257, 242, 245, 266

a) Determinar la media X y la desviacin tpica s muestrales para el


esfuerzo de rotura.
b) Es significativa la diferencia entre procesos a los niveles de significacin 0,05 y 0,01?
c) Cabe esperar que la nueva desviacin estndar del proceso vaya a
mantenerse s > 10 a los niveles de significacin 0,05 y 0,01?
6.11) Se dispone de dos mtodos A y B para determinar la cantidad de Zn en el
cuerpo humano. Para una muestra de 11 individuos, con peso 70 Kg
cada uno, estos mtodos han arrojado un mismo valor medio Zn = 2 g,
pero con desviaciones tpicas muestrales diferentes sA = 0,4 g y sB = 0,7 g.
Supuesto que la muestra se ha extrado de una poblacin normal
a) Al nivel de significacin del 5% es el primer mtodo A mejor que el
segundo B?
b) Analizar la misma cuestin con niveles del 2,5% y del 1%.
c) Discutir la situacin cuando se realiza un ensayo bilateral al nivel del
5% buscando slo si existen diferencias significativas entre ambos
C
(0,025) = 3,717).
(F10,10
6.12) Un proceso de vulcanizacin de caucho natural produce una tensin de
deformacin media m = 6,4 Kg/cm2, para elongaciones de las piezas del
100% con una desviacin tpica s = 0,51 Kg/cm2. Supuesta una distribucin Gaussiana se pide

a) Encontrar el valor de la tensin de deformacin media X 50 (redondeada a tres decimales) para el que con una muestra de tamao
N = 50 se tiene el percentil del 95% de la distribucin.

390

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

b) Utilizando los valores anteriores se formula una regla de decisin


sobre una variacin del proceso que se destina a aumentar la tensin
de deformacin. Especificarla.
c) Con dicha regla de decisin, cul es la probabilidad b de cometer un
error del tipo II cuando la nueva tensin media es m = 6,55 Kg/cm2
(mantener la desviacin tpica constante en s = 0,51 Kg/cm2).
d) Construir las curvas OC y de potencia para la variacin del proceso
(mantener constante la desviacin tpica en el valor anterior). Interpretar estos resultados.
NOTA: Efectuar todos los clculos redondeando los valores de la variable
tipificada a tres decimales y las probabilidades a cuatro decimales.
6.13) Del anlisis de una muestra N1 = 16 de piezas iguales de una aleacin
ligera de Mg se obtuvo una desviacin tpica s = 38 para el contenido en
gramos de ese metal por pieza.
a) Con una confianza del 95% se quiere determinar el intervalo para la
media poblacional del contenido en gramos de Mg de manera que la
precisin en esta estima sea 0,4 Cuntas determinaciones n se
van a requerir para lograr esta precisin?
b) Con el dato n anterior utilizar las n primeras mediciones de una
nueva muestra N2 = 6 para mejorar la estimacin de s calculando s.
Los contenidos en gramos de Mg son para esta muestra
40,5, 38,6, 39,5, 39,9, 40,1, 40,7
Comentar el resultado.
c) Recalcular la semianchura del intervalo de confianza del 95% con la
muestra de tamao n utilizando (N2 + n 2) grados de libertad y el
valor recin calculado s. Comentar el resultado.
6.14) Mediante dos mtodos diferentes se analizan porciones de volumen
1 mm3 procedentes de un lquido homogeneizado para determinar su
contenido en bacterias. Los resultados obtenidos son
Mtodo A: 62, 67, 66, 58, 67, 69
Mtodo B: 59, 63, 63, 65, 66, 60
Son los dos mtodos significativamente diferentes a un nivel a = 0,05?

391

CLCULO NUMRICO Y ESTADSTICA APLICADA

SOLUCIONES
Problema 6.1
Los parmetros poblacionales a2 y a4 son los momentos centrales

2 =
4 =

f ( x) ( x )2 dx = X 2 2
f ( x) ( x )4 dx = X 4 4 X 3 + 6 X 2 2 3 4

Estas integrales discretizadas simplemente como una suma sobre puntos


se expresan
1
a2 =
N
1
a4 =
N

1 N
xi
N i=1

xi4

1 N 1 N 1 N 1 N
1 N
4 xi3 xi + 6 xi2 xi 3 xi
N i =1 N i =1 N i =1 N i =1
N i =1

i=1

xi2

i =1

Obsrvese que no se pretende construir estimadores insesgados de las


magnitudes poblacionales, ni definir aproximaciones numricas precisas a
las integrales, sino slo identificar los promedios que aparecen. En la descripcin estadstica de conjuntos de datos a2 y a4 encuentran utilidad tal y
como se han escrito arriba.
Problema 6.2
De acuerdo con las ecuaciones (6.2.1b) y (6.2.5) se tiene
N 2
N
s2 =
s =
N 1
N 1

( xi + X )2
i

El sumatorio que corre sobre i = 1, 2, 3, ..., N puede desarrollarse como

( xi + X )2 = {( xi )2 + 2( xi )( X ) + ( X )2 } =
i

( xi )2 + 2( X ) N ( X ) + N ( X )2 = ( xi )2 N ( X )2
i

392

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Por tanto
s2 =

N 1
2
2
( xi ) ( X )
N 1 N i

Tomando el valor medio se obtiene la relacin pedida


N 1
2
2
( xi ) ( X ) =
N 1 N i

N N
N 2 2
2
2
2
(
x

X
)


N 1 N 1
N
1
N

s2 =

en donde se ha hecho uso de que el valor medio de una suma es la suma de


los valores medios y adems de la propiedad de simetra
( x1 )2 = ( x2 )2 = ... = ( xN )2
y de

( X )2 =

2
N

Problema 6.3
Los estimadores insesgados pedidos para la media y la varianza se obtienen por generalizacin directa de las relaciones (6.3.1)
N X + N2 X 2 + N3 X3 + N4 X 4
X = 1 1
;
N1 + N2 + N3 + N4
s 2 =

( N1 1)) s12 + ( N2 1) s22 + ( N3 1) s32 + ( N4 1) s42


N1 + N2 + N3 + N4 4

expresiones que son claramente insesgadas, pues


X i = ;

si2 = 2; i = 1, 2, 3, 4

con lo que
X = ;

s 2 = 2

393

CLCULO NUMRICO Y ESTADSTICA APLICADA

Problema 6.4
La versin ms eficaz del muestreo estratificado se consigue tomando
elementos proporcionales segn
ni
n 1500
1, 5
; i = 1, 2, 3, ..., 10
=
=
=
6
Ni NP
1000
10
Por ejemplo para el estrato 1 se tiene
n1
1, 5
=
n1 = 450
300000 1000
Los dems se encuentran de manera anloga y se tiene
Tabla. Problema 4
Estrato

10

ni

450

225

75

150

120

30

150

36

114

150

Problema 6.5
El problema hay que abordarlo en varias etapas.
a) La funcin densidad no est normalizada y hay que normalizarla
C

f ( x) dx =C

x dx =

C
= 1 C = 2
2

2 x, 0 < x < 1
f ( x) =
0 en otro caso
b) Calcular la funcin integral v = F(x) que est comprendida entre
0v1
0 x < 0
x
v = F ( x) = 0 2u du = x2 , 0 x < 1

1 1 x

394

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

c) Transformar los nmeros de dos cifras ledos en la tabla al intervalo


[0,1]. Esto equivale a la transformacin y[0, 99] v[0,1] que se logra con el
y
.
cambio v =
99
d) Hacer v = F(x) = x2 y calcular x = F 1 ( ) = + v con resultados en
0 x 1. La tabla siguiente contiene los resultados pedidos (Fig. 6EP1)

Figura 6EP1. Grfico para el Problema 5. Obtencin de nmeros aleatorios xi no uniformemente


distribuidos entre 0 y 1 a partir de nmeros aleatorios ni que s estn uniformemente distribuidos
en ese intervalo.

Tabla. Problema 6.5. Nmeros aleatorios


y

06

82

98

78

43

v = F ( x)

0,06061

0,82828

0,98990

0,78788

0,43434

x= v

0,24618

0,91010

0,99494

0,88763

0,65905

28

19

52

72

79

v = F ( x)

0,28283

0,19192

0,52525

0,72727

0,79798

x= v

0,53182

0,43809

0,72474

0,85280

0,89330

Problema 6.6
La distribucin muestral de medias en este caso es tal que

mX = m = 0,0105 g

X =

NP N 0, 0025 700 150


=
700 1
NP 1
150

395

CLCULO NUMRICO Y ESTADSTICA APLICADA

Un total de 1,5 g en 150 especimenes equivale a decir que la media en

esta muestra es de X = 1,5/150 =0,01 g y el problema se reduce al de la probabilidad de que la cantidad media sea menor que este valor. Dado el tamao de la poblacin y de la muestra puede utilizarse la Gaussiana y la tipificacin, redondeando el resultado para la variable a dos decimales, lleva a
z=

X X 0, 01 0, 0105
=
= 2, 76
X
0, 0001811

La probabilidad es por tanto


p( z < 2, 76) = 0, 5 p(0 < z < 2, 76) = 0, 5 0, 4971 = 0, 0029
9 0, 3%
El lector puede comprobar con cuantos decimales en el denominador se
mantiene el resultado para z con el redondeo utilizado.
Problema 6.7
Se comienza analizando un subsistema

3 = 3 1 = p = 0, 6; 3 =

pq
0, 6 0, 4
=
NS
500

El uso de una distribucin Gaussiana implica tipificar las proporciones


utilizando las consabidas correcciones de continuidad, derivadas del paso
binomial Gaussiana, y se tiene
31 =

279, 5
325, 5
= 0, 559; 3 2 =
= 0, 651
500
500

Tipificando se obtienen
z1 =

31 3

32 3
0, 559 0, 6
0, 651 0, 6
= 1, 87; z2 =
=
= 2, 33
0, 02191
0, 02191
3

habindose utilizado redondeo a dos decimales en la variable tipificada. La


probabilidad para un subsistema es pues
p(280 espines 325) = p(279, 5 < z < 325, 5) = p( 1, 87 < z3 < 2, 33) =
p(0 < z3 < 1, 87) + p(0 < z < 2, 33) = 0, 4693 + 0, 4901 = 0, 9594 = 95, 94%

396

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Para el sistema completo de subsistemas independientes se mantiene el


porcentaje sealado para la probabilidad del suceso S(280 espines 325),
y el nmero de ellos en los que se cumplir la relacin pedida es
n = 0, 9594 1000 959
Ntese que la probabilidad del suceso S pedido en todo el sistema es
p(S) =

1
1
1
N
p1 + p2 + ... + pN =
p= p
N
N
N
N

Este problema podra haberse abordado utilizando la distribucin binmica desde el principio.

Problema 6.8
La media de la suma/diferencia viene dada por la suma/diferencia de
las medias

R + R = R + R = 150 + 75 = 225 micro-rontgens/horra


1

R R = R R = 150 75 = 75 micro-rontgens/hora
a
1

en tanto que la desviacin tpica es la misma en ambos casos (redondeo a un


decimal)

R + R = R R = R2 + R2 = 102 + 82 = 12, 8 13 micro--rontgens/hora


1

Problema 6.9
Hay que utilizar la distribucin t de Student y deben determinarse los
valores medios y desviaciones tpicas de ambas partidas. Se considera que no
hay diferencias significativas entre las dos varianzas muestrales. Los clculos
son automticos con una calculadora de sobremesa, pero conviene haber
hecho alguno en detalle. Para el caso a) redondeando a cuatro decimales el
clculo se organiza as

397

CLCULO NUMRICO Y ESTADSTICA APLICADA

xi

(xi X )

(xi X )2

124

0,1429

0,0204

118

5,8571

34,3056

106

17,8571

318,8760

127

3,1429

9,8778

131

7,1429

51,0210

132

8,1429

66,3068

129

5,1429

26,4494

x = 867;
i

X1 = 123, 8571;

(x X )

= 506, 8571; s1 = 9,1911

i (1)

Para la segunda muestra se obtienen los valores

x = 1260;
i

X2 = 126;

i( 2)

(x X )

= 412; s2 = 6, 7659

a) Los lmites de confianza para la primera muestra se corresponden con


n = N1 1 = 7 1 = 6 grados de libertad y los coeficientes crticos (percentiles) del 97,5% y del 99,5% son
t0 ,975 ( = 6 ) = 2, 45; t0 ,995 ( = 6 ) = 3, 71
y los lmites de confianza en las unidades del problema son
95% X1 t0 ,975

99% X1 t0 ,995

s1
N1
s1
N1

= 123, 9 8, 5 115, 4 < 1 < 132, 4 115 < 11015 < 132 curies/g

= 123, 9 12, 9 111 < 1 < 136, 8 111 < 11015 < 137 curies/g

b) Para realizar la comparacin de las medias poblacionales hay que formular la hiptesis nula H0 : m1 = m2 y contrastarla va el estadstico (redondeo
a dos decimales) y grados de libertad siguientes
t=

398

X1 X 2
1
1
s
+
N1 N2

123, 8571 126


1 1
7, 8267
+
7 10

= 0, 56; = 7 + 10 2 = 15

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

Entonces se tiene
H0 : m1 = m2 y las diferencias son slo consecuencia del azar
H0 : m1 m2 y las diferencias son significativas al nivel a seleccionado
El ensayo es bilateral y para a = 0,05 hay que rechazar H0 si el estadstico
calculado t = 0,56 est fuera de los lmites comprendidos entre los valores
crticos t0,975(n = 15) = 2,13 y t0,975(n = 15) = 2,13. Como 2,13 < 0,56 < 2,13
hay que aceptar H0 y concluir que las medias reales de la radiactividad debida al 65Zn no difieren significativamente al nivel a = 0,05.
El ensayo al nivel a = 0,01 no es ya necesario, pues el intervalo que va a
indicar es an mayor que el obtenido antes [t0,975(n = 15) = 2,95]. Puede
concluirse pues que las dos muestras proceden de la misma poblacin.
Problema 6.10
a) Los valores pedidos son (redondeos en su caso a cuatro decimales)

X = 259; s = 13,6115; n = 12 1 = 11 grados de libertad.


b) Hay que utilizar la distribucin chi-cuadrado. La formulacin de
hiptesis es
H0 : s = 32 y las diferencias son slo producto del azar.
H1 : s < 32 y las diferencias son significativas al nivel a seleccionado.
Aqu hay que fijarse en que H1 est definiendo una regin en la parte
izquierda de la distribucin. Si el estadstico calculado es menor que el
valor crtico, es entonces cuando hay que rechazar H0. El estadstico para la
muestra redondeado a dos decimales es

= ( N 1)
2

s2

2038
322

= 1, 99

En un ensayo unilateral a < 0,05 a < 0,01 hay que comparar c 2 = 1,99 con
2
2
(n = 11) = 4,57 y c 0,01
(n = 11) = 3,05. En ambos casos se
los valores crticos c 0,05
2
2
2
tiene c = 1,99 < c 0,05, c 0,01 y hay que concluir que las diferencias son significativas y que el proceso ha tenido xito en la reduccin de la desviacin tpica
del esfuerzo de rotura. Ntese que si el estadstico calculado hubiera sido
mayor que el valor crtico de referencia, se habra aceptado la hiptesis nula.

399

CLCULO NUMRICO Y ESTADSTICA APLICADA

c) De nuevo utilizando chi-cuadrado hay que contrastar las hiptesis


H0 : s = 10
H1 : s > 10
La situacin es ahora la contraria a la anterior desde el punto de vista de
la distribucin. El estadstico redondeado a dos decimales toma el valor

2 = ( N 1)

s2

2038
102

= 20, 38

y los valores crticos para este ensayo unilateral son c 20,95(n = 11) = 19,7 y
2
c 0,99
(n = 11) = 24,7. La regla de decisin para cada nivel de significacin es la
siguiente
2
2
, c 0,99
hay que rechazar H0 es decir aceptar H1 al
Si c 2 = 20,38 > c 0,95
nivel de significacin que se considere.
2
2
, c 0,99
hay que aceptar H0 es decir rechazar H1 al
Si c 2 = 20,38 < c 0,95
nivel de significacin que se considere.

En el caso estudiado se tiene que


2
c 2 = 20,38 > c0,95
(n = 11) = 19,7 y hay que aceptar al nivel a = 0,05 que H1 :
s > 10 es cierta.

Por otra parte, se tiene tambin que


2
c 2 = 20,38 < c 0,99
(n = 11) = 24,7 y hay que rechazar al nivel a = 0,01 que
s > 10, es decir H1 es falsa.

Ntese la proximidad de valores en el caso a = 0,05 que ya casi anticipa el


resultado al nivel a = 0,01. Aunque las circunstancias particulares de la produccin y venta del producto pueden llevar a decidir lo contrario, lo ms
adecuado sera revisar el proceso para garantizar que la disminucin en la
resistencia de rotura es tal que s > 10.
Problema 6.11
a) Hay que utilizar la distribucin de Fisher con a = 0,05 y n1 = n2 = 11
1 = 10 grados de libertad. Como sB > sA se forma el estadstico
F=

400

s2B
s2A

0, 72
0, 42

= 3, 0625 > 1

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

y comparar unilateralmente con el valor crtico. ste ledo en una tabla


C
(0,05) = 2,978. Este ltimo valor marca
construida con tres decimales es F10,10
la separacin entre la regin con 95% de probabilidad F < F10,10 (0,05) = 2,978
y que dara como cierta la hiptesis nula, H0 : s A2 = s B2, y la regin con 5% de
probabilidad F > F10,10 (0,05) = 2,978 y que dara como falsa tal hiptesis.
C
Como F 3,06 > F10,10
(0,05) = 2,978, hay que rechazar con un 5% de nivel
de significacin que H0 : s A2 = s B2, concluyendo entonces que efectivamente A
(que muestra una menor varianza) es ms preciso que B.
C
(0,01) = 4,849.
b) Un nuevo ensayo con a = 0,01 lleva a considerar F10,10
C
Por el contrario, se tiene ahora F 3,06 < F10,10(0,01) = 4,849, y con un 1% de
nivel de significacin no puede rechazarse H0 : s A2 = s B2.
C
Un nuevo ensayo con a = 0,025 lleva a considerar F10,10
(0,025) = 3,717. De
C
nuevo se tiene que F 3,06 < F10,10(0,025) = 3,717, y con un 2,5% de nivel de
significacin puede arriesgarse que H0 : s A2 = s B2, aunque convendra repetir
las mediciones para asegurarse.

c) Un ensayo bilateral con a = 0,05 implica que los valores crticos van a
delimitar un rea central en la distribucin de aceptacin de la hiptesis nula
C
(a/2)
H0 con valor 1 a. Esto hace que la comparacin deba hacerse con F10,10
C
= F10,10(0,025) = 3,717. Como F 3,06 < F10,10(0,025) = 3,717, no se debera
rechazar la hiptesis nula, al igual que en el segundo ensayo de b) (el otro
valor de referencia es F10,10(0,975) = 1/F10,10(0,025) 0,269). En este ensayo
bilateral no habra diferencias significativas entre A y B.
Problema 6.12
a) La variable tipificada z0,95 queda definida por el rea que encierra
p( < z < 0,95) = 0,95 y la relacin
z0 ,95 =

X50

X50 6, 4

= 1, 645
0, 51/ 50

de donde se obtiene el valor medio buscado X 50 = 6,519 Kg/cm2.

/ N

b) La formulacin al nivel a = 0,05 sera como sigue


H0 : m = 6,4 Kg/cm2 y ambos procesos no difieren a este nivel a
H1 : m > 6,4 Kg/cm2 y el nuevo proceso es mejor al nivel a

401

CLCULO NUMRICO Y ESTADSTICA APLICADA

lo que se traduce en la regla de decisin siguiente

H0 se rechaza si X 50 en 50 ensayos > 6,519 Kg/cm2 (H1 se acepta).


c) El error del tipo II consiste en aceptar H0 cuando H1 es efectivamente
cierta. Se mide mediante el parmetro b que es el rea delimitada en la curva
de H1 por el nivel de significacin a de H0, desde hasta el punto de corte.

Hay que tipificar X 50 = 6,519 Kg/cm2 con respecto a la distribucin de H1


y con este valor calcular en esta funcin el rea b. Redondeando a tres decimales se tiene
z50 =

6, 519 6, 55
0, 51/ 50

= 0, 430

= pH ( ` < z < 0, 43) = 0, 5 pH (0 < z < 0, 43) = 0, 5 0,1664 = 0, 3336


1

d) La curva OC es la representacin de valores (m, b) y la curva de potencia es la representacin equivalente de (m, 1 b). Para obtenerlas hay que dar
valores mi a la media poblacional y proceder del mismo modo que en el
apartado anterior
zi =

X50 i

/ N

; i = pH ( ` < z < zi )
1

Las curvas pueden calcularse tan detalladamente como se desee, pero


una seleccin de valores basta para dar la idea de los comportamientos de
ambas. Cuatro clculos de puntos tpicos con redondeos a tres decimales en
la variable tipificada son los siguientes

1 = 6,1 z1 =
5 = 6, 5 z5 =
6 = 6, 6 z6 =

0, 51/ 50

6, 519 6, 5
0, 51/ 50

6, 519 6, 6
0, 51/ 50

8 = 6, 8 z8 =

402

6, 519 6,1

= 5, 809 1 = pH ( ` < z < 5, 809 ) = 1


1

= 0, 263 5 = pH ( ` < z < 0, 263) = 0, 6037


1

= 1,123 6 = pH ( ` < z < 1,123) = 0,1307

6, 519 6, 8
0, 51 / 50

= 3, 896 8 = pH ( ` < z < 3, 896 ) = 0


1

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

en donde se ha utilizado una tabla Gaussiana dada con precisin de dos


decimales para la variable y se han efectuado las correspondientes interpolaciones lineales para determinar las probabilidades con la variable tipificada redondeada a tres decimales. Una tabla representativa se da a continuacin
Tabla Problema 6.12. Curvas OC y de potencia
m

6,1

6,2

6,3

6,4(*)

6,5

6,6

6,7

6,8

5,809

4,423

3.036

1,645

0,263

1,123

2,510

3,896

b (OC)

1,0000

1,0000

0,9988

0,9500

0,6037

0,1307

0,0060

1b

0,0000

0,0000

0,0012

0,0500

0,3963

0,8693

0,9940

(*) Se han tomado los datos exactos.

Figura 6EP2. Grfico para el Problema 12. Curvas OC (caracterstica de operacin) (a) y de potencia
(b). 1 b es la potencia del criterio estadstico utilizado. Los datos de entrada se han suavizado con
splines cbicos.

De la curva OC (Fig. 6EP.2) se observa que para m = 6,4 la probabilidad


de seguir con el proceso original es prcticamente la unidad. En m = 6,4 entra
en juego el nivel de significacin elegido a < 0,05 y es la zona de decisin.
Para m > 6,4 el parmetro b desciende rpidamente y ya para m > 6,7 la probabilidad de seguir con el proceso original es despreciable. De la curva complementaria de potencia se deducen los mismos resultados.

403

CLCULO NUMRICO Y ESTADSTICA APLICADA

Problema 6.13
a) En este caso se conoce la desviacin tpica muestral para un tamao
N1 = 16 y se tiene que estimar otro tamao de muestra menor que cumpla un
determinado requisito. Utilizando la t de Student con t0,975(n = 15) = 2,13 el

intervalo bilateral alrededor de X en el cul se encontrar m es


X t0 ,975

s
N

= X 2,13

0, 38
16

= X 0, 20

En esta ecuacin s(n = 15) y t0,975(n = 15) para N = N1 = 16. Ahora bien,
conocido este resultado se puede utilizar una semi-anchura dada l, mayor
y menos restrictiva que la anterior, para un intervalo de seguridad prctica
y estimar un valor n del nmero de observaciones a realizar compatible
con l
l = t0 ,975

s
n

= 2,13

0, 38
n

La semi-anchura del intervalo debe ser 0,4 y as se tiene


0, 4 = t0 ,975

s
n

= 2,13

0, 38
n

n 4, 09 n = 5 determinaciiones

en donde se ha redondeado por exceso para mayor seguridad.


b) Tomando las cinco primeras determinaciones de la muestra de tamao 6 se calcula su desviacin tpica y se obtiene s(n = 4) = 0,7225. Este dato
se combina con lo sabido para N1 = 16 en la forma de mezcla (pooling)
s 2 =

15 (0, 38)2 + 4 (0, 7225)2


s = 0, 4732 0, 47 g
16 + 5 2

La diferencia entre las dos varianzas es grande y esta operacin de pooling no parece tener mucho sentido.
c) En esta nueva estimacin de la desviacin tpica se han aadido grados de libertad con la toma de la muestra N2 = 6. De manera que la semianchura final real para el conjunto n = 5 va a ser diferente de la pretendida
de 0,4. Para estimarla se puede utilizar la relacin original l = t0 ,975 s / n
404

MUESTREO, ESTIMACIN Y DECISIN ESTADSTICA

pero con n = 16 + 5 2 = 19 grados de libertad para t0,975. As se recalcula esta


semi-anchura como
t0 ,975 ( = 19)

s
5

= 2, 09

0, 4732
5

0, 44

La semi-anchura es mayor que la pretendida, como resultado de la diferencia entre varianzas comentada. Parece conveniente revisar la toma de
datos.
Este tipo de procedimiento es ampliamente utilizado en los planes de
muestreo de poblaciones.

Problema 6.14
Primero hay que construir la variable diferencia que toma los valores
D = xA xB = 3, 4, 3, 7, 1, 9
cuya media y desviacin estndar, redondeadas a tres decimales, son
D = 2,167; sD = 5, 231
valores con los que se calcula el valor del estimador
t=

D
sD

N ; = N 1= 5

Redondeando a dos decimales la dcima toma el valor t = 1,01 y los


valores crticos para el 95% con n = 6 1 = 5 grados de libertad son
t0,975 = 2,57. Como t < 2,57 hay que aceptar la hiptesis nula de que los dos
mtodos no dan resultados significativamente diferentes al nivel a = 0,05.

405

CAPTULO 7
CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

7.1. Experimentos con ms de una variable aleatoria, correlacin y regresin


7.2. Ecuaciones empricas tpicas en dos variables y su reduccin a forma
lineal
7.3. El coeficiente de correlacin en dos variables
7.4. Aspectos prcticos de la regresin lineal por mnimos cuadrados
7.5. Desestimacin de puntos en el anlisis de datos
7.6. Correlacin lineal mltiple
7.7. Estadstica no paramtrica
Bibliografa
Problemas tericos y numricos

Se abordan las cuestiones de correlacin, regresin y estadstica no paramtrica. Se consideran as los problemas de la cuantificacin del grado de relacin que presentan una variable dependiente y una o varias variables independientes (correlacin simple o mltiple). En el caso general la teora estadstica
posee mtodos para optimizar expresiones matemticas empricas y obtener la
mejor relacin funcional (mnimos cuadrados, por ejemplo) entre las variables,
suministrando medidas (coeficientes) para estimar el grado (o grados) de correlacin existente. Utilizando estas relaciones funcionales ptimas, que poseen
propiedades ms suaves que los datos originales, se puede estimar el valor de la
variable dependiente para determinados valores de las variables independientes
(regresin). Se retoma as la discusin iniciada en el Cap. 1 relativa a los mnimos
cuadrados, pero ahora desde la perspectiva estadstica. Se analizan tambin las
posibilidades de realizar ajustes de regresin de funciones complicadas (una
variable independiente) reducindolas a forma lineal mediante los consiguientes
cambios de variable. El problema lineal se estudia con detalle, determinando: los
coeficientes de la relacin, los errores asociados, y el coeficiente de correlacin.
Aqu se presta especial atencin al significado del coeficiente de correlacin entre
dos variables como ligado a una distribucin Gaussiana bivariante y se le relaciona con la transformacin z de Fisher, considerndose tambin algunos aspec-

407

CLCULO NUMRICO Y ESTADSTICA APLICADA

tos prcticos de la regresin lineal. Una vez explicados algunos tests sencillos
(cuartiles extendidos, y distancia de Cook) para identificar puntos extraos en
una muestra, se pasa al caso de la correlacin lineal mltiple centrando el
problema en el caso de tres variables (plano de mnimos cuadrados) y analizando
los diferentes coeficientes de correlacin y los errores tpicos de la estima que pueden definirse. Finalmente, por su inters como tcnicas alternativas del anlisis de
la correlacin, se estudian dos aplicaciones sencillas de la denominada estadstica no paramtrica (test de los signos y correlacin por rangos de Spearman).
Correlacin / Regresin
Correlacin bivariante

Correlacin mltiple

Ecuaciones empricas

Regresin lineal
Coeficientes de correlacin

Casos con 2, 3 y 4 parmetros


Reduccin a forma lineal
Coeficiente de correlacin lineal
Covarianza
Transformacin z de Fisher

Estadstica no paramtrica

Regresin lineal por mnimos cuadrados


Errores RMS, de la estima, en los parmetros
Desestimacin de puntos

Test de signos
Spearman

Caps. 1, 10

7.1. Experimentos con ms de una variable aleatoria,


correlacin y regresin
En este captulo se retoma la discusin general del ajuste de funciones a
series de datos, pero ahora se aadirn los aspectos que estn ligados al
hecho de que tales datos pueden estar extrados de distribuciones de probabilidad y venir afectados de errores estadsticos de entrada. En principio hay
que distinguir entre dos situaciones: a) cuando la relacin funcional entre las
variables que intervienen, X, Y, Z, etc., es conocida a priori por argumentaciones tericas, y = f(x), z = f(x, y), etc.; y b) cuando tal relacin no se conoce
y hay que buscarla (relacin emprica) ensayando tipos o modelos prefijados,
bien entendido que pudiera darse el caso de que la relacin no existiera o de
que incluso resultase producto de una coincidencia no significativa.

408

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

En el caso a) ya existe por definicin una correlacin terica entre las


variables del problema que puede cuantificarse para dar una idea de la dispersin de los datos de entrada. Para concretar ideas, en el caso de dos
variables, si cuando X crece (decrece), la variable Y tambin crece (decrece),
se dice que la correlacin es positiva, en tanto que cuando las variaciones de
X e Y son contrarias se dice que la correlacin es negativa.
En el caso b) es claro que el objetivo es justamente determinar si una tal
correlacin existe y en qu grado, algo que es en general un problema difcil y
que puede conducir a situaciones poco significativas y hasta absurdas. Por
ejemplo, ante una tabla {(xi, yi)}i=0,M con N = M + 1 parejas de valores (la muestra
obtenida) puede ensayarse el ajuste de una relacin funcional lineal y = ax + b y
esta operacin puede llevar a un buen resultado o a un mal resultado (Cap. 1).
Si el resultado es aparentemente bueno, en el sentido de una proximidad
entre los valores tabulares yi y los valores estimados yi = yi,est. = axi + b, se puede seguir adelante e intentar cuantificar el grado de correlacin obtenida
entre las variables X e Y. Sin embargo, si el resultado es malo, en el sentido de
una pobre proximidad entre yi e yi, slo se podr afirmar que hay mala correlacin lineal entre las variables, pero nada impide que puedan existir correlaciones mejores entre ambas (y = ax2 + bx + cx, y = ax/(bx + c), etc.). Todo esto
indica porqu determinar la mejor correlacin es un asunto arduo y con
una respuesta unvoca no necesariamente definitiva. Adems, en cualquier
caso hay que cerciorarse de que una correlacin obtenida es significativa y no
un mero artefacto matemtico. Por ejemplo, una correlacin positiva entre la
proporcin de oro en rocas extraidas de una mina y el contenido en taninos de
una produccin vincola no cabe esperar que tenga una significacin vlida.
El ajuste emprico de ecuaciones a fenmenos fisicoqumicos (modelizacin) es una etapa importante del trabajo cientfico y tcnico. En el mejor de
los casos estas ecuaciones empricas pueden contener verdades cientficas de
gran calado, como las ecuaciones para las series del espectro del hidrgeno
atmico de Balmer (1885) y de Paschen (1908), pero a falta de una teora que
las respalde, como la teora de Bohr en los dos casos anteriores (1913), su
utilidad queda reducida a la de un mtodo de interpolacin (en el mejor de
los casos tambin de extrapolacin). Como ya se ha mencionado en otros
lugares del texto, la utilidad de un esquema de interpolacin est limitada al
intervalo de definicin de los datos y, dentro del contexto presente de correlacin de variables, las estimaciones con ecuaciones empricas de los valores
de una variable conocidos los del resto de ellas se denomina regresin.

409

CLCULO NUMRICO Y ESTADSTICA APLICADA

Antes de lanzarse a calcular conviene realizar una sencilla representacin


grfica de los datos de entrada para decidir entre qu tipos de relaciones funcionales conviene ensayar posibilidades. Esto ahorra tiempo y errores de
apreciacin sobre los datos. Por razones obvias de simplicidad siempre que
sea posible conviene rectificar o (linealizar) la forma de la ecuacin emprica, es decir convertirla en la de una lnea recta y = ax + b. Un diagrama de
puntos (diagrama de dispersin) ofrece una gran variedad de posibles lneas
rectas (u otras funcionalidades) para ser trazadas a travs de ellos, por lo que
es necesario seguir algn criterio que permita seleccionar la mejor. El
criterio habitual es el ya conocido (Cap. 1) de mnimos cuadrados, en el que
se minimiza la suma de los cuadrados de las desviaciones de cada punto
tabular al punto de la lnea de ajuste. La regresin hecha as es la denominada regresin de mnimos cuadrados. Existen otros criterios, como la regresin ortogonal en la que se minimiza la suma de las distancias punto tabular recta de regresin, pero la versin preferida por su sencillez y facilidad
de operacin es la de mnimos cuadrados.
Para cuantificar el grado de correlacin entre dos variables se utiliza el
denominado coeficiente de correlacin, una magnitud que est relacionada
con la covarianza de tales variables (Cap. 5). Este nuevo coeficiente es independiente de la regresin mnimo cuadrtica, pero da una muy buena idea
de la concentracin / dispersin de los datos tabulares alrededor de la dependencia lineal de las variables. De aqu se deriva su gran popularidad, as
como su uso conjunto con las regresiones lineales para caracterizar la calidad de stas (calibracin de aparatos de anlisis qumico, seleccin de ecuaciones empricas, etc.). Ahora bien, aqu hay que sealar que la fundamentacin del coeficiente de correlacin no es tan general como se supone,
pues, en rigor, su aplicacin fiable requiere de una distribucin Gaussiana en
dos dimensiones como poblacin de la que procedan los puntos de la muestra (xi, yi). Es debido a estas particularidades del coeficiente de correlacin
que se han diseado herramientas alternativas que no presuponen distribucin alguna en los datos de entrada para caracterizar la correlacin entre
variables (tcnicas de la estadstica no paramtrica y de la estadstica robusta).
A pesar de todo ello, el concepto de coeficiente de correlacin es como se ha
indicado muy usado y tiene sus generalizaciones en el caso de los experimentos multivariantes en los que intervienen tres o ms variables aleatorias.
En la realizacin de los clculos de regresin pueden presentarse varias
circunstancias. Por ejemplo, se puede estar interesado en realizar compara-

410

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

ciones de resultados entre varios aparatos, varios laboratorios, diferentes


operarios, etc. Adems, los datos de entrada (por simplicidad bivariantes)
{(xi, yi)} pueden ser tales que: a) sean uno-a-uno, con un valor yi para cada xi;
b) con varios valores yi1, yi2, ..., para alguno o todos los xi; c) con un valor yi
para varios xi; d) con errores en uno o en ambos datos de entrada, aunque lo
comn es considerar que estos errores afectan slo a los datos yi, estando los
xi libres de error; e) haya datos de entrada que deban ser desechados; etc.
Existen tcnicas adecuadas para tratar con cada uno de estos casos pero por
razones de espacio y tiempo no se pueden tratar aqu. En general, los mnimos cuadrados son un buen punto de partida para toda esta casustica y van
a considerarse en este captulo algunas de sus aplicaciones principales. La
atencin se concentrar principalmente en los experimentos bivariantes
que se describen con regresiones lineales mnimo-cuadrticas, y se prestar
algo de atencin a los experimentos con tres variables aleatorias y a las
correlaciones que pueden definirse en ellos. Otros detalles complementarios
pueden abordarse con las tcnicas no paramtricas o las robustas, de las
que se van a dar tambin algunas ideas aqu, y se dejan algunas aplicaciones
ms avanzadas para el Cap. 10 (ajustes chi-cuadrado con errores en los
datos yi, rectas robustas), remitiendo al lector a la bibliografa especializada
para ms tcnicas (regresin de la media, optimizacin de Deming para
errores tanto en xi como en los datos yi, etc.).

7.2. Ecuaciones empricas tpicas en dos variables y su reduccin


a forma lineal
Al tratar de representar una coleccin de puntos {(xi, yi)}i=0,M experimentales aparecen con frecuencia en la prctica algunas formas no lineales tpicas. Ya se han considerado en el Cap. 1 los tipos bsicos en conexin con el ajuste de mnimos cuadrados. El punto importante all era que
con sencillos cambios de variable admisibles la funcin modelo acababa
transformndose en una dependencia lineal tanto en las nuevas variables
como en los parmetros incgnita que ayudaban a definir la relacin. A su
vez, estos parmetros se obtenan a travs de la resolucin de un sistema
lineal de ecuaciones. Antes de considerar situaciones ms generales con
tres y cuatro parmetros y a modo de resumen, se detallan a continuacin
los tipos bsicos junto a sus cambios de variable para reducirlos al tipo
lineal.

411

CLCULO NUMRICO Y ESTADSTICA APLICADA

Tipos bsicos con dos parmetros


A = a, B = b
y = ax + b
Y = AX + B
X = x, Y = y

(7.2.1)

A = a, B = ln b
y = bxa
Y = AX + B
X = ln x, Y = ln y

(7.2.2)

A = ln a, B = ln b
y = ba x
Y = AX + B
X = x, Y = ln y

(7.2.3)

A = a, B = b
a

Y = AX + B
x
X = 1 / x, Y = y

(7.2.4)

y = b+

y=

y=

A = a, B = b
1

Y = AX + B
ax + b
X = x, Y = 1 / y

(7.2.5)

A = a, B = b
x

Y = AX + B
bx + a
X = 1 / x, Y = 1 / y

(7.2.6)

No se han considerado ajustes polinmicos de grados 2 por brevedad.


Una vez realizada la oportuna representacin grfica, la tcnica de
mnimos cuadrados da los coeficientes A y B ptimos para la ecuacin
emprica ms adecuada. Aunque se ha tomado la dependencia y = f(x)
pudiera haber casos en los que resultase ms ventajoso intercambiar los
papeles de las variables y formular la dependencia como x = g(y) [por
ejemplo, x = (ay + b)1. En cualquier caso, hay que prestar atencin a las
posibles restricciones sobre los valores de entrada {(xi, yi)} de manera que
no se presenten operaciones prohibidas, como por ejemplo: en (7.2.2) hay
que exigir que x > 0, y > 0; en (7.2.6) hay que exigir y 0 y que x 0. No
obstante, en determinadas ocasiones pueden manipularse ligeramente los
valores de entrada y conseguir tratar situaciones aparentemente imposibles.
EJERCICIO 7.2.1
Disear una reduccin a forma lineal de la relacin y= bxa, b > 0, x > 0.

412

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

Como ln y con y < 0 no est definido en el campo de los nmeros reales,


no es posible realizar el cambio (7.2.2) directamente. Sin embargo, notando
que las funciones y = bxa e y = bxa son simtricas con respecto al eje x
(Fig. 7T1), redefiniendo el problema original como
Y = y = bxa ( b > 0, x > 0 )
se puede tratar el problema haciendo
ln Y = ln b + a ln x
de donde la aplicacin convencional de mnimos cuadrados da los valores
ptimos para a y b, que definirn la ecuacin buscada y = bxa.

Figura 7T1.

Tipos con tres y cuatro parmetros


Aqu van a considerarse los tipos especiales siguientes
i) y = be ax + c

(7.2.7)

ii) y = bxa + c

(7.2.8)

iii) y = B( x a) A + c

(7.2.9)

En estos casos, tras la oportuna representacin grfica que indique la viabilidad inicial del modelo, el ajuste directo con mnimos cuadrados de la

413

CLCULO NUMRICO Y ESTADSTICA APLICADA

tabla {(xi, yi)} lleva a un sistema no lineal en los parmetros y, aunque existen
tcnicas rigurosas de minimizacin, stas requieren el uso de computacin
avanzada. En muchas ocasiones puede resultar suficiente proceder de una
manera aproximada y se va a mostrar en cada caso una posible ruta elemental de ataque.
i) y = beax + c
Es fcil ver que si se conociera c la ecuacin podra transformarse en
lineal sin ms que hacer

y c = be ax Y = ln( y c), X = x ln( y c) = ln b + ax; ( y > c)

(7.2.10)

y aplicar aqu mnimos cuadrados para obtener a y b.


Ahora bien, si la relacin lineal propuesta tiene finalmente sentido para el
problema, algo que debe comprobarse a posteriori, entonces los puntos tabulares deben verificarla. En particular esto debe sucederles a los puntos extremos (x0, y0) y (xM, yM) y tambin a un tercero, convencionalmente aquel en la
mitad del intervalo de definicin
xI =

x0 + xM
, yI valor interpolado en la tabla para xI
2

(7.2.11)

Estos tres puntos deben ser tales que


y0 c = be

ax0

yM c = be
yI c = be

axI

axM

= be

(7.2.12)

a ( x0 + xM )/ 2

De (7.2.12) es inmediato obtener una estimacin para el parmetro c


( y0 c)( yM c) = ( yI c)2 c =

y0 yM yI2
y0 + yM 2 yI

(7.2.13)

Este valor de c puede utilizarse en (7.2.10) para realizar el ajuste lineal de


mnimos cuadrados all expresado y calcular a y b. Una alternativa al procedimiento anterior es utilizar como puntos extremos (x0, y0) y (xM, yM), que se
leen del grfico de una curva razonablemente trazada y que estn en las cercanas de (x0, y0) y (xM, yM) y/o se toma como valor yI el ledo en tal grfica para

414

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

el valor intermedio xI. Una vez realizados estos clculos hay que comprobar la
bondad del ajuste y determinar si al menos para efectos prcticos ste es
vlido (proximidad entre estimaciones y datos de entrada). En este sentido,
cualquier mejora en la estimacin del valor clave yI es siempre deseable.
ii) y = bxa + c
De nuevo, si se conociera c el problema de determinar a y b podra
hacerse mediante mnimos cuadrados utilizando
ln( y c) = ln b + a ln x; ( y > c, x > 0 )

(7.2.14)

La estrategia general es la misma que antes, pero ahora utilizando los tres
puntos en teora alineados siguientes (ln x0, ln(y0 c)), (ln xM, ln(yM c)),
(ln xI, ln(yI c)),en donde el punto intermedio est ahora definido como
ln xI =

ln x0 + ln xM
xI = x0 xM
2

(7.2.15)

con yI interpolado en la tabla para la abscisa anterior xI. Se tienen as las


relaciones
y0 c = bx0a
a
yM c = bxM

yI c = b

x0 xM

(7.2.16)
a

Procediendo como antes se obtiene para el parmetro c la misma relacin formal ya escrita
c=

y0 yM y2I
y0 + yM 2 yI

(7.2.17)

(comparada con (7.2.13) difiere en las coordenadas del punto intermedio (xI,
yI)). Las mismas observaciones operativas finales hechas en i) son de aplicacin aqu.
iii) y = B(x a)A + c
Este es un problema de cuatro parmetros y por tanto ms complicado.
Si a y c fueran conocidos, entonces el problema de determinar A y B sera

415

CLCULO NUMRICO Y ESTADSTICA APLICADA

formalmente equivalente a ii). Para llegar a ese punto hay que hacer un
enfoque ligeramente diferente.
Primero, ntese que la derivada de la funcin emprica propuesta permite
eliminar el parmetro c
z=

dy
= BA( x a) A 1
dx

(7.2.18)

y la reduccin a una lnea recta se logra con


ln z = ln( BA) + ( A 1) ln( x a);

( x > a; z > 0 )

(7.2.19)

representando ln z frente a ln(x a). El problema es ahora doble: por un


lado, z es una derivada y sus valores tienen que ser estimados a partir de los
datos tabulares de entrada; por el otro, a es desconocida y aparece dentro del
logaritmo neperiano de una diferencia. La primera dificultad se puede abordar utilizando los elaborados mtodos de derivacin numrica del Cap. 3, o
utilizando alternativas ms sencillas. La segunda puede tratarse visualizando el problema de forma inversa para determinar el punto intermedio (xI, zI).
Se considera cada una de ellas a continuacin.
La determinacin de los valores de z se va a realizar de forma aproximada
calculando los cocientes de incrementos Dy/Dx en los puntos medios xi de cada
subintervalo (i, i + 1) tabular, xi = (xi+1 + xi)/2, y se tienen las estimaciones
zi

y yi +1 yi
=
; i = 0,1, 2,..., M 1
x xi +1 xi

(7.2.20)

Con ello hay que rescribir (7.2.18) como una nueva funcin de la variable x
z BA ( x a

A 1

(7.2.21)

funcin que est definida en los M puntos (xi, zi).


La eleccin de (xI, zI), o ms propiamente de (xI, zI), procede al revs de lo
visto anteriormente, en consonancia con el hecho de que (7.2.21) es anloga
al tipo (7.2.8) sin ms que plantearla en la forma equivalente
1

1 A 1 1/ ( A 1)
+a
x
z
BA

416

(7.2.22)

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

As, se fija el valor intermedio zI como


zI = z0 zM 1
y se interpola (o lee del grfico) el valor correspondiente de xI (como antes
los valores extremos pudieran leerse del grfico, etc.).
Con todo ello se tienen las relaciones

(
BA ( x
BA ( x

z0 BA x0 a
zM 1
zI

M 1
I

A 1

A 1

A 1

A 1

(7.2.23)

De aqu se obtiene

z0 zM 1 zI2 = ( BA)2 ( x0 a)( xM 1 a)

( xI a)2

A 1

= 0

(7.2.24)

resultando la expresin para evaluar el parmetro a


a=

x0 xM 1 xI2
x0 + xM 1 2 xI

(7.2.25)

Con este valor se puede trabajar la relacin (7.2.21) como


ln z = ln( BA) + ( A 1) ln( x a);

( x > a, z > 0)

(7.2.26)

y obtener los parmetros A y B por mnimos cuadrados.


Queda finalmente la estimacin de c que puede hacerse utilizando las
diferencias
ci = yi B( xi a) A , i = 0,1, 2, 3,..., M
(7.2.27)
y calculando el valor medio de todas ellas
c=

1
M +1

( y B( x a) )
A

(7.2.28)

i=0

Como en los dos casos anteriores hay que verificar la bondad del ajuste
as obtenido, lo que puede llevar a tener que afinar las estimaciones de las
derivadas y del punto intermedio. Es recomendable pretar atencin a los signos (+ , ) que vayan obtenindose durante el clculo.

417

CLCULO NUMRICO Y ESTADSTICA APLICADA

Todava se pueden afinar an ms los ajustes anteriores con tratamientos


adicionales de mnimos cuadrados, como es el aadir a las dependencias
funcionales propuestas funciones extra que tengan sentido para el problema,
pero no se van a considerar en este texto.
EJERCICIO 7.2.2
Representar esquemticamente el comportamiento general de las relaciones
funcionales
a) y = bxa , 0 < a < 1, b > 0, x > 0
b) y = B( x a) A + c, B > 0, A < 0, a > 0, c > 0, x > a
Las grficas se dan en la Fig. 7T2.

Figura 7T2.

7.3. El coeficiente de correlacin de dos variables


Correlacin de poblaciones
En el Cap. 5 se discuti someramente el concepto de covarianza entre dos
variables aleatorias X e Y, y se estableci su definicin como la siguiente
magnitud independiente del origen tomado para cada variable
Cov( X , Y ) =

418

(X

)(Y Y )

= XY X Y

(7.3.1)

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

A partir de esta definicin es directo interpretar que si las dos variables


tuviesen algn tipo de asociacin (o correlacin), el valor numrico de la
covarianza sera en valor absoluto mayor que si no la tuvieran (el caso lmite es el de variables independientes para las que Cov = 0). De hecho, el valor
absoluto de la covarianza va a resultar tanto mayor cuanto mayor sea el grado de asociacin entre ambas variables (el nombre covarianza sugiere la idea
de variacin conjunta). Si cuando X crece (decrece) Y tambin crece (decrece), entonces Cov(X, Y) tender a ser un nmero grande y positivo. Se dice
as que la correlacin es positiva. Si los comportamientos de X e Y son
opuestos, Cov(X, Y) tender a ser un nmero grande y negativo, dicindose
que la correlacin es negativa. Estas dos situaciones despliegan un abanico
de posibilidades muy grande, todas contenidas entre los valores positivosnegativos que puede tomar Cov(X, Y) y dando cada uno de estos valores una
medida del grado de correlacin entre X e Y. Como siempre, hay que insistir
en las salvedades ya mencionadas, como la de que Cov(X, Y) = 0 no implica
necesariamente independencia, sino slo que no hay correlacin.
Una dificultad que presenta la definicin (7.3.1) para su uso generalizado
surge cuando se quieren comparar diferentes asociaciones entre pares arbitrarios de variables aleatorias, (X1, Y1), (X2, Y2), , (Xn, Yn). As, y todo lo que
sigue en valor absoluto, las covarianzas de las parejas de variables que tengan valores (xi, yi) ms grandes van a resultar tambin mayores que las
covarianzas de aquellas parejas de variables con valores (xi, yi) ms pequeos. En estas condiciones cualquier comparacin entre los diferentes grados
de asociacin va a carecer de significado por un problema de escala en los
diferentes datos. Es por ello que se define como medida de la correlacin
entre dos variables X e Y una magnitud r normalizada o estandardizada
con las respectivas desviaciones estndar sX y sY en la forma

= (X,Y ) =

Cov( X , Y )
; 1 +1; X 0, Y 0
X Y

(7.3.2)

y que se denomina coeficiente de correlacin entre X e Y. Ntese que, en


particular, r (X, X) = 1 y que, adems, esta definicin hace de r un nmero
adimensional. Evidentemente, r = 0 indica que no hay correlacin. Cuando
r = +1 se tiene la asociacin o correlacin positiva perfecta entre las dos
variables, y cuando r = 1 se tiene la asociacin o correlacin negativa perfecta entre las dos variables. En estos dos ltimos casos, r = 1, la masa total
de la distribucin bidimensional f(x, y) est concentrada a lo largo de una

419

CLCULO NUMRICO Y ESTADSTICA APLICADA

recta en el plano XY. Este es un resultado crucial, pues de hecho r = 1 es la


condicin necesaria y suficiente para que la distribucin est en una lnea recta, y as contiene la clave de las muchas aplicaciones que se hacen de este
parmetro, al que se le suele calificar como de correlacin lineal por razones
obvias. Hay que sealar, no obstante, que no todas la aplicaciones que se
hacen con este concepto estn siempre completamente justificadas como se
ver ms adelante.
EJERCICIO 7.3.1
Probar la propiedad 1 r +1.
La demostracin puede hacerse considerando la cantidad no negativa
Y2 ( X X ) Cov( X , Y )(Y Y )

en donde se han utilizado X = mX, Y = mY. Desarrollando la expresin


anterior se llega a

4 ( X )2 + ( Cov( X , Y ) 2 (Y )2 2 2 Cov( X , Y )( X )(Y ) =


X
Y
Y
X
Y

Y4 ( X X )2 + ( Cov( X , Y )) (Y Y )2 2 Y2 Cov( X , Y ) ( X X )(Y Y ) =


2

Y4 2X + Y2 ( Cov( X , Y )) 2 Y2 ( Cov( X , Y )) 0
2

de donde se obtiene la relacin pedida

( Cov( X , Y ))

( Cov( X , Y ))
=


2
Y

2
X

Y2 2X

1 1 +1

Correlacin lineal en muestras bivariantes


El concepto anterior de correlacin puede aplicarse muy ventajosamente a la caracterizacin de muestras resultantes de experimentos bivariantes.
A continuacin va a tratarse con detalle el caso discreto que es el que aparece
generalmente en la prctica experimental, notando que las ecuaciones para
el caso de variables continuas son formalmente anlogas (remplazando

420

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

sumas por integrales sobre la funcin densidad conjunta, siguiendo el mtodo expuesto en el Cap. 2 pero aqu con dos variables). Para una coleccin de
N datos {(xi, yi)} se define el denominado coeficiente de correlacin lineal a
travs de una discretizacin adecuada de (7.3.2) como la frmula productomomento
N

( x x )( y y )
i

r=

i =1

; 1 r +1

(7.3.3)

( x x) ( y y)
2

i =1

i =1

en donde se utilizan las medias muestrales de cada variable con la notacin

ms habitual en este contexto: X = x e Y = y. La expresin anterior es un estimador muestral consistente de r y conserva sus propiedades. Puede observarse en (7.3.3) la simetra total en el tratamiento de las dos variables. Hay
que notar, por otra parte, que si se quiere mantener la estimacin de las s 2
mediante la cantidad insesgada s2 habra que definir la covarianza discreta
del numerador con un factor correspondiente igual a 1/(N 1). Convencionalmente, sin embargo, se opta por utilizar el estimador sesgado s2 y definir
esta covarianza discreta como un promedio normal sobre N datos. A la cantidad r2 se la suele denominar coeficiente de determinacin.
Al igual que se encontraba con r el coeficiente r es independiente del origen, de las unidades, y adimensional. Adems, conviene sealar las siguientes propiedades generales.
i) Si r = +1, existe una correlacin lineal perfecta y positiva, y = ax + b
(a > 0), entre los datos de la muestra.
ii) Si r = 1, existe una correlacin lineal perfecta y negativa, y = ax + b
(a < 0), entre los datos de la muestra.
iii) En los dos casos anteriores, i) y ii), tambin existen rectas de ajuste
perfectas con los papeles de las variables intercambiados x y y que, en realidad, son rectas idnticas a las originales (por ejemplo, en el caso i) se tendra tambin la recta x = a1(y b)). Este resultado parece trivial, pero no lo
es tanto como se va a ver despus.
iv) Si r 1, entonces se dice que existe una acusada o fuerte correlacin
lineal entre las variables para los datos muestrales suministrados. Adems

421

CLCULO NUMRICO Y ESTADSTICA APLICADA

hay que estar precavido contra valores altos de r que pudieran no tener significado alguno.
v) Cuanto ms apartado est r de 1 menor ser la asociacin lineal
entre X e Y, y de hecho hay que estudiar con algn detalle la situacin para
poder rechazar la hiptesis de correlacin lineal, si bien este es un problema
complicado. En particular, si r = 0, se va tener un diagrama de puntos con
una dispersin muy grande y se puede descartar completamente la existencia
de correlacin en la muestra.
vi) Para evitar la subjetividad en el trazado grfico de las rectas de regresin que ajusten el conjunto de puntos muestrales se utiliza generalmente el
mtodo de mnimos cuadrados para obtener stas (Fig. 7T3).

Figura 7T3. El principio de mnimos cuadrados para ajustar una recta a una coleccin de puntos:
hacer mnima la suma de los cuadrados de las desviaciones de los puntos a la recta.

vii) Cuando r 1 se presentan dos lneas de regresin diferentes conocidas como de regresin de y sobre x y = ax + b, y de regresin de
x sobre y x = ay + b (Fig. 7T.4). En el primer caso se toma como variable
independiente X en tanto que en el segundo se toma como variable independiente Y. Para un mismo conjunto de N datos con r 1 las dos rectas
mencionadas se cortan en el punto (x, y), el centro de masa (centroide) de la
distribucin, y el ngulo a que forman ambas est comprendido entre

422

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

0 a p/2, siendo a tanto ms pequeo cuanto ms prximo est r a 1, y


ms cercano a p/2 cuanto ms prximo est r a 0. Recurdese que para dos
rectas cualesquiera de pendientes m1 y m2 el ngulo que forman puede
determinarse a partir de su tangente dada por tan a = (m1 m2)/(1 + m1m2).

Figura 7T4. Rectas de regresin y sobre x y = ax + b y de x sobre y y = ay + b, y relacin


de los dos coeficientes a y a con el coeficiente de correlacin lineal r. (xM, yM) = (x, y) = centroide
de la distribucin de puntos (no mostrados).

EJERCICIO 7.3.2
Escribir los sistemas normales de las rectas de regresin y sobre x y
x sobre y para una muestra de N puntos {(xi, yi)} as como las ecuaciones
para determinar los coeficientes respectivos.
Las ecuaciones normales pedidas se obtienen siguiendo el procedimiento expuesto en el Cap. 1. Ambas son formalmente idnticas sin ms que
cambiar x por y. Se tienen as
y sobre x
yi = a xi + Nb
i
i
y = ax + b
2
xi yi = a xi + b xi
i
i
i

(7.3.4)

423

CLCULO NUMRICO Y ESTADSTICA APLICADA

a=

N xi yi xi yi
i i
i
N
i

xi2

xi
i

b=

2
yi xi xi xi yi
i
i
i
i
N
i

xi2

xi
i

(7.3.5)

y sobre x
xi = a yi + Nb
i
i
x = a y + b
2
xi yi = a yi + b yi
i
i
i

a =

N xi yi xi yi

i
i
i

N yi2 yi
i
i

b =

(7.3.6)

2
xi yi yi xi yi
i
i
i
i

N yi2 yi
i
i

(7.3.7)

Ejercicio 7.3.3
Dada una distribucin de probabilidad bidimensional con densidad normalizada f(x, y) encontrar el sistema normal de ecuaciones para la recta de
mnimos cuadrados y = ax + b que mejor la ajusta.
Este es el caso continuo bidimensional y la recta se obtiene minimizando
la funcin
S=

( y ax b) f ( x, y) dxdy
2

Utilizando derivacin parcial con respecto a los coeficientes


S
= 0 2
a

S
= 0 2
b

424

( y ax b) xf ( x, y) dxdy = 0
( y ax b) f ( x, y) dxdy = 0

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

lo que conduce al sistema de ecuaciones


`

xy f ( x, y dxdy =a

y f ( x, y dxdy =a

x2 f ( x, y dxdy + b

x f ( x, y dxdy + b

x f ( x, y dxdy

f ( x, y dxdy

del que pueden obtenerse los coeficientes a y b. Las analogas de este sistema
lineal con el dado en (7.3.4) son claras.

El coeficiente r como estimador estadstico


El coeficiente de correlacin lineal r (7.3.3) es una herramienta muy utilizada para identificar agrupaciones lineales de datos {(xi, yi)} cuando r 1.
A pesar de ello, r es un estadstico bastante pobre para decidir sobre la significacin de las correlaciones observadas en muestras, o para compararlas
entre s. Esto es as debido a que en (7.3.3) no est incluida ninguna informacin relativa a las distribuciones de probabilidad individuales f(x) y g(y).
Hay, sin embargo, dos casos interesantes en los que r puede ser empleado
con fiabilidad.
1) Uno de estos casos favorables es el de la verificacin de la hiptesis de
que no existe correlacin, r = 0 entre las dos variables. Se plantea aqu el
ensayo para los N datos {(xi, yi)}
H0 : r = 0, no hay correlacin en la muestra
H1 : r 0, existe correlacin en la muestra
y se exigen las dos condiciones siguientes
a) N > 20.
b) f(x) y g(y) decaen con suficiente rapidez al tender x, y (ambas
distribuciones tienen suficientes momentos de orden superior convergentes).
En estas condiciones r se distribuye aproximadamente de forma normal con media nula y desviacin tpica N1/2, (r = 0, sr = N1/2), y el ensayo se
realiza como en el caso Gaussiano estudiado en el Cap. 6. Ntese que en un
test a dos colas, si el nivel de significacin dado por la probabilidad

425

CLCULO NUMRICO Y ESTADSTICA APLICADA

= p r > rcalculado = erfc v = r

N
2

2
=

`
v

( )

exp u2 du

(7.3.8)

toma un valor pequeo, va a indicar una correlacin significativa entre los


valores de X e Y de la muestra (erfc es la funcin complementaria de error
definida en el Cap. 5).
2) El segundo caso es aquel en el que la distribucin poblacional conjunta XY es en s misma, o aproximadamente, una Gaussiana bidimensional

1
f ( x, y) = Cte exp A11 x2 2 A12 xy + A22 y2

(7.3.9)

en donde A11, A12 y A22 son constantes, y para la que se verifica exactamente
que el coeficiente de correlacin est dado por

A12
A11 A22

; 1 < < +1

(7.3.10)

Cuando r 1 la masa de esta distribucin bidimensional tiende a


concentrarse en torno a una lnea recta en forma de elipses equiprobables
alargadas y estrechas. Los casos r = 1 se corresponden con las consabidas
rectas de correlacin perfectas, pero se omiten de lo anterior por simplicidad
de presentacin, pues su discusin pasa por la consideracin de situaciones
matemticas singulares (d de Dirac). Por otra parte, dos variables distribuidas segn (7.3.9) son independientes si y slo s r = 0. A partir de aqu se
pueden abordar situaciones en las que r muestra su utilidad. A continuacin
se consideran tres de estas interesantes aplicaciones.
i) Como primera aplicacin, con un nmero N pequeo de datos {(xi, yi)} la
hiptesis nula de ausencia de correlacin, H0 : r = 0, puede docimarse con un
estadstico t de Student para n = N 2 grados de libertad y que se calcula como

t ( = N 2 = r

N2
1 r2

(7.3.11)

de manera que si para el nivel de significacin a (a dos colas) fijado se tiene


t(N 2) > tC1a /2, entonces se puede rechazar H0 : r = 0 y admitir H1 : r 0
como cierta. Este es un test que puede utilizarse con tamaos N crecientes,
ya que sus resultados tienden asintticamente a los ligados a (7.3.8).

426

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

ii) Como segunda aplicacin, con un nmero moderado de datos, pero


N 10, se pueden docimar hiptesis de comparacin entre dos coeficientes
de correlacin no nulos r1 y r2 obtenidos con muestras diferentes. Se utiliza
aqu un cambio de variable, conocido como la transformacin z de Fisher,
que define una variable z aproximadamente Gaussiana mediante
z=

1 1+ r
ln
= arc tanh r = tanh 1 r ;
2 1 r

r = tanh z

(7.3.12)

en donde arc tanh r = arco cuya tangente hiperblica es r y se recuerda al lector las posibles notaciones para las magnitudes trigonomtricas inversas
que pueden encontrarse en la literatura cientfica (tanh1 es la funcin inversa de tanh, no el inverso de la funcin tanh : tanh1 1/tanh). Aqu va a utilizarse la notacin tanh1 que, por brevedad es la comnmente utilizada en
este contexto. La media y la varianza de z vienen dadas por

z = z =

1 1+

1
2
+
ln
; z

2 1 N 1
N3

(7.3.13)

en donde es de notar que s z2 viene dada aproximadamente por un valor


independiente de r. La variable Gaussiana tipificada (media nula, varianza
unidad) se construye en este caso como
zF =

z z

= tanh 1 r z

N3

(7.3.14)

y la docimasia de hiptesis se efecta como en el Cap. 6. En muchas aplicaciones se suele despreciar el trmino r/(N 1) para operar con mZ (valores
suficientemente grandes de N por ejemplo).
EJERCICIO 7.3.4
Probar la relacin (7.3.12).
La relacin implica
1+ r
exp(2
2z) 1
(1 r ) exp(2 z) = (1 + r ) r =
2 z = ln

exp(2z) + 1
1 r

427

CLCULO NUMRICO Y ESTADSTICA APLICADA

de donde es inmediato escribir


r=

exp( z) exp( z)
=
exp( z) + exp( z)

exp( z) exp( z) 2 senh z


=
= tanh z z = tanh 1 r
exp( z) + exp( z) 2 cosh z

EJERCICIO 7.3.5
Plantear utilizando la z de Fisher un ensayo de hiptesis para investigar si
dos coeficientes de correlacin, r1 y r2, uno para cada una de dos muestras independientes {(xi, yi)} de gran tamao, N1 y N2, difieren significativamente a un
nivel de significacin a bilateral.
Las hiptesis a analizar son
H0 : 1 = 2
H1 : 1 2
El anlisis conviene hacerlo con la variable combinacin de las z de Fisher z1 y z2 siguiente (z1 z2), que bajo H0 va a ser Gaussiana con media nula y
varianza suma de varianzas (Cap. 5)
z1 = tanh1 r1 (N1 datos);
z1 z2 = 0;

z2 = tanh1 r2 (N2 datos)

z2 z = z2 + z2
1

1
1
+
N1 3 N2 3

(7.3.15)

A continuacin hay que docimar bilateralmente (r1 < r2 r1 > r2) calculando
zF =

z1 z2 z1 z2

z z
1

z1 z2

z z
1

(7.3.16)

y comparando con el valor crtico extrado de la Gaussiana tipificada zC1a /2


Si zF < zC1a /2, H0 no puede rechazarse al nivel a,
Si zF > zC1a /2, H0 debe rechazarse y aceptar H1 al nivel a.
iii) Como tercera aplicacin, la determinacin de los lmites de confianza para r(N 10) se puede hacer siguiendo la tcnica general discutida en el

428

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

Cap. 6. Como zF es aproximadamente normal con media nula y varianza unidad, ste se trata de un ejercicio conceptualmente simple pero en el que conviene proceder con cuidado debido al uso de la funcin trigonomtrica
inversa tanh1. El siguiente ejercicio muestra los pasos a dar en un caso
tpico.
EJERCICIO 7.3.6
Determinar los lmites de confianza del 99% para un coeficiente de correlacin calculado con una muestra bidimensional grande extrada de una distribucin normal.
En este caso se tiene la relacin Gaussiana de probabilidad-intervalo

z z
p 2, 58 <
< 2, 58 = 0, 99
z

o equivalentemente, despreciando r/(N 1), se tiene

2, 58
2, 58
p tanh 1 r
< tanh 1 < tanh 1 r +
= 0, 99

N3
N3
que puede reconvertirse en un intervalo para r notando que las funciones
tanh y tanh1 son montonas crecientes y por tanto se encuentra (r 1)
2, 58

exp(2u) 1
exp(2 v) 1
N3
1
= 0, 99
<<
p(u < tanh < v) = p
exp(2 v ) + 1
exp(2u) + 1
2, 58

1
v = tanh r +
N 3

u = tanh 1 r

Antes de pasar a considerar algunos detalles prcticos importantes en el


estudio de la regresin lineal hay que insistir en que los resultados anteriores, i), ii), y iii), estn limitados a una poblacin Gaussiana bivariante, exacta o suficientemente aproximada a ella. Por tanto, su valor ser tanto menor
cuanto ms separada del comportamiento Gaussiano est la poblacin de la
que se extrae la muestra {(xi, yi)}. En el lmite de separaciones muy grandes la
discusin anterior no puede aplicarse y los resultados que se obtendran
careceran de sentido.

429

CLCULO NUMRICO Y ESTADSTICA APLICADA

7.4. Aspectos prcticos de la regresin lineal por mnimos cuadrados


Dada la importancia general en la prctica de la regresin lineal por
mnimos cuadrados el nmero de cuestiones que pueden estudiarse en conexin con ella es muy elevado. Como no es posible aqu tratarlas todas ellas
van a considerarse slo algunos de los resultados centrales, as como las frmulas simples ms utilizadas. En lo que sigue y cuando no se preste a error
las sumatorias se entiende que van sobre el nmero total de puntos, numerados desde i = 1 hasta N inclusive, y se expresar solamente el ndice de
sumacin i.
i) La primera cuestin es la del punto de interseccin de las dos rectas de
regresin que se pueden definir para estos problemas cuando r 1 y las
simplificaciones que pueden obtenerse utilizndolo.
Ya se ha mencionado que este punto (x, y) es el centro de masa o centroide de la distribucin de N puntos {(xi, yi)}
x=

xi
i

; y=

yi
i

(7.4.1)

Esto es muy sencillo de comprobar viendo que (x, y) verifica las ecuaciones de ambas rectas de regresin. Basta dividir la primera ecuacin normal en cada caso, (7.3.4) y (7.3.6), por N
1

yi = a xi + Nb N yi =
i

xi = a yi + Nb N xi =
i

a
x + b y = ax + b
N i i

(7.4.2)

a
y + b x = a y + b
N i i

(7.4.3)

Este resultado puede utilizarse para simplificar los clculos de mnimos


cuadrados pues ayuda a eliminar una de las dos ecuaciones del sistema
normal. Por ejemplo, utilizando (7.4.2) la recta de regresin de y sobre x se
puede escribir como
y = ax + b y = a(x x)
(7.4.4)
con lo que slo hay que determinar por minimizacin el parmetro a utilizando la tabla de valores de entrada una vez transformados {(ui, vi)} = {(xi x,

430

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

yi y)}. Puede procederse ahora a expresar el sistema normal en las nuevas


variables, u = x x y v = y y, o a minimizar la siguiente suma de los cuadrados de las desviaciones
S=

(( y y ) a( x x )) = ( v au )
2

(7.4.5)

obteniendo para la nueva recta v = au


S
= 2
a

ui vi

( v au ) u = 0 a =
i

ui2

( xi x ) ( yi y )
i

( xi x )

(7.4.6)

Ntese que b = y ax. Resultados anlogos se obtienen para la recta x


sobre y x = ay + b. A sealar aqu la conexin (7.3.3).
ii) La segunda cuestin tiene que ver con los errores en los parmetros
de la recta de regresin. Por simplicidad van a considerarse nicamente las
expresiones habituales que se utilizan para la recta y sobre x (un intercambio de papeles x y en las frmulas siguientes permite obtener directamente las de la recta x sobre y). Tambin se va suponer que los errores en
los valores xi son inexistentes y que slo los valores yi estn afectados de
error. Este error se considerar distribuido igualmente para todos ellos,
siguiendo una distribucin Gaussiana con media nula y varianza s 2 y siendo
adems independiente del valor xi asociado. Ms adelante (Cap. 10) se estudiar como tratar con el caso en el que cada yi venga afectado de diferentes s
(suavizacin c 2). Todas estas operaciones son de gran importancia en la
calibracin de aparatos y tcnicas de anlisis experimentales.
Para una tabla de N datos {(xi, yi)} y con regresin y = ax + b se define el
error aleatorio tpico de la estima (valores y) como la magnitud positiva

( yi yi, est. )

sY / X =

N2

yi2 a xi yi b yi
i

N2

(7.4.7)

expresin en la que yi,est. = axi + b y en la que se consideran dos grados de


libertad eliminados por la determinacin de los dos parmetros a y b. En
algunas fuentes bibliogrficas se define (7.4.7) con el factor en el denominador igual a N lo que coincide con el error RMS definido en Cap. 1. Por ello

431

CLCULO NUMRICO Y ESTADSTICA APLICADA

al comparar frmulas y resultados hay que estar atento a cmo se han calculado. Haciendo uso de sY/X se definen dentro de este contexto los errores
estndar en los parmetros de la recta de regresin como
sa =

sY / X

(
i

sb = sY / X

xi x

1
x2
+
N x x
i
i

= error estndar en la pendieente

(7.4.8)

= error estndar en la ordenada en el origen (7.4.9)

iii) Estrechamente ligado con lo anterior estn los intervalos de confianza


de los parmetros a y b. Utilizando la distribucin t de Student con n = N 2
grados de libertad estos lmites se establecen siguiendo el procedimiento ya
conocido. Para un nivel de confianza del 100(1 a)% se tienen los intervalos
a sa t1C / 2 ( = N 2);

b sb t1C / 2 ( = N 2)

(7.4.10)

Si se supiera, por argumentaciones tericas, que debe ser b 0 entonces


hay que utilizar n = N 1 grados de libertad. Se tomaran entonces en
0.
(7.4.8): sY/X con N 1, y x
iv) La siguiente observacin tiene que ver con el coeficiente de correlacin lineal r. Primero hay que notar que la variacin total en una correlacin
lineal, definida como la suma de los cuadrados de las desviaciones con respecto a la media (yi y)2, puede expresarse como la suma

( y y)
i

(y

i , est.

) + ( y y )
2

(7.4.11)

i , est.

en la que el primer sumando de la derecha se define como la variacin


explicada y el segundo como la variacin no explicada. Se puede escribir
entonces que el coeficiente de correlacin es

r=

variacin explicada
=
variacin total

( y y)
( y y)
i

432

i , est.

(7.4.12)

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

Esta definicin es consistente con todo lo dicho hasta ahora y da una


visin alternativa y poderosa de r. De hecho, omitiendo los signos en
(7.4.12), se tiene en ella una expresin vlida para definir un coeficiente de
correlacin en situaciones no lineales, como por ejemplo aquellas en las
que las estimas vienen dadas por un ajuste polinmico yi,est. = axni + bxin1 +
cxin2 +...+ m.
Tambin es de inters fijarse en que para el par de rectas de regresin de
un mismo problema, y = ax + b y x = ay + b, el coeficiente de correlacin
lineal r (el mismo para ambas) resulta ser
r2 = aa

(7.4.13)

un resultado que puede conectarse con lo sealado para el ngulo que forman ambas rectas en el epgrafe (7.3).
v) Finalmente, ya se ha mencionado que un valor alto de un coeficiente
de correlacin lineal no es necesariamente un buen indicador de correlacin
lineal y suele ser una buena prctica analizar el comportamiento de los
denominados residuos, yi yi,est., observando regularidades o irregularidades
en sus signos. Estos residuos son las componentes de la variacin no explicada en la regresin, y lo normal en una correlacin lineal sera observar una
distribucin de signos + y al azar, con los puntos tabulares repartidos
uniformemente a ambos lados de la recta. Sin embargo, si al ajustar una
relacin lineal (que incluso puede tener un buen coeficiente de correlacin)
se observa una secuencia de signos en los residuos consecutivos como, por
ejemplo,
, , , , +, +, +, +, +, , , , ,
entonces hay que pensar que el ajuste no es significativo y que una funcin
no lineal va a ser probablemente mejor. Esto requiere de la existencia de suficientes puntos en el ajuste para poder evaluar cuantitativamente con fiabilidad este problema. Hay tcnicas elaboradas en este contexto (test de WaldWolfowitz), pero aqu como ilustracin prctica sencilla de esta discusin se
tratar un poco ms adelante con el denominado test del signo al hablar de
la estadstica no paramtrica. Relacionado con este asunto est el de los
puntos fuera de rango y que deberan desecharse en un ajuste de mnimos
cuadrados por ser no significativos. Tales puntos, al estar tratados con el
mismo peso que los dems, distorsionan el ajuste, algo que a ser posible
debera evitarse.

433

CLCULO NUMRICO Y ESTADSTICA APLICADA

EJERCICIO 7.4.1
Decidir razonadamente si las parejas de rectas siguientes son compatibles
con clculos de regresin y sobre x y x sobre y de mnimos cuadrados y, en
su caso, determinar el centroide de la distribucin de puntos.
a) y = 2 x + 1

x = y / 2+ 7

b) y = 3 x 10

x = 6y + 8

c) y = 2 x / 3 + 5

x = 2y / 5 3

a) Se trata de dos rectas paralelas y no corresponden a un clculo de


regresin de mnimos cuadrados.
b) Aplicando (7.4.13) se tiene aa = 3.6 = 18 > 1. Como en un problema de
regresin por mnimos cuadrados r2 = aa 1, estas dos rectas no estn
relacionadas con este tipo de clculos.
2 2 4
=
1.
3 5 15
Por tanto, es cierto que estas rectas pueden corresponder a un clculo de
c) En este caso, aplicando de nuevo (7.4.13) se tiene aa =

regresin con coeficiente de correlacin lineal positivo r = +2 / 15 , pues


las dos variables crecen a la vez. En este caso se cortan ambas rectas en el
centro de masa de la distribucin, el centroide con coordenadas
45
, .
( x, y ) = 15
11 11

7.5. Desestimacin de puntos en el anlisis de datos


Al analizar una muestra monodimensional o multidimensional puede
suceder que uno o varios de los puntos de que consta se aparte notablemente
de la tendencia general que siguen los dems. El anlisis de tales muestras
posee un elemento de incertidumbre derivado de la presencia de dichos
puntos extraos o fuera de rango (outliers) y que pueden desvirtuar los
resultados o conclusiones que se extraigan. Cuando los puntos de la muestra
o sus propiedades obedecen a distribuciones conocidas se pueden utilizar
criterios claros que permitan identificarlos como no genuinos y descartarlos,

434

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

reevalundolos o no, para proseguir con el estudio. Ejemplos ya vistos de


estos procedimientos son los lmites 3s en distribuciones Gaussianas y los
ensayos de hiptesis estadsticas. Una forma alternativa de tratar con este
problema es la de dar a estos puntos extraos un peso menor en el anlisis,
en una forma similar a la que se mostrar en el ajuste c 2 de datos (10.3) pero
utilizando un grado de elaboracin an mayor (tcnicas robustas). Es fcil
entender que la casustica en este terreno es muy amplia y aqu slo se van a
considerar unas sencillas aplicaciones que complementen lo visto anteriormente: el test de los cuartiles extendidos para muestras unidimensionales y
dos tests de distancias para datos de una regresin lineal bidimensional. De
alguna manera se volver sobre este asunto al tratar la estadstica no paramtrica en el epgrafe 7.7. Se remite al lector a referencias especializadas
para otras tcnicas y ms detalles.

Test de cuartiles con extensin (box-and-whisker plot)


Este es un test para muestras {xi} de los denominados robustos, pues est
basado en la determinacin de los tres cuartiles de la muestra, magnitudes
cuyas posiciones son bastante insensibles a los valores particulares xi. El proceso se esquematiza a continuacin.
Primero se fijan las posiciones de los cuartiles z1(25%), Med(x) = z2(50%),
y z3(75%), como se indic en el Cap.6 (6.2). Hecho esto se calcula el rango
intercuartlico z3 z1 y se identifican los puntos fuera de rango x* (a descartar) como aquellos apartados del cuerpo de la distribucin para los que

(
(

)
)

< 1 1, 5 3 1
x* = xj
> 3 + 1, 5 3 1

(7.5.1)

en donde el valor 1,5 es el comnmente aceptado en este contexto. Este es un


criterio til cuando el nmero de datos es suficientemente grande y, por otra
parte, puede tomar otras elecciones diferentes del factor 1,5.
Ntese que una sencilla representacin grfica de la distribucin en la
que figuren los valores: mximo, mnimo, y los tres cuartiles, ya da una
buena idea global de sus caractersticas (simetra, anchura, etc.), algo que
puede utilizarse muy ventajosamente para comparar dos distribuciones con
muy poco esfuerzo.

435

CLCULO NUMRICO Y ESTADSTICA APLICADA

Tests de distancias
Para el anlisis de los N datos {(xi, yi)} que intervienen en un clculo de
regresin lineal el mtodo ms sencillo de identificacin de puntos fuera de
rango es posiblemente el que utiliza un criterio de separacin para el residuo
de la forma
( xj , y j ) * si y j yj , est. > cte sY / X ; cte = 2 o 3

(7.5.2)

Esto obliga a haber realizado primero el ajuste y = ax + b para poder descartar estos puntos fuera de rango y por supuesto a recalcular despus la nueva recta de regresin libre de tales puntos.
En esta lnea un test ms elaborado es el denominado CD2 o del cuadrado
de la distancia de Cook. Para una regresin lineal y = ax + b esto se expresa a
travs de la cantidad asociada al potencial punto fuera de rango (xj, yj) que se
investiga
N

( y

)
yi(,jest
i , est.
.

CD2j =

i =1

2 sY2 / X

(7.5.3)

en donde yi,est. es el valor habitual estimado para xi con el ajuste de todos los
N datos originales
yi, est = axi + b;

N datos

(7.5.4)

j
es el valor estimado para xi con un nuevo ajuste en el que se
en tanto que yi,est.
ha suprimido el punto (xj, yj) sospechoso analizado (N 1 datos)

)
yi(,jest
= axi + b ; N 1 datos

(7.5.5)

2
se calcula con los N datos originales en la forma habitual (7.4.7). Los
y sY/X
puntos fuera de rango se identifican dentro de este criterio como aquellos
para los que se cumple

( x, y)* = ( xj , yj ) si CD2j > 1

(7.5.6)

Este es un criterio que funciona tanto mejor cuanto ms alejado del


centro de masa (x, y) se encuentre el punto fuera de rango.

436

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

7.6. Correlacin lineal mltiple


Un problema es de correlacin mltiple cuando tres o ms variables,
X1, X2, X3, , Xn, pueden ser asociadas mediante una relacin matemtica del
tipo X1 = X1(X2, X3, , Xn), ecuacin que se denomina de regresin de X1 sobre
X2, X3, , y Xn. La complejidad aadida aqu sobre la del caso bidimensional
es evidente. En particular, ntese que, adems de los coeficientes de correlacin totales (o de orden cero) entre cada dos variables rij = rji, que se definen como en (7.3.2), se pueden definir un buen nmero de diferentes coeficientes de correlacin, como por ejemplo los coeficientes de correlacin
parcial sij,k de la variable Xi con la variable Xj dejando la variable Xk constante, u otros muchos. Un caso especial es el de la correlacin lineal, en cuyo
caso la relacin funcional toma la forma de un plano en n dimensiones
(hiperplano). Incluso en esta aplicacin la amplitud de posibilidades a considerar es muy grande y hace falta una cierta soltura en el manejo de algunos
recursos matemticos ligados a las formas cuadrticas y sus propiedades.
Aunque no se puede entrar aqu en todas estas cuestiones, conviene al
menos mencionar una propiedad muy interesante para los coeficientes de
correlacin totales rij como es la siguiente acotacin del determinante simtrico que forman

11

12

13

... 1n

21

22

23 ... 2 n

0 31

32

33 ... 3 n 1

...
n1

...
n2

... ... ...


n3 ... nn

(7.6.1)

En lo que sigue se van a tratar slo los aspectos ms elementales de la


correlacin lineal, concentrando la atencin en el caso del ajuste por mnimos
cuadrados de una tabla de N puntos {(xi, yi, zi)} con tres variables X, Y y Z.
La regresin lineal de Z sobre X e Y para la tabla {(xi, yi, zi)} se expresa
como el plano
z = c + by + ax

(7.6.2)

y, aunque quiz sea innecesario, conviene sealar que esta notacin z no tiene conexin alguna ni con la variable Gaussiana estandardizada, ni con la z

437

CLCULO NUMRICO Y ESTADSTICA APLICADA

de Fisher. Como mtodo de obtencin de los parmetros se toma el de mnimos cuadrados minimizando la suma habitual
N

( z c by ax )

S=

(7.6.3)

i =1

con respecto a los parmetros a, b y c. Se obtienen as las ecuaciones normales del plano
N

S
=0
a

S
=0
b

i =1

xi + b

i =1

i i

i =1

zi =Nc + b

i =1

(7.6.4a)

yi2

x y

+a

i =1

2
i

i =1

z y = c y + b

S
=0
c

yi xi + a

i =1

i =1

zi xi = c

i i

(7.6.4b)

i =1

yi + a

i =1

(7.6.4c)

i =1

y con ellas se pueden determinar los coeficientes incgnita que definen el


plano de mnimos cuadrados. La utilidad de este tipo de ajuste puede
ampliarse al caso de relaciones funcionales que, aunque no sean lineales en
s mismas, puedan reducirse a ella mediante cambios de variable adecuados.
Como en el caso de la recta la tarea se puede simplificar notando que el
centroide (x, y, z) de la nube de puntos que forman la muestra pertenece al
plano (7.6.2). Dividiendo por N la ecuacin (7.6.4c) se tiene efectivamente
para el centroide definido como
x=

1
N

x;
i

y=

1
N

y;
i

z=

1
N

(7.6.5)

la relacin que demuestra este hecho


z = c + by + ax

(7.6.6)

Si se definen unas nuevas variables como

438

u = x x, ui = xi x (i = 1, 2,..., N )

(7.6.7a)

v = y y , vi = yi y (i = 1, 2,..., N )

(7.6.7b)

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

w = z z , wi = zi z (i = 1, 2,..., N )

(7.6.7c)

el plano (7.6.2) se rescribe

z z = b ( y y + a ( x x w = bv + au

(7.6.8)

La transformacin (7.6.7) reduce el sistema (7.6.4) de dimensin (3 3) a


dimensin (2 2) encontrando por minimizacin, o sustituyendo (7.6.7)
directamente en (7.6.4), el nuevo sistema ms sencillo
S
=0
a
S
=0
b

w u = b v u + a u
i i

2
i

i i

i =1

i =1

wi vi = b

i =1

(7.6.9a)

i =1

uv

vi2 + a

i =1

i i

(7.6.9b)

i =1

del que se obtienen los parmetros a y b y en donde no hay que olvidar


c = z by ax.
En este tipo de ajuste la definicin del error aleatorio estndar de la
estima z se define va la expresin

( zi zi, est. )

sZ / XY =

(7.6.10)

N3

que generaliza (7.4.7) considerando que hay tres grados de libertad menos en
la muestra debido a la determinacin hecha de los tres parmetros a, b y c.
De nuevo, ntese que un factor N en el denominador convertira (7.6.10) en
la expresin del error RMS para el ajuste del plano de mnimos cuadrados.
En cuanto a la definicin de los diversos coeficientes de correlacin se
tienen varias posibilidades. Primero estn los tres coeficientes de correlacin totales (o de orden cero) para cada pareja de variables, rZX, rZY y rXY, de
formulacin idntica a la dada en (7.3.3). As, por ejemplo, para rZX se tiene

( z z )( x x )
;
(z z ) ( x x)
i

rZX =

1 rZX +1

(7.6.11)

439

CLCULO NUMRICO Y ESTADSTICA APLICADA

y de la misma forma se escriben relaciones equivalentes para las otras dos


parejas. Como no puede ser de otra manera: los tres coeficientes de correlacin totales estn acotados entre 1 y +1 (ambos valores includos). Con ayuda de estos coeficientes se construyen los denominados coeficientes de correlacin parciales r ZX,Y, r ZY,X y r XY,Z, cuyo significado (ZX, Y) es el de la
correlacin conjunta entre las dos primeras variables (Z y X) dejando constante la tercera (Y). Las ecuaciones para estas magnitudes presentan simetras claras a partir de sus definiciones
rZX ,Y =

rZX rZY rXY

)(

2
2
1 rZY
1 rXY

rXY , Z =

; rZY , X =

rZY rZX rXY

)(

2
2
1 rZX
1 rXY

;
(7.6.12)

rXY rXZ rYZ

(1 r )(1 r )
2
XZ

2
YZ

y verificndose para ellos la misma acotacin acotacin general ya mencionada 1 rZX,Y, rZY,X, rXY,Z +1. En el caso de que las tres variables estn no
correlacionadas, entonces todos los coeficientes de correlacin parciales y
totales son nulos. Finalmente, se define el coeficiente de correlacin mltiple
de Z sobre X e Y

)(

2
2
RZ ( XY ) = + 1 1 rZX
1 rZY
; 0 RZ ( XY ) 1
,X

(7.6.13)

Si RZ(XY) = 1, la relacin entre las tres variables con los puntos de la


muestra proporcionados es casi con toda seguridad lineal perfecta y estos
puntos estn contenidos en el plano calculado. Si RZ(XY) = 0, la relacin entre
las tres variables puede garantizarse que no es lineal, y esto sucede si y slo
si rZX = rZY = 0. Los casos intermedios marcan la mayor o menor proximidad
a estas situaciones lmite. En algunas ocasiones, a efectos de comparacin y
de un anlisis ms completo, se utilizan los coeficientes RX(YZ) y RY(XZ) que se
definen de manera anloga a la hecha en (7.6.13).

7.7. Estadstica no paramtrica


Ya se ha mencionado que el problema general subyacente a las aplicaciones del coeficiente de correlacin lineal es el del desconocimiento de la
distribucin de probabilidades conjunta f(x, y) que obedecen los puntos de la

440

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

muestra {(xi, yi)}. Aunque r es ampliamente utilizado para caracterizar (y validar) agrupamientos de puntos en torno a lneas rectas, la presuposicin de
que f(x, y) es doblemente Gaussiana hace que el significado de r no sea siempre claro y, de ah, que se hayan desarrollado otras herramientas estadsticas
para el anlisis de correlaciones. Estas otras herramientas pertenecen a dos
grandes grupos relacionados: la estadstica no paramtrica y la estadstica
robusta. En la estadstica no paramtrica se remplaza el comportamiento real
observado por un comportamiento altamente idealizado, en tanto que en la
robusta se disean estimadores que resultan suficientemente insensibles a
pequeos cambios en el comportamiento del modelo aplicado. A continuacin van a darse las ideas bsicas de dos mtodos utilizados en la estadstica no paramtrica: el test de signos y la correlacin por rangos de Spearman. En cierto sentido la correlacin de Spearman es tambin robusta y se
deja otra aplicacin de tales tcnicas robustas para el Cap. 10. Como nota distintiva, hay que indicar que la obtencin de una correlacin no paramtrica
seala que, dentro del nivel de significacin elegido, existe verdaderamente
una correlacin en los datos analizados. La complejidad en lo que sigue no va
a pasar del caso bidimensional.
Test de signos
Este test est basado en la distribucin binomial y es muy sencillo de
aplicar como una alternativa a la t de Student o para establecer la existencia
de tendencias definidas en los datos, entre otras utilidades. El problema se
reduce al del estudio de la probabilidad de aparicin de determinado nmero de signos + y como desviaciones positivas y negativas con respecto a una
referencia tomada en la muestra. Generalmente esta referencia se toma
como la mediana (un parmetro robusto), ya que este parmetro divide la
distribucin en dos partes iguales con un 50% de masa de probabilidad a
cada lado. Un par de ejemplos servirn para ilustrar esta aplicacin.
i) El primer ejemplo es el de una muestra {xi} de tamao N de la que se
sabe que la mediana poblacional toma un valor dado Med(x) y se desea
saber si los valores extrados xi proceden de esa poblacin, con un cierto
nivel de significacin (normalmente a = 0,05), o dicho de otra manera, si los
datos son compatibles con la poblacin tomada. Recurdese que en la verificacin de hiptesis slo se dan resultados probabilistas, al nivel a y no se
garantiza generalmente un resultado absoluto.

441

CLCULO NUMRICO Y ESTADSTICA APLICADA

El anlisis consiste en estudiar los N valores a los que se les ha restado la


mediana {x i Med(x)}, con la particularidad de que si en algn caso
xi = Med(x), entonces tal dato (o datos) xi se elimina del anlisis. En la muestra resultante de estas posibles eliminaciones, con un tamao N N, se establecen cuntos signos + (desviaciones positivas) y cuntos signos (desviaciones negativas) aparecen como resultado de dichas restas. Sean estos
nmeros n(+) y m() = N n(+). Consistentemente con la definicin de la
mediana se considera que la probabilidad de obtener desviacin positiva es
la misma que la de obtener desviacin negativa en una medida y, por tanto,
p(+) = q() = 1/2.
La hiptesis nula H0 es la de que los datos son consistentes o compatibles
con la poblacin que tiene mediana Med(x) de manera que la probabilidad
de las desviaciones observadas debe ser menor que el nivel de significacin a
(se va a seguir un ensayo bilateral). En caso contrario hay que rechazar H0 al
nivel de significacin a.
El clculo comienza planteando la probabilidad del suceso de los signos
observados en la muestra y se completa con la de las situaciones que dan la
cola de la distribucin. Para n = n(+) se tiene la aplicacin binomial
N

P ( n) =

i= n

N 1
N 1
N 1
Pi = +
+ ... +

n + 1 2
n 2
N 2

(7.7.1)

que es la probabilidad de obtener en N ensayos aleatorios un nmero de signos + mayor o igual al nmero observado n(+), en este caso la cola de la
derecha. Como se est interesado en el estudio de si hay discrepancias significativas sin ms, hay que considerar la situacin opuesta en la que haya
n() signos y m(+) signos +, as como todo lo que suceda en la cola izquierda de la distribucin. Como ambas situaciones son equivalentes la probabilidad total buscada es el doble de (7.7.1) y se obtiene
N

PT ( n signos iguales ) = 2

(7.7.2)

i= n

Ahora, si PT( n) > a, entonces no se puede rechazar H0 a este nivel de significacin, pues la situacin analizada cae dentro de la regin esperada en
una distribucin binomial equiprobable. Si, por el contrario, PT( n) < a, hay
que rechazar H0 y concluir a este nivel de significacin que los datos no proceden de la poblacin con mediana Med(x).

442

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

ii) El segundo ejemplo es el del anlisis de una tendencia. Dada una


muestra {xi} de tamao N se comienza eliminando el dato central si N es
impar (N = 2M + 1). Si N = 2M, la muestra se conserva tal cual es. La discusin sigue con la muestra 2M, reducida en un elemento en su caso, y dividindola en dos partes iguales de tamao M cada una, {x1, x2, ..., xM} y {xM+1,
xM+2, ..., x2M}. A continuacin se comparan elemento a elemento determinando los signos de las diferencias respectivas obteniendo
x1 xM +1

x2 xM + 2
0 ), m( ); n + l + m = M
n(+ ), l (0
... ... ...
xM x2 M

(7.7.3)

El paso siguiente consiste en desechar todos los posibles resultados nulos


l(0) quedndose con el anlisis de la probabilidad de aparicin de n signos
iguales o ms en un total de M l(0) ensayos.
En un ensayo de significacin bilateral se calcular la probabilidad
correspondiente y se ensayar la hiptesis nula H0 : no existe tendencia significativa al nivel a y la muestra es al azar, procediendo igual que antes en i).

Correlacin por rangos de Spearman


Este es un mtodo muy bien adaptado para tratar con situaciones en las
que las variables aleatorias consideradas no se pueden expresar fcilmente
de manera cuantitativa, pero s pueden ser sometidas a una ordenacin que
responda a algn criterio (preferencias de consumidores, sensacin de confort, eficiencia del personal de una empresa, etc.). Obviamente, tambin
puede aplicarse a problemas bien definidos en trminos cuantitativos no exigindoles que sigan una determinada distribucin de probabilidad. En cierto sentido este mtodo no paramtrico puede ser calificado tambin como
robusto, del tipo especial conocido como estimacin R, ya que suministra un
estadstico rS (coeficiente de correlacin) suficientemente insensible a pequeas desviaciones del comportamiento ideal que representa.
La idea de este mtodo es remplazar cada valor xi que presenta una
variable aleatoria X por el valor correspondiente del nmero de orden (o rango) que ocupa en la muestra una vez ordenada sta con un criterio.

443

CLCULO NUMRICO Y ESTADSTICA APLICADA

Es decir, la muestra {xi} se ordena y resulta una permutacin de sus elementos originales a la que se asignan correlativamente los nmeros enteros
U i = 1, 2, 3, ..., N (se supone que no hay datos iguales), teniendo
{xi} {xi} = {1, 2, 3, ...}. Por ejemplo, para una muestra de tamao N = 6
podra ser
{ x1 , x2 , x3 , x4 , x5 , x6 } ordenacin { x2 , x5 , x3 , x1 , x6 , x4 } rangos {1, 2, 3, 4, 5, 6}U
en donde a x2 se le asigna el rango U1 = 1, a x5 se le asigna el rango U2 = 2, a
x3 se le asigna el rango U3 = 3, etc. Como se ve la ordenacin se extrae de
una distribucin uniforme: los enteros positivos del 1 al N. Cuando hay dos
o ms valores xi iguales se tiene una de las denominadas ataduras y se
asigna a todos ellos el mismo nmero de orden o rango, que se define
como la media de los rangos que hubieran tenido de haber sido ligeramente diferentes. Este orden especial puede resultar entero o semi-entero y
se denomina semi-orden. La suma de todos los rangos siempre debe ser
evidentemente
N

U = 1+ 2 + 3 + ... + N = 12 N ( N + 1)
i

(7.7.4)

i =1

Si la muestra es bidimensional, todo lo dicho para los valores xi se


aplica igualmente a los y de manera que {(xi, yi)} {(Ui, Vi)}, en donde tanto U como V toman los valores Ui, Vj = 1, 2, 3, ..., N, pero as como Ui sigue
el orden natural con i crecientes, no sucede necesariamente lo mismo con
los valores Vj que, en general, siguen una permutacin de los anteriores. Se
define el coeficiente de correlacin lineal de orden de Spearman de una forma anloga a (7.3.3) con las variables enteras U y V y sus valores medios

U = V = (N + 1)/2

(U U )(V V )
(U U ) ( V V )
i

rS =

; 1 rS +1

(7.7.5)

es decir, se est analizando la correlacin entre 1, 2, 3, ..., N, y una de sus


permutaciones (Fig. 7T.5).

444

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

Figura 7T5. Correlacin de Spearman por rangos entre la permutacin identidad de los nmeros
enteros del 1 al N (variable X ordenada segn U) y una permutacin de estos enteros (variable Y
ordenada segn V). La lnea recta sugerida es slo una gua para la vista.

La significacin de un valor rS 0 se puede evaluar con un estadstico de


Student anlogo al expuesto en (7.3.11)

t ( = N 2 = rS

N2

(7.7.6)

1 rS2

y siguiendo el mtodo general ya discutido, siendo la hiptesis nula H0: r = 0


la ausencia de correlacin.
El parmetro de Spearman est estrechamente ligado a la suma de los
cuadrados de las diferencias entre rangos
N

D=

di2

i =1

(U V )

(7.7.7)

i =1

En el caso sencillo de no existencia de ataduras ni en Ui ni en Vi se


encuentra la relacin
rS = 1

6D
N ( N 2 1)

(7.7.8)

445

CLCULO NUMRICO Y ESTADSTICA APLICADA

La expresin para rS en presencia de ataduras en {xi} e {yi} es bastante


complicada y no se va a considerar aqu.
Finalmente, tambin puede ensayarse la significacin de la magnitud D
anterior utilizando como hiptesis nula H0 : no hay correlacin en los datos,
y notando que D se distribuira de forma aproximadamente normal con
media y varianza dadas por
D =

446

N ( N 2 1)
N 2 ( N + 1)( N 2 1)
; D2 =
6
36

(7.7.9)

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

BIBLIOGRAFA
1. SPIEGEL, M. R.; SCHILLER, J. y ALU SRINIVASAN, R., Probabilidad y Estadstica, 3
Edicin (Serie Schaum), McGraw-Hill, Madrid (2010). (Caps. 8, 10).
2. SPIRIDONOV, V. P. y LOPATKIN, A. A., Tratamiento Matemtico de Datos Fisico-qumicos, Mir, Mosc, 1973. (Caps. 4, 5).
3. SES, L. M., Mtodos Tericos de la Qumica-Fsica (Vol. 1), UNED, Madrid,
1994. (Tema 8).
4. PRESS, W. H.; FLANNERY, B. P.; TEUKOLSKY, S. A. y VETTERLING, W. T., Numerical
Recipes, Cambridge University Press, Cambridge, 1986. (Caps. 13, 14).
5. TURNER, J. C., Matemtica Moderna Aplicada, Alianza (Madrid), 1993. (Cap. 8).
6. CRAMR, H., Elementos de la Teoria de Probabilidades, Aguilar, Madrid, 1968.
(Cap. 9).
7. DEMIDOWITSCH, B. P.; MARON, I. A. y SCHUWALOWA, E. S., Mtodos Numricos de
Anlisis, Paraninfo, Madrid, 1980. (Cap. 2).
8. SPIEGEL, M. R.; LIU, J. y ABELLANAS, L., Frmulas y Tablas de Matemtica Aplicada,
McGraw-Hill, 2 Edicin Revisada (Serie Schaum), Madrid (2005).

447

CLCULO NUMRICO Y ESTADSTICA APLICADA

PROBLEMAS TERICOS Y NUMRICOS

Problemas tericos
7.1) Probar las relaciones del texto (7.4.7), (7.4.11) y (7.4.13).
7.2) La ecuacin general de la densidad de probabilidad de una distribucin
Gaussiana bivariante (no singular) est dada por
f ( x, y) =

1
2 X Y

1 ( x X
B( x, y) =

1 2 X2

1
exp B( x, y)

2
1
2

2 ( x X

)( y ) + ( y )

X Y

Y2

donde r es el coeficiente de correlacin entre X e Y y B(x, y) es una forma


cuadrtica no negativa.
a) Calcular las funciones densidad marginales para X e Y.
b) Si las variables X e Y son independientes, qu forma toma f(x, y)?
c) Si las variables X e Y no estn correlacionadas, qu forma toma
f(x, y)?
d) En el caso de variables Gaussianas, son siempre equivalentes los
resultados de b) y c)?Y en el caso general de variables no Gaussianas?
e) Qu forma geomtrica toma f(x, y) proyectada en el plano XY cuando
sX = sY?
7.3.) a) Discutir la posibilidad de que en una correlacin lineal general de tres
variables se tenga la situacin rZX = rZY = rXY = 0,8. b) Escribir el sistema
normal de mnimos cuadrados para una correlacin lineal de tres variables discretas en el que aparezcan de forma explcita los coeficientes de
correlacin lineal totales rZX, rZY, y rXY.
7.4) Probar que en ausencia de ataduras el coeficiente de correlacin lineal
de Spearman viene dado por la frmula (7.7.8) del texto.

448

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

Problemas numricos
7.5) Los siguientes datos corresponden a la relacin entre el ndice de refraccin n y la densidad especfica r de un determinado lquido orgnico a
una cierta temperatura
n

1,33015

1,33922

1,34602

1,34911

1,35688

1,35700

r 0,792692 0,812422 0,827135 0,833799 0,850492 0,850753


Calcular las siguientes lneas de regresin y sus correspondientes coeficientes de correlacin (lineales)
a) = An + B
b) n = A + B
c)

n2 1
n2 + 2

= k + C

Qu conclusiones se extraen de estos resultados?


7.6) Mediante un mtodo espectrofotomtrico se calibra la cantidad x(%) de
estireno en una serie de substancias afines que lo contienen (copolmeros)
como una funcin determinada f(y) de la absorcin de radiacin (y)
x(%)

15

25

45

60

80

100

f(y)

2,801

2,645

2,482

2,229

1,653

1,363

0,781

0,315

Supuesto que la muestra de datos extrados procede de una poblacin distribuida binormalmente:
a) Determinar la lnea recta de calibracin por mnimos cuadrados, los
errores en los parmetros y sus intervalos de confianza del 95%.
b) Calcular igualmente el coeficiente de correlacin y averiguar si es significativo al nivel a = 0,05.
c) Calcular los lmites de confianza del 95% para el coeficiente de correlacin lineal.

449

CLCULO NUMRICO Y ESTADSTICA APLICADA

7.7) Una muestra lquida sometida a ciertas condiciones externas contiene


una poblacin de bacterias cuyo nmero n por unidad de volumen se
comporta con respecto al tiempo (horas) segn la tabla
t(horas)

1,5

4,5

7,5

65

80

135

238

420

750

a) Utilizando una estimacin razonable de la constante c investigar si


este comportamiento puede ajustarse empricamente mediante la
relacin
n = c + b exp( at)
b) Determinar los errores estndar en los parmetros a y B = ln b, as
como los lmites de confianza del 95% en ambas magnitudes. Discutir
igualmente el error estndar que se espera afecte a la constante b.
c) Comentar las posibles mejoras que se pueden incorporar al tratamiento de este problema.
7.8) Los siguientes datos polarogrficos relacionan la intensidad lmite de
corriente Il en funcin de la concentracin inica C y del tiempo t (unidades arbitrarias)
Il

0,888

2,000

3,214

4,311

5,654

7,121

0,25

0,50

0,75

1,00

1,25

1,50

0,5

1,25

2,25

2,50

a) Ajustar una expresin del tipo Il = ACmtn.


b) El modelo terico de Ilkovich predice para la relacin anterior m = 1 y
n = 1/6. Tomando este modelo como referencia, qu puede decirse de
los resultados anteriores?
c) Cabe esperar que un ajuste Il = A + mC + nt represente mejor, desde
un punto de vista meramente emprico, que el a) los datos de la tabla?
Razonar la respuesta.

450

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

7.9) El nivel radiactivo R en milicuries de 137Cs/km2 de una regin se mide


durante varios meses obteniendo los resultados siguientes
Mes
Nivel R.

M1

M2

M3

M4

M5

M6

M7

M8

M9

19,2 21,3 17,2 22,5 22,5 21,9 23,4 24,0 22,9

a) Muestran estos resultados alguna tendencia al nivel a = 0,05 (bilateral) que pueda detectarse con el test del signo?
b) Durante un periodo similar anterior se obtuvo que la mediana de las
actividades era 23,8 En los datos suministrados, se observa alguna
diferencia significativa al nivel a = 0,05 (bilateral) con respecto a
aquel dato?
7.10) Ocho versiones de un medicamento que difieren en la cantidad del principio activo se ensayan frente a un determinado tipo de infeccin con
otros tantos grupos de 100 pacientes. La tabla rene cantidades de principio activo (unidades arbitrarias) frente a la eficacia dada como el
nmero de pacientes que experimentan una notable mejora
Medicamento

M1

M2

M3

M4

M5

M6

M7

M8

Cantidad

10

Eficacia

12

50

10

60

55

63

61

Cabe esperar una correlacin positiva entre la cantidad del principio


activo y la eficacia del medicamento al nivel de significacin a = 0,05?
7.11) Para una disolucin se ha obtenido la siguiente tabla de calibracin para
las transmisiones T = I/I0 en funcin de la concentracin c del soluto, a una
longitud de onda de luz incidente dada y con un espesor de clula l = 1 cm
T

0,752

0,553

0,505

0,461

0,421

c 103 mol/l

1,1

1,3

1,5

1,7

1,9

Se sabe que la ley a la que obedece este fenmeno de absorcin es


T = exp(ccl) en donde c es el denominado coeficiente de extincin.
Habr que desestimar la medicin en c = 1,1 103 moles/litro?

451

CLCULO NUMRICO Y ESTADSTICA APLICADA

SOLUCIONES
Problema 7.1
La relacin (7.4.7) es

( yi yi,est. )2

sY / X =

N2

yi2 a xi yi b yi

N2

y operando con el numerador del primer radical se tiene

( yi yi,est. )2 = ( yi axi b)2 = y2 2a xi yi 2b yi + a2 x2 + 2 ab xi + Nb2


i

agrupando trminos afines

( yi yi,est. )2 = y2 a xi yi b yi

i
i

+ a2 x2 a xi yi + ab xi
i
i
i

+ b yi + ab xi + Nb2 = y2 a xi yi b yi
i
i
i
i
i i

se tiene la relacin a demostrar, ya que los dos ltimos corchetes son idnticamente nulos (ecuaciones normales igualadas a cero).
La relacin (7.4.11) es

( y y ) = ( y y
2

i,est.

)2 +

(y

i ,est.

y )2

cuya demostracin se obtiene sumando y restando yi,est. dentro del primer


sumatorio

( y y ) = ( y y
2

i, est.

+ yi, est. y )2 =

= [( yi yi,est. )2 + ( yi ,est. y )2 + 2( yi yi,est. )( yi,est. y )]


i

452

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

y notando seguidamente que la suma implcita del tercer trmino es idnticamente nula

(y y

y) =

i ,est. )( yi ,est.

xi yi a2

xi2 ab

( y ax b)( ax + b y) =
i


xi + b

yi ab


xi Nb2 + y

yi + ya

xi +Nby = 0

con lo queda demostrada la relacin.


La relacin (7.4.13) es r2 = aa y se demuestra directamente multiplicando las expresiones de los dos coeficientes
2

N xi yi xi yi
i
i
i
=
aa =
2
2

2
2
N xi xi N yi yi
i
i i
i
2

1
xi yi N xi yi
i
i
i
=
2
2

1
2
1
2
xi N xi yi N yi
i
i i
i

( xi x )( yi y )
i

= r2

( xi x )2 ( yi y )2
i

ya que

( xi x )( yi y ) = xi yi N x y ; ( xi x ) =
2

xi2

N xi ; etc.
i

Problema 7.2
a) La funcin marginal de una variable se consigue integrando la densidad conjunta sobre la otra variable. Aplicando las relaciones integrales vistas
en el epgrafe 5.6 se obtienen
fX ( x) =

`
`

f ( x, y) dy =

1
2 2X

( x )2
X
exp

2
2 X

453

CLCULO NUMRICO Y ESTADSTICA APLICADA

fY ( y) =

`
`

f ( x, y) dx =

( y Y )2
exp

2 Y2
2 Y2

b) Si las variables son independientes entonces necesariamente r = 0 y


por tanto se tiene el resultado
f(x, y) = fX(x). fY(y)
obviamente lo mismo que cabe esperar aplicando directamente la definicin
de variables independientes.
c) En este caso hay que considerar que para el problema dado r = 0 y se
tiene el mismo resultado que en b) al poderse factorizar directamente la densidad conjunta
f(x, y) = fX(x). fY(y)
d) De los dos resultados anteriores se concluye que en el caso Gaussiano
siempre se tiene que las variables son independientes implica r = 0 y viceversa: la condicin necesaria y suficiente para que dos variables Gaussianas
conjuntas sean independientes es r = 0. Para pares de variables no Gaussianas no se verifica en general esta doble implicacin y b) y c) no siempre tienen que ser equivalentes.
e) La discusin de esta cuestin puede hacerse considerando la funcin
cuadrtica no negativa que define a B(x, y)
B( x, y)

X = Y

1
( x X )2 2 ( x X )( y Y ) + ( y Y )2 0
(1 2 ) 2X

Definiendo las variables auxiliares u = x mX, v = y mY, referidas al centro


de masa como origen de coordenadas de la distribucin conjunta, (mX, mY), es
fcil comprobar que la cuadrtica define elipses para valores fijos c2 de B(x, y)
y que son las elipses equiprobables del problema f(x, y) = constante
( x X )2 2 ( x X )( y Y ) + ( y Y )2 = u2 2 uv + v2 = c2
Se tiene entonces un sencillo problema de diagonalizacin de una forma
cuadrtica
1 u
(u, v)
= u2 2 uv + v2 > 0

1 v

454

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

que la reducir a forma diagonal en las nuevas variables transformadas x1 y


x2 que se obtienen por rotacin de las dos variables anteriores u y v (esta
transformacin la realizan los autovectores). A efectos de la cuestin presente slo se va a obtener la forma reducida cannica de las elipses equiprobables, dejando al lector que complete los detalles de los nuevos ejes
coordenados (Cap. 9). La diagonalizacin para obtener los autovalores es
1
= (1 )2 2 = 0 = 1
1
Con ello se tiene la reduccin

1 12 + 1 + 22 = c2

12

c2 1

22

c2 1 +

=1

que da la forma cannica de las elipses, con semiejes

a = semieje mayor = c2 1 ; b = semieje menor = c2 1 +

Problema 7.3
a) Para un problema de tres variables se debe satisfacer la condicin
1
0 XY
XZ

XY
1
YZ

XZ
YZ 1
1

Sustituyendo los valores rXY = rXZ = rYZ = 0,8 se obtiene un valor para el
determinante de los coeficientes de correlacin totales igual a 1,944 < 0 y
hay que concluir que el caso planteado no es posible.
b) Utilizando la forma reducida
z z = a( x x ) + b( y y ) w = au + bv
el sistema normal pedido en forma (22) es
rZX sZ = as X + bsY rXY
rZY sZ = as X rXY + bsY
con s~ denotando las desviaciones tpicas sesgadas.

455

CLCULO NUMRICO Y ESTADSTICA APLICADA

Problema 7.4
El coeficiente de correlacin de Spearman con las variables enteras U,
V = 1, 2, 3, ..., N y sin ataduras se plantea como

(U U )(V V )
(U U ) (V V )
i

rS =

; 1 rS +1

en donde hay que recordar que si los valores U siguen ordenadamente la


secuencia de nmeros enteros desde 1 hasta N, los valores V forman una permutacin de tales enteros y no siguen en general tal ordenacin. En cualquier caso se tiene que los valores medios de ambas secuencias son idnticos
y siempre iguales a
U=V = A=

( N + 1)
2

Esto permite rescribir el coeficiente de correlacin en la forma ms simple

(U A)(V A) U V NA
=
=
U

A
(
)
U NA

rS

i i

2
i

Utilizando la definicin de D puede obtenerse una expresin equivalente


para

UiVi
i

D=

(U V ) = U + V 2 U V = 2 U 2 U V
2

2
i

2
i

i i

i i

de donde

U V = U
i i

2
i

D
2

y la tarea queda reducida a evaluar la suma de los cuadrados de los N primeros nmeros enteros. Esta cantidad puede encontrarse en las tablas mate-

456

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

mticas, aunque puede tambin calcularse de forma muy sencilla empleando conocimientos previos de los polinomios de colocacin y tablas de diferencias. Se trata de calcular

2
i

= 02 + 12 + 22 + 32 + ... + N 2

en donde se ha incluido el 02 por comodidad. Si se dan valores a N se puede


construir la tabla de diferencias (de avance) con las sumas parciales.
Esta tabla presenta diferencias constantes en el tercer orden (el lector
puede verificar por induccin que este resultado es vlido para cualquier N)
y, por tanto, esto revela que la suma de los cuadrados se puede representar
exactamente mediante un polinomio de colocacin de tercer orden. Este
polinomio para un valor arbitrario es
pk = 0 + k +

3
2
k( k + 1)(2 k + 1)
k( k 1) + k( k 1)( k 2) =
2
6
6

y en particular da la suma de cuadrados buscada para cualquier k = N entero finito

2
i

= 02 + 12 + 22 + 32 + ... + N 2 =

N ( N + 1)(2 N + 1)
6

Sustituyendo todos los resultados intermedios encontrados en la expresin de rS se tiene

U V NA
r =
U NA

i i

2
i

1
1
D
N ( N + 1)(2 N + 1) N ( N + 1)2
6D
6
4
2 = 1
=
1
1
N ( N 2 1)
N ( N + 1)(2 N + 1) N ( N + 1)2
6
4

que es la expresin que se quera demostrar.

457

CLCULO NUMRICO Y ESTADSTICA APLICADA

Tabla. Problema 7.4.


k

Sk

D2

D3

1
1

3
4

2
5

9
3

14

2
7

16
4

30

2
9

25
5

55

2
11

36
6

91

2
13

...

...

...

...

...

49
7

140
...

...

...

Problema 7.5
Los resultados para las lneas de regresin son
a) = An + B = 2,161302 n 2, 082088;
b) n = A + B n = 0, 462680 + 0, 963352;
c)

n2 1
n2 + 2

= k + C f ( n) =

r = 0, 999996
r = 0, 999996

n2 1
= 0, 257472 6, 58 108 ; r = +1
n2 + 2

A la vista de estos resultados slo hay una ligersima diferencia entre los
tres ajustes. Los dos primeros sugieren fuertemente que existe una sencilla
dependencia lineal entre n y r, en tanto que el tercer resultado tambin
indica que la dependencia lineal de f(n) con r es en la prctica perfecta
(ntese adems que el valor de C es despreciable). Podra pensarse en anali-

458

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

zar los comportamientos de los residuos, es decir las diferencias entre los
valores tabulares y los estimados por regresin, para decidir entre b) y c),
pero hay que notar que ambas relaciones son muy diferentes y se tendran
que resolver complicaciones adicionales. En estas circunstancias no se puede optar por ninguno de los, en definitiva, dos modelos de comportamiento.
Tiene que ser la teora del fenmeno la que diga qu relacin es la fsicamente significativa. En este caso, y coincidiendo con el estrecho margen que
tiene la correlacin perfecta c), la correlacin fsicamente significativa es la
c) que constituye la expresin de la ley de Lorentz-Lorenz.
n2 1
= k
n2 + 2

Problema 7.6
a) Los clculos con el sistema normal para obtener la recta y = ax + b
producen el siguiente resultado (redondeos a seis decimales)
y = ax + b = 0,025009x + 2,815247
El clculo de los errores en los parmetros dar una respuesta significativa para ellos. Los resultados parciales son

( yi yi,est. )2

sY / X =

sa =

sY / X

(
i

xi x

N2

= 0, 041501

= 4, 3064 10 4 ; sb = sY / X

en donde N = 8, x = 41,25,

1
x2
+
N x x
i
i

= 0, 023040

( xi x )2 = 9287, 5, y los valores estimados para


i

yi se han calculado con la relacin obtenida yi,est. = axi + b.


Estos resultados permiten afinar los de la pendiente y la ordenada en el
origen
a = 0, 02501 0, 00043; b = 2, 815 0, 023

459

CLCULO NUMRICO Y ESTADSTICA APLICADA

Todava se puede ir ms lejos en esta direccin determinando los lmites


de confianza para estos parmetros. Utilizando la distribucin t de Student
con n = N 2 = 8 2 = 6 grados de libertad y a = 0,05 (el 95%), el coeficiente
crtico para esta cuestin es
t1C / 2 ( ) = t0C,975 (6 ) = 2, 45
y los intervalos de confianza son (Fig. 7EP. 1)
ordenada en el origen: b sb t0C,975 (6) = 2, 815 0, 023 2, 45 = 2, 815 0, 056
pendiente: a sat0C,975 (6) = 0, 02501 0, 00043 2, 45 = 0, 025 0, 001

Figura 7EP1. Figura para el problema 6 (calibracin de una lnea recta).

b) El coeficiente de correlacin resultante es r = 0,9991 muy prximo a


la unidad (negativa) y muestra una pronunciada correlacin negativa entre
las variables. Para las operaciones del apartado siguiente se va a tomar
r = 0,9991116739.
El ensayo de si no existe correlacin (hiptesis nula) con un nivel a = 0,05
se realiza con el estadstico de Student
t=

460

r N2
1 r2

58

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

que resulta ser mucho mayor que el valor crtico ya indicado antes
tC0,975(6) = 2,45 y hay que concluir que prcticamente con toda seguridad
existe correlacin (t es tambin mucho mayor que los valores crticos habituales).
c) Los lmites de confianza del 99% para el coeficiente de correlacin
poblacional, supuesta la distribucin bivariante Gaussiana, estn dados por
el intervalo

z z
p 2, 58 <
< 2, 58 = 0, 99
z

o equivalentemente

2, 58
2, 58
p tanh 1 r
< tanh 1 < tanh 1 r +
= 0, 99

N3
N3
En donde se ha despreciado el trmino r/(N 1) en mZ (7.3.13) aplicando
as la aproximacin

z = z

1 1+
ln
2 1

Procediendo como en el texto (Ejercicio 7.3.5)


u = tanh 1 r

2, 58

v = tanh 1 r +

2, 58

1 1 + r 2, 58

ln
; u = 5,, 013248362
2 1 r
5

1 1 + r 2, 58
+
ln
; v = 2,, 70562621
2 1 r
5

exp(2u) 1
exp(2 v) 1
0, 9999;
0, 9911
exp(2u) + 1
exp(2 v) + 1
y el intervalo pedido est contenido en la expresin de la probabilidad.
p 0, 9999 < < 0, 9911 = 0, 99

461

CLCULO NUMRICO Y ESTADSTICA APLICADA

Como siempre hay que recordar que conviene mantener el mayor nmero posible de decimales en los clculos para evitar redondeos intermedios
que desvirten el resultado final. El lector puede comprobar con qu nmero mnimo de decimales puede alcanzar un resultado al redondearlo a cuatro
decimales como el obtenido aqu.

Problema 7.7
Siguiendo el procedimiento expuesto en el texto se determina primero
una estimacin de la constante c. Aqu va a estimarse c de una forma simple
y se deja al lector la tarea de ensayar otras posibilidades. Esto es importante, ya que los resultados finales van a depender de la eleccin que se
haga de c y es de inters estudiar este punto, pero por brevedad no va a
hacerse aqu. Para obtener los resultados que se dan debajo redondeados a
6 decimales se han utilizado ms decimales en las operaciones intermedias.
Como se ver al final, la precisin significativa en los parmetros de inters
no se vera afectada de haberse utilizado los datos intermedios redondeados
ya a 6 decimales.
La estimacin de c se obtiene con (7.2.13) y M = 5 fijando el punto intermedio en
tI =

t0 + tM 0 + 7, 5
=
= 3, 75
2
2

con lo que un ajuste de interpolacin cuadrtico (colocacin) utilizando los


puntos en t = 1,5, 3, 4,5 (esto puede mejorarse de muchas maneras, obviamente) se obtiene el valor intermedio asociado nI dado por
nI = pk =1,5 = 80 + 1, 5 55 +

1, 5 0, 5
48 = 180, 5
2

Con ello la constante c se estima a travs de


c=

n0 nM nI2
= 35, 616189
n0 + nM 2 nI

lo que lleva a la nueva tabla

462

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

Tabla (a1). Problema 7.7


t(horas)

1,5

4,5

7,5

N=nc

29,383811

44,383811

99,383811

202,383811

384,383811

714,383811

ln N

3,380444

3,792875

4,598989

5,310166

5,951641

6,571420

A partir de aqu se puede proceder a ajustar la dependencia funcional


N = b exp( at) ln N = ln b + at = B + At
El ajuste de mnimos cuadrados para la recta resultante de tomar logaritmos neperianos da los resultados
B = ln b = 3, 281230 b = 26, 608492
A = a = 0, 440807
r = 0, 99
977
Una tabla comparativa de valores de entrada y calculados ln Ni,est. = B + Ati
es la siguiente
Tabla (a2). Problema 7.7
t(horas)

1,5

4,5

7,5

ln N

3,380444

3,792875

4,598989

5,310166

5,951641

6,571420

ln Nest.

3,281231

3,942441

4,603651

5,264861

5,926071

6,587282

29,3838

44,3838

99,3838

202,3838

384,3838

714,3838

Nest.

26,6085

51,5442

99,8482

193,4194

374,6796

725,8051

sg(N Nest.)

En la tabla se muestran los signos de los residuos (valor de entrada


valor calculado) y no dan la impresin de que haya tendencias, aunque son
muy pocos datos para intentar analizar la aleatoriedad de aparicin de tales
signos apropiadamente. En cualquier caso, el coeficiente de correlacin
lineal obtenido es suficientemente alto como para indicar que existe una
fuerte correlacin lineal entre los datos analizados.

463

CLCULO NUMRICO Y ESTADSTICA APLICADA

b) En cuanto a los errores estndar en los parmetros hay que empezar


determinando el error en la estima (se mantiene el redondeo a seis decimales)

sln N / t =

(ln Ni ln Ni,est. )2
i

62

= 0, 093799

con lo que se tienen los valores (t = 3,75)


sln N / t

sA =

( ti t )2

= 0, 014948; sB = sln N / t

1
t2
= 0, 067887
+
N (ti t )2
i

Con los resultados anteriores se pueden afinar las estimaciones de los


parmetros
a = A = 0, 441 0, 015
B = ln b = 3, 281 0, 068
y todava ms con los lmites de confianza utilizando la distribucin t de Student con n = 6 2 grados de libertad, para la que al 95% el coeficiente crtico es tC0,975(4) = 2,78 y se encuentra
pendiente a : 0, 441 0, 015 2, 78 0, 44 0, 04
ordenada ln b : 3, 281 0, 068 2, 78 3, 28 0,19 b = 26, 608492
El siguiente asunto es de la estimacin del error en la constante b, para lo
que se conoce ya el error en la magnitud relacionada B = ln b. La regla general es la de manejar la dependencia funcional b = exp(B) y utilizar el desarrollo en serie de Taylor a primer orden (D s)
2

b = db / dB B sb2 = db / dB s2B
con lo que
b = exp( B)B = exp(3, 281230) 0, 067887 = 1, 806371 1, 81
Conviene observar como se comporta esta estimacin con rdenes del
desarrollo crecientes. As hasta tercer orden se tiene
2
1
1
b = exp( B)B 1 + B + ( B 1, 8064 + 0, 0613 + 0, 0014 1, 87
6

464

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

con lo que se ve que la estimacin a primer orden es bastante razonable.


Finalmente la constante b se escribir
b = 26, 61 1, 87 26, 6 1, 9
c) Todos los resultados obtenidos lo han sido bajo la eleccin hecha
para el valor c. Es claramente este parmetro el que debe ser tratado con cuidado para mejorar la calidad del ajuste. Hay ciertamente mucho espacio
para la creatividad en esta tarea de mejora. Posibles formas para afinar
esta estimacin pueden ser utilizar una interpolacin con un polinomio de
colocacin de diferencias centrales, o un ajuste de mnimos cuadrados (parbola) a la tabla con el que interpolar el valor nI de forma suavizada en
t = 3,75, etc. No obstante, son los resultados finales de proximidad entre el
ajuste emprico y la tabla de entrada los que van a decidir sobre este asunto
de la calidad interpolatoria de la funcin emprica propuesta.
Por ltimo, una vez utilizada la frmula emprica encontrada para interpolar valores n
a determinados tiempos habr que redondear a valores enteros
los resultados obtenidos para tales nmeros de bacterias.
Problema 7.8
a) La expresin propuesta se corresponde con un ajuste de un plano de
mnimos cuadrados, ya que al tomar logaritmos se tiene
ln Il = ln A + m ln C + n ln t
y se denotarn por simplicidad
x1 = ln Il ; x2 = ln C ; x3 = ln t
Hay pues que empezar transformando los datos de entrada a la forma de
las nuevas variables. Se van a mantener 6 decimales en los clculos siguientes. La nueva tabla es
Tabla (a1). Problema 7.8
x1 = ln Il

0,118784

0,693147

1,167516

1,461170

1,732363

1,963048

x2 = ln C

1,386294

0,693147

0,287682

0,223144

0,405465

x3 = ln t

0,693147

0,223144

0,693147

0,810930

0,916291

1,098612

465

CLCULO NUMRICO Y ESTADSTICA APLICADA

Con estos datos conviene determinar los valores medios (centros de


masa) de cada nueva variable
x1 = 1,149743; x2 = 0, 289752; x3 = 0, 508163
El siguiente paso consiste en utilizar las variables referidas a este centroide de la distribucin y se van a denotar como
y1 = x1 x1 ; y2 = x2 x2 ; y3 = x3 x3
en funcin de las cuales el plano de mnimos cuadrados se expresa en la forma
y1 = my2 + ny3 ;

ln A = x1 mx2 nx3

Las ecuaciones normales para esta reduccin son ms simples que si no


se hubiese hecho tal operacin y se convierten en un sistema (2 2) que por
simplicidad se escribe

y1 y2 = m y22 + n y2 y3
y1 y3 = m y2 y3 + n y32
en donde las sumas se extienden sobre los seis datos tabulares.
Los resultados tras resolver este sistema son
A = 4, 252496; m = 1,107723; n = 0, 045658
y la tabla queda ajustada con los datos estimados para Il redondeados a
tres decimales, que son con los que vienen dados los datos de entrada, resultando
Tabla (a2). Problema 7.8

466

Il

0,888

2,000

3,214

4,311

5,654

7,121

0,25

0,50

0,75

1,00

1,25

1,50

0,5

1,25

2,25

2,50

Il, est.

0,887

1,993

3,191

4,413

5,678

7,006

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

La tabla de entrada se reproduce muy bien y los coeficientes de correlacin relevantes son (redondeados a cuatro decimales)
r12

= r (ln Il ,ln C ) = 0, 9998

r13

= r (ln Il ,ln t) = 0, 9828

r23

= r (ln C ,ln t ) = 0, 9815

r13 ,2 = 0, 3960
R1( 23 ) = 0, 9998
El ajuste realizado a los datos tabulares parece pues muy razonable y la tcnica de mnimos cuadrados ha cumplido su misin de minimizar desviaciones.
b) A pesar de los resultados anteriores, la comparacin con la ley terica
de Ilkovich pone de manifiesto que existen problemas en la tabla de entrada.
El exponente de la concentracin C(m 1,1) no es una mala estimacin del
valor terico, pero el exponente del tiempo n = 1/6 0,0457 sugiere que
existen errores de entrada. Por otra parte, el nmero de datos utilizados para
este problema de tres variables es bastante escaso, de manera que pequeos
errores de entrada pueden originar grandes discrepancias en la comparacin
con los resultados tericos de referencia, como consecuencia de la amplificacin que produce la ley de tipo potencial en dos variables. Por tanto, todo
indica que no slo hay que revisar las medidas, sino que deben hacerse
muchas ms para obtener resultados adecuados.
c) Desde un punto de vista emprico el ajuste con una expresin
Il = A + mC + nt va a presentar los coeficientes de correlacin
r12

= r ( Il , C ) = 0, 9986

r13

= r ( Il , t ) = 0, 9686

r23

= r (C , t ) = 0, 9760

r13 ,2 = 0, 5164
R1( 23 ) = 0, 9990
Comparando los valores obtenidos en a) con estos nuevos se observa
que aqullos son ligeramente mejores. Por ello es de esperar que la comparacin de residuos Ii Il,est. sea ms favorable al ajuste a), pero no de una
manera claramente definitiva. No obstante, hay que recordar que si faltara la

467

CLCULO NUMRICO Y ESTADSTICA APLICADA

ley terica de Ilkovich, que no es una simple suma de contribuciones y que


justifica la eleccin de a), la decisin entre ambos modelos pudiera ser dificultosa y habra que revisar toda la investigacin y la toma de datos (siguiendo los pasos explicados en b)) para asegurar un resultado final fiable.

Problema 7.9
a) Como el nmero de datos es impar el dato central (M5, 22,5) se ignora totalmente de las consideraciones siguientes. Los otros ocho datos se
dividen en dos grupos, del 1 al 4 y del 6 al 9 y se efectan ordenadamente las
diferencias (dato de nivel radiactivo dato de nivel radiactivo) observando el
signo de stas
Tabla (a). Problema 7.9
19,2

21,3

17,2

22,5

21,9

23,4

24,0

22,9

Se tienen as cuatro signos idnticos en cuatro pruebas y hay que


decidir si esta regularidad es o no consistente con una distribucin de
signos al azar binomial. Supuesto que es igualmente probable encontrar un
signo u otro entonces la distribucin est caracterizada por p+ = q = 1/2. La

Figura 7EP2. Figura para el problema 9 (a). Probabilidades de la distribucin binmica


con cuatro ensayos.

468

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

probabilidad de conseguir cuatro signos idnticos en cuatro pruebas


(4+ 4) est dada por
4

4
4
1
2
= 0,125
P = p0 q 4 + p4 q 0 = 2 =
16
2
4
0
A un nivel a = 0,05 bilateral se ve que el resultado anterior obtenido cae
dentro de lo esperado con una distribucin binomial, pues las zonas crticas
a cada lado (4+ 4) estn sealadas por el valor a/2 = 0,025 = 1/40 que es
ciertamente menor que P/2 = 1/16 = 0,0625 (Fig. 7EP.2).
La conclusin es que con los datos analizados no se observa ninguna tendencia significativa. No se puede rechazar pues la hiptesis nula de que no
hay tendencia al nivel a = 0,05.
El rechazo de la hiptesis nula hubiera sucedido si P/2 < a/2.
b) Comparando los datos de la tabla con la mediana del anterior periodo
23,8 se observan los signos de las restas respectivas
Tabla (b). Problema 7.9
Radiact.

19,2

21,3

17,2

22,5

22,5

21,9

23,4

24,0

22,9

(23,8)

Si algn dato fuera igual a la mediana 23,8 se descartara el valor 0 de las


operaciones siguientes.

Figura 7EP3. Figura para el problema 9 (b). Probabilidades de la distribucin binmica con nueve
ensayos. Se muestra el valor crtico en la verificacin bilateral a = 0,05.

469

CLCULO NUMRICO Y ESTADSTICA APLICADA

Ahora se tienen 9 ensayos y una presencia de 8 signos iguales, lo que


sugiere la existencia de diferencias significativas, aunque sin el correspondiente test esto no pasa de ser una apreciacin bien fundada. Para un ensayo de hiptesis bilateral hay que evaluar la probabilidad de que aparezcan 8
o ms signos iguales, probabilidad que viene dada por
9

9
9
9
9
1
P = p9 q0 + p8 q + pq8 + p0 q 9 = 2 10 = 0, 0390625
2
9
8
1
0
Utilizando la comparacin anloga a la anterior a) se observa que
P/2 < a/2: 0,0195 < 0,025,de modo que la pequea probabilidad asociada a 8
o ms signos iguales no es compatible con un nivel de significacin bilateral
a = 0,05 en una distribucin binmica (Fig. 7EP3).
Consecuentemente, en este caso hay que rechazar la hiptesis nula H0 y
aceptar que existe un cambio significativo en el nivel radiactivo ms reciente (todo siempre al nivel a = 0,05).

Problema 7.10
Como hay 8 datos, para establecer la correlacin de Spearman hay que
ordenar las secuencias cantidad y eficacia siguiendo los nmeros enteros
positivos del 1 al 8. Prcticamente la cantidad C se corresponde ya con esta
ordenacin correlativa, en tanto que la eficacia E va a presentar una ordenacin diferente (permutacin distinta de la identidad). Ajustando ligeramente los datos (faltan las cantidades C = 2 y 9), asociando cantidad-eficacia
y calculando sus diferencias d se tiene la nueva tabla
Tabla. Problema 7.10
Medicamento

M1

M2

M3

M4

M5

M6

M7

M8

Cantidad C

Eficacia E

d = C E

470

CORRELACIN, REGRESIN Y ESTADSTICA NO PARAMTRICA

Dado que no hay ataduras el coeficiente de correlacin de Spearman es


pues

rS = 1

6 di2
i
3

N N

= 1

6 10
0, 881
504

Este es un valor elevado teniendo en cuenta la ausencia de detalles particulares en la evaluacin hecha del estadstico, por lo que hace sospechar
que efectivamente va a existir correlacin. Ahora bien, para determinar si
este valor es significativo, al nivel a = 0,05 (bilateral), hay que ensayar la
hiptesis nula, H0 : r = 0, con el estadstico de Student
t = rS

N2
82
= 0, 881
4, 56;
2
1 rS
1 0, 8812

= 8 2 = 6 grrados de libertad

C
Este valor calculado de t resulta ser mayor que el valor crtico t0,975
(6) = 2,45.
Se rechaza pues H0 y se concluye que existe correlacin al nivel a = 0,5
(bilateral).

Problema 7.11
La ley de Lambert-Beer se puede transformar en una dependencia lineal
tomando logaritmos
ln T = cl = c
que es una recta que pasa por el origen de coordenadas. La tabla a investigar
es pues (redondeos a 6 decimales) utilizando C = c 103
Tabla (a). Problema 7.11
T = ln T
C = c 10

0,285019

0,592397

0,683197

0,774357

0,865122

1,1

1,3

1,5

1,7

1,9

Una sencilla representacin grfica lineal de estos datos ya indica que el


primer punto es extrao y que debera descartarse. Esta idea se refuerza con
el ajuste convencional de mnimos cuadrados con los 5 puntos
T = 0, 671083 C + 0, 366607 ( r = 0, 9517)

471

CLCULO NUMRICO Y ESTADSTICA APLICADA

en el que ya se aprecia una ordenada en el origen bastante apartada del valor


terico nulo al que debera estar prximo este resultado. Realizando adems
el ajuste por mnimos cuadrados del que se suprime el primer punto, que es
el sospechoso, se obtiene
T = 0, 454668 C 0, 001300 ( r 1)
y aqu se observa cmo la calidad es prcticamente perfecta: un coeficiente
de correlacin negativa unidad y un valor prximo a cero para la ordenada
en el origen.
Las estimaciones con ambos ajustes se dan a continuacin redondeando
a 6 decimales
Tabla (b). Problema 7.11
T = ln T

0,285019

0,592397

0,683197

0,774357

0,865122

C = c 103

1,1

1,3

1,5

1,7

1,9

T (5 puntos)

0,371585

0,505802

0,640019

0,774235

0,908452

T (4 puntos)

0,501434

0,592368

0,683302

0,774235

0,865169

De nuevo la tabla muestra la gran proximidad entre el ajuste que desprecia el primer punto y los datos originales. Ahora conviene para asegurar
el descarte efectuar el test de Cook para el primer punto y que lleva al valor
5

(y

i ,( N = 5, est. )

CD12 =

yi(,(1)N 1= 4 ,est.)

i =1

2 sY2 / X

0, 02810
2, 25 > 1
0, 01249

lo que justifica despreciarlo como fuera de rango (y = T, x = C). El lector puede desarrollar el problema considerando de partida que la ordenada en el
origen es nula.

472

III
ANLISIS Y PROPAGACIN DE LOS ERRORES
EXPERIMENTALES

8. El tratamiento de errores en datos experimentales

CAPTULO 8
EL TRAMIENTO DE ERRORES EN DATOS EXPERIMENTALES

8.1.
8.2.
8.3.
8.4.
8.5.
8.6.

Introduccin
Los errores en la medicin experimental
Propagacin del error de escala del aparato
Propagacin de los errores sistemticos
Propagacin de los errores accidentales
Un caso de estudio: clculo del error total de un ndice de refraccin

Bibliografa
Problemas tericos y numricos

El asunto del error cometido en los clculos numricos aproximados ya se ha


considerado anteriormente en los captulos del bloque I, as como tambin se
han venido tratando ciertas caractersticas del error estadstico en todos los
captulos precedentes del bloque II. Ahora se va a considerar el estudio de la propagacin de errores experimentales en los procesos de medicin. Se empieza
distinguiendo entre las mediciones directas de una magnitud y las indirectas,
que son las que resultan de aplicar relaciones matemticas a la cantidad medida
directamente. La siguiente cuestin es la clasificacin de errores, haciendo hincapi en las posibles fuentes de error desde el punto de vista experimental: de
escala del aparato de medida, sistemticos de un aparato o proceso de medida,
y accidentales derivados de la naturaleza aleatoria de las variables que se
miden. Los dos primeros tipos generalmente son constantes en el proceso, pero
el tercero tiene una naturaleza casual que hace que las mediciones individuales
oscilen alrededor de un determinado valor medio, y esto lleva directamente a la
consideracin de las caractersticas estadsticas que juegan un papel en el
proceso de medida. Se contina con la evaluacin de errores absolutos y varianzas en los resultados de mediciones directas e indirectas (operaciones aritmticas, funciones de una y de varias variables), estudiando la propagacin de cada
tipo de error. Finalmente se considera con detalle el clculo numrico del efecto
global de los errores presentes en un proceso de medida hipottico (un ndice de
refraccin) con una muestra finita: el error total se construye como una suma de

475

CLCULO NUMRICO Y ESTADSTICA APLICADA

todos los errores (los sistemticos tienen signo!), y se presta atencin especial a
los lmites de confianza con los que se expresa el error accidental que afecta a
la (media de la) medicin. Dependiendo del tamao de la muestra analizada, el
uso de la Gaussiana o de la t de Student, estudiadas previamente, sirve perfectamente al anterior propsito.
Tipos de error en mediciones
Escala del aparato

Sistemticos

Accidentales

Puramente aditivo
Propagacin:
derivacin parcial primer orden
(suma de valores absolutos)

Con signo
Propagacin:
derivacin parcial primer orden
(con suma algebraica). Se
inducen por errores accidentales

Estadsticos
Puramente aditivos
Propagacin:
derivacin parcial primer orden
(independencia suma
de cuadrados/varianzas)

Composicin: error total


Uso de la t de Student
Cifras significativas

Cap. 10

8.1. Introduccin
En captulos anteriores se ha venido considerando el problema del error
en dos contextos diferentes pero relacionados, el numrico y el estadstico, y
se han revisado medidas y tcnicas para caracterizar tanto sus efectos en los
resultados de los clculos como en la toma de decisiones estadsticas. Ahora
se va a tratar con detalle un aspecto importante ms como es el problema de
las mediciones experimentales derivadas. Este es el problema conocido
como de la propagacin del error. En todo lo que sigue se excluyen los errores
que se producen como consecuencia de una mala comprensin del problema
estudiado, manipulaciones matemticas equivocadas, etc.
En general una medicin experimental no va a conducir directamente
al valor de la magnitud de inters fisicoqumico Y = y, sino que tal medicin X = x va a ser utilizada para obtener el valor y a travs de una relacin
matemtica y = h(x). Por ejemplo, una medida espectromtrica de una muestra lquida dar el valor de una propiedad ptica como una funcin de la

476

EL TRATAMIENTO DE ERRORES EN DATOS EXPERIMENTALES

concentracin (ley de Lambert-Beer), en una volumetra el resultado del


experimento ser funcin del volumen del reactivo, etc. La situacin se
complica si la propiedad de inters depende de la medicin de varias
variables independientes (o no), Y = h(X1, X2, ..., Xn), como puede ser el caso
de la presin de un fluido puro P = P(V, T), con dependencia del volumen y
de la temperatura absoluta, la energa interna de un sistema multicomponente E = E(S, V, c1, c2, ..., cN), con dependencia de la entropa, el volumen y
la composicin (concentracin de cada componente), etc.
Es claro que las imprecisiones o errores en las mediciones directas de las
variables Xi van a repercutir en el conocimiento que se puede alcanzar de la
magnitud derivada Y que es va Y = h(X) medida indirectamente. Atendiendo a la naturaleza de las variables Xi los errores experimentales pueden
ser de diferentes tipos y se los clasifica en tres grandes grupos: de escala del
aparato de medicin, sistemticos, y accidentales (aleatorios). Los dos primeros estn asociados con variables de efecto fijo y son constantes e
independientes del nmero de mediciones que se realicen. Sin embargo el
tercer tipo, accidental, est asociado con variables aleatorias y puede disminuirse aumentando el nmero de mediciones. La cuestin est en estimar
cmo todos estos errores se propagan a travs de la funcionalidad Y = h(X).
Parte de esta tarea ya ha sido considerada en el texto, pues en lo que respecta a los errores de escala y sistemticos la estimacin se realiza utilizando bsicamente la expresin conocida (3.1.3) que contiene el desarrollo de
Taylor truncado a primer orden (con una ligera modificacin en el caso
sistemtico). Por otra parte, se han estudiado tambin las medidas de dispersin de variables aleatorias (Caps. 5 y 6) como caracterizaciones de los
errores estadsticos, estableciendo las relaciones entre las distribuciones de
probabilidad original f(x) e inducida g(y) por Y = h(X), o las similares cuando hay ms de una variable independiente. Parecera pues, a primera vista,
que el clculo de la dispersin en Y se reduce sencillamente una manipulacin matemtica que calcule primero g(y) y segundo, va integracin, la
varianza asociada con la distribucin de la nueva variable Y. Sin embargo,
como ya se indic en el Cap. 5, esta operacin puede resultar bastante compleja en la mayora de los casos con funciones de distribucin de partida
conocidas, f(x), f(x1, x2, ..., xk), etc., y no es factible cuando tales funciones
son desconocidas, como suele suceder en muchos problemas de muestreo.
Es pues necesario disponer de un mtodo alternativo que permita estimar de
forma sencilla, aunque no sea siempre exacta, el efecto de los errores alea-

477

CLCULO NUMRICO Y ESTADSTICA APLICADA

torios en las variables X1, X2, ..., Xk, sobre el resultado Y. La clave general
para hacer esta operacin est en el teorema de adicin de varianzas (5.7.22)
y el desarrollo lineal de Taylor de Y = h(X1, X2, ..., Xn).
Este captulo se concentra en el estudio elemental de la propagacin de
cada tipo de error y de la construccin del error total como una suma de
todas las contribuciones que afectan al proceso de medicin. Otros asuntos
relacionados con el tratamiento de errores experimentales en el anlisis de
datos se estudiarn en el Cap. 10 (ajustes c2, ANOVA, etc.).

8.2. Los errores en la medicin experimental


Ya se han mencionado las tres fuentes de error en una medicin experimental: de escala del aparato, sistemticas, y accidentales. El error de escala eesc. viene dado por la construccin del aparato de medida y se identifica
con la magnitud de la divisin (uniforme) ms pequea que presenta: en una
regla esta divisin es de 1 mm, en una probeta graduada en cm3 = cc es de
1 cc, en un aparato digital lo que indiquen las especificaciones tcnicas,
etc. Se trata de un error constante en todas las mediciones que se efecten
con dicho aparato, siendo por tanto independiente del operario y de las
condiciones externas, siempre que estas ltimas estn controladas y dentro
de los lmites tcnicos especificados. Por ejemplo, altas temperaturas pudieran hacer que una distancia medida como 1 cm fuese en realidad, por las
diferentes dilataciones de la regla y de