Está en la página 1de 536

Temas que trata la obra:

• Redes cristalinas y tipos de cristales


• Análisis cristalográfico con rayos X
• Dinámica de las redes cristalinas
• Mecánica cuántica, generalidades
• Mecánica estadística, generalidades
• Vibraciones reticulares y propiedades
térmicas de los cristales
• Teoría del electrón libre de los metales
• Teorí~ cuántica de los electrones en
redes periódicas
• Semiconductores electrónicos uniformes
en equilibrio
• Exceso de portadores en
semiconductores
• Tecnología de materiales y medición de
propiedades volumétricas
• Teoría de las uniones p-n de los
semiconductores
• Rectificadores de la unión p-n y
transistores
• Uniones p-n a niveles altos de
corrientes; el rectificador p-i-n
• Otros dispositivos semiconductores
• Contactos metal-semiconductor y
superficies de semiconductores
,6flll""'

FISIC ,
DEL ESTADO SOLIDO Y DE
SEMICONDUCTORES

J. P. McKELVEY

~LIMUSA
NORIEGA EDITORES
MÉXICO • Eapel\a • Venezuela • Colombia
VERSIÓN AUTORIZADA EN ESPNIOL DE LA OBRA
PUBLICADA EN INGLéS CON EL TITULO:
SOLIO STATE ANO
SEMICONDUCTOR PHYSICS
O HARPER & Row PuBLISHERs, INc.

COLABORADOR EN LA TRADUCCIÓN:
HORTENSIA CORONA RODRÍGUEZ
INGENIERO DE LA UNIVERSIDAD DE CALIFORNIA,
8eRKELEY.

REVISIÓN:
FRANCISCO RESÉNDIZ RODRÍGUEZ
MAESTFÚA EN CIENCIAS EN INOENIERIA ELéCTRI•
CA DEL CeNTRO DE INVESTIGACióN Y EsTUDIOS
AVANZADOS, PROFESOR DE ELECTRÓNICA DE LA
EscueLA SuPERIOR DE INOENIERfA MECÁNICA
Y ELéCTRICA DEL INSTITUTO PouTéCNICO NA·
CIONAL, MéxiCO.

LA PRESENTACIÓN YDISPOSICIÓN EN CONJUNTO DE


FÍSICA DEL ESTADO SÓLIDO Y
DE SEMICONDUCTORES

SON PROPIEDAD DEL EDITOR. NINGUNA PARTE DE


ESTA OBRA PUEDE SER REPRODUCIDA O TRANS·
MlliDA, MEDANll: NfGÚN SISTBM O MÉlalO, B..EC·
TIÓIIICO o aECÑICO (N:W'fENX) afOitlCXlPWlO,
LA GRABACIÓN O CUALQUIER SISTEMA DE RECUPE·
RACIÓN Y ALMACENAMIENTO DE INFORMACIÓN), SIN
CONSENTIMIENTO POR ESCRITO DEL EDITOR.

DERECHOS RESERVADOS:

O 1996, EDITORIAL LIMUSA, S.A. DE C.V.


GRUPO NORIEGA EDITORES
BALDERAS 95, MéJOCO, D.F.
C.P. 06040
i l 521·21.05
Q 512·29.03
CANIEM NúM. 121

NovENA RBMPRESIÓN

HECHO EN MéxiCO
ISBN 968·18·0431·7
Prólogo

Este libro se basa en el material que utilicé para impartir cursos especiales
de dos semestres a los estudiantes de las carreras de física, ingeniería
eléctrica, metalurgia y ciencias de materiales. Por lo común, el primer
semestre de estos cursos se dedica ala física general del estado sólido y el
segundo, a un estudio detallado de los materiales y dispositivos semiconduc-
tores, incluyéndose en él (además de una gran cantidad de material nuevo)
muchas aplicaciones de los principios desarrollados en la sección introducto-
ria del curso. Por consiguiente, la obra es fundamentalmente un libro de
texto para un curso de este tipo. Esperamos que su alcance sea lo
suficientemente amplio y la exposición de los aspectos fundamentales, lo
suficientemente detallada y clara para que también sirva como libro de
consulta general para los ingenieros y otros profesionales que trabajan en el
área de investigación y desarrollo de los materiales y dispositivos
semiconductores.
En vista de que este material puede interesar a los estudiantes y
profesionales de carreras muy diversas, se incluyeron los capítulos sobre
mecánica cuántica y mecánica estadística, por creer que serían muy útiles
para algunos. Sin embargo, cabe señalar que con estos capítulos no se
pretende suplir un curso completo de estos temas, ya que sólo se trata df.
breves ensayos introductorios que le proporcionan al lector los conocimien-
tos necesarios para seguir el desarrollo del tema y entender el significado
físico de los conceptos presentados. Desde luego, para apreciar debidamente
la importancia que tienen los fenómenos cuánticos y estadísticos en la física
del estado sólido, no queda otra, sino estudiarlos a fondo.
A lo largo de la obra, los temas se presentan desde el punto de vista de la
física; por otra parte, se incluyen muchos detalles técnicos sobre temas tales
como tecnología de materiales y crecimiento de cristales; fabricación de
dispositivos semiconductores; características y configuración de circuitos de
estos dispositivos, y para proporcionar un panorama más completo, se
indican las obras que conviene consultar, si se desea obtener datos más
concretos y detallados en relación con estos temas. Traté de presentar en
forma exhaustiva la teoría de la unión p-n y el análisis del dispositivo
semiconductor y dar una explicación completa y detallada de las técni<:as
analíticas que se utilizan en este campo tan importante, pero tan descuidado.
Prólogo 6

Los conceptos de la física general del estado sólido que se estudian en la


sección introductoria, capítulos del 1 al 8, sólo abarcan aquellos que tienen
una importancia central en la física de los semiconductores. Por lo tanto,
esta introducción es más bien selectiva que completa; peri, aun así, contiene
el material suficiente para un curso completo, de nivel intermedio, sobre la
física del estado sólido. Desde luego, un libro de texto de tamaño normal no
puede abarcar un estudio de dieléctricos, magnetismo, centros de color,
experimentos de resonancia y otros temas que por lo general se tocan en los
cursos de física del estado sólido.
El nivel de presentación es intermedio; he tratado de ir mucho más allá de
lo que puede lograrse con un enfoque cualitativo, sin recurrir realmente a la
mecánica cuántica y la mecánica estadística, a fin de evitar las tremendas
complejidades matemáticas requeridas para un planteamiento absoluto de la
teoría cuántica. La línea de mis planteamientos es pragmática bien que
axiómática y traté sistemáticamente de explicar todos los temas desde dos
puntos de vista, el físico y el matemático. A lo largo de la obra se hace
énfasis en los principios fundamentales y no en los detalles técnicos. Además,
con mucha frecuencia se recurre al planteamiento de la partícula tal y como
se explica en la teoría del transporte del electrón libre; este planteamiento se
justifica a la luz de la teoría cuántica que se subraya en el capítulo 8. No se
necesita tener conocimientos matemáticos más avanzados que el análisis
vectorial y de las ecuaciones diferenciales ordinarias. Aunque en varias
ocasiones aparecen las ecuaciones diferenciales parciales y expansiones de la
función ortogonal, siempre se proporcionan en seguida los medios
matemáticos necesarios para resolverlas.
Me es imposible expresar en forma adecuada mi gratitud a todos mis
colegas que han contribuido a esta obra. Sin embargo, quisiera dar las gracias
de un modo específico a los doctores D.R. Frankl, P.H. Cutler, J. Yahia y
H.F. John por sus útiles comentarios, observaciones y sugerencias, así como
al Dr. F .G. Brickwedde quien me autorizó a emplear su personal, cuando la
transcripción del manuscrito se retrasaba por alguna emergencia. Mis
antiguos alumnos, los doctores J.C. Balogh, M W. Cresswell y E.F. Pulver
también me ayudaron mucho leyendo, evaluando y corrigiendo partes del
manuscrito. También muchos de mis estudiantes me señalaron los errores
que hubo en las notas del manuscrito y sugirieron cómo mejorar la
exposición de algunos temas. No me puedo acordar de todas las personas que
me ayudaron; pero estoy profundamente agradecido a cada una de ellas.
También deseo expresar mi gratitud a la señorita Frances Fogle, a la señora
Marion Shaw y a la señorita Eileen Berringer por su inapreciable
colaboración en la transcripción del manuscrito.

J.P. MCKELVEY

University Park, Pa.


Contenido

Capítulo 1 Redes cristalinas y tipos de cristales 13

1.1 Concepto de estado "sólido", 13


1.2 Celdas unitarias y redes de Bravais, 14
1.3 Algunas estructuras cristalinas simples, 18
1.4 Planos cristalinos e índices de Miller, 23
1.5 Espaciamiento de los planos en las
redes cristalinas, 25
1.6 Clasificación general de los
cristales, 27
Capítulo 2 Análisis cristalográfico con rayos x 31

2.1 Introducción, 31
2.2 Física de la difracción de los rayos X: las
ecuaciones de V on Laue, 34
2.3 Factor de dispersión atómica, 37
2.4 Factor geométrico de la estructura, 40
2.5 La red recíproca, 43
2.6 La condición de Bragg en función de la red
recíproca, 47

Capítulo 3 Dinámica de las redes cristalinas 51


3.1 Vibraciones elásticas de medios continuos, 51
3.2 Velocidad de grupo de trenes de ondas
armónicas, 53
3.3 Movimiento ondulatorio en redes atómicas
unidimensionales, 55
3.4 Estructuras diatómicas unidimensionales, 62
3.5 Región de frecuencia prohibida, 65
3.6 Excitación óptica de vibraciones reticulares
en cristales iónicos, 6 7
3. 7 Energía de enlace de estructuras cristalinas
iónicas, 69
Contenido 8

Capítulo 4 Mecánica cuántica, generalidades 19

4.1 Introducción, 79
4.2 Radiación del cuerpo negro, 79
4.3 Efecto fotoeléctrico, 81
4.4 Calor específico de los sólidos, 83
4.5 El átomo de Bohr, 84
4.6 La hipótesis de De Broglie y las propiedades
ondulatorias de la materia, 8 7
4.7 Mecánica ondulatoria, 87
4.8 Dependencia del tiempo de la función de onda, 91
4.9 La partícula libre y el principio de
incertidumbre, 94
4.10 Una partícula en un pozo de potencial
unidimensional e infinitamente profundo, 100
4.11 Una partícula en un pozo unidimensional
de profundidad finita, 103
4.12 El oscilador armónico unidimensional, 111
4.13 Oetogonalidad de las funciones propias y
la superposición de estados, 119
4.14 Valores esperados y números cuánticos, 123
4.15 El átomo de hidrógeno, 128
4.16 El espín electrónico, el principio de
exclusión de Pauli y el sistema
periódico, 141

Capítulo S Mecánica estadística, generalidades 147


5.1 Introducción, 147
5.2 La función de distribución y la densidad
de los estados, 148
5.3 La distribución Maxwell·Boltzmann, 153
5.4 La estadística de Maxwell-Boltzmann para
un gas ideal, 161
5.5 Estadística de Fermi-Dirac, 168
5.6 La distribución Bose-Einstein, 176

Capítulo 6 Vibraciones reticulares y propiedades térmicas 181


de los cristales
6.1 Cálculos clásicos del calor específico
reticular, 181
6.2 Teoría de Einstein sobre el calor específico, 183
6.3 Teoría de Debye sobre el calor específico, 186
6.4 El fonón, 192
6.5 Expansión térmica de los sólidos, 193
6.6 Conductividad térmica reticular de los sólidos, 195
Contenido 9

Capítulo 7 Teoría del electrón libre de los metales 203


7.1 Introducción, 203
7.2 La ecuación de Boltzmann y la trayectoria libre media, 204
7.3 Conductividad eléctrica de un gas de electrones libres, 209
7.4 Conductividad térmica y efectos termoeléctricos en
sistemas de electrones libres, 215
7.5 Procesos de dispersión, 219
7.6 El efecto de Hall y otros efectos galvanomagnéticos, 222
7. 7 Capacidad térmica de sistemas de electrones libres, 225

Capítulo 8 Teoría cuántica de los electrones en redes periódicas 231

8.1 Introducción, 231


8.2 El teorema de Bloch, 232
8.3 El modelo de Kronig-Penney de un cristal infinito
unidimensional, 23 5
8.4 Cantidad de movimiento del cristal y masa efectiva, 240
8.5 Representación de zona reducida; electrones y huecos, 243
8.6 La aproximación del electrón libre, 248
8. 7 La aproximación del enlace firme, 255
8.8 Dinámica del electrón en estructuras bidimensionales
y tridimensionales; superficies de energía constante y
zonas de Brillouin, 260
8.9 Aisladores, semiconductores y metales, 269
8.10 Densidad de la función de estados y cambios de fase en
aleaciones binarias, 273

Capítulo 9 Semiconductores electrónicos uniformes en equilibrio 281

9.1 Semiconductores, 281


9.2 Semiconductores intrínsecos y semiconductores
con impurezas, 284
9.3 Estadística de huecos y electrones- El caso del
semiconductor intrínseco, 288
9.4 Energía de ionización de centros de impurezas, 292
9.5 Estadísticas de los semiconductores con impurezas, 295
9.6 El caso de la ionización incompleta de niveles de impureza
(Temperatura muy baja), 300
9. 7 Conductividad, 302
9.8 El efecto de Hall y la magnetorresistencia, 306
9.9 Resonancia de ciclotrón y superficies elipsoidales
de energía, 316
9.10 Densidad de estados, conductividad y efecto de Hall con
superficies complejas de energía, 327
9.11 Mecanismos de dispersión y movilidad de los portadores
de carga, 335
Contenido 10

Capítulo 1O Exceso de portadores en semiconductores 347

10.1 Introducción, 347


10.2 Comportamiento de transporte de los portadores excedentes; las
ecuaciones de continuidad, 348
10.3 Algunas soluciones particulares de la ecuación de
continuidad, 361
10.4 Movilidad de arrastre y el experimento de Haynes-Shockley, 371
10.5 Recombinación superficial y condiciones de frontera
superficiales, 3 74
10.6 F otoconductividad de estado estacionario, 3 79
10.7 Fotoconductividad transitoria; tiempo de vida de los
portadores en excedentes, 383
10.8 Mecanismos de recombinación; la teoría de recombinación
de Shockley-Read, 390

Capítulo 11 Tecnología de materiales y medición de propiedades •E 401


volumétricas
11.1 Preparación de los materiales semiconductores de alto
grado de pureza, 401
11.2 Crecimiento de muestras monocristalinas, 407
11.3 Medición de la resistividad volumétrica, 409
11.4 Medición del contenido de impurezas y la movilidad mediante
el efecto de Hall, 411
11.5 Medición del tiempo de vida de los portadores excedentes, 412
11.6 Dislocaciones y otras imperfecciones, 413

Capítulo 12 Teoría de las uniones p-n de los semiconductores 421

12.1 La unión p-n, 421


12.2 El potencial de contacto interno de equilibrio, 424
12.3 Potenciales y campos en las cercanías de una unión p-n, 426
12.4 Modelo matemático simplificado de la unión p-n abrupta, 429
12.5 Capacitancia de unión; determinación del potencial interno, 435

Capítulo 13 Rectificadores de unión p-n y transistores 439

13.1 Teoría del rectificador de unión p-n, 439


13.2 Corrientes y campos en los rectificadores de unión p-n, 44 7
13.3 Rectificadores de unión de tamaño finito; efectos de
superficies y terminales óhmicas, 452
13.4 Mecanismos físicos de ruptura en las uniónes p-n, 456
13.5 Técnicas de fabricación de la unión p-n, 460
13.6 Transistores de unión p-n-p- y n-p-n, 460
Contenido 11

Capítulo 14 Uniones p-n a niveles altos de corriente; 479


el rectificara p-i-n,
14.1 Uniones p-n a densidades altas de corriente, 479
14.2 El análisis del rectificador p+-i-n+ a niveles
altos de corriente, 481
14.3 Rectificadores p-i-u; la caída de voltaje en sentido directo
como una función de la temperatura, 490

Capítulo 1S Otros dispositivos semiconductores, 495

15.1 El efecto fotovoltaico p-n y las celdas fotovoltaicas de


unión p-n, 495
15.2 Otros dispositivos sensibles a la luz; fototransistores, detectores
de partículas y detectores infrarrojos, 502
15.3 Rectificadores controlados p-n-p-n, 503
15.4 Diodos túnel, 506
15.5 Transist~res de efecto de campo o unipolares, 509

CAPITULO 16 CONTACTOS METAL-SEMICONDUCTOR Y


SUPERFICIES DE SEMICONDUCTORES, 513
16.1 Contactos metal-semiconductor en equilibrio, 513
16.2 Rectificación por contacto metal-semiconductor, 517
16.3 Estados superficiales y rectificación independiente de las
funciones de trabajo, 5 20
16.4 Potencial, campo y carga en la capa superficial de un
semiconductor, 524
16.5 Conductividad superficial, efecto de campo y movilidad
superficial; propiedades de superficies de
semiconductores reales, 5 31

Apéndice a la función & dirac S3S

Apéndice b análisis tensorial 537

Indice de nombres 541

Indice de temas S43


CAPITUW 1
Redes cristali,-,m y
tipos de cristales

1.1 CONCEPTO DE ESTADO "SOLIDO"

Desde un punto de vista general, el término sólido se aplica a substancias


elásticas rígidas, es decir, a substancias que tienen un comportamiento elástico no
sólo cuando se les somete a fuerzas hidrostáticas, sino también a esfuerzos de ten-
sión y cortantes. Por supuesto, existen algunos materiales cuyo comportamiento es
tanto elástico como plástico o viscoso, de modo que esta clasificación no es del
todo rigurosa. No obstante, se adoptará como criterio de lo que es una substancia
sólida, reconociendo que existe un tipo de substancias que, al mismo tiempo, se
comporta como sólido y como fluido.
Los materiales que se pueden considerar como sólidos de acuerdo con esta
defmición, se dividen en dos categorías: los amorfos y los cristalinos. Entre las
substancias amorfas, los átomos o moléculas pueden estar enlazados con bastante
firmeza entre sí; pero poseen poca o ninguna regularidad o periodicidad geométrica,
en la forma en que los átomos están dispuestos o acomodados en el espacio. Estas
substancias son casi siempre viscoelásticas y se pueden considerar como líquidos
sobreenfriados. En la figura 1.1 se muestra una representación bidimensional de un
material amorfo.

•o •o •o •o• •o • • o• •o•
•o •o•o •o• o • o •
•o •o •o •o • •o • o o • o • o

•o • o •o •o • • • o •o••
•o •o •o •o• •o o o • •o
•o •o • • • • o• o o •
• o • o • oo • oo • •o • • •
o o o •o •
o •
• • • • • • • • • •
Cristalino Amorfo

Figura 1.1. Representación esquemática en dos dimensiones, que muestra la düerencia existente
entre el arreglo atómico de un sólido cristalino y otro amorfo.

13
14 H.edes cristalinos y tipos de cristales

Por otro lado, las substancias cristalinas se caracterizan por una periodicidad
perfecta (o casi perfecta) en su estructura atómica; esta regularidad de estructura
proporciona un cuadro conceptual muy simple de un cristal y facilita la tarea de
comprender y calcular sus propiedades físicas. Por esta razón, los sólidos cristalinos
se comprenden mejor físicamente que los sólidos y líquidos amorfos. En este libro,
el tema se restringirá principalmente a un estudio de las propiedades físicas de los
sólidos cristalinos perfectos o casi perfectos. En algunas ocasiones, la presencia de un
número relativamente pequeño de imperfecciones tales como átomos de impurezas,
vacíos en la red o dislocaciones, en un cristal periódico que sería perfecto a no ser
por esta circunstancia, puede producir cambios notables en el comportamiento físico
del material. Esta obra se ocupará también de ellos según la importancia que revistan
dichos efectos.
Por último, es necesario comprender que las muestras macroscópicas de sólidos
cristalinos tales como metales, cerámicas, sales iónicas, etc., no siempre se componen
de un solo cristal, sino que a menudo están formados por un conjunto o conglo-
merado de pequeñas unidades de cristal -cada una con diferente orientación de
cristal- separadas entre sí por "fronteras o límites de grano" que se pueden consi-
derar como regiones definidas de rupturas y dislocaciones reticulares muy grandes.
Principalmente se tratarán las propiedades de diferentes tipos de cristales individuales;
pero se intentará comprender la naturaleza de las fronteras o límites de granos y
sei'ialar las principales formas en que pueden influir en las propiedades físicas de las
muestras cristalinas macroscópicas.

1.2 CELDAS UNITARIAS Y REDES DE BRAVAIS

En la figura 1.2 se describe la estructura reticular de un cristal bidimensional


que se utilizará como ejemplo para explicar ciertos términos cristalográficos funda-
mentales. En relación con esta figura, se puede seleccionar el paralelogramo ABCD
como una celda unitaria de dicha estructura reticular o red, la cual está determinada
por los vectores base a y b. Todas las traslaciones del paralelogramo ABCD mediante
múltiplos enteros de los vectores a y b a lo largo de las direcciones a y b, darán
como resultado su traslación a una región del cristal exactamente igual a la original.
Así pues, todo el cristal se puede reproducir sencillamente si se reproduce la super-

Figura 1.2. Celdas unitarias y vectores base en una estructura reticular bidimensional.
Celdas unittuios y redes de Bravais 15

ficie ABCD que se traslada sobre las direcciones a y b mediante todas las combina-
ciones posibles de múltiplos de los vectores base a y b. En otras palabras, cada
punto de la red del cristal se puede describir por medio de un vector r tal que

r =ha+ kb, (1.2-1)

en donde h y k son enteros. Evidentemente, este procedimiento se puede ampliar


con suma facilidad para determinar celdas unitarias y vectores base en redes crista-
linas tridimensionales. Por tanto, se puede llegar a las siguientes defmiciones:

Celda unitaria: una región del cristal defmida por tres vectores, a, b y e, que
al trasladarse por medio de cualquier múltiplo entero de dichos vectores
reproduce una región similar del cristal,
Vectores base: conjunto de vectores linealmente independientes a, b, e, que se
pueden usar para defmir una celda unitaria,
Celda unitaria primitiva: la celda unitaria más pequeiia (en volumen) que se
puede defmir para una red dada,
Vectores base primitivos: conjunto de vectores linea1mente independientes que
definen una celda unitaria primitiva.

De acuerdo con las anteriores defmiciones, en este caso también es evidente que
cada punto reticular de una red cristalina tridimensional se puede describir mediante
un vector de la forma

r =ha+ kb +le (h, k, 1 enteros) (1.2-2)

Conviene obserYar que la celda unitaria se puede defmir de varias maneras, po1
ejemplo, A'B'C 'D' y A"B''C "D" son otras posibilidades que describen la celda uni·
taria ilustrada en la figura 1.2. Estas tres celdas unitarias son de tipo primitivo para
esta red y, por ende, existe una ambigüedad correspondiente en la selección de un
conjunto de vectores base primitivos. Cualquiera de los vectores (a, b) o (a', b')
podría servir de igual manera. La celda de mayor tamaño EFGH de la misma figura
es un ejemplo de una celda unitaria que no es primitiva.
Se puede demostrar que existen 14 formas de acomodar los puntos en las
redes cristalinas, de tal modo que todos los puntos de dichas redes tengan exacta-
mente el mismo medio circundante. Estas estructuras reticulares conocidas como
redes de Bravais se ilustran en la figura 1.3. En el caso de una de estas redes, un
observador que ve el cristal desde uno de los puntos de la red, vería exactamente la
misma disposición o arreglo de los puntos circundantes de la red, sea cual fuere el
punto que haya seleccionado para observar. A primera vista podría parecer que
puede existir otra red de Bravais; por ejemplo, en las 14 redes de Bravais de la
figura 1.3 no se incluye un arreglo tetragonal centrado en la cara. la razón de ello
es que esta estructura tetragonal centrada en la cara equivale a una red tetragonal
centrada en el cuerpo, en la que el lado de la base de la celda unitaria es 1/.¡2
veces su valor correspondiente a la disposición centrada en la cara. La demostración
de este postulado, y la pregunta acerca de por qué las estructuras cúbicas centrada
en la cara y centrada en el cuerpo son distintas, se le dejan al lector como ejercicio.
Estas 14 redes se pueden agrupar en siete sistemas cristalinos, cada uno de los
cuales tiene en común ciertos elementos de simetría característicos. Los elementos
de simetría que se han escogido para especificar estos siete sistemas son los si-
guientes:
16 Redes cristoliliiiS y tipos de cristales

/ /

/ V
Cúbica simple Cúbica centrada en la base Cúbica centrada en
la cara
./ 7

./ [7

Tetragonal simple Tetragonal centrada


en el cuerpo

V V
Ortorrómbica Ortorrómbica Ortorrómbica Ortorrómbica
simple centrada en la base centrada en el cuerpo centrada en la cara

MonocHnica Monoclínica Triclínica Trigonal


simple centrada en la base

Figura 1.3. Las catorce redes de Bravais.

(1) Eje de rotación de orden n: la rotación alrededor de un eje de este tipo a


un ángulo de 21rjn radianes no produce ningún cambio en la estructura
reticular. En este caso, n puede tener los valores 1, 2, 3, 4 y 6. La simetría
rotacional de 5 veces en una red cristalina es imposible.
(2) Plano de simetría: una mitad del cristal reflejada en un plano semejante
que pasa por un punto de la red, reproduce la otra mitad.
Celdas unitarias y redes de Bravais 17

(3) Centro de inversión: un punto de la red alrededor del cual la operación


r-+ - r (en donde r es un vector a cualquier otro punto de la red) deja a
la estructura reticular sin sufrir cambio alguno.
( 4) Eje de rotación-inversión: la rotación alrededor de este eje a 2n/n radianes
(n = 1, 2, 3, 4, 6) seguida de una inversión alrededor de un punto de la red
por el que pasa el eje de rotación, no produce ningún cambio en la red.

Existen otras formas posibles de operaciones de simetría; pero se puede demos-


trar que todas son equivalentes a combinaciones lineales de estas cuatro. Los siete
sistemas cristalinos con sus elementos de simetría representativos y sus características
de celda unitaria aparecen en la tabla 1.1. En la figura 1.4 se describe la notación
que se emplea para las dimensiones y los ángulos de la celda unitaria.

TABLA l.l
Los siete sistemas cristalinos

Elemento característico Red de Características de


Sistema de simetría* Bravais la celda unitaria

Triclínico Ninguno Simple

Monoclínico Un eje de rotación doble Simple a=l=b=l=c


Centrada en a. = f3 = 90° =1= y
la base
Ortorrómbico Tres ejes de rotación doble Simple a=l=b=l=c
mutuamente perpendiculares Centrada en a. = f3 = y = 900
la base
Centrada en
el cuerpo
Centrada en
la cara
Tetragonal Un eje de rotación cuádruple Simple a=b=l=c
o un eje de rotación-inversión Centrada en a. = f3 = y = 900
cuádruple el cuerpo
Cúbico Cuatro ejes de rotación triple Simple a=b=c
(diagonales cúbicas) Centrada en a. = f3 = y = 90°
el cuerpo
Centrada en
la cara
Hexagonal Un eje de rotación séxtuple Simple a =b =1= e
a.= 120°
f3 =y= 90°
Trigonal Un eje de rotación triple Simple a=b=c
(Rombohédrico) a. = f3 = Y -r 90·
*Por supuesto, pueden existir otras propiedades de simetría en casos individuales. aquí se
indican sólo los más peculiares de cada sistema cristalino en particular.
18 Redes cristalinas y tipos de cristales

~------b--------~

Figura 1.4. Notación de los ángulos y las dimensiones dentro de la celda unitaria.

Conviene recordar que, por lo general, los puntos de la red de una estructura
reticular no representan a un solo átomo, sino más bien a un grupo de átomos o
molécula. En consecuencia, además de las propiedades de simetría de los puntos
reticulares propiamente dichos, se necesita tomar en cuenta las propiedades de sime-
tría de las moléculas o grupos de átomos en cada punto reticular alrededor de los
puntos de red propiamente dichos, a fin de enumerar totalmente todas las estruc-
turas cristalinas posibles. Cuando esto se hace, se descubre que hay 230 patrones
repetitivos básicamente diferentes en los que los elementos se pueden acomodar para
formar posibles estructuras cristalinas. Las limitaciones de este libro no permiten
estudiar y enumerar todas estas posibilidades en detalle. Si el lector desea obtener
datos más detallados sobre este tema, convendrá que consulte una de las obras que
tratan sobre cristalografía y que se citan al final de este capítulo.

1.3 ALGUNAS ESTRUCTURAS CRIST AUNAS SIMPLES

De acuerdo con la figura 1.3, es evidente que existen tres redes cúbicas posi-
bles, es decir, la cúbica simple, la cúbica centrada en el cuerpo y la cúbica centrada
en la cara. La celda cúbica unitaria que se ilustra en la figura 1.3 como la red
cúbica simple, constituye también la celda unitaria primitiva, dado que contiene el
mínimo irreductible de un átomo por cada celda. Este resultado se obtiene obser-
vando que en la celda cúbica simple se tienen ocho átomos en los ocho vértices de
la celda, donde, cada átomo es compartido en la misma forma por ocho celdas
unitarias adyacentes a cada vértice. Por tanto, se puede decir que se tienen 8 átomos
en las esquinas y que 1/8 de cada uno de éstos pertenece a esta celda en particular,
dando un total de un átomo por celda unitaria. La celda cúbica correspondiente a la
estructura cúbica centrada en la cara, contiene 8 átomos en los vértices, compartidos
por 8 celdas y 6 átomos centrados en la cara, que son compartidos por dos celdas,
lo cual da un total de 8(1/8) + 6(1/2), o bien, 4 átomos dentro de la celda cúbica.
En la celda cúbica correspondiente a la estructura cúbica centrada en el cuerpo, se
tienen 8 átomos en los vértices compartidos por 8 celdas y un átomo central que
pertenece exclusivamente a dicha celda, dando un total de 8(1/8) + 1 ó 2 átomos
dentro de la celda cúbica. Para estructuras simples que contienen átomos de un solo
tipo, la celda unitaria primitiva contiene casi siempre un solo átomo y, por tanto, se
puede llegar a la conclusión de que la celda cúbica centrada en la cara y la centrada
en el cunpo no son primitivas. En efecto, este es el caso; las celdas primitivas para
las estructm:J<; cúhica crntrada en la cara y cúbica centrada en el cuerpo, se ilustran
Algunas estructuras cristalinas simples 19

Celda primitiva
cúbica centrada en la cara

1
Celda primitiva 1
cúbica centrada en el cuerpo 1
1
1 1 1
11 11
~--------4'
Figura 1.5. Celdas unitaria~ primitivas de redes cúbicas centrada en la cara y centrada en el
cuerpo.

en la figura l.S. Cada celda primitiva contiene un solo átomo. Como siempre, estas
celdas primitivas no son las únicas que se pueden definir, ya que existen muchas
opciones posibles de grupos de vectores base primitivos para cualquiera de las estruc-
turas.
La celda primitiva para la estructura cúbica centrada en la cara que se ilustra
en la figura 1.5 es, obviamente, un caso especial de una estructura trigonal en la
que a = {3 = 'Y = 60°. Para este valor particular de a, la estructura trigonal posee una
simetría cúbica y se reduce a la red cúbica centrada en la cara. Por supuesto, se
puede hacer caso omiso de la celda cúbica de la red cúbica centrada en la cara y
considerar que la estructura sea de tipo trigonal con a = 60°, empleando sólo la
celda primitiva de la figura l.S. Sin embargo, casi siempre conviene considerar la
mayor celda cúbica como la base del cristal, en lugar de utilizar la celda primitiva,
ya que esto permite representar la estructura reticular en un sistema de coordenadas
ortogonales (x, y, z) -el cual es mucho más simple que un sistema oblicuo- y porque
la red tiene todas las propiedades de simetría relacionadas con la estructura cúbica
simple. En el caso de la estructura cúbica centrada en el cuerpo, por similares
consideraciones, se aconseja usar, siempre que sP.a posible, la mayor celda cúbica
como la base del cristal. No obstante, para ciertos fines será absolutamente necesario
emplear la celda primitiva; pero estos casos especiales se señalarán cuando surjan.
Cuando se tienen esferas iguales dentro de un recipiente, el empaquetamiento
más cerrado o compacto que se puede lograr es tener una capa en la base en la que
cada esfera está rodeada por otras seis adyacentes, con capas exactamente iguales
encima de ella, utilizando los intersticios triangulares entre las esferas de la capa
inferior para acomodar las que se van agregando en la capa inmediatamente superior.
Es obvio que en un arreglo de empaquetamiento compacto cada esfera sólo tiene 12
vecinas adyacentes, seis que la rodean en la misma capa, 3 en la superior y. 3 en la
inferior. Cualquier estructura que tiene un empaquetamiento compacto en este sen-
tido, se caracteriza por la propiedad de que cada átomo tiene 12 vecinos adyacentes
y, por lo contrario, no hay otra estructura en la que cada átomo tenga más de 12
vecinos cercanos.
20 Redes cristalinos y tipos de cristales

@ Posiciones para la tercera capa en h.e.c.


© Posiciones para la tercera capa c.c.c. de empaquetamiento
en cúbica centrada en la cara compacto

Figura ] .6. Arre~( o de capas de empaquetamiento compacto en las redes cúbica centrada en la
eara con empaquct~miento compacto y la hexagonal con empaquetamiento com-
p;wto. [Tomado l"Oil autorización de L. V. Azaroff, Introduction to Solids, Mc-
C.raw-Hill (1960), pá¡>;ina 1)0.1
Algunas estructuras cristalinas simples 21

Para tener una estructura con esta clase de empaquetamiento compacto, se


puede colocar una capa inferior A, luego una segunda capa B -tal como se describió
en el párrafo anterior-, después se pone una tercera capa en la que los átomos
quedan directamente arriba de los de la capa A, a continuación, la cuarta capa
cuyos átomos se ubican directamente arriba de los de la capa B, y así sucesivamente
hasta formar un arreglo de capas ABABABAB ... , como se ilustra en la figura 1.6.
Esta estructura tiene una Simetría hexagonal y se le conoce con el nombre de
estructura hexagonal de empaquetamiento compacto (h.e.c.). De igual modo, se pue-
den colocar los átomos de la tercera capa ya no directamente encima de los de la
primera, sino en una tercera gama de posiciones como se ilustra en la figura 1.6,
formando la tercera capa C cuyos átomos quedan arriba, en una posición diferente a
los de las capas A y B. A continuación se agrega la cuarta capa en las posiciones
correspondientes a la capa A y se forma una disposición de capas ABCABCABC ...
Esta segunda estructura ·posible de empaquetamiento compacto es sencillamente, la
cúbica centrada en la cara, que es la normal en las capas de empaquetamiento
compacto de la estructura diagonal cúbica. De acuerdo con la figura 1.3, se puede
ver claramente que cada átomo de la estructura cúbica centrada en la cara tiene sólo
12 vecinos contiguos, a una distancia de ..j2(2 veces el lado del cubo, por lo que la
estructura debe ser de empaquetamiento compacto. Por el contrario, en la estructura
cúbica centrada en el cuerpo, cada átomo tiene sólo 8 vecinos adyacentes a una
distancia de ../'f/2 veces el lado del cubo; si los puntos reticulares de la estructura
cúbica centrada en el cuerpo se observaran como si fueran esferas en expansión,
éstas tocarían el borde del cubo antes de rozar la diagonal y la estructura resultante
no tendría un empaquetamiento tan compacto.
En la figura l. 7 se muestran las estructuras de NaCl y CsCI. La estructura del
NaCI tiene átomos alternantes de Na y Cl en los puntos reticulares de una red
cúbica simple. Los átomos de Na quedan en los puntos reticulares de una estructura
cúbica centrada en la cara, al igual que los átomos de Cl. La estructura del CsCl es
básicamente centrada en el cuerpo y, en ella, los átomos de Cs quedan en las
posiciones centradas en el cuerpo y los de Cl en los vértices del cubo (o viceversa).
Hay un gran número de cristales iónicos que cristalizan en cualquiera de estas dos
formas reticulares.

/ / /
L / /

~ V V
~ V V

V V V
V V V
(O) NoCI (b) CsCI

Figura 1.7. Las estructuras de NaCI y CsCI.

En la figura 1.8 se ilustran las estructuras del diamante y la zincblenda. Las


líneas que conectan los átomos de estas estructuras representan los enlaces covalentes
de los pares de electrones que están dispuestos tctrahédricamente alrededor de cada
átomo. En estas dos estructuras, cada átomo tiene cuatro vecinos contiguos. En el
caso del diamante, la estructura se puede considerar como dos redes cúbicas centra·
das en la cara que se intercalan una en la otra, desplazándose entre sí a lo largo de
la diagonal del cubo en 1/4 de la longitud de dicha diagonal. Por tanto, la re.d tiene
22 Redes cristaliTUlS y tipos de cristales

{al Zincblenda {ZnS) { b) Diamante

Figura 1.8. Estructuras de la zincblenda y el diamante.

Figura 1.9. Diagrama de la estructura reticular de la zincblenda en donde se muestran los


contornos lk la n:lcla unitaria cúbica.
Planos cristalinos e índices de Miller 23

una simetría cúbica. La descripción anterior de la red del diamante se puede en-
tender mejor estudiando la figura 1.9 en donde se muestra cómo la red del diaman-
te se puede describir mediante una celda unitaria cúbica. El silicio, el germanio y el
estaño a- (gris) se cristalizan también en la estructura del diamante. La estructura de
la zincblenda está íntimamente relacionada con la del diamante. En el caso de la
zmcblenda, la estructura se puede representar como dos redes cúbicas centradas en
la cara que tienen una interpenetración, al igual que el diamante, excepto que una de
las redes cúbicas centradas en la cara se compone por completo de átomos de zinc y
la obra está constituida totalmente por átomos de S. Por supuesto, esta estructura
reticular también tiene simetría cúbica. Los compuestos semiconductores III-V,
InSb, GaAs, GaSb, InP, GaP, etc., se cristalizan con esta misma estructura.
Lo "compacto" del empaquetamiento de los átomos en cualquier estructura
dada se puede inferir del número de vecinos más cercanos que rodean a cada átomo.
Esta cifra, que con frecuencia se denomina número de coordinación del cristal,
puede variar de un máximo de 12 en las estructuras de empaquetamiento compacto
hasta el 4, en el caso del diamante y la zincblenda, cuyas estructuras son relativa-
mente "abiertas".

1.4 PLANOS CRISTALINOS E INDICES DE MILLER

En un cristal de red periódica regular, con frecuencia es necesario mencionar el


sistema de planos dentro del cristal que corren en ciertas direcciones, cortando varios
conjuntos de átomos. Así pues, las capas con empaquetamiento compacto de las
redes cúbicas centradas en la cara y hexagonal con empaquetamiento compacto,
forman sistemas muy definidos e importantes de planos cristalinos. La orientación de
estos sistemas de planos dentro del cristal se especifica mediante tres números deno-
minados índices de Miller, que se pueden determinar como sigue:

(1) Se toma como origen cualquier átomo del cristal y se levantan ejes de
coordenadas a partir de dicho átomo en las direcciones de los vectores
base.
(2) Se encuentran las intersecciones de un plano que pertenece al sistema,
expresándolos como múltiplos enteros de los vectores base a lo largo de
los ejes cristalinos.
(3) Se sacan los recíprocos de estos números y se reducen a la tríada más
pequeña de enteros h, k, l, que tienen la misma relación. De donde, la
cantidad (hk/) constituye lol> índices de Miller de dicho sistema de planos.

Por ejemplo, en la figura 1.1 O se muestra un plano cuyas intersecciones son el


doble de la distancia reticular a, tres veces la distancia reticular b y 4 veces la
distancia reticular c. Los índices de Miller de la familia a la que pertenece este
plano se obtienen sacando los recíprocos de estos números, es decir, 1/2, 1/3, 1/4, y
reduciéndolos a la tríada más pequeña posible de enteros que tengan la misma
relación. Esto se logra multiplicando cada uno de los recíprocos p0r doce, que en
este caso dan 6, 4, 3. Los índices de Miller se escriben simplemente encerrando estos
tres números entre paréntesis; en este ejemplo, el plano forma parte de una familia
de planos (643) o sea, un plano.
Puede haber un número de sistemas de planos cuyos índices de Miller difieran
por permutación de los números o de signos menos y, sin embargo, ser todos
cristalográficantente equivalentes en lo que respecta a densidad de átomos y espa-
24 Redes cristalinas y tipos de cristales

Figura 1.10. Un plano reticular (643) de una red cristalina.

ciamiento interplanar. Por ejemplo, en una red ortogonal, los siguientes planos
(Jzkl), (hkl), (hKl), (hkl), (ftld), (fikl), etc., obtenidos al asignar varias combinaciones de
signos menos a los índices de Miller, son equivalentes en este sentido. (Se acostum-
bra escribir los signos menos encima y no antes de los índices de Miller.) De igual
modo, en una estructura reticular cúbica, todos los planos representados por permu-
taciones de los tres índices de Miller entre sí mismos, tales como (hkl), (khl), (lhk),
etcétera, al igual que los que se obtienen tomando varias combinaciones de signos me-
nos, son cristalográficamente equivalentes. C'uando se hace referencia a un grupo
completo de planos cristalográficamente equivall'ntes, de los cuales (hkl) ~s un miem-
bro, se acostumbra encerrar los índices de Miller entre llaves, o sea, { hkl}.
Si el plano es paralelo a uno o dos de Jos vectores a, b, e, una o dos de las
intersecciones se localizarán en el infinito; los índices de Miller correspondientes son,
por tanto. cero. Por ejemplo, si el plano que se ilustra en la figura 1.1 O se hace
girar alrededor de la línea AB hasta que queda paralelo a e, las intersecciones se
convierten en 2, 3, oo, y los índices de Miller son, en consecuencia (320). Si se hace
girar más todavía alrededor de una línea perpendicular al plano a y b pasando por
el punto A hasta que quede en paralelo a b, las intersecciones serán 2, oo, uo, y los
índices de Miller son (1 00). El lector debe conocer a fondo las familias de planos
{ 100} (planos de cara cúbica), { 11 O } y de {111} para las redes cúbicas.
Los índices de una dirección dentro de un cri~tal se pueden expresar como un
conjunto de enteros que tienen la misma relación que los componentes de un vector
en esa dirección, expresados como múltiplos de los vectores base a, b, c. Por tanto,
el índice de dirección de un vector ha+ kb +le es, en todo caso, [hkl]. Los parén-
tesis cuadrados que encierran las tres cifras señalan los tres índices de dirección. Por
supuesto, las direcciones con distintos índices direccionales pueden ser cristalográ-
ficamente diferentes en la misma forma que los planos cristalinos con distintos
índices de Miller; sobre todo las normales a los planos cristalográficamente equiva-
lentes también deben tener direcciones cristalográficamente equivalentes. El conjunto
completo de direcciones cristalográficamente equivalentes de las cuales [hkll es un
miembro, se expresa encerrando los índices de dirección en la siguiente forma: (hk[).
En cristales cúbicos, una dirección con índices direccionales [hkl] es normal a un
plano cuyos índices de Miller son (hkl); pero, por lo general, esto no se aplica a
otros sistemas. Esta es otra de las razones aceptables para relacionar las redes cúbicas
centradas en el cuerpo y la centrada en la cara con estructuras cúbicas más que con
celdas unitarias primitivas. El comprobar este resultado queda como ejercicio para el
lector.
La posición de los puntos de una celda unitaria se especifica en función de las
partes fraccionales de las magn1tudes de los vectores de base a lo largu de las
direcciOne~ de coordenadas correspondientes, tomando siempre como origen el átomo
Espaciamiento de los planos en las redes cristalinas 25

de un vértice. Por ejemplo, las coordenadas del punto central de una celda unitaria
son {1/2, 1/2, 1/2) y las coordenadas de los centros de las caras son (1/2, 1/2,
0), (0, 1/2, 1/2), (1/2, O, 1/2), (1/2, 1/2, 1), (1, 1/2, 1/2) y (1/2, 1, 1/2).

1.5 ESPACIAMIENTO DE LOS PLANOS EN LAS REDES CRISTALINAS

De acuerdo con la figura 1.1 O, se podría pensar que el espaciamiento existente


entre los planos vecinos del sistema (hkl) sería simplemente igual a la longitud de la
normal al plano definida por las intersecciones dadas y el origen. Sin embargo,
generalmente no es así y la razón es que al determinar la ubicación de un plano
(hkl) desde ciertas distancias de intersección, el origen se podría tomar como cual-
quier punto reticular del cristal, por lo que un plano (hkl) debe pasar por cada
punto reticular del cristal. Esto se ilustra gráficamente en la figura 1.11 para el caso
de un conjunto de "planos" en una estructura reticular bidimensional. El sistema de
planos es el que determinan las intersecciones 3a y 2b a lo largo de los ejes, a y b,
respectivamente. En consecuencia, los índices de Miller son (23) (o bien, (230) si se
piensa que los planos son paralelos a un eje e que sale del plano de la hoja de papel
en un cristal tridimensional). Los planos que están delineados con líneas más gruesas
son los que se determinan por medio de las distancias de intersección (3a, 2b) y el
origen se escoge en O. No obstante, el origen podría haberse escogido en el punto
reticular número "1 ", en cuyo caso se habrían definido los planos de trazo más
ligero marcados con "1 ", utilizando el mismo conjunto de distancias de intersección.
De igual manera, el origen se podría haber ubicado en los puntos reticulares 2, 3, 4
ó 5, en cuyo caso, usando todavía el mismo conjunto de distancias de intersección,
el conjunto de planos números 2, 3, 4 y 5 habrían quedado definidos. Sin embargo,
ahora se tiene un plano de esta familia que pasa por cada átomo del cristal, entre

Figura I.l L Una representación de todas las líneas (23) dentro de una red bidimensional.
Si existe un eie e- normal al nlano del papel, este sistema de líneas se puede consi-
derar como los tra10s de planos (230) (que son normales a la página) en el plano
del papel. Observe que sólo se tiene una línea (o plano) del sistema que pasa pnr
cada punto reticular.
26 Redes cristalinos y tipos de cristales

los cuales se intercalan 5 planos adicionales entre cada par de planos originales de
trazo grueso. Ahora se ve que las intersecciones de los planos adyacentes a lo largo
de los ejes a y b difieren, respectivamente, en a/2 y b/3. Para un .conjunto de ín-
dices de Miller (hk) estas intersecciones diferirán en a/h y b/k.
Para demostrarlo, véase primero el área OA CB de la figura 1.11. Se tienen los
puntos reticulares hk que pertenecen a esta área, ya que consiste en hk celdas
unitarias que tienen cada una de ellas un solo punto reticular. La región ABCD, que
obviamente equivale en superficie a OACB (ambas se pueden tomar como superposi-
ciones de dos triángulos congruentes a OAB) por tanto, también tiene hk puntos
reticulares. Esta superficie también contiene sólo hk planos reticulares (6 en el ejem-
plo anterior), uno por cada uno de los puntos reticulares hk dentro del área. Se
observará que cada plano puede cortar sólo un punto reticular dentro de ABCD,
excepción hecha de los planos que cortan los puntos reticulares de las fronteras, que
pueden pasar por dos puntos reticulares, de los cuales un medio o un cuarto pueden
pertenecer a ABCD, dependiendo de que dichos puntos reticulares así intersecados
representen átomos laterales o de vértices. En consecuencia, en ABCD hay hk planos
del sistema que se intersecan con el eje b dentro de una distancia hb, siendo la
diferencia que hay entre las intersecciones b de los planos adyacentes, hb/hk = b/k.
De la misma manera, en el área ABEC que también es igual en superficie a OACB y
que contiene también hk puntos reticulares y hk planos, se observa que se tienen hk
que cortan el eje a en una distancia ka, en donde la diferencia existente entre las in-
tersecciones a de los planos adyacentes del sistema es afh. Para simplificar los conceptos
geométricos, este resultado se obtuvo para un cristal bidimensional (o para planos
paralelos al eje e de un cristal tridimensional). Sin embargo este mismo argumento se
puede ampliar en una forma muy directa para un conjunto de planos (hk{) de un
cristal tridimensional teniendo como resultado el hecho de que las distancias entre
las intersecciones entre los ejes y los planos adyacentes de un sistema con índices de
Miller (hkl) a lo largo de los ejes a-, b- y e- son, respectivamente, afh, b/k y cfl.
El desarrollo de la exposición para un cristal tridimensional queda de ejercicio para
que el lector lo resuelva.
El espaciamiento real d que hay entre los planos adyacentes se puede calcular
tomando cualquier punto reticular como origen, levantando ejes en las direcciones

b
k

Figura 1.12. Angulas direccionales de la normal al plano (hkl).


Qasificación general de ~os cristales 27

a-, b- y e-, y encontrando la distancia perpendicular existente· entre este origen y


el plano cuyas intersecciones con el eje son afh, b/k y cfl. En relación con la fi-
gura 1.12, es obvio que

a b e
d = OP = h cos rx = k cos fJ = l cos y, (1.5-1)

en donde a, {3, 'Y son los ángulos que hay entre la nonnal al plano y los ejes a-, b-
Y e-, respectivamente. No obstante, si n es el vector unitario nonnal al plano, se
tiene que n • a =a cosa, etc., y

n·a n·b n·c


d=-=-=- (1.5-2)
h k l .

En una red ortogonal, tomando el eje de la coordenada x a lo largo de a, el


eje y sobre b y el eje z sobre e, la ecuación del plano (hkl) cuyas intersecciones con los
ejes son a/h, b/k, cfl, es

hx ky lz
f(x,y,z) =-; + b +e = l. (1.5-3)

Si f(x, y, z) =constante es la ecuación de una superficie, entonces Vf es un


vector nonnal a dicha superficie y la unidad nonnal n está dada por

Vf (hfa)i" + (k/b)i, + (lfc)iz (1.5-4)


0 = \-Vf-1 = "'--"-........;;;J'":-h-2..;. . .;. . . ;k2-<--l....:.2.;.....;....=.,
2+b2+2
a e

y el espaciamiento d'que hay entre los planos adyacentes (hkl) es simplemente


n·a 1
d= - = , (1.5-5)
h Jh2 k2 [2
2+b2+2
a e

de acuerdo con (1.5-2). En este punto conviene observar que a, b y e no son


vectores unitarios, en este ejemplo, a = aix, b = biy y e = ciz, en donde ix, iy e iz
son la tríada usual de vectores unitarios a lo largo de las direcciones x-, y- y z-,
respectivamente. En estructuras reticulares no ortogonales, el problema de encontrar
el espaciamiento existente entre planos adyacentes en ténninos explícitos de los
espaciamientos y los ángulos reticulares se hace más complejo y no se estudiará en
esta obra, aunque las expresiones generales (1.5-1) y (1.5-2) son correctas tanto para
sistemas ortogonales como para los no ortogonales.

1.6 CLASIFICACION GENERAL DE LOS CRISTALES

Para darle al lector una imagen inicial amplia de las propiedades y las caracterís-
ticas de varios tipos de materiah:s cristalinos, se hará un repaso breve de algunas de las
características más sobresalientes de varias clases de cristales. Por supuesto, se pueden
28 Redes cristalinas y tipos de cristales

clasificar en muchas formas, por ejemplo, según sus redes cristalinas, propiedades
eléctricas, propiedades mecánicas o características químicas. Sin embargo, para el
estudio que nos ocupa, es más conveniente adoptar un esquema de clasificación
basado en el tipo de interacción que hace que los átomos del cristal se mantengan
unidos. De acuerdo con este esquema de clasificación, los sólidos se subdividen en
cuatro categorías generales: iónicos, covalentes, metálicos y moleculares. Cada una de
estas clases se examinará en lo particular, aunque se reconoce que no son absoluta-
mente distintos y que algunos cristales pueden posser, al mismo tiempo, caracte-
rísticas relacionadas con más de una de estas clases generales.
Los iónicos son cristales en los que los electrones de valencia se transfieren de
un átomo a otro, dando como resultado que el cristal esté compuesto de iones
positivos y negativos. La fuente de energía cohesiva que mantiene unido al cristal es
la intersección electrostática de estos iones. La configuración electrónica de los iones
es esencialmente la de un gas inerte, en donde la distribución de carga de cada ion
es esféricamente simétrica. Los compuestos químicos que contienen átomos muy
electropositivos y electronegativos, por ejemplo, NaCl, KBr, LiF, tienden a formar
cristales iónicos en estado sólido. Casi siempre los cristales iónicos tienen energías de
enlace relativamente altas y, como resultado, se caracterizan por puntos de fusión y
ebullición más o menos elevado. También se caracterizan por ser malos conductores
eléctricos a temperaturas normales y casi siempre son transparentes a la luz visible
en tanto que muestran un solo pico de reflexión óptico característico en la región
lejana infrarroja del espectro. Los cristales son a menudo muy solubles en disolventes
ionizantes tales como el agua, y sus soluciones se disocian fácilmente en iones libres.
Casi siempre los cristales iónicos se cristalizan en estructuras de empaquetamiento
relativamente compacto como las del NaCl y el CsCI.
Los cristales covalentes son aquellos en los que varios átomos comparten equi-
tativamente los electrones de valencia en lugar de transferirlos de unos a otros, como
sucede en los cristales iónicos. De donde, no se tiene una carga neta asociada con
ningún átomo del cristal. A menudo los elementos de las columnas III, IV y V de la
tabla periódica forman combinaciones covalentes. Un ejemplo típico de cristal cava-
lente lo tenemos en el diamante, en el que cada átomo de carbono comparte sus
cuatro electrones de valencia con sus cuatro vecinos más cercanos formando enlaces
covalentes de pares de electrones. Los espins de los electrones de estos enlaces de
par de electrones son antiparalelos. Estos enlaces covalentes de pares de electrones
del diamante son idénticos a las uniones carbono-carbono que se encuentran tan
frecuentemente en los compuestos orgánicos. Tienen una naturaleza muy direccional,
es decir, los electrones tienden a concentrarse a lo largo de las líneas que unen a los
átomos adyacentes y estas líneas tienden a ubicarse tetrahédricamente alrededor de
cualquier átomo. Esta disposición tetrahédrica natural de los enlaces covalentes se
satisface en las estructuras del diamante y la zincblenda y se ha descubierto que los
cristales covalentes tienen a menudo estas estructuras. Por lo general, los cristales
covalentes son materiales duros, quebradizos y de energías de enlace bastante eleva-
das, con puntos de fusión y ebullición elevados. Son semiconductores típicos cuya
conductividad eléctrica es muy sensible a la presencia de pequeñas cantidades de
átomos de impurezas y aumenta al incrementarse la temperatura a niveles lo suficien-
temente elevados. Son transparentes a la radiación de longitudes de onda largas y
opacos a longitudes de onda más cortas, con una transición abrupta que se produce
a una longitud de onda característica y que casi siempre se localiza en la región
visible o infrarroja cercana.
Existe un rango continuo entre las propiedades covalente e iónica; un cristal
dado puede tener naturaleza tanto covalente como iónica y sus electrones de va-
lencia se transfieren en parte y se comparten parcialmente. En la tabla 1.2, los
cmtales de la primera columna se componen de átomos de la columna IV del
Dosificación general de los cristales 29

TABLA 1.2.
Cristales covalentes y iónicos

Compuestos Compuestos Compuestos


Covalentes III-V 11-VI {iónicos)
(Grupo IV) I-VII

e (diamante) BN BeO LiF


BP BeS LiCI
AIN MgO NaF
SI AIP MgS NaCI
GaP CaO KF
AlAs Ca S KCI
ZnS LiBr
Ge GaAs CaSe KBr
InP ZnSe Nal
AISb CdS RbCI
GaSb CdSe RbBr
InAs ZnTe KF
cx-Sn InSb CdTe Rbl
CsBr

sistema periódico y forman cristales completamente covalentes. Los compuestos de la


cuarta columna de la tabla son de '"I y VII" y están constituidos de átomos muy
electropositivos y electronegativos y los cristales de estos compuestos son muy ióni-
cos. La segunda y la tercera columnas contienen compuestos (II-Vl y lll-V) que son
intermedios entre estos dos extremos y tienen naturaleza tanto iónica como cava-
lente. Por supuesto, los compuestos 111-V son un poco más covalentes que los com-
puestos 11-VI. Los compuestos intermetálicos III-V forman, a pesar de su carácter
ligeramente iónico, una serie de semiconductores cuyas propiedades son similares en
muchas formas a las de Jos materiales correspondientes del grupo IV.
Los elementos metálicos en estado libre forman cristales metálicos en los que
están presentes electrones libres. El hecho de que haya tales electrones libres explica
la elevada conductividad eléctrica y térmica de los metales. A su vez, a esta elevada
conductividad eléctrica se deben directamente los elevados coeficientes de reflexión y
absorción ópticas que son las propiedades ópticas más típicas de los metales. Las
propiedades eléctricas y térmicas de los metales que se deben a la existencia de los
electrones libres, se pueden explicar fácilmente si se supone que el cristal metálico es
un recipiente lleno de un "gas ideal de electrones libres". La energía de enlace de
metales "ideales" tales como los metales alcalinos, se originan en la interacción del
gas de electrones libres con iones positivos de la red, aunque para muchos otros
metales esta imagen es mucho más compleja. Las energías de enlace reales de los
cristales metálicos pueden ser muy bajas, como sucede en el caso de los metales
alcalinos, que tienen puntos de ebullición y fusión relativamente bajos o muy eleva-
dos, como el tungsteno. cuyo punto de fusión es muy alto.
Los cristales moleculares son aquellos en los que el enlace entre átomos o las
moléculas no es iónico ni covalente, sino que se origina exclusivamente en fuerzas
dipolares existentes entre los átomos o las moléculas del cristal. A pesar de que un
átomo o una molécula no tiene un momento dipolar promedio, por lo general tendrá
un momento dipolar instantáneo y fluctuante que se origina en las posiciones instantá-
30 Redes cristalinas y tipos de cristales

neas de los electrones dentro de sus órbitas. Este momento dipolar instantáneo
es la fuente de un campo dipolar electrostático que, a su vez, puede inducir un mo-
mento dipolar en otro átomo u otra molécula. La interacción existente entre el mo-
mento dipolar original y el inducido es de atracción y puede servir para unir un
cristal en ausencia de un enlace de tipo iónico y covalente. Las fuerzas de enlace
que se originan en interacciones dipolares fluctuantes de esta naturaleza se conocen
con el nombre de fuerzas de van der Waals. Casi siempre, estas fuerzas son muy
débiles y la energía de enlace que originan disminuye según l/r6 , en donde r es la
distancia entre los dipolos. Entonces, los cristales moleculares se caracterizan por
energías de enlace reducidas y, en consecuencia, por puntos de fusión y ebullición
bajos; por lo general son conductores eléctricos deficientes. Los cristales de com-
puestos orgánicos generalmente pertenecen a esta clase, como es el caso' de los gases
inertes He, Ne, A, etc., en estado sólido.

EJERCICIOS

l. Demuestre geométricamente que la estructura tetragonal centrada en la cara es equiva-


lente a una red tetragonal centrada en el cuerpo en la que el lado de la base de la celda unitaria
es 1/.,¡2 veces la magnitud que tiene para la disposición centrada en la cara. ¿Por qué son
distintas las estructuras cúbicas centrada en la cara y la centrada en el cuerpo?
2. Demuestre que la proporción máxima de espacio que se puede llenar con esferas sólidas
acomodadas en varias estructuras es la siguiente para cada arreglo

Cúbica simple 7T/6,


Cúbica centrada en el cuerpo 7Tv' 3/8,
Cúbica centrada en la cara 7Tv'1¡6,
Hexagonal con empaquetamiento compacto 7Tv'2/6,
Estructura del diamante 7Tv'3!t6.

3. Analice desde el punto de vista físico el porqué un cristal real no puede tener un eje
de un múltiplo de cinco de simetría rotativa.
4. (a) Dibuje los bosquejos que ilustren Jos planos (100), (110) y (111) para una celda
unitaria cúbica. •
(b) ¿Cuántos planos equivalentes {lOO'}, ( 110} y { 111} existen en un cristal cúbico?
Considere que los planos (hkl) y (hkl) son idénticos.
5. (a) ¿Cuántos planos equivalentes {123} existen en un cristal cúbico?
(b) ¿Cuántos planos equivalentes { 111} existen en un cristal ortorrómbico?
(e) ¿Cuántos planos equivalentes { 123} existen en un cristal ortorrómbico? En todos
estos casos se considerará que los planos (hkl) y (hkl) son idénticos.
6. Demuestre que en un cristal cúbico la dirección [hkl] es normal al plano (hkl).
7. Demuestre que las intersecciones entre los ejes y Jos planos adyacentes (hkl) a Jo largo
de los ejes, a-, b- y e- dentro de una estructura tridimensional son a/h, b/k y e/1, respectiva-
mente, utilizando una extensión de los métodos que se usaron en el caso bidimensional dt' la
sección 1.5.
8. Demuestre que para las fuerzas de van der Waals, la energía de interacción de los
átomos y las moléculas desciende en la forma lfr6, en donde r es la distancia que hay entre
los átomos o las moléculas interactuantes. Nota: principie teniendo en cuenta la energía potencial
de un dipolo eléctrico en un campo eléctrico externo.
9. De acuerdo con los resultados de la teoría electromagnética de Maxwell para ondas
planas, demuestre que en el caso de un conductor muy bueno (a~oo, K ~oo, a= conductividad,
K =constante dieléctrica) se debe esperar un alto grado de reflectividad superficial y una gran
absorción interna.
CAPITULO 2
Análisis cristalográfico
con rayos X

1.1 INTRODUCCION

El uso de la difracción de los rayos X como técnica para analizar la estructura


de los cristales, data del descubrimiento de los efectos de difracción de los rayos X
en muestras de un monocristal, efectuado por von Laue en 1912. Laue predijo que
:0s átomos de un espécimen monocristalino producirían la difracción de un haz de
::o~ os X monocromático y paralelo, originando una serie de haces difractados cuyas
.:!necciones e intensidades dependerían de la estructura reticular y la composición
":.~ímica del cristal. Estas predicciones se verificaron en un plazo muy corto, gracias
1 los trabajos de Friedrich y Knipping. En la figura 2.l(a) se muestra un diagrama
esquemático del arreglo experimental correspondiente. La ubicación de los máximos de
difracción fue explicada por W. L. Bragg, 1 a base de un modelo muy simple en el que
;.e supone que la radiación X se refleja especularmente desde los planos sucesivos de los

fi!~Jra 2.1. (a) Diagrama esquemático de la difracción de rayos X obtenida con la técnica de
Laue.

1 W.L. Bragg, Proc. Cambrige Phil. Soc. 17, 43 0912).

31
32 Análisis cristalográfico con rayos X

Figura 2.1. (continúa) (b) Un patrón de difracción de Laue de un cristal de fluoruro de litio,
haz incidente de rayos X a lo largo de una dirección { 100} (fotografía por cor-
tesía de H. A. McKinstry, Materials Research Laboratory, Pennsylvania Sta te Uni-
versity).

471"
~~--~~----~~L-~~--~~~----~~----~671"

Planos
del cristal

AB = AC =d sen 8

Figura 2.2. Representación de Bragg de una difracción de rayos X, de acuerdo con reflexion.:s
en fase desde planos sucesivos de un sistema particular (hk/).
Introducción 33

diversos sistemas (hkl) del cristal, y en el que los máximos de difracción sólo se encuen-
tran para direcciones de incidencia y reflexión tales que las reflexiones de los planos
adyacentes de un sistema interfieran en forma constructiva, con diferencias de fase de
2rrn radianes, en donde n es un entero.
Según este experimento, la diferencia de trayectoria para reflexiones sucesivas
sería igual a un número entero de longitudes de onda de los rayos X. Sin embargo,
esta diferencia de trayectoria, de acuerdo con la figura 2.2, es 2d sen e, en donde d
es el espaciamiento entre planos átomicos adyacentes, tal y como lo dan las expre-
siones (1.5-2) o (1.5-5) y e es el ángulo de incidencia entre el plano atómico y el
haz incidente. Por tanto, los haces fuertemente difractados deben propagarse, fuera
del cristal, en direcciones para las que se satisface la ecuación de Bragg

nA.= 2d sen e (2.1-1)

A partir de 1916, la observación experimental de los patrones de difracción de


rayos X se simplificó enormemente gracias a la introducción del método de potencia
de Debye y Scherrer. 2 Como se ilustra en la figura 2.3(a), en este método se deja
pasar un haz monocromático paralelo lit> rayos X a través de un espécimen fina-
mente pulverizado. En forma puramente accidental, algunos de los microcristales del
espécimen pulverizado estarán orientados en el ángulo correcto de difracción para un
conjunto particular de planos (hkl), como se expresa en (2.1-1) y el haz difractado

' ' 1

.
'
\'
.
. )\ ;
¡

(b)

Figura 2.3. (a) Diagrama esquemático de la difracción de rayos X obtenida con la técnica del
polvo de Debye-Scherrer. (b) Un patrón de difracción de polvo, de Debye-Scherrer
a partir de una muestra de un óxido compleJO de escandia y circonio (fotografía
por cortesía de H. A. l\lcKimtry, Materials Research Laboratory, Pennsylvania State
University).

2 P. Debye y P. Scherrer, Physikal, Zeitschr. 17, 277 (1916).


34 Análisis cristalográfico con rayos X

se produce inmediatamente. Puesto que la condición de difracción se puede satisfacer


para cualquier orientación angular posible </> de la normal a los planos de dispersión
alrededor del eje del haz incidente, y dado que siempre habrá microcristales orien-
tados en tal forma que produzcan la difracción (hkf) para cualquier valor de </>, el
haz difractado tendrá la forma de un cono cuyo ángulo de abertura es e y no sólo
un haz de rayos. Se acostumbra colocar una tira de película en la pared interior
de una cámara cilíndrica, concéntrica con la muestra, con el fin de interceptar una
porción específica de estos conos de difracción, que son una serie de arcos produ-
cidos sobre dicha película. En la figura 2.3(b) se ilustra un patrón pulverizado
logrado mediante este sistema.

2.2 FISICA DE LA DIFRACCION DE LOS RAYOS X:


LAS ECUACIONES DE VON LAUE

Los rayos X se pueden producir fácilmente permitiendo que electrones de alta


energía choquen contra un ánodo metálico que constituye el blanco. Los rayos X
producidos en esta forma poseen, además de un espectro de fondo continuo, algunas
líneas espectrales muy intensas y casi monocromáticas cuya frecuencia es caracte-
rística del material del blanco. Estas líneas se originan debido al paso de electrones
de capas internas del átomo a estados de mayor energía de los cuales se apartan
para volver al estado base original con la consecuente emisión de rayos X. La
producción de rayos X debido a la interacción de electrones de alta energía con la
materia se analiza más detalladamente en la obra de Leighton. 3
Si existe un potencial V0 entre el cátodo y el ánodo de un tubo de rayos X,
los electrones adquieren una energía eV0 -en donde e es la magnitud de la carga
electrónica- al llegar al ánodo. El cuanto de rayos X más energético que pueden
producir tales electrones es aquel para el que la energía del cuanto hv es igual a
eV0 • En consecuencia, para este cuanto,

eV0 = hv =he/A., (2.2-1)

en donde h( = 6.62 x 10- 27 erg-seg) es la constante de Planck. De donde, la longitud


de onda de rayos X más corta que se puede producir es

A.=~
l/ . (2.2-2)
e o

Para un voltaje de 10 kilovolts, esto demuestra que la longitud de onda mínima


de rayos X que se puede excitar es 1.24 x I0- 8 cm o sea, 1.24 unidades Angstrom.
Esta magnitud es del orden de las distancias interatómicas de cristales reales y, de acuer-
do con la ecuación de Bragg (2.1-1), es la apropiada para producir efectos de difracción
observables sin recurrir a valores extremos de d y e. Por tanto, en un tubo de rayos X
en el que los electrones se aceleran mediante un potencial de unas cuantas decenas de
kilovolts, se puede considerar satisfactorio para producir rayos X apropiados para el
trabajo de difracción cristalográfica.

3 R B. 1 ei¡•hton, l'rinl"iples o( Modern Physics, McGraw-Hill Book Co., Inc. Nueva York
(1959), p 405 d 21.
Física de la difracción de los rayos X 35

Cuando los átomos de un cristal están sometidos a una radiación electromag-


nética, por ejemplo, los rayos X, se ejercen sobre ellos fuerzas eléctricas debidas a la
interacción de las partículas cargadas de los átomos con el vector del campo eléc-
trico de la onda electromagnética. Debido a esto, los electrones atómicos vibran
armónicamente a la frecuencia de la radiación incidente sufriendo una aceleración.
Estas cargas aceleradas vuelven a irradiar energía electromagnética, de acuerdo con la
teoría electromagnética, a la frecuencia de vibración, es decir, a la de la onda
incidente. A las frecuencias de la luz visible en donde la longitud de onda incidente
es mucho mayor que las distancias interatómicas, la superposición de las ondas
reirradiadas o dispersas en esta forma por los átomos individuales del cristal, produce
solamente los efectos bien conocidos de la refracción y la reflexión ópticas. Sin
embargo, a las frecuencias de los rayos X, la longitud de onda incidente es compa-
rable al espaciamiento interatómico y se puede observar la difracción de la radiación
de los átomos del cristal.
Bragg supuso que los sistemas de planos cristalinos reflejarían especularmente
los rayos X, siempre y cuando se satisficiera la condición para la interferencia
constructiva entre las reflexiones de planos atómicos sucesivos. A continuación se
examinará en detalle la forma en que los rayos X dispersados de diferentes átomos
individuales se pueden recombinar de varias maneras. Primero se examinará la radia-
ción dispersada por dos centros de dispersión idénticos separados por una distancia r.
El vector n 0 se define como un vector unitario en la dirección del haz incidente y
se considera que el vector n 1 es un vector unitario en una dirección arbitraria de
dispersión, como se indica en la figura 2.4. Se supone que la radiación incidente es
un haz paralelo y el haz disperso se detecta en un punto de observación muy
distante. Por tanto la diferencia de trayectoria entre la radiación dispersa en P y la
que se dispersa en O es

PA - OB = r • n0 - r • n 1 = r • (n 0 - n 1 ). (2.2-3)

El vector n 0 - n 1 =N es la normal a lo que en la representación de Bragg se


denomina plano de reflexión, si n 1 fuera una dirección de difracción, como se
ilustra en la figura 2.5. De acuerdo con esta figura, también es evidente que la
magnitud de este vector es

N=2sen0. (2.2-4)

Figura 2.4. Geometría de la situación de dispersión de rayo~ X que ~e .mali1a en la ~cc­


ción 2.2.
36 Análisis cristalográfico con rayos X

/
/
/
/
/
/

Plano de
e_ _L_ di~ersión
Figura 2.5. Relación geométrica del haz incidente y el difractado, la normal de dispersión y el
"plano de dispersión".

La diferencia de fase rl>r entre la radiación dispersa en los dos puntos es, sen·
cillarnente 27T/A veces la diferencia de trayectoria, de donde,

(2.2-5)

Ahora bien, para que haya una difracción máxima en la dirección n cada áto-
mo del cristal debe contribuir a la dispersión en esa dirección, con una diferencia
de fase igual a un múltiplo entero de 27T radianes. Para que esto sea verdad, lo único
que se necesita es que la radiación de los átomos separados por los vectores reticu·
lares primitiJ;os a, b, y e se sumen en fase, ya que en este caso, la contribución de
otros átomos separados del origen por combinaciones enteras de estos vectores se
sumarán en fase obligatoriamente. Si las contribuciones de dispersión de átomos
circunvecinos tuviera una diferencia de fase distinta, siempre sería posible encontrar
un átomo del cristal que contribuyera con una radiación exacta de 1T radianes fuera
de fase con la contribución de un átomo dado; estas contribuciones se cancelarían
átomo por átomo, y no darían un haz difractado. Si se analiza un ejemplo en el
que átomos circunvecinos a lo largo de la dirección a contribuyen con componentes
de radiación en una dirección dada, que están fuera de fase en 1T radianes (o
7T/2, 7T/4, 7T/6, etc.,) se verá con claridad que esta afirmación es fácil de corroborar.
En consecuencia, lo único que se requiere es que se obtenga un múltiplo
entero de 27T (2.2-5), en donde r es igual a a, b o e, es decir, se requiere simultá·
neamente que

2n
-(a· N)= 2nh' = 2nnh
}.

2n
T (b • N) = 'J.nk' = 2nnk (2.2-6)

2n
-;-(e· N)= 2nl' = 2nnl.
l.

En estas expresiones, h', k', !' pueden ser cualquiera de tres enteros; en ge-
neral estos tres enteros pueden contener el factor común entero de mayor valor n
superior a la unidad, en cuyo caso se puede escribir h' = nh, k'= nk y !' = nl, en
Factor de dispersión atómica 37

donde h, k y 1 son ahora tres enteros en la misma relación que h', k' y 1 ' sólo que
no tienen un factor común mayor que la unidad. Si h', k', y 1 ', no tienen un factor
común mayor que la unidad, entonces se considera que n es la unidad. Si a,~. y 'Y
son los ángulos entre la normal de dispersión N y los ejes a-, b- y e- del cristal,
respectivamente, entonces, de acuerdo con (2.2-4), a • N= aN cosa= 2a sen() cosa,
etcétera, de donde (2.2-6) se puede expresar también como sigue

2a senO cos oc= h'A. = nh.A.,

2b sen (} cos fJ = k' A. = nk.A., (2.2-7)

2c sen (} cos y = l' A. = nl.A..

Estas expresiones se conocen con el nombre de ecuaciones de Laue. Para una


longitud de onda incidente dada, >.., y valores e~pecíficos de los enteros h, k, l y n,
las ecuaciones determinan un cierto valor de () y dos de las tres cantidades (cos a,
cos ~. cos 'Y). No obstante, sólo dos de las trc~ cantidades (a,~. 'Y) son independientes
debido a que una vez que se fijan los ángulos entre un vector y dos de los tres ejes
de coordenadas, la dirección del vector queda fija y el tercer ángulo se puede
determinar trigonométricarnente. Por ejemplo, en un sistema de coordenadas ortogo-
nales, un resultado elemental de geometría analítica es que cos2 a + cos2 ~ + cos 2 'Y =
l. Las tres ecuaciones (2.2-7) sirven, por tanto, para determinar un valor único de ()
y N, definiendo así una dirección de dispersión. Los cosenos de dirección de la
normal de dispersión N son, de acuerdo con la expresión (2.2-7), proporcionales a
h/a, k/b y 1/c. Sin embargo, los planos cercanos cuyos índices de Miller son (hkl), se
intersecan con los ejes a-, b- y e- a intervalos a/h, b/k y c/1; por tanto, los cosenos
de dirección de la normal a la familia de planos (hkl) son también proporcionales a
hja, k/b y ljc, de acuerdo con (1.5-1). La normal de dispersión N es, por ende,
idéntica a la normal de los planos (hkl) y, en consecuencia, los planos (hkl) pueden
tomarse como los de reflexión en la representación de Bragg.
Se puede demostrar que la ecuación de Bragg se sigue de las ecuaciones de
Laue, haciendo que h =a cos ajd, k= b cos ~/d, 1 =ecos 'Y/d, en la expresión (1.5-1),
de acuerdo con lo cual una de las tres ecuaciones de Laue se reduce a

nA.= 2d sen 8,

en donde d es la distancia entre los- planos adyacentes del sistema (hkl) y en donde
el orden n de la difracción es el factor común más alto entre los órdenes de
interferencia h', k' y l '. Por lo general, para referirse a una reflexión de rayos X
observada, se citan los números (h' k' 1 ') que dan el orden de interferencia entre los
átomos circunvecinos a lo largo de los ejes cristalinos; en consecuencia, el máximo
de difracción de primer orden para los planos ( 111) se menciona como la reflexión
(111), el máximo de difracción de segundo orden para el mismo conjunto de planos
(n = 2, h' = 2h, k' = 2k, 1' = 21) es la reflexión (222), el tercer orden es la reflexión
(333), etc.

2.3 FACTOR DE DISPERSION ATOMICA

Los cálculos de la sección anterior se basaron en la supostcton de que los


centros de los puntos de dispersión coincidían con los puntos reticulares. Ahora,
38 Análisis cristalográfico con rayos X

conviene tomar en cuenta que la dispersión, que es el resultado de una interacción


entre los electrones del átomo y un haz de rayos X, puede desarrollarse en cualquier
punto en que se encuentren los electrones. En otras palabras, se desea modificar los
cálculos considerando que la radiación X se dispersa debido a una distribución con-
tinua de "densidad de electrones" relacionada con cada punto reticular. Como se
verá más tarde, este concepto concuerda totalmente con el punto de vista de la
mecánica ondulatoria del proceso. Sin embargo, se debe hacer notar que se está
descuidando el efecto de dispersión de los núcleos atómicos que interactuán con
mucha menor fuerza con los rayos X. Se encontrará que, debido a la extensión
finita de la distribución de densidad e.lectrónica, la amplitud de la radiación difrac-
tada se multiplica por un factor que incluye la longitud de onda de los rayos X, el
ángulo incidente y la distribución de densidad electrónica asociada con los átomos.
Se principiará inquiriendo sobre la relación entre la amplitud de difracción de
los rayos X, en el ángulo de Bragg, dispersados por un elemento de carga p(r)dv,
ubicado en un elemento de volumen dv alrededor del punto r, y la que dispersa un
electrón de un solo punto en un punto de la red, como se ilustra en la figura 2.6.
En este caso, p(r) es la densidad de electrones, p(r) dv es la probabilidad de que se
encuentre un electrón dentro del elemento de volumen dv. Por supuesto, es necesrio
que

ip(r) dv = Z, (2.3-1)

en donde Z es el número de electrones por átomo, esto es, el número atómico de


los átomos de los que está compuesto el cristal. La integral anterior se toma sobre todo el
espacio; aunque al hacer los cálculos se supone habitualmente que las "nubes de elec-
trones", relacionadas con diferentes átomos del cristal, no se superponen en for-

Figura 2.6. Geometría de la situación de dispersión de rayos X que se analiza en la· sección 2.3.
Radiación dispersada en el ángulo ele Bragg por una densidad electrónica contenida
en el elemento de volumen dv en r, que se compara con la que se dispersaría des-
de un ciPctrón de punto en O.
Factor de dispersión atómica 39

ma apreciable, de donde, dicha nube electrónica de un solo átomo queda confmada


al volumen de una celda unitaria.
La diferencia de fase if>n entre la radiación dispersada en el origen y la que se
dispersa en el elemento dv en r es, de acuerdo con (2.2-5)
2n
cj>, = T (r • N). (2.3-2)

Si la amplitud de dispersión desde el electrón del punto a lo largo de la dirección


n 1 se representa mediante Aei(ks-wt), en donde k= 2n/A. y ses una coordenada de
distancia a lo largo de la dirección de dispersión n 1 , entonces, la amplitud de
dispersión a lo largo de tal dirección, a partir del elemento dv, será p(r)dv veces más
fuerte (puesto que será proporcional a la can ti dad de carga en ese elemento) y
estará fuera de fase en una cantidad dada por (2.3-2). La relación de la amplitud de
la radiación que dispersa el elemento dv con la que dispersa un electrón de punto
en el origen que se denominará df, será entonces

Aei(ks-wt)+i<i>,p(r) dv .
dr = . = pfr)é2n•fA.)(r·N) dv (2.3-3)
J Ae•<ks wt) ' ·

Si se integra sobre todo el espacio, se encontrará la relación f de la amplitud


dispersa en el átomo entero con la de un electrón de punto, en un punto reticular.
De donde,

f = 1 p(r)e(2ní/A.)(r·N) dv. (2.3-4)

No obstante, de acuerdo con la expres1ón (2.2-4)

2n 2n 4rr
T (r ·N)= T Nr cos 8' = T r sen() cos ()' = w cos ()', (2.3-5)

4rr
en donde 11 = "T sen 8. (2.3-6)

Si la densidad de carga del átomo es esféricamente simétrica y, por tanto, es


una función exclusiva de r, p(r) = p(r) y

f = f' J: J:n p(r)eiw cos 8 ' r 2 sen()' dr d()' dc/J. (2.3-7)

Se pueden evaluar las partes angulares de esta integral, integrando primera-


mente sobre Q>, luego sobre 8' (haciendo que x = cos 8', dx =sen O' d8'), y expre-
sando finalmente los factores exponenciales como funciones trigonométricas, lo cual da

f(!l) = l oo

o
sen 11r
4rrr 2 p(r) - - dr.
Jll"
(2.3-8)

Esta cantidad, es decir, la relación de la amplitud dispersada por el átomo real


con la que dispersa un solo electrón sobre un punto reticular, se denomina factor de
dispersión atómica. Puesto que 8 -+O, Jl-+ O y sen JlY/JlY-+ 1, de donde

Joj 4rrr p(r) dr = fp dv = Z,


00
!Ímf(tt) = 2
(2.3-9)
11~o v
40 Análisis cristalográfico con rayos X

Los valores de p(r) deben obtenerse, evaluando, de acuerdo con la mecamca


cuántica, las "funciones de onda" de los átomos del cristal. En un capítulo posterior
se verá en qué consiste este proceso. En la práctica, las funciones ondulatorias de los
átomos libres se utilizan muy a menudo en los cálculos del factor de dispersión,
para obtener resultados aproximados para las intensidades esperadas; mientras que las
funciones ondulatorias reales modificadas se emplean para los átomos, cuando éstos
se encuentran en una red cristalina.

2.4 FACTOR GEOMETRICO DE LA ESTRUCTURA

Hasta ahora, se ha supuesto que se trata de celdas unitarias con átomos exclu-
sivamente en los vértices (es decir, celdas unitarias primitivas). Si se desean predecir
las características de la radiación difractada desde cristales con celdas unitarias com-
plejas, que contienen más de un átomo, como sucede en las celdas cúbicas para las
estructuras cúbica centrada en el cuerpo y cúbica centrada en la cara, se debe
explicar la interacción de los haces que se difractan desde los diversos átomos,
dentro de la celda unitaria. Si para la reflexión (h' k'!') se representa la relación de
la amplitud de radiación que dispersa toda la celda unitaria en función a la que
dispersa un electrón de punto en el origen, por medio de F(h' k'!'), entonces

F(h'k'l') = ¿¡;ei4>;. (2.4-1)


i

En este caso, [¡ es el factor atómico de dispersión para el iésimo átomo de la


celda unitaria y cp¡ se relaciona con la diferencia de fase entre la radiación dispersada
en el origen y la dispersada del iésimo átomo de la celda unitaria. La suma se
obtiene, tomando en cuenta todos los átomos que pertenecen a la celda unitaria. La
diferencia de fase cjJ¡ está dada por (2.3-2), de donde (2.4-1) se puede expresar como
sigue:

F(h'k'l') = ¿¡;e<2xi/.l.)(r;·N>, (2.4-2)


i

en donde r¡ es un vector desde el origen hasta el iésimo átomo de la celda unitaria.


Si las coordenadas de posición fraccionales del iésimo átomo son (x¡, y¡, z¡), de
acuerdo con lo definido en la sección 1.4, entonces, r¡ se puede expresar así:

f¡ = X¡a + y¡b + Z¡C. (2.4-3)

Sin embargo, de acuerdo con la ecuacwn (2.2-6), a · N= h'X, etc.; substi-


tuyendo la (2.4-3) en la (2.4-2) y utilizando este resultado, se encuentra que

r; ·N= A(h'x¡ +k' y¡+ l'z;), (2.4-4)

de donde F(h'k'l') = Lf¡e2xi(h'x;+k'y1 +1'z;). (2.4-5)


i
Factor geométrico de lo estructura 41

Cuando todos los átomos del cristal son idénticos, el resultado se puede expre-
sar en una forma especialmente simplificada, porque, en ese caso, todas las[¡ tienen
el mismo valor f Por tanto, la ecuación (2.4-5) se convierte en

F(h'k'l') = fS (2.4-6)

en donde S= L e2ni(h'.x¡+k'y¡+l'z¡). (2.4-7)


i

Por tanto, la amplitud total dispersada está dada por el producto del factor de
dispersión atómica y un factor S, que está regido por la disposición geométrica de
los átomos, dentro de la celda unitaria y que se conoce como el factor geométrico
estructural. Para los cristales en los que no todos los átomos son idénticos, esta
separación es imposible y, en tales casos, se utilizará la forma más general (2.4-5).
La intensidad del haz difractado es proporcional al cuadrado de la amplitud F
o, más exactamente, dado que F es compleja, al cuadrado del valor absoluto de F,
que es F* F, en donde F* es el conjugado complejo de F Si F(h' k' l '), como lo
expresa (2.4-5), se escribe como el número complejo a+ i{3, entonces, F* =a- i(3 y

(2.4-8)

en donde a:= Re(F) = L [f; cos 2n:(h'x; +k' y;+ l'z;)], (2.4-9)
i

y P = Im(F) = L [J¡sen 2n:(h'x; +k' y¡+ l'z¡)]. (2.4-10)


i

Como ejemplo, se verá el caso de un cristal cúbico centrado en el cuerpo, en


el que todos los átomos son idénticos. En esta estructura, se tienen dos átomos
dentro de la celda cúbica unitaria: un átomo del vértice y otro en el centro del
cuerpo; se procede a asignar arbitrariamente el átomo del vértice cuyas coordenadas
(x¡, y¡, z¡) son (0, O, O) a la celda unitaria y no se consideran los otros átomos de
vértice; el otro átomo de la celda es el del centro del cuerpo, que pertenece exclu-
sivamente a la celda unitaria, cuyas coordenadas son (t.t.t). Por tanto, de acuerdo
con esta situación, la amplitud de difracción para la dirección de difracción (h' k' l ')
es la que señalan las expresiones (2.4-6) y (2.4-7),

F(h'k'l') = fL e2>ti(h'.x,+k'y,+t'••> = f[l + ein(h'+k'+t'>]. (2.4-11)


i

Puede pensarse que la forma en que un átomo de vértice se asignó a la celda


y los otros se excluyeron, es demasiado arbitraria, por lo que se puede proponer un
procedimiento más razonable, en el que i de cada átomo de vértice se asigna a la
celda, dejándolos en sus respectivas ubicaciones~ Esta forma alternativa de proceder
lleva exactamente a la misma expresión que la que se obtuvo en (2.4-11) para el
factor de estructura geométrica. La verificación de esta afirmación quedará como
tarea para el lector. En general, la asignación de los átomos que pertenecen a la
celda unitaria puede hacerse en cualquier forma arbitraria, como antes se hizo, siem-
pre que se le asigne a ésta el número correcto de átomos de cada categoría (cara,
vértice, borde, interior).
42 Análisis cristalográfico con rayos X

De acuerdo con (2.4-11), el factor geométrico de la estructura 1 + exp(hr(h' +


k' + l ')] desaparece para cualquier reflexión (h'k'l ') para la que h' +k'+ l' sea un
número impar, ya que exp(mri) = -1 cuando n es impar. Por tanto, en la estructura
cúbica centrada en el cuerpo, faltan ciertas reflexiones (h'k'l '), que estarían pre-
sentes en una estructura cúbica simple, con la misma dimensión lateral del cubo. Por
ejemplo, no existe una reflexión (100), aunque sí se tiene la reflexión (200); del
mismo modo, no hay la reflexión (111) aunque se tiene la (222). Este efecto se
puede comprender físicamente, cuando menos en el caso de la reflexión (100),
observando primeramente que para una estructura cúbica simple, los haces reflejados
desde las caras superior e inferior del cubo de la celda unitaria, difieren 2rr en fase
para la dirección de difracción (1 00). Sin embargo, en la estructura cúbica centrada
en el cuerpo que tiene la misma dimensión lateral del cubo, existe otro plano de
átomos (centros de cuerpos), ubicados paralelamente y a la mitad entre los planos
de las caras superior e inferior del cubo de las celdas unitarias, como put..de verse en
la figura 2.7. La densidad de átomos en estos planos intermedios es la misma que la
de los planos de las caras superior e inferior del cubo y, por tanto, dan origP.n a
haces difractados, con la misma intensidad que los producidos por los planos supe-
rior e inferior de la celda unitaria; pero están fuera de fase con estos haces por rr
radianes. Los haces difractados desde los planos superiores y los del centro del
cuerpo interfieren en forma destructiva en pares, sin producir un haz difractado neto
para este conjunto de condiciones. No obst?.nte, la reflexión (200) está presente,
debido a que, en ese caso, los planos superior e inferior dan origen a haces que
están 4rr fuera de fase. Entonces los planos de los centros de cuerpo contribuyen,
con haces que difieren 2rr en fase de las reflexiones obtenidas de los planos superior
e inferior, reforzándolos en lugar de cancelarlos. Las otras reflexiones faltantes para
la estructura cúbica centrada en el cuerpo se pueden explicar físicamente, siguiendo
la misma trayectoria de razonamiento.

Los haces
se refuerzan

(1 00) reflexión Celda unitaria c.c.c.


reflexión (200)

Figura 2.7. Relaciones de fase para los ángulos de difracción (100) y (200), en una estructura
cúbica centrada en el cuerpo.
La red reciproca 43

2.5 LA RED RECIPROCA

En este punto, conviene presentar el concepto de la red recíproca, que es una


estructura reticular de puntos, que está relacionada en cierta forma con la red
cristalina real. La condición de Bragg para la difracción de rayos X se puede ex-
presar en una forma muy sencilla con la ayuda de la red recíproca y en uno de
Jos vapítulos posteriores se verá que el comportamiento mecánico ondulatorio de los
electrones en las redes cristalinas periódicas se entiende más fácilmente en relación
con la red recíproca del cristal.
Si a, b y e son los vectores primitivos de translación de una red cristalina real,
los vectores primitivos de translación de la red recíproca, a*, b*, y e* se definen
mediante las relaciones

a*· a= b* • b =e*· e= 1 (2.5-1)

y a*· b =a*· e= b* ·e= b* ·a =e*· a= e*· b =O. (2.5-2)

Puesto que, de acuerdo con (2.5-2), a* • b =a* · e= O, el vector a* es perpendicular


al plano determinado por b y c. En consecuencia, es paralelo al vector b x e y se
puede expresar como un múltiplo de ese vector, esto es

a*= A(b X e), (2.5-3)

en donde A es una constante escalar. Sin embargo, de acuerdo con (2.5-1)

a* ·a= A(b X e)· a= 1, (2.5-4)

de donde, resolviendo para A y substituyendo el valor así obtenido en {2.5-3),

a* = b X e
. (2.5-5)
a· b X e

De igual manera, se puede demostrar que

b* = e X a
a· b X e

* = a-X- b-
e
a· b X e

Si se utiliza el mismo planteamiento general, se pueden obtener las siguientes


transformaciones inversas

b* X e*
a = a* . b* X e*, (2.5-6)

etcétera.
Como ejemplo, supóngase que se desea determinar la red recíproca de una
estructura cúbica centrada en la cara. Se debe principiar con la celda unitaria pri
44 Análisis cristalográfico con rayos X

mitiva de la figura 1.5(a), para la cual, los vectores de base primitivos a, b y e se


pueden expresar como sigue:

a('lx + .,
a= 2 .)

(2.5-7)

e= 2.a('•, + •.'
.)

en donde a es el lado de la celda cúbica y en donde el eje de la coordenada x se


toma a lo largo de a, el eje y va sobre b y el eje z pasa por c. Entonce~,
2
a4 Ci.x + i.) X (i, + i.) 1
*
a =
b X e
= 3
(' . . )·
= - •x + •, - •. '
a· b X e a ('lx + IJI
S . ) ' [('lx + lz
. ) X ('1)1 + lz
. )] a

de igual modo, b* = -1 ('lx -


.
IJI + lz. ) ' e * = -1 ( .
-•x + .,• + ••.
•) (2.5-8)
a a

Es evidente que esos vectores tienen las direcciones cúbicas diagonales, al igual
que los vectores primitivos de la estructura cúbica centrada en el cuerpo, como se
puede ver en la figura 1.5(b). Además, se debe observar que el espaciamiento reticu-
lar de la red recíproca es proporcional a 1/a. O sea, que cualquier vector r* que
conecte dos puntos reticulares de la red recíproca, debe tener la forma

r* =la*+ mb* + ne*, (2.5-9)

en donde /, m y n son enteros; al substituir las expresiones correspondientes a a*,


b*, y e* de (2.5-8) en (2.5-9), es evidente que los puntos de la red recíproca deben
tener (x, y, z) coordenadas de la forma

1
(x,y,z) = - [(l + m - n), (l- m+ n), ( -l +m+ n)], (2.5-10)
a

en donde l, m y n pueden tomar cualquier valor entero. En la tabla 2.1 se presenta


una tabulación de estos puntos reticulares posibles; los diversos casilleros de la tabla
corresponden a valores específicos de l y m, esto hace que la forma de las coorde-
nadas indicadas en cada casillero varíe sólo con n, de acuerdo con (2.5-1 0), en
función de los valores correspondientes de l y m, ahí incluidos. En la tabulación que
se da aquí, cualquier punto cuya coordenada x, y o z exceda de 2 (aparte del
factor constante 1/a, que no se incluye en las entradas de la tabla), queda descar-
tado por completo; por tanto, los puntos que se conservan son suficientes para
describir 8 celdas unitarias de la red recíproca. Cuando se grafican estos puntos,
insertando el factor constante 1/a -y se considera la forma que tienen los vectores
primitivos de la red recíproca- es evidente que fa red recíproca resultante es una
estructura cúbica centrada en el cuerpo, cuya dimensión lateral del cubo es 2/a. En
forma similar, se puede demostrar que la red recíproca para una estructura real
cúbica centrada en el cuerpo, es una red cúbica centrada en la cara.
TABLA 2.1.
Puntos reticulares para la red recíproca cúbica centrada en la cara
(Todos los puntos son de la fonna [(/+m- n), (/-m+ n), (-1 +m+ n)])

1= -2 1 = -1 1=0 l = 1 1=2

(-n- 4, n, n) ( -n- 3, n +- 1, n- 1) ( -n- 2, n + 2, n- 2)


m= -2 -2, -2, -2 -2, O, -2 -2, 2, 2

(-n-3,n-1,n+1) (-n-2,n,n) (- n - 1, n + 1, n - 1) (- n, n + 2, n - 2)
-2, O, O -1,1,-1
m= -1 --2, -2, o -1, -1, -1 - 2, 2, O O, 2, - 2
O, -2, -2 0,0, -2

( -n- 2, n- 2, n + 2) ( -n- 1, n- 1, n + 1) (-n, n, n) (1-n,n+ 1,n-1) (2 - n, n + 2, n - 2)


-1, -1,1 0,0,0 1, 1, -1
m=O -2, -2, 2 -2, o, 2 -1, 1, 1 O, 2,0 2, 2, -2
O, -2,0 -2, 2, 2 2,0, -2
1, -1,-1
2, -2, -2

(- n, n - 2, n + 2) (1 - n, n- 1, n + 1) (2- n, n, n) (3-n,n+ 1,n-1)


1, -1, 1 2,0,0
m= 1 O, -2,2 0,0,2 1, 1, 1 2,2,0
2, -2, o O, 2, 2

(2 - n, n - 2, n + 2) (3- n, n- 1, n + 1) (4- n, n, n)
m=2 2, -2,2 2,0,2 2, 2, 2
46 Análisis cristalográfico con rayos X

Una de las propiedades de la red recíproca es que un vector r* = h'a* +


k'b* +!'e* desde el origen hasta cualquier punto reticular de la red recíproca es
normal al plano (hk[) de la red real. En este caso, la tríada (hkl) es, simplemente, la
tríada (h'k'l') dividida por el factor común mayor, n entre (h'k't'), al igual que se
hizo en la sección 2.2. En otras palabras, h'/h =k'/k= 1'/l = n. Para demostrar este
resultado, se puede observar en la figura 2.8 que el vector AC es igual a - (a/h) +
(e/[), y queda dentro del plano (hkl), al igual que el vector AB, que es igual a
- (a/h) + (b/k). Sin embargo, utilizando las expresiones (2.5-1) y (2.5-2),

h' 1'
r* · [ -(a/h) +(e//)]= (h'a* + k'b* + l'e*) · [ -(a/h) + (ejl)] =- h +-¡=O,

(2.5-11)

puesto que h'/h = 1'/l = n, de acuerdo con (2.2-6). De igual modo,


h' k'
r* · [ -(a/h) + (b/k)] = (h'a* + k'b* + l'e*) · [ -(a/h) + (b/k)] = - h +k= O.
(2.5-12)
e

Figura 2.8. Geometría vectorial en la red directa para los cálculos de la sección 2.5.

Por tanto, el vector r* es perpendicular a dos vectores linealmente independien-


tes, AC y AB, que se encuentran dentro del plano (hkl). Luego, debe ser perpen-
dicular al plano propiamente dicho.
Del mismo modo, si n es un vector unitario normal al plano (hk[) de la red
real, se puede escribir n = r*/r*, ya que se sabe que r* es un vector normal a (hkl).
No obstante, si d es la distancia entre los planos adyacentes (hkl), de acuerdo con
(1.5-2), debe ser verdad que

a· n a· r* a· (h'a* + k'b* + /'e*) n


d=-=-= -- (2.5-13)
h hr* hr* - r* '

por lo que la magnitud de r* está dada por

r* -= n/d, (2.5-14)

en donde n es un entero que se defme como se indica en la ecuación (2.2-6).


La condición de Bragg 47

2.6 LA CONDICION DE BRAGG EN FUNCION


DE LA RED RECIPROCA

La condición de Bragg se puede expresar como una relación entre vectores en


la red recíproca. En la figura 2.9, el vector AO que tiene una longitud 1/A. está
trazado en la dirección del haz incidente de rayos X y termina en el origen de la
red recíproca. Se observará que el origen del vector AO no debe encontrarse necesa-
riamente en un punto reticular de la red recíproca. Se construye una esfera de radio
lA alrededor del punto A, que es el centro. Supóngase ahora que esta esfera inter-
secta algún punto (h'k'l ') de la red recíproca en B. Por tanto, el vector OB repre-
senta al vector que conecta el origen de la red recíproca con un punto (h'k'l ') de la
red; como tal, debe ser normal al plano (hkl) de la red real y también debe tener la
longitud n/d, donde n es el factor común entero de mayor valor a los tres números
(h'k'l '). Sin embargo, de acuerdo con las relaciones trigonométricas de la figura 2.9,
la longitud de OB se puede expresar también como 2 sen 0/A.. Si se igualan estas dos
expresiones para la longitud del vector OB, se tiene que

n). = 2d sen e,
y se satisface la condición de Bragg. En relación con la figura 2.9, también es
evidente que el vector OB representa una normal a los planos de reflexión (hkl) y
que el vector AB lo es en la dirección del haz difractado. Esta última proposición se
entenderá con mayor claridad, si se traslada el vector AB paralelo consigo mismo,
hasta que su origen descanse en el punto O, en que se verá que AO, OB y AB están
en la relación familiar de la dirección del haz incidente, así como la dirección
normal de dispersión y del haz de difracción. De acuerdo con esta construcción
geométrica, es evidente que la condición de Bragg se satisfará para una longitud de
onda dada por cada intersección de la superficie de una esfera de tadio 1/A. trazada
alrededor de A, con un punto de la red recíproca. En cada caso, el ángulo apro-
piado de Bragg estará dado por el ángulo comprendido entre el vector AO y un
plano normal a OB. Cuando la condición de Bragg se satisface en esta forma, los
vectores AO y AB constituyen un triángulo isósceles con un vector OB de la red
recíproca. De acuerdo con esta disposición de los vectores, como se ilustra en la

Figura 2.9. Geometría vectorial de la reflexión de Bragg en la red recíproca.


48 AniÍiisis cristalográfico con rayos X

figura 2.9, se puede observa~ que AB debe ser la suma vectorial de AO y OB y la


geometría vectorial de la figura 2.9 permite expresar la condición de reflexión de
Bragg, en un forma especialmente sencilla.
Para este fin se supone que todos los vectores de la figura 2.9 se multiplican
por un factor escalar constante de 27T, como se indica en la figura 2.10. Por tanto,
en esta figura, el vector G es simplemente 27T veces el vector OB de la figura 2.9 y
el vector k es 27T veces el vector AO de la figura 2.9. También en este caso, la
disposición de los vectores es tal que el vector A 'B' de la figura 2.1 O debe ser la
suma vectorial de k y G. Puesto que la magnitud de ese vector y la del vector del

8'

Figura 2.10. Diagrama vectorial de la figura 2.9, ampliado de acuerdo con un factor escalar de
27T y rotulado nuevamente (la notación va de acuerdo con la utilizada por C. Kittel
en /ntroduction to Solid Sta te Physics. J ohn Wiley & Sons, Nueva York (1956).

haz incidente k deben ser iguales, en todos Jos casos en que se satisface la condición
de Bragg, ésta debe implicar que

(k + G) 2 = (k + G) • (k + G) = k 2 , (2.6-1)
o bien, desarrollando el producto y simplificando,

2k · G + G2 =O, (2.6-2)
en donde G es 27T veces un vector desde el origen hasta un punto reticular de la red
recíproca, en donde k es un vector de magnitud 27T/A a lo largo de la dirección del
haz incidente de rayos X. La ecuación (2.6-2) es la forma vectorial de la ecuación
de Bragg. 4

EJERCICIOS

l. l·.n un cristal cúbico se oh~erva una reflexión de primer orden (1 00) a un ángulo
incidente de 18° utilizando una radiación X de longitud de onda de 1 5 A ¿Cuál es la di~tancia
~ntre lo~ planos (1 00) del cristal?

4 Esta construcción la originó Ewald (P.P. Ewald, Zeitschrift für Kristallographie 56, 129
(1921) y se denomina, a veces, construcción de Ewald.
La condición de Bragg 49

2. Para el átomo de hidrógeno en su estado energético más bajo, la función de onda está
dada por

en donde a0 es el radio de la primera órbita de Bohr, h2j4rr2me2 = 0.53 A. La densidad


electrónica para este tipo de átomo está dada por 1/Jfs 1/1 19 , por lo que

e-2rJ•o
p(r) =--.
7TQ~

Si se utiliza esta función de distribución de densidad electrónica, calcule el factor de dispersión


atómica para un cristal hipotético, compuesto de átomos de este tipo y grafíquela como función
de p. ( = 4rr sen (} (l\).
3. Sea una estructura cúbica centrada en el cuerpo, en la que todos los átomos son
idénticos. Demuestre que asignándole a la celda unitaria un octavo de cada átomo de vértice -en
su ubicación respectiva de coordenada celular- y el ítomo del centro del cuerpo -en la posición
central- se obtiene el mismo resultado para el factor geométrico de estructura de esta red, que
derivando dicho factor de acuerdo con la ecuación (2.4-11 ).
4. Encuentre la amplitud de difracción F(h'k'l ') para la reflexión (h'k'l ') de un cristal que
tiene la estructura del CsC'l, como se ilustra en la figura 1.7(b). ¿Se podría esperar una reflexión
(100) en este cristal? Explique por qué.
5. Encuentre el factor geométrico de estructura para la red cúbica centrada en la cara
(donde todos los átomos son idénticos). ¿Cuál de las siguientes reflexiones de rayos X habrá en
un cristal de este tipo y cuál faltará en él: (100), (110), (111), (200), (220), (222), (211),
(221 ), (123)?
6. Determme el factor geométrico de estructura de la red de diamante. Exprese el resul-
tado como el producto del factor geométrico de estructura para la red cúbica centrada en la
cara por otro factor. Indique cuáles de las reflexiones de rayos X mencionadas en relación con
el problema 5 se encuentran en dicha estructura y cuáles faltarán en ella? Nota: asigne los
átomos a una celda unitaria cúbica, de acuerdo con el diagrama de la figura 1.9.
7. Demuestre que la red recíproca de una estructura cúbica simple es otra red cúbica
simple, de donde, dicha estructura es autorrecíproca.
8. Demuestre que la red recíproca de una red cúbica centrada en el cuerpo es una estruc-
tura cúbica centrada en la cara. Haga una tabla de los puntos reticulares y grafíquelos para
formar un diagrama, basándose en sus resultados.

LECTURAS RECOMENDADAS
W. H. Bragg, An Introduction to Crystal Analysis, G. Bell & Sons, Londres (1928).
W. L. Bragg,The Crystalline State, Vol. 1, G. Bell & Sons,.,.Londres (1955).
R. B. Leighton, Principies o[ Modern Phys;cs, McGraw-Hill Book Company, Inc., Nueva York
(1959).
A. Taylor, X-Ray Metallography, John Wiley & Sons, Nueva York (1961).
CAPITULO 3
Dinámica de las
redes cristalinas

3.1 VIBRACIONES ELASTICAS DE MEDIOS CONTINUOS

Ahora se investigarán las características del movimiento elástico vibratorio de


las redes cristalinas. Se encontrará que existen diferencias importantes entre las on-
das elásticas, en las estructuras reticulares compuestas de átomos discretos y las ondas
que hay en los medios elásticos completamente continuos y homogéneos. Para en-
tender estas diferencias con toda claridad, primeramente se hará un repaso breve de
algunas características esenciales de las ondas elásticas en substancias elásticas homo-
géneas, isotrópicas y lineales. Se analizará detalladamente tan sólo el movimiento
ondulatorio unidimensional, pero siempre que sea necesario se tratará de indicar
cómo se pueden generalizar los resultados obtenidos para describir sistemas de dos y
tres dimensiones.
Sea un elemento de una substancia elástica isotrópica y homogénea, de lon-
gitud tu y el área transversal uniforme ~Y l:!.z. Cuando no hay deformaciones este
elemento se extiende de x a x + ÁX a lo largo del eje x, como se ilustra en la
figura 3.1, pero al aplicarle un esfuerzo, se produce una deformación elástica, la

-u+~u-1
I
(l
Areo t:J.yt:J.z
\r------t----i-1---.
r-u- -u-:t:J.u--::___
- F=ce(x+t:J.x)t:J.yt:J.z
F =ce (x) !:J. y tJ. z .._-------+---+-...J
1 t:J.x-----1
X x+t:J.x

Figura 3.1. Desplazamiento y deformación de extensión de un elemento de volumen que origi-


nalmente se extendía de x a x + &. En la condición deformada, el elemento se
extiende de x'+u a x + ~x +u+ ~u.

poSictOn de equilibrio del extremo izquierdo del elemento se desplaza una distan-
cia u a lo largo del eje x, y el extremo derecho del elemento se desplaza una distancia
u + &. Si el medio elástico es lineal, el esfuerzo aplicado y la deformación resul-

51
52 Dinámica de las redes cristaliiUls

tante se relacionan linealmente, mediante la ley de Hooke. La deformación s se


define como la extensión elástica del elemento por unidad de longitud, es decir

, Au ou
s(x)= hm - = - , (3.1-1)
&x--+O Ax ox
mientras que el esfuerzo es la fuerza por unidad de área que actúa sobre el ele·
mento. Por tanto, de acuerdo con la ley de Hooke, si F(x) es la fuerza total que
actúa en el punto x,

F(x) = cs(x)Ay Az, (3.1-2)

en donde e es el módulo elástico del material. Del mismo modo, en el punto


X+ _ax,
F(x + Ax) = cs(x + Ax)Ay Az. (3.1-3)

La fuerza total ejercida sobre el elemento se debe relacionar con la aceleración


del elemento, de acuerdo con la ley de Newton, por lo que

F(x + Ax) - F(x) = c[s(x + Ax) - s(x)]Ay Az = ma, (3.1-4)

en donde m es la masa del elemento y a su aceleración. Desarrollando s(x + & )


como una serie de Taylor, con respecto al punto x, y descartando los términos de
segundo o mayor orden en .ax, que en cualquier caso se perderían en el límite,
conforme .ax -+ O, se encuentra que

os
e ox Ax Ay Az = ma. (3.1-5)

Sin embargo, la masa del elemento es su intensidad p por el volumen


.ax Lly &, la aceleración es a2 ujat 2 , y la deformación, de acuerdo con la definición
{3.1-1) es au;ax. Al efectuar estas substituciones, (3.1-5) se convierte en

ou2 p o2 u
(3.1-6)
ox 2 =~ ot 2 •
Esta es la ecuación de onda para la amplitud de ondas elásticas en un medio
lineal homogéneo, en función de x y t, en donde la deformación elástica se limita a
la dirección x.
Las soluciones a esta ecuación se pueden escribir en la forma
u(x,t) = Aei<wr-znxt.l.l = Aei<wr-kx>, (3.1-7)

en donde,

k= 2nfA. (3.1-8)

La solución (3.1-7) representa una perturbación sinusoidal de frecuencia w y lon-


gitud de onda X, que se propaga a lo largo del eje x positivo. Por lo general, es más
conveniente expresar los resultados de un cálculo relativo a las vibraciones armónicas,
en términos de la constante de propagación k, que en función de X propiamente
Velocidad de grupo de trenes de ondas armónicas 53

dicha. La dirección de propagación de la onda se invierte, cambiando el signo de k.


Si la solución (3.1-7) se diferencia y se substituye de nuevo en la ecuación ondula-
toria (3.1-6), se verá que, para satisfacer (3.1-6), w y k deben relacionarse mediante

ro= kJcfp. (3.1-9)

La velocidad de fase de una onda es la razón de avance de un punto de fase


constante a lo largo de la dirección de propagación de la onda. Para determinar la
velocidad de fase, se puede examinar el movimiento de un punto de fase constante
y, para mayor facilidad, se utilizará un punto de fase cero. Puesto que el ángulo de
fase es wt- kx, de acuerdo con (3.1-7), la ecuación de movimiento del punto de
fase cero es,

rot- kx =O

o bien,
(3.1-10)

Como se puede ver, el punto de fase avanza a una velocidad constante de fase
vP igual a w/k. De acuerdo con la ecuación (3.1-9), la velocidad de fase para estas
ondas se puede expresar como

vP = wfk = Jcfp, (3.1-11)

de donde, es evidente que la ecuación de onda (3.1-6) se puede escribir como sigue

(3.1-12)

Para este caso en particular, la velocidad de fase es independiente de la fre-


cuencia y la longitud de onda, y sólo depende de las constantes físicas e y p,
relacionadas con el medio elástico.

3.2 VELOCIDAD DE GRUPO DE TRENES DE ONDAS ARMONICAS

Ahora se investigará lo que sucede cuando se superponen dos trenes de ondas,


uno de frecuencia w y constante de propagación k el otro con una frecuencia
ligeramente distinta, w + dw y constante de propagación k+ dk. Para mayor faci-
lidad, se supondrá que las amplitudes máxima de los dos trenes de ondas son
idénticas, en cuyo caso, ambas amplitudes se expresan como sigúe:

u 1 =A cos (wt- kx)


(3.2-1)
u 2 =A cos [(ro+ dro)t- (k+ dk)x].
La amplitud de la superposición es, entonces,

u1 + u2 = A[cos (rot- kx) + cos [(ro+ dro)t- (k+ dk)x]] = A[cos a+ cos p].
(3.2-2)
54 Dinámica de los redes cristalinas

Sin embargo, tomando como base la trigonometría elemental,

cos ex+ cos p = 2 cos t(ex - p)cos !(ex + p), (3.2-3)


y, de acuerdo con (3.2-2), se tiene que

ex+ P= 2rot - 2kx + tdro- xdk ~ 2(rot - kx), (3.2-4)


y

ex - p= xdk - tdro. (3.2-5)


En (3.2-4), los términos diferenciales tdw y xdk se pueden hacer a un lado,
teniendo en cuenta que son pequeños, en comparación con los otros términos; en
(3.2-5) no hay términos "grandes" y los términos diferenciales son importantes. Al
substituir (3.2-4) y (3.2-5) en (3.2-2), se tiene que

u1 + u 2 = 2A cos (rot- kx) cos (tx dk- !t dro). (3.2-6)


Esta superposición representa una onda caracterizada por los valores originales
de w y k, multiplicados por una envolvente sinusoidal con una longitud de onda
mucho más larga, 21T/dk, denominada "envolvente de pulsaciones", como se ilustra
en la figura 3.2. Se puede examinar el movimiento de esta envolvente y, sobre todo,

2,.
k

Figura 3.2. Tren de ondas formado al superponer dos ondas sinusoidales cuyas frecuencias son
w y w +dw y con constantes de propagación de k y k +dk.

la velocidad de fase de la envolvente (correspondiente a la velocidad de los grupos o


"pulsaciones", a lo largo de la dirección de propagación) determinada mediante el
mismo procedimiento que se utilizó para una onda armónica simple, en la sec-
ción 3.1. La ecuación del movimiento del punto de fase cero de la envolvente es

x dk - t dw = O,
o bien,
dw
x=-t=vt
dk g o
(3.2-7)

Por tanto, se ve que la envolvente o los grupos de ondas se desplazan con una
velocidad dw/dk; que se denomina velocidad de grupo, v.rr, asociada con las ondas.
Se puede demostrar que la velocidad con que la onda transmite energía a lo largo
de la dirección de propagación es idéntica a esa velocidad de grupo. 1 Como puede

1 L. Brillouin, Wave l'ropa!!;ation in Perwdic Structures, Dover Publications, lnc., Nueva


York (1953)
Movimiento ondulatorio en redes atómicas unidimensionales SS

verse, esto es lógico desde el punto de vista físico, por ejemplo, en el tren de ondas
de la figura 3.2, no puede fluir energía más allá de un nodo, ya que el medio en el
punto nodal está totalmente inmóvil. Por consiguiente, la energía se debe transmitir
a la velocidad a la que se mueven los nodos, es decir, a la velocidad de grupo. En el
caso de una onda estacionaria, la velocidad de grupo es cero y es evidente que no
puede haber un flujo neto de energía.
Para las ondas elásticas en un medio homogéneo, que se estudiaron en la
sección 3.1, la velocidad de fase y la de grupo son iguales, de acuerdo con la
ecuación (3.1-9). Esto es cierto debido a que w es una función lineal de k, de
donde, w/k y dw/dk son iguales. El mismo resultado se aplica también a las ondas
electromagnéticas en vacío, dado que también en este caso, la velocidad es una
constante independiente de la frecuencia y la longitud de onda. La velocidad de fase
y la velocidad de grupo sólo pueden diferir cuando la primera w/k es una función
de la frecuencia w, y por tanto, cuando la misma w no es una función lineal de k.
Por ejemplo, esta situación se presenta cuando hay una luz que pasa por un medio
en el que el índice de refracción (y, por ende, la velocidad de fase) es una función
de la frecuencia; el fenómeno se conoce como dispersión y dicho medio se deno-
mina medio dispersivo o de dispersión. Como ¡,~ verá en breve, también sucede en el
caso de ondas elásticas, en un medio compuesto de átomos discretos enlazados por
las fuerzas de la ley de Hooke, sobre todo cuando las longitudes de onda de que se
trata no son mucho mayores que las distancias interatómicas.

3.3 MOVIMIENTO ONDULATORIO EN REDES ATOMICAS


UNIDIMENSIONALES

Ahora se examinará el movimiento vibratorio longitudinal de una cadena uni-


dimensional de átomos idénticos de masa m, que están unidos entre sí mediante
fuerzas lineales, como se indica en la figura 3.3. En estado de equilibrio, los átomos
estarán situados en puntos de equilibrio igualmente espaciados; pero en estado de
excitación producido por el movimiento vibratorio, los átomos realizan movimientos
periódicos alrededor de estas posiciones de equilibrio, en este caso, la amplitud Un
representa el desplazamiento real del nésimo átomo, desde su posición de equilibrio.

n-2 n-1 n n+l n+2


~a
En reposo:
+ a
+ a
+ a----4

~ ~t ~t
Vibrando

Un-1 un
~ t
Un+ 1
t
Figura 3.3. Geúmetría de la red lineal monoatómica de la sección 3.3.

Se supone que las fuerzas entre los átomos circunvecinos son las de la ley de
Hooke, y que los átomos se comportan como si estuviesen unidos por medio de
resortes ideales, suponiéndose también que las únicas interacciones de fuerzas signifi-
cativas, son las que se ejercen directamente entre los átomos más cercanos. De
donde la influencia directa de los átomos n + 2, N+ 3, n + 4 ... sobre el átomo n
56 Dinámica de las redes cristalinos

se considera despreciable, aunque el comportamiento del átomo n + 2, por ejemplo,


puede influir indirectamente en el átomo n en el sentido de que afecta directamente
al átomo n + 1 que, a su vez, actúa sobre n. De acuerdo con estas suposiciones, la
fuerza neta que actúa sobre el nésimo átomo se puede expresar en términos de la
extensión de dos "resortes" que lo unen a los átomos n + 1 y n - l. Así:

= {3(u.+ 1 + !1 11 _ 1 - 2u,). (3.3-1)

en donde (3 es la constante de la ley de Hooke, que expresa la proporcionalidad


existente entre la fuerza requerida para producir un desplazamiento atómico y el
desplazamiento propiamente dicho.
De acuerdo con la segunda ley de Newton, esta fuerza se puede expresar como
el producto de masa m del nésimo átomo por su aceleración, de donde, se obtiene
la ecuación del movimiento

(3.3-2)

Se buscan soluciones periódicas a esta ecuación y se puede esperar que tengan


la forma

(3.3-3)
en analogía con (3.1-7). Sin embargo, en la expresión (3.3-3) se debe representar el
coeficiente de k del exponente como la coordenada x ael nésimo átomo de la
cadena, es decir, na. De acuerdo con esto. se puede esperar que
un+l = Aei[wt-k(ll+l)aJ
y

Un-l = Aei[wt-k(n-l)•J. (3.3-4)

Si la solución (3.3-3) se diferencia dos veces con respecto al tiempo y, junto


con la (3.3-4) se substituye de nuevo en la ecuación de movimiento (3.3-2), el
resultado es

= 2{3(cos ka - 1). (3.3-5)

Sin embargo, dado que

1 -cosO= 2 sen~ !0, (3.3-6)

esto se puede expresar en la forma

01 = ,./4fJ/m lsen-!kal. (3.3-7)


Movimiento ondulatorio en redes atómicas unidimensionales 51

Los signos de valor absoluto se requieren en (3.3-7), por la única razón de que
la frecuencia se debe considerar como una cantidad esencialmente positiva, sin im-
portar de que k sea positiva o negativa, es decir, sin importar que la onda se
propague hacia la derecha o la izquierda, a lo largo de la cadena.
En consecuencia, se observa que existen soluciones de la forma (3.3-3), a
condición de que w se relacione con k, mediante (3.3-7). Es obvio que, en este
caso, w no es una función lineal de k, de modo que aquí se trata un medio de
dispersión; una relación del tipo de (3.3-7) que presenta a w en función de k, se
conoce como relación de dispersión. En la figura 3.4 se muestra una gráfica de w
en función de k, como se da en (3.3-7). De acuerdo con esto (y (3.3-7)), se
observará que, si se restringen los valores de k, mucho menores que rrja, y, por
ende, a valores de "A que son mucho mayores que el doble de la distancia interató-
mica a, w es aproximadamente lineal, con k, ya que, en ese caso, sen-!- ka~-!- ka y

(3.3-8)
En este límite de longitud de onda larga, la velocidad de fase será esencial-
mente constante, ya que

vP = wfk = aJ{3/m = v0. (3.3-9)


En este mismo límite, la velocidad de grupo es

(3.3-10)

y, por tanto, constante e igual a la velocidad de fase en esas condiciones. En


consecuencia, para longitudes de onda muy largas, los efectos de dispersión son
desechables y el medio se comporta como si fuera elástico, continuo y homogéneo.
Por supuesto, esto es plausible desde un punto de vista físico, ya que, para este tipo
de longitudes de onda largas, la naturaleza "atómica" de la cadena tiene poca impor-
tancia en lo que respecta al comportamiento dinámico del sistema. No obstante, al
aumentar k, los efectos de dispersión se hacen cada vez más importantes y w deja

w(k)

_,------------~------------r--k
-7T
o o 1T
o

Figura 3.4. Relación de dispersión de red lineal monoatómica de la sección 3.3.


58 Dinámica de las redes cristalinas

de variar en forma lineal, en función de k. En estas circunstancias, se observa que,


de acuerdo con (3.3-7),

vP = wfk = v0 lsentkal
!ka (3.3-11)
y
v9 = dwfdk = v0 leos tkal, (3.3-12)

en donde v0 =a .Jlflm es el límite de longitud de onda larga, tanto de vP como de


vg, como lo demuestran (3.3-9) y (3.3-1 0). En las figuras 3.5 y 3.6 se presentan las
gráficas de vp y Vg, como funciones de k.
En la figura 3.6 se observa que vg-+ O conforme k-+ rr/a y, por tanto, con-
forme A-+ 2a; en este caso, la fase de vibración de los átomos adyacentes difiere en
rr radianes y la naturaleza del movimiento es sencillamente una onda estacionaria.
Esta condición corresponde también a la reflexión de Bragg de las vibraciones elás-
ticas de átomos sucesivos del cristal; para esta geometría, el ángulo 8 de Bragg de la
ecuación de Bragg (2.1-1) es rr /2 correspondiendo a la incidencia normal, en cuyo
caso, la ecuación de Bragg se reduce a A = 2d para el primer orden de reflexión. La
naturaleza física real del movimiento se ilustra en la figura 3.7, para el caso de una
longitud de onda larga y para la condición A = 2a, en la que se establecen las ondas
estacionarias. En estas figuras, los desplazamientos atómicos se representan como
movimientos transversales, para facilitar la ilustración, aunque, por supuesto, los mo-
vimientos atómicos reales que se analizan aquí son de tipo longitudinal, en el que

Vp

-6,. -2,. -., o .,. 2rr


-6a...
o
-
o o o a o -4rr
o

Figura 3.5. Velocidad de fase en función de la constante de propagación k, correspondiente a la


red lineal monoatómica. [Tomado, con permiso, de Wave Propagation in Periodic
Structures, McGraw-Hill (1946). J

Figura 3.6. Vcloddad de grupo como una función de la constante de propagación k para la
red lineal monoatórnica.
Movimiento ondulatorio en redes atómicas unidimensionales 59

~j i j ¡---¡-_,__

Figura 3.7. Desplazamientos atómicos en la red monoatómica lineal (a) para una longitud de
onda mucho mayor que el espaciamiento interatómico, (b) en el límite en donde
'A= 2a. Para mayor claridad, los desplazamientos se representan como transversales,
pero se debe tener presente que los desplazamientos reales estudiados en este texto
son longitudinales. [De acuerdo con Brillouin.]

los desplazamientos atómicos reales se efectúan a lo largo de la cadena y no en


sentido normal a ésta.
Como se ilustra en la figura 3.8, para cualquier valor de k en la región - rr/a
<k< rr/a, se tendrá un movimiento vibratorio comprendiendo ciertos desplaza-
mientos atómicos posibles. Sin embargo, como se indica también en dicha figura, el
mismo conjunto de desplazamientos de átomos que hay en esta onda, se puede
asociar asimismo con una onda de k mayor (y por ende, de una menor 'A), e incluso

Figura 3.8. Un solo grupo de desplazamientos atómicos representados por varias ondas sinusoi-
dales de diferentes longitudes de onda. [Tomado de Brillouin, Wave Propagation in
Periodic Structures, McGraw-Hill, Nueva York, (1946).]

con otra de k aún mayor. En otras palabras, pueden existir muchas representaciones
del mismo patrón de desplazamiento átomico en el que se incluya un valor distinto
de k y, en consecuencia, un valor diferente de 'A. Se puede demostrar que estas
representaciones disímbolas están asociadas con diferentes periodos de la gráfica de
w en función de k. Cada una de las representaciones posibles debe tener el mismo
valor de w por lo que, en una gráfica de w en función de k, en la que aparezcan
varios periodos de la curva, como sucede en la figura 3.9, puede haber muchos
valores de k que correspondan al mismo valor de w. En la región central, que se
extiende desde - rr/a hasta rr/a, se tiene sólo dos posibilidades, una onda que se
propaga hacia la derecha, con la constante de propagación k 1 y otra que se desplaza
hacia la izquierda, con una constan te de propagación k_ 1 = - k 1 • Las regiones mar-
cadas en esta figura con los números 2 y 2', que con tienen otras dos soluciones
posibles, k 2 y k_ 2 = - k 2 , se pueden superponer en la región central, desplazando
la región 2 hacia la izquierda una distancia 2rr/a y moviendo la región 2' una
distancia 2rr/a. El carácter de las soluciones posibles en la región 2 es el mismo que
60 Dinámica de las redes cristalinos

"'

Figura 3.9. Varios periodos de la relación de dispersión para una red lineal monoatómica. Se
observará que muchos valores de k se pueden asociar con cualquier frecuencia dada
dentro del rango permitido.

el de las soluciones posibles de la región 1' excepto por una diferencia en los valores
k de 2rr/a; lo mismo puede afirmarse de las regiones 2' y l. Del mismo modo, las
regiones 3 y 3', que contienen dos soluciones posibles para las que k = k 3 y k =
k_ 3 = - k 3 , se pueden superponer sobre la región central - rr/a <k< rr/a, despla-
zando la región 3 hacia la izquierda una distancia 4rr/a y la 3', a la derecha, una
distancia 4rr/a; la naturaleza física de las soluciones en esta región coincide, por
tanto, con la de la región central, excepción hecha de las diferencias de los valores k
de 4rr/a. Se pueden observar relaciones similares en zonas superiores. El hecho
físico importante es que cualquier arreglo posible de posiciones atómicas, que sea
compatible con una solución sinusoidal de cualquier longitud de onda, por más
pequeña que sea, se puede representar o reducirse a una solución sinusoidal para la
que - rr/a <k< rr/a. y que, por ende, pertenece a la zona central. Por consiguiente
en este caso, no es necesario considerar las vibraciones que no pertenezcan a la zona
central -rr/a <k< rr/a. Esta región central (1 y 1' de la figura 3.9) se denomina
primera zona de Brillouin; las regiones 2 y 2', y 3 y 3', etc., para las que el
carácter físico de las soluciones es el mismo que el de la primera zona, exceptuando
la traslación que se hace a lo largo del eje k, en una distancia igual a un múltiplo
entero de 2rr/a, se citan como la segunda, tercera, etc., zonas de Brillouin, respecti-
vamente. Más adelante, se representará la ocasión de utilizar el concepto de las zonas
de Brillouin, en relación con el comportamiento de la mecánica cuántica de los
electrones en las estructuras reticulares periódicas. 2
También se debe determinar cuántos modos nonnales posibles de vibración (en
otras palabras, cuántas soluciones independientes de la ecuación de onda que satis-
fagan un conjunto de condiciones de frontera) se pueden asociar con una cadena
lineal de átomos. Por ejemplo, supongamos que se tiene una cadena rígidamente fija
en ambos extremos. Si dicha cadena, que tiene una longitud L, fuera un medio
homogéneo y continuo, cualquier vibración de la forma

u(x,t) = A sen knx sen wt (3.3-13)


con
kn = nrr.JL, (3.3-14)

en donde, n es un entero, satisfaría las condiciones de frontera de que el desplaza-


miento u en ambos extremos de la cadena en x =O y x = L, debe ser cero y, por

2 Debe hacerse notar que las velocidades de fase de ondas equivalentes en diferentes Zonas
de Brillouin son distintas; pero este hecho no tiene un efecto físico directo.
Movimiento ondulatorio en redes atómicas unidimensionales 61

Figura 3.10.
~
, n =4

Conjunto de desplazamientos sinusoidales de una cuerda con vibración transversal,


que satisfacen la condición de frontera de que el desplazamiento desaparece en
ambos extremos. Estas diversas configuraciones sinusoidales se pueden considerar
como modos normales para el sistema en esta condición particular de frontera.

tanto, se calificaría como modo normal de vibración del sistema. Esta situación se
ilustra en la figura 3.1 O. Sin embargo, si la cadena se compone de átomos discretos,
el valor máximo de k está dado por rrja, y corresponde a un valor mínimo de la
longitud de onda de 2a, como se puede ver en la figura 3. 7(b ). Cualquier valor
grande de k o cualquier valor pequeño de A. corresponde simplemente a una repeti·
ción de cierta configuración que se puede describir mediante un valor de k dentro
de la zona central. De acuerdo con (3.3-4), los valores posibles de k para un sistema
de ese tipo son, k= rr/L, 2rr/L, 3rr/L, • • • rrja. No obstante, si hay N átomos en una
cadena de longitud L, cada uno de los cuales está separado de su vecino por una
distancia a, entonces, a= L/(N- 1) y, por tanto los valores permitidos de k para
vibraciones normales de esta índole es k = rr/L, 2rr/L, 3rr/L • • • (N - 1)rr/L, dando
un total de N- 1 modos. Sin embargo, para k= (N- l)rr/L, (A.= 2a) se debe excluir
en este caso, dado que no se puede excitar a menos que se muevan los átomos del
extremo, lo cual está prohibido por las condiciones de frontera. El número de
modos reales de vibración, en estas condiciones de frontera, es, por tanto N- 2, o
sea, el número de átomos de la cadena menos dos. Por supuesto, si N es un número
muy grande, no importa si el número de modos normales se considera como N- 2
o, simplemente, como N.
Conviene hacer notar que las condiciones físicas de frontera que se imponen al
sistema son las que limitan los valores posibles de k a cierto número finito de
valores, tomados del continuo de valores posibles entre - rr/a y rrja que permiten las
soluciones de las ecuaciones diferenciales de movimiento del sistema. Como lo de-
muestra la exposición anterior, cuando los extremos de la cadena se mantienen
rígidamente fijos, se seleciona un conjunto de N- 2 valores posibles de k, corres-
pondientes a las soluciones que satisfacen esas condiciones de frontera, de entre este
grupo infinito de valores posibles. Sin embargo, en cualquier problema real se deben
seleccionar ciertas condiciones de frontera en las ondas elásticas y, en lo que res-
pecta al número de modos normales posibles, se encuentra que no importa mucho
cuál de los conjuntos de condiciones se escoja, siempre que sea físicamente acep-
table. En cada caso, se tendrán básicamente N modos normales posibles de vibración,
que satisfagan las condiciones de frontera que se hayan seleccionado, a condición de
que el número de átomos N sea mucho mayor que la unidad. Se encuentra que este
resultado se aplica también en sistemas bidimensionales y tridimensionales.
En muchos casos, será útil seleccionar como condición de frontera, el requisito
de que la amplitud de vibración del Nésimo átomo sea precisamente la misma que la
del primer átomo. Desde el punto de vista físico, esto correspondería a una cadena
lineal, que se dobla para obtener la forma de un anillo, en el que el Nésimo átomo
se une al primero para cerrar la cadena. Las condiciones de frontera de esta natu-
raleza se conocen con el nombre de frontera periódica; la aplicación de estas condi-
ciones a las soluciones (3.3-3) de las ecuaciones de movimiento, producirá el mismo
62 Dinámica de redes cristalinos

resultado, a saber: que pueden existir esencialmente N soluciones de las ecuaciones


de movimiento, que satisfagan también las condiciones de frontera periódicas. Más
adelante, la demostración de este resultado se le asignará al lector como tarea y
ejercicio.

3.4 ESTRUCTURAS DIATOMICAS UNIDIMENSIONALES

Hasta ahora el examen de las propiedades dinámicas de las redes cristalinas se


ha concretado al caso en que todos los átomos de la red son idénticos. Puesto que
muchos cristales comunes son compuestos diatómicos, que contienen átomos de dos
especies químicas diferentes y, dado que las característic~s dinámicas de sus estruc-
turas difieren en varias formas importantes de los cristales monoatómicos, conviene
proceder al de las vibraciones elásticas en cristales de este tipo.
Sea una red en la que los átomos de dos especies están dispuestos en forma
alternada y cada átomo está separado de los dos átomos adyacentes por una dis-
tancia a, como se muestra en la figura 3.11. La masa del átomo ligero se representa
mediante m, y la del átomo pesado es M. También aquí se aplicarán las suposiciones
de la sección 3.3 en relación con las fuerzas de la ley de Hooke y sólo se tomarán
en cuenta las interacciones entre los átomos adyacentes. Aquí se hace necesario
escribir ecuaciones independientes para el átomo ligero y el pesado; lo cual se hace
siguiendo una analogía exacta del procedimiento de la sección 3.3, teniendo como
resultado

(3.4-1)

También ahora se deben buscar soluciones de la forma (const.)ei(wt-kx), re-


presentando la coordenada x del átomo, de acuerdo con su posición a lo largo de la
cadena, como en (3.3-3) y (3.3-4).

m M m M m M m M m M
• o • o • o •
~o-i-o~
---- 2 n-2 2n-l 2n 2n+l 2n+2 2n+3 ---

Figura 3.11. Geometría de la red diatómica lineal de la sección 3.4.

Puesto que Jos dos tipos de átomos tienen masas distintas, por lo normal, sus
respectivas amplitudes de vibración, también, serían diferentes. Además, en este
punto, no se puede f>aber que sus frecuencias son iguales -aunque, como se verá
Estructuras diatómicas unidimensionales 63

más adelante, esto es lo que sucede en este caso en particular. Por tanto, se suponen
soluciones de la fórmula

y
(3.4-2)

Si u 2 n y u2n+i están dadas por estas expresiones, de acuerdo con la regla de


que el coeficiente de k en el exponente debe representar la coordenada x del átomo
en cuestión, también debe ser cierto que

(3.4-3)

Si las soluciones (3.4-2) se diferencian dos veces con respecto al tiempo y se


substituyen de nuevo en las ecuaciones de movimiento (3.4-1), utilizando (3.4-3)
para expresar todos los desplazamientos en términos de u 2 n y u 2 n+i, se tiene que

(3.4-4)

Al resolver la segunda de estas ecuaciones para u 2 n+i, se observa que

p(l + e-2ika>
U2n+ 1 = 2 p _ Mw~ U2n· (3.4-5)

Las ecuaciones de movimiento requieren que esta relación se satisfaga para


todos los valores de tiempo. No obstante, si los valores de u 2 n y u 2 n+l tal y como
los da (3.4-2), se substituyen en (3.4-5), es evidente que este requisito se puede
satisfacer para todos los valores de t, sólo cuando w 1 y w 2 son iguales. De acuerdo
con esto, tomando

(3.4-6)

y substituyendo (3.4-5) en la primera de las ecuaciones (3.4-4), expresando los


exponenciales de acuerdo con las funciones trigonométricas y simplificando, es evi-
dente que

(3.4-7)

Al reacomodar esta ecuación y reunir las potencias de w, se tiene, por último,

4 2P(m +M) 2 4P 2 sen 2 ka


w - mM w + mM = O. (3.4-8)
64 Dinámica de redes cristalinos

Esta ecuación cuadrática en w 2 se puede resolver fácilmente mediante la fór-


mula cuadrática a fin de obtener dos soluciones para w 2 , que se designarán como
w~ y w~, según se escoja el signo + o el - en la fórmula cuadrática. El resultado es

2 _
c.o± -
P(m + M) [
mM 1±
J_ 1
4mM sen2 ka]
( m+ M)2 . (3.4-9)

w(k)

l /2~/M

1
1
1

-4--------------~--------------~k
l-..!:.
2o o 1 ;o
Figura 3.12. Relación de dispersión correspondiente a la red diatómica lineal, donde se mues-
tran las ramas Óptica y acústica.

En la figura 3.12 se muestra una gráfica de este resultado. En donde se pue-


den ver dos ramas de la curva w en función de k, una para el caso en que se tome
el signo + y la otra, el signo -, en (3.4-9). La rama superior, w+(k), se conoce con
el nombre de óptica, en tanto que la inferior, w_(k), se denomina la rama acústica.
La importancia de esta terminología se aclarará más detalladamente a su debido
tiempo. Para valores pequeños de k, sen ka:::: ka, y las dos raíces se convierten en

(3.4-10)

w_(k)=ka J --
m+M
2p
(ka ~ ;r/2). (3.4-11)

Para obtener la expresión (3.4-11) se debe escribir la raíz cuadrada de (3.4-9)


en forma de una expansión binomial para valores pequeños del argumento.
La longitud de onda más pequeña posible de la primera zona de Brillouin es
dos veces la distancia de la celda unitaria de la red que, en este caso, es 2a. Esto
proporciona una longitud de onda mínima de 4a, correspondiente a un valor má-
ximo de k de Tr/2a en la frontera de la primera zona. Para este valor de k (3.4-9) da
Región de frecuencia prohibida 65

y (3.4-12)
w_ = )l/3/M.

Las características físicas del movimiento se pueden entender mejor, obser-


vando lo que sucede cuando k~ O. En este caso, para obtener la relación de la
amplitud B/A la expresión (3.4-5) es la más conveniente, siendo el resultado

, U2n+ 1 B 2{3
(3.4-13)
!~~~=A= 2{3- Mw~

Para la rama acústica, w = w_, como se indica en (3.4-11) y conforme


k~ O, w_ ~O, de donde B/A = l. En consecuencia, para el modo acústico de vibra-
ción, los dos tipos de átomos se mueven en la misma dirección, con igual amplitud,
como se muestra en la figura 3.13(a).

(a) Rama acústica

(b) Rama óptica

Figura 3.13. Desplazamientos físicos asociados con vibraciones de longitud de onda larga pro-
pios de (a) la rama acústica y (b) la rama Óptica.

Para 1~ rama óptica, w = w+ en (3.4-13) y utilizando (3.4-10) se ve claramente


que, en este caso, B/A = - m/M. Por tanto, para la rama óptica en k= O, las
vibraciones de los átomos tienen direcciones opuestas y las amplitudes, una relación
inversa con las masas, de manera que el centro de la masa de la celda unitaria
permanece fijo durante el periodo de movimiento, como se observa en la figu-
ra 3.13(b). Por lo general, esas características son típicas de las ramas óptica y
acústica. Las vibraciones de modo óptico en cristales iónicos, donde dos tipos de
átomos tienen cargas opuestas, se pueden excitar mediante un campo eléctrico que
tiende a hacer que los iones se muevan en diiecciones contrarias. Sobre todo en las
substancias iónicas, este modo se puede excitar mediante un campo eléctrico asocia-
do con una onda lumínica, debido a lo cual se usa el término de vibraciones de
modo óptico.

3.5 REGION DE FRECUENCIA PROHIBIDA

De acuerdo con la mencionada figura 3.1 '2, existe una banda de frecuencias
2(3/M < w 2 < 2(3/m en la que no hay soluciones de la forma (3 4-2). Pues sucede que
las frecuencias de este rango simplemente. no pueden propagarse como vibraciones
armónicas continuas no amortiguadas de la red. Si se intenta excitar vibraciones de
una frecuencia que queda dentro de esta banda. las vihmciones ~on at<'lllltlllas o
66 Dinámica de redes cristalinas

amortiguadas por la propia red, dependiendo el coeficiente de atenuación de la


frecuencia, las masas atómicas y la constante de fuerza.
Para ver esto con mayor claridad, la ecuación (3.4-7) se puede escribir en la
siguiente forma

(3.5-1)

Puesto que en la regwn 2(3/M < w 2 < 2(3/m, el primer factor en la parte supe-
rior de la ecuación de (3.5-1) es positivo y negativo el segundo, es evidente que
cos ka debe ser imaginario en esta región de frecuencias, por lo que ka debe ser un
número complejo. Si la raíz cuadrada se escribe en la segunda forma que se indica
arriba, cos ka se expresa como una cantidad imaginaria if>, en donde 6 es un número
real dentro del rango de frecuencias de interés.
El coseno de un número complejo se puede expresar como la suma de partes
reales o imaginarias mediante un simple cálculo, utilizando el teorema de Euler como
sigue:

COS Z = COS (x + iy) = COS X COSh y- Í sen XSenh y. (3.5-2)

Si esto se iguala a if>, como lo requiere (3.5-1), y se igualan las partes reales e
imaginarias de la ecuación resultante, se obtiene

cos x cosh y = O, (3.5-3)

sen x senh y= -~. (3.5-4)

En (3.5-3), coshy no es nunca cero para cualquier valor de y, de donde


cos x = O y x = ± rr/2, por tanto, sen x = ± l. Al substituir este valor en (3.5-4), es
obvio que

y = :¡: senh- 1 ~. (3.5-5)


en donde,
7l
z = ka = x + iy = ± l + i senh- 1 e) (3.5-b)

y las soluciones de la ecuación de onda (3.4-2) se convierten en

(3.5-7)

Estas son oscilaciones atenuadas o amortiguadas; el signo menos del exponente


se debe seleccionar para los casos físicamente reales de-ondas amortiguadas (el signo
m:ís representa ondas crecientes cuya amplitud aumenta exponencialmente a lo largo
Excitación óptica de vibraciones reticulares en cristales iónicos 67

de la cadena). La constante de atenuación K, definida al escribir la solución (3.5-7)


como

(3.5-8)
está dada por

1
K=- senh - l ó, (3.5-9)
a

en donde o, a su vez, está dada por (3.5-1). Esta misma situación general predomina
para valores de w que exceden w+(O), según han sido dados por (3.4-1 0), y también
en el caso de la cadena monoatómica para valores de w que se sobrepasen de
y4[3/m; en cada caso se encuentra que la red cristalina no puede propagar frecuen-
cias en estos rangos y que la red misma debe amortiguar o atenuar cualquier pertur-
bación de esta índole.
Hasta ahora sólo se han visto ondas longitudinales en redes unidimensionales;
sin embargo, también se pueden excitar vibracwnes transversales en las que los des-
plazamientos atómicos son perpendiculares a la cadena y no a lo largo de ella. Las
características de estas ondas transversales son, en general, muy similares a las de las
ondas longitudinales; el fenómeno de dispersión, los modos de vibración acústico y
óptico para las estructuras diatómicas y las bandas de frecuencias prohibidas, se
producen más o menos en la misma forma que en las ondas longitudinales. Puesto
que las ondas transversales implican desplazamientos atómicos normales a los que
tienen lugar en las vibraciones longitudinales, las ondas transversales y longitudinales
se pueden excitar en forma simultánea (como primera aproximación) e independien-
temente entre sí. De igual manera, puesto que existen dos direcciones posibles de
desplazamiento ortogonal e independiente para las ondas transversales, se pueden
excitar de un modo simultáneo dos oscilaciones transversales independientes.

3.6 EXCITACION OPTICA DE VIBRACIONES RETICULARES


EN CRISTALES IONICOS

En un cristal iónico, por ejemplo, el de NaCl, los átomos de sodio y cloro


están ionizados; el átomo de sodio lleva una carga e y el de cloro una carga -e. En
estos cristales, el vector eléctrico de una onda lumínica puede excitar vibraciones de
un modo óptico, ya que un campo eléctrico ejerce fuerza sobre las cargas positiva
y negativa que tienen direcciones opuestas. En esta exposición, se supondrá que se
trata de redes diatómicas lineales de átomos de cargas opuestas que se extienden a
lo largo de la dirección x y que la luz incide perpendicularmente a la cadena
atómica, de tal modo que el vector eléctrico de la onda oscila a lo largo del eje x. En es-
tas condiciones, en cualquier instante dado, todos los átomos del cristal están sometidos
al mismo campo eléctrico, y sobre los iones adyacentes, positivos y negativos, se
ejercen fuerzas exactamente iguales, pero opuestas. El efecto que produce un campo
de excitación de esta naturaleza consistirá en establecer vibraciones longitudinales
forzadas en la red cristalina, a la frecuencia de la fuente de excitación, es decir, la
onda de luz incidente. Puesto que el campo eléctrico es idéntico en todas las partes
de la red, en un momento dado, el tipo de vibración que se excitará será el de la
figura 3.13(b), o sea, una vibración óptica de una longitud de onda infinitamente
larga, en la que k = O.
68 Dinámica de redes cristalinas

En presencia de este tipo de campos, la fuerza ejercida sobre un ion positivo


es eE0 eíwot y en el ion negativo, -eE0 eiwot, en donde w 0 es la frecuencia de la luz
y E 0 es la magnitud del vector eléctrico de la onda de luz. De acuerdo con esto, se
debe agregar un término de fuerza eE0 eiwot al lado derecho de la primera ecuación
de movimiento (3.4-1) y el término - eE0 eiwot al segundo. Si ahora se suponen
soluciones de la forma

(3.6-1)
u 2n+ 1 = Bei(coor-[2n+ 1JkaJ

Las vibraciones que se han supuesto a la frecuencia de fuerza y, si se repiten los


pasos que llevan a las ecuaciones (3.4-4), se obtiene

- mw~u2n = p[(l + éika)u2n+ 1 - + eE0 eiwot


2u2nJ
(3.6-2)
- 2 R[(l +e - 2ika) U2n- 2U2n+1 J -eE oeiwot·
M WoU2n+1=P

Puesto que desde el punto de vista físico la vibración óptica que se excita por
medio de la onda de luz es tal que k= O, el conjunto de ecuaciones anteriores se
reduce a

(2P- mw~)u 2 n- 2Pu2n+1 = eEoeiwor


(3.6-3)
-2Pu2n + (2P- Mw~)u2n+1 = -eEoeiwor.

Este grupo de ecuaciones simultáneas se puede resolver para las amplitudes de


vibración u 2 n y u 2 n+l, y el resultado es

- (- eEo/m) iwor
U2n- Wo-
2
w+2(0)e
(3.6-4)
_ (eEo/M) iw 0 t,
U2n+ 1 -
w 02 -w+2 (O) e

en donde w+{O) es el límite de longitud de onda larga de la frecuencia de rama


óptica, como está dado por (3.4-10).
De acuerdo con estos resultados, cuando la frecuencia de la luz incidente es
igual a la frecuencia natural de la red para vibraciones de modo óptico de longitud
de onda larga, w+{O), por lo normal, se observaría un efecto de resonancia ya que
las amplitudes de vibración aumentarían mucho. Es de esperarse que al producirse la reso-
nancia, las amplitudes muy grandes de vibración de los iones cargados den origen a una
fuerte rerradiación de energía electromagnética a la frecuencia resonante. De hecho,
este fenómeno se observa en cristales iónicos en los que se produce un solo pico
fuerte en la reflexividad óptica del cristal en la región infrarroja lejana del espectro,
sobre todo en la región de 40 a 1OOJ.L de longitud de onda. Si se conocen las
constantes de elasticidad del cristal, se puede hacer un cálculo de la constante de
fuerza {3; sí luego se conocen las masas atómicas m· y M, se puede calcular y
comparar la frecuencia de resonancia w+(O) según la predice (3.4-1 O), con la fre-
cuencia óptica a la que se observa experimentalmente la máxima reflexividad. De
esta manera se encuentra que en la mayoría de los cristales iónicos simples, los dos
valores concuerdan con bastante exactitud.
Energía de enlace de estructuras cristalims iónicos 69

Si un cristal iónico dado refleja varias veces la radiación de una fuente infra-
rroja de espectro continuo, la radiación residual resultante será una luz casi mono-
cromática de la frecuencia de resonancia de la red, ya que a otras frecuencias, la
reflexividad del cristal será más bien pequeña y, después de varias reducciones, este tipo
de luz se atenuará enormemente. Este efecto ha llevado a la terminología de rayos resi-
duales o bien, como se dice en alemán, Reststrahlen, refiriéndose a la radiación refle-
jada desde un cristal iónico al pico de reflexividad. El efecto característico de Reststrahl,
según se produzca o no, puede indicar si el cristal es iónico o bien covalente, ya que el
modo de vibraciones ópticas no se puede excitar así en un cristal covalente, eP el que
los átomos no llevan una carga neta. La intensidad del pico de Reststrahl en un cristal
mixto iónico-covalente, también proporciona una estimación cuantitativa de la fuerza
relativa del componente iónico del enlace del cristal.
Por supuesto, en relación con el pico de reflexividad, se tiene un mínimo en la
transmisión óptica del cristal. Aunque en el cálculo sencillo que se hizo se pasaron
por alto los términos de amortiguamiento en la ecuación del movimiento, y no se
incluyó ningún otro para explicar las pérdidas de energía del cristal, en realidad, sí
se registra una pérdida de energía. Esta pérdida se debe no sólo a la rerradiación del
haz reflejado, sino también a otras razones entre las cuales la más importante es la
de la inarmonía de las vibraciones reticulares que se origina a las amplitudes grandes,
producidas cerca de la resonancia, originando, a su vez, la excitación de otros modos
de vibración de la estructura reticular.

3.7 ENERGIA DE ENLACE DE ESTRUCTURAS


CRISTALINAS IONICAS3

En un cristal iónico, las fuerzas que mantienen unido el cristal se ongman


principalmente en interacciones electrostáticas simples entre los iones positivos y
negativos del cristal. Para este tipo de enlace, es bastante sencillo calcular la energía
de enlace de la red cristalina sobre una base semiempírica. El planteamiento original
de este tema se debe a Madelung y Born. 4 ,S,6
A continuación se verá el ejemplo específico de un cristal de la estructura del
NaCl, como se ilustra en la figura l. 7(a); U¡¡ es la energía potencial de interacción
entre los iones i y j del cristal. El total de energía de interacción entre el ion i y
todos los demás iones del cristal es, entonces,

(3.7-1)

La prima de la suma indica que el término para el que j = i se debe excluir de


la suma, ya que evidentemente, no existe una interacción de enlace entre el ion i y
él mismo. Además de la energía coulómbica de interacción ± e2 jr¡¡, en donde r¡¡ es
la distancia entre los iones i y j, se debe suponer q•1e existe una fuerza de repulsión
la cual crece sólo en distancias interiónicas muy pequeñas. En efecto, esta fuerza de
repulsión de corto alcance se origina debido a que cuando los átomos están cerca,

3 Esta sección sigue, en forma general, el planteamiento que le dio C. Kittel en IT'troduc-
tion to Solid State Physics, John Wiley & Sons, Nueva York (1956).
4 E. Madelung, Physik, Zeitschr, 11, 898 (1910).
S M. Born, Atomtheorie des Festen Zustandes, Teubner, Leipzig (1923).
6 M. Born y M. Goppert-Mayer, Handbuch der Physik, 24/2, 623 (1933).
70 Dinámica de redes cristalinas

resisten cualquier intento adicional para obligarlos a ocupar el mismo espacio. Si no


existiera esta fuerza, el cristal tendría siempre una energía coulómbica de atracción neta
entre iones de cargas opuestas, que sería mayor que la energía coulómbica de repul-
sión entre iones de cargas iguales, y el cristal simplemente se derrumbaría reducién-
dose a un volumen igual a cero. La energía de interacción entre los iones i y j
debida a esta fuerza, se representa empíricamente mediante el término A/1/¡. Si el
exponente n es un número razonablemente grande, esta interacción de repulsión será
muy pequeña a grandes distancias y se hará apreciable sólo en espaciamientos in-
teratómicos bastante reducidos.
La energía total de interacción entre los dos iones i y j, se puede expresar
como la suma de las interacciones de repulsión de Coulomb y de corto alcance, en
la forma

(3.7-2)

Se debe observar que la fuerza originada en la interacción de repulsión a corto


alcance, está dada por la derivada negativa de la energía de interacción correspon-
diente con respecto a r¡¡, nA/1¡}+ 1 • En (3.7-2) el signo + se aplica a interacciones
entre iones de signos iguales y el signo - se refiere a las interacciones entre iones de
cargas opuestas. La constante A se limita a expresar la proporcionalidad entre la
energía de repulsión a corto alcance y rij 11 • Si el cristal se considera como un elemen-
to compuesto de N iones positivos y N iones negativos, la energía total de enlace de
la red, U, se puede expresar como sigue:

U=NU;. (3.7-3)
Ahora bien, el número total de iones del cristal es 2N, pero, al determinar la
energía total de enlace, sólo debe tomarse una vez la energía aportada por cada par
de interacciones ij; si se escribiera (3.7-3) con un factor de 2 en el lado derecho, las
interacciones U¡¡ y U¡¡ de (3.7-1) se hubieran contado erróneamente como si fueran
entidades independientes. La energía U¡¡ dada por (3. 7-2), viene a ser la suma de la
energía necesaria para separar los iones i y j situados a una distancia inicial r¡¡, hasta
que estén infinitamente separados; la energía reticular total U es, entonces, la ener-
gía requerida para convertir un cristal cuyos átomos vecinos más cercanos se encuen-
tran inicialmente a una distancia r, en iones separados, cada uno de los cuales está
infinitamente lejos de los demás.
Si ahora las cantidades X¡¡ que no tienen dimensiones se definen en tal forma
que

(3.7-4)

en donde r es la distancia entre los átomos adyacentes del cristal, entonces, (3. 7-2)
se puede expresar como sigue:

(3.7-5)
y

(3.7-6)
Energía de enlace de estructuras cristalinas iónicas 71

No obstante, en (3.7-6), r es ahora independiente del índice de suma j, por lo


que

A , 1 e2 1
U-(r)
1 n¿ - n+-
= -"" - ""'-
¿ ' (3.7-7)
r i X¡i r i xii

que se puede escribir así:

B ae 2
U-(r)=....!! _ _ (3.7-8)
' r" r '
con

B" = A L' 1/x'& (3.7-9)


j

y
a = L.' + 1/xii. (3.7-10)
j

En la figura 3.14 se muestra una gráfica de la relación (3.7-8), dando a U¡


como una función de la distancia al átomo más cercano r. Si la distancia entre los

U; (r)

r =o (Separación del ion en equilibrio)

7::7
:;."
:í'
'/'
/
U; (o)+--........::~_.,1 Energía de Coulomb- ae 2/r
(Energía de enlace) 1
1
1
Figura 3.14. Energía potencial de un ion de un cristal iónico en función de la distancia in-
teratómica r. El cristal está en equilibrio cuando dicha energía está en un mínimo,
o sea cuando existe una separación interatómica igual a la distancia reticular de
equilibrio a.

átomos adyacentes es grande, la repulsión de alcance corto se puede omitir y la


energía de enlace es esencialmente el exceso de la energía coulómbica de atracción,
que se acerca a cero conforme r tiende a infinito. A distancias más cortas, la ener-
gía positiva de repulsión de corto alcance adquiere importancia y sobrepasa la energía
negativa de Coulomb, aumentando con gran rapidez conforme disminuye r. Existe
72 Dinámica de redes cristalinos

una posición de energía mínima para el sistema, como lo indica el diagrama, y este
punto representa la posición de equilibrio del cristal. El valor de r asociado con
este punto es, sencillamente, la distancia interatómica de equilibrio a del vecino más
cercano. En este punto, la fuerza coulómbica de atracción entre los iones mantiene
un difícil equilibrio debido a la repulsión de corto alcance, siendo igual a cero la
fuerza neta ejercida sobre un átomo, dada por - au;;ar.
La constante a de la ecuación (3.7-8) que se denomina constante de Madelung,
es un número que está determinado completamente por la estructura reticular del
cristal. La constante B depende del coeficiente de energía de repulsión A, así como
de la estructura reticular. Sin embargo, se puede determinar en términos de la
distancia de equilibrio a del vecino más cercano. Para hacer esto, se debe evaluar la
derivada de U;(r), a r =a que, de acuerdo con la exposición anterior, debe ser igual
a cero, ya que el punto mínimo de la curva de energía potencial se produce a r = a
Por tanto, se tiene que

nBn cxe 2
- n:tr
a
+ -a2 = O,
de donde,

(3.7-11)

Al substituir este valor de Bn en (3. 7-8), si se usa (3. 7-3) se encontrará que
para la energía total de enlace en equilibrio,

U0 = NU¡(a) = - -Ncxe
2
a - ( 1- ~ . 1) (3. 7-12)

En esta fórmula no se conoce inicialmente a o n. No obstante, en principio, se


puede calcular a evaluando la suma (3. 7-10) en todos los átomos del cristal. En esta
ecuación, el signo superior se refiere a las interacciones entre cargas iguales y el
signo inferior, a las interacciones entre cargas opuestas. Por tanto, si el origen se
escoge como un punto de ion negativo, el signo positivo de (3.7-10) corresponderá a
las interacciones con iones positivos y el signo negativo a las interacciones con iones
negativos. Para una cadena unidimensional de átomos cargados, alternados, en donde,
cada átomo está separado de sus vecinos por una distancia a, se tiene que, al escoger
un ion negativo como origen y al usar (3.7-10),

(3.7-13)

El factor 2 es necesario porque las cantidades aportadas por los átomos a la


izquierda del origen y por los átomos a la derecha del mismo, se deben incluir
igualmente en la suma. De acuerdo con la expansión de serie,

x2 x3 x4
In (1 + x) = -x- -
2
+---
3 4
+ ··· (3.7-14)

la serie de (3.7-13) se puede obtener haciendo que x = l, de donde, para este caso,

ex= 2ln 2. (3.7-15)


Energía de enlace de estructuras cristalinas iónicas 73

La evaluación de la constante de Madelung resulta un ejercicio fácil para este


ejemplo sencillo. Sin embargo, cuando estos mismos métodos se aplican a estructuras
cristalinas reales de tipo tridimensional, se descubre que la suma converge en forma
tan lenta que es muy difícil evaluar a directamente en esta forma. Resulta ilustrativo
escribir la suma de Madelung para los vecinos más cercanos, los que le siguen en
segundo lugar, en tercero, etc., para la estructura del NaCl, con el fin de demostrar
la naturaleza de estas dificultades de convergencia. Existen varios patrones matemá-
ticos que se pueden utilizar para contrarrestar estas dificultades, el mejor de los
cuales ha sido creado por Evjen 7 y Ewald. 8 En esta obra no se entrará en los
detalles de estos métodos, sino que sólo se mencionarán los resultados correspon-
dientes a algunas estructuras de interés. Se ha encontrado que para la

estructura de NaCl oc= 1.7476


estructura de CsCl 1.7627
estructura de la zincblenda 1.6381

La tendencia de los compuestos iónicos a cristalizar en estructuras que poseen


constantes de Madelung grandes es por demás conocida. Esto se debe a que un valor
máximo de a, de acuerdo con (3.7-12), minimiza la energía del sistema dando un
cristal con la máxima energía de enlace (negativa). En consecuencia, los cristales
muy iónicos raramente cristalizan en estructuras como la de la zincblenda.
La constante n de (3. 7-12), que es en realidad el exponente asociado con el
potencial de repulsión a corto alcance, se puede expresar en términos de la compre-
sibilidad adiabática del cristal, que se puede medir en forma experimental. Para hacer
esto, se puede comenzar con la Primera Ley de Termodinámica que establece que

dQ = dU + p dV = T dS, (3.7-16)

en donde los símbolos tienen su significado termodinámico acostumbrado. Se consi-


dera que la energía interna U se compone totalmente de la energía potencial de
interacción entre los iones del cristal, según se expresa en (3.7-12). Esto significa
que se supone que la temperatura es mucho menor que la de fusión en una escala abso-
luta, ya que al aumentar la temperatura, los iones adquieren, además de su energía po-
tencial, cada vez más energía cinética de vibración, que al llegar al punto de fusión exce-
de la energía potencial de interacción entre los iones y con ello se destruye la estabi-
lidad de la estructura reticular. En el caso de un proceso adiabático, dQ = O, en
donde dS = O y dU = - p dV, dando

p = -(dU) y (3.7-17)
dV S

La compresibilidad adiabática (compresibilidad medida en tales condiciones que no


se intercambie calor con el medio), se puede definir como

K=_.!._ (dV) (3.7-18)


V dp .'

7 H. M. Evjen, Phys. Rev. 39, 675 (1932).


8 P. P. Ewald, Ann.d.Physik 64, 253 (1921).
74 Dinámica de redes cristalinas

en cuyo caso, de acuerdo con (3.7-17),

.!.= -v(dp) =v(dz~)-


K dV • dV •
(3.7-19)

De igual manera,
dU dU dr
dV=drdV
y

_ dU d 2 r
- dr dV 2 +
(!!!:)
dV
2 d2 U
dr 2 • .
(3.7-20)

Sin embargo, el volumen de la celda unitaria de NaCl, con 4 átomos de Na y


4 átomos de Cl, como se ilustra en la figura 1.7(a), es 8r3 ; el volumen por átomo
de Na (o por átomo de Cl) es, por tanto, 2r 3 , y el volumen total de un cristal
grande con N iones de Na y N iones de Cl, será

(3.7-21)

de donde,
dr 1
(3.7-22)
dV = 6Nr 2

(3.7-23)

De acuerdo con (3.7-20), (3.7-22) y (3.7-23), se tiene que

d2U -1 dU 1 d2U
(3.7-24)
dV = 18N 2 r 5 dr
2 + 36N 2 r4 dr 2 '

Como ya se vio antes, dU/dr =O a r =a, por tanto, de acuerdo con (3.7-24),
se de be tener

(3.7-25)

de donde, recordando (3.7-19)

(3.7-26)
Energía de enlace de estructuras cristalinas iónicas 15

A partir de (3.7-8), U(r) se puede expresar como sigue:

2
B a.e ]
U(r) = NU¡(r) = N [ ; ---¡: , (3.7-27)

en donde,

(3.7-28)

Bn está dada por (3.7-11). Al substituir Bn de la última ecuación, en (3.7-28),


y simplificando, haciendo que r =a, se obtiene finalmente,

Na.é(n- 1) 18Na
a3 =~· (3.7-29)

de donde, resolviendo para n,

18a 4
n = l + - -2 • (3.7-30)
Ka.e

Para el NaCl, el valor medido de la compresibilidad adiabática k, es aproximada-


mente 4 x I0- 12 cm 2 /dina, en tanto que a= 2.8 x I0- 8 cm. Cuando se substituyen
estos valores en la expresión (3. 7-30), se obtiene el resultado n e:: 8, por lo que en
este caso, de acuerdo con (3.7-12), se debe esperar que U0 e:: -0.9Nae 2 ja. Entonces,
parecería que aproximadamente el 90 por ciento de la energía de enlace de la red
está representado por el primer término de (3.7-12), que simboliza el exceso de
energía de atracción coulómbica entre iones de cargas opuestas, en relación con
la energía de repulsión de Coulomb entre iones de cargas iguales, en tanto que el
segundo término, que representa la parte aportada de repulsión a corto alcance,
constituye sólo aproximadamente el 1O por ciento del total. El hecho de que n
resulta ser un número bastante grande, coincide con las suposiciones originales rela-
cionadas a la forma del potencial de repulsión a corto alcance y, en efecto, sirve
para validar hasta cierto punto dichas suposiciones.
La energía de cohesión de casi todos los cristales altamente iónicos de tipo
I-VII calculados así a partir de (3.7-12) y (3.7-30), concuerdan muy bien con los
valores determinados de un modo experimental, como se indica en la tabla 3.1. 9
Esta coincidencia con el experimento no es tan buena en el caso de los compuestos
completamente iónicos II-VI, como podría esperarse. Se debe tener en cuenta el
hecho de que estos cálculos son, hasta cierto grado, empíricos, y que relacionan un
conjunto de cantidades determinadas en forma experimental (espaciamientos reticula-
res y compresibilidad) con otras (exponentes del potencial de repulsión y energía de
enlace). Un cálculo verdaderamente fundamental de la energ:a de enlace del cristal,
se etectuará a partir del conocimiento de las propiedades mecánicas ondulatorias de
los iones positivos y negativos, y predeciría más que utilizaría, los valores de la
constante de red y las compresibilidades; las únicas cantidades medidas que aparece-
rían en una formulación de esta clase serían e, m, h, etc. Lowdin 10 llevó a cabo

9 Los valores aquí citados fueron tomados de F. Seítz, Modern Theory of Solids, McGraw-
Hill, Nueva York (1940), tablas XXIV y XXVI, páginas 80-83.
10 P. Lowdin, Ark.Mat. Astron. Fysik 35A, Nos. 9, 30 (1947).
76 Dinámico de redes cristalinas

TABLA 3.1.
Energías de enlace teóricas y experimentales
de cristales iónicos

Uo (cale.) U0 (exp.) Exponente


Substancia kcal./mol kcal./mol de repulsión, n

LiCI 193.3 198.1 7.0


NaCI 180.4 182.8 8.0
KCI 164.4 164.4 9.0
RbCI 158.9 160.5 9.5
CsCI 148.9 155.1 10.5
NaBr 171.7 173.3 8.5
KBr 157.8 156.2 9.5
N al 160.8 166.4 9.5
KI 149.0 151.5 10.5
Rbl 144.2 149.0 11.0
ZnS (Zincblenda) 819.0 851.0 9.0
ZnSe 790.0 845.0 9.5
PbS 705.0 731.0 10.5
PbSe 684.0 735.0 11.0

cálculos de este tipo, cuyos resultados concuerdan bastante con el experimento. Sin
embargo, el análisis detallado de este tema está fuera del alcance de esta obra.
A pesar de todo, la teoría más sencilla de Born-Madelung tiene un valor considerable,
debido a que verifica el simple modelo conceptual del enlace iónico con el que
principiamos y porque permite que se entienda con facilidad el papel que desem-
peñan las fuerzas de repulsión Coulomb y de corto alcance en la determinación de
la energía de enlace en las substancias iónicas.

EJERCICIOS

l. Para la red lineal monoatómica de la sección 3.3, encuentre el coeficiente de atenuación


de ondas de frecuencias mayores que Y4fJ!m.
2. Derive la ecuación de movimiento para ondas transversales en la red monoatómica lineal
de la sección 3.3. Compare sus resultados con la ecuación de movimiento para ondas longitudi-
nales.
3. Determine la velocidad de fase y la de grupo para ondas de las ramas óptica y acústica,
para la red diatómica de la sección 3.4. Grafique sus resultados en función de k.
4. La red de la zincblenda se puede considerar como una serie de planos (111) con
espaciamiento alternado a, a/3, a, a/3, a, a/3, • • • , en donde a es 1/4 del lado de una celda
unitaria cúbica. Cada plano contiene átomos de un solo tipo, de modo que los espacios atómicos
en planos sucesivos son alternados: Zn, S, Zn, S, Zn, • • • . Los planos se mantienen unidos alter-
nativamente mediante un enlace covalente por átomo, normal al plano (111), y 3 enlaces de este
tipo por átomo a un ángulo con la dirección [111] cuyo coseno es 1/3, de tal modo que se
utiliza la misma cantidad de fuerza por unidad de desplazamiento para estirar un solo enlace o
un sistema de tres enlaces dispuestos a este ángulo, cuando un átomo se desplaza a lo largo de
la dirección angular [111]. Estudie la red diatómica del tipo que se ilustra en la figura que sigue,
con una constante de fuerza {3 que es la misma para cualquier desplazamiento, y luego defina y
resuelva las ecuaciones de movimiento para ondas longitudinales en la dirección (111) en la
zincblenda, y grafique la relación resultante de w en función de k en la primera Zona Brillouin.
¿Cuál es el borde de esta primera zona? Nota: para la zincblenda, b =a/3, m =/=M en la fJ.gura
antcri'-;r.
Energía de enlace de estructuras cristalinas iónicas 11

m M m M

Zn-3 2n-2 2n-l


tf
2n 2n+l
tt
2n+2 2n+3

5. Resuelva el problema 4 para obtener las relaciones de w en función de k para ondas


longitudinales en la dirección [111] para la red de diamante. Diga si el hecho de que el
diamante sólo tiene átomos de una especie es la causa de que no existe una rama "óptica" para
esta estructura. Sin entrar en detalles compare resultados obtenidos con los del problema 4.
6. Si el coeficiente de rigidez elástica e para NaCl es 5 X 1011 dinas/cm2, encuentre la
constan te de fuerza {j y calcule la frecuencia de Reststrahl de este cristal.
7. Suponga que las vibraciones longitudinales de una cadena lineal de N átomos idénticos,
se limitan a obedecer las condiciones periódicas de frontera, de tal manera que el movimiento
del primero y el último átomos es idéntico. Encuentre el número de modos normales de vibra-
ción para este sistema.
8. Determine la constante de Madelung para la cadena lineal del problema 4, suponiendo
que los átomos de masa m tienen carga positiva y los de masa M tienen la misma carga; pero
negativa.
9. Suponga que un fluido isotrópico homogéneo con una constante dieléctrica K, se derra-
ma en los espacios interatómicos de un cristal iónico, de tal manera que la interacción coulóm-
bica se reduce por un factor de 1/K. Suponiendo que el potencial de repulsión de corto alcance
no varía, calcule el nuevo espaciamiento reticular y la nueva energía de enlace en términos de la
energía de enlace y el espaciamiento antiguos.
10. Analice las características de reflexión óptica de Ge, CdS, KBr y GaAs en la región
infrarroja lejana del espectro. Finalmente explique sus predicciones desde el punto de vista de la
física.
11. La imposición de condiciones periódicas de frontera a una cadena unidimensional de
átomos, corresponde físicamente al caso en que el principio y el fin de la cadena se unen para
formar un anillo continuo de átomos. ¿A qué sistema físico corresponde una red cuadrada
bidimensional de átomos que obedecen a condiciones periódicas de frontera en los bordes opues-
tos de la red? Explique el significado topológico de una red cúbica tridimendional que obedece
a condiciones periódicas de frontera en las caras opuestas de la muestra.

LECTURAS RECOMENDADAS
M. Born y M. Goppert-Mayer, Handbuch der Physik, Vol. 24/2, J. Springer Verlag, Berlín
(1933), p. 623.
M. Born y K. Huang, Dynamical Theory of Crystal Lattices, Oxford University Press, Oxford
(1956).
L. Brillouin, Wave Propagation in Periodic Structures, Dover Publications, Nueva York (1953).
C. Kittel, Introduction to So/id State Physics, 2.a edición, John Wiley & Sons, Nueva York
(1956), capítulo 3.
F. Seitz, Modern Theory of Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo 2.
R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman & Hall, Ltd., Londres (1961),
capítulo 3.
J. M. Ziman, Electrons and Phonons, Oxford University Press, Nueva York (1960), capítulos 1 y 3.
CAPITULO 4
Mecánica cuántica.
Generalidades

4.1 INTRODUCCION

Durante los últimos años del siglo diecinueve y los primeros del presente, los
científicos se encontraron con un gran número de hechos observados en su experi-
mentos que no se podían explicar debidamente basándose en la mecánica y la
electrodinámica clásicas. Entre los fenómenos poco comprendidos se incluían algunas
de las propiedades térmicas y eléctricas fundamentales de los sólidos. Por ejemplo, el
hecho de que algunos sólidos son muy buenos aisladores, con resistividades específicas
mayores de 10 12 ohm-cm, y otros son conductores excelentes con resistividades del
orden de 10- 5 ohm-cm, no se podía explicar en absoluto desde el punto de vista de
la teoría clásic.-. Sin embargo, a partir de 1901 gracias a la explicación dada por
Max Planck sobre la distribución espectral de radiación proveniente de cuerpos ca-
lientes incandescentes, se pudo demostrar que casi todos estos resultados expe-
rimentales hasta entonces inexplicables, demostraron estar de acuerdo con las pre-
dicciones de una nueva mecánica la cual difiere en muchos aspectos importantes de
la mecánica newtoniana, aunque concuerda con ella en el límite en que las masas y
las energías de las partículas se hacen relativamente grandes. Esta nueva y ampliada
forma de la mecánica, que resultó especialmente útil en la descripción de aconteci-
mientos que se desarrollan a una escala atómica, se denominó mecánica cuántica.
Aunque es imposible presentar en esta obra una relación extensa sobre el tema, se
analizarán algunos de sus aspectos más importantes, a fin de proporcionar al lector
los conocimientos necesarios para resolver problemas dinámicos simples desde el pun-
to de vista de la mecánica cuántica, y para apreciar los resultados de los cálculos
concernientes a sistemas más complejos que se dan más adelante, al explicar el
comportamiento físico de cristales reales.

4.2 RADIACION DEL CUERPO NEGRO

En la figura 4.1 se ilustra la distribución espectral de la intensidad de radia-


cwn emitida por un radiador incandescente ideal, llamado "cuerpo negro" detemli-
nada experimentalmente. Hacia fines del siglo pasado, se realizaron varios intentos
para explicar estos resultados a base de la mecánica clásica y la teoría electromag-
nética, tratando al campo de radiación como si fuera un fluido con propiedades

79
80 Mecánica cuántica. Generalidades

termodinámicas tales como temperatura, presión, entropía, etc., que se determinaban


mediante las leyes de la electrodinámica y la termodinámica clásicas Se supuso que
este fluido estaba en equilibrio con los átomos de la substancia radiante y éstos se
consideraban como osciladores armónicos dásicos. Ninguno de estos intentos tuvo
éxito para describir la parte de las curvas, correspondiente a longitudes de onda
corta, aunque se obtuvieron coincidencias aceptables con los datos experimentales en
el límite o sea, para las longitudes de onda largas (la Ley de Rayleigh-Jeans). Los
cálculos clásicos que se basaron siempre en la idea de que los osciladores atómicos
podían absorber o emitir continuamente energía en cualquier cantidad, grande o
pequeña, predijeron invariablemente intensidades espectrales infinitas en el límite de
las longitudes de onda corta. Esto dio como resultado la emisión de una energía de
radiación total infinita por unidad de tiempo, lo cual constituye un resultado obvia-
mente absurdo.

3000 °K

I(X)

o 1 2 3
x (micrones)

Figura 4.1. Representación esquemática de la distribución de frecuencia de la radiación emitida


por un radiador incandescente ideal o "cuerpo negro" a varios valores diferentes de
temperatura.

En 1901, Max Planck logró explicar la forma de las .curvas de intensidad de


radiación espectral correspondientes a la radiación de un cuerpo negro, formulando
la hipótesis de que los osciladores atómicos podían radiar o absorber energía sólo en
paquetes o grupos discretos (denominados fotones) cuya energía está dada por

e= hv = nw, (4.2-1)

en donde,
n = hj2n. (4.2-2)

En este caso, v es la frecuencia del oscilador (o de la radiación absorbida o


emitida), w = 2nv, y h es la constante atóm1ca universal (constante de Planck) de
magnitud

h = 6.625 x 10- 27 erg-sec

n = hj2n = 1.054 X 10- 27 erg-sec.


Efecto fotoeléctrico 81

Así pues, se supone que los osciladores poseen sólo ciertos estados de energía permi-
sibles de una energía total O, líw, 2líw, 3líw, • • • nlíw, • • • , en donde las transicio-
nes entre estos estados permisibles se efectúan mediante la absorción o emisión de
fotones cuya energía es líw.
A ciertos científicos de esa época, la hipótesis cuántica les pareció muy ex-
traña, ya que estaban acostumbrados a las ideas de la mecánica clásica; pero la
coincidencia que se obtuvo a partir de entonces con los datos experimentales fue
excelente y el valor de h que usó Planck para lograr que su teoría concordara con
los datos experimentales (6.55 x I0- 27 erg-seg), es solamente uno por ciento menor
del valor que en la actualidad se acepta como correcto. Además, es muy importante
observar que los éxitos subsecuentes de la teoría cuántica para explicar fenómenos
muy diferentes, no dejaron ninguna duda respecto a su validez esencial. A la luz de
los conocimientos actuales, no es difícil aceptar el hecho de que la energía, al igual
que la materia, puede estar compuesta de partículas discretas e indivisibles.

4.3 EFECTO FOTOELECTRICO

Cuando se deja que la luz caiga sobre la superficie de un metal, éste puede
expulsar electrones hacia un vacío, en donde los puede recoger un ánodo, como se ilustra
en la figma 2.4(a). La máxima energía inicial de estos fotoelectrones emitidos se
puede medir insertando un rejilla entre el fotocátodo y el ánodo, y determinando el
potencial retardador que se debe aplicar entre la rejilla y el cátodo para reducir la
fotocorrriente a cero, como se indica en la figura 4.2{b). Se puede demostrar en
esta forma que, si la luz incidente tiene una frecuencia menor que la de una
frecuencia de umbral dada (¡Jo, no se produce ningún efecto fotoeléctrico en abso-
luto, sea cual fuere la intensidad de la luz. Para una radiación incidente de una
frecuencia mayor que w 0 , los fotoelectrones se· emiten en una can ti dad proporcional

Luz

Anodo colector + Foto corriente


Iluminación interna

Iluminación leve
Fotocátodo metálico

Potencial de rejilla

(o) ( b)

Figura 4.2. (a) Diagrama esquemático del aparato usado para estudiar los efectos fotoeléctricos
en los metaies, (b) una gráfica de la fotocorriente observada en función del poten-
cial retardador para varios niveles de intensidad de la luz incidente.
82 Mecánico cuántico. Generalidades

a la intensidad de la iluminación incidente, haciendo que fluya en el circuito externo


una fotocorriente proporcional a la intensidad de la luz. La máxima energía inicial
de estos electrones, medida por el método del potencial retardador, es estrictamente
proporcional a w- w 0 , en donde w es la frecuencia de la luz incidente.
La existencia de la frecuencia de umbral no se puede explicar a base de la
física clásica, y no fue sino hasta después de 1905, cuando Einstein describió la
naturaleza física del efecto fotoeléctrico basándose en la hipótesis cuántica de
Planck. De acuerdo con la explicación de Einstein, los electrones que están dentro
del metal deben poseer una energía potencial menor que la de los electrones que
están en reposo dentro del vacío, fuera de la superficie metálica; de lo contrario, el
metal podría emitirlos espontáneamente en la obscuridad. Este hecho lleva al cuadro
conceptual de un metal tal como se ilustra en la figura 4.3. Para que los electrones
del metal puedan convertirse en fotoelectrones, deben superar una barrera de energía
potencial de una magnitud de por lo menos ecp 0 • El potencial cp0 , denominado
función de trabajo en vacío, es una propiedad característica del material del cátodo
emisor. De acuerdo con las ideas cuánticas de Planck, la absorción de un fotón cuya
energía es menor que ecp 0 por parte del metal, no puede excitar a un electrón hacia
el vacío, sino que sólo le imparte cierta energía cinética que finalmente se disipará
dentro del metal en la forma de calor por medio de colisiones.
Por otro lado, si el fotón absorbido tiene una energía ecp 0 , puede excitar un
fotoelectrón hacia el vacío con una energía cinética cero y, si la energía del fotón

\
Frecuencia incidente
del fotón "'o' etf>0 111
Fotoelectrón emitido al vacío
Energía con un E.C. cero
f _ ___,
e <Po
_L~~~~~~~~
Electrones
Vacío Metal Vacío

Figura 4.3. Modelo conceptual simplificado de un metal, representado como un pozo de po·
tencial que contiene electrones libres y en el que se basa la teoría de Einstein
sobre los efectos fotoeléctricos.

es mayor que ecp 0 , puede excitar a un fotoelectrón hacia el vacío con un exceso de
energía cinética que puede ser de la magnitud hw - ecp 0 , siendo hw la energía del
fotón incidente. La máxima energía de los fotoelectrones emitidos es, entonces,

(4.3-1)

en donde la frecuencia de umbral w 0 debe estar dada por

W0 = e</> 0 /h. (4.3-2)

Todo esto concuerda con los hechos experimentales que se describieron previa-
mente. Además, la ecuación (4.3-1) predice que la pendiente de la curva que da Em
en función de w, será la constante de valor h. ¡Cuándo esta pendiente se evalúa
basándose en datos experimentales, se encuentra, en efecto, que es una constante y
da un valor de h que concuerda exactamente con el valor derivado por Planck de los
datos experimentales corrrspondientes a la radiación de cuerpo negro! El efecto
Calor específico de los sólidos 83

fotoeléctrico proporcionó así, en unos cuantos años, una confirmación notable de la


teoría cuántica, en un campo muy alejado de su aplicación original.

4.4 CALOR ESPECIFICO DE LOS SOLIDOS

La física clásica considera que un cristal sólido es un conjunto de átomos que


se mantienen unidos en un arreglo periódico por medio de ciertas fuerzas de atrac-
ción. Se supone que los átomos son libres para vibrar alrededor de sus posiciones de
equilibrio bajo el efecto de las fuerzas presentes y, para lograr una primera aproxi-
mación, las fuerzas y los desplazamientos átomicos se relacionaron por medio de la
ley de Hook. Entonces, el efecto de la energía térmica consistiría en hacer que estos
átomos vibraran como osciladores armónicos alrededor de sus posiciones de equili-
brio. Un resultado elemental de la teoría cinética clásica consiste en que si las
energías de un conjunto de osciladores clásicos se distribuyen de acuerdo con la ley
de Boltzmann en equilibrio térmico, la energía promedio de un oscilador es kT para
cada grado de libertad vibratoria, en donde T es la temperatura absoluta y k la
constante de Boltzmann (igual a 1.380 x 10- 16 erg¡oK). En una sección posterior se
verá cómo se derivó este resultado. Entonces, de acuerdo con la física clásica, puesto
que hay tres grados de libertad de vibración independiente, por átomo, se debe
esperar que la energía interna térmica total de un cristal compuesto de N átomos
idénticos sea
U= 3NkT. (4.4-1)
La capacidad calórica a volumen constante, Cv, es por definición, la razón de
aumento de la energía interna por unidad de incremento de la temperatura, medidas
en condiciones de volumen constante o, en este caso.

c. = (oUfoT). = 3Nk. (4.4-2)


De acuerdo con la fórmula clásica (4.4-2), la capacidad calórica debe ser inde-
pendiente de la temperatura. Si en (4.4-2) N es igual al número de Avogadro NA
(igual a 6.025 x 10- 23 mol- 1 ), se puede ver que la capacidad calórica molar de
todos los elementos químicos sólidos debe tener el mismo valor 3NAk, igual o
aproximadamente 6 cal °K-- 1 mol- 1 . Este resultado se conoce como la ley de Dulong
y Petit, y concuerda bastante con el experimento para muchos elementos a la tem-
peratura ambiente y por encima de ésta. A temperaturas bajas, el resultado clásico
no concuerda con l::t experiencia, ya que los datos experimentales indican que la
capacidad calórica se acerca a .;ero, conforme la temperatura tiende a cero en la
escala absoluta, según se indica en la figura 4.4. Por supuesto, estas mismas observa-
ciones generales se aplican al calor específico a volumen constante cv, que se define
sencillamente como

c.= (oU/oT)vfV. (4.4-3)

En 1911, Einstein explicó las discrepancias entre la teoría clásica y la experien-


cia, y en 1912, Debye propuso una explicación más exacta basándose en la teoría
cuántica. De acuerdo con la hipótesis original de Planck, un oscilador armónico
puede poseer sólo ciertos estados de energía discreta que tienen los valores

(4.4-4)
84 Mecánica cuántica. Generalidades

c. ley clásica de Dulong • Petit


3Nk _____ 1_ _______~

Figura 4.4. Datos experimentales típicos· para el calor específico de una substancia sólida, en
función de la temperatura, en comparación con el resultado clásico de Dulong-Petit.

en donde w 0 es la frecuencia clásica del oscilador. Como se verá más tarde, esto da
como resultado un promedio de energía de oscilador diferente del resultado clásico,
y capacidades calóricas que concuerdan con los datos experimentales a todas las
temperaturas. También en este caso, la teoría cuántica ha proporcionado una explica-
ción sencilla de un efecto que no podía analizarse de acuerdo con los métodos
clásicos, siendo también este campo muy distinto del de la aplicación original.

4.5 EL ATOMO DE BOHR

Uno de los aspectos más desconcertantes del comportamiento atómico al que


se enfrentaron los físicos del siglo diecinueve, consistió en los espectros de emisión y
absorción de los elementos. Las líneas espectrales claras y discretas que se observa-
ron, no podían entenderse en absoluto a la luz de la mecánica clásica y la teoría
electromagnética. No obstante, en 1913, Niels Bohr propuso un modelo del átomo
del hidrógeno basado en la hipótesis cuántica de Planck, que describe con precisión
sorprendente las principales características del espectro del hidrógeno atómico.
En el modelo de Bohr, que se basó en el concepto del átomo nuclear pro-
puesto por Rutherford en 1910, se supone que un electrón de masa m y carga -e
se desplaza en un órbita alrededor de un núcleo mucho más masivo, de carga + Ze,
en donde Z es un entero. La introducción del factor Z permite explicar no sólo el
hidrógeno (Z = 1), sino también otros iones parecidos a éste, tales como He+ (Z =
2), u++ (Z = 3), Be+++ (Z = 4), etc., que se componen de un solo electrón y un
núcleo pesado.
De acuerdo con la electrodinámica clásica, las cargas aceleradas siempre irradian
energía, y un sistema como el que propuso Bohr, en donde el electrón está some-
tido siempre a una aceleración central, perdería energía constantemente en forma de
radiación y el electrón giraría en espiral acercándose gradualmente hacia el núcleo.
Sin embargo, Bohr supuso que el electrón podía existir en órbitas estacionarias
alrededor del núcleo sin irradiar energía en absoluto, a condición de que la cantidad
de moPimiento angular relacionada con este movimiento estuviera cuantizada en tal
forma que sólo se tuvieran los valores permitidos nh, en donde n es un entero
positivo. Entoncc~. b~ transiciones entre los estados estacionarios permitidos n y m
El átomo de Bohr 85

se relacionan con la emisión o absorción instantánea de un fotón de frecuencia Wmn


tal que

(4.5-1)
en donde Em es la energía asociada con el estado de la cantidad de movimiento
angular mh y En de energía correspondiente al estado de la cantidad de movimiento an-
gular nh.
Por supuesto, desde el punto de vista de la dinámica, la órbita del electrón
alrededor del núcleo podía ser circular o elíptica; pero para facilitar las cosas, se
supondrá que es circular. Los valores permisibles de la cantidad de movimiento
angular L están restringidos a enteros múltiplos de h, de tal manera que

(n = 1,2,3, ···), (4.5-2)

en donde rn es el radio de la órbita con un momento angular nh y Wn es la


velocidad angular del electrón dentro de dicha órbita. Para una órbita estacionaria, el
radio rn debe ser tal que la fuerza electrostática de atracción entre el electrón y el
núcleo, Ze 2 /r~, es justamente la fuerza centrípeta mvMrn necesaria para mantener al
electrón dentro de la órbita circular, de donde,

(4.5-3)

Las ecuaciones ( 4.5-2) y ( 4.5-3) se pueden resolver ya como ecuaciones simul-


táneas para r n y W 12 , dando

n21i2
r =-- (4.5-4)
" Zme 2
y

(4.5-5)

La energía cinética del sistema, ek> está dada por

_ 1 2 _ 2 2 _
Z l me4
¡;k- "lmv"- !mr"w" - - -2- 2 • (4.5-6)
2n li

La energía potencial eP, es

2 Z2 mé
¡;P = -Ze ft"n = - -2-2-. (4.5-7)
n li
Por tanto, la energía total del sistema es

(n = 1,2,3, ···). (4.5-8)

Como se puede ver, la energía del sistema está limitada a ciertos valores dis-
cretos o niveles de energía correspondientes a n = 1, 2, 3, •••. Si Z = l, el sistema
86 Mecánica cuántica. Generalidades

l Energía •

114'1
~

-
-
¡¡- 11
Serie
de Paschen
•3= 1

Serie
de Balmer

Serie
de Lyman

me 4

Figura 4.5. Niveles de energía del átomo de hidrógeno según lo pll'dlc ho por la teoría de
Bohr. Se indican las transiciones correspondientes a cierta~ lmcas espectrales pro-
minentes.

correspondiente al átomo de hidrógeno y el diagrama de niveles de energía resultante


se ilustra en la figura 4.5. Las transiciones entre los niveles de energía se logran
mediante la absorción o la emisión de un fotón cuya frecuencia está dada por
(4.5-1), correspondiendo cada transición de este tipo a una línea posible del espec-
tro. La teoría de Bohr explica con claridad y precisión el espectro del hidrógeno y
de los iones semejantes a él, y se puede ver que las frecuencias espectrales predichas
y las observadas son muy semejantes.
En la exposición anterior se supuso que las órbitas de los electrones son
circulares. En general, las órbitas pueden ser elípticas y, en efecto, se puede demos-
trar que existen series regulares de órbitas elípticas permitidas que satisfacen la
condición cuántica ( 4.5-2). Sin embargo, estas órbitas elípticas no establecen nuevos
niveles energéticos, sino que sólo representan órbitas para las que la cantidad de
movimiento angular tiene un valor mh en donde m es un entero menor que n, así
pues, el sistema posee una energía En de acuerdo con lo que determine (4.5-8); pero
su cantidad de movimiento angular, aunque sigue siendo un entero múltiplo de h, es
menor que el valor máximo nh que corresponde a una órbita circular. También se ha
considerado que el núcleo está fijo, lo cual es cierto sólo en el límite en que la
relación de la masa nuclear a la electrónica se hace infinita. Para una masa nuclear
finita, el núcleo y el electrón girarán alrededor de un centro común de masa. Este
efecto se explica fácilmente y el resultado es que la cantidad m de las ecuaciones
anteriores se debe substituir por una masa reducida J1 dada por

(4.5-9)

siendo M la masa nuclear. En el caso del átomo del hidrógeno, la masa reducida
difiere de la electrónica en aproximadamente 1 parte por 1850.
La hipótesis .te De Broglie 87

Se hicieron numerosos intentos para generalizar el modelo de Bohr con el fin


de explicar los espectros del helio y átomos más complejos; durante la década que
siguió a la presentación del modelo, todos los esfuerzos fracasaron debido a que no
se encontró una forma sencilla para describir las órbitas. En general, los resultados
de los cálculos hechos no concordaron con la experiencia, ni se logró que la teoría
de Bohr explicara por qué algunas transiciones entre estados electrónicos en átomos
complejos, aparentemente, estaban prohibidas. No obstante, el modelo de Bohr pro-
porcionó por vez primera una explicación simple, coherente y exacta de los espec-
tros de átomos monoelectrónicos así como un marco conceptual que permitía en-
tender ciertos aspectos del comportamiento atómico y que resulta útil incluso hasta
hoy.

4.6 LA HIPOTESIS DE DE BROGLIE Y LAS


PROPIEDADES ONDULATORIAS DE LA MATERIA

En 1924, De Broglie sugirió que a una partícula con cantidad de movimiento


p, se le podría asociar una onda de longitud de onda A tal que
h h 2n
p = ¡ = 2n T = ñk. (4.6-1)

La condición cuántica de Bohr se sigue directamente de esta hipótesis, si se


supone que las órbitas permitidas de la sección anterior alojan un número entero de
longitudes de onda de la partícula, definidas por (4.6-1 ). Puesto que la longitud de
trayectoria de la órbita es 21Trn, de acuerdo con este concepto, se debe determinar

o bien,
(4.6-2)

Davisson y Germer demostraron experimentalmente que los electrones podían,


en efecto, difractarse de los cristales, obteniéndose el mismo patrón para un cristal
dado que el que producen los rayos X de longitud de onda A = h/p, según propuso
De Broglie. La condición para la difracción de electrones de planos cristalinos es,
precisamente, la condición de Bragg siendo A igual a h/p,

nA. = nh/ p = 2d sen 9. (4.6-3)

Posteriormente se ha demostrado que los átomos neutros, los protones, los


iones positivos y otras partículas, presentan el mismo comportamiento ondulatorio, y
en cada uno de estos casos se satisface la relación de De Broglie ( 4.6-1 ).

4. 7 MECANICA ONDULATORIA

En 1926, Schrbdinger desarrolló un patrón unificado para la mecamca, basán-


dose en las ideas físicas de la teoría cuántica de Planck, y utilizando los conceptos
de De Broglie sobre la naturaleza ondulatoria de la materia. Este patrón, que se
denomina mecánica ondulatoria, constituye una versión muy general de las leyes de
la mecánica, diseñada especialmente para abarcar el campo de los fenómenos ató-
88 Mecánica cuóntictl. Generalidades

micos y nucleares. Este planteamiento ha tenido un éxito rotundo y, hasta donde se


puede afirmar en la actualidad, constituye una forma correcta de describir el com-
portamiento físico de la materia en una escala atómica o en cualquier escala, ya que
la mecánica ondulatoria proporciona los mismos resultados qu¡; la mecánica new-
toniana clásica para los sistemas relativamente grandes y masivos que se pueden
observar en forma macroscópica. Casi al mismo tiempo, Heisenberg diseñó otro sis-
tema de mecánica cuántica denominada mecánica de matrices, basada en las mismas
ideas físicas que la mecánica ondulatoria. Aunque su formulación matemática difiere
bastante de la mecánica ondulatoria de Schrodinger más tarde se demostró que, en
realidad, las dos mecánicas constituyen sistemas equivalentes. La exposición de esta
obra se confirmará mayormente a la descripción de la mecánica ondulatoria de
Schrodinger, que es más sencilla y se relaciona con mayor facilidad a las situaciones
físicamente observables.
En la formulación de Schrodinger de la mecánica cuántica, una cantidad com-
pleja '11, denominada función de onda, se relaciona con un sistema dinámico. Esta
cantidad es una función de tres coordenadas espaciales para cada partícula del sis-
tema, y el tiempo. Las propiedades dinámicas del sistema están íntimamente rela-
cionadas con las propiedades de la función '11 y el comportamiento dinámico del
sistema se puede determinar cuando se conoce la función '11 del sistema. Para un sis-
tema de una sola partícula, que será el tema general de este libro, las propiedades
de la función de onda '11 se pueden expresar de acuerdo con los siguientes cinco
postulados: 1

l. Se tiene una función de onda compleja relacionada con la partícula,


'11 (x, y, z, t), en donde x, y, z, son las coordenadas espaciales y t es el
tiempo.
2. La expresión clásica correspondiente a la energía total e del sistema (que se
conoce con el nombre de Hamiltoniano clásico del sistema) dado por
p2
2m + V(x,y,z) =e, (4.7-1)

en donde p es la cantidad de movimiento de la partícula, m es su masa y


V(x, y, z) es la energía potencial, se pueden convertir en una ecuación on-
dulatoria por medio de ciertos operadores de asociación con las cantidades
dinámicas clásicas, y permitiendo que estos operadores se apliquen a la
función de onda como lo indica (4.7-1). Los operadores correspondientes a
las cantidades dinámicas pertinentes son:

dynamical variable associated operator


X, y, O Z ~ X, y, O Z
f(x,y,z) ~ f(x,y,z)

p ~
~V (4.7-2)
'
ha
e ~
; ot ·
1 C. W. ShNwin, lntrodur·tion to Quantum Mechanics, Holt, Rinehart and Winston, Nueva
'orl.. (1959). p;Í¡:ina 14. pJ¡•ina\ li2-63 Con'>Ílltcs<' también respecto a la ampliación de estos
P<"tul.ld<" a ~~~ll'llla~ de m..Í\ de una partícula
Mecánica ondulatoria 89

Puesto que las componentes cartesianas de operador son (3/3x, 3/3y, 3/3z),
es evidente que los operadores correspondientes a las componentes de la can-
tidad de movimiento Px• Py· Pz son (h/iX3/3x), {h/iX3/3y) y (h/iX3/3z), res-
pectivamente. Así también, puesto que p2 = p • p, el operador correspondien-
te p 2 debe ser - tJ2( V· V) o - fi2 V2 , de donde, V2 representa al operador
laplaceano 32 ¡ax2 + 3 2 /3y 2 + 32 /3z 2 , Al reemplazar las cantidades dinámicas
p 2 , V(x, y, z) y e en ( 4.7-1) con sus operadores correspondientes y al permi-
tirles que operen sobre la función de onda '11, se obtiene la ecuación on-
dulatoria
h2 2 ñ a'l'
- V 'Y
- 2 + V(x,y,z)'l' = - 7 -. (4.7-3)
m 1 at
Esta es la ecuación de Schrodinger para la función ondulatoria, que con
frecuencia se expresa en la forma

ha'Y
Jt"'Y = - - - (4.7-4)
¡ ot '
en donde Jlf representa el operador hamiltoniano
h2
Jt" =- 2m V
2 + V(x,y,z). (4.7-5)

3. Las cantidades 'IF(x, y, z, t) y V'll deben ser finitas, continuas y de un solo


valor para todos los valores de x, y, z y t.
4. La cantidad '11*'11, en donde '11* es el conjugado complejo de '11, es siempre
una cantidad real. Esta cantidad se interpreta como la densidad de proba-
bilidad en el sentido de que '11*'11 dv es la probabilidad de que las partícu-
las se encuentren dentro del elemento de volumen dv en el instante t. Esta
es toda la información respecto a la ubicación real de la partícula, que se
puede obtener de la función de onda; en cuanto al sitio exacto en donde se
encuentra la partícula en un momento dado y cuál es su trayectoria, esto
no se puede determinar en forma precisa de acuerdo con la mecánica cuán-
tica. Por supuesto, para un objeto grande o masivo, '11*'11 es grande sólo
dentro de las fronteras clásicas del objeto y se mueve en el tiempo según lo
predicen las leyes de Newton; pero, en una escala atómica, será imposible
localizar una partícula en forma exacta y seguir su trayectoria con minucio-
sidad. Puesto que '11*'11 dv es una densidad de probabilidad y, puesto que la
probabilidad de que la partícula se encuentre en algún punto en el espacio,
es la unidad, es necesario que la función de onda sea normalizada de tal
manera que

i 'Y*'I'dv=1, (4.7-6)

tomándose la integral sobre todo el espacio.


S. El promedio o valor esperado (a.) de cualquier variable dinámica a con la
que se asocia un operador a 0 p.• se define mediante

(01) = i '1'*01op '1' dv, (4.7-7)

tomándose la integral sobre todo el espacio.


90 Mecánica cuántica. Generalidades

Las características esenciales de toda la mecánica ondulatoria están contenidas


en estos cinco postulados. Lo que resta de este análisis estará dedicado a examinar
las implicaciones de la misma y a aplicarlas a problemas específicos. No se puede
demostrarlas, sólo se puede enunciar que los resultados obtenidos, siempre que se
han sometido a prueba por medio de experimentos, han coincidido con las observa·
ciones dentro de los límites de la incertidumbre experimental que, en muchos casos,
ha sido extremadamente pequeña. Por supuesto, se tratará de demostrar que los
resultados de la mecánica ondulatoria son paralelos con los dictados de la intuición
y coinciden con los resultados de la mecánica clásica cuando puede esperarse que
esto suceda.
En relación al último punto, se puede demostrar que la mecánica ondulatoria
proporciona los mismos resultados que la mecánica clásica en los que se relaciona
con los valores promedios o esperados de cantidades dinámicas. Para hacer las cosas
más sencillas, sea una situación unidimensional en la que el sistema dinámico está
confinado al eje x. El valor esperado de la cantidad de movimiento Px, de acuerdo
con (4.7-7), es, entonces,

<Px) = f oo

_ 00
li a
'l'*(x,t) · - -:--a 'l'(x,t) dx,
1 X
(4.7-8)

por lo que, al tomar una derivada de tiempo y diferenciarla bajo el signo de la


integral de la derecha,

d(px)
-- = -
li f"" a'I:'* -a'I:' dx
- + -li f"" - '1' dx
2
'1' *8 (4.7-9)
dt i -ro at ox i - 00 oxot .

Ahora, el valor de a\f! jat está dado por la ecuación de onda (4. 7-3) y el valor
de a\f!* jat se puede expresar en forma similar escribiendo la ecuación de onda en
función de \f!* en lugar de hacerlo en función de \f!. Esto se logra escribiendo la
función compleja \f!(x, t) como la suma de partes reales e imaginarias

'l'(x,t) = u(x,t) + iu(x,t), (4.7-10)

substituyendo esta forma de \f! en (4.7-3) e igualando las partes reales e imaginarias
de ambos lados de la expresión resultante, para obtener dos ecuaciones de la forma

(4.7-11)
li 2 2 au
--Vu+uV=ñ-.
2m ot

Si se multiplica la segunda de estas ecuaciones por - i y se suma a la primera,


se obtiene una ecuación de onda para \f!* ( =u - iv) de la forma

li 2
- - vzll'* + Vtl' * = ñ D'l'*
- --. (4.7-12)
2m ' it
Dependencia del tiempo de la función de onda 91

En la ecuación ( 4. 7-9), si se expresa a\lt j"ot por medio de ( 4. 7-3) y a\lt* jat
mediante (4.7-12), se obtiene

d(px) = - ~ foo [azq¡* o'l' -'V* o3'!1] dx + foo [ V'!l* o'V- '1'* ~ (V'I')] dx
dt 2m -oo ox 2 ax ox 3 -oo OX ax

= - ~ f<X) [~ (a'!l
o'V* - '1'* azq¡)] dx- Joo 'V* av '1' dx
2m -ac ox ox OX ox 2 -oo ' ox
= - ~ [o'V* o'V- 'V* az~]oo - Joo 'V* av 'V dx. (4.7-13)
2m ox ax OX o -oo -oo ax

De acuerdo con el postulado ( 4) anterior, la integral de la cantidad \lt*\lt =


u 2 + v 2 sobre el rango de oo a - oo, debe existir; esto significa que tanto u y v,
como sus derivadas, deben tender a cero conforme x se acerca a oo ó - oo. Por tanto,
\lt y a\lt jax tienden a cero dentro de estos límites, y el primer término de la
expresión (4.7-13) desaparece. No obstante, de acuerdo con el postulado (5) ante-
rior, el segundo término de ( 4. 7-13) representa el valor esperado de la cantidad
- aV/ ax, que es la fuerza clásica ejercida sobre la partícula. En consecuencia, se
tiene que

(4.7-14)

que es, sencillamente, la ley del movimiento de Newton. Por tanto, es evidente que
en lo que respecta a los valores esperados, la mecánica ondulatoria concuerda con
las ecuaciones de la mecánica clásica.

4.8 DEPENDENCIA DEL TIEMPO DE LA FUNCION DE ONDA

Se supondrá que la ecuación de Schrodinger (4.7-3) se puede resolver mediante


las técnicas matemáticas usuales o sea, separando las variables. Así pues, se supon-
drán soluciones de la forma

'V(x,y,z,t) = 1/J(x,y,z)r/J(t), (4.8-1)

en donde 1/1 depende sólo de las coordenadas espaciales y 41 depende sólo del tiempo.
Al derivar (4.8-1) y al substituirla nuevamente en (4.7-3), es evidente que

n
--rjJV
2
2
1/1+ Vr/Jl/1= ---:1/1-.
n dr/J
(4.8-2)
2m z dt

Si se dividen ambos lados de la ecuación entre \lt = 411/J, se tiene que

¡¡z vzlf¡ 1i 1 dr/J


- - - + V(x,y,z) = - - - - =e. (4.8-3)
2m 1/J i </> d t
92 Mecánica cuántica. Generalidades

En ( 4.8-3), el lado izquierdo es una función exclusiva de las coordenadas


espaciales, en tanto .:¡ue la expresión central está en función del tiempo solamente.
La única forma en que esta igualdad se puede aplicar a todos los valores de las
variables, es que cada expresión por separado sea igual a una constante denominada
constante de separación y representada por e en ( 4.8-3). En realidad, son dos ecua-
ciones separadas, una para cp(t), y la otra para ¡J;(x, y, z), de donde,

ie
d</Jfdt = - - </J(t) (4.8-4)
h
y

.1 2 lj¡ 2m (e-
+ ""j;2 V(x,y,z)) 1/1( x,y,z ) -O.
_ (4.8-5)

La ecuación ( 4.8-4) se puede integrar de tal modo que dé

(4.8-6)

La constante de integración que normalmente aparecería como un factor multiplica-


tivo ( 4.8-6) se iguala arbitrariamente a la unidad. Al hacer esto, no se pierde la
generalidad que se ha venido sosteniendo. De acuerdo con ( 4.8-1), la función de
onda dependiente del tiempo, '11, se puede expresar ahora como

I.JI(x,y,z,t) = ¡f¡(x,y,z)e-ietfn, (4.8-7)

en donde ¡J;(x, y, z) es una solución de ( 4.8-5).


La expresión ( 4.8-5) se denomina ecuación independiente del tiempo, de
Schrodinger, y sus soluciones ¡J;(x, y, z) se llaman funciones de onda independientes
del tiempo o de estado estacionario. La ecuación ( 4.8-5) se puede expresar también
como sigue

(4.8-8)

en donde ;jf es el operador hamiltoniano expresado por (4.7-5). Normalmente con-


viene, siempre que sea posible, resolver las ecuaciones independiente del tiempo
( 4.8-6) y utilizar lo más que se pueda sólo las funciones de onda independientes del
tiempo. Las dependencias del tiempo, siempre que se necesiten, se pueden expresar
utilizando ( 4.8-7).
Para lograr esto en forma correcta, se deben observar ciertos resultados que se
obtienen cuando la función de onda tiene la forma ( 4.8- 7). En primer lugar, si la
función de onda tiene esta forma, entonces,

(4.8-9)

y '11*\lf propiamente dicha es independiente del tiempo e igual a ¡J;*¡J; -; la termino-


logía de funciones de onda de estado estacionario, se aplica a funciones de onda de
esta índole. Como consecuencia de este resultado, ¡J¡*¡J¡ tiene la misma interpretación
de densidad de probabilidad con respecto a las funciones de onda independientes del
tiempo, que la que tiene \lf*\lf con respecto a las dependientes del tiempo. Además,
de acuerdo con ( 4.8-9), se sigue que

1 •p*•p dv = 1 ¡f¡*¡f¡ dv = 1, (4.8-10)


Dependencia del tiempo de la función de onda 93

y que la condición de normalización para las funciones independientes del tiempo


(4.8-7) es, por tanto, la misma que la que corresponde a las funciones dependientes
del tiempo. Por último, si las funciones de onda tienen la forma (4.8-7) y si a 0 p.
depende sólo de las coordenadas y no explícitamente del tiempo, el valor esperado
de ia variable dinámica representado por el operador CXop. se puede expresar como

(4.8-11)

ya que los factores exponenciales de tiempo se anulan al igual que sucede en


(4.8-9), si CXop. no tiene una dependencia explícita del tiempo. Si a 0 p. depende
explícitamente del tiemp<', entonces las funciones de onda dependientes del tiempo
se deben emplear normalmente para evaluar (a).
Se debe observar que estos resultados pueden aplicarse sólo cuando la función
de onda total tiene la forma (4.8-7). Si la función de onda total - ('ñ/iXo/ot), es
una superposición de funciones de la forma ( 4.8-7) -como puede suceder aun cuan-
do se satisfaga la ecuación ondulatoria dependiente del tiempo- estos tres resultados
ya no son válidos y, para calcular las propiedades del sistema, se deben utilizar las
funciones de onda dependientes del tiempo.
Se puede demostrar fácilmente, usando la función de onda (4.8-7) en (4.7-7),
con el operador de energía dependiente del tiempo - (h/i)(o/ot), que el valor espe-
rado de la energía de un sistema en un estado representado por una función de
onda de esta clase es, sencillamente, el valor de la constante de separación e. Por
supuesto, se puede prever este resultado gracias a la notación seleccionada para la
constante de separación. También se puede demostrar, a partir de (4.8-8), que el valor
esperado del operador hamiltoniano :tf para un sistema en un estado representado
por este tipo de función ondulatoria (el cual, puesto que :tf es un operador inde-
pendiente del tiempo, se puede calcular empleando la función de onda independiente
del tiempo de acuerdo con (4.8-11)), es igual a e, el valor esperado de la energía.
Las expresiones (4.8-4) y ( 4.8-5) no imponen ninguna restricción en el valor de
e, ya que para cualquier valor de e existe una \}1 que satisface estas ecuaciones. Sin
embargo, los requisitos de continuidad, el aspecto finito y el valor único, pueden
seleccionar, de entre el continuo infinito de soluciones posibles, sólo ciertas solu-
ciones individuales que satisfagan estas condiciones, que corresponden a ciertos va-
lores discretos de la constante de separación (y, por tanto, la energía) e. De esta
manera se puede encontrar que sólo un grupo determinado de soluciones 1/ln(x, y, z)
que se relaciona con un conjunto asociado de niveles energéticos En es aceptable
como funciones de onda para el sistema, debido a que sólo estas funciones satisfacen
la ecuación de onda y, a la vez, las condiciones de frontera. Las funciones de onda
aceptables se denominan funciones propias del sistema (tomado del alemán eigen,
que significa propias o características), y los niveles de energía correspondientes se
llaman valores propios de energía. Los niveles discretos de energía del oscilador de
Planck y el átomo de Bohr son, en realidad, valores propios de esta naturaleza. De
acuerdo con ( 4.8-6), se puede ver claramente que la frecuencia de la función de
onda obedece siempre a la relación de Planck

e = liw. (4.8-12)

En algunos casos, tanto la ecuación de onda como las condiciones de frontera


asociadas con ella se pueden satisfacer para cualquier valor de e, o, cuando menos,
para cualquier valor de e dentro de un intervalo finito dado. En tales casos existe
un rango continuo de energías permisibles o un continuo de niveles energéticos. Más
94 Mecánica cUJÍntica. Generalidades

adelante se verá en qué circunstancias particulares se presentan estas situaciones


posibles.

4.9 LA PARTICULA LIBRE Y EL PRINCIPIO


DE INCERTIDUMBRE

A continuación se examinará la función de onda de una partícula libre, es


decir, que no está sujeta a fuerzas y que, por tanto, se mueve en una región de
potencial constante. Este estudio se limitará a una geometría unidimensional en la
que el movimiento está restringido al eje x. Por conveniencia y, para no perder
generalidad, el potencial se puede considerar con un valor de cero, en cuyo caso la
ecuación ( 4.8-5) se convierte en

(4.9-1)

en donde

k= J2mejh2. (4.9-2)

La ecuación (4.9-1) es de un tipo diferencial ya conocido que tiene soluciones de la


forma

t/J(x) = Ae±ikx, (4.9-3)

en donde A es una constante arbitraria. Estas soluciones satisfacen todos los requi-
sitos de las funciones de onda excepto, en un sentido estricto, la integrabilidad en el
intervalo - oo < x < oo. Sin embargo, será necesario aceptarlas aunque, como se verá
más adelante, se pueden originar ciertas dificultades para satisfacer los requisitos de
normalización. Las funciones de onda dependientes del tiempo del sistema, de acuer-
do con (4.8-7), serán

'l'(x,t) = Aei(lkx-wt), (4.9-4)

en donde, de acuerdo con (4.9-2),

flk2
w = efñ = - . (4.9-5)
2m

Las soluciones dependientes del tiempo ( 4.9-4) representan ondas progresivas; si


se escoge el signo +, la dirección de propagación es a lo largo del eje + x; si se
selecciona el signo --, la dirección de propagación es en sentido opuesto. Por tanto,
se puede hacer la misma selección de signo para las funciones independientes del
tiempo (4.9-3) para representar ondas que se propagan (en el tiempo) en estas
direcciones respectivas. El valor esperado de la cantidad de movimiento de la par-
tícula, de acuerdo con ( 4.8-11 ), está dado por

(4.9-6)
La partícula libre y el principio de incertidumbre 95

No obstante, de acuerdo con (4.9-3), se puede ver que a¡J¡¡ax = ± ikl/l, por lo
que (4.9-6) se convierte en

oo h
(p}) = ±ñk f
-oo
1/1*1/1 dx = ±ñk = ± -:;.
A
(4.9-7)

Esta expres10n es, sencillamente, un enunciado de la relación de De Broglie (4.6-1);


por tanto, la relación de De Broglie para partículas libres está contenida implícita-
mente en los postulados de la mecánica ondulatoria. Además, por lo que establece
(4.9-5), es evidente que

iz2k2 (p2)
B=--=-- (4.9-8)
2m 2m'

lo cual concuerda con el resultado clásico.


Al intentar normalizar la función de onda ( 4.9-3) de acuerdo con los requisitos
de (4.8-10), se encuentra que el valor de A*A debe escogerse en tal forma que sea
infinitesimalmente pequeño a fin de que no diverja la integral (4.8-10). Puesto que,
de acuerdo con (4.9-3), la probabilidad 1/1*1/1 dx de encontrar la partícula dentro de
un intervalo dx alrededor de un punto x es la misma en todos los puntos e igual a
A*A dx y, puesto que la probabilidad clásica a priori de encontrar una partícula
libre dentro de una región finita específica de una línea infinita, es infinitesimal-
mente pequeña, no es sorprendente que esta situación se haya presentado. En efecto,
esto coincide con lo que se podía haber esperado desde el punto de vista físico. No
se intentará resolver esta dificultad de un modo muy riguroso, sólo se observará que
no existen problemas graves al aplicar la condición de normalización (4.8-1 0), siem-
pre que se reconozca la naturaleza singular de las circunstancias que determinan la
magnitud de A*A y no se intente evaluar esta cantidad explícitamente en términos
numéricos.
Las soluciones de la ecuación de Schrodinger independiente del tiempo ( 4.8-5)
dan funciones de onda de la forma (4.9-3) o (4.9-4), que representan ondas planas
que se propagan a lo largo de la dirección ± x. Puesto que la densidad de probabi-
lidad '11!*'11! asociada con estas funciones es independiente del tiempo, las soluciones
(4.9-3) son funciones de onda de estado estacionario. Cada función de onda de
estado estacionario se relaciona con un valor único de energía E y, por ende, de
acuerdo con (4.9-8) y (4.9-7), representa un estado cuya constante de propagación
tiene un valor único k y cuya cantidad de movimiento tiene un valor único Px ( = lik).
No obstante, puesto que la amplitud de las ondas es constante, éstas se desplazan
de un modo uniforme desde oo a - oo, y, en consecuencia, no tienen una ubicación
única en el espacio. Dado que las condiciones de frontera de continuidad, de lo
finito, de unicidad, etc., se satisfacen igualmente para cualquier valor de E o k, existe
un rango continuo de valores permitidos para estos parámetros.
Mediante la superposición de soluciones de este tipo, cada una de las cuales
corresponde a un valor diferente de E y k, se pueden construir funciones de onda de
la forma

(4.9-9)
Debido a la linealidad de la ecuación dependiente del tiempo de Schrodinger,
este tipo de funciones de onda superpuestas son soluciones perfectamente adecuadas
para la ecuación dependiente del tiempo (4. 7-3); en cambio, no satisfacen la ecua-
96 Mecánica cuántica. Generalidades

ción independiente del tiempo ( 4.8-3) debido a que no tienen la forma ( 4.8-7). La
amplitud de probabilidad asociada con esta clase de soluciones, no es independiente
del tiempo, como sucede con las soluciones de estado estacionario. El método de
superposición se puede aplicar en forma más amplia de manera que un número
infinito de soluciones de estado estacionario se combine en una función de onda de
la forma

'l'(x,t) = L Anei(kn.x-mntl. (4.9-10)


n

Los valores de kn se pueden escoger muy cerca unos de otros, separados sólo por
intervalos dk, y los valores An pueden asumir la magnitud de cualquier función dada
de k en estos puntos, en cuyo caso, la superposición ( 4.9-1 O) se puede convertir, en
el límite, en una integral de la forma

'l'(x,t) = f~ 00
A(k)ei<kx-mt) dk. (4.9-11)

Como ejercicio, el lector puede verificar fácilmente el hecho de que ésta constituye
todavía una solución a la ecuación dependiente del tiempo de SchrOdinger (4.7-3).
La función A(k) de (4.9-11), puede ser cualquier función de k en tanto exista la
integral.
Supóngase ahora que, en algún instante de tiempo, por ejemplo, t = O, se trata
de formar una función de onda cuya densidad de probabilidad '11*'11 se localiza en
una región particular del eje x, por ejemplo, entre los puntos x = a/2 y x =- a/2,
como se ilustra en la figura 4.6. Esto se puede lograr construyendo una superpo-
sición de soluciones de la forma de estado estacionario (4.9-4), perteneciendo a
diferentes valores de k, de acuerdo con (4.9-11). Por ejemplo, se puede escoger

A( k) = e sen !(k - k 0 )a
(4.9-12)
t(k- k 0 )a '

en donde e y k 0 son constantes. Se verá directamente que esta selección de A(k) es


la correcta si '11*'11 es como se representa en la figura 4.6. Si se substituye (4.9-12)
en (4.9-11) y t se hace igual a cero, es evidente que

'll(x,O) = e f"' sen t(k - ko)a eikx dk. (4.9-13)


-=o t(k- k 0 )a

'11*'11 (/=O)

Figura 4.6. La función de densidad de probabilidad de una partícula que, de alguna manera,
debe encontrarse forzosamente a lo largo de la región del eje x que se extiende
entre a/2 y +a/2.
La partícula libre y el principio de incertidumbre 91

Si se hace que

q =k- k 0 , (4.9-14)

esto se puede escribir en la forma

'l'(x,O) =Ce'
.k
o.c
foo sen !qa .
- - - e'q" dq. (4.9-15)
-oo !qa
Ahora, de acuerdo con el teorema de la integral de Fourier2, una función arbitraria
f(x) se puede expresar como una integral de Fourier mediante

1 JO() . JO() . ,
f(x) =- e'q" dq f(x')e-•qx dx'. (4.9-16)
2n _ oo - oo

Si la función representada como 'lt*'lt en la figura 4.6, es decir,

(x) = 1/a (- a/2 < x < a/2)


(4.9-17)
=O (x > a/2; x < -aí2)

se expresa en forma de integral utilizando (4.9-16), se puede demostrar de un modo


directo que

1
f(x) = -
Joo
sen fqa .
- - - e'q" dq = 1/a (- a/2 < x < a/2)
2n _ oo tqa (4.9-18)

=O (x > a/2; x < -a/2).

Utilizando este resultado para expresar la integral en (4.9-15) con mayor sencillez, se
encuentra que 3

2nC .k
'l'(x,O) = -- e' 0" ( -a/2 < x < a/2)
a
(4.9-19)
=0 (x > a/2; x < -a/2).

La constante de normalización C se debe escoger en tal forma que satisfaga (4.7-6),


según lo cual
4n2;2 f!a dx = 4n2C2 = 1
a -!a a

2 Véase, por ejemplo, R. V. Churchill, Fourier Series and Boundary Value Problems,
McGraw-Hill Book Co. Inc., Nueva York (1941), capítulo V.
3 Aunque todas las funciones de superposición A(k)ei(kx-wt) satisfacen el requisito de
continuidad de las funciones de onda, la suma real, según lo expresa (4.9-19), no satisface este
requisito para x =±a. Esta violación de los requisitos formales no introduce, por tanto, ningún
error en los cálculos ya que, evidentemente, la función del pulso cuadrada (4 9-19) se puede
"redondear" muy cerca de x =±a para satisfacer la condición de continuidad sin introducir
ninguna alteración significativa en la forma de la función A(k).
98 Mecánica cuántica. Generalidades

o bien,

e= .J~/(2rr). (4.9-20)

Entonces,

1 'k
'P(x,O) = J~ e' ""' (- a/2 < x < a/2)
(4.9-21)

=0 (x > af2;x <- a/2)

En otras palabras, si A(k) se escoge como en ( 4.9-12), con e= ,jíi/(2rr), la


función de onda en el instante t = O, dada por ( 4.9-15), se puede expresar en la
forma sencilla (4.9-21). La amplitud de probabilidad 'lt*(x, O)'lt(x, O) existente en
t = O es, entonces, la de la figura 4.6 y la "partícula" se localiza dentro de una dis-
tancia & = a alrededor del origen. Sin embargo, para lograr esta localización, es
necesario introducir una superposición de funciones de ondas estacionarias corres-
pondientes a varios valores de k y, por ende, a varios valores de can ti dad de movi-
miento lík. Las amplitudes relativas de las diversas componentes en la sup~osición,
están dadas por la función A(k) y, por tanto. por (4.9-12) siendo e=ya/(2rr). En
la fi~ura 4. 7 aparece una gráfica de estas amplitudes de contribución en función de
ka. Las principales contribuciones provienen de la región cercana a k = k 0 y la
contribución desciende rápidamente para componentes con valores de k mucho ma-
yores o mucho menores que k 0 • Se puede considerar que las contribuciones a la
superposición de valores de k mayores que k 0 ++~ y menores que k 0 -+~ son
despreciables, siendo ~ un parámetro que expresa la anchura efectiva de la parte de
la curva de A(k), en donde A(k) asume valores que no son pequeños en compa-
ración al valor máximo A(k 0 ). Si arbitrariamente se escoge un valor tal de ~ que
t:J...ka) = 8rr, o sea, una posición correspondiente al segundo cero de la curva a ambos
lados de k= k 0 , -siendo ésta una selección ;azonable de acuerdo con el criterio
anterior- se tiene que

Ak = 8rrfa. (4.9-22)

A(k)

Figura 4. 7. lli~trihudón de la amplitud de la cantidad de movimiento correspondiente a la


·'lnplltud de (Hl'h.lhilida<l fl<' la figura 4 6.
La partícula libre y el principio de incertidumbre 99

El producto de la distancia Ax dentro de la cual se puede considerar que se localiza


la partícula, y la incertidumbre !lk en la cantidad de movimiento que se introduce
mediante la superposición de estados requerida para lograr esta localización, es

8n
ó.k · ó.x =-·a= 8n,
a

o bien, puesto que k = p/h,


ó.p · ó.x = 8nli. (4.9-23)

Olvidando los valores numencos que se obtienen de la selección arbitraria de un


punto de corte para !::k, y utilizando el símbolo - para indicar "del orden de'', se
puede escribir
ó.p . ó.x - li. (4.9-24)

Para una partícula libre cuya cantidad de movimiento se caracteriza por un


valor único singular de k, la "partícula" se extiende a lo largo de todo el espacio. Si
la partícula debe estar dentro de una región dada del espacio, entonces, su función
de onda, que ahora se debe considerar como una superposición de funciones de
estado estacionario con diferentes valores de k, se caracteriza por un "despliegue" de
valores de cantidad de movimiento tal que se obedezca a (4.9-24), según se ilustra
en la figura 4.6. Fste es un ejemplo específico de un efecto conocido con el nom-
bre de Principio de incertidumbre de Heisenberg, el cual es una consecuencia muy
general deducida de la descripción de la naturaleza en términos de la mecánica
ondulatoria. El principio de incertidumbre establece que la posición de una partícula
y su cantidad de movimiento no se pueden definir simultáneamente con precisión
arbitraria; cualquier experimento que se realice para asegurar que la partícula se
localizará dentro de una región dada del espacio, introducirá inevitablemente una
mcertidumbre en su cantidad de movimiento, que estará dada por (4.9-24). Se debe
recalcar el hecho de que este efecto es independiente de la precisión experimental
con que se pueden medir las cantidades de que se trata y, en realidad, es una
propiedad que tiene la materia en observación.
Por lo general, se puede demostrar que las relaciones de incertidumbre tales
como ( 4.9-24) existen entre todos los pares de variables dinámicas conjugadas que se
podrían usar clásicamente para especificar por completo el estado de movimiento del
sistema. Powell y Craseman 4 han escrito un análisis completo y detallado de este
tema. Si en (4.9-24) se escribe Ax = v t:.t, en donde v es la velocidad, se obtiene

V Ó.p Ó.t "' Ji. (4.9-25)

Puesto que, para una partícula libre, E= p 2 /2m, ÁE = p fjp/m = v fjp, (4.9-25) se pue-
de expresar como sigue
ó.e · ó.t - li. (4.9-26)

Por tanto, la relación de Heisenberg (4.9-24) también se puede expresar como la


incertidumbre de energía del tren de ondas multiplicada por la duración de éste.
Conviene observar que el comportamiento del "paquete de ondas" que se es-
tudió con anterioridad, se puede expresar como una función del tiempo por medio

4 J, L. Powell y B, Craseman, Quantum Mechanics, Addison-Weslcy, Reading. Mas~, (1961)


pág~nas 69-76; páginas 182-184,
100 Mecánica cuántica. Generalidades

de (4.9-11), con A(k) según la da (4.9-12). Se puede demostrar que el máximo de la


amplitud de probabilidad "11'*"11' se mueve a la velocidad constante hk0 fm, correspon-
diendo a una cantidad de movimiento constante hk0 según lo predice la m'ecánica
clásica. Además de este movimiento clásico del paquete como un todo, también se
sabe que el paquete se despliega conforme transcurre el tiempo, en tal forma que
siempre se satisface la relación de incertidumbre ( 4.9-24). En los casos de paquetes
de ondas que representan objetos grandes o masivos localizados dentro de distancias
macroscóp;r ente observables, este efecto de despliegue es tan pequeño que es
indetectabh: a una escala de tiempo razonable. s

4.1 O UNA PARTICULA EN UN POZO DE POTENCIAL


UNIDIMENSIONAL E INFINITAMENTE PROFUNDO

En este ejemplo se examinará el comportamiento de una partícula ubicada en


el pozo de potencial unidimensional que se ilustra en la figura 4.8. Para este sis-
tema, se tiene que

V(x) =O (O< x <a)


(4.10-1)
=00 (x <O; x >a).

En la región (O <x <a), en donde V0 , la ecuación de Schrodinger independiente del


tiempo (4.8-5) se puede reescribir como sigue

(4.10-2)

en donde

k= J2me/1i 2 • (4.10-3)

V(x) .. .
'
V=O-L....--~-x
X=O X=o
1 1

Figura 4.8. Un "pozo" de potencial infinitamente profundo.

s L Ikcnherry, Quantum Mechanics for Mathematicians and Physicists, Oxford University


Prt:'~~. Nut>va York (1962}, r:ígina 64.
Una partícula en un pozo de potencial unidimensional 101

En esta región, la partícula es libre y la solución ( 4.1 0-2) se puede expresar en la


forma (4.9-3). Sin embargo, es más conveniente escribirla en la forma equivalente

t/J(x) =A sen kx + B cos kx (0 < x <a), (4.10-4)

en donde A y B son constantes arbitrarias. Puesto que la partícula está limitada por
barreras de potencial infinitamente altas en x = O y x =a, se supondrá que

t/J(x) =O (x <O; x >a). (4.10-5)


Esta suposición, que parece ser físicamente razonable, se justificará más tarde en la
siguiente sección.
Si se requiere que t/l(x) sea continua en las fronteras del pozo de potencial
en x =O y x =a, entonces, (4.10-4) se debe reducir a cero en esos puntos. Si se
substituyen los valores x = O y x =a en (4.1 0-4) y el resultado se hace igual a cero,
es evidente que B =O y que

A sen ka= O. (4.10-6)

Esta condición se puede satisfacer sólo cuando

ka= nn (n = 1,2,3, ... ), (4.10-7)


de donde, sólo para una secuencia discreta de valores de k, que se identifican como
kn, en donde

k. = nnfo (n = 1,2,3, ... ). (4.10-8)

Puesto que k está relacionada con la energía por medio de (4.10-3), esta
condición se define como un conjunto discreto de valores propios de energía permi-
sibles
li2k! n2n21i2
e=--=--- (n = 1,2,3, ... ). (4.10-9)
• 2m 2ma 2
En la figura 4.9 se muestra un diagrama de los niveles de energía de este
sistema. En vista de los requisitos establecidos en ( 4.1 0-8), las funciones de onda del
sistema deben tener la forma
nnx
t/l.(x) = A. sen- (O< x <a),
a

=0 (x<O;x>a), (4.10-10)

en donde las constantes An están determinadas por los requisitos de normalización


( 4.8-1 0), de acuerdo con los cuales,

J oo
-oo
t/l:t/1. dx = A!
f" sen
o
2 -nnx
a
dx = 1 (4.10-11)

lo cual da
A.= 1/j~. (4.10-12)
102 Mecánica cuántica. Generalidades

·¡
25<¡ +------- E5

16<¡ +------- .•

4<¡ +------- •2 7T2h2

o -:l=======~·~~'_2_m_u_
2

Figura 4.9. Niveles de energía permisibles para una partícula que se encuentre dentro del pozo
de potencial ilustrado en la figura 4.8.

La dependencia del tiempo de las funciones de onda se determina fácilmente a partir


de ( 4.8-7). Por supuesto, las funciones ( 4.10-1 O) son funciones propias de estado
estacionario para las que '1'*'1' es independiente del tiempo.
Para este sistema, se sabe que existe un sistema de niveles discretos de energía,
dados por ( 4.1 0-9). La ecuación de Schrbdinger ( 4.1 0-2) dentro de la región permi-
tida de movimiento es la misma que para una partícula libre (4.9-1) para la que se
permite un rango continuo de valores de energía, y las soluciones ( 4.1 0-1 O) son
simplemente combinaciones lineales de las soluciones para la partícula libre de la
forma ( 4.9-3) pertenecientes a la misma energía. La diferencia entre los dos casos se
basa únicamente en las condiciones de frontera las cuales, en el pozo de potencial,
se pueden satisfacer sólo para un conjunto discreto de energías.
La condición de continuidad de la pendiente de las funciones de onda
(4.10-10) se viola abiertamente en x =O y x =a. Esta situación se origina debido a
la singularidad de la función de potencial V(x) en estos puntos y no produce
dificultades en la interpretación física de los resultados. Ei comportamiento de la
función de onda en estos puntos se puede inferir como un caso límite de los
resultados, que se verá en la siguiente sección, en donde se confirman los cálculos
que condujeron a ( 4.10-1 0).
Las funciones de onda ( 4.10-1 0), se pueden representar como sigue

(4.10-13)

en la región (O< x <a), vienen a ser superposiciOnes de ondas estacionarias de


soluciones de ondas planas para las que k= mr/a y - mrja, es decir, superposiciones
de una onda que se propaga en la dirección + x y otra de igual amplitud que va en
dirección opuesta. Puesto que las dos componentes de la superposición poseen la
misma energía, la combinación lineal ( 4.1 0-13) es una solución de la ecuación de
Schródinger independiente del tiempo ( 4.1 0-2) y, por tanto, representa todavía un
estado estacionario del sistema. El cuadro físico correspondiente es el de una par-
tícula que se refleja elásticamente en las paredes de un pozo de potencial, en x = O
y x =a, y oscila rápidamente hacia un lado y otro dentro del pozo de potencial. La
función de onda y la amplitud de probabilidad para la partícula en el estado energé-
tico más bajo y en un estado de energía más alto, se ilustran en la figura 4.10. De
acuerdo con la amplitud de probabilidad, cuántica la probabilidad de encontrar la
partícula en ciertos puntos correspondientes a ceros de 1/1*1/1 (que, en este' ejemplo,
Partícula en un pozo unidimensional de profundidad finita 103

.¡,•.¡,

.¡, (x) ljl(x) n (\

"-
(\

o o o _K

n~1
-x
V V
n~a
V V
(a)
(b)
Figura 4.10. Funciones de onda y amplitudes de probabilidad de dos determinados estados de
energía permisibles de una partícula que se encuentra dentro de un pozo infinita-
mente profundo.

es igual a l/; 2 , ya que ¡!; ('S real), se hace infinitamente pequeña. La amplitud de
probabilidad cuántica para lo~ estados de energía más bajos no concuerda con la
amplitud de probabilidad constante que se podría esperar desde el punto de vista
clásico y que en la figura se ilustra por medio de las líneas punteadas. Sin embargo,
para estados de energía más altos, además de la rápida oscilación de la amplitud
cuántica alrededor del valor clásico como un promedio, la coincidencia es aceptable
en el sentido de que el valor medio de la amplitud de probabilidad cuántica tomada
sobre cualquier intervalo de longitud apreciable es casi igual a la amplitud clásica.

4.11 UNA PARTICULA EN UN POZO UNIDIMENSIONAL


DE PROFUNDIDAD FINITA

El comportamiento de una partícula dentro de un pozo unidimensional de


profundidad finita se puede calcular, siguiendo las líneas generales del planteamiento
utilizado en la sección 4.1 O. En este caso se supondrá un pozo de potencial de la
forma ilustrada en la figura 4.11, en donde la profuncidad del po:w es V0 . Se
deben resolver ecuaciones por separado para la función de onda en las regiones
(x<-a), (-a<x<a) y (x>a), y las funciones de onda en estas regiones se
denominará, respectivamente, l/1-(x), l/1 0 (x) y l/l+(x). En primer lugar, se tratará el
caso de una partícula que está limitada clásicamente a permanecer dentro del pozo,
es decir, una partícula para la que - V0 <e< O.*
En las regiones fuera del pozo (x < -a; x >a), la ecuación (4.8-5) se convierte en

(x<-a;x>a) (4.11-1)

* N. de T. La partícula posee en esta región los estados ligados.


104 Mecánica cuántica. Generalidades

V(x)

o
- -x

-a~ -a-

(x) '~'o(x)

-Vo

Figura 4.11. Un pozo de potencial de profundidad finita.

en donde

(4.11-2)

mientras que, en el pozo, en donde V(x) =- V0 , (4.8-5) se convierte en

d2r/Jo 2
-d
X
2 + k 0 r/1 0 (x) = O (-a<x<a) (4.11-3)

en donde

(4.11-4)

Como se ha definido, en la condición (- V0 < € <O), k y k 0 son cantidades


reales. Las soluciones generales de (4.11-1) y ( 4.11-3) se pueden expresar como sigue

(x > a) (4.11-5)

r/1 0 (x) = A 0 sen k 0 x + B 0 cos k 0 x (-a<x<a) (4.11-6)

rf¡_(x) = A_ekx + B_e-kx (x <-a). (4.11-7)

Las condiciones de frontera de la función de onda requieren que dicha función


y su derivada sean continuas en x =±a y que la función de onda tienda a cero
conforme x "* ± oo. Por tanto, es necesario que
r/ló(a) = rf¡~(a) (4.11-8)

r/1 0 ( - a) = rf¡ _ ( - a) r/ló( -a)= rf¡'_( -a) (4.11-9)

1/J_(- oo) =O, (4.11-10)

en donde las primas indican las derivadas con respecto a x. En la expre-


sión (4.11-10), es evidente que A+= B_ =O. Los cuatro coeficientes restantes se
Partícula en un pozo unidimensional de profundidad finita 1OS

pueden evaluar mediante la substitución de las soluciones (4.11-5,6,7) en las cuatro


condiciones de frontera (4.11-8) y ( 4.11-9), de donde se obtiene un grupo de cuatro
ecuaciones simultáneas de la forma

=0

- A 0 sen k 0 a + B 0 cos k 0 a
(4.11-11)

A 0 k 0 cos k 0 a + B 0 k 0 sen k 0 a -A_ ke -ka = O.

Para resolver completamente el problema, se deben determinar los valores de


las cuatro constantes arbitrarias A 0 , B 0 , A_ y B+. Las expresiones (4.11-11) forman
un conjunto de cuatro ecuaciones homogéneas con estos coeficientes desconocidos.
Un resultado elemental de la teoría de las ecuaciones algebraicas lineales es que un
conjunto de ecuaciones de esta naturaleza no pueden tener otra solución que no sea
A 0 = B 0 =A_ = B+ = O, a menos que desaparezca el determinante de los coefi-
cientes del sistema. 6 Esto significa que no existen soluciones de significado físico, a
menos que

sen k 0 a cos k 0 a -1 o
e
- 2ka -sen k 0 a cos k 0 a o -1
=0. (4.11-12)
k 0 cos k 0 a -k 0 sen k 0 a k o
k» cos k 0 a k 0 sen k 0 a o k

Para obtener esta expresión, la can ti dad e- ka se sacó por factorización de las
columnas tercera y cuarta del determinante de los coeficientes de (4.11-11). Puesto
que e-2ka no desaparece para ningún valor real de ka, el determinante debe hacerlo
·a fin de satisfacer ( 4.11-12). El determinante se puede expresar como menores para
dar la ecuación

que se puede escribir también como

(k sen k 0 a + k 0 cos k 0 a)(k 0 sen k 0 a -k cos k 0 a) =O.


o, dividiendo entre cos 2 k 0 a,

(k tan k 0 a + k 0 )(k0 tan k 0 a- k)= O. (4.11-13)

Esta ecuación se satisface si desaparece cualquiera de los factores. Si se hace


que

(4.11-14)

6 Véase, por ejemplo, N. B. Conkwright, lntroduction to thc Theory of Equations, Ginn


and Co., Boston (1941), páginas 144-145.
106 Mecánica cuántica. Generalidades

entonces, de acuerdo con (4.11-4) y (4.11-2),

(4.11-15)

Al substituir esto en ( 4.11-13) e igualando cualquiera de los factores a cero, se


tiene que (4.11-13) se satisface si

o bien, ( 4.11-16)

1
1
1
1
1
1
1
1
t-- Curvas punteadas
1 y =-k0 ctn k0 o
1
1
1
1
1

Figura 4.12. Diagrama que ilustra la solución de las ecuaciones trascendentales de los valores
propios de energía asociados con el pozo de potencial mostrado en la figura 4.11.

Una de estas dos ecuaciones quedará satisfecha sólo para un conj,mto dado de
valores de k 0 , que se puede representar mediante k 01 , k 02 , k 03 , • • • kon, •••. Exis-
te un conjunto de valores propios de energía Erz que se relacionan con estos valores
de k 0 , de acuerdo con (4.11-4), por medio de

(4.11-17)

Los valores propios kon se pueden obtener gráficamente encontrando las inter-
secciones de las curvas y = - k 0 ctn k 0 a y y = k 0 tan k 0 a con el círculo y =
yp. 2 - k~, como se ilustra en la figura 4.12. Para cada punto de intersección se
satisface cualquiera de las dos ecuaciones (4.11-16). Por tanto, existe un grupo finito
específico de valores kon y un número finito de niveles discretos de energía asocia-
dos a estos valores, a través de (4.11-17). El radio del círculo y = yp. 2 - k~ de la
figura 4.11 es, sencillamente, p. que está directamente relacionado con la profun-
Partícula en un pozo unidimensional de profundidad finita 107

di dad del pozo de potencial por medio de (4.11-14). Para un pozo poco profundo,
J1~O, y únicamente habrá un solo nivel de energía en el rango - V0 <e< O. Para
pozos más profundos, aumenta el número de estados energéticos y para pozos muy pro-
fundos, este número es muy grande. Como se ilustra en la figura 4.12, en un pozo muy
profundo, los niveles que están en la parte más baja se caracterizan por valores de kon
que están espaciados equidistantemente, correspondiendo muy de cerca a los valores de
kn del pozo infinito de la sección 4.10. y dando origen a niveles de energía que, con res-
pecto a la base del pozo...,son semejantes a los del pozo infinito. En la figura 4.13 se
proporcionan los diagramas de niveles de energía para varios pozos fmitos.

--J --- ---


------
--- ---
---
---
--- -----
---
-----
---
Estados de energía para un pozo infinito-----
Estados de energía para un pozo finito -----
----
-
---
Figura 4.13. Representación esquemática de los niveles de energía correspondientes a pozos de
potencial de distintas profundidades.

Una vez se han determinado los valmes kon para los que ( 4.11-11) tiene
soluciones físicamente significativas, es necesario encontrar los coeficientes A 0 , B 0 ,
A_ y B+. Puesto que para los valores de kon que satisfacen (4.11-16) desaparece el
determinante del sistema homogéneo (4.11-11 ), las ecuaciones (4.11-11) ya no son
independientes linealmente y, por tanto, lo único que se puede obtener directamente
de (4.11-11) son las relaciones de los coeficientes. Sin embargo, las magnitudes reales
de los coeficientes se pueden encontrar imponiendo la condición de que

Una vez que se conocen los coeficientes, las funciones de onda se obtienen de
(4.11-5,6,7). El cálculo exacto de los coeficientes es un procedimiento laborioso y
no se presentará en detalle. No obstante, se analizarán algunas de las propiedades de
las funciones de onda que se obtienen de este modo.
Las funciones de onda para los estados energéticos ligados de este problema se
ilustran en la figura 4.14. Antes que nada, se observará que la función de onda
como un todo es una función par o bien, una función impar de x. En el ejemplo
de que se trata, el estado energético más bajo es par, el siguiente es impar, el que le
sigue es par, y así sucesivamente de un modo alternado. Esto se debe al hecho de
que el potencial V(x) es en sí mismo una función para de x; se puede demostrar de
108 Mecánica cuántica. Generalidades

un modo general que, cuando esto sucede, las funciones propias deben ser funciones
pares o impares de x. 7

Figura 4.14. Diagramas esquemáticos de las funciones de bnda de los estados energéticos más
bajos del pozo de potencial finito de la figura 4.11.

De acuerdo con la figura 4.14 y las ecuaciones (4.11-5) y (4.11-7), se puede


nr que a pesar de que la energía total de la partícula es negativa y, por tanto, de
acuerdo con la representación clásica dicha partícula nunca podría sobrepasar la
barrera de potencial para aparecer fuera del pozo, de hecho, la función de onda de
la partícula se extiende más allá de los límites del pozo. Por tanto, de acuerdo con
la mecánica cuántica, existe una probabilidad definida de que la partícula se encon-
trará en la región clásicamente prohibida, más allá de las fronteras reales del pozo.
La función de onda de la partícula se atenúa exponencialmente en esta región y se
acerca a cero en la parte que está lejos del pozo. Este fenómeno, que se conoce
como penetración de barrera, es un aspecto común del comportamiento cuántico de
la materia. Una partícula que se acerca a una barrera de potencial, de altura y
espesor finitos, como se ilustra en la figura 4.15, tiene una probabilidad determinada
de penetrar la barrera y aparecer en el otro lado, aun cuando esto pueda estar
prohibido de acuerdo con la teoría clásica. La función de onda se atenúa dentro de
la barrera, y si ésta es muy alta o gruesa, la atenuación se hace muy marcada y la
probabilidad de penetración se reduce mucho. En mecánica cuántica este efecto se
denomina túnel y se ha observado experimentalmente en dispositivos semiconduc-
tores y en capas aisladoras delgadas. Los efectos de reflexión semiconductores y en
capas aisladoras delgadas. Los efectos de reflexión se pueden predecir también de
acuerdo con la mecánica cuántica, para las partículas incidentes sobre una barrera,

7 Véase, por ejemplo, E. Merzbacher, Quantum Mechanics, John Wiley and Sons, Nueva
York (1961), página 53.
Partícula en un pozo unidimensional de profundidad finita 109

•t Vlxl

·- n -+X
(O)

(b)

Figura 4.15. Representaciones hechas de acuerdo con la mecánica clásica (a) y cuántica (b), de
una partícula que interactúa con una barrera de potencial cuya altura es mayor
que la energía inicial de la partícula. La representación cuántica (b) ilustra el
efecto túnel.

por ejemplo, como las que se muestran en la figura 4.15, aun cuando poseen más
de la energía necesaria para sobrepasar la barrera clásicamente. El efecto túnel pro-
porciona las explicaciones generalmente aceptadas sobre la ruptura eléctrica que se
produce en aisladores, la ruptura inversa en rectificadores semiconductores y la desin-
tegración radiactiva de Jos isótopos a-emisores.
Hasta ahora, este estudio se ha basado exclusivamente en la suposición de que
la energía total e es negativa, dentro del rango - V0 <e< O. En el caso en que e
sea positiva, es fácil apreciar en la expresión (4.11-1) que las soluciones 1/1± fuera
del pozo tienen una naturaleza oscilatoria, como sucede con la solución 1/1 0 en su
interior. En este caso, se encuentra que la ecuación de Schrodinger y todas las
condiciones de frontera se pueden satisfacer para cualquier valor positivo de e. Por
tanto, existe un rango continuo de estados energéticos permisibles y funciones pro-
pias correspondientes que se extiende en forma ascendente desde e= O en la figu-
ra 4.13. Esos estados se denominan "estados del continuo".
Para ver cómo sucede esto, supóngase que las funciones propias de este rango
de energía son funciones pares o impares de x; como se vio antes, esto es válido si
V(x) es una función par. De dor.de, para funciones propias pares, es necesario que

t/1 0 (x) = A 0 cos k 0 x (-a<x<a)

(x >a) (4.11-19)

(x < -a)

en donde k se define ahora como

k= J2me/ñ 2 (e> 0). (4.11-20)

Las condiciones de frontera (4.11-8) y (4.11-9) deben aplicarse todavía, de tal ma-
nera que los valores y las pendientes de 1/1 0 (x) y 1/J+(x) sean iguales en x =a. De
11 O Mecánica cuántica. Generalidades

acuerdo con ( 4.11-19), esto requiere que

A 0 cos k 0 a =A+ cos ka+ B+ sen ka

y (4.11-21)

-k 0 A 0 sen k 0 a = -kA+ sen ka+ kB+ cos ka.

Si se dividen ambas ecuaciones entre A 0 y se resuelve el grupo resultante de ecua-


ciones simultáneas para A+/A 0 y B+/A 0 , se tiene que

A+/A 0 = cos k 0 a cos ka+~ sen k 0 a sin ka


(4.11-22)

B+/A 0 = cos k 0 a sen ka- kko senk 0 a cos ka.


Por tanto, siempre se pueden encontrar valores perfectamente adecuados para A+ y
B+ en términos de A 0 , cuyo valor, a su vez, queda determinado por los requisitos
de normalización. Esto significa que cualquiera que sea el valor inicial que se escoja
para e o k, se puede encontrar una solución para l/1 0 , W+ y ¡J¡_ que satisfaga todas
las condiciones de frontera, como se aseguró antes. Se puede realizar un cálculo
similar principiando con las funciones propias impares y se obtendrá el mismo resul-
tado. En la figura 4.16 se ilustra el carácter general de las funciones de onda para
los estados del continuo.

(O) (b)

Figura 4.16. (a) Representación e~quemática de la función de onda de una partícula cuya
energía tan grande que, en la representación clásica, sobrepasa los límites del pozo
de potencial ilustrado. (b) División de los niveles de energía permisibles para el
pozo de potencial finito, en un grupo de niveles discretos correspondientes a
una partícula clásicamente ligada y a un continuo de niveles correspondientes a
una partícula clásicamente no ligada. La función de onda representada en (a)
pertenece al último grupo de niveles.
El oscilador armónico unidimensioanl 111

Este l.stado de cosas ejemplifica un principio mucho más general. Si la energía


total del sistema es tal que la partícula esté limitada clásicamente por medio del
potencial V(x) para moverse en una región finita dada del espacio, se tendrá un
grupo discreto de funciones propias y niveles de energía que satisfagan todos los
requisitos, de las funciones de onda. Por otro lado, para partículas con energías lo
suficientemente grandes para que una partícula clásica pueda escapar de cualquier
mínimo de potencial del sistema, al infinito en, cuando menos, una dirección, existe
también un continuo de estados energéticos y funciones propias correspondientes. 8
Los resultados de la sección 4.1 O para el pozo de potencial infinitamente pro-
fundo se pueden obtener a partir de los resultados de esta sección, si se deja que
V 0 tienda a infinito. En particular, se puede ver a partir de (4.11-5) y (4.11-7) con
A+= B_ =O, que si k se hace indefmidamente grande, como debe suceder para
cualquier estado con un energía finita superior a la base del pozo, conforme
V 0 ~ c..o, ia función de onda fuera de los límites del pozo tiende a cero. Conforme
el pozo se hace cada vez más profundo, la curvatura de la función de onda se hace
sumamente grande cerca de x = a y x = - a, en donde las soluciones 1/J +(x) y 1/J _ (x)
se unen a la solución 1/J 0 (x), se hace aunque para una profundidad finita de pozo, la
pendiente es siempre continua. Sólo en el límite, conforme la profundidad del pozo
se acerca a infinito, es cuando se presenta la discontinuidad en la derivada de la
función de onda en estos punto, como se mencionó en la sección 4.10.

4.12 EL OSCILADOR ARMONICO UNIDIMENSIONAL

El oscilador armónico es una partícula que está ligada a una postcwn de


equilibrio por medio de una fuerza proporcional al desplazamiento desde dicha posi-
ción; esta fuerza .:;e puede expresar como

F = -kx = -dV(x)fdx. (4.12-1)

Entonces, el potencial V(x) debe ser una parábola de la forma

(4.12-2)

De acuerdo con ( 4.12-1 ), la ecuación clásica de movimiento para una partícula


de masa m sometida a una fuerza de este tipo es

(4.12-3)

cuya solución es una función oscilatoria que se puede escribir como

x(t) =A sen (w 0 t- 15), (4.12-4)

en donde

(4.12-5)

8 Una simple prueba de estas afirmaciones se puede encontrar en la obra de L. Pauling y


E. B. Wilson, lntroduction to Quantum Mechanics, McGraw-Hill Book, Co., Inc., Nueva York
(1935).
112 Mecánica cuántica. Generalidades

es la frecuencia clásica del oscilador y en donde A y o son constantes. Siguiendo


este resultado clásico, se puede usar ( 4.12-5) para expresar la constante de fuerza k
en función de w 0 y m, y volver a escribir el potencial V(x) como

(4.12-6)

A continuación se procederá a resolver la ecuación de Schrodinger ( 4.8-5)


utilizando esta función de potencial; en este caso, (4.8-5) se convierte en

d21/1 2m 2 2
dx2 + hl [e- tmw 0 x ]1/J(x) =O. (4.12-7)

Para resolver esta ecuación, primeramente es necesario que

(4.12-8)

P= 2ef(ñw 0 ) (4.12-9)

e= x.j~. (4.12-10)

Entonces, de acuerdo con ( 4.12-8) y ( 4.12-9), es obvio que


d21/J
dx2 + (cx.p- cx.2x2)1/J(x) =O, (4.12-11)

y, por lo que indica (4.12-10) observando que d2 1/f/dx 2 =cx.d 2 1/1/d~ 2 ,


d21/J 2
de+ <P-e >1/Jce> =o. (4.12-12)

Para valores grandes de 1~1, tales que ~2 ~ (3, (3 se puede despreciar y (4.12-12)
se escribe como

(4.12-13)

Esta ecuación se satisface aproximadamente, para un valor grande de ~. por


medio de

(4.12-14)

puesto que d 2 1/1/de = (~ 2 - l)exp(- ~ 2 /2), lo cual satisface aproximadamente (4.12-13)


si ~ 2 ~ l. Esto sugiere que las soluciones 1/1(~) para (4.12-12) podrían expresarse
de manera más simple escribiendo

(4.12-15)

Y transformando (4.12-12) en una ecuación para la función H(~). Esto se logra


substituyendo la forma ( 4.12-1 S) en la ( 4.12-12) y como resultado, ( 4.12-12) se
convierte en

d2 H dH (4.12-16)
--2e-+<P-t)H<e>=O.
de de
El oscilador armónico unidimensional 113

Esta ecuación diferencial se puede resolver mediante una técnica de series de


potencias, suponiendo inicialmente que
00

H(') = L ak'k'
k~o
(4.12-17)

por lo que

(4.12-18)

• 00

(p- 1)H(') = L (p- 1)ak'k·


k=O

Si estas tres ecuaciones se suman se observa que el resultado es cero de


acuerdo con (4.12-16), y se encuentra que
oc
O= I. [(k+ 1)(k + 2)ak+l + [(p- 1)- 2k]ak],k. (4.12-19)
k=O

Esta ecuación debe ser aplicable para todos los valores de ~. y, por tanto, el
coeficiente de cada potencia ~ debe desaparecer por separado. (Esto se podrá ver
con mayor claridad evaluando los coeficientes para la expansión de la función .f(~) =
O en la serie de potencia de McLaurin; todas resultan ser cero.) Este requisito
establece inmediatamente una relación de recursión entre los coeficientes ak+ 2 y ak,
en donde

p - l - 2k
ak+2 = -(k+ l)(k + 2) ak. (4.12-20)

En la solución de cualquier ecuación diferencial de segundo orden, debe haber


dos constantes arbitrarias. Por tanto, sean a0 y a 1 las constantes arbitrarias funda-
mentales que deben determinarse de acuerdo con las condiciones de frontera, en la
expresión de la serie (4.12-17) para H(~), y expresar todos los demás coeficientes en
función de estos dos mediante la aplicación repetida de la relación de recursión
t.4.12-20). En esta forma, es fácil ver que

P-l
al= - - - a o
<P- 3)
a 3 =- - - - a 1
2! 3!

p- 5 <P - 1><P - 5) <P- 3)(p- 7)


a4 = - -¡-:-J a2 = 4! ao as= 5! a¡ (4.12-21)

(p- 1)(p- 5)(p - 9) <P - 3)(p - 1)(P - 11)


a6 = - 6! ao a1 = 7! al

etc., etc.
114 Mecánica cuántica. Generalidades

De acuerdo con (4.12-17), se de be tener

H(~) = ao[1- ((J- 1) e+ ((J- 1)((J- 5) ~4- ((J- 1)((J- 5)((J- 9) ~6 + ... ]
2! 4! 6!

+a¡[~_ {J- 3 e+ ({J- 3)({J- 7) ~S_ ({J- 3)({J- 7)({J- 11) e+ •••]
3! 5! 7! .
(4.12-22)

Si en la relación de recursión (4.12-20) {3- 1 - 2k debe ser cero para algún


valor del índice k, entonces, ak+l = O. Sin embargo, puesto que ak+4 es un múltiplo
de ak+l y ak+ 6 es un múltiplo de ak+ 4 , etc., todos los coeficientes subsecuentes
que se relacionan con ak por medio de la fórmula de recursión deben desaparecer, y
cualquiera de las dos series entre paréntesis rectangulares en (4.12-22) terminaría por
convertirse en un polinomio de grado k. Este fenómeno se puede producir sólo para
ciertos valores enteros de {3, en efecto, de acuerdo con (4.12-20), sólo ocurre cuando
{3 _ 1 es igual al doble de un entero, es decir, cuando

(J- 1- 2n =O
o bien,
p= 2n +1 (n = 0,1,2,3, ... ). (4.12-23)

Al examinar (4.12-22), se ve fácilmente que esta terminación de una u otra serie


para producir un polinomio se realiza efectivamente cuando {3 = 1, 3, 5, 7, . . . como
lo predice (4.12-23). De esto resulta que las únicas soluciones de (4.12-16), que llevan a
funciones de onda aceptables a través de (4.12-15), SO;'l estas soluciones polinómicas.
Para entender el porqué de esto, primero se considerará la expansión en serie
para la función et 2 , que se puede escribir

(4.12-24)

Para valores grandes de t las contribuciones de Jos términos iniciales de esta serie
son despreciables en comparación con aquellos para los que k es grande. Por su-
puesto, esto es cierto también en la serie de (4.12-22) para H(~). En la serie
( 4.12-24), la razón del coeficiente bk+l al coeficiente bk es

y para valores grandes de k,

b~:2 ~ 2/k. (4.12-25)


El oscilador armónico unidimensional 115

La razón de los coeficientes ak+ 2 y a k para las soluciones en serie de ( 4.12-16) está
dada por la relación de recursión ( 4.12-20) y, para valores grandes de k, se puede
ver claramente que también es más o menos igual a 2/k. Entonces las soluciones en
serie de H(~). cuando no terminan en polinomios, se comportan como e~ 2 para
valores grandes de ~- Sin embargo, de acuerdo con (4.12-15), las funciones de onda
reales están dadas por

(4.12-26)

para valores grandes de ~- Puesto que estas funciones no siguen siendo finitas en ±oo,
no son aceptables como funciones de onda para el sistema físico. Las únicas solu-
ciones que son aceptables son aquellas que terminan como polinomios, o sea, las
soluciones para las que se obedece (4.12-23). Si una de las dos series encerradas
entre paréntesis angulares de (4.12-22) termina como polinomio, la solución para
H(~) toma la forma

H(e) = a0 (polinomio) + a 1 (serie infinita)

H(~) = a 0 (serie infinita) + a 1 (polinomio).

En cualquier caso, para que la solución H(~) sea una función de onda físicamente
aceptable, la constante arbitraria que multiplica la solución en serie se debe escoger
en tal forma que sea cero, para que la expresión total de H(~) sea sencillamente un
polinomio. Si se expresa (3 en (4.12-13) en función de e por medio de (4.12-9), es
evidente que las únicas soluciones que dan las expresiones polinómicas para H(n son
las que corresponden a un grupo discreto de valores propios de energía

(n = 0,1,2,3, ... ). (4.12-27)

Una característica notable de este sistema es que su estado más bajo de ener-
gía, para el que n = O, está representado no por e0 = O, sino por e0 = -!-hwo. En
otras palabras, el estado más bajo de energía del oscilador armónico no se carac-
teriza por la ausencia de movimiento vibratorio, sino por una energía vibratoria
mínima de "punto cero" -thw 0 . En su teoría original de la radiación de cuerpo
negro, Planck supuso que los niveles energéticos de un oscilador armónico estaban
dados por En= nhw 0 más que por (4.12-27). No obstante, en ese caso en particular,
la energía de punto cero no establece ninguna diferencia en el resultado final. Se
observará que los pozos de potencial de las secciones anteriores presentaban también
este efecto de energía de punto cero. El diagrama de niveles de energía del oscilador
armónico se ilustra en la figura 4.17. El espaciamiento equidistante de los niveles es
una propiedad singular del pozo de potencial parabólico.
Las soluciones polinómicas que representan las funciones propias del sistema, se
pueden obtener de (4.12-22), considerando que (3 toma los valores 1, 3, 5, ••• 2n +
1, ••• de acuerdo con (4.12-23). Para cada uno de estos valores, cualquiera de las dos
series entre paréntesis rectangulares terminará en un polinomio y todos los coeficientes
más allá de cierto punto se convierten en cero. Por Jo común se escoge la constante arbi-
traria a0 o bien, a 1 , cualquiera que sea el caso, que multiplica el polinomio resultante en
tal fom1a que el coeficiente de la potencia más alta de ~ en el polinomio es 2n( =
116 Mecánica cuañtica. Generalidades

•t
15 fr
•8 2 "'o
13 ñ
7 2 "'o
11 ñ
6 2 "'o
5 ~ hw0
4 ~ fr..,o
3 ~ ,.,o
2 ~ ñ..,o
1
t fr..,o
o

Figura 4.17. Niveles de energía del oscilador armónico cuántico unidimensional.

2<13-l )/ 2 ). Cuando se hace esto, se obtiene un grupo de soluciones polinómicas fin(~) de


la forma

H¡<e> = 2e
H2<e> = 4e 2
H3<e> = se 3- 12
(4.12-28)

Hie> = 16e 4 - 4se


Hs(ü = 32es- 160e 3 + 12oe
etc.,

Los matemáticos conocen bien estas expresiones que se denominan polinomios de Her-
mite; la ecuación (4.12-16) recibe el nombre de Hermite. Los polinomios de Hermite
se pueden definir como

(4.12-29)

Se puede demostrar que la defmición (4.12-29) conduce a los polinomios que satis-
facen la ecuación de Hermite (4.12-16). La demostración de esto se propone como
ejercicio para el lector.
Las funciones de onda reales l/ln(x) se obtienen de las soluciones polinómicas
de la ecuación de Hermite por medio de ( 4.12-15) y (4.12-1 0), siendo el resultado

(4.12-30)
El oscilador armónico unidimensional 117

en donde a está dada por (4.12-8) y en donde la constante de normalización Nn se


escoge de tal manera que

Se puede demostrar 9 que esta condición requiere que

(4.12-31)

Las funciones de onda dependientes del tiempo 'l{ln(x, t) se obtienen a partir


de las expresiones de (4.12-30) multiplicándolas por el factor e-ientfñ, de acuerdo
con (4.8-7).
Puesto que más adelante se compararán las propiedades del oscilador cuántico
con las de su equivalente clásico, conviene analizar brevemente algunas características
del oscilador clásico y, sobre todo, se debe calcular la distribución de probabilidad
asociada con éste. Dado que el desplazamiento x(t) de la partícula clásica es como
lo establece (4.12-4), se sigue que la energía cinética y la potencial del oscilador
clásico están dadas, respectivamente, por

de donde, la energía total debe ser

(4.12-32)

Esta ecuac10n se puede resolver para A en función de e, dando A= ..J2e/mw~,


y, si se supone que la energía tiene el valor (n +-t)hw 0 (como debe ser en el caso
del oscilador cuántico con el que se desea establecer una comparación directa), se
obtiene, para la amplitud del oscilador clásico con esta energía

A = J(T,J+i)h = J2n + 1 , (4.12-33)


mw 0 ex
en donde a está definida por ( 4.12-8).
La amplitud de probabilidad es la probabilidad de encontrar la partícula dentro
de una región dada dx alrededor del punto x. Para el oscilador clásico, esto es
sencillamente, la razón del tiempo dt que la partícula pasa en esta región durante el
curso de una vibración, al periodo de oscilación T( = 27r/w0 ). Puesto que dx = v(x) dt,
el tiempo que permanece la partícula en este intervalo durante un periodo es

2 d t_-2dx
- (4.12-34)
v(x)'

9 D. Bohm, Quantum Mechanics, Prentice-Hall, Englewood Clit'fs, N. J. (1951), página 305.


118 Mecánica cuántica. Generalidades

ya que pasa dos veces por la región durante un periodo completo de movimiento.
Dado que, de acuerdo con (4.12-4), v(t)=dx/dt=Aw 0 cos(w 0 t- 8), y, puesto que
w 0 t- 8 =sen - l (x/A)= cos- 1 (1- (x/A)2)lf2, v se puede expresar en función de x
por medio de
-~2
v(x) = Aw 0 J 1- A 2 • (4.12-35)

La fracción de tiempo que pasa en dx es P(x) dx, en donde P(x) es la ampli·


tud de probabilidad clásica correspondiente a la cantidad cuántica 1/J*l/J. En vista de
que esta cantidad es igual a 2dt/T, debido a lo que establece (4.12-34) y la relación
T = 21T/w 0 , se tiene que

(4.12-36)

Si se usa (4.12-33), la amplitud de probabilidad de un oscilador clásico que


-t
tiene una energía (n + )líw 0 se convierte en

(4.12-37)

Esta cantidad se comparará con las amplitudes de probabilidad cuánticas 1/J~l/Jn


obtenidas a partir de ( 4.12-30).
En la figura 4.18 se ilustra el comportamiento general de las funciones de
onda correspondientes al oscilador armónico. Se observará que también en este caso
la función de onda penetra en la región más allá de los límites de amplitud del
movimiento clásico. Además, como se puede esperar, debido al hecho de que V(x)
es una función par de x, las funciones de onda son, dternadamente, funciones pares
e impares de x para valores ascendentes de n. Para el estado de energía más baja, la
amplitud de probabilidad clásica calculada a partir de (4.12-37), y representada por
la curva punteada en la figura, no se parece en absoluto a la amplitud de probabi-
lidad desde el punto de vista de la mecánica cuántica. La amplitud de probabilidad
clásica predice que la partícula tiene una mayor tendencia a encontrarse cerca de los
extremos de la región de movimiento permisible, en tanto que el resultado cuántico
predice que es más posible encontrarla en el centro. Sin embargo, para un estado de
mayor amplitud y de una energía correspondientemente más alta, se encuentra una
coincidencia aceptable entre las distribuciones de probabilidad clásica y cuán tic a,
aparte del hecho de que, como es normal, la amplitud cuántica de probabilidad
oscila con gran rapidez alrededor de un valor medio semejante al resultado clásico.
Conforme la amplitud y la energía relacionadas con el movimiento se hacen detec-
tables en una escala macroscópica, los resultados cuántico y clásico no son apre.cia-
blemente diferentes. Normalmente existen puntos a lo largo de la trayectoria clá~ca
de la partícula, en donde la probabilidad de encontrarla, según lo predice la amJ}li-
tud de probabilidad cuántica, se hace sumamente pequeña.
Ortogonalidad de las funciones propias 119

1 '1
1 1
1 1

''1
11
1 ¡1
1
1
,.
11 1
1
ti
1
\
''
n nn /
1

-- -- - - -
/
'- / : 1
' ' '
~

j lJ :\ e
o 6
( b)

Figura 4.18. (a) Funciones de onda de los estados de energía más bajos del oscilador armónico
cuántico unidimensional. (b) Amplitudes de probabilidad cuánticas (curvas conti-
nuas) y distribuciones de probabilidad clásicas (curvas punteadas) correspondientes
al o~cilador armónico unidimensional para dos valores de energía, if:wo y lf.l':wo.
[Tomado de L. Pauling y E. B. Wilson, lntroduction to Quantum Mechanics,
McGraw-Hill, Nueva York (1935).]

4.13 ORTOGONALIDAD DE LAS FUNCIONES PROPIAS


Y LA SUPERPOSICION DE ESTADOS

Se puede demostrar que las funciones propias de la ecuación unidimensional de


Schrodinger que satisfacen los requisitos físicos de las funciones de onda, presentan
siempre la propiedad de ortogonalidad, es decir, que obedecen siempre la ecuación

J~oo 1/1!1/Jn dx =O (m# n)


(4.13-1)
=l (m= n).
120 Mecánica cuántica. Generalidades

Estas relaciones son una propiedad característica de la ecuación de Schrodinger


y las condiciones de frontera, y se ha encontrado que se aplican sea cual fuere la
función de potencial V(x) y sin que tampoco importe la forma matemática que
tengan las funciones de onda. Que esto es nece~ariamente cierto, se puede com-
probar escribiendo la ecuación unidimensional de Schrodinger para 1/1 n,

(4.13-2)

y la ecuación de onda 1/1~, que, de acuerdo con (4.7-12) y (4.8-6), debe ser
d 2 t/l* 2m
dx 2m - ¡r [em - V(x)]t/l!(x) =O. (4.13-3)

Si la primera ecuación se multiplica por 1/1 ~, y la segunda por 1/1 n, se restan


ambas ecuaciones y se integra de oo a - oo, se obtiene

(4.13-4)

El integrando del término del lado izquierdo de esta ecuación se puede expre-
sar como la derivada de 1/l~(dl/ln/dx) -- 1/ln(dl/1~/dx) con respecto a x, de donde,
( 4.13-4) se convierte en

(4.13-5)

Para funciones de onda con un buen comportamiento físico, 1/1 y dl/1/dx tien-
den a cero conforme x ~ ± oo; por tanto, la cantidad de la izquierda desaparece en
los dos puntos extremos y

(4.13-6)

Si se supone que las funciones de onda 1/1~ y 1/ln pertenecen a dos niveles de
energía diferentes, de tal manera que En =1= Em, entonces, se puede satisfacer (4.13-6)
si y sólo si

(m '# n). (4.13-7)

Para m= n, se pierde el factor En -En en (4.13-6); en este caso, de acuerdo


con la forma en que se definen las funciones de onda ( 4.8-1 0), se debe tener

(4.13-8)

Así pues, las funciones dr onda 1/lm, 1/ln exhiben la propiedad de ortogona-
ltdad. La prop1cdad de ortogonalidad no está restringida a las soluciones de la ecua-
ción de Schrodint'cr. sino que tamhién se relaciona con las soluciones características
Ortogonalidad de las funciones propias 121

de una gran clase de ecuaciones diferenciales, incluyendo la de calor, la de la cuerda


vibrante y las ecuaciones de ondas electromagnéticas. Se puede ver que las funciones
de onda (4.10-10) asociadas con un pozo de potencial infinitamente profundo, satis-
facen las condiciones de ortogonalidad ya que, como se sabe y se puede comprobar
fácilmente,

f0
L mnx nnx
sen - - sen - - dx = O.
L L
(m -:F n) (4.13-9)

Aunque es más difícil hacer la misma demostración para el pozo finito y para el
oscilador armónico, es cierto que las funciones de onda (4.11-5, 6, 7) y (4.12-30)
que pertenecen también a estos sistemas son también ortogonales. 1 0
Supóngase ahora que se tiene un conjunto infinito de funciones propias 1/Jn(x)
que son soluciones a la ecuación de Schrodinger para un potencial dado V(x). Ya se
dijo que estas funciones propias deben ser ortogonales y normalizadas de acuerdo
con (4.8-10), de manera que obedecen a (4.13-1). Se pueden combinar estas fun-
ciones propias en una superposición lineal, de modo que la suma represente una
función arbitraria de x, sujeta a ciertas restricciones matemáticas que no son muy
severas. Para entender cómo se hace esto, supóngase que una función arbitraria f(x)
se puede representar como la combinación lineal de las funciones propias de tal
manera que
<Xl

f(x) = L ant/Jn(x).
n=O
(4.13-10)

Al multiplic<!T esta ecuación por 1/J~(x) e integrar, se encuentra que

(4.13-11)

En la suma, todas las integrales son cero por virtud de (4.13-1 ), excepto
aquella para la que n = m, que da un valor de am. El resultado final es

(4.13-12)

Si se substituye este valor en lugar de am ( 4.13-1 0), es obvio que f(x) se


puede respresentar como

(4.13-13)

en donde la variable ficticia de integración x' se substituyó con x para evitar confu-
siones.
Para las funciones propias senoidales de la sección 4.1 O, sucede que, esta ex-
pansión es simplemente una expansión de serie de Fourier. Se pueden efectuar

10 /bid., página 219. Véase también R. V. Churchill, Fourier Series and Boundary Value
Problems, McGraw-Hill, Nueva York (1941), páginas 46-52.
122 Mecánica cuántica. Generalidades

expansiones similares en términos de las funciones de Hermite asociadas con el


oscilador armónico, y en términos de otras funciones de onda relacionadas con otras
funciones de potencial. En la sección 4.9 se vio un ejemplo de una situación en la
que los valores propios y las funciones propias están distribuidos en una forma
continua, en lugar de discreta. En este caso se encontró que una función arbitraria
se podía representar como una combinación de integrales de las funciones propias,
de la forma de una integral de Fourier. Este resultado se puede extender a las
funciones propias que representan cualquier sistema cuyos valores propios tienen una
distribución continua, y el resultado se puede expresar como la ecuación (4.13-13)
en el límite en el que los valores propios se amontonan o concentran, después de lo
cual la suma en dicha ecuación se convierte en integral. Aunque esta representación
integral es importante y hay que mencionarla como dato complementario, no se
analizará en detalle, ya que no se utilizará en esta sección. Su aplicación al caso de
las funciones propias de la partícula libre puede verse con claridad en la exposición
de la sección 4.9.
La combinación lineal de las funciones propias tales como (4.13-1 O) no consti-
tuye una solución a la ecuación de Schri:idinger, independiente del tiempo relacionada
con algún valor particular de energía en, ya que ha perdido la forma (4.8-7); pero, una
combinación lineal de las funciones propias dependientes del tiempo de la forma

00 00

f(x,t) = L an'1' n<x,t) = L ani/Jix)e-i""''ll, (4.13-14)


n=O n=O

que se reduce a (4.13-10) para t =O, es efectivamente una solución para la ecuación
de Schri:idinger dependiente del tiempo, (4.7-3). Esto se puede verificar de un modo
directo con gran facilidad considerando el hecho de que las funciones propias inde-
pendientes del tiempo 1/Jn obedecen siempre, de acuerdo con (4.8-8), a la relación
.tf 1/Jn =En 1/Jn. Esto permite ver que, aunque se puede construir una superposición
de funciones de onda, que obedezcan a la ecuación de Schri:idinger dependiente del
tiempo, para representar cualquier función o amplitud de probabilidad en un instante
dado (t = O en el ejemplo anterior), en general, la superposición de las funciones de
onda no stgue representando esa misma función o amplitud de probabilidad en
tiempos posteriores, debido a las diferentes dependencias del tiempo de las compo-
nentes individuales de dicha superposición. Así pues, una superposición de funciones
de onda no representa por lo general un estado estacionario del sistema. Este tema
ya se tocó en la sección 4.8.
Si una superposición de funciones propias, tales como (4.13-14), va a utilizarse
como cualquier tipo de función de onda para un sistema físico, es necesario norma-
lizarla para que satisfaga ( 4. 7-6). Por tanto, para funciones de onda de la forma
(4.13-14), se debe tener

(4.13-U)

En vista de los establecido por {4.13-1 ), todos los términos de la doble suma
son cero, excepto aquellos para los que m = n, en donde el valor de la integral es
igual a la unidad. En consecuencia, se encuentra que el requisito de normalización
quedará satisfecho a condición de que los coeficientes se escojan de tal modo que

(4.13-16)
Valores esperados y números cuánticos 123

4.14 VALORES ESPERADOS Y NUMEROS CUANTICOS

Supóngase que se hace un gran número de mediciones de una cantidad física f


que es una propiedad de un sistema dinámico dado. Estas mediciones se hacen
siempre sobre el mismo sistema o en sistemas idénticos que se encuentran siempre
en el mismo estado. Si se conserva la propiedad f, es decir, si es constante con
respecto al movimiento de dicho sistema, entonces (dentro del error experimental
que se supondrá despreciable), se obtendrá el mismo valor de f en cada medición, y
si se traza una gráfica de la frecuencia P(j) df con que se obtiene un valor medido en
un rango df alrededor de f, será simplemente un "pico" localizado en un valor dado
/ 0 , que constituye el valor esperado <ft. Esta situación se ilustra en la figura 4.19(a).
Si la propiedad f no se conserva en el movimiento, se puede esperar obtener resul-
tados diferentes en cada medición y una gráfica de la frecuencia a la que se obser-
van los valores en un rango df alrededor de f, en función de f, presentará una
··ampliación" alrededor de un valor promedio o esperado (ft, como se ilustra en la
figura 4.19(b ). El grado de la ampliación estadística de las mediciones se puede
expresar en términos de la desviación estándar a, que se define como

(4.14-1)

De acuerdo con esto, es evidente que si f es siempre lo mismo que (ft, como
sucede en la distribución "pico" de la figura 4.19(a), entonces, a= O, mientras que
si f y <ft no son siempre iguales, entonces a es la desviación de raíz cuadrada media
de los valores de f en relación con el promedio. La expresión (4.14-1) puede escri-
birse en diferente forma, haciendo notar que

P(f) p (f}

fo <t>
( = <t>l
(al (b}

Figura 4.19. (a) Distribución estadística de muchas determinaciones relativas a una cantidad
que es una constante del movimiento (b) Distribución análoga Lurrespondiente a
una cantidad que no es una constante del movimiento.

le donde,

(12 =<12> - 2(/)(f) + <!>2


= <!2>- (!)2. (4.14-2)
124 Mecánica cuántica. Generalidades

Uno de los postulados fundamentales es que el valor esperado de una cantidad


dinámica está dado por

(f) = f~"' 'P*fop'P dx, (4.14-3)

en donde fop es el operador correspondiente a la variable dinámica f y en donde 'IJ1


representa la función de onda del sistema para el que se mide f Ahora se investi·
garán ciertos valores esperados relacionados con el operador de energía (- h/iXofot),
primeramente, para un sistema en uno de sus estados propios, y luego para el mismo
sistema en un estado que se representa como una superposición de dos estados
propios.
En primer lugar, es obvio que para cualquier sistema, el valor esperado de
energía (e), se puede calcular a partir de la función de onda dependiente del tiempo
'IJ!(x,t) por medio de (4.14-3), utilizando también (4.7-4). El resultado es

(e) = f oo
-oo
Ji
1 ut
o'P)
'P* ( --:--;-- dx, = foo
_ 00
'P*.Jf'P dx = ($). (4.14-4)

El valor esperado de la energía es, entonces, el mismo que el del operador


hamiltoniano evaluado sobre las funciones de onda dependientes del tiempo. Si
'IJ!(x,t) es una función de onda que representa un estado propio estacionario del
sistema y que, por tanto, tiene la forma ( 4.8-7), ( 4.14-4) se puede expresar como
sigue

(4.14-5)

El valor esperado del operador hamiltoniano y, por ende, de la energía es, en


este caso, el mismo cuando se toma sobre las funciones de onda independientes del
tiempo 1/J(x), o bien, que sobre las funciones dependientes del tiempo 'IJ!(x,t). Puesto
que :Tf, de acuerdo con (4.7-5), es un operador independiente del tiempo, no opera
en factores de tiempo en (4.14-5); por tanto, estos factores se pueden mover más
allá del operador :lf y cancelarse entre sí.
Si la función de onda 'IJ!(x,t) es una superposición de las funciones propias de
estado estacionario de la forma ( 4.13-14),

'P(x,t) = L anl/ln(x)e-ient!A, (4.14-6)


"
entonces, de acuerdo con (4.14-4), observando nuevamente que :lf no opera sobre
los factores de tiempo,

(4.14-7)

Si se usa (4.8-8), que indica que :1ft/In= Ent/ln, se tiene

(e) = L L e"e-i(en-em)t/A
m n
f"'
-oo
a!anl/l!l/ln dx, (4.14-8)
Valores esperados y números cuánticos 125

que, en vista de la propiedad de ortogonalidad de las funciones propias, se reduce a

(4.14-9)

todas las integrales de (4.14-8) desaparecen excepto aquellas para las que m= n. Sin
embargo, este es el mismo valor que se obtuvo tomando el valor esperado del
operador hamiltoniano Yf sobre la función de onda independiente del tiempo

t/l(x) = 'l'{x,O) = L a.t/l.(x), (4.14-10)

porque entonces, utilizando ( 4.8-8) y las propiedades de ortogonalidad de las fun-


ciones propias,

= L L a!a.e. foo t/l!t/1. dx = L a:a.e. = (e). (4.14-11)


m n -oo n

El operador Yf que opera sobre la función independiente del tiempo


(4.14-10), es por tanto, totalmente equivalente al operador (-h/iXofot) que opera
sobre la función dependiente del tiempo (4.14-6). Cuando se calculen los valores
esperados para funciones de ondas superpuestas, se usará este resultado que se debe
a la independencia del tiempo del operador Yf y la ortogonalidad de las funciones
propias.
Si el sistema se encuentra en uno de sus estados propios estacionarios, su
función de onda es 1/Jn(x), y, de acuerdo con (4.14-5),

(e)= (Jt") = f~oo .¡,:Jt"t/1. dx = f~oo .¡,:(e.t/1.) dx =e. f~oo t/l:t/1. dx =e•.
(4.14-12)

De igual manera, el valor esperado de e2 se puede determinar evaluando el


operador correspondiente independiente del tiempo :lf 2 sobre la función de onda
independiente del tiempo,l 1 según lo cual

La desviación estándar asociaJa con una serie de determinaciones de energía


sobre un sistema, en uno de sus estados propios estacionarios será, de acuerdo con
(4.14-2), (4.14-12) y (4.14-13)

(4.14-14)

11 Estrictamente hablando, este enunciado se debe (y se puede) demostrar mediante los


métodos usados para derivar (4.14-9) y (4.14-11).
126 Mecánica cuántica. Generalidades

Entonces, se obtendrá una distribución "pico" en donde cada medición dará el


mismo valor de energía en.
Ahora se supondrá que la función de onda del sistema es una superposición de
dos funciones propias, de la forma

(4.14-15)
de tal manera que

(4.14-16)

en donde, de acuerdo con (4.13-16),

(4.14-17)

El valor esperado de la energía se puede evaluar ahora calculando el valor


esperado del operador :if sobre la función de onda (4.14-16). Por supuesto, los
resultados se pueden obtener como un caso especial de (4.4-11),.por ló cual

(4.14-18)
en donde

and 1 -a.= a:an. (4.14-19)

Del mismo modo, el valor esperado de e2 se puede determinar evaluando


:ff 2 y empleando la función de onda (4.14-16), lo cual da

(.Yt' 2 ) = f~.., (a!t/1! + a:t/f:)Jf.Yf(amt/Jm + ant/Jn) dx

= f~..,a!amt/J!.Yf(.Yft/lm) dx + f~.., a:ant/J:.1f(.Yft/ln) dx

+ f~.., a!ant/J!.Yt'(.1ft/ln) dx + f~oo a:amt/J:..it'(.rt't/lm) dx. (4.14-20)

Sin embargo, .rt'l/lm = em 1/lm y Hl/ln =en 1/ln; al aplicar estas fórmulas dos
veces a cada una de las cuatro integrales de ( 4.14-20) se obtiene

(4.14-21)

Las dos primeras integrales de (4.14-21) son la unidad y las otras dos son
cero, debido a la ortogonalidad de las funciones propias 1/Jn. La ecuación se reduce.
en este caso, a

(4.14-22)
Valores esperados y números cuánticos 127

La desviación estándar asociada con mediciones de energía en un sistema cuya


función de onda es la superposición (4.14-15), es

(4.14-23)

La desviación estándar es cero sólo cuando a = O, a = 1, ó em = en; en cada


uno de estos casos, la función de onda ( 4.14-16) se reduce a una sola función
propia del sistema. Sin embargo, en general, se tendrá cierto "despliegue" relacio-
nado con mediciones de energía de un sistema de esta índole, en donde las determi-
naciones no dan siempre el mismo valor de energía. En realidad, si se piensa un

P(•)

Figura 4.20. Distribución estadística de energías para sistemas cuyas funciones de onda son
superposiciones de las mésima y nésima funciones propias

poco, se verá que la distribución de frecuencia de "dos picos" de la figura 4.20


coincide con los valores de (e) y (e 2 ) dados por (4.14-18) y (4.14-22). Si se estudian
los valores esperados de potencias más altas de e, se llegará a la conclusión de que
sólo esta distribución es consistente con todos los valores esperados. 12 En la actua-
\\d.ad., \a \n.terpretadón. -pteva.\ec¡,den.te de este resultado es o,.ue, cuando se mide la
energía en un sistema, el acto mismo de la medición hace que el sistema pase a uno
de sus estados propios, si no está ya en uno de ellos, y que la probabilidad de que
el valor medido de la energía esté asociado con uno u otro estado propio, es propor-
.::ional a la cantidad a~am relacionada con el estado propio en la función de onda
de superposición.
Si la cantidad a 2 asociada con el valor esperado de cierta cantidad dinámica es
.::ero, se dice que esa cantidad se conserva en el movimiento o que es una constante
del movimiento. De acuerdo con (4.14-14), es evidente que se conserva la energía de
"Jn sistema en uno de sus estados propios. Si se puede encontrar un operador A con
la propiedad de que

(4.14-24)

12 C. W. Sherwin, op. cit. páginas. 118-122.


128 Mecánica cuántica. Generalidades

en donde An es una constante, se dice que An es un valor propio del operador A.


Para tal operador,

(4.14-25)

(4.14-26)

por lo cual,
(4.14-27)

y la cantidad dinámica representada por A se conserva, y el valor esperado del


operador A está dado por el valor propio An· Evidentemente, el operador hamil-
toniano Jf es tal, que sus valores propios son las energías En· Cualquier otro
operador A, que posea la propiedad (4.14-24) con respecto a las funciones propias
del sistema, conmutará siempre con el operador hamiltoniano, es decir, siempre se
encontrará que
AJf =ffA, (4.14-28)
ya que, entonces,
Jt' Al/In= Jt'().nl/ln) = AnJfl/ln = AnBnl/ln (4.14-29)

y
A.tfl/ln = A(enl/ln) = enAI/1. = enA.nl/ln = ff Al/In· (4.14-30)

La inversa de este enunciado es verdad también; si un operador A conmuta


con el operador hamiltoniano, como sucede en (4.14-28), el operador tiene la pro-
piedad ( 4.14-24) con respecto a las funciones propias 1/1 n, y la variable dinámica que
representa es una constante del movimiento ya que en este caso se satisface
( 4.14-27),13
Cuando se trata de sistemas más complejos, tales como el átomo de hidrógeno,
que se estudia en la siguiente sección, las relaciones (4.14-24) y (4.14-28) son muy
útiles para demostrar que ciertas cantidades dinámicas son constantes del movi-
miento. Se constatará, recurriendo a (4.14-24), que el total de la cantidad de mo-
vimiento angular orbital del electrón dentro del átomo de hidrógeno, y su compo-
nente z, son constantes del movimiento.

4.15 EL ATOMO DE HIDROGENO

El átomo de hidrógeno es un sistema compuesto de un protón y un solo


electrón que interactúan como resultado de su atracción electrostática mutua. El
potencial clásico de este sistema es, sencillamente,
V(r) = - e2 /r, (4.15-1)
13 Si se desea ver la demostración inversa ·de esta expresión, véase E. Merzbacher, op. cit.,
página. 160.
El átomo de hidrógeno 129

en donde e es la carga electrónica y r la distancia entre el electrón y el protón. En


este estudio se considerará que la masa del protón es infinita en comparación con la
del electrón. En esta aproximación, cualquier movimiento del protón puede consi-
derarse como despreciable, ya que se supone que el movimiento es el que realiza el
electrón alrededor de un núcleo fijo. Puesto que la masa del protón es alrededor de
1850 veces la del electrón, esta aproximación es aceptable. El movimiento del pro-
tón se puede tomar en cuenta si se utiliza una masa reducida, como se hizo en el
análisis de la sección 4.5 en relación con el átomo de Bohr.
Considerando la simetría esférica del potencial (4.15-1) conviene usar el sistema
de coordenadas esféricas ya conocido, donde

x = r sen Ocos rjJ

y = r sen Osen rjJ

z = r cosO,

Figura 4.21. Sistema de coordenadas esféricas utilizadas en el estudio del átomo de hidrógeno.

como se ilustra en la figura 4.21, en donde se puede escribir la ecuación inde-


pendiente del tiempo de Schrodinger como

(4.15-2)

con

(4.15-3)

En (4.15-2), m 0 representa la masa del electrón.


Se puede proceder mediante la técnica ya conocida de separación de variables,
en la que se supone que las soluciones tienen la forma

1/J(r,O,r/J) = R(r)E>(O)<'P(r/J), (4.15-4)


130 Mecánica cuántü:::. Generalidades

en donde R(r) es una función de r solamente, independiente de 8 y 1/>; 8(8) es una fun-
ción sólo de 8, y cl>(if>) es una función exclusiva de 1/>. Al substituir esta forma para la
solución, en (4.15-2), observando que 3¡J¡f3r = 0cl> dR/dr, 31/1/38 = Rcl> d0/d8 y 31/1/31/>
=R@Jd~/dl/>, multiplicando la ecuación resultante por r2 sen 2 8/(R~), y transpo-
niendo, se tiene que

Puesto que la expresión de la izquierda, que es una función solamente de r y


8 es igual a otra expresión que es una función exclusiva de 1/>, las dos expresiones se
deben igualar por separado a una constante que, por razones que se verán en breve,
se representará por medio de m 2 .
A continuación se limitará el estudio, por un momento, a la última igualdad
que aparece en (4.15-5). Esta se puede reacomodar ligeramente de tal modo que se
lea

(4.15-6)

que es una ecuación diferencial cuya solución se puede escribir como sigue

(4.15-7)

Puesto que la función de onda completa ¡J¡ debe tener un solo valor, es
necesario que cl>m(l/>) tenga un solo valor también. En otras palabras, es necesario
que

(4.15-8)

por lo que, de acuerdo con (4.15-7),

o bien,
e±2,.mi =l. (4.15-9)

Esta condición se puede satisfacer sólo si m es un entero positivo o negativo o


bien, cero. Los valores permisibles de m están limitados, entonces, a

m= O, ±1, ±2, ±3, ···,

de otra manera, la función de onda tendrá múltiples valores. Ahora se comprenderá


por qué la constante de separación se escogió de tal manera que se representara
mediante m 2 • Si m es un número real, entonces m 2 debe ser positiva. Si la cons-
tante de separación de ( 4.1 S-5) hubiera sido negativa, las soluciones ( 4.1 S-7) habrían
sido exponenciales y no sinusoidales y la condición de valor único (4.15-8) nunca se
habría satisfecho. Así pues, la constante de separación se escogió de este modo para
asegurar que tendría siempre un valor positivo y, por ende, excluyera inmediata-
mente las soluciones indeseables.
El átomo de hidrógeno 131

En (4.15-5), la expresión de la izquierda se puede igualar a m 2 , y la ecuación


resultante dividirse entre sen 2 fJ y reacomodarse en tal forma que se exprese como
sigue

2 2 2
1-
- d (r2 dR)
- +2m- 0r ( e)
- e+- = - - -1- - sde( n ( )
dE>)
- +--m =fJ,
R dr dr li 2 r E> sen O d() d() sen 2 ()
(4.15-10)

Una vez más, puesto que la primera expresión es una función exclusiva de r y
la segunda lo es sólo de fJ, las dos deben ser iguales, independientemente, a una
constante {3. La segunda igualdad de (4.15-10) se puede escribir en la forma

1 d ( dE>) m 2 E> (4.15-11)


sen() dO sen() d() - sen 2 () + {JE>(O) = O.

Esta ecuación es muy conocida en la física matemática y se denomina ecuación de


Legendre. Sin entrar en muchos detalles matemáticos, 14 se observará que las únicas
soluciones de esta ecuación que no violan los requisitos de lo fmito para las fun-
ciones de onda son aquellas para las que {3 tiene valores de O, 2, 6, 12, 20, • • • , de
donde, para aquellas en que

fJ = l(l + 1) con (l = 0,1,2,3, · · · ). (4.15-12)

En estos casos, las soluciones de (4.15-11) se reducen a un polinomio en cos fJ


y sen fJ más o menos en la misma forma en que las soluciones de la ecuación de
Hermite se reducen a polinomios en ciertas condiciones. Estas soluciones polinómicas
se pueden representar como las funciones asociadas de Legendre P'f(8), definidas por
dlml
Pr(()) =senlml () d(cos O)lml P,(cos O) (4.15-13)

en donde
1 d 1(cos 2 ( ) - 1)'
P,(cos ()) = 211! d(cos 6)1 (4.15-14)

Las funciones P1 (cos fJ) son las llamadas polinomios de Legendre, las primeras
de las cuales son

P 0 (cos O)= 1

P¡{COS ()) = cos ()


(4.15-15)
P 2 (cos O)= t(3 cos 2 ()- 1)

P 3 (cos 9) = !(5 cos 3 ()- cos 9)


etc.

14 Por ejemplo, véase R. B. Leighton, Principies o[ Modern Physics, McGraw-Hill Book Co.,
Inc., Nueva York (1959), página 168.
132 Mecánica cuántica. Generalidades

Por supuesto, cuando m= O, las funciones asociadas P?(e) se reducen a los


simples polinomios de Legendre P1( cos 8). La función E>( 8) de ( 4.15-11) se escribe
casi siempre en la forma

0 (8) = J(2l + l)(l- m)! pm(e) (4.15-16)


lm 2( 1 + m) ! 1 ,

siendo el factor de multiplicación Pf(8) una constante de normalización. La parte


angular de la función de onda, representada como un producto de 8 1m(8) y <I>m(cf>)
se escribe con frecuencia en la siguiente forma

= ( -l)m J( 21 + 1)(l- m)l. Pr(e)eim<J>.


4n(/ +m)!
(4.15-17)

Las funciones Y 1m (e ,e/>) se conocen como armónicas esféricas. Para una fuerza
central en donde el potencial es una función exclusiva de r, la parte angular de la
función de onda está dada siempre por ( 4.15-17), sea cual fuere la forma particular
que tome V(r).
La porción radial de la ecuación ( 4.15-1 O), tomando ~ = l(l + 1) como lo re-
quiere ( 4.15-12), se convierte ahora en

_1_ .!!_ (r 2 dR) + 2m 0 (s + e 2 )R(r) _ 1(1 + 1)R(r) =O. (4.15-18)


r 2 dr dr li 2 r r2

Esta expresión se denomina ecuación de Laguerre. Las soluciones cuyo compor-


tamiento en r = oo permite calificarlas como funciones de onda, son aquellas que se
pueden expresar en términos de los polinomios de Laguerre. Estas funciones con las
que se asocia un conjunto discreto de valores propios de la energía E, se pueden
expresar como sigue

_ _
Rnl(r)-
[(2 nli2 2)3
moe (
. n- 1 -
(2n[n +
1)' ]1/2 e
·
/] !)3
-p¡z 1 zt+ 1
p Ln+l (p), (4.15-19)

en donde
11 = 1,2,3, .... (4.15-20)
y en donde
(4.15-21)

Las funciones L ~':/(p) son funciones asociadas de Laguerre, definidas por


ds
L~(p) = -1S L,(p), (4.15-22)
(p

en donde Lr(P) son los polinomios de Laguerre que, a su vez, se definen como
d'
L,(p) = eP - ,(p'e-P). (4.15-23)
(1p
El átomo de hidrógeno 133

Las energías en para las que existen funciones de onda aceptables están rela-
cionadas con los valores de n en (4.15-19) por medio de 15

(4.15-24)

La ecuación ( 4.15-24) para los niveles de energía del átomo de hidrógeno


concuerda con el resultado ( 4.5-8) de la teoría de Bohr; los niveles energéticos,
según se ilustran en la figura 4.5, y dados por la teoría de Bohr son los mismos que
los que predice la mecánica ondulatoria.
Existen tres números cuánticos, n, l y m en el planteamiento de la mecánica
ondulatoria para el átomo de hidrógeno. Los valores posibles de n están dados por
(4.15-20). Los polinomios de Laguerre Lr(P) de (4.14-23) se pueden identificar como
polinomios de grado r. Estos polinomios se pueden derivar sólo r veces antes de que
el resultado de la derivación repetida dé cero como resultado. De donde, para las
funciones de onda que no sean cero de la forma L:,
que se puedan obtener del
polinomio Lr, el número de derivaciones s necesarias para generar la función aso-
ciada L: de acuerdo con (4.15-22), debe ser igual o menor que r. Entonces, para
funciones de onda con significado físico, es necesario tener en (4.15-22)

s ~ r, (4.15-25)
o, en (4.15-19)
21 + 1 ~ n +l. (4.15-26)
Si se resta l +1 en ambos lados de esta desigualdad, (4.15-26) se reduce a

l~n-1. (4.15-27)

De igual manera, la función asociada de Legendre P{'(fJ) se obtiene del poli-


nomio de Legendre P1(cos fJ) mediante una derivación de m veces. Para una función
de onda distinta a cero de la forma P{'(fJ), el número de derivaciones m debe ser
igual o menor que el grado l del polinomio. Por tanto, se debe tener

(4.15-28)

para funciones de onda de interés físico. Las condiciones expresadas en (4.15-20),


( 4.15-27) y ( 4.15-28), sirven para definir las expresiones bien conocidas para el
rango posible de valores correspondientes a n, l y m,

n = 1,2,3,4, ···

l = 0,1,2,3, ··· n- 1 (4.15-29)

m =0,±1,±2,±3, ···±l.

Por lo común los estados para los que l = O, 1, 2, 3 se mencionan como es-
tados s, p, d y f, respectivamente. Así pues, para indicar un estado para el que n = 2
y l =O, se dice estado 2s, en tanto que uno con n = 3 y l = 2 se representa como
estado 3d.

15 Los detalles matemáticos de este desarrollo están dados por R. B. Leighton, op. cit.,
páginas. 171-17 5.
134 Mecánica cuántica. Generalidades

Las funciones de onda completas para el átomo de hidrógeno, de acuerdo con


lo establecido en ( 4.15-4), deben ser

(4.15-30)

en donde Rn 1(r), E>,m(l1>, y <~~m(C/>) son según lo establecen, respectivamente,


(4.15-7), (4.15-16) y (4.15-19), y en donde Nnlm es una constante de normalización
seleccionada en tal forma que

f 1/J:,ml/lnlm · r 2senO dr dO df/J =l. (4.15-31)

Se encuentra que las funciones de onda (4.15-30) son ortogonales, de modo


que

f 1/J:I'm'l/lnlm · r 2 senO dr d(J df/J =O, (4.15-32)

a menos que n = n', l = l' y m= m' simultáneamente. Las funciones de onda depen-
dientes del tiempo se o_btienen a partir de las funciofles independientes del tiempo y
multiplicándolas por e- 1 ent/fl.

TABLA 4.1.
Funciones de onda del átomo de hidrógeno

n=1 1=0 m=O .P1oo = Nlooe-'hP 1s

n=2 1=0 m=O .P2oo = N2oo(2- p)e-'hP 2s


1=1 m=O .P21o = N21ope- 'hP cos 8
} 2p3
(4 estados) m=±1 .P21±1 = N211pe-~'>P sen8 e± 1"'

n=3 1=0 m=O .P3oo = N3oo(6- 6p + p2)e- 'hP 3s


1= 1 m=O .P31o = N31op(4- p)e- 'hP cos 8
} 3p3
m=±1 .P3t±1 = N311p(4 -p)e-'l.zP sen8 e± 1•
1=2 m=O .P32o = N32op 2e_ 'hP(3 cos 2 8- 1)
m=±1 .P32± 1 = N321p 2e- 'hP sen8 cos 8 e± 1"' ) 3d'
(9 estados) m=±2 if¡ 32 ±2 = N 322 p2e- 'lzP sen 2 8e±Z1"'

n=4 1=0 m=O .P4oo = N4oo(24- 36p + 12p 2 - p3)e- 'hP 4s


l= 1 m=O .P4to = N4tope- 'hP(20- 10p + p2) cos 8
} 4p3
m=±1 .P4t±l = N411pe-'lzP(20- 10p +p 2) sen8 e± 14>
1=2 m=O .P4zo = N42oP 2(6 -p)e- 'hP(3 cos 2 8- 1)
.P42±1 = N42tP 2(6 -p)e-'hPsen8 cos 8 e± 1•
m=±1
m=±2 .P4z±Z = N4••P 2(6- p)e-'l.zP sen 2 8 eu 1•
)4d'
1=3 m=O .P43o = N43op 3e-'hP(j-cos 3 8- cos 8)

(16 estados)
m=±1
m=±2
m=±3
.p43±1 = N43tp 3e- 'h•(5 cos 2 8- 1) sen 8 e± 1"'
.P43±2 = N432p 3e-'h.Psen 2 8 cos 8 e± 21 "'
.P43±3 =N433p 3e-'hPsen 3 8 e± 3'"'
}·;,
N = _ [ cmoe 2 ) 3 (n -1- 1)!(/- m)!(2/ + 1)]'/.z
nlm nli' 4rr(2n[n + /]!) 3(/ + m)!
El átomo de hidrógeno 135

Figura 4.22. Representaciones fotográficas de la densidad de electrones asociada con varios


estados propios del átomo de hidrógeno. El eje polar yace sobre el plano de la
página y está orientado verticalmente.

De acuerdo con (4.15-24), es evidente que la energía depende sólo del número
cuántico principal n de este sistema particular. Existen muchos estados cuánticos
independientes [correspondientes a los diversos valores permisibles para l y m, de
acuerdo con (4.15-29)], que tienen el mismo número cuántico principal n y que, por
tanto, pertenecen al mismo nivel de energía. Este fenómeno se conoce como degene-
ración y un nivel energético que contiene más de un estado cuántico independiente
se conoce con el nombre de nivel degenerado. Gracias a ( 4.15-29), se puede ver
mediante un simple recuento de los estados, que la degeneración o multiplicidad
asociada con el nivel de energía En, cuyo número cuántico principal es n, es sim-
plemente n 2 •
Las expresiones algebraicas para algunas de las funciones de onda del átomo de
hidrógeno se ilustran en la tabla 4.1 y, en la figura 4.22 se muestran algunas repre-
sentaciones de la densidad de probabilidad de algunos de estos estados. Se observará
que los estados s- (l = O) son siempre esféricamente simétricos, en tanto que los
estados p-, d- y f, etc., tienen dependencias angulares que pueden ser muy com-
plejas. El estado 2p- para el que m = O, tiene dos lóbulos que señalan hacia las
direcciones ± z, en tanto que los estados 2p- para los que m = ± 1 tienen la forma
de "ondas" y son simétricos alrededor del eje z. Por tanto, todos los estados 2p-
136 Mecánica cuántica. Generalidades

Figura 4.22. (continúa). La escala no es uniforme en todos los diagramas. [Tomado de R. B.


Leighton, Principies of Modern Physics, McGraw-Hill, Nueva York (1959).]

tienen amplitudes de probabilidad que son simétricas alrededor del eje z. Se podría
preguntar cuál es la razón de esta aparente preferencia por el eje z. Después de
todo, el potencial V(r) es esféricamente simétrico, lo cual permite en primer lugar
escoger cualquier eje polar del sistema de coordenadas esféricas, y se seleccionó éste
de un modo puramente arbitrario. Entonces, ¿por qué parece que este aspecto es en
apariencia preferible o, más concisamente, se prefiere en realidad este eje en un
sentido físico?
En la sección 4.13 se hizo notar que las superposiciones lineales de las fun-
ciones ondulatorias en estado estacionario que pertenecen a diferentes niveles de
energía, no representan amplitudes de probabilidad que son independientes del tiem-
po. Puesto que las diversas funciones propias de estado estacionario independientes
que pertenecen al mismo grado energético degenerado tienen el mismo factor de
dependencia del tiempo e-iEntffi, sin embargo, se sigue que los estados de esta
naturaleza pueden superponerse y la amplitud de probabilidad de la superposición
sigue siendo independiente del tiempo. En la sección 4.10 se vio un ejemplo de este
tipo [en relación con la ecuación (4.10-13)]. Por ejemplo, de acuerdo con la ta-
bla 4.1 y (4.15-29) es evidente que existen tres estados independientes 2p para el
átomo de hidrógeno. No obstante, no existe ninguna diferencia si se considera que
El átomo de hidrógeno 137

estos estados son los mismos que se indican en la tabla 4.1 ó si se les toma como
tres superposiciones linealmente independientes de dichos estados. Mediante la super-
posición adecuada de los tres estados dados en la tabla 4.1, se podrían producir tres
funciones de onda independientes en superposición, que correspondan a las ampli-
tudes de probabilidad con lóbulos que señalen a lo largo de los ejes x-, y- y z-, en
lugar del lóbulo polar y la configuración en "dona" de las funciones de la tabla. Si
se hace una superposición lineal adecuada y subsecuente de estas tres funciones de
onda, se puede hacer que estos tres lóbulos señalen en cualquiera de tres direcciones
ortogonales dadas. Esto demuestra que las funciones de onda de la tabla 4.1, en las
que un eje polar arbitrariamente escogido parece tener un grado único o preferencial,
forman sólo una representación de las funciones de onda del sistema y que, a través
de la superposición correcta de estados cuánticos degenerados, se podría formar una
representación en la que el eje polar estuviese en alguna otra dirección. Además, por
supuesto, si así se deseara, se podría superponer el estado 2s a lo largo de los tres
estados 2p. No obstante, no se podría sumar en un estado 3s o 3p y seguir conser-
vando una amplitud de probabilidad independiente del tiempo.

o3/2R/Z
o 3/2 2
1
k
R 10

~
1 1
o 10 15

Figura 4.23. Gráficas de la función de onda radial Rn¡(r) correspondiente a 11lgunos estados del
átomo de hidrógeno. [Tomado de R. B. Leighton, Principies of Modern Physics,
McGraw-Hill, Nueva York (1959).]

En la figura 4.23 se muestra una gráfica de la función de onda radial Rn¡(r)


para varios de los estados de energía más bajos del átomo de hidrógeno, y en la
figura 4.24 se muestra una gráfica de la densidad de probabilidad radial, que es la
probabilidad de encontrar al electrón dentro de una capa esférica de un espesor dr,
alrededor del radio r. Puesto que el volumen de una capa de esta naturaleza es,
138 Mecánica cuántica. Generalidades

47rr2 dr, la densidad de probabilidad radial debe ser proporcional a r 2 R~ 1nl(r). 1


demostración de este aserto se propone como ejercicio para el lector. Los máxim<
en la densidad de probabilidad radial para las funciones de onda s, como se ilust1
en la figura 4.24, son muy semejantes (aunque no idénticas) a los radios de Bot
rn, según lo establece (4.5-4).
Ya se observó, gracias a la ecuación (4.15-24), que el número cuántico pri1
cipal n está asociado con la energía total del sistema. Más tarde se verá que 1<
números cuánticos 1 y m están relacionados con la cantidad de movimiento angul:
del sistema. En el movimiento planetario clásico se conserva la cantidad de mov

25
Zr
o;
Figura 4.24. Gráficas de la distribución de probabilidad radial r2R~ 1 (r) para algunos estado~ d
átomo de hidrógeno. [Tomado de R. B. Leighton, l'rinciples of Modern Physic
McGraw-Hill, Nueva York (1959).]

miento angular orbital. Como se verá en breve, esto se aplica también al plante:
miento de la mecánica cuántica. La cantidad de movimiento angular clásica L de ur
partícula se define por medio de

L = r X p, (4.15-3:

en donde p es la cantidad de movimiento lineal y r es el vector de radio a partir d


un origen arbitrario hasta la partícula. De acuerdo con esta definición y el enur
ciado de los operadores de cantidad de movimiento lineal (4.7-2), se puede construJ
de un modo muy directo un conjunto de operadores que representen las comp<
nentes cartesianas de una cantidad de movimiento angular. El resultado es

L
y
=zp" -xpz =~[z~-x!_]
i OX oz (4.15-3~

L
z
=xpy -yp" =~[x!_-y!_]
i iJy ox .
El átomo de hidrógeno 139

Estos operadores se pueden expresar de acuerdo con las coordenadas esféricas


(r, O, cp) mediante una transformación de coordenadas directa, pero tediosa. En este caso,
los operadores se convierten en

L
x
li[ a - ctn () cos "~',¡,. -a<Pa]
= -¡ - sen "~',~,. -ao

L =
'
~¡ [cos ,¡,."~' ao0 - ctn Osen,¡,.~]
"~' a<P (4.15-35)

li a
L.= i a<P ·
El operador que representa el cuadrado del total de la cantidad de movimiento
angular se puede obtener a partir de (4.15-3 5) como

2
L = Lx
2
+ L,2 +L.=
2
-li
2[ 1 a(
sen OoO sen()
a) o2
ao + sen12 Oa<jJ 2 ] • (4.15-36)

A continuación se examinará lo que sucede cuando este operador opera sobre


las funciones de onda 1/lnlm del átomo de hidrógeno, según lo indica (4.15-30). Se
encuentra que

(4.15-37)

Sin embargo, el operador L 2 es independiente de r y opera sobre la función


de onda producto (4.15-30) en tal forma que (4.15-37) se puede escribir como sigue

(4.15-38)

Si a esta expresión se aplican sucesivamente las relaciones (4.15-6), ( 4.15-11) y


(4.15-12), es evidente que

(4.15-39)

Esta ecuación demuestra que el operador L 2 es tal que tiene la propiedad


especial dada por (4.14-24) con respecto a las funciones de onda 1/lnlm· En conse-
cuencia, de acuerdo con (4.14-27) y (4.14-25), la variable dinámica asociada con el
operador debe ser una constante del movimiento y su valor esperado es h2 l(l + 1).
Así pues, se conserva el cuadrado de la cantidad del movimiento angular, por lo que
la propia cantidad de movimiento angular debe conservarse, y el valor esperado de la
cantidad de movimiento angular debe ser

(L) = J (L2 ) = lijl(l + t). (4.15-40)


140 Mecánica cuántica. Generalidades

En forma similar, se puede demostrar que la componente z de la cantidad de


movimiento angular se conserva también. En este caso, a partir de (4.15-35) y
(4.15-30), se tiene que

li a li a<I>m
Lzt/Jnlm = ¡ oc/J R",(r)E>,m(O)<I>m(cP) = ¡ R",(r)E>,m(O) oc/J • (4.15-41)

Sin embargo, ocfJm/ocp = imeím<P = imcfJm(C/J), de donde (4.15-41) se convierte


en

(4.15-42)

En consecuencia, el operador Lz tiene también la propiedad especial (4.14·24)


y, por ende, Lz es una constante del movimiento cuyo valor esperado debe ser

(4.15-43)

Se conserva tanto el total de la cantidad de movimiento angular como su


componente a lo largo del eje polar (cuya dirección, como ya se vio antes, se puede
escoger de un modo arbitrario). El número cuántico /, que especifica el total de la
cantidad de movimiento angular orbital, se denomina a veces número cuántico or-
bital. El número cuántico m, que especifica la componente z del momento angular,
se llama a veces número cuántico magnético, ya que la degeneración de los estados
que tienen los mismos valores de n y /, pero distintos para m, se pueden eliminar
aplicando un campo magnético.
Las orie'ltaciones posibles del vector de cantidad de movimiento angular L con
las restricciones impuestas por las condiciones cuánticas ( 4.15-40) y (4.15-43), se
ilustran en la figura 4.25 para los estados en los que l = O, 1 y 2. El vector L debe
tener, al mismo tiempo, una longitud total dada por (4.15-40) y una proyección a
lo largo del eje z establecida por ( 4.15-43). Esto da como resultado un grupo
discreto de orientaciones posibles para el vector, como se indica en los diagramas. Es
evidente que estos diagramas pueden generalizarse para aplicarlos a sistemas que
tienen valores más altos de /. También se debe aclarar que, si se aplica un campo
magnético constante a lo largo del eje z, el momento magnético del electrón dentro
de su órbita (que es proporcional al total de la cantidad de movimiento angular

L,="Íi

1=0 /= 1 /=2
L=O L="Íiff L="Íi {6
L,=O, ± "Íi L,=O,±"Íi ±2"Íi

Figura 4.25. Posibles orientaciones para el vector de cantidad de movimiento angular bajo las
restricciones impuestas por (4.15-40) y (4.15-43) para l =O, 1 y 2.
El espín electrónico 141

orbital) tendrá una interacción con el campo aplicado, de modo que el átomo
experimentará una fuerza que trata de alinear al vector del momento magnético (y,
por ende, el vector de su cantidad de movimiento angular orbital) con el campo
aplicado. Por consiguiente, los estados cuyo valor de m permite una alineación par-
.:ial o completa, deben tener una energía más baja que los que corresponden a
orientaciones casi antiparalelas. Los estados cuánticos que tienen dife¡entes valores de
m, los cuales se degeneran en ausencia de un campo magnético, al aplicarles dicho
~po se dividirán en m niveles separados aunque muy proximos uno del otro. Este
fenómeno se conoce con el nombre de efecto de Zeeman.
Estos resultados sirven para explicar adecuadamente las propiedades eléctricas,
magnéticas y espectroscópicas observadas en el átomo del hidrógeno. En principio,
los átomos de estructura más compleja se pueden manejar con los mismos métodos;
por otra parte, puesto que estos átomos representan sistemas de tres o más cuerpos,
no se pueden obtener soluciones analíticas de forma cerrada, debido a lo cual es
necesario recurrir a la teoría de perturbaciones. Un método de esta índole se basa
en la técnica de dividir el operador hamiltoniano del sistema en una parte principal
.:uya solución se conoce o se puede obtener analíticamente, y una parte más pe-
queña que contiene todos los términos que pueden originar dificultades analíticas. O,
por lo menos la mayoría de ellos. Entonces, se supone que la solución tiene la
forma de una combinación lineal de funciones propias de la primera parte del ha-
miltoniano y las constantes relacionadas con la combinación lineal se determinan de
tal modo que la función de onda sea una función propia aproximada del hamil-
toniano completo. Aunque estos métodos son muy útiles para resolver una gran
,·ariedad de problemas prácticos, no se analizarán aquí con más detalle. 16

4.16 EL ESPIN ELECTRONICO, EL PRINCIPIO DE EXCLUSION


DE PAULI Y EL SISTEMA PERIODICO

En el cálculo de las funciones de onda y los niveles de energía de átomos con


muchos electrones (He, Be, Li, etc.,) que se hace desde el punto de vista de la mecá-
nica cuántica, generalmente se supone que cada electrón se mueve dentro de un
potencial esféricamente simétrico, debido al núcleo y a una distribución espacial
promedio de todos los demás electrones. En esta aproximación, la función de onda
total del sistema se puede expresar como un producto de funciones de onda de un
solo electrón. La función del potencial de cada electrón es esféricamente simétrica y
la parte angular de las funciones ondulatorias de un solo electrón se pueden seguir
expresando de acuerdo con los armónicos esféricos (4.15-17). No obstante, la por-
ción radial de estas funciones de onda es más compleja que en el caso del átomo de
hidrógeno. Debido a que las funciones de onda de un solo electrón pueden dividirse
en sus partes radiales y angulares, cada electrón se puede considerar como repre-
sentado por tres números cuánticos n, m y l, al igual que en el 1-tidrógeno. Sin
embargo, puesto que la función radial de onda no tiene ya la forma (4.15-19),
correspondiente a un simple potencial de Coulomb, los estados que tienen el mismo
valor de n, pero un valor diferente de l, ya no están degenerados y la energía total
del electrón depende del número cuán tic o orbital l así como de n.
En vista de estas observaciones, los niveles de energía de átomos complejos se
pueden calcular y ya se pueden hacer predicciones acerca de los espectros de dichos

16 Para obtener un estudio completo de este tema véase, por ejemplo, C. W. Sherwin, op.
cit., capítulos 7-10 o bien, E. Merzbacher, op. cit., capítulos 16-20.
142 Mecánica cuántica. Generalidades

átomos. No obstante, estas predicciones no concuerdan por completo con la expe-


riencia, a menos que se efectúen dos correccciones adicionales.
La primera de éstas es la hipótesis del espín electrónico, que fue introducida
por Goudsmit y Uhlenbeck en 1925, según la cual, cada electrón, además de la
cantidad de movimiento angular orbital que tenga, debe poseer una cantidad de
movimiento angular intrínseco o cantidad de movimiento angular de espín, de mag-
nitud L 8 = -!-h..J3, cuya componente a lo largo de cualquier eje de campo dado
puede tener dos valores posibles hm8 = ± h/2. En consecuencia, el electrón puede
existir en dos "estados de espín" correspondientes a dos valores posibles de m8 •
Estos dos estados de espín se mencionan con frecuencia como estados de "espín
ascendente" y "espín descendente". Se puede considerar que el electrón tienen un
número cuántico de cantidad de movimiento angular total del espín s, que sólo
puede tener un valor de 1/2, en cuyo caso, análogamente a lo que establece
(4.15-40), la cantidad de movimiento angular del espín es

(L.) = nJ s(s + 1) = nJ3¡2, (4.16-1)

y un número cuántico m8 que representa la componente z de la cantidad de movi-


miento angular del espín que puede tener los valores ± 1/2, análogamente a
(4.15-43), la componente z de dicha cantidad de movimiento es

(L•• ) = m.ñ = ± ñ/2. (4.16-2)

Así pues, la degeneración de todos los estados electrónicos que se producen


en el hidrógeno y en átomos más complejos, se duplica debido a que haya dos
estados del espín del electrón. La cantidad de movimiento angular intrínseca del
electrón es una consecuencia de la relatividad y se obtuvo de los primeros principios
cuando se formuló la ecuación de onda del modo covariante relativísticamente, como
lo demostró Dirac en 1928. La incorporación del espín electrónico al formalismo de
la mecánica ondulatoria en realidad no constituye ninguna suposición nueva en esta
rama de la física.
El otro factor que se debe introducir en la explicación del comportamiento de
sistemas de muchas partículas, de acuerdo con la mecánica ondulatoria, es el prin-
cipio de exclusión de Pauli, que establece que en un sistema dado (que puede ser un
átomo, una molécula o todo un cristal compuesto de muchos átomos interactuantes),
no hay dos electrones que puedan ocupar el mismo estado cuántico, considerándose
los estados de espín opuestos como si fueran estados diferentes. Aplicándolo a un
átomo complejo, el principio significa que no puede haber dos electrones en el
átomo que posean los mismos números cuánticos, n, l, m y m8 • Para otros sistemas,
esto significa que no puede haber más de g electrones que ocupen un nivel energé-
tico que se haya degenerado g veces. Aunque los electrones obedecen al principio de
Pauli, hay otras partículas tales como los fotones, que no lo hacen. En general, las partí-
culas tales como los electrones cuyo espín es múltiplo de (s = f, f, f, • • • ) obedecen
al principio de Pauli, en tanto que otros, como los fotones cuyo espín intrínseco es
entero (s =O, 1, 2 • • • ), no lo obedecen. Este hecho origina diferencias muy impor-
tantes en el comportamiento estadístico de los grupos de electrones y fotones, lo cual
se verá en el siguiente capítulo.
La adición del espín electrónico y ta principio de Pauli al planteamiento de la
mecánica ondulatoria de átomos de muchos electrones, ayudó a explicar el sistema
periódico de los elementos basándose en la ocupación sucesiva de los estados electró-
nicos de los átomos. Este enfoque se ilustra en la tabla 4.2, en donde se indica la
configuración electrónica de cada átomo.
El espín electrónico 143

TABLA 4.2.
Configuraciones electrónicas y el sistema periódico

1s H ls
He 1s 2 )
2s Li 1s 2 )2s
Be 1s 2 )2s 2
B 1s 2 )2s 2 2p
e 1s,)2s,2p>
N 1s 2 )2s 2 2p 3
o 1s,)2s,2p4
F 1s2 )2s 2 2p 5
Ne 1s2 )2s 2 2p 6)

3s Na 1s 2 )2s 2 2p 6)3s
Mg 1s 2 )2s 2 2p 6)3s 2
3p Al 1s2)2s 2 2p 6)3s 23p
Si 1s2)2s22p6)Js2Jp2
p 1s2)2s22p6)Js2Jp3
S 1s2)2s22p6)Js2Jp4
Cl 1s2)2s22p 6)3s2 3ps
A 1s2)2s22p6)Js2Jp6)

4s K 1s 2 )2s 22p 6)3s 23p 6)4s


Ca 1s 2)2s 22p 6 )3s 23p 6 )4s 2
3d Se 1s 2)2s 22p 6 )3s 23p 6 3d)4s 2
Ti 1s 2 )2s 2 2p 6 )3s 2 3p 6~d 2 )4s 2
V 1s2)2s22p6)Js2Jp6Jd3)4s2
Cr 1s2)2s22p6)Js2Jp63ds)4s
Mn 1s2)2s22p6)Js2Jp63ds)4s2
Fe ls 2)2s 22p 6)3s 23p 63d6)4s 2
Co 1s 2)2s 22p 6)3s 23p 63d 7 )4s 2
Ni 1s2)2s22p6)Js2Jp6JdB)4s2
Cu ls2)2s22p6)Js>Jp6Jdlo)4s
Zn 1s2)2s22p6)Js2Jp6Jdlo)4s2
4p Ga ls 2)2s 22p 6)3s 23p 63d 10)4s 24p
Ge 1s2)2s22p6)Js2Jp6Jdlo)4s24p2
As ls2)2s22p6)Js2Jp6Jdlo)4s24pJ
Se ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 4
Br ls2)2s,2p6)Js2Jp6Jdlo)4s24ps
Kr ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 6) ... etc.

Según la representación de esta tabla, el átomo más simple, H, tiene un solo


electrón, que en la configuración de energía más baja del sistema, debe encontrarse
en un estado ls. El siguiente átomo, He, con dos electrones, puede tener dos
electrones ls con espins opuestos en la configuración de energía más baja (o estado
fundamental o basal). Esta configuración se denota con ls 2 Puesto que sólo hay
dos estados relacionados con el nivel n = 1, 1 = O, el siguiente átomo más complejo,
144 Mecánica cuántica. Generalidades

Li, debe tener, de acuerdo con el principio de Pauli, la configuración de estado basal
ls 2 )2s, con lo cual se indica que el tercer electrón pasa al siguiente estado energé-
tico más bajo, o sea, 2s. El cuarto elemento, Be, tiene dos electrones 2s más; pero
puesto que sólo existen dos estados 2s, el principio de Pauli requiere que el quinto
elemento, B, tenga un electrón en el nivel 2p, que es el más bajo en energía,
excepción hecha de ls y 2s; así pues, B tiene la configuración de estado basal
ls 2 )2s 2 2p. Existen seis estados 2p posibles que corresponden a los números cuán-
ticos n = 2, l = 1, m = O ± 1 y m 9 = ± 1/2. Los cinco elementos siguientes, C, N, O, F y
Ne tienen un electrón 2p adicional para llenar el nivel 2p. La capa 2p llena es esférica-
mente simétrica y muy estable, como sucede en la capa ls llena, y los elementos Ne y
He, que tienen estas configuraciones, son gases inertes. Los elementos subsecuentes lle-
nan, entonces, las capas 3s y 3p, como se indica en la tabla, y terminan con otro gas
inerte, A, que tiene una capa 3p llena con 6 electrones. Los elementos que tienen arre-
glos similares de los electrones externos o de valencia en los grupos n = 2 y n = 3,
poseen propiedades químicas similares.
Cuando se llena el nivel 3p, los dos elementos siguientes agregan electrones en
los estados 4s y no en los niveles 3d, como podría esperarse. Esto se debe simple-
mente, a que el estado 4s tiene una energía más baja que el estado 3d. Luego viene
una serie de 8 ''elementos de transición" que tienen una capa interna 3d incompleta.
Cuando este nivel 3d se llena por fin, se sigue llenando la capa 4p concluyendo con
otro gas inerte, Kr. El resto de la tabla se puede elaborar siguiendo, por lo general
los mismos lineamientos. En todos los casos, la estructura de la capa externa de
elementos químicamente relacionados, tales como Li, Na, K, Rb, y Cs es idéntica.
Por tanto, es evidente que la teoría cuántica explica satisfactoriamente no sólo la
estructura de los niveles energéticos observados espectroscópicamente, en el caso de
los átomos complejos, sino que también explica la disposición de los átomos en el
sistema periódico y la regularidad con que se distribuyen en dicha tabla las propie-
dades químicas de los elementos.

EJERCICIOS
l. Demuestre que el valor esperado de la energía es igual a la constante de separación é,
para un sistema que tiene funciones de onda dependientes del tiempo, de la forma (4.8-8).
Demuestre que el valor esperado del operador hamlltoniano, tomado sobre la función de onda
independiente del tiempo es igual a é para este tipo de sistema.
2. Demuestre que si z 1 y z 2 son dos números complejos cualesquiera, entonces (z 1 z 2 )* =
zjz~; demuestre que el conjugado complejo de una cantidad compleja expresado en forma polar
feifJ (f. 8 real) es {*e-ifJ.
3. Para la partícula libre de la sección 4.9, la velocidad de fase, de acuerdo con (4.9-5) es
w/k =f'k/2m =p/2m. Sin embargo, desde el punto de vista clásico, la velocidad de una partícula
libre es p/m. Explique por qué discrepan en un factor de 2.
4. Verifique directamente que la función de onda (4.9-11) correspondiente a una partícula
libre, satisface la ecuación de Schrodinger (4.7-3) cuando V= O.
5. Verifique la ecuación (4.9-18) expresando la función (4.9-17) como un integral de
Fourier con la ayuda de (4.9-16).
6. Encuentre (x)n, {px)n, {pi>n para el nésimo estado propio del pozo de potencial infinita-
mente profundo de la sección 4.10, y demue~tre explícitamente que En= {p~)n/2m, para las
partícula libre.
7. ¿Cuál es la razón de las amplitudes que tienen las funciones propias del continuo del
pozo de potencial finito de la sección 4.11, en la región (-a <x <a), a la amplitud que hay en
las regiones (x <-a, x >a)?
8. De acuerdo con la definición (4.12-29), demuestre 4ue dHn(~/d~ = 2nHn-i (~). Nota:
observe que dn(xf(x))/dxn =X dnffdxn + ndn-i {/dxn-i.
9. A partir de (4.12-29), corrobore que Hn+i(~=2~n(~)- 2nHn_¡(~).
10. De acuerdo con los re~ultados de los problemas 8 y 9, demuestre que las funciones
Hn(~) satisfacen la ecuación de Hermite (4.12-16).
El espín electrónico 145

11. Encuentre el valor esperado de la energía potencial <v>n para el nésimo estado propio
de un oscilador armónico cuántico unidimensional: Nota: use las propiedades de ortogonalidad
de las funciones de onda.
12. Determine el valor esperado de la energía cinética <K>n correspondiente al nésimo
estado propio de un oscilador armónico cuántico unidimensional y utilice el resultado del pro-
blema 11 para demostrar que (V)n +<K>n = hvo<n +-!), lo cual concuerda con lo que se puede
mtuir.
13. Mediante la evaluación de la desviación estándar, demuestre que la cantidad de movi-
::~iento de una partícula libre es una constante del movimiento.
14. En relación con los estados propios del átomo de hidrógeno, demuestre que la probabi-
.Jdad de encontrar al electrón dentro de una capa esférica de espesor dr y radio r es r2R~ 1 (r).
Suponga que los armónicos esféricos Y¡m(O, cp) están normalizados.
15. Demuestre directamente que la fórmula de la desviación estándar indica a= O para los
vperadores L2 y Lz para el átomo de hidrógeno.
16. Obtenga las expresiones (4.15-36) para L2, a partir de las expresiones (4.15·35) para
Lx,Ly y Lz.
17. Utilice los métodos de la sección 4.15 y demuestre que si (€") se puede evaluar como
·JI'") usando las ecuaciones de onda independientes del tiempo, entonces, (en+t) se puede
:epresentar como (Jt'•+t) usando estas mismas funciones. Indique en forma inductiva la manera
<!n que esto significa que {f(e)) se puede obtener a partir de (/(Jt')) empleando las funciones de
·Jnda independientes del tiempo, en donde /(€) es una función de € que se puede representar
.:omo una serie de potencias convergente.

LECTURAS RECOMENDADAS
D. Bohm, Quantum Mechanics, Prentice-Hall, Inc., Englewood Cliffs, N.J. (1951).
E. Ikenberry, Quantum Mechanics for Mathematicians and Physicists, Oxford University Press,
Nueva York (1962).
R. B. Leighton, Principies of Modern Physics, McGraw-Hill Book Co., lnc., Nueva York (1959).
E. Merzbacher, Quantum Mechanics, John Wiley & Sons, Inc., Nueva York (1961).
L. Pauling y E. B. Wilson, Introduction to Quantum Mechanics, McGraw-Hill Book Co., lnc.,
Nueva York (1935).
J. L. Powell y B. Craseman, Quantum Mechanics, Addison-Wesley Publishing Company, Inc., Rea-
ding, Mass. (1961).
C. W. Sherwm, lntroduction to Quantum Mechanics, Holt, Rinehart and Winston, Inc., Nueva
York (1959).
J. C. Slater, Quantum Theory of Matter, McGraw-Hill Book Co., Inc., Nueva York (1951).
CAPITULO 5
Mecánica estadística.
Generalidades

5.1 INTRODUCCION

El objetivo de la mecamca estadística es analizar el comportamiento de un


gran conjunto de partículas o sistemas idénticos, en una forma estadística o proba-
bilística, derivando los valores más probables de las propiedades del conjunto sin
inquirir en detalle los valores de estas propiedades para una partícula dada en un
momento determinado.
Este estudio se limitará a un conjunto de sistemas idénticos que se supondrán
independientes unos de otros, excepto que pueden actuar entre sí o con el medio
ambiente externo, sólo a través de procesos instantáneos que conservan la energía y
la cantidad de movimiento. Por ejemplo, estos sistemas podrían ser las partículas de
un gas monoatómico ideal de partículas libres que pueden interactuar unas con otras
o con el medio circundante, interviniendo en colisiones instantáneas, o bien podrían
representar sistemas de otros tipos. Los campos de fuerza externos (eléctrico, magné-
tico o gravitacional, etc.,) también pueden ejercer su influencia en estos sistemas. En
tales circunstancias, se puede tratar a ::ada sistema de un modo independiente de los
demás, y se puede describir el comportamiento de cualquier sistema de acuerdo con
sus coordenadas en un espacio de fase sesquidimensional cuyas coordenadas son
(x, y, z, Px, Py. Pz). Se supone que estas coordenadas son independientes y ortogo-
nales, y la especificación completa del estado de movimiento de cualquier partícula
perteneciente al conjunto se expresa asignando valores a estas seis coordenadas espa-
ciales; entonces, su comportamiento subsecuente se puede describir, en principio,
basándose en estos conocimientos.
El postulado básico de la mecánica estadística es que la probabilidad a priori
de que un sistema esté en cualquier estado cuántico dado, es la misma para todos
los estados cuánticos del sistema. Esto significa, por ejemplo, que la probabilidad a
priori de que una partícula libre se encuentre dentro de una región (Ax, Áy, &)
alrededor de (x, y, z) es la misma para todos los valores de x, y, z, y la probabi-
lidad de que su cantidad de movimiento esté comprendida dentro de una región
(¡jpx, ¡jpy, ¡jpz) alrededor de (px,Py.Pz) es idéntica para todos los valores de
(px, Py, Pz). Se debe subrayar el hecho de que este postulado se refiere sólo a las
probabilidades a priori, es decir, a las probabilidades que prevalecen en ausencia de
cualquier restricción dinámica. Las probabilidades a priori en cualquier conjunto de
sistemas se modifica casi siempre mediante restricciones externas impuestas al sis-
tema, tales como requisitos de que el número total y la energía total de todos los
sistemas que pertenecen al conjunto se mantengan constantes.

147
148 Mecánico estadística. Generalidades

Primero se tratarán las partículas pertenecientes al conjunto, como si fueran las


clásicas "bolas de billar," considerando que se pueden distinguir unas de otras y
suprimiendo que un número cualquiera de ellas puede encontrarse en un solo estado
cuántico. Después de esto se investigará el efecto que tiene el principio de exclusión
de Pauli y cuál es el efecto de la imposibilidad de identificación de las partículas
elementales que se están estudiando. Se recurrirá con mucha frecuencia a los resul-
tados del capítulo anterior e, incluso, en el caso del planteamiento estadístico de las
partículas clásicas, se utilizará el marco cuántico de los niveles energéticos y los
estados cuánticos, aunque no sea absolutamente necesario hacerlo, con el fin de
conservar la misma consistencia y uniformidad.

5.2 LA FUNCION DE DISTRIBUCION Y LA DENSIDAD


DE LOS ESTADOS

Para calcular las propiedades promedio de un conjunto de partículas, por lo


general se necesita conocer la forma en que dichas partículas están distribuidas, en
promedio, en lo que respecta a la energía. Si el número promedio de partículas del
sistema que ocupa un solo estado cuántico de energía e se designa como f(e) y si se
hace que g(e)de sea el número de estados cuánticos del sistema, cuya energía está
dentro de un rango de alrededor de e, entonces, el número de partículas del sistema
cuya energía está dentro del rango de alrededor de e está dado por N(e)de, en
donde

N( e) de = f(e)g(e) de. (5.2-1)

La cantidad f(e), como se definió antes, se denomina función de distribución


del sistema, y depende de las probabilidades relacionadas con la distribución de las
partículas del sistema entre los estados cuánticos disponibles. La cantidad g(e), que
depende sólo de la forma en que los estados cuánticos mismos están situados en lo
que respecta a la energía, se llama densidad de los estados.
Si se conocen estas dos cantidades, el valor promedio de cualquier cantidad a
que se puede expresar como una función de la energía total e, se puede evaluar
como

frx(e)N(a) de
<!X> =
f
"---:o----

N(e) de

= ~f rx(e)f(e)g(e) de, (5.2-2)

la integral de N(e)de tomada sobre todos los valores posibles de e da simplemente


N, que es el número total de partículas del sistema. Si la cantidad a es una función
de las coordenadas del sistema q¡( = x,y,z, para i = 1, 2, 3, respectivamente) y las
cantidades de movimiento p¡( = Px• Py. Pz, en la misma forma) que no se puede expre-
sar como una función exclusiva de la energía total e, entonces e se puede expresar como
La función de distribución y la densidad de los estados 149

una función de las coordenadas y las cantidades de movimiento, como la suma de las
energías cinética y potencial,

¡¡ =
1 "L. p¡,
-2 + V(q¡), (5.2-3)

y el valor promedio de ex evaluado como una integral sobre las coordenadas del
espacio de fase como

JI a.(p¡.q¡}f(p¡,q¡) dp dq
(a.)= . (5.2-4)
JJJ(p¡,q¡} dp dq

En este caso, f(p¡, q¡) representa la función de distribución .f(E) en donde E se


expresa en función de p¡ y q¡ por m~dio de (5.2-3), y las cantidades dp y dq
representan los elementos de volumen en el espacio de cantidades de movimiento y
en el espacio de coordenadas expresadas en cualquier forma (cartesianas, cilíndricas,
esféricas, etc.) que pueda ser conveniente para la integración. La ecuación (5.2-4) no
contiene ningún factor de densidad de estados g{p¡, q¡) debido a que, como se verá
en breve, en sistemas del tipo que se está estudiando, la densidad de los estados
cuánticos en el espacio de fase es constante y se cancelan en el numerador y el
denominador de (5.2-4). Las expresiones (5.2-2) o (5.2-4) se mencionarán con fre-
cuencia cuando se calculen los promedios.
Puesto que el factor de densidad de estados g( E), según se define en relación
con (5.2-1), depende sólo de la dtstribución de los estados cuánticos del sistema en
cuanto a la energía, debe existir la posibilidad de calcular g{E) a partir de la solu-
ción de la ecuación de Schrodinger. Esto se puede hacer en relación con las partícu-
las libres tal y como se definieron en la sección 5.1, suponiendo que el sistema está
confinado en el interior de un recipiente rígido cuyas dimensiones son x 0 ,y 0 ,z 0 en
las direcciones x-, y- y z-, respectivamente. En efecto, este recipiente es un pozo de
potencial infinitamente profundo para las partículas que se encuentran en su interior,
siendo el potencial igual a cero para cada partícula que se encuentra dentro del
recipiente, a condición de que las interacciones de las partículas estén restringidas a
colisiones instantáneas. En este caso, dentro del recipiente, la ecuación de Schro-
dinger se puede escribir de acuerdo con ( 4.8-5) como sigue

(5.2-5)

en donde

(5.2-6)

De acuerdo con los resultados dados en las secciones 4.10 y 4.11, se puede
llegar a la conclusión de que 1/1 =O, fuera del recipiente. De acuerdo con (4.9-3), se
puede esperar que una solución válida para (5.2-5) sería una onda plana de la forma

(5.2-7)

Se puede verificar con facilidad que, en efecto, esta solución satisface lo esta-
blecido en (5.2-5). En realidad, la ecuación (5.2-7) se puede obtener como una
solución de (5.2-5) mediante la técnica de separación de variables que se usó con el
lSO Mecánict1 estadística. Generalidades

átomo de hidrógeno, suponiendo inicialmente una solución de producto de la forma


t/1 = X(x) Y(y) Z(z). Sin embargo, para que (5.2-7) sea una solución de (5.2-5), las
cantidades kx, ky y kz de (5.2-7) se deben relacionar en tal forma que

(5.2-8)

y, en este caso, se puede considerar que estas cantidades se comportan como las
componentes de un vector k que se conoce como vector de propagación. Si se
estudia el carácter físico de la función de onda dependiente del tiempo que se
relaciona con (5.2-7) por medio de (4.8-7),

'P(x,y,z,t) = Aei(k·r-wr)
(5.2-9)
(w = efh),

debe ser evidente que la dirección de k es la misma que aquella en la que avanza el
frente de la onda. La explicación física real de esto quedará asignada como tarea
para el lector. Utilizando los métodos desarrollados en el último capítulo, se puede
demostrar que el valor esperado de la cantidad de movimiento vectorial p está dado
por

(p) = hk, (5.2-10)

y que p (y, por tanto, k) es una constante del movimiento.


Para las condiciones de frontera, se requerirá que la función de onda en cual-
quiera de las caras del recipiente sea igual a la de la cara opuesta. Estas condiciones
de frontera periódicas o cíclicas se vieron con anterioridad en relación con las vibra-
ciones de red (sección 3.3). En una geometría unidimensional, estas condiciones de
frontera representan un sistema que equivale topológicamente a un anillo. En tres
dimensiones, las condiciones periódicas de frontera dividen todo el espacio en regio-
nes exactamente similares cuyas dimensiones son (x 0 , y 0 , z 0 ), siendo la función de
onda la misma en cada una de ellas, y cualquiera de estas regiones se puede usar
para representar el interior del pozo de potencial correspondiente al recipiente. Pro-
cediendo de esta manera y suponiendo que los bordes del recipiente se extienden a
lo largo del eje x desde O hasta Xo, a lo largo de la dirección y, de O a y 0 y en la
dirección z, de O a z 0 , las condiciones de frontera se convierten en

tf¡(O,y,-z) = tf¡(x 0 ,y,z)

t/l(x,O,z) = tf¡(x,y 0 ,z) (5.2-11)

tf¡(x,y,O) = tf¡(x,y,z 0 ),
lo cual requiere que en (5.2-7) se tome

(nx = 0,± 1,±2, ···)

(ny = 0,± 1,±2, ···) (5.2-12)

(nz = 0,± 1,±2. ··· ),


La función de distribución y la densidad de los estados 151

y luego, (5.2-7) se reduce a


lni(nxx + nll'y + ~)
1/l(x,y,z) = Ae xo Jlo zo • (5.2-13)

De acuerdo con (5.2-2) y (5.2-6), esto significa que sólo es permisible un


grupo discreto de valores de energía dados por

(5.2-14)

De acuerdo con (5.2-10), los valores permisibles de (kx, ky, kz) se pueden expresar
como los valores permisibles de (px,Py,Pz) en la forma

Py = hny/Yo (5.2-15)

Si se graficaran todos los valores permisibles de la cantidad de movimiento,


haciéndolos corresponder a todos los valores enteros posibles de (nx, ny, nz) en
(5.2-15), como puntos en un espacio ortogonal de cantidad de movimiento cuyas
coordenadas son (px, Py, Pz ), se obtendría una red ortogonal simple de los puntos,•
que representan los valores permisibles de la cantidad de movimiento, en donde las
dimensiones de la célula unitaria (h/x 0 , h/y 0 , h/z 0 ) corresponden a los cambios unita-
rios en (nx, ny, nz) en (5.2-15). El volumen del espacio de cantidad de movimiento
correspondiente a un solo estado cuántico del sistema es, simplemente, el volumen
de la celda unitaria

(5.2-16)

en donde V es el volumen físico del recipiente. De acuerdo con esto (y con la


gráfica de los puntos que representan las cantidades de movimiento permisibles), se
observa que la densidad con la que están distribuidos los estados cuánticos permisi-
bles en el espacio de cantidad de movimiento, es uniforme sobre todo el espacio,
[lo cual se mencionó anteriormente en relación con las ecuaciones (5.7-4)]. En
(5.2-16), no se tomó en cuenta el espín; para partículas con espín de l/2, como los
electrones, existen dos estados permisibles de cantidad de movimiento por cada pun-
to reticular dentro del espacio de cantidad de movimiento correspondientes a las dos
orientaciones posibles de espín de la partícula. Si se toma esto t'n cuenta, (5.2-16)
debe escribirse en la forma

(5.2-17)

Para valores grandes de x 0 ,y 0 y z 0 , tales como los que se relacionan con un


recipiente de dimensiones macroscópicas, el volumen VP de (5.2-17) se hace muy
pequeño y los estados de cantidad de movimiento (5.2-15) y los estados de energía
(5.2-14) se concentran excesivamente en comparación con los intervalos de energía y
cantidad de movimiento que se pueden apreciar macroscópicamente. Entonces, para
un sistema de dimensiones razonables, estará justificado el considerar que los valores
permisibles de energía y cantidad de movimiento están distribuidos t'n una forma
substancialmente continua dentro del espacio de cantidad de movimiento.
152 Mecánica estadística. Generalidades

Ahora se verá una superficie dentro del espacio de cantidad de movimiento


(px, p , Pz), estando todos estos puntos a una energía constante e. De acuerdo con
(5.2-6), (5.2-8)__rj_5.2-10), la ecuación de esta superficie debe ser la de una esfera
de radio p = ..j2me, o bien,

P2 = Px2 + Py2 + Pz2 = 2me. (5.2-18)

Esta superficie aparece ilustrada en la figura 5.1. En esta misma figura se


muestra una esfera similar cuya superficie representa todos los puntos de energía e + de.
La capa esférica entre estas dos esferas representa la región del espacio de cantidad de
movimiento correspondiente a las energías comprendidas en el rango de e a e +de. El
volumen del espacio de cantidad de movimiento contenido dentro de. esta capa es

dVP = 4n:p 2 dp. (5.2-19)

Sin embargo, de acuerdo con (5.2-18),

p dp =m de, (5.2-20)

por lo cual,

dVP = 4n:p ·m de= 4n:mjlme de. (5.2-21)

El número de estados cuánticos que se pueden encontrar en este volumen del


espacio de cantidad de movimiento se determina dividiendo este resultado entre el
volumen de tal espacio, relacionado con un solo estado cuántico dado por (5.2-17).
Por definición, el resultado

g(e) de
8 fin:v
= "h 3
J-
m3 ' 2 e de, (5.2-22)

es el factor de densidad de estados que se menciona en (5.2-1). Por supuesto, este


resultado se refiere sólo a las partículas libres suje~as exclusivamente a interacciones
tales como choques instantáneos. Para otros sistemas, sobre todo aquellos en los que

Cantidad de
movimiento p,
energía •
Cantidad de
movimiento p + dp,
energía • + d•

P,

Figura 5.1. Superficit>s esféricas correspondientes a energías constantes e y e +de graficadas en


el c<pacio de cantidad de movimiento (px, Py, Pz) de una partícula.
La distribución Maxwe/1-Boltzmann 153

se produ..~.: L'!n3C..-iooes mutuas de largo alcance entre partículas, el factor de


densidad de esudos sería mucho más complejo. Así también, el resultado (5.2-22)
pertenece estrictamente hablando sólo a un recipiente de la forma de un sólido
rectangular. No obstante, puesto que sólo en el resultado fmal aparece el volumen
d~l recipiente, por simple intuición se deduce que se obtendría la misma densidad de
ntados para un recipiente de volumen semejante, independientemente de su forma.
Se puede demostrar que esto es verdad.

5.3 LA DISTRIBUCION MAXWELL-BOLTZMANN

Si no existen restricciones respecto a los valores de energía y cantidad de


movimiento que una partícula del sistema pueda poseer, la probabilidad asociada con
todos los estados cuánticos es la misma y el promedio del número de partículas por
estado cuántico será independiente de la energía. Esto significa que la función de
distribución fte) será constante. Esta simple situación no es muy importante desde el
punto de vista físico, ya que un sistema que está térmicamente aislado del medio
que lo rodea debe obedecer la restricción de que la suma de las energías de todas
las partículas del sistema debe ser constante, y éste es precisamente el tipo de
sistema que se estudiará aquí. En este caso que es más apegado a la realidad se
reduce la proporción de partículas que ocupan estados de energía sumamente altos,
y la función de distribución ya no es constante con respecto a la energía.
Para determinar cuál es la función de distribución en estas condiciones, será
necesario proceder en primer lugar de acuerdo con los lineamientos clásicos, imagi·
nando que las partículas del sistema son objetos identificables tales como las bolas
de billar numeradas. Todo esto se hará dentro del marco de los estados cuánticos y
los niveles de energía, aunque, haciendo caso omiso del principio de exclusión de
Pauli, se permitirá que un número de partículas ocupe un estado cuántico dado del
s1stema. Se supondrá que se trata de un sistema aislado de N partículas distinguibles,
.:on una energía total constante U que se puede distribuir entre n niveles de energía
e1 , e2 , e2 , • • • e¡, • • • En. Desde el punto de vista estadístico, el conjunto tendrá la
distribución de energía que corresponde a una distribución aleatoria de partículas
entre los niveles, y en donde el número de cada nivel está dado por
.V 1 ,N2 ,N3 , · ··N¡,···Nn. De todas las distribuciones fortuitas de N partículas
~ntre n niveles energéticos, algunas ocurrirán con una probabilidad relativamente alta
desde un punto de vista puramente estadístico, y otras serán muy poco probables.
Esta situación es análoga al hecho de lanzar simultáneamente dos monedas en las
que la distribución (1 águila, 1 sol) es más probable que la distribución (2 águila, O
sol) o bien, (O águila, 2 sol). La distribución que tiene la máxima probabilidad de
ocurrir es la distribución de partículas entre niveles que se pueden producir dentro
de un número máximo de formas estadísticamente independientes. En consecuencia,
se supondrá que el estado de equilibrio del sistema corresponde íntimamente a esta
distribución estadística de partículas entre niveles que tienen la máxima probabilidad
en las condiciones del problema.
El cálculo del número de maneras en que las partículas identificables se pue-
den distribuir entre los niveles energéticos de un sistema, equivale a la determinación
del número de formas en que una cantidad de objetos numerados se puede distribuir
entre un conjunto de recipientes también numerados. Así pues, es necesario estudiar
el problema de determinar la cantidad de formas para distribuir N objetos identifi-
cables entre n recipientes, de tal manera que haya N 1 en el primero, N 2 en el
segundo, • • • , N¡ en el iésimo, etc. Este número será proporcional a la probabilidad
154 Mecánica estadística. Generalidades

con la que pueda ocurrir una distribución en donde N 1 , N 2 , • • • , Nn objetos se


encuentran dentro de los recipientes 1, 2, 3, • • • , n.
En primer lugar, se supondrá que se cuenta sólo con dos recipientes en los que
se pueden colocar los objetos, como se ilustra en la figura 5.2. En general, se tendrán
N 1 objetos dentro del recipiente 1 y N 2 en el recipiente 2, con

N1 + N2 = N = const. (5.3-1)

Sea Q(N 1 , N 2 ) el número de formas estadísticamente independientes de llegar a


la distribución (N 1 ,N2 ) de objetos en los recipientes (1, 2). Ahora, Q(O,N2 ) es
evidentemente igual a 1, porque la única forma de lograr esta distribución es poner
todos los N objetos dentro de la segunda caja, como se indica en la figura. De igual
manera, Q(l, N 2 ) =N, ya que para alcanzar esta distribución se puede poner el
objeto 1 dentro del primer recipiente y el resto en el segundo, el objeto 2 dentro
del primer recipiente y el resto en el segundo, y así sucesivamente hasta N objetos.
Existen N formas de seleccionar un objeto para colocarlo dentro del primer reci-
piente y, por tanto, N maneras de llegar a la distribución deseada. Si se tienen dos
objetos dentro de la primera caja, entonces Q(2,N2 ) =N(N- 1)/2! . Este resultado
se obtiene debido a que hay N formas de escoger el primer objeto que va al primer
recipiente; pero sólo N- 1 maneras de escoger el segundo de los objetos restantes.
Así también, las dos distribuciones en las que el objeto numerado a se escogió como
el primero y el objeto numerado {J como el segundo para colocarlo dentro del
primer recipiente, y en donde {J se escogió como el primero y a como el segundo,
son en realidad idénticos, y los mismos dos objetos acaban por colocarse dentro de
la primera caja; por tanto, el factor N(N- 1) se debe dividir entre dos. Para el caso
en que se tienen tres objetos dentro de la primera caja, existen N formas de escoger
el primero, N- 1 formas de escoger el segundo y N - 2 maneras de escoger el

Nz (j) ® ®---0---®
Compartimiento Núm. 2 Partículas

Q(O,N2 ) = 1

Q(I,N2 )=N

N formas de escoger a
Q( 2 N)=N(N-I)
N-1 formas de escoger (3
' 2 21 (pero las dos distril:iuciones
que aparecen a la izquierda
son la misma)

N formas de escoger a
N-1 formas de escoger p
N-2 formas de escoger 'Y
(pero las 3! distril:iuciones
ilustradas son la misma)

Figura 5.2. Jo'ormas posibles de distribuir N partículas identificables entre dos recipientes.
La distribución Maxwell-Boltzmann 1SS

tercero, en tanto que hay 3! formas de permutar entre sí los objetos enumerados
a, (3, y 'Y como si se les hubiera seleccionado en primero, segundo y tercer lugares,
por lo que Q(3, N 2 ) = N(N- 2)/3! . Por supuesto, se puede confirmar con este
procedimiento, entonces, recordando (5.3-I), se puede establecer que

N(N-1)(N-2)···(N-N 1 +1) N! N!
Q(N¡,Nz) = N1! = N 1 !(N- N 1)! N 1 !N 2 !
(5.3-2)
Supóngase ahora que el segundo recipiente se divide en dos subcompartimien-
tos que contienen v 1 y v2 objetos en donde, por supuesto,

(5.3-3)
como se ilustra en la figura 5.3. El número de formas independientes que logra la
distribución (v 1 , v 2 ) entre los subcompartimientos de la segunda caja es, de acuerdo
con (5.3-3),

(5.3-4)

Sin embargo, ahora se podría considerar que el sistema tiene tres recipientes
distintos y que el número total de maneras de acomodar los objetos, requerido para
que haya N 1 en el primer recipiente, v 1 en el segundo y v2 en el tercero [que se
denominará Q(N 1 ,v 1 ,v 2 )], será sencillamente el producto de Q(N1 ,N2 ) y Q(v 1 ,v 2 ),
ya que para cada arreglo (N1 , N 2 ), habrá Q(v 1 , v 2 ) maneras de acomodar las par-

IN·
Compartimiento : 1
m
~
2

Figura 5.3. Subdivisión del segundo recipiente en dos subcompartimientos; de hecho, se puede
considerar que el sistema así obtenido se ha dividido en tres recipientes diferentes.

tículas entre los subcompartimientos y existen Q(N 1 ,N2 ) maneras básicas de llegar a
una distribución (N1 , N 2 ) para los dos recipientes originales. De donde, se encontrará
que

(5.3-5)

A continuación, el trabajo se limita a marcar de nuevo los tres recipientes


como las cajas 1, 2 y 3, y denominar a los objetos dentro de cada una N 1 , N 2 y
N3 en lugar de N 1 , V 1 y v 1 , en cuyo caso (5.3.-5) se puede expresar como sigue
N!
Q(N¡,Nz,N3) =N 1N 1N 1 (5.3-6)
1. 2. 3.
156 Mecónica estadística. Generalidades

Una vez más, se puede imaginar que el tercer compartimiento se subdivide


como antes y, utilizando el mismo procedimiento se obtiene una expresión para el
número de acomodos requeridos a fm de distribuir N objetos entre cuatro cajas en
un forma tal que se obtenga una distribución (N 1 , N 2 , N 3 , N 4 ). Mediante la aplica·
ción repetida de este procedimiento el resultado se puede extender indefinidamente
por inducción hasta abarcar el caso en que se tengan n cajas. De acuerdo con
(5.3-3) y (5.3-6), es evidente que se encontrará

(5.3-7)

en donde el símbolo TI indica un producto ampliado, en la misma forma en que el


bien conocido ¿ expresa una suma.
La probabilidad real relacionada con una distrioución dada de N objetos entre
n cajas, es el número de diferentes maneras de acomodar objetos en Q(N 1 , • • • Nn)
cajas, requerido para obtener esta distribución particular, dividido entre el número
total de maneras de acomodar N objetos en n cajas sin tener en cuenta la distribu-
ción resultante de objetos entre las cajas. Como se puede demostrar con facilidad,
este último factor es nN. La probabilidad relacionada con una distribución dada es,
entonces, Q(N 1 , • • • Nn)/nN. Sin embargo, se encontrará que es más conveniente
manejar sólo las cantidades Q(N 1 , • • • Nn), que son proporcionales a las probabili-
dades reales, ya que sólo se tiene el interés de determinar los valores de N 1 , • • • Nn
que le dan un máximo a la probabilidad y, si Q(N 1 , • • • Nn), es un máximo, tam-
bién lo es la probabilidad asociada.
Ahora se identificará el iésimo recipiente con el iésimo nivel energético del
sistema, y el número de objetos N¡ de dicho recipiente con la cantidad de partículas
pertenecientes a ese nivel. Sin embargo, se debe permitir un margen por si los
niveles energéticos degeneran y se supondrá que hay g¡ estados cuánticos indepen-
dientes asociados con el iésimo nivel energético, cada uno de los cuales tiene la
misma probabilidad a priori de estar ocupado, de acuerdo con el postulado funda-
mental de la sección 5.1. Entonces, cada nivel de energía se debe considerar no
como un solo recipiente, sino como un grupo de g¡ recipientes, según se ilustra en la
figura 5.4. Para un nivel energético dado, por ejemplo, el iésimo que contiene N¡
partículas y g¡ estados cuánticos independientes, existen gf'i formas de acomodar las par-
tículas en los estados o recipientes pertenecientes a tal nivel, porque existen g¡ opciones
independientes respecto al lugar en que se puede colocar la primera partícula y para
cada una de éstas, hay g¡ selecciones del sitio donde se puede colocar la segunda, y

Degeneración g; =4 6 2

.: r-·-'-- 1

. --- 1
--1-- le.
•• 1 • r--1- •1
~··· • _L
Nivel 1 2 n
Población N¡ 4 7 2

Figura 5.4. La subdivisión de los niveles energéticos en diferentes estados cuánticos de acuerdo
con ~u dcgenerac.:ión. Dichos estados desempeñan el mismo papel que los recipientes
del desarrollo e~tadístico, y cada uno tiene el mismo peso estadístico.
La distribución Maxwell-Boltzmann 157

así sucesivamente hasta N¡ factores. Cada uno de estos arreglos constituye una forma
estadísticamente, independiente de distribuir partículas entre los estados cuánticos
del sistema, ya que estos estados cuánticos son de igual probabilidad, y no así los
niveles energéticos. Si el primer nivel de energía e 1 , fuera el único nivel degenerado,
se tendrían i( 1 maneras independientes de establecer una distribución específica de
partículas entre los niveles energéticos, como se indica en (5.3-7), ya que existen
muchas maneras de permutar las partículas entre los distintos estados degenerados
pertenecientes al primer nivel, y por cada uno de éstos queda todavía el mismo
número de maneras de asignar las partículas a los otros niveles del sistema, de tal
modo que se obtenga la distribución (N1 , N 2 , • • • Nn). Si además el segundo nivel
estuviera degenerado, se tendrían 112 posibilidades por cada una que existió antes,
siendo ahora el número total de formas independientes en que se logra una distribu-
ción dada de las partículas entre los niveles, ¡{ 1 112
veces la que se establece en
( 5 .3-7). Es obvio que cuando se incluye la degeneración de todos los niveles, el
11
resultado (5.3-7) se deberá multiplicar por 1{ 1 21:3 • • • tf:n, lo cual da

º( N¡,N2, ... Nn ) = - n - -
N! nn g¡N,
(5.3-8)
TIN¡!i=l
i= 1

cuando se incluye la degeneración.


Ahora se supondrá que la distribución real (N 1 , N 2 , • • • N n) de partículas
entre los estados energéticos que se observa en equilibrio, es esencialmente la que se
suele obtener en el número máximo de formas estadísticamente independientes, en
otras palabras, la distribución para la que la cantidad Q de (5.3-8) es un máximo.
Entonces, Q debe maximizarse con respecto a los parámetros N 1 , N 2 , • • • Nn, te-
niendo en cuenta la~ restricciones

n
L1 N¡ = N = const.
i=
(5.3-9)

y
n
L e¡N¡ = U = const. (5.3-10)
i= 1

Esta maxnmzacwn se logra con mayor facilidad utilizando la técnica matemá·


tica denominada método de los multiplicadores de Lagrange y se hará un breve
paréntesis para describir este tema. Supóngase que se da una función f(x 1 , x 2 , • • • x n)
de n variables y hay que determinar los valores de x 1 , x 2 , • • • Xn que maximizan
f, a condición de que alguna otra constante dada <P{x 1 , x 2 , • • • xn) permanezca
constante. Para un valor máximo (o mínimo) de f, df =O y si cp permanece constante
dcp = O, de tal manera que si f es un máximo o un mínimo en estas condiciones,
entonces

df + (/. d<f> =o (5.3-11)

sea cual fuere el valor que el multiplicador arbitrario indeterminado a pueda tener.
~o obstante, (5.3-11) se puede expresar como
158 Mecánica estadística. Generalidades

De acuerdo con esta ecuación, la condición ( 5.3-11) se satisface con toda


seguridad si para cada i

a¡ o</J (5.3-13)
-+IX-=Ü {i = 1,2, ·· · n),
OX¡ OX¡

y como además se dio la información inicial de que

(5.3-14)

las ecuaciones {5.3-13) y (5.3-14), tomadas juntas, representan un grupo de n + 1


ecuaciones simultáneas que se pueden resolver para las n cantidades x 1 ,x 2 , • • • Xn
que maximizan (o minimizan) a f y [para el multiplicador indeterminado] a que se
introdujo en (5.3-11).
Si existen dos funciones auxiliares cf>(x 1 , x 2 , • • • Xn) y ¡J¡(x 1 , x 2 , • • • Xn) que
se deben mantener constantes mientras se maximiza la función f, entonces se intro-
ducen dos multiplicadores arbitrarios a y {3, y es necesario que

df + IX d</J + f3 dlj¡ =O, (5.3-15)

que lleva, en .la misma forma, a un conjunto de n + 2 ecuaciones


a¡ o<P oi/J
-+IX-+/3-=Ü (i = 1,2, ·· · n) (5.3-16)
OX¡ OX¡ OX¡

(5.3-17)

¡J¡(x 1 ,x 2 , ••• x.) = 1/1 0 = const. (5.3-18)

paras las n + 2 incógnitas x 1 , x 2 , • • • x n, a y (3.


A continuación se procederá a aplicar este método con el fin ce encontrar la
distribución N 1 , N 2 , • • • Nn para la que (5.3-8) es un máximo. Para facilitar las
operaciones matemáticas lo que en realidad se maximizará es In Q y no Q propia-
mente dicha; pero puesto que el logaritmo es una función monotónica de un solo
valor de todas las variables comprendidas, cuando In Q es un máximo, también lo es
Q. Si se toma el logaritmo de los dos lados de (5.3-8), se tiene que

n n
In Q(N 1 ,N 2 , ···N.)= In N!+ L N¡ In g¡- L In N;!.
i= 1 i= 1
(5.3-19)

Se supondrá que este sistema es tan grande que para cada nivel t:¡! se puede
aproximar, utilizando la aproximación de Stirling según la cual, para x ~ 1,

lnx!:::;;-xlnx-x. (5.3-20)

Cuando se usa esta aproximación, {5.3-19) se convierte en

In Q = In N! + L N¡ In g¡ - L N; In N¡ + L N;, (5.3-21)
i i i
La distribución Moxwell-Boltz1111lnn 159

que se debe maximizar bajo las restricciones

</J(N¡,N2, ··· Nn) = L N¡= N


¡
(5.3-22)

I/J(N¡,N2, ··· Nn) = L¡ e1N 1 =U. (5.3-23)

De acuerdo con (5.3-16), esto requiere que

o(ln Q) o</J
- - +1X-+{J-=-
oi/J a [ LN 1 lng 1 - ¿N1 lnN1 + LN1
]
iJNi oNi oNi oNi 1 1 1

(j = 1,2, ··· n).

(5.3-24)

Al desarrollar las derivadas de {5.3-24), se observa que los únicos términos de


las sumas cuyas derivadas con respecto a N¡ no sean cero son aquellos para los cuales
i = j; por tanto, ( 5.3-24)se puede reducir a

(j = 1,2, ··· n). (5.3-25)

Resolviendo para In (N¡/g¡) y desarrollando los exponenciales, esta expresión se


puede escribir en la forma

(5.3-26)

La ecuación ("5.3-26) proporciona el número promedio de partículas por estado


cuántico del sistema y, por ende, representa por definición la función de distribución
de energía f(e). Esta función de distribución particular de energía, que se obtuvo
como {5.3-26) de acuerdo con la suposición clásica de partículas identificables y sin
utilizar el principio de exclusión de Pauli, se conoce como función de distribución
de Maxwe/1-Boltzmann.
Conviene explicar la forma en que las dos constantes a y 13 se relacionan con
las propiedades físicas del sistema. En primer lugar, a la constante 13 se le asignará el
valor

p = -1/kT, (5.3-27)

en donde T es la temperatura absoluta del sistema y k es una constante denominada


constante de Boltzmann, y se considerará que esta ecuación junto con {5.3-26)
definen lo que se entiende por temperatura. A su debido tiempo se verá que esta
definición conduce a todas las bien conocidas características de temperatura que se
asocian con un gas ideal y, entonces se podrá ver claramente que, antes de definir la
temperatura, ya se podían identificar las propiedades de un gas ideal a partir de
(5.3-26). Después se podría proceder a la identificación de p con el valor dado
arriba, basándose en una comparación de los resultados así obtenidos y la ecuación
termodinámica ya conocida del estado de un gas ideal (a partir de la cual se define
más comúnmente la temperatura). Se demostrará que el valor de k se puede rela-
cionar con la constante medida del gas ideal R y el número de Avogadro.
160 Mecánica estadística.. Generalidades

Si se utiliza el valor de (J dado en (5.3-27), la expresión (5.3-26) ahora se


puede escribir como
N.J = gJ.e"e-• 1/kT. (5.3-28)

Luego, el valor de la constante a se puede expresar de acuerdo con el número


total de partículas N ya que, de acuerdo con (5.3-9) y (5.3-28),

N= L N¡= e" L g¡e-•JfkT, (5.3-29)


j j

por lo cual

e"= N (5.3-30)
L g¡e e1tkT•
j

y
Ng .e-•¡tkT
N = g .e"e-•JtkT = (5.3-31)
1 J L g¡e
J
•1¡kr

Si los niveles energéticos del sistema están muy próximos unos de otros, como
sucede con los niveles del gas de partículas libres que se vio en la sección anterior,
la cantidad g¡ de (5.3-28) se puede considerar como g(e)de y la cantidad N¡ de la
ecuación se considerará como N(e)de, de acuerdo con lo expuesto en relación con la
ecuación (5.2-1). El número de partículas dentro de un rango energético de alrede-
dor de e dentro de este límite, estará dado, de acuerdo con (5.3-28), por

N(e) de= e"e-•fkTg(e) de= f(e)g(e) de. (5.3-32)

Para un gas ideal de partículas libres, el factor de densidad de estados g(e) está
dado por (5.2-22). Obsérvese que la forma de (5.3-32) es la misma que la de
(5.2-1), siendo !(e)= e"e-efkT. Una vez más, como se vio en relación con (3.3-31),
se puede evaluar la constante a teniendo en cuenta la condición de que el número
total de partículas dentro del sistema será una constante N, por lo cual

N = f N(e) de = e" f g(e)e-•fkT de, (5.3-33)

y
N
-f
e"-~----
g(e)e-•fkT de'
(5.3-34)

en donde las integrales se toman sobre todas las energías disponibles para las par-
tículas del sistema.
Se debe observar que la cantidad Q de (5.3-8) está íntimamente relacionada
con la entropía termodinámica del sistema. En equilibrio, el estado del sistema es tal
que Q. el número de formas estadísticamente independientes de distribuir las par-
La estadístiCil de Maxwell-Boltzmann para un gas ideal 161

f(•l

7j

ura S.S. Representación esquemática de la función de distribución de energía de Maxwell-


Boltzmann para tres temperaturas distintas.

ulas entre los estados cuánticos, es un maxtmo como lo es la entropía del sis-
na Por ahora no se entrará en detalles; pero se puede demostrar 1 que la relación
stente entre estas dos cantidades es

S-= k In Q, (5.3-35)

donde S es la entropía.

LA ESTADISTICA DE MAXWELL-BOLTZMANN PARA


UN GAS IDEAL

A continuación se analizarán las propiedades de un gas ideal de partículas


es del tipo que se estudió en la sección 4.2. Para este sistema, el factor de
sidad de estado g(€) d€ está dado por (5.2-22), debido a lo cual, de acuerdo con
:-34),

"'- N (5.4-1)
e - 8j2 ¡¡; V m 3!2 f"" Jf.e-c!kT de
h3 o

La integración se toma entre los límites cero e infinito, ya que la energía de


partículas es totalmente cinética y, por ende, positiva. La integral de (5.4-l) se
de expresar en una forma más sencilla mediante la substitución

x = efkT, (5.4-2)

1 J. E. Mayer y M. Goppert-Maycr, Statistical Mechanics, John Wiley & Sons, Nueva York
!.'1), capítulo 4.
162 Mecánica estadística. Generalidades

por lo cual, (5.4-1) se convierte en

(5.4-3)

La integral se puede expresar ahora como una función r-, 2 ya que f(n) se
define como

(5.4-4)

siendo entonces la integral de (5.4-3) igual a f(3/2), que, a su vez, es igual a ..J1i72.
Si se inserta este valor en (5.4-3), se tiene que

N ( h2 )3/2 (5.4-5)
e"= 2V 2mnkT '

que permite escribir la función de la distribución de Maxwell-Boltzmann para un gas


ideal como

(5.4-6)

Nótese que el valor de e" dado por (5.4-5), es dependiente de la temperatura.


También conviene destacar quue este valor de e" pertenece sólo a la función de
densidad de estados de partículas libres (5.2-22) y que para sistemas que tienen
otras funciones de densidad de estado relacionadas con ellas, el valor de e" será
diferente del que se da en (5.4-5). En la f~ura 5.5 se muestra una gráfica de la
distribución de Boltzmann (5.4-6) para varias temperaturas. De acuerdo con (5.4-6) y
(5.2-22), es obvio que la distribución real de la densidad de partículas con respecto
a la energía está dada por

2rrN
N(e) de =f(e)g(e) de= r;,.e-•tkT de (5.4-7)
( rrk T)312 \/ .

La energía interna total y el calor específico del gas se puede obtener fácil-
mente a partir de estos resultados. Puesto que la energía de las partículas en el
rango de alrededor de e es eN( e) de, la energía interna total del gas es

U= E'"eN(e) de, (5.4-8)

o bien, utilizando (5.4-7),

(5.4-9)

2 Véa~c. pm <'Íl"mplo, I. S. y 1·~ S. Sokolnikoff, Hif{her Mathematics for Engineers and


1'/n•sicil'l.\, Md;raw-llill Hook Co., lnc., Nueva York (1941), página~. 273-276.
La estadística de Maxweii-Boltzmann para un gas ideal 163

Esta integral se puede evaluar en términos de las funciones r-, substituyendo


(5.4-2). Al desarrollar la integral de este modo, y observando que r(5/2) =
(3/2)r(3/2) = 3 .Jrr/4, se encuentra

U =tNkT, (5.4-10)

por lo cual, la energía interna promedio por partícula, U/N, es 3/2kT que es un
resultado importante y muy conocido. La capacidad calorífica del gas a volumen
constante es la razón de aumento de la energía interna con respecto a la tempera-
tura, por lo cual, de acuerdo con (5.4-10),

e (au)
Var =
V
=1Nk
,
(5.4-11)

independiente de la temperatura. El calor específico Cv es simplemente la capacidad


calorífica por unidad de volumen.
El objetivo final es derivar la ecuación de estado para un gas de Boltzmann
ideal a partir de las propiedades dinámicas de la partícula y la función de distribu-
ción. N:> obstante, antes de llegar a esto, es necesario convertir las distribuciones de
energía (5.4-6) y (5.4-7), en distribuciones de velocidad apropiadas e investigar breve-
mente cómo se pueden usar estas funciones de distribución de velocidad. En la
tabla 5.1 se proporciona el valor de algunas integrales definidas que se utilizan muy
a menudo cuando se trabaja con las distribuciones de velocidad de Boltzmann.
En un gas de partículas libres que no poseen ningún grado interno de libertad,
toda la energía se basa en la energía cinética de las partículas. Esto se puede
relacionar con la velocidad mediante la expresión

(5.4-12)

de donde

de= mv dv, (5-4.13)

y la distribución de energía ( 5.4-7), se puede escribir directamente como una distri-


bución de velocidad de la forma

N(v) dv = 47tN ( 21tkT


m )3/2v2e-mv>f2kT dv. (5.4-14)

Esta función expresa el número de partículas el sistema cuvas velocidades


quedan dentro de un rango dv alrededor de v, o el número de partículas que quedan
dentro de una capa esférica cuyo espesor es dv y el radio es v, dentro del espacio
de velocidad.
Suponga que ahora se desea conocer cuántas partículas del sistema tienen velo-
cidades tales que la componente x de la velocidad se encuentre dentro de un rango
dvx alrededor Vx, la componente y está en el rango dvy alrededor de vy y la
componente z está dentro de un rango derivada de Vz alrededor de Vz, o sea el
número de partículas que quedan dentro de un elemento rectangular de volumen
(dvxdvydvz) en el espacio de velocidad centrado alrededor del valor (vx, vy, Vz). Este
164 MecániCtJ estadístiCtJ. Generalidades

TABLA 5.1.
Integrales Maxwell-Boltzmann*

=-
4
kT
m

= ~; e~Tr2

= ~e~Tr =--
32

= 3~; e~Tr 2 256

= e~Tr =--
64

*La segunda columna de la tabla da el valor de la integral definida que aparece en la


primera columna. La tercera columna indica el valor ~ la integral definida cuando a se hace
igual a m/2kT, como casi siempre sucede cuando se trabaja con distribuciones de velocidad de
Boltzmann. La cuarta columna expresa el resultado que aparece en la tercera columna como un
múltiplo de 12 velocidad térmica media e, en donde

e= v8kT/Trm.

número se denominará N(vx, Vy, Vz)dvx dvy dvz. Ahora se procederá con más cui-
dado, principiando con (5.4-6) que, de acuerdo con (5.4-12), se puede escribir como

!( V
N (
V V)=- - - -
h2 )3/2 e-m(v 2 x+v 2 ~+v 2 ,)/2kT
(5.4-15)
'"' '' z 2V 2nmkT

Entonces, como lo requiere (5.2-1),

(5.4-16)

en donde g(vx, vy, ~·.)dvx dvy dvz es el número de estados cuánticos dentro del ele-
mento de espacio de velocidad dvxdvvdvz. De acuerdo con (5.2-17) el número de
La estadística de Maxwell-Boltzmann para un gas ideal 165

estados dentro de un elemento de volumen dpx dpy dpz del espacio de cantidad de
movimiento es (2V/h3) (dpxdPydPz), por lo cual,

(5.4-17)

Puesto que la densidad de estados en el espacio de cantidad de movimiento, es


constante, también lo es la densidad de estados en el espacio de velocidad. Si se
substituyen (5.4-15) y (5.4-17) en (5.4-16) y simplifica el resultado, se obtiene

N(v V V)
m
dv dv dv =N ( - -
)3/2 e-mlu'"+u'y+u'.)/lkT dv dv dv
x• Y' z x y z 21tkT x Y z·

(5.4-18)

Una tercera función de distribución de velocidad N(vx)dvx, que representa el


número de partículas cuya componente x de velocidad queda dentro del rango dvx
alrededor de Vx, sean cuales fueren los valores de las componentes y- y z- de
velocidad para dichas partículas, está íntimamente relacionada con la función de
distribución (5.4-18). La función de distribución N(vx)dvx se puede calcular a partir
de (5.4-18) integrando sobre todos los valores posibles de vy y Vz, siendo el resul·
tado

(5.4-19)

Los valores de las integrales definidas requeridas al integrar (5.4-18), se toma-


ron de la tabla 5.1. En la figura 5.6 se ilustra una gráfica de la distribución N(v) y
N(vx) como funciones de la coordenada de velocidad aprÓpiada.
Si se conocen estas tres funciones de distribución de velocidad, es muy fácil
evaluar los promedios sobre las distribuciones de velocidad. Por ejemplo, la velocidad

(o) ( b)

Figura 5.6. (a) Representación esquemática de la distribución de Maxwell-Boltzmann de las


velocidades de partículas, N(v) a tres temperaturas distintas. (b) La distribución
correspondiente de las componentes x de la velocidad, N(vx).
166 Mecánica estadística. Generalidodes

térmica promedio e para una partícula en una distribución de Boltzmann, se obtiene


a partir de (5.4-14) escribiendo
ra)
J, vN(v)dv 1 312 a)
(v) = o =-. 4nN (~-) f v3e-mv2f2kT dv
Soa) N(v)dv N 2nkT Jo

= J8kT/nm, (5.4-20)

en donde la integral se evaluó con la ayuda de la tabla 5.1.


Ahora ya se puede pasar al estudio de la ecuación de estado de un gas ideal.
Supóngase que las partículas chocan contra una área unitaria de la pared de un
recipiente lleno con dicho gas, como se ilustra en la figura 5.7. Si la pared es un
plano orientado en sentido normal al eje x, las componentes de la cantidad de
movimiento Py y Pz de las partículas que chocan contra la pared, se conservan, si
las colisiones de las partículas con las paredes son elásticas, lo cual se supondrá, es
el caso de que se trata. En cada colisión, la componente de velocidad Vx dirigida
hacia la pared, cambia a - Vx, alejándose de la pared. La transferencia de cantidad
de movimiento de la partícula a la pared, por colisión, es entonces 2mvx. La trans-

r----
las partículas de 1 Unidad de área
velocidades Vx dentro l
de este volumen chocarán-,-_
contra la pared durante 1
el período dt 1

1
1
1
1
L____ _
-v.dt Pared de recipiente
-x

Figura S. 7. Colisión elástica de una partícula contra la pared de un recipiente rígido, siendo Vx
la componente x de la velocidad de dicha partícula.

ferencia de cantidad de movimiento a la pared en el intervalo de tiempo dt es esta canti-


dad por el número de partículas que chocan con la pared durante este período; para par-
tículas cuya componente x de velocidad es Vx, se trata sencillamente del número de
tales partículas dentro de un volumen que se extiende a una distanciad= vxdt detrás
de la pared, o el número por unidad de volumen por vxdt, de donde, vxdt • N(vxXJvxfV.
La transferencia de cantidad de movimiento en el tiempo dt para partículas cuya velo-
cidades quedan dentro del rango dvx alrededor de Vx, entonces, es
La estadística de MaxweU-Boltzmann para un gas ideal 167

o bien,

(5.4-21)

La razón total de transferencia de cantidad de movimiento a las paredes, me-


diante las colisiones en que intervienen partículas con todos los valores posibles de
vx, se puede obtener integrando sobre vx, lo cual da, con ayuda de (5.4-19) y la
tabla 5.1,

dpx-
--
2m NJrn
--
foo V 2 e -mv2xf2kT dV--NkT
--. (5.4-22)
dt V 2nkT 0 x x V

Sin embargo, de acuerdo con la ley de Newton, el cambio en el tiempo de la


cantidad de movimiento por una unidad de área de la pared del recipiente es igual a
la fuerza ejercida sobre una unidad de área de la pared que, por definición, es la
presión P. En consecuencia, la ecuación (5.4-22) se reduce a

PV = NkT, (5.4-23)

que es la ecuación de estado para un gas de Boltzmann de partículas independientes.


La ecuación anterior tiene la misma forma que la ley del gas ideal ya cono-
cida, aunque ésta se suele escribir

PV = nRT, (5.4-24)

en donde n es el número de moles de gas en el sistema y R es una "constante


molar de gas" determinada en forma experimental, que es la misma para todos los
gases "ideales". Si el sistema tiene n moles de gas, el número de partículas estará
dado por N= nNA, en donde NA es el número de Avogadro igual a 6.026 X 10 23
moléculas por mol. En estas condiciones, (5.3-23) toma la forma

PV = nNAkT, (5.4-25)

por lo cual, comparando (5.4-24) con (5.4-25), es obvio que la constante de Boltz-
mann k debe estar dada por

(5.4-26)

de donde, la constante de Boltzmann es la constante de gas por partícula del


sistema. Su valor se puede derivar de NA y R y es igual a 1.380 x lQ-16 ergs/°K, o
bien, 8.615 x 1Q- 5 eV¡oK.
Ahora se ve con claridad que el valor de la constante {3 en la función de
distribución que se supuso en (5.3-27), se escogió correctamente. Si se hubieran
desarrollado los cálculos hasta este punto sin suponer ningún valor para {3, se habría
llegado a la ecuación (5.4-23),

PV = -N/{3, (5.4-27)
168 Mecánictl estadístictl. Generalidades

y, para que esos resultados concuerden con la ley de los gases (5.4-24) establecidos
experimentalmente, habría sido obligatorio escoger

N
-N/P = nRT =NA RT,

o bien,

(5.4-28)

.S ESTADISTICA DE FERMI-DIRAC

En el desarrollo de la función de distribución de Maxwell-Boltzmann, se con-


sidera que las partículas pueden distinguirse; pero en la práctica es imposible distin-
guir un electrón de cualquier otra partícula elemental. Es más, se admitió que un
número cualquiera de partículas ocupara el rniemo estado cuántico del sistema, a
pesar de que muchas de ellas, sobre todo los electrones, obedecen al principio de
exclusión de Pauli, que no permite que un estado cuántico acepte a más de una
partícula. Si estas condiciones adicionales se imponen al sistema, los cálculos de la
sección 5.4 se deben modificar, dando como resultado otra función de distribución
que se conoce como función de distribución de Fermi-Dirac. Esta distribución tiene
una importancia enorme, ya que describe la conducta estadística de los electrones
libres en los metales y los semiconductores; además, muchas propiedades eléctricas y
térmicas de los sólidos que no se pueden comprender en absoluto a la luz de lo
establecido con las estadísticas clásicas, se deducen como una consecuencia directa
de la estadística de Fermi-Dirac.
Si las partículas del sistema no se pueden distinguir, tampoco se pueden iden-
tificar numéricamente, como se supuso cuando se analizaron las diversas posibilidades
ilustradas en la figura 5.2. En realidad, todas las diferentes distribuciones presentadas
en cada hilera de la figura 5.2 que dan Q(N1 ,N2 ) para cualquier valor particular de
N 1 , serían iguales si se eliminaran los números que identifican las partículas, en
cuyo caso el factor (5.3-7) se reduce a la unidad. Sin embargo, en el iésimo nivel
energético se pueden permutar las N; partículas entre los g; estados cuánticos per-
tenecientes a ese nivel, y se puede hacerlo de muchas maneras cada una de las
cuales constituye una forma estadísticamente independiente de lograr un arreglo en
el que N; partículas estén en el iésimo nivel energético del sistema, como se ilustra
en la figura 5.8. El producto de los números posibles de permutaciones de partículas
entre los estados cuánticos sobre todos los niveles energéticos del sistema, da enton-
ces el número de formas independientes de efectuar una distribución dada de partí-
culas entre los niveles de energía.

~f;~:~:!Y~:el 1·1·1·11·1·11 1·1


Estado Núm. 1 2 3 4 5 s 7 9 ,.

Figura 5.8. Una posible distribución de partículas entre los estados cuánticos del iésimo nivel
de energía de un sistema en el que se aplica el principio de exclusión de Pauli.
Estadística de Fermi-Dirac 169

En el caso de Fermi-Dirac, en el que se supone que se aplica el pnncipio de


exclusión de Pauli, se permite que haya, como máximo, una partícula por estado
cuántico. En relación con la figura 5.8, que describe el iésimo nivel de energía del
sistema, existen g¡ formas de seleccionar el punto en el que !>e debe insertar la
primera partícula, g¡ - 1 formas de escoger en donde se inserta la segunda, ya que la
segunda no puede ocupar el mismo estado cuántico que la primera, g¡ - 2 formas de
escoger en donde insertar la tercera, y así sucesivamente. El número total de ma-
neras de acomodar N¡ partículas en el iésimo nivel obtenido sobre esta base, es

g.l
g1(g 1 - l)(g 1 - 2) ... (g 1 - N 1 + 1) = ( . -·~·)' (5.5-1)
g, 1.

No obstante, las partículas no se pueden distinguir entre sí y por tanto, en un


arreglo dado de partículas las N¡! formas de permutadas unas con otras y entre
estados, no se consideran como permutaciones diferentes. Fl número real de formas
independientes de lograr una distribución de N¡ partículas en el iésimo nivel, se obtie-
ne dividiendo (5.5-1) entre N¡! , lo cual da

(5.5-2)
N 1!(g1 - N 1)!

El número total de formas independientes de lograr una distribución de


(N 1 , N 2 , • • • Nn) partículas indistinguibles entre n niveles energéticos, en donde no
se tiene más de una por estado cuántico, es sólo el producto de los factores indi-
viduales de la forma (5.5-2) sobre todos los niveles, es decir,

(5.5-3)

Ahora se procederá a maxlffiJZar el logaritmo de esta cantidad con respecto a


las variables N 1 , N 2 , • • • Nn por el método de los multiplicadores lagrangeanos
utilizados en la sección 5.3. De acuerdo con (5.5-3), se tiene que

In Q1 = L In g1!- L In N1! - L ln(g1 -


i i i
N1)!, (5.5-4)

que, utilizando la aproximación de Stirling (5.3-20) se puede describir

In Q1 = L [g 1 In g1 - N 1 In N 1 - (g 1 - N 1) In(g 1 - N1)]. (5.5-5)


1

Nuevamente, se requiere que el número total de partículas del sistema y su


energía total se mantengan constantes, lo que significa que las ecuaciones (5.3-22) y
l5.3-23) deben aplicarse también en este caso, de donde, se puede escribir, al igual
que antes

(j = 1, 2, ... n), (5.5-6)


170 Mecánica estadística. Generalidades

en donde cp y 1/1 están dados por (5.3-22) y (5.3-23). Al substituir (5.5-5), (5.3-22)
y (5.3-23) en esta ecuación, se obtiene

- a~J ~ N 1 In N1 + ~ (g 1- N 1) ln(g 1 - N 1)] +oc a~i (~ N 1) + pa~i (t e N


1 1) =O.
(5.5-7)

Al desarrollar las derivadas de la sección 5.3, se encontró que

(5.5-8)

o bien, reacomodando, haciendo las exponenciales, y resolviendo para N¡/g¡ =!(e¡),

1
f(e.) = N ·fg · = 11 • (5.5-9)
1 1 1 1 + e " "1

Esta es la función de distribución de Fermi-Dirac.


Al igual que en la sección 5.4, se considerará que el valor de (3 es

p= -1/kT, (5.5-10)

y más adelante se explicará el porqué de este paso. Lo más aceptado es expresar a


como
(X= 8¡/kT, (5.5-11)

en donde e¡ es un parámetro con las dimensiones de la energía que se denomina


energía de Fermi o bien, nivel de Fermi del sistema. Por tanto, la ecuación (5.5-9)
se convierte en

N·= gi (5.5-12)
J 1 + e<•J tt)fkT '

o bien, si se supone que los niveles se juntan formando un continuo, de modo que
g¡(e¡)-+ g(e)de, entonces,

g(e)de
N(e)de = g(e)f(e) de = 1 + e<• •tlikT. (5.5-13)

Para un gas de partículas independientes tales como electrones libres, g(e)de se


representa mediante (5.2-22), al igual que un gas de Maxwell-Boltzmann.
La energía de Fermi e¡ es, en general, una función de la temperatura cuya
forma y dependencia de temperatura depende primordialmente de la densidad de la
función de estados del sistema, al igual que en el caso del parámetro correspon-
diente e" de la distribución Maxwell-Boltzmann. Su valor se determina mediante la
condición (5.3-22) o bien si se trata de un continuo de niveles, por medio de

N = const. = f g(e)de
1 + e<• •tlfkT =
f g(e)f(e)de. (5.5-14)
Estadístico de Fermi-Dirac 171

La integral se toma sobre todas las energías disponibles para las partículas del
sistema. Para un gas de Fermi de partículas independientes, g(e) está dada por
(5.2-22) y e¡ se determina mediante

N= B.j21tVm312 roo Jede


h3 Jo 1 + e<• e¡)/kT.
(5.5-15)

Desgraciadamente, esta integral no se puede evaluar en una forma analítica, de


modo que e¡ no se pueda determinar como una función simple de la temperatura.
Sin embargo, en un gas bidimensional de partículas libres, se puede demostrar, me-
diante los métodos usados para derivar (5.2-22), la función de densidad de estados es

41tmA
g(e)de = """"'h2 de, (5.5-16)

e independiente de la energía (ejercico 3, capítulo 5). En esta fórmula, A representa


el área del "recipiente" bidimensional. Para este sistema, (5.5-14) se convierte en

41tmA roo de
N= -¡¡r- Jo i + e<•-•¡)/kT• (5.5-17)

que se puede evaluar en forma cerrada, haciendo que uno resuelva para e¡ y se
obtiene
e1(T) = kT ln(e•t<O)/kT- 1), (5.5-18)
en donde
Nh 2
e¡(0)=-- (5.5-19)
41tmA

es el valor que ej(1) toma conforme T tiende a cero, como está dado por (5.5-18).
Los detalles del cálculo de este resultado son muy instructivos y quedan asignados
como ejercicio para el lector. La variación de la energía de Fermi del gas bidimen-
sional de partículas independientes se ilustra en la figura 5.9. Se notará en este caso,
que la energía de Fermi es una función monotónica decreciente de la temperatura.
La energía de Fermi para el gas de Fermi tridimensional, con la función de densidad
de estados (5.2-22), presentará el mismo comportamiento general, excepto que en
este caso, la variación de la energía de Fermi con respecto a la temperatura es lineal
cuando los valores de ésta se mantienen razonablemente bajos, en tanto que para el
ejemplo bidimensional, la variación es mucho más compleja a temperaturas bajas.
Para muchos sistemas, incluyendo estos dos, la variación del nivel de Fermi con
respecto a la temperatura es p~queña sobre el rango de temperaturas físicamente
posibles; en la figura 5.9, la temperatura a la que e¡= O sería del orden de
75000°K para un gas de electrones con la densidad de electrones libres correspon-
diente a la del cobre metálico. Por esta razón, en muchas aplicaciones la depen-
dencia de temperatura de la energía de Ferrni se puede desechar o aproximar me-
diante una función lineal u otra apropiada de la temperatura.
La función de distribución de Fermi propiamente dicha,

1
/(e) = 1 + e<•-•,>tkT ' (5.5-20)
172 Mecánica estadística. Generalidades

., (T)

Figura 5.9. Representación esquemática de la variación de la energía de Fermi en función de la


temperatura, en un gas bidimensional de electrones libres, de acuerdo con (5.5-18).

se muestra en la figura 5.10 para varios valores de temperatura. Puesto que sólo
una partícula puede ocupar un estado cuántico dado, el valor de f(e) para una dis-
tribución de Fermi a una energía partícular es justamente igual a la probabilidad
de que un estado cuántico de dicha energía esté ocupado. En el cero absoluto,
como se puede ver fácilmente en la figura 5.10 y por la ecuación (5.5-20), la
función de distribución de Fermi se convierte sencillamente en una función de escalón

f(e) =1 (e< e1 )
(5.5-21)
=O (e> e1 ).

Conforme aumenta la temperatura, los bordes del escalón se redondean y la


función de distribución varía rápidamente desde casi la unidad hasta casi cero sobre
un rango de energía de algunos múltiplos de kT alrededor del valor e = e1. Al
mismo tiempo, el valor de e¡ cambia y la variación ilustrada en la figura 5.10 es
aproximadamente la que se asocia con el gas electrónico tridimensional, cuya den-
sidad de estados está dada por (5.2-22). A temperaturas muy elevadas, la función de

Figura 5.10. Representación esquemática de la función de distribución de Fermi para cuatro


diferentes temperaturas. Obsérvese la variación de la energía de Fermi con la
temperatura. La dependencia de la energía de Fermi en relación a la temperatura,
tal como se muestra aquí, es típica para un gas tridimensional de electrones libres;
pero la variación real en cualquier sistema en particular depende críticamente de
la función de densidad de estados (o nivel de degeneraciones) del sistema.
Estadístictl de Fermi-Dirac 173

distribución pierde su característica de escalón y varía con más lentitud en función


de la energía. De acuerdo con (5.5-20), es evidente que el valor de !(e) a e= e¡ es
sólo l/2, es decir,

(e1 ) =t. (5.5-22)

de donde, un estado cuántico al nivel de Fermi tiene la probabilidad de ocupación


de l/2.
En la figura 5.11 se muestra la distribución real de la densidad de partículas
.V(e) como una función de la energía para un gas de Fermi de partículas indepen-
dientes, dada por (5.5-13) con la función de densidad de estados (5.2-22). Nueva-
mente, en T =O, la curva tiene un carácter escalonado; así la porción para la que
(e< e¡) es la parábola de densidad de estados (5.2-22) y para la que (e> e¡) es
.:ero. Al aumentar la temperatura, este aspecto escalonado se hace cada vez menos
pronunciado, como se ilustra en el dibujo. A temperaturas bajas, cuando la función
de distribución de Fermi es escalonada, se dice que la distribución está sumamente
degenerada.
A temperaturas bajas, la distribución de Fermi-Dirac se puede representar como
una esfera en el espacio de cantidad de movimiento en el que todos o casi todos los
estados cuánticos de energía menor que e1 están llenos, en tanto que todos o la
mayoría de los estados de energía mayores que e1 están vacíos. De acuerdo con
f 5.2-14), la ecuación de la superficie de esta "esfera Fermi" debe ser

Px2 + Py2 + Pz2 = 2 me¡, (5.5-23)

de donde, el radio es ..J2me1 , como se ilustra en la figura 5.12. A temperaturas muy


altas, la superficie de la esfera de Fermi está definida muy deficientemente debido a
la desaparición de bs aspectos escalonados de j(f), y el concepto resulta menos útil.
Entonces, se llega a la conclusión que ta integral (5.5-15) no puede evaluarse
en forma exacta y esto no permite encontrar una expresión simple para la energía
de Fenni de un gas de Fermi tridimensional a todas las temperaturas; sin embargo el
.:arácter simple (5.5-21) que adopta la función en T= O permite evaluar er de un
modo muy sencillo en el cero absoluto. Si se utiliza (5.5-:ll) para representar !(e)
en T =O, se puede volver a escribir (5.5-14) utilizando la función de densidad de
estados (5.2-22) como

N = 8J2nm 312 r•¡(O) Jede = 16j2nm 3 ' 2 [e¡(0)] 3 ' 2


(5.5-24)
V h3 Jo 3h 3

N(.)

Figura 5.11. Representación esquemática de la densidad electrónica como función de la energía


asociada a un gas tridimensional de electrones libres.
174 Mecánica estadística. Generalidades

( r- eje .lal papel l

Figura 5.12. La distribución de Fermi al cero absoluto correspondiente a un gas de electrones


libres, representada, por medio de una esfera de electrones dentro del espacio de
cantidad de movimiento. Esta representación es útil siempre y cuando T<t.Tp.

Resolviendo esta ecuación para ej(O), se obtiene

h2
e¡(O) = - -
(3N)2/3 . (5.5-25)
8m 1rV

De un modo similar, se puede obtener la energía interna de un gas de Fermi


al cero absoluto, siendo el resultado

U0 _ 1th 2 (3N) 3_3N


5'
V- 40m 1rV -5 V e¡(O). (5.5-26)

Los detalles de estos cálculos se omiten, pero se proponen como ejercicio para el
lector.
Para energías mucho mayores que er, e<e-e¡)fkT es mucho mayor que la unidad
y para tales energías, la función de dÍstribución de Fermi-Dirac (5.5-20) se puede
escribir aproximadamente como

(5.5-27)

Si todas las energías disponibles para el sistema satisfacen la condición

e- e1 ~ kT, (5.5-28)

es decir, si e¡ es muchas unidades kT menor que cualquier energía que pueda tener
una partícula perteneciente al sistema, entonces (5.5-27) constituirá una buena apro-
ximación de (5.5-20) para todas las partículas del sistema. Sin embargo, la función
de distribución aproximada (5.5-27) es, sencillamente, la función de distribución de
Maxwell-Boltzmann de (5.4-6) con a= e¡/kT. Entonces, si se conserva la condición
(5.5-28) para todas las partículas del sistema, la distribución Fermi-Dirac y la de
Maxwell-Boltzmann son casi iguales.
Estadística de Fermi-Dirac 175

Para el gas bidimensional de Fermi, donde la energía de Fermi está dada por
(5.5-18), si T es tan grande que kT'> e¡(O), el exponente e¡(O)/kT será pequeño, de
tal manera que el exponencial se puede aproximar mediante 1 + [e¡(O)/kT], dando

e (T) = kT In e¡(O)
1 kT

= (O)[ kT 1 B¡(O)]
81 e1(0) n kT

kT kT]
= -e¡(O) [ e¡(O) In e¡(O) . (5.5-29)

De acuerdo con esto, se advierte que conforme T aumenta, e¡(T)-+- oo. Pues-
to que la energía más baja que puede tener cualquier partícula del sistema es cero,
es evidente que la condición (5.5-28) se satisfará para temperaturas lo suficiente-
mente altas y la función de distribución será aproximadamente la misma que la de
la distribución de Maxwell-Boltzmann a temperaturas muy elevadas. Se puede demos-
trar que el mismo resultado se aplica al caso tridimensional. Estos resultados también
pueden esperarse si se emplea un enfoque físico, ya que a altas temperaturas, las
partículas se distribuyen sobre un rango muy amplio de estados energéticos, y el
número de partículas en cada rango de energías disponibles es tan pequeño que
siempre hay mucho más estados cuánticos disponibles que partículas que puedan
ocuparlos. En estas circunstancias, la probabilidad de que dos o más partículas ocu-
pen el mismo estado cuántico siempre se hace sumamente pequeña de modo que no
importa mucho si la función de distribución obedece al principio de Pauli (distri-
bución Fermi-Dirac) o no lo obedece (distribución Maxwell-Boltzmann). 3 Puesto que
la cantidad e¡(O), que deber ser obligatoriamente mucho menor que kT para que las
dos distribuciones coincidan, es proporcional a la densidad de partículas N/A por
(5.5-19), la reducción de la distribución de Fermi a una reducción de Maxwell-Boltz-
mann se desarrollará a temperaturas más bajas en gases menos densos. Por las mis-
mas razones, de acuerdo con ( 5.5-19), se producirá a temperaturas más bajas en
gases en las que la masa de las partículas m sea grande. Debido a ello, las substan-
cias gaseosas ordinarias a temperaturas normales obedecen a la estadística de Maxwell-
Boltzmann mejor que a la estadística Fermi-Dirac (o Bose-Einstein). Sin embargo,
para un gas denso de partículas muy ligeras, tales como los electrones libres de un
metal, la energía de Fermi al cero absoluto es bastante grande y la condición
(5.5-28) se puede satisfacer para todas las partículas del sistema sólo a temperaturas
tan altas que sean físicamente inalcanzables. Por tanto, cuando se trata de un gas
denso de electrones libres, debe utilizarse la estadística de Fermi-Dirac. No obstante,
en los semiconductores, la forma peculiar de la función de densidad de estados es
tal que la distribución de Maxwell-Boltzmann casi siempre es una aproximación acep-
table de la distribución de Fermi-Dirac o prácticamente igual a ella. Esta situación
se examinará más detalladamente en un capítulo posterior.

3 Se podría alegar que aun en este límite la distribución de Fermi-Dirac debe diferir de la
de Maxwell-Boltzmann en virtud de que no se pueden identificar las partículas. Sin embargo, se
puede demostrar, como se verá en la siguiente sección, que la función de distribución de par-
tículas no distinguibles, que no obedecen el principio de exclusión de Pauli (la distribución
Bose-Einstein), se aproxima a la función de distribución Maxwcii-Boltzmann en este límite. Una
forma más exacta de explicar la situación sería afirmar que, en el límite de altas temperaturas,
la distribución Fermi-Dirac se acerca a la distribución Bose-Einstein que, a su vez, se acerca a la
distribución Maxwell-Boltzmann.
176 Mecánica estadística. Generalidades

Si se hubiera escogido para el multiplicador (3, otro, diferente al dado por


(5.5-10), no se habría encontrado, por lo general, la correspondencia entre los sis-
temas Fermi-Dirac y Maxwell-Boltzrnann en el límite de las temperaturas altas que,
como ya se vio, se puede esperar por razones físicas. Por tanto, se debe llegar a la
conclusión de que el valor de (3 dado por (5.5-10) está físicamente justificado.

5.6 LA DISTRIBUCION HOSE-EINSTEIN

En la sección anterior se demostró que la distribución estadística de Fermi-


Dirac (5.5-20) es la que caracteriza el comportamiento de un conjunto de partículas
no distinguibles que obedecen al principio de exclusión de Pauli. Puesto que no
todas las partículas elementales obedecen el principio de Pauli (siendo la excepción
más conspicua los fotones), es necesario considerar el comportamiento de las partí-
culas no distinguibles, que no obedecen este principio. También en este caso, puesto
que las partículas no están numeradas, el factor ( 5.3-7) se reduce a la unidad y sólo
es necesario considerar las posibles permutaciones de N¡ partículas idénticas entre g¡
estados cuánticos de iésimo nivel energético; pero ahora sin ninguna restricción en lo
que respecta al número de partículas que pueden ocupar cualquier estado cuántico
dado.
Sea un arreglo lineal de N¡ partículas y g¡ - 1 particiones que serían necesarias
para dividir estas partículas en g¡ grupos, como se ilustra en la figura 5.13. No es
difícil ver que el número de formas de permutar las N¡ partículas entre g¡ niveles, es
igual al número de permutaciones independientes de objetos y particiones de la
figura 5.13. Puesto que se tiene un total de N¡+ g¡- 1 partículas más las parti-
ciones, éstas se pueden arreglar linealmente en (N¡+ g¡- 1)! formas; pero puesto
que las permutaciones que se hacen entre las partículas y entre las particiones no
se consideran como acomodos independientes, el número de acomodos se debe di-
vidir entre el número de maneras de permutar las partículas entre ellas mismas (N¡! )
y nuevamente entre el número de maneras de permutar las particiones entre ellas
mismas ((g¡- 1)! ), dando

(N;+ g¡- 1)!


(5.6-1)
N;!(g;- 1)!

formas de realizar una distribución de N¡! partículas no distinguibles entre g¡ esta-


dos que pueden alojar a cualquier número de partículas. Fl número Qb de formas
estadísticamente independientes de lograr una distribución (N 1 , N 2 , • • • Nn) de par-
tículas entre los niveles energéticos del sistema, de acuerdo con estas reglas, es

•• • •• •• •• • ••• •
iésimo nivel de energía: degene.r.ación 9; =9
poblac10n N;= 14

Figura 5.13. Una posible distribución de partículas entre los estados cuánticos del iésimo nivel
< ncr?,ético
de un sistema en el que no se aplica el principio de exclusión de Pauli.
La distribución de Rose-Einstein 177

simplemente el producto de los factores de la forma (5.6-l) sobre todos los niveles
del sistema por lo que

(5.6-2)

Ahora se puede maxlinizar esta cantidad con r~specto a las variables N¡, N 2 : • • •
Nn, utilizando el método de los multiplicadores de Lagrange y de acuerdo con las res-
tricciones (5.3-22) y (5.3-23). Los cálculos no se incluirán aquí; pero se sugiere que
los ejecute el lector como ejercicio. El resultado es
1
(5.6-3)

Esta fórmula se conoce como función de distribución Bose-Einstein. También


ahora se puede identificar (3 como

{3 = -1/kT, (5.6-4)

mientras que a puede determinarse de acuerdo con el número de partículas del


sistema, al igual que se hizo en los casos Maxwell-Boltzmann y Fermi-Dirac. Para el
caso de un continuo de niveles muy poco espaciados entre sí, g¡ ~ g(c)d€ y
N¡~ N(c)dc, lo cual da

(5.6-5)

Para la función de densidad de estados de partículas independientes ( 5.5-16)


correspondiente a un gas bidimensional de partículas libres, el parámetro a se puede
calcular explícitamente en la misma forma que e¡ para este sistema, de acuerdo con
la estadística Fermi-Dirac. Se puede demostrar entonces que conforme T se incre-
menta, a~- oo, en cuyo caso el factor exponencial del denominador de (5.6-5) se
hace mucho mayor que la unidad y la distribución Bose-Einstein (5.6-5) tiende a

(5.6-6)

que es una función de distribución del tipo de Maxwell-Boltzmann. Se puede obte-


ner el mismo comportamiento general para un gas de Base-Einstein tridimensional de
partículas independientes, aunque en este caso no es posible obtener una expresión
para a en forma exacta.
En el límite de las temperaturas muy altas, las partículas del sistema se distri-
buyen sobre un rango muy amplio de energía, y el número de partículas en cada
rango de energía disponible será mucho más pequeño que el número de estados
cuánticos de dicho rango, de donde, para todos los estados g¡ :>N¡. En esta situa-
ción, se puede escribir, aproximadamente,

(N; + g¡ - 1)! ~ N;
(g¡-1)! =g¡, (5.6-7)

de donde, (5.6-2) se convierte en

(5.6-8)
178 Mecánica estadística. Generalidades

Cabe notar que esto, aparte de un factor constante N! , es igual a


Q(N 1 , N 2 , • • • Nn) como está dado por (5.3-8) para un sistema Maxwell-Holtzmann.
Entonces, desde un punto de vista puramente físico se debe esperar que las distri-
buciones Hose-Einstein y Maxwell-Holtzmann coincidan en el límite de altas tempe-
raturas. La selección del valor dado por (5.6-4) para (j está entonces justificado, ya
que esta selección, como se vio antes, lleva directamente a la correspondencia entre
la estadística Hose-Einstein y Maxwell-Boltzmann indicada por (5.6-6).
En el caso de los gases bidimensional y tridimensional de partículas indepen-
dientes de Hose-Einstein, conforme la temperatura se acerca a cero, el valor de a
tiende a cero y el resultado es que todas las partículas del sistema tienden a conden-
sarse en el estado energético más bajo del sistema al cero absoluto. Este fenómeno,
denominado condensación de Hose, es característico de los sistemas que obedecen la
estadística de Bose-Einstein.
En algunas aplicaciones, conviene obtener la función de distribución Base-
Einstein, sin establecer la restricción de que el número de partículas del sistema sea
constante. De acuerdo con (5.3-15) y (5.3-16), se puede ver que este resultado se
puede obtener de (5.6-5), si se supone que a es idéntica a cero. En este caso,
(5.6-5) se reduce a

1
f(e) = e/kT · (5.6-9)
e - 1

EJERCICIOS
l. Demuestre que el frente de onda asociado con la onda plana 'Ir= ei(k•r-wt) avanza en
la dirección k.
2. Demuestre, para la partícula libre en tres dimensiones cuya función de onda está dada
por (5.2-7), que el valor esperado de la cantidad de movimiento vectorial p es igual a hlc, y que
p (y, por ende, k) es una constante del movimiento.
3. Calcule la densidad del factor de estados g(e)de para un sistema bidimensional de partí-
culas libres, en el que no hay otras interacciones que colisiones instantáneas y que está conte-
nido en un recipiente rígido de superficie A y de dimensiones x 0 y y 0 . Comience con la ecuación
de SchrOdinger.
4. Suponga que se lanzan simultáneamente cuatro monedas, ¿cuáles son las probabilidades
asociadas con las distribuciones (0 águila, 4 sol), (1 águila, 3 sol) ... (4 águila, O sol)?
5. Encuentre las dimensiones y la superficie del rectángulo de área máxima con lados
paralelos a los ejes de las coordenadas, que se puede inscribir dentro de una elipse cuyo eje
mayor es 2a y cuyo eje menor es 2b. Los ejes de la elipse pueden considerarse paralelos con los
ejes de las coordenadas. Emplee el método de los multiplicadores de Lagrange.
6. Encuentre la velocidad de raíz cuadrada media y la velocidad más probable de una
partícula en un gas ideal de Boltzmann.
7. Demuestre que el flujo de partículas en un gas ideal de Boltzmann, cuyas componentes
x de velocidad son positivas, por unidad de área sobrt> un plano normal al eje x es -!Nc7V.
Nota: el flujo o densidad de corriente se define como el número de partículas por unidad de
volumen por su componente de velocidad a lo largo de la normal al plano sobre el que se
observa el flujo.
8. Demuestre que la energía de Fermi de un gas de Fermi bidimensional de partículas
libres cuya función de densidad de estados está dada por el resultado del ejercicio 3, es ej{T) =
kTin(eEj{O)fkT- 1), en donde et{O) =Nh2f(4rrmA)
9. Calcule la energía de Fermi, en electrón-volts, para los electrones libres en el cobre al
cero absoluto, suponiendo que hay un electrón libre por átomo de cobre. Indique la temperatura
a la que kT será igual a ef.O).
10. Demuestre que la energía interna por unidad de volumen de un gas de Fermi de
partículas libres al cero absoluto es ~!!.. ej(O).
5 V
11. Demuestre por el método de los multiplicadores lagrangeanos, que si Q(N ¡, N 2 , • • • Nn)
está dada por la ecuación (5 .6-2), la función de distribución correspondiente a los valores más pro-
bables dé N •· N2, • • • Nn, está dada por (5.6-3).
La distribución de Rose-Einstein 179

12. Use la función de densidad de estados calculada en el ejercicio 3 para demostrar que
d parámetro a de un gas de Bose-Einstein bidimensional de partículas libres está dado por
IX= )n(l _ e-h2N/(2nAmkT)).

Analice las propiedades de la función de distribución resultante para T--'>- oo y para T-+ O.

LECTURAS RECOMENDADAS

W. Band, An Introduction to Quantum Statistics, D. Van Nostrand, Princeton, N. J. (1955).


R. W. Gurney, Introduction to Statistical Mechanics, McGraw-Hill Book Co., lnc., Nueva York
(1949).
D. ter Haar, Elements of Statistical Mechanics, Holt, Rinehart and Winston, lnc., Nueva York
(1954).
R. B. Lindsay, Introduction to Physical Statistics, John Wiley and Sons, Nueva York (1941).
J. E. Mayer y Maria Gi:ippert-Mayer, Statistical Mechanics, John Wiley and Sons, Nueva York
(1940).
R. C. Tolman, The Principies of Statistical Mechanics. Oxford University Press, Londres (1938).
CAPITULO 6
Vibraciones reticulares y
propiedades térmicas de los cristales

6.1 CALCULOS CLASICOS DEL CALOR ESPECIFICO RETICULAR

En la sección 4.4 se delinearon algunos de los problemas que se presentan


cuando se calcula el calor especifico de un cristal, suponiendo que los átomos de
dicho cristal se comportan como osciladores armónicos clásicos independientes. Aho-
ra se examinarán estos problemas detalladamente y se estudiará la forma en que se
pueden resolver, usando los resultados obtenidos en los capítulos 3-5, relacionando
la dinámica reticular, la mecánica cuántica y la mecánica estadística. En todas estas
investigaciones se tratará de un cristal compuesto de N átomos, que se mantienen
unidos en un arreglo periódico. Se supone que estos átomos sólo pueden vibrar
alrededor de sus posiciones de equilibrio ya que están sometidos a fuerzas restrictivas
que, en una primera aproximación, obedecen a la ley de Hooke. También se supone
que no hay electrones libres, como se encontrarían en un metal, y que toda la
capacidad calorífica del cristal se debe a las vibraciones de la red producidas por
excitación térmica. Cuando hay electrones libres, también, se puede lograr que se
muevan excitándolos por medio de una fuente calorífica externa y, entonces, su
movimiento ocasiona un aumento en el calor específico observado; esto se estudiará
en un capítulo posterior.
El cálculo clásico supone que cada átomo es un oscilador armónico clásico
tridimensional que vibra independientemente de todos los demás átomos del cristal.
En estas circunstancias, se puede calcular la energía térmica interna total del cristal
determinando la energía promedio de un solo oscilador y multiplicando el resultado
por N. Para un solo oscilador armónico isotiópico tridimensional, la energía total es
p2
e=-+ V(r) (6.1-1)
2m
siendo
(6.1-2)

en donde m es la masa y w 0 la frecuencia natural del oscilador. Si se supone que la


distribución de los osciladores por energía obedece a la ley de distribución Maxwell-
Boltzmann, la función de distribución que expresa la probabilidad de que un osci-
lador tenga una energía dada E es
pl mwo2r2

f(c.) = Ae-•lkT = Ae- 2mkT e- 2fT= f(p,q) (6.1-3)

181
182 Vibraciones reticulares y propiedades térmicas de los cristales

en donde A es una constante. De acuerdo con (5.2-4), la energía promedio está


dada por

(6.1-4)

En este caso se prefirió usar coordenadas esféricas (r, e, cf>) para el espacio de
las coordenadas y (p, eP, cf>p) para el espacio de la cantidad de movimiento, para
fines de integración la cual, por supuesto, debe hacerse sobre todo el espacio de
fase. Puesto que el integrando no tiene dependencia en relación de e, p, ep, o 'cf>p la
integración sobre estas variables se puede desarrollar de un modo muy sencillo,
dando un factor de 41T tanto al numerador como al denominador, y dejando

_1_foo p4e- 2~~T dp m;~ foo r4e- m~~~z dr


2m o (~ ) + (~"p) • (6 1 5)
(e) = foo pZ + foo o mm >rZ 0
-
- "k • -
p2e2mkT dp r2e 2kT dr
o o

En el primer término de (6.1-5), cada doble integral de (6.1-4) se ha expresado


como un producto de una integral p y otra integral r; las integrales r del numerador
y el denominador son iguales y se anulan, dando el primer término de la expresión
antes presentada. El segundo término se maneja en la misma forma; pero en este
caso las integrales de p del numerador y el denominador son las que se cancelan. Es
evidente que el primer término de la expresión anterior representa la energía cinética
promedio y el segundo la energía potencial promedio. Al evaluar las integrales con la
ayuda de la tabla 5.1, se encuentra que

(6.1-6)

Para un conjunto de N oscilaciones independientes, la energía interna total U


es, sencillamente,

U= N(e) = 3NkT, (6.1-7)

y la capacidad térmica Cv es, por definición,

Cv = (8Uf8T)v = 3Nk. (6.1-8)

El calor específico es la capacidad calorífica por gramo (o por unidad de


volumen). La capacidad calorífica es una constante independiente de la temperatura.
Para un mol de cualquier substancia, N es igual al número de Avogrado Na y la
capacidad calorífica molar Cvm está dada por

(6.1-9)

Este resultado se conoce como la ley de Dulong y Petit, y los alumnos que
han estudiado química elemental están familiarizados con ella ya que es la base de
una forma rudimentaria de estimar el peso atómico de un elemento desconocido. La
Teoría de Einstein sobre el calor específico 183

Cvm

~i"!'O:....__~I0'-0---2-'0-0---30-'--0---4.L.OO--- T ("K)

Figura 6.1. Capacidad térmica de una substancia sólida típica graficada como una función de la
temperatura.

ley de Dulong y Petit concuerda totalmente con los resultados experimentales obte-
nidos con la mayoría de las substancias a la temperatura ambiente y por encima de
ella; pero conduce a errores notables a temperaturas bajas. En el rango de tempera-
turas bajas, el calor específico de todas las substancias tiende a cero siendo propor-
cional a P conforme T se acerca a cero, como se ilustra en la figura 6.1.

6.2 TEORIA DE EINSTEIN SOBRE EL CALOR ESPECIFICO

Einstein investigó las discrepancias en la teoría clásica del calor específico y,


en 1911, logró explicar cualitativamente el calor específico (por lo menos en su
forma observada y desde un punto de vista experimental) como una función de la
temperatura. En la teoría de Einstein, los átomos se consideraban nuevamente como
osciladores armónicos independientes e idénticos con una sola frecuencia de vibración
natural w 0 , pero se toman como osciladores cuánticos armónicos que pueden tener
sólo valores discretos de energía 1 tales que

(n = 0,1,2, · · · ), (6.2-1)

como está dado por ( 4.12-27). Se puede considerar que los osciladores tienen una
distribución de energía del tipo Maxwell-Boltzmann, ya que forman un conjunto de
sistemas que son distinguibles o identificables en virtud de su ubicación en puntos
separados y distintos de la red, y puesto que cualquier número de osciladores puede
estar en cualquier estado cuántico del sistema. Por tanto, aunque los átomos son
osciladores cuantizados, la distribución clásica de Maxwell-Boltzmann sigue siendo la
más apropiada para describir su comportamiento estadístico. Por otro lado, los verda-
deros cuantos de energía vibratoria que absorben o emiten los osciladores, no son
entidades distinguibles y, por tanto, la estadística de Bese-Einstein se debe utilizar

1 Por supuesto, Einstein utilizó el resultado de Planck En = nl'k.u más bien que el resultado
de la mecánica ondulatoria que se da en (6.2-l) para los niveles de energía de un oscilador
armónico. Si se usa el resultado original de Planck, la expresión final de la energía interna y el
calor específico que se obtienen difieren de los resultados aquí derivados, ~ólo en la <lll~encia de
una contribución energética de punto cero independiente de la tl'mpcratura a la energía interna
184 Vibraciones reticulares y propiedades térmicas de los cristales

para describir su comportamiento estadístico. Como se verá más tarde, se pueden


obtener los mismos resultados analizando las propiedades del sistema de osciladores de
acuerdo con la estadística Maxwell-Boltzmann, o bien manejando la dinámica de los
cuantos de energía vibratoria por medio de la estadística de Bose-Einstein.
Para mayor simplicidad, se supondrá que el cristal contiene 3N osciladores
armónicos unidimensionales cuyos niveles de energía están dados por (6.2-l), en
lugar de N osciladores isotrópicos tridimensionales. Esta suposición se justifica, ya
que existen tres grados de libertad de vibración independiente relacionados con cada
átomo del cristal y que, de acuerdo con el principio de equipartición, la energía
vibratoria disponible se distribuye de un modo equitativo, en promedio, entre estos
tres grados de libertad. Si la energía se distribuye entre los osciladores de acuerdo
con la ley de Boltzmann, el número de osciladores a la energía e es proporcional a
e- efKT y la energía promedio es

(6.2-2)
¿ e<n+t)x
n

en donde
x = -liw0 /kT. (6.2-3)

Sin embargo, la ecuación 6.2-2 se puede escribir como

(6.2-4)
La energía interna se obtiene multiplicando la energía promedio por oscilador,
por el número de osciladores, como antes, de donde,

3Niiw 0 3Niiw 0
U= 3N(e) = --2- + eftwa/kT- 1 (6.2-5)

e = (-aaTu_)
V V
= 3 N k (-liw_o) 2 ---;:--e~=Wo,...lk_T--::
kT (eftwo/kT- 1)2. (6.2-6)

Este resultado se puede expresar en una forma algo más s~ncilla definiendo
una "temperatura de Einstein" 8¡.; tal que

liw 0 = k0E. (6.2-7)


Al substituir k8E en lugar de hw 0 en (6.2-6), se tiene que

(6.2-8)
Teoría de Einstein sobre el calor específico 185

Para temperaturas lo suficientemente altas para que T~ eE, e0 EIT:::: 1; utili-


zando la expansión de series de potencias para la exponencial y reteniendo sólo los
términos de primer orden, se puede ver fácilmente que en este límite, Cv se acerca
al resultado clásico 3Nk. Para temperaturas bajas (T <1!; SE), e0 EIT ~ 1 y (6.2-8) se
puede aproximar mediante

(6.2-9)

.:¡ue se acerca a cero conforme T tiende a cero, aunque no concuerda con el com-
portamiento T3 observado a temperaturas bajas. El primer término de (6.2-5) repre-
senta la parte de energía interna del sistema que corresponde a la energía de punto
~ero de los osciladores. Puesto que es independiente de la temperatura, no hace
\·ariar el valor del calor e~pecífico.
Físicamente, la razón de que el calor específico se haga tan pequeño a tempe-
raturas bajas se puede entender suponiendo que el cristal se coloca de tal modo
que hace contacto con un baño térmico externo compuesto de un gas monoató-
mico ideal a una temperatura dada y se deja que absorba energía de los átomos del gas
ideal. La energía promedio de los átomos del gas es 3/2kT y si la temperatura del
sistema es lo suficientemente alta, de tal modo que kT sea por lo menos del orden
de la energía líw 0 requerida para excitar uno de los átomos vibrantes del cristal a
un estado energético más alto, tales excitaciones ocurrirán frecuentemente, al chocar
~on el cristal los átomos del gas del baño térmico. Entonces, estas colisiones serán
inelásticas en el sentido mecánico y la energía que inicialmente pertenecía a los
átomos del gas se transferirá con facilidad a la red cristalina como energía de
\"ibración. Por otro lado, a temperaturas lo suficientemente bajas, kT será mucho
más pequeña que la energía de excitación líw 0 , y sólo un átomo ocasional de gas
que tenga una energía mucho mayor que la promedio podrá producir una excitación
de esta índole y, por tanto, transferir calor a la red cristalina. Luego, el cristal tiene
relativamente poca capacidad para absorber calor de su ambiente y un cambio unita-
rio de temperatura en el ambiente sólo ocasiona la transferencia al cristal de una
cantidad de calor muy pequeña, en comparación con la que se puede transferir en con-
niciones similares a temperaturas más altas. Conforme la temperatura se acerca al cero
absoluto, la fracción de átomos del baño térmico que poseen la mínima energía de ex-
citación hw 0 tiende a cero, y en consecuencia, también lo hace el calor específico.
La temperatura de Einstein SE = líw 0 /k se puede calcular fácilmente si se
conoce w 0 . Esta frecuencia natural de vibración se puede calcular a partir de la
masa atómica y las constantes elásticas observadas del cristai.2 Para muchos elemen-
tos metálicos, el valor calculado de esta manera es del orden de 100-200°K y, por
ende, la transición del comportamiento a bajas temperaturas al de altas temperaturas
debe ocurrir en este rango de temperaturas. Experimentalmente, se ha encontrado
que la teoría de Einstein satisface las observaciones en todas las temperaturas, excep-
to las bajas, en donde el comportamiento de T3 observado no se puede obtener. Por
lo general, los valores calculados de SE y los que se obtienen aplicando la expresión
teórica (6.2-8) a datos observados, también concuerdan con bastante exactitud. Evi-
dentemente, la teoría de Einstein proporcionó una explicación mucho mejor de los
datos experimentales que la teoría clásica, a pesar de que la coincidencia con la
experiencia no es perfecta. La teoría de Debye, de 1912, permitió eliminar la discre-
pancia entre la teoría y Jos resultados experimentales a baja temperatura y mejoró la
aceptación general de Jos datos experimentales. En la teoría de Debye, se toman en

2 Véase el capítulo 3, ejercicio 6.


186 Vibraciones reticulares y propiedades térmicas de los cristales

cuenta las interacciones entre los átomos que dan como resultado que exista un
rango de valores posibles de frecuencia vibratoria en lugar de un solo valor Wo,
como se describió en el capítulo 3.

6.3 TEORIA DE DEBYE SOBRE EL CALOR ESPECIFICO

La teoría de Debye sobre el calor específico, primeramente propuesta en


1912, 3 consideraba a los átomos de los cristales como osciladores que están acopla-
dos y que pueden propagar ondas elásticas cuya frecuencia varíe sobre un amplio
rango de valores, como lo predicen los cálculos del capítulo 3. Aunque todavía se
obtienen algunos resultados que son aproximaciones, se encontró que eran superior
al modelo de Einstein en lo que respecta a las predicciones sobre el calor específico
de substancias en la región de temperaturas bajas. Además, proporcionó una base
para varias investigaciones subsecuentes más detalladas.
Puesto que de acuerdo con lo anterior, los átomos del cristal no vibran inde-
pendientemente unos de otros, es más conveniente trabajar con los modos normales
de vibración del sistema, que con el movimiento vibratorio de un solo átomo. Ya se
vio (en la sección 3.3 y el ejercicio 7, capítulo 3), que para una cadena lineal
unidimensional de N átomos, existen esencialmente N modos normales de vibración.
En el caso de un cristal tridimensional de N átomos, cada átomo puede vibrar
independientemente a lo largo de las tres direcciones de las coordenadas, de manera
que, para este sistema, se tienen 3N modos normales posibles. Puesto que cualquier
movimiento vibratorio del sistema se puede considerar como una superposición de
vibraciones independientes de modo normal, los modos normales se pueden tomar
como oscilaciones armónicas independientes cuyos niveles de energía permisibles es-
tán dados por (6.2-1) y cuya energía promedio está dada por (6.2-4), a condición de
que el número de modos normales excitados estén distribuidos en cuanto a energía
de acuerdo con la ley de distribución de Maxwell-Boltzmann.
Supóngase ahora que en un rango de frecuencia dw alrededor de la frecuencia
w, existen g( w) dw modos normales de vibración del cristal. En consecuencia, la
cantidad g(w) debe representar el número de modos normales por unidad de fre-
cuencia a la frecuencia w. El aumento de la energía vibratoria interna del cristal,
producido por estos modos de vibración, está dada por

dU = (e(w))g(w) dw (6.3-1)

en donde (e(w)) es la energía promedio de un modo de vibración de frecuencia w,


según lo establece la fórmula (6.2-4). Es más conveniente calcular el número de
modos normales g(k) dk en un intervalo dk alrededor del número de onda k, y,
puesto que dk = (dk/dw)dw (6.3-1) se puede escribir como

dk
dU = (e(w(k)))g(k) dk = (e(w))g(k)- dw. (6.3-2)
dw

Para calcular g(k), sea un cristal rectangular cuyas dimensiones son (Lx, Ly, Lz)
y supóngase que el origen se encuentra en un vértice del cristal, y que los bordes
del cristal coinciden con los ejes + x, +y y + z. Las ecuaciones de movimiento de

~ P lkhyc, Ann. Physik 39, 789 (1912).


Teoría de Debye sobre el calor específico 187

la amplitud mecánica vibratoria u(x, y, z, t), conduce entonces a soluciones vibra-


torias de la forma

(6.3-3)
Si a la expresión (6.3-3) se aplican las condiciones periódicas de frontera de la
forma

u(L",y,z,t) = u(O,y,z,t)

u(x,L,,z,t) = u(x,O,z,t) (6.3-4)

u(x,y,L.,t) = u(x,y,O,t)

k" = 21tnxf L"

k,= 21tn,JL, (6.3-5)

en donde nx, ny, nz son enteros positivos o negativos. Los valores permisibles
(kx, ky, kz), a los cuales corresponde un solo modo normal de vibración que satis-
facen las condiciones periódicas de frontera, se pueden graficar como puntos en un
espacio k ortogonal, como el que se ilustra en la figura 6.2. Los modos normales
permisibles forman una red ortorrómbica simple en este espacio, siendo las dimen-
siones de la célula unitaria (2rr/Lx, 2rr/Ly, 2rr/Lz).

Figura 6.2. Superficies esféricas corre~pondientes a valores constantes de la constante de pro-


pagación k Y k +dk, graficadas en un sistema de coordenadas (kx, k y, kz)·

Si las dimensiones del cristal Lx, Ly, Lz son lo suficientemente grandes, la


célula unitaria se hará pequeña y los puntos que representan los modos normales
permisibles se amontonarán en un modo muy semejante al diagrama que aparece en
188 Vibraciones reticulares y propiedades térmicas de los cristales

la figura 6.2. En este caso, se puede calcular g(k) dk, evaluando el volumen del
espacio k entre la superficie esférica de radio k

(6.3-6)

que es el lugar geométrico de todos los puntos correspondientes al número de onda


k, y otra superficie esférica de radio k + dk, que es el lugar geométrico de todos los
puntos cuyo número de onda es k+ dk. El volumen requerido es, sencillamente, el
comprendido entre las dos esferas de la figura 6.2 o 47Tk 2 dk. El número de modos
normales permisibles se obtiene dividiendo esta cantidad entre el volumen de la
célula unitaria correspondiente a un solo modo normal del sistema. Este volumen es
87T 3 f(LxLyLz) = 87T 3 /V, en donde V es el volumen del cristal. Este procedimiento da
como resultado el valor
k2V
g(k) dk = -2 dk.
2n

Sin embargo, existen en realidad tres modos normales independientes para cada
punto permisible en el espacio k, uno correspondiente a una vibración longitudinal
(que ya se vio antes) y los otros dos que corresponden a dos vibraciones transver-
sales mutuamente ortogonales que, hasta ahora, no se han considerado en este aná-
lisis. Para tomar en cuenta esas posibilidades, el lado derecho de la ecuación anterior
debe multiplicarse por un factor de 3, lo cual da finalmente

3k 2 V
g(k) dk = - - 2 dk. (6.3-7)
2n

En este punto, se desearía utilizar alguna relación como la (3.3-7) que expresa
la variación de k como una función de w para una red monoatómica, encontrando
dk/dw y substituyendo los resultados junto con (6.3-7) y (6.2-4) en (6.3-2), e
integrando finalmente sobre w. Born y von Karman, 4 fueron los primeros en deli-
near este procedimiento. Desafortunadamente, la forma matemática de la ecuación es
tal que la expresión resultante es demasiado compleja y no se puede integrar en
forma cerrada o manejarse numéricamente de un modo conveniente. Para contrarres-
tar esta dificultad, Debye aproximó la función sinusoidal (3.3-7) escribiéndola como
una función lineal:
w(k) = v0 k (6.3-8)
en donde v0 es una velocidad de fase (constante) la cual, en principio, es igual a la
velocidad del sonido de onda larga en el cristal. En realidad esto es, lo que indica (3.3-7)
con respecto a longitudes de onda lo suficientemente grandes para satisfacer la con-
dición ka~ 1T, pero Debye utilizó la función para describir el comportamiento de
todas las vibraciones que se pueden propagar dentro del cristal.
La integración sobre w indicada en (6.3-2) se realiza entre los límites cero y
una frecuencia máxima Wm que se escoge de tal forma que el número total de
modos normales de frecuencia menores que Wm deben ser justamente 3N, ya que se
sabe que éste es el número real de modos normales que existen para un cristal de N
átomos. 5 Existe un número de onda km correspondiente a Wm y todos los modos

4 M. Born T. von KJrman, Physikalische /eitschrift U, 297 (1912).


5 Si hubiera sido posible usar una exprc~ión exacta para relacionar
w y k, la integración se
habría desarrollado dentro de los límites de la primera zoua de Brillouin. Esto habría garanti-
!.ado que se hubiera satisfecho automáticamente la condición de que el número total de modos
fu <'SC igual a 3N
Teoría de Debye sobre el color específico 189

nonnales para los que k< km tienen frecuencias w < Wm, de acuerdo con (3.3-7) o
(6.3-8). Por tanto, debe haber solamente 3N modos nonnales de oscilación dentro de
una esfera de radio km en el espacio k. Puesto que el volumen del espacio k
ocupado por un solo modo normal es 81r 3 /3 V, se puede escribir

4 8n 3
-nk 3 = 3N · -
3 "' 3V
o bien
(6.3-9)

por lo cual, utilizando la aproximación de Debye (6.3-8),

W 111 = Vokm = v0 (6Nn 2 /V) 113 • (6.3-10)

La variación de w en función de k, de acuerdo con la aproximación de Debye,


se ilustra y se compara con el valor dado por (3.3-7) en la figura 6.3. En (6.3-10)

"'

Figura 6.3. La verdadera relación de dispersión (curva continua) y la relación de dispersión


(curva punteada) de acuerdo con la aproximación de Debye.

se supone que la velocidad v0 es la misma para ondas elásticas longitudinales y


transversales. Por lo general, esto no es cierto; pero la diferencia no es siempre lo
suficientemente grande para que afecte el resultado final de un modo significativo.
Si ahora se substituye (6.2-4) y (6.3-7) en (6.3-2), utilizando (6.3-8) siempre
que sea necesario expresar k en función de w, e integrando desde cero hasta Wm, se
obtiene

(6.3-11)

La integral del primer término anterior se evalúa fácilmente y origina en el


punto cero un aumento de la energía interna el cual, por otra parte, es indepen-
diente de la temperatura y no modifica en nada el calor específico. La integral del
segundo ténnino no se puede evaluar en fonna exacta; pero se solucionará numérica-
mente.
190 Vibraciones reticulares y propiedades térmicas de los cristales

Por lo general, se acostumbra expresar estos resultados en una forma algo


diferente. Si se hace que

x = hwfkT, (6.3-12)

liv (6Nn
= liwm /kT = ~
2 113

kT -V-
)
x (6.3-13)
m

(6.3-14)

entonces, (6.3-12) se puede escribir en la forma

8
9
U=-Nk0+9NkT 0
"
(T) 3 fa¡T x 3 dx
-x-·
e-1
(6.3-15)
0

Como se puede ver, el parámetro e tiene las dimensiones de la temperatura y


desempeña el papel de una temperatura característica en ( 6.3-15) más o menos en la
misma forma que lo hace la temperatura de Einstein en (6.2-8). e se conoce gene-
ralmente como la temperatura de Debye. Por supuesto, es independiente de la tem-
peratura, excepción hecha de la ligera variación de temperatura introducida por el
cambio de V y de v0 al cambiar la temperatura.
Al derivar (6.3-11), con respecto a la temperatura, se puede determinar la
capacidad térmica y se demuestra fácilmente que el resultado es

- 31i2V f"'m w4e~"'/kT dw -


Cv- 2n2v~kT2 o (e~"'/kT- 1)2- 9Nk 0
(T)3 fa¡T x4ex dx
o (ex- 1)2.
(6.3-16)

La integral de (6.3-16), que es una función exclusiva de e¡T, se puede evaluar


de un modo númerico dando una función cuya gráfica se ilustra en la figura 6.4.
A altas temperaturas T~ e y el término exponencial de la expresión central de
(6.3-16) se pueden ampliar al igual que se hizo en relación con (6.2-8), obteniéndose
una expresión que se puede integrar fácilmente; a continuación, usando (6.3-10) se
puede demostrar que se obtiene el resultado clásico eV = 3Nk. A bajas temperaturas,

3Nit
v
~------------------

~~0~-----0~5--------~----~15-------2~0 ~8

Figura 6.4. La capacidad térmica de un sólido monoatómico aislador, de acuerdo con la teoría
de Debye, graficada en función de la variable de temperatura reducida T/e.
Teoría de Debye sobre el color específico 191

en la expreswn del lado derecho de ( 6.3-15), el límite de la integral se acerca a


infinito y, por los métodos de integración de contorno, se puede demostrar que la
integral definida resultan te es igual a rr4 115, dando

(au)
oT
=e = 12n Nk(!.)
V Vs e
4 3
(T ~E>). (6.3-17)

Esto se conoce como la "Ley 'J'3 de Debye" y sus predicciones sobre los
calores específicos en la región de temperaturas bajas concuerdan aceptablemente con
los datos experimentales obtenidos con muchas substancias.
El valor de la temperatura de Debye se puede calcular a partir de (6.3-14), u
obtenerse experimentalmente seleccionando el valor de e con el que se obtenga la
mayor concordancia entre los datos experimentales y la expresión teórica (6.3-16).
Los valores calculados y los determinados de un modo experimental están casi siem-
pre de acuerdo en el caso de substancias que obedecen las suposiciones hechas de
acuerdo con la teoría de Debye. Para los elementos metálicos más comunes, la
temperatura de Debye se registra generalmente en el rango de 150-450° K. Seitz 6
presenta una tabla de temperaturas de Debye y un análisis detallado de la concor-
dancia entre los valores de la temperatura de Debye, calculados y determinados de
un modo experimental.
En un cristal, en el que los átomos no son todos idénticos, por ejemplo, el
NaCl, se pueden excitar vibraciones elásticas pertenecientes a modos ópticos o acús-
ticos, y los resultados calculados mediante este procedimiento ya no se pueden
aplicar directamente en los cristales de este tipo. Sin embargo, los modos acústicos y
los ópticos se pueden utilizar por separado. Los modos acústicos se pueden manejar
mediante el procedimiento anterior, mientras que la variación de w con k para los
modos ópticos es, como lo ilustra por ejemplo la figura 3.11, tan pequeña, que gene-
ralmente se obtiene una aproximación bastante buena al considerar los modos óp-
ticos como vibracione3 de una sola frecuencia dada por (3.4-10). Los modos ópti-
cos se pueden tratar mediante el método de Einstein, desarrollado en la sección
anterior y los valores aportados por los modos óptico y acústico se combinan para
dar la capacidad calorífica total del cristal. Blanckman, 7 • 8 estudió con cierto detalle
éstas y otras modificaciones de la teoría primitiva de Debye, y llegó a la conclusión
de que en ciertos casos específicos, el procedimiento de Debye puede llevar a errores
notables y que en tales circunstancias, es mejor usar el procedimiento más exacto de
Born-von Karman.
Se suele pensar que una substancia metálica posee un gran número de elec-
trones libres que pueden servir para producir en el metal un flujo de corriente al
aplicarle un campo eléctrico, lo cual explica la gran conductividad eléctrica de los
metales. Tomando esto como base, se podría esperar que los electrones libres adqui-
rirían una energía cinética adicional cuando el cristal está cerca de una fuente
térmica externa y que debido a ello habría un aumento notable en el calor especí-
fico. En realidad, y contrario a lo esperado, este aumento es tan pequeño que se
puede pasar por alto a temperaturas mayores de aproximadamente 5° K. Por debajo
de esta temperatura, en los cristales metálicos se puede distinguir una variación lineal
del calor específico con respecto a la temperatura, que se debe efectivamente a los
electrones libres. La explicación de este comportamiento peculiar del calor específico
electrónico se dará en el análisis detallado que hace en el capítulo siguiente.

6 F. Seitz, Modern Theory o{ Solids, McGraw-Hill Book Co., Inc., Nueva York (1940),
páginas 110-111.
7 M. B1ackman, Z. Physik 86, 421 (1933).
8 M. Blackman, Proc. Roy. Soc. 148, 384 (1935); 159, 416 (1937).
192 Vibraciones reticulares y propiedades térmicas de los cristales

6.4 EL FONON

Hasta ahora el calor específico de materiales sólidos se ha estudiado en rela-


cwn con osciladores armónicos cuánticos y la energía interna se ha calculado deter-
minando el número de osciladores que hay en promedio en cada estado energético
permisible. Si las vibraciones de la red se pueden tratar de este modo, entonces
deben existir cuantos de energía vibratoria emitidos o absorbidos cuando ocurran
transiciones entre un estado cuántico y otro. Uno de los resultados de la mecánica
cuántica del oscilador armónico es que, a una aproximación de primer orden, las
transiciones ocurren sólo entre estados adyacentes del sistema;9 en otras palabras, en
tales transiciones, el número cuántico del oscilador puede cambiar sólo por ± l. De
acuerdo con esto, el cambio de energía ~E del oscilador correspondiente a la energía
del cuanto que se absorbe o emite, debe ser

~e = ~n · ñw = ± ñw (6.4-1)
en donde w es la frecuencia del oscilador. El signo más de ( 6.4-1) se relaciona con
la absorción y el signo menos con la emisión.
Un cuanto de energía acústica de esta índole se denomina comúnmente fonón,
para guardar cierta analogía con el término fotón usado para un cuanto de energía
electromagnética. Un fonón se parece al fotón en que se debe considerar como algo
que tiene características tanto de onda como de partícula; de hecho, es muy posible
tratar la interacción entre dos fonones o entre un fonón y un electrón, como una
"colisión" de dispersión entre dos partículas. En efecto, el resultado de Debye para
el calor específico se puede obtener considerando las vibraciones reticulares del cris-
tal como un gas de fonones. Puesto que los fonones son partículas no distinguibles,
se debe utilizar la función de distribución Bose-Einstein para describir la distribución
de partículas entre los estados energéticos del sistema y, dado que el número de
fonones del sistema no es constante con respecto a la temperatura, la forma que
toma la función de distribución es (5.6-9), en donde a= O.
El número de fonones en el rango de frecuencias dw, alrededor de w (corres-
pondiente a un rango de energía dE alrededor de E= hw) es, entonces,

N(w) dw = g(w) dw (6.4-2)


ehw/kT _ 1

en donde g( w) dw es el núm~:ro de vibraciones normales posibles del sistema dentro


del rango dw alrededor de w. No obstante, en (6.3-2) y (6.3-7), ya se sabe que

dk 3k 2 V dk
g(w) dw = g(k) -d dw = -.-
2 -d dw. (6.4-3)
w 2n w

Utilizando la aproximación de De by e ( 6.3-8) para expresar k y dk/dw en


función de w (6.4-2) se convierte en

3V w 2 dw
N(w) dw = -----z-3 hwfkT • (6.4-4)
2n v0 e - 1

9 Para una derivación de esta regla de selección véase R. B. Leighton, Principies of Modem
Physics, McGraw-Hill Book Co., Inc., Nueva York (1959), páginas 211-222.
Expansión térmica de los sólidos 193

El aumento de la energía interna correspondiente al rango de frecuencias dw


alrededor de w es, simplemente, la energía cuántica hw multiplicada por el número
de cuantos que haya en ese rango de frecuencias. Por tanto,

dU = e(w)N(w) dw = hwN(w) dw

3/iV w 3 dw
= 21t2V~ eAw/kT _ 1· (6.4-5)

Al integrar sobre todas las frecuencias permisibles desde cero hasta la frecuen-
cia máxima de Debye Wm, se obtiene directamente el resultado (6.3-11). Por supues-
to, el término de energía de punto cero no se obtiene cuando la energía interna se
calcula en esta forma, ya que la energía de punto cero no está relacionada de
ningún modo con la distribución de los fonones. Sin embargo, este término no
modifica el calor específico y los dos métodos conducen al mismo valor (6.3-16) del
calor específico; dicho resultado es de interés físico y accesible a la medición. En
consecuencia, el sistema se puede tratar como un conjunto de osciladores armónicos
distinguibles que obedecen a la estadística de Maxwell-Boltzmann o bien, como un
gas de fonones o cuantos de energía vibratoria, que no son distinguibles, y que
obedecen a la estadística de Base-Einstein.

6.5 EXPANSI ON TERMICA DE LOS SOLIDOS

La representación de un sólido como sistema de átomos que tienen la libertad


para vibrar alrededor de un arreglo periódico de posiciones de equilibrio, desarrollado
en las secciones anteriores, basta para explicar el comportamiento observado del
calor específico y, también, es suficiente para entender la expansión térmica de los
sólidos. No obstante, en este caso se encuentra que si los átomos del cristal son
simples osciladores armónicos ideales, no puede haber una expansión térmica en
absoluto, de acuerdo con el pensamiento de la mecánica clásica ni la cuántica, y que
el efecto total de la expansión térmica de un cristal real depende de la inarmonía de
las vibraciones de la red.
Este resultado se puede comprender cualitativamente considerando la energía
potencial de interacción entre átomos cercanos, que debe tener la forma de una
función de la distancia interatómica, como se ilustra en la figura 6.5. El mínimo en
la curva de energía potencial, en B, es la posición clásica de equilibrio del átomo en
cuestión cuando está en reposo. Si las fuerzas interatómicas fueran tales que el áto-
mo al activarlo por excitación térmica vibrará alrededor de su posición de equi-
librio, como un oscilador armónico clásico ideal, entonces la curva potencial sería una
parábola perfecta cuyo vértice se ubicaría en B. En un ''pozo'' de potencial de esta
naturaleza, el átomo ejecutaría vibraciones armónicas alrededor del punto de equi-
librio B, las excursiones máximas a partir de dicho punto de equilibrio en ambas
direcciones serían iguales, y la distancia interatómica promedio (x} sería igual a la
.::onstante de red a temperatura cero, a. Así pues, no habría ninguna expansión
térmica en absoluto.
Sin embargo, en realidad, el cristal se desintegra al aplicarle una cantidad finita
de energía y, por tanto, el pozo potencial en el que vibran los átomos debe tener
.1proximadamente la apariencia que se ilustra en la figura 6.5. En este caso, aunque
es casi parabólico alrededor del punto mínimo B, el verdadero pozo se desvía cada
194 Vibraciones reticulares y propiedades térmicas de los cristales

t•

1-- Pozo P.arabólico que corresponde


¡ al OSCilador ideal armónico

~O~l¡---:~----t-----=:==~~~==~--- X
Energfa potencial del átomo

Niveles cuanticos permitidos


del oscilador inarmónico

Figura 6.5. Representación de la energía potencial de un solo atomo del cristal en tunción del
espaciamiento interatómico, ilustrando el papel de la componente inarmónica en la
expansión térmica.

vez más de la forma parabólica conforme aumenta 1a distancia que lo separa del
punto mínimo. Si el átomo tiene una energía e0 , como debe ser, de acuerdo con el
cuadro clásico, deberá vibrar entre los límites de amplitud extrema A y C, siendo las
vibraciones de naturaleza más bien inarmónica. No obstante, la distancia DC entre la
posición de equilibrio y la posición de máxima extensión es ahora mayor que la
distancia AD entre la postción de equilibrio y la posición de máxima compresión.
La distancia interatómica promedio <x> es, por tanto, mayor que la constante de red
a temperatura cero y se observa una expansión térmica. Se puede demostrar que esta
observación clásica del efecto lleva a la conclusión de que la expansión térmica
<x>- a es directamente proporcional a la temperatura o que el coeficiente de expan-
sión térmica d(<x>- a)/dT es independiente de la temperatura. Esto concuerda bas-
tante bien con lo observado en la mayoría de las substancias, en el rango de
temperatura ambiente o un poco por encima de ella.
No obstante, a temperaturas bajas, el coeficiente de expansión térmica obser-
vado en la mayoría de los materiales se hace mucho más pequeño que el valor
clásico y, en efecto, tiende a cero conforme la temperatura absoluta se acerca a
cero. También aquí la representación clásica se hace inaplicable y los átomos del
cristal deben considerarse como osciladores cuánticos y no como clásicos. Para calcu-
lar la expansión térmica, primero se debe resolver la ecuación de Schrodinger utili-
zando un potencial inarmónico (por lo general basta con modificar el potencial
armónico (4.12-6) mediante la adición de un término cúbico en x) para obtener los
niveles energéticos En y las funciones de onda correspondientes a este potencial
modificado y, a continuación, se debe encontrar el valor esperado <x>n para cada
estado energético permisible según (4.8-11). Entonces, la distancia interatómica, pro-
mediada sobre una distribución de Maxwell-Boltzmann, debe escribirse (en analogía
con (6.2-1)) como
L (x).e-•nlkT
(6.5-1)
(x) = • Le tn/kT


Conductividad térmica reticular de los sólidos 195

en donde la suma se toma sobre todos los niveles de un oscilador inarmónico. Los
detalles de este procedimiento son muy complejos y no se presentarán aquí. El
coeficiente de expansión térmica calculado mediante este método se acerca a cero y
concuerda aceptablemente con los experimentos sobre un amplio rango de tempe-
raturas.

6.6 CONDUCTIVIDAD TERMICA RETICULAR DE LOS SOLIDOS

La conducción de calor en los sólidos es un proceso en el que las vibraciones


de red desempeñan también un papel importante. En los cristales metálicos en los
que se tienen grandes concentraciones de electrones libres, éstos hacen aumentar
notablemente la conductividad térmica y, en efecto, constituyen el mecanismo prin-
cipal para el transporte de energía térmica a través del cristal. El estudio de la
conductividad térmica electrónica en los metales se facilita realizándolo a la luz de la
teoría del electrón libre de los metales y, por tanto, se pospondrá hasta un capítulo
posterior. Sin embargo, en substancias no metálicas, el transporte de calor a través del
cristal se debe exclusivamente a las vibraciones de la red.
La conductividad térmica se define generalmente como una situación de flujo
térmico unidimensional, en la que hay una diferencia de temperatura t:1l' sobre una
distancia &, originando un flujo de calor /Y), en una superficie A dentro de un
tiempo !:J.t. La conductividad térmica es el coeficiente de proporcionalidad entre el
flujo de calor por unidad de área y el gradiente de temperatura. De acuerdo con
esta definición, se puede escribir

1 AQ AT
J =--=-K- (6.6-1)
qx A At Ax'

en donde K es el coeficiente de conductividad térmica y Jqx el flujo de calor por


unidad de área o la densidad de corriente térmica. El signo menos es obligatorio, ya
que K se considera como una cantidad positiva; pues, con un gradiente de tempe-
ratura positivo se obtendría una corriente térmica negativa. Si se conserva la energía
térmica, la corriente térmica debe obedecer siempre a la ecuación de continuidad de
la forma

V·J
q
=oTq" aQ
ax- = - -ot. (6.6-2)

Si se combinan (6.6-2) y (6.6-l), se puede ver fácilmente que la temperatura


(y, por ende, la energía térmica por átomo) debe obedecer a una ecuación dife-
rencial de la forma

K o2 T oT
~ ox 2 =a¡· (6.6-3)

. Esta ecuación diferencial parcial es esencialmente la misma que la ecuación que


de~cnbe el tra~sporte por difusión de partículas móviles en un medio en el que
ex1~te .un gradiente de concentración. Difiere de la ecuación para la propagación
radiactiva (3.1-12) en que el lado derecho es la primera derivada con respecto al
tiempo Y no la segunda derivada. Sus soluciones características tienen un comporta-
196 Vibraciones reticulares y propiedades térmicos de los cristales

miento exponencial en lugar de armónico con respecto al tiempo, como se verá más
adelante en un capítulo posterior.
En un sistema compuesto de osciladores armónicos ideales, los diversos modos
normales de oscilación del sistema son completamente independientes los unos de
otros, no existiendo en absoluto ningún acoplamiento entre los diferentes modos
normales de vibración. Si se excita un modo normal dado de dicho sistema, éste
vibrará en forma estable en ese mismo modo normal durante un periodo indefinido.
En un sistema de este tipo, la energía de vibración se propaga directamente por
radiación acústica en lugar de hacerlo por un proceso mucho más lento que se
asocia con la conducción térmica. Así pues, la energía fluye a través del sistema con
la velocidad del sonido, y no existe un mecanismo mediante el cual se pueda hacer
aleatoria esta energía y mediante el cual se crea una resistencia térmica, de modo
que la conductividad térmica del espécimen es esencialmente infinita. Estas observa-
ciones son aplicables a los osciladores cuánticos al igual que a los osciladores clá-
sicos. Este estado de cosas se puede describir en función de los fonones mediante la
proposición de que los fonones correspondientes a diferentes vibraciones armónicas
de modo normal no interactúan entre sí en absoluto -o que su sección transversal
de interacciones mutuas es cero.
Si se introduce una pequeña inarmonía en dicho sistema, se produce un aco-
plamiento entre los diversos modos normales. En este caso, si en un principio se
excita un solo modo normal, la energía que inicialmente pertenece a este modo se
transferirá gradualmente a otros modos normales que pueda tener el sistema y, así.
quedará aleatorizada. En el lenguaje de los fonones, se puede decir que los fonones
que representan las diferentes vibraciones de modo normal del sistema, interactúan
(o chocan) unos con otros. En otras palabras, un grupo de fonones correspondientes
a un solo modo normal del sistema armónico interactúan (o dispersarán unos a
otros) de tal forma que, después de cierto tiempo, las cantidades de movimiento de
cada fonón y sus direcciones de propagación cambiarán de una manera esencialmente
aleatoria. La distribución de los fonones se convierte así, en una distribución que
representa una selección más o menos aleatoria de los modos normales del sistema.
dentro de las restricciones impuestas por la conservación de energía y la cantidad de
movimiento en las interacciones individuales.
De acuerdo con esto, es evidente que la conductividad térmica sería infinita.
de no ser por la inarmonía de las vibraciones de red. La fuerza de la componente
de inarmonía del potencial interatómico es, por tanto, un factor primordial en la
determinación de la conductividad térmica. Puesto que la magnitud de la inarmonía
aumenta de acuerdo con la amplitud de vibración, es de esperarse que la conducti-
vidad térmica disminuya conforme se incrementa esta amplitud, llegando a una re-
ducción de la conductividad térmica de la red al aumentar la temperatura. Este
efecto se observa de un modo muy general en los experimentos efectuados a tempe-
raturas lo suficientemente elevadas. Una medición inversa de la fuerza de la interac-
ción inarmónica entre los átomos de cristal, está dada por la distancia promedio que
un fonón puede recorrer entre las colisiones aleatorizadoras o fenómenos de disper-
sión en que intervienen otros fonones. Esta distancia se conoce como la trayectoria
libre media para las interacciones fonón-fonón y la conductividad térmica de los
sólidos se puede entender con mayor facilidad sobre una base cualitativa en términos
de la trayectoria libre media. En secciones posteriores se tendrá la ocasión de anali-
zar la trayectoria libre media de un modo más preciso y en una forma cuantitativa.
La conductividad térmica de los sólidos se comprenderá con mayor claridad
considerando al cristal como un recipiente que encierra un "gas" de fonones. Pri-
mero se desarrollará una fórmula para la conductividad térmica de un gas monoató-
mico ideal y luego se examinará cómo se puede aplicar a la red de un sólido
cristalino En primer lugar, se debe definir el número de partículas de un gas ideal
Conductividad térmica reticular de los sólidos 197

que tienen una velocidad en el rango de dv alrededor de v, que cruzan un elemento


de área dS por unidad de tiempo, desde una dirección que queda dentro del rango
angular d(J alrededor del ángulo polar fJ. Esta cantidad es la mitad del número
dentro del rango de velocidad en el interior de una columna cuya sección transversal
es dS cos (J (que es la proyección del área dS sobre un plano normal a la dirección
fJ) que queda a una distancia de v centímetros del elemento de área propiamente
dicho. Esta situación se ilustra en la figura 6.6. El factor un medio se incluye
porque, en promedio, sólo la mitad de las partículas dentro de la columna que va a
lo largo de la dirección (J, están encaminadas hacia el elemento de área, y el resto
va en dirección opuesta. Si n(v) dv es el número de partículas por unidad de volumen
que tienen la velocidad dentro del rango v alrededor de v, entonces, el número que
cruza el elemento de área es

4n sen 9 d(J
dn = fv · n(v) dv · 41t • dS cos 9 = fvn(v) sen(} cos (} dv d(J dS. (6.6-4)

El factor asociado con sen (J anterior representa la relación del ángulo sólido
subtendido por d(J alrededor de O y e1 ángulo sólido 41T subtendido por todo el
espacio; es evidente que ese factor debe aparecer también en la expresión. Si se
integra sobre v utilizando la distribución Maxwell-Boltzmann (5.4-14) (y recordando
que la distribución de velocidad es independiente de fJ), se obtiene

n(9) d(J = fnc sen 9 cos (} d(J dS (6.6-5)

con e dadapor (5.4-20), como el resultado deseado.


En este punto conviene hacer notar que el problema de la conducción térmica
siempre implica un flujo de energía y un gradiente de temperatura, es decir que el
sistema en cuestión nunca se encuentra en un estado de equilibrio térmico. Por esta
razón, no es estrictamente correcto utilizar las funciones de distribución estadística
que se aplican a sistemas en equilibrio. Sin embargo, si el gradiente de temperatura
del sistema es tan pequeño que la variación fracciona! de la temperatura absoluta
sobre una trayectoria libre media es reducida, se justifica el uso de la distribución en
equilibrio como una aproximación. En todo caso, el problema se limitará aquí al
estudio de sistemas de esta naturaleza. La cuestión del uso de distribuciones esta-
dísticas en sistemas que no están en equilibrio, se examina en el siguiente capítulo.

FJgUra 6.6. Geometría de partículas que fluyen a través de un plano, usadas en el cálculo de la
sección 6.6.
198 Vibraciones reticulores y propiedades térmicas de los cristales

Por lo pronto, considérese la situación Ilustrada en la figura 6. 7. Se supone


que existe un gradiente de temperatura a lo largo del eje x, de tal manera que las
partículas en el origen tienen una energía promedio e y las que se encuentran a una
corta distancia hacia la izquierda tienen la energía promedio e+ &. Supóngase que
una partícula principia a una distancia 1 del origen y cede su energía a la distribu·
ción en el origen, en una colisión que se produce en ese lugar. De acuerdo con la
expansión de Taylor, la energía de esta partícula es

(6.6-6)

Por supuesto, para esta partícula se tendrá otra que va en dirección opuesta y
que transporta e energía desde el origen hasta el punto inicial de la primera par-
tícula. El transporte neto de energía es & = (1 cose) (3ef3x ), y, puesto que el valor
promedio de 1 es simplemente la trayectoria libre media entre las colisiones aleato-
rias, que se denominará X, el transporte neto de energía por partícula, promediada
sobre la distribución de las longitudes de trayectoria 1, es

oe
e = (A. cos 8) ox. (6.6-7)

Para partículas con un ángulo polar e, de acuerdo con ( 6.6-5) y ( 6.6-7), se


produce un flujo neto de energía !lF por unidad de área, en donde

!l.e · n(O) dO 1 oe
!l.F = = - ncA.- cos 2 Osen O dO (6.6-8)
dS 2 ox .
Al integrar sobre el ángulo polar e entre los límites de O y 1r se puede ver
fácilmente que el flujo total de energía debe ser -tncX (3e/3x). No obstante, de
acuerdo con la definición de la conductividad térmica, K (6.6-l), esto debe ser igual
también a K (3Tj3x). De acuerdo con esto,

oT 1 oe 1 oe oT
K - =-nCA.- =-nCA.- - , (6.6-9)
ax 3 ax 3 ar ax

• +Ó• •

Figura 6.7. Trayectoria de una partícula en un sistema que contiene un gradiente de tempe-
ratura en la dirección x.
Conductividad térmica reticular de los sólidos 199

por lo cual,

1 ae 1
K = -3 ncA. -ar = -3 euA.c• (6.6-10)

de donde, por definición, el calor específico cv es n(oe/31).


Este resultado, que se acaba de derivar para un gas ideal de Maxwell-Boltz-
mann, es aplicable también a una distribución de fonones, a condición de que se
sobreentienda que la velocidad e se refiere a una velocidad promedio de fonón, esto
es, a una velocidad promedio de sonido dentro del cristal. [Se recordará que la
distribución de Boltzmann se utilizó sólo para velocidades promedio al obtener
(6.6-5).] Entonces, de acuerdo con (6.6-10), el problema de determinar la conducti-
vidad térmica de red se puede reducir esencialmente a la determinación de la trayec-
toria libre media de los fonones en el cristal, ya que la velocidad del sonido y el
calor específico se pueden medir o calcular con facilidad. Desgraciadamente este
problema no es tan sencillo. Reproducir el trabajo comprendido en su cálculo queda
más allá del alcance de este libro. Peierls,l 0 fue el primero en resolver este pro-
blema, y encontró que X es proporcional a 1/T a temperaturas elevadas y a eE>/lT a
temperaturas bajas. De acuerdo con esto, la conductividad térmica se deberá hacer
infmitamente grande conforme la temperatura se acerca al cero absoluto, ya que el
producto de Cv y X divergirá al infmito en este límite. Sin embargo, en realidad, a
temperaturas muy bajas la trayectoria libre del fonón deja de estar limitada por las
interacciones fonón-fonón y se ve limitada, por el contrario, por la dispersión de
fonones mediante impurezas e imperfecciones en el cristal o bien, en cristales muy
puros, por las superficies de la misma muestra de cristal. ¡En este último caso, se ha
encontrado que la conductividad térmica del cristal es una función del tamaño de la
muestra! En cualquier caso, la trayectoria libre media tiende a un límite finito
conforme T se acerca a cero, y la conductividad se acerca a cero conforme T tiende
a cero, debido al hecho de que Cv se desvanece en el límite de la temperatura cero.
Entonces, al incrementarse la temperatura la conductividad térmica aumenta de cero
a cierto valor máximo y luego disminuye conforme la temperatura se incrementa
más todavía. Este comportamiento cualitativo se ha observado, efectivamente, de un
modo experimental en la mayoría de los casos y las magnitudes de los valores
calculados ( 6.6-1 O) a partir de los valores calculados de X, concuerdan con los datos
experimentales en el orden de magnitud. Casimir 11 fue el primero en estudiar el
efecto de la dispersación a través de las fronteras del cristal, y Klemens 12 fue quien
trató detalladamente el efecto de ciertos tipos de imperfecciones.

EJERCICIOS

l. Demuestre de un modo explícito, utilizando la estadística de Maxweli-Boltzmann, que la


energía promedio de un oscilador armónico clásico tridimensional es sencillamente tres veces la
de un oscilador armónico clási.::o unidimensional a la misma temperatura y que, por tanto, no
unporta si el cristal de N átomos se considera como un conjunto de N osciladores tridimensio-
nales o bien, como 3N osciladores unidimensionales.
2. Calcule, por el método de Debye, la capacidad calorífica de una red cristalina periódica
bidimensional que contiene N átomos idénticos, y demuestre que a temperaturas bajas, la capaci-
dad calorífica varía con la temperatura como 'J'2. ¿Cuál es el límite en alta temperatura para la
capacidad térmica?

lO R. Peierls, Ann. Physik 3, 1055 (1929).


11 H. B. G. Casimir, Physica 5, 495 (1938).
12 P. G. Klemens, Proc. Roy. Soc. A208, 108 (1951).
200 Vibraciones reticulares y propiedades térmicas de los cristales

3. Calcule la temperatura de Debye 8 para (a) diamante, (b) germanio, (e) cobre y
(d) plomo, y compare sus resultados con Jos valores publicados derivados de los datos experi-
mentales de la capacidad térmica.
4. Utilice la relación de Planck para expresar la energía de un fonón en relación con su
frecuencia y la relación de De Broglie para expresar la cantidad de movimiento en función del
número de onda; encuentre una expresión para la "masa" equivalente de un fonón de energía
térmica promedio a 300° K, y compare este valor con la masa electrónica. Puede suponer que k
es tan pequeña que se puede hacer caso omiso de Jos efectos de dispersión.
S. Demuestre que el valor promedio <x>n de la amplitud de un oscilador armónico cuán-
tico, en el nésimo estado de energía, es cero.
6. Utilice las leyes de la termodinámica para demostrar que la difer~::ncia entre el calor
específico de una substancia a presión constante y a volumen constante está dada por

9oc 2 VT
Cp-Cu = - - -
K~oo

en donde a es el coeficiente lineal de expansión y Kiso es la compresibilidad isotérmica - V-1


(iW/aP>r· Nota: Observe que, de acuerdo con las relaciones de Maxwell (os/aP)r=-(av¡aT)p.
7. Sea un conjunto de N sistemas idénticos que tienen sólo dos niveles de energía, a las
energías cero y € 0 . Suponiendo que los sistemas son distinguibles, encuentre (a) la energía
interna del conjunto, (b) la capacidad térmica, (e) las expresiones aproximadas para la capacidad
térmica en los límites de temperatura alta y baja. Grafique la capacidad térmica en función de la
temperatura.
8. Para el conjunto de sistemas que se vio en relación con el ejercicio 7, demuestre que la
capacidad térmica alcanza un valor máximo a una tt.>mperatura T 0 para la que

xtanhx=l
en donde x =e0 /2kT. Demuestre también que la capacidad térmica a esta temperatura está dada
por

c. (max) = Nk (x~ - 1)

en donde X o = e0 /2kT0 • Las contribuciones a la capacidad térmica de sistemas de esta natura-


leza, se encuentran con frecuencia a temperaturas bajas en substancias paramagnéticas y se cono-
cen también con el nombre de anomalías de Schottky.
9. De acuerdo con la expresión de la mecánicd cuántica e=<1 +nx +ny +nz)hvo (en
donde nx, nY. y nz pueden ser cero o enteros positivos) para los niveles de energía de un
oscilador armónico tridimensional, demuestre, en el límite de las energías grandes en donde
e>% y de:lil>%, que el número de estados cuánticos dentro de un rango de alrededor de la
energía e, está dado por g(e) de= e2de/2(flwo) 3 •
10. Utilice el resultado del problema 9 para demostrar que la expresión (e)= 3kT para la
energía promedio de un oscilador armónico clásico tridimensional de un sistema cuyos miembros
están distribuidos en energía de acuerdo con la ley de Boltzmann, se puede obtener sencilla-
mente evaluando la expresión

fef(e)g(e) de
(e) =
Jt(e)g(e) de

Compare críticamente los aspectos físicos de este método y el que se utilizó para obtener el
mismo resultado en la sección 6.1.

REFERENCIAS GENERALES
P. G. Klemt'ns, Thermal Conductivity and Lattice Vibrational Modes, en Salid State Physics,
Advances in Research and Applications, Vol. 7, Academic Press, Nueva York (1959), pp.
l-98.
Conductividad térmica reticular de los sólidos 201

1. de Lannay, The Theory of Specific Heats and Lattice Vibrations, en Salid State Physics,
Advances in Research and Applications, Vol. 2, Academic Press, Nueva York (1956), pp.
219-303.
LB. Leighton, Principies of Modern Physics, McGraw-Hill Book Co., Inc., Nueva York (1959),
capítulo 6.
1l. B. Peierls, Quantum Theory o[ Solids, Clarendon Press, Oxford (1955), capítulo 11.
f Seitz, Modern Theory of Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo Ill.
CAPITULO 7
Teoría del electrón
libre de los metales

7.1 INTRODUCCION

En 1900, Drude 1 fue el primero en formular la hipótesis de que la gran


conductividad eléctrica y térmica de las substancias metálicas podría explicarse de-
bido a la presencia de grandes concentraciones de electrones libres móviles en estos
materiales. Más tarde, Lorentz 2 investigó exhaustivamente las implicaciones de esta
idea. Drude y Lorentz supusieron que los electrones libres de un metal podían
considerarse como un gas ideal de partículas libres, el cual obedece a la estadística
de Maxwell-Boltzmann, cuando se encuentra en equilibrio térmico. Para examinar lo
que puede suceder cuando se permite el flujo de corrientes eléctricas o térmicas,
estableciéndose así un estado de desequilibrio, fue necesario investigar cómo se modi-
ficaría la distribución de equilibrio mediante una (pequeña) corriente eléctrica o
térmica. También fue necesario estudiar el comportamiento cinético de los electrones
como el de partículas libres sujetas a colisiones instantáneas que sirven para volver la
distribución a una condición de equilibrio, y para expresar el resultado final de la
conductividad eléctrica y térmica en términos de una trayectoria libre media o tiem-
po libre medio entre estos choques aleatorios. La teoría Drude-Lorentz explicó satis-
factoriamente la ley experimental bien conocida de Wiedemann y Franz, 3 según la
cual la relación existente de la conductividad eléctrica a la térmica es casi la misma
para la mayoría de los metales. Además, para calcular las magnitudes de la conduc-
tividad eléctrica y térmica se podrían utilizar los valores más elevados para la trayec-
toria libre media.
Sin embargo, la teoría del electrón libre en su forma más sencilla llevó a una
predicción de la componente electrónica del calor específico que (suponiendo que la
teoría de Debye para el componente reticular esté en lo correcto) estaba en gran
desacuerdo con los resultados experimentales. Sommerfeld4 resolvió esta dificultad
Uunto con algunas otras) utilizando la estadística de Fermi-Dirac en lugar de emplear
la estadística clásica de Boltzmann. La representación del electrón libre empleando la
estadística de Fermi-Dirac constituye una forma teórica muy directa y sencilla de
analizar y entrever los efectos de transporte en los metales. Puesto que principia con
una idea preconcebida del aspecto de un metal, no tiene ningún valor para explicar

1 P. Drude, Ann. Physik 1, 566 (1900).


2 H. A. Lorentz, The Theory of Electrons, Teubner Verlag, Leipzig (1909).
3 Wiedemann y Franz, Ann. Physik 89, 497 (1853).
4 A. SommerfeJd, Z. Physik, 47, 1 (1928).

203
204 Teoría del electrón libre de los metales

por qué algunas substancias son metales y tienen electrones libres en abundancia y
otros son aisladores con sólo unos cuantos electrones libres, si es que los tienen.
Para encontrar una explicación a estas cuestiones fundamentales, es necesario comen-
zar examinando el comportamiento mecánico cuántico de los electrones en los cam-
pos periódicos de potencial, examinando el mismo tema en un nivel mucho más
fundamental. El último planteamiento se pospondrá hasta el siguiente capítulo, en el
que se demostrará que las propiedades de los metales y los aisladores se pueden
comprender de acuerdo con la teoría cuántica, y que las bases en las que descansa
la teoría del electrón libre son, en su mayor parte, compatibles con los requisitos de
la mecánica cuántica.

7.2 LA ECUACION DE BOLTZMANN Y LA TRAYECTORIA


LIBRE MEDIA

En cualquier problema de mecánica estadística, lo más importante es conocer


la forma de la función de distribución. Por supuesto, en un sistema de equilibrio
térmico, la función de distribución será una de las que ya se estudiaron en el
capítulo 5, pero si el estado del sistema no es de equilibrio (por ejemplo, si fluye
una corriente o hay un gradiente de temperatura), la función de distribución será
algo distinta. Naturalmente, en el límite en que desaparece la perturbación de la
condición de equilibrio, la función de distribución de desequilibrio debe aproximarse
a la distribución de equilibrio apropiada. Entonces, para cualquier estudio estadístico
de procesos en desequilibrio debe darse un paso preliminar que consiste en la deter-
minación de una forma para evaluar la función de distribución cuando el sistema se
encuentra en un estado de desequilibrio. Esto se logra mediante la ecuación de
Boltzmann.
Para deducir esta ecuación, debe considerarse una región de espacio de fase
alrededor del punto (x,y,z,px,Py.Pz). El número de partículas que entra en esta
región en el tiempo dt, es igual al número de las que estaban en la región del
espacio de fase en (x- Vxdt, y - Vydt, z - Vzdt, Px - Fxdt, Py - Fydt, Pz - Fzdt) en
un tiempo anterior dt. En este caso, F representa la fuerza que actúa sobre las
partículas de la distribución en el punto (x, y, z) y el tiempo t, y se sigue de la ley
de Newton, F = dpfdt. Si f(x, y, z, Px• Pv• Pz) es la función de distribución que ex-
presa el número de partículas por estado cuántico en la región, entonces, habrá un
cambio df que ocurre durante el tiempo dt, debido al movimiento de las partículas
en el espacio de las coordenadas y debido a que los campos de fuerza que actúan
sobre las partículas tienden a moverlas de una región a otra en el espacio de la
cantidad de movimiento; este cambio df es

df = f(x- v"dt, y- v,dt, z - v.dt, Px- F"dt, p1 - F,dt, Pz- F.dt)


- f(x,y,z,p",p,,p.). (7.2-1)

Utilizando la expansión de Taylor y manteniendo sólo los términos de primer


orden dentro del límite dt ~O, esta expresión se puede escribir como sigue
La ecuación de Boltzmann y la trayectoria libre media 205

o bien,

df
-
dt
= -v · vr-
J
F ·V f
p '
(7.2-2)

en donde el símbolo VP se refiere al operador del gradiente en el espacio de canti-


dad de movimiento (px, Py. Pz). Hasta ahora sólo se ha explicado el cambio en la
función de distribución debido al movimiento de las partículas en el espacio de las
coordenadas y debido a los cambios en la cantidad de movimiento originados por los
campos de fuerza que actúan sobre las partículas. Las partículas también se pueden
~ransferir hacia dentro o hacia afuera de una región dada del espacio de fase, por
medio de colisiones o interacciones de dispersión que abarcan otras partículas de la
distribución o centros de dispersión externos al conjunto de partículas que se están
estudiando. Si la velocidad de cambio de la función de distribución debida a las
colisiones o a la dispersión se representa mediante (a¡;at) col• entonces, la velocidad
total de cambio de f se puede obtener sumando esta cantidad al lado derecho de
(7.2-2), lo cual da

# = -v•Vf-F·VPJ+
- (~)
- (7.2-3)
dt at col

Esta es la ecuacton de Boltzmann. Si se conoce el campo de fuerza F y la


velocidad de cambio (a¡;at) col• de la ecuación diferencial (7.2-3), en principio, se
puede despejar la función de distribución.
Por supuesto, a fin de hacer esto se debe adoptar para la interacción de
dispersión algún modelo que pueda proporcionar la velocidad a la que las partículas
a consecuencia de colisiones pueden entrar en cualquier región dentro del espacio de
fase a salir de ella. Por ejemplo, se pueden suponer condiciones de estado estacio-
nario que indican que df/dt =O, y, además, especificar que no existen campos de
fuerza que actúen sobre las partícula~ y que las partículas de la distribución son
esferas duras, perfectamente elásticas y de un radio dado, que sufren colisiones que
pueden tratarse mecánicamente de acuerdo con las leyes clásicas del movimiento,
para obtener un valor promedio para (a¡;at) col· Este cálculo mecánico proporciona
fundamentalmente una sección transversal de la dispersión de una partícula de la
distribución. En este caso, se puede demostrar que la ecuación de Boltzmann lleva
directamente a la distribución Maxwell-Boltzmann del capítulo 5.
La ecuación de Boltzmann se usa más comúnmente para analizar las propie·
dades de un sistema que se encuentra desplazado del estado de equilibrio debido a
una fuerza perturbadora pequeña -por ejemplo, un campo eléctrico o un gradiente
de temperatura- cuando se conoce la función de distribución / 0 , que es la función
de distribución en equilibrio, cuando no hay perturbación. En estos casos, con fre-
cuencia se supone que el término de la colisión tiene la forma

(-a¡) -_-f-- -Jo


at col T
(7.2-4)

en donde T es un parámetro denominado tiempo de relajación o tiempo libre medio.


L~ ecuación (7.2-4) representa la velocidad a la que la función de distribución se
acerca a la condición de equilibrio (habiéndose eliminado repentinamente la fuerza
de perturbación), siendo proporcional en cualquier tiempo a la desviación, desde el
equilibrio.
206 Teoría del electrón libre de los metales

Por ejemplo, suponga que un campo eléctrico E0 ongma una corriente en un


circuito que se compone de una substancia metálica uniforme, de tal modo que f es
la misma en todos los puntos y, por ende, Vf = O. Mientras el campo se aplica, la
fuerza F de (7.2-3) debe representarse como -eE0 ; pero si el campo se suprime de
un modo repentino, por ejemplo, cuando t =O, entonces, para valores positivos de t,
F = O, y la ecuación de Boltzmann, utilizando la aproximación del tiempo de relaja-
ción (7.2-4), se convierte en

=---
f-fo (t >O) (7.2-5)

que se puede resolver fácilmente y se obtiene

f- fo = (const.)e-'1' (t > 0). (7.2-6)

Así es como la función de distribución se aproxima exponencialmente junto


con la constante de tiempo 7, a la función de distribución en equilibrio y se descubrirá
que la corriente del circuito disminuye de su valor inicial esencialmente en la misma for-
ma, tendiendo a cero exponencialmente con la constante de tiempo 7.
A primera vista, este resultado parece contradecir la evidencia experimental;
pero en realidad no se opone a ella, ya que la constante de decaimiento 7 en
circunstancias ordinarias, es muy corta, casi siempre del orden de 1o- 13 segundos.
Un estudio más cuidadoso puede ayudar a verificar la factibilidad de (7.2-6), ya que
la acción del campo eléctrico es darle a los electrones del circuito una velocidad de
arrastre en dirección opuesta a la corriente que, de acuerdo con la ley de la inercia,
debe persistir durante un corto tiempo después de la supresión de la fuerza, hasta
que los electrones del conductor pasen los procesos que aleatorizan su velocidad
reduciendo la velocidad promedio de arrastre a cero. Es evidente que las colisiones
ejercen influencia en una distribución que es perturbada de un modo u otro, pero
tiende a restaurarse al estadd de equilibrio y, si dicha perturbación se suprime, esta
restauración se logra en un tiempo del orden del tiempo de relajación 7. Los detalles del
proceso de dispersión determinan el tiempo de relajación que, en general, es una fun-
ción de la energía, debido a que la sección transversal de la dispe1sión puede depender
de la energía.
Este efecto de restricción de las colisiones es esencial para determinar la ley
que relaciona la densidad de corriente con el campo eléctrico en un conductor
ordinario. Si un sistema que contiene electrones perfectamente libres recibe la in-
fluencia de un campo eléctrico constante, sin que hayan colisiones, los electrones
sometidos a una fuerza constante adquieren una aceleración constante y, por tanto,
una velocidad linealmente creciente. Por consiguiente con un campo dado, la den-
sidad de corriente en un conductor largo sería mayor que en uno corto, ya que la
velocidad promedio de los electrones principiando en repo'so en un extremo y flu-
yendo hacia el otro, sería mayor en la trayectoria más prolongada que en la más
corta. Por supuesto, esto no es lo que sucede en absoluto. En realidad, un electrón
que principia en reposo es acelerado por un campo y adquiere una velocidad de
arrastre que aumenta linealmente durante un corto tiempo; pero a continuación sufre
una colisión que (en promedio) reduce su velocidad de arrastre a cero y el proceso
se repite. Durante un periodo dado, al electrón puede asignársele una velocidad de
a"astre constante promedio, proporcional al campo e inversamente proporcional al
tiempo de relajación. Esto lleva a la ley de Ohm, según la cual la densidad de
corriente es proporcional a la fuerza del campo eléctrico. Se puede hacer una esti-
mación aproximada de la conductividad basándose en esos datos. La fuerza ejercida
La ecuación de Boltzmann y la trayectoria libre media 207

sobre un electrón es -eE0 , en donde E 0 es el campo aplicado, por lo que la


aceleración es -eE0 /m, siendo m la masa del electrón. Si la fuerza actúa durante el
tiempo t, produce una velocidad de arrastre -eE0 t/m y si el tiempo promedio que
hay entre las colisiones aleatorias es 7, la velocidad de arrastre promedio está dada
por

_ eE0 r:
V=---, (7.2-7)
2m

suponiendo, por supuesto, que la velocidad de arrastre se ha reducido a cero en


promedio de bido a una colisión. Si la densidad de electrones libres es n 0 , la den-
sidad de corriente I será, por definición,

(7.2-8)

en donde la conductividad se expresa mediante

(7.2-9)

La ecuación (7.2-8) es, sencillamente, la ley de Ohm; este simple planteamiento en


el que se hace caso omiso de los promedios, da un valor de 7 demasiado pequeño al
multiplicarlo por 2, como se verá en breve.
El hecho de considerar el tiempo de relajación 7 como el tiempo libre medio
entre las colisiones aleatorias, se puede explicar si se analiza un grupo compuesto
inicialmente de n 0 partículas, en el tiempo t = O, cada una de las cuales puede sufrir
una colisión que aleatoriza por completo su velocidad con una probabilidad dt/7 en
cualquier intervalo de tiempo dt. Suponga que en el tiempo t, quedan n(t) partículas
que todavía no han tenido un choque. El número de partículas que chocan en un
tiempo dt, con respecto a t es, en promedio, n(t'ylt/7, de modo que,

dn(t) n(t)
-dt- = - 1:- (7.2-10)

al integrarse (haciendo que n = n 0 a t = 0), da

(7.2-11)

El número de partículas existentes en el grupo original decae exponencial-


mente, volviendo a la distribución de equilibrio de acuerdo con (7.2-11). Este es
exactamente el comportamiento que predice la ecuación de Boltzmann en la aproxi-
mación del tiempo de relajación (7.2-6). Es más, la distribución de los tiempos
libres, de acuerdo con (7.2-11), también es exponencial, en tal forma que el número
de tiempos libres dn(t) en un intervalo dt con respecto a t es

no
dn(t) =-e-'1
• dt. (7.2-12)
1:
208 Teoría del electrón libre de los metales

El tiempo libre promedio se puede calcular del modo acostumbrado y esto da

t'" t dn(t) f: te-''' dt

Ia''" dn(t) = J: e-r!< dt = T.


(7.2-13)

Entonces, se puede llegar a la conclusión de que la supostcwn de una proba-


bilidad de colisión que es constante con el tiempo para una partícula dada, conduce
al mismo resultado que la aproximación del tiempo de relajación en la ecuación de
Boltzmann, y que el tiempo de relajación de esta ecuación es idéntico al tiempo
libre medio que hay entre colisiones. En el desarrollo anterior se supuso que basta
una sola colisión para hacer que la partícula vuelva a la distribución de equilibrio. Si
no es así (por ejemplo, si se requieren varias colisiones para aleatorizar por completo
la velocidad de una partícula), el tiempo de relajación se debe interpretar como algo
que se refiere al tiempo requerido, en promedio, para que una partícula adquiera
una velocidad totalmente aleatoria, a pesar de que ésta pueda ser muchas veces
mayor que el tiempo medio real entre colisiones.
En el estudio anterior se supuso que en el grupo inicial, todas las partículas
tenían la misma energía. Si la sección transversal de las colisiones varía con la
energía de la partícula incidente, como sucede a menudo, el tiempo de relajación
será diferente para cada valor de energía de partícula, y T será una función de la
energía. También es posible que el tiempo de relajación sea no isotrópico, variando
con la dirección del vector de la cantidad de movimiento de la partícula. Sin em-
bargo, este estudio se limitará solamente al caso isotrópico en el que T puede ser
una función de la energía; pero no de la dirección.
La trayectoria libre media existente entre colisiones se puede definir en la
misma forma que el tiempo de relajación. Si la probabilidad para que una sola
partícula sufra una colisión al atravesar una distancia dx es el valor constante dx(A,
y si se tienen n(x) partículas de un grupo inicial en el que quedan n 0 después de
haber recorrido una distancia x, el número de partículas que choca en un intervalo
de trayectoria dx con respecto a x será n(x)dxj'll., por lo cual,
dn(x) n(x)
--= --dx (7.2-14)
dx A. •

Al igual que antes, esto lleva a

(7.2-15)

Nuevamente, la distribución de longitudes de trayectoria dn(x) dentro de un


intervalo dx alrededor de x es, pues,

dn(x) =no e-x/A dx (7.2-16)


).

y la trayectoria libre media está dada por

_ L"'xdn(x) f 0
,.,xe-x1Adx
X =

t"'
·--- ---- =
dn(x)
.
L'"
---
e-x/A dx -
A
.
(7.2-17)
Conductividad eléctrica de un gas de electrones libres 209

La cantidad A que, como se vio antes, es la recíproca de la probabilidad de


.-:olisión por unidad de distancia, se denomina trayectoria libre media.
La trayectoria libre media se define también en relación con un grupo de
partículas que tienen, todas ellas, la misma energía inicial y que en general debe
.-:onsiderarse como una función de la energía. En el caso de las interacciones elásticas
mutuas que hay entre esferas duras o colisiones elásticas entre partículas esféricas
rígidas y centros de dispersión fijos en forma de esferas duras, se puede ver fácil-
mente que la trayectoria libre media es una propiedad geométrica del sistema y, por
ende, independiente de la energía. Se verá que la dispersión de electrones mediante
fonones de modo acústico en metales y semiconductores, se puede aproximar a
través de este modelo y, en consecuencia, se puede describir de acuerdo con una
:rayectoria libre media independiente de la velocidad. Por supuesto, cualquier trayec-
:oria libre individual l y el tiempo libre correspondiente t están relacionados, por

l = vt, (7.2-18)

ii.n embargo, la relación existente entre la trayectoria libre media A y el tiempo libre
"'"edio T se deben obtener sacando el promedio de la distribución de velocidades y
iependerá en detalle de la forma en que la trayectoria libre media y el tiempo de
~elajación dependan de la energía.

73 CONDUCTIVIDAD ELECTRICA DE UN GAS


DE ELECTRONES LIBRES

Ahora se utilizará la ecuación de Boltzmann para predecir la conductividad


liéctrica y térmica de un gas de electrones libres. En primer lugar se verá una
substancia isotrópica uniforme a temperatura constante en una condición de estado
estacionario bajo la influencia de un campo eléctrico constante aplicado E 0 • Puesto
que el sistema se encuentra en un estado estacionario, df/dt =O y, dado que el
material es uniforme y está a temperatura constante, la función de distribución debe
ser la misma en todas las partes de la muestra, de donde, V/= O. En estas condicio-
nes, la fuerza ejercida sobre un electrón es -eE0 y la ecuación de Boltzmann en la
aproximación del tiempo de relajación se puede escribir como sigue, utilizando
(7.2-3) y (7.2-4)
f-fo
eE0 • V,f= - - . (7.3-1)
't

Si se escoge un sistema de coordenadas de tal modo que el eje z esté en la


dirección E 0 , entonces, E0 sólo tiene una componente z y la ecuación anterior se
puede expresar como sigue
eE0 -r a¡
--=f-fo· (7.3-2)
m av,
En esta ecuación, se supone que la diferencia existente entre f y fo es muy
pequeña, de modo que offozz se puede aproximar por medio de ofo/OVz. Si además
se supone que la función de distribución fo, que describe el estado de equilibrio del
sistema, es una distribución Maxwell-Boltzmann de la forma (5.4-15), entonces,

a¡o = - mv, fo· (7.3-3)


av, kT
210 Teoría del electrón libre de los metales

En estas condiciones, la ecuación de Boltzmann se convierte en

f = fo ( 1 -
eEo·r:vz) =Jo ( 1 -
---¡:;¡- eE 0 -r )
k T v cos (} , (7.3-4)

dado que Vz = v cos {), en donde 8 es el ángulo que hay entre el eje polar z y la
dirección v.
Por definición, la densidad de la corriente eléctrica lz es

(7.3-5)
y vz se puede expresar como

_f vzf(v)g(v)d 3 v

f
Vz = f(v)g(v)d 3 v '
(7.3-6)

en donde g(v) es la densidad de estados por unidad de volumen del espacio de


velocidad y d 3 v es el elemento de volumen apropiado en el espacio de la velocidad.
La notación que se adoptará en esta obra y se utilizará sistemáticamente a partir de
ahora, es que una cantidad con una barra encima, a:, se refiere a un promedio sobre
la distribución real de desequilibrio, en tanto que una cantidad encerrada entre
paréntesis, (a:), se relaciona con un promedio de dicha cantidad tomado sobre la
función de distribución de equilibrio. La única excepción es la velocidad térmica
que, para seguir esta convención, debería escribirse realmente como (v), pero que, de
acuerdo con la convención tradicional, se conservará la notación C. Como se verá, es
más conveniente integrar sobre coordenadas esféricas (v, 8, cp) en el espacio de velo-
cidad y, por tanto, se debe utilizar el elemento de volumen d 3 v = v2 sen 8 dvd8dcp.
Utilizando este elemento de volumen en combinación con la densidad de estados en
el espacio de velocidad, según está dado por ( 5.4-1 7) y la función de distribución
(7.3-4), y observando que Vz = v cos 8, (7.3-6) se puede expresar como

(7.3-7)

En (7.3-7), ya se realizó la integración sobre cp de O a 2rr. Puesto que los


integrandos son independientes de e/>, los factores 2rr obtenidos en el numerador y el
denominador se anulan. Así también, puesto que <vz> es cero (para la situación de
equilibrio), la integral que incluye sólo / 0 en el numerador de (7.3-7) debe ser cero;
es más, en el término dependiente del campo del denominador aparece una integral
angular de cos 8 sen 8 =+sen 28 sobre el rango O< 8 < 7T y, por tanto, este término
también se integra a cero. En consecuencia, la ecuación (7.3-7) se puede reducir a

(7.3-8)
Conductividad eléctrica de un gas de electrones libres 211

Las integrales angulares se pueden evaluar con facilidad, dando

_
Vz =-
eEo o
3kT
f f'"'
'"'v 2 t(v) · v2j 0 (v) dv
=-
E
e o 2
3kT (v t), (7.3-9)
v%(v) dv
o

las integrales restantes representan sólo el promedio (v 2 r (v)> sobre la función de


distribución de equilibrio. No obstante, en un gas de partículas libres de Boltzmann,
la energía cinética promedio por partícula es 3kT/2, de tal manera que

de donde,

(7.3-10)

Al substituir esto en (7.3-9), se puede escribir, finalmente,

(7.3-11)

en donde,

(7.3-12)

El resultado de este método más exacto concuerda con (7.2-7) que se obtuvo
de un modo muy aproximado, excepto por un factor de 2 y por el hecho de que la
cantidad 7, según la da (7.3-12) y (7.3-9) no es precisamente igual a r, excepto
cuando r, es independiente de v.
En este aspecto, es muy común defmir la movilidad de una partícula como la
magnitud de la velocidad promedio de arrastre por unidad de campo. De acuerdo
con (7.3-11), la movilidad ¡.¡. debe estar dada por

p.-
E0
-1 1-
Vz- - -
ei.
m
(7.3-13)

La unidad de movilidad es la velocidad por unidad de campo que, en el


sistema cgs-gaussiano es cm 2 volt- 1 seg- 1 • La densidad de corriente /z es, de acuerdo
con (7.3-5) y (7.3-11),

(7.3-14)

por lo cual,
212 Teoría del electrón libre de los metales

Se debe observar que estos resultados también se pueden establecer de acuerdo


con la movilidad, como sigue,

(7.3-16)

de donde,

u= nep. (7.3-17)

Para evaluar a explícitamente en términos del tiempo de relajación r, es nece-


sario especificar la dependencia de r con respecto a v. Entonces, si r es indepen-
diente de v, de acuerdo con (7.3-9) y (7.3-12), 7 = r. Para el caso en el que la
trayectoria libre media es independiente de la velocidad, r = 'A/v y (7.3-12). (7.3-10)
y (5.4-20) llevan a

_ A.(v) A.c 8 A.
'r=--=---=-- (7.3-18)
(v2) 3kT/m 31t e'

En la expoSicton anterior se supuso, al igual que Drude y Lorentz, que el gas


electrónico se podía describir adecuadamente mediante la distribución de energía de
Maxwell-Boltzmann. Por supuesto, los electrones obedecen en realidad al principio de
exclusión de Pauli y, debido a ello, se tuvo que utilizar la función de distribución
de Fermi-Dirac para que los resultados fueran perfectamente correctos. Si la distri-
bución de equilibrio es la de Fermi-Dirac (5.5-20), se debe escribir, en lugar de
(7.3-3),

(7.3-19)

Al substituir este resultado en (7.3-2) suponiendo nuevamente que offovz se


puede substituir mediante ofofovz, se tiene que

eE0 -r
f = fo - kT fo(l - fo)v cos O. (7.3-20)

Al utilizar esta expresión como la función de distribución en (7.3-6) y obser-


vando que la integral incluida en el primer término de (7.3-20) en el numerador, y
la integral relacionada con el segundo término de (7.3-20) en el denominador, de la
expresión resultante se anulan igual que antes y, después de integrar sobre las coor-
denadas angulares, se llega a

(7.3-21)

En el caso general es imposible evaluar analíticamente estas integrales sobre la


función de distribución de Fermi-Dirac; en cambio, es muy fácil obtener un resul-
tado aproximado que es casi correcto para T 4.. TF, lo cual por supuesto, es lo que
sucede casi siempre para la mayoría de los conductores metálicos en las condiciones
que se encuentran en la práctica.
Conductividad eléctrica de un gas de electrones libres 213

Para lograr esto, es muy conveniente expresar las integrales de (7 .3-21) como
integrales sobre la energía, y no la velocidad, por lo cual se obtiene

(7.3-22)

Se debe observar que para T~TF (es decir, kT~e1), la función de Fermi
f 0 (e) es muy pequeña para e, significativamente en exceso de e¡ y la función com-
plementaria 1 - fo es muy pequeña para valores de e que son mucho menores que
e1. Por tanto, la función producto [ 0 (1 - [ 0 ) es muy pequeña excepto en la cercanía
de e = e1 , como se ilustra en la figura 7.l. Partiendo de (7 .3-19), es fácil demostrar
analíticamente que [ 0 (1 - [ 0 ) es un máximo en e= e¡, en cuyo punto [ 0 (1 - [ 0 ) = t
y que la región sobre la que [ 0 (1 - [ 0 ) no es pequeña en comparación con su valor
máximo, tiene una anchura del orden de kT. Por tanto, la integral del numerador de
(7.3-22) no aumentará de manera significativa, excepto en donde e tiene valores no
mayores de unas cuantas unidades kT de e1. Si e3 12 T(e) es una función que no
cambia mucho en este rango de energías, se puede considerar que [ 0 (1 - [ 0 ) es
esencialmente una función o de Dirac de e - e1 , y se puede escribir, 5

fo(e)(l - fo(e)) ~ A!5(e- e1 ) (7.3-23)

en donde A es un factor de normalización que se debe escoger de tal modo que


cuando (7.3-23) se integra sobre la energía, se obtiene el valor correcto de la inte-
gral del lado izquierdo.

.,
Figura 7.1. Las funciones /o(€), 1 -!o y lo (1 - / 0 ) para un sistema de Fermi, graficadas en
función de la energía. El factor de escala vertical de la curva fo (1 -/o) no es el
mismo que el de las otras curvas.

Puesto que, mediante la integración directa (empleando la substitución u=


(e- e¡)/kT) se puede demostrar que

Joo
o
j 0 (1 -Jo) de =kT
Joo e"du
( + ") 2
-•1 tkT 1 e
= 1+e
kT
•¡tkT ~ kT (7.3-24)

s Véase el apéndice A, donde hay una definición y una explicación de la función o- de


Dirac.
214 Teoría del electrón libre de los metales

y, puesto que la integral de la función 6 es la unidad, es evidente que se debe


tomar A = kT en (7 .3-23), de donde,

j 0 (e)(l - j 0 (e)) g;; kTb(e- e1) (kT ~ e1 ). (7.3-25)

Esto se substituye en (7.3-22) y se evalúa la integral del denominador de la


ecuación, observando que fo(E) es la unidad para O< E< E¡ y cero para E> E¡, que
es una buena aproximación de kT ~ E¡, obteniéndose

_ 2eE0 f 00

0
e3 ' 2 -r(e)b(e - e1 ) de
(7.3-26)
Vz = - _3_m_ !:.....:....._f'"":-~-el_/_2d_e_ __

La densidad de corriente lz =-nevz y la conductividad a se pueden evaluar,


como antes, en relación con (7 .3-15), lo cual da

e-r(e1 )
con J.L=--. (7.3-27)
m

Parece que estos resultados son los mismos que se encontraron para el caso
Maxwell-Boltzmann (7.3-11), etc., excepto que el tiempo libre medio promedio r se
representa mediante el valor r(v) en la "velocidad de Fermi" v1 , en donde

tmv} = e1 . (7.3-28)

En este caso, las estadísticas sólo establecen una diferencia en los detalles de
los promedios y no afectan la conductividad por órdenes de magnitud. Esto se
comprende desde el punto de vista físico, ya que, en cualquiera de los casos, el
campo sólo tiene el efecto de superponer una velocidad de arrastre del orden de
eE0 r/m en todos los electrones de la distribución, como se ilustra en la figura 7.2,
sin tener en cuenta los detalles de su distribución de energía. En todo caso, la
introducción de la estadística Fermi-Dirac, aunque modifica algunos de los detalles,
conserva las características esenciales de la representación del electrón libre de Dru-
de-Lorentz-Boltzmann de la conducción eléctrica, que es básicamente correcta. Sin
embargo, como se verá a su debido tiempo, las capacidades térmicas predichas por
las estadísticas de Maxwell y Fermi-Dirac para electrones libres en metales, son

Figura 7.2. Las distribuciones Maxwell-Boltzmann (MB) y Fermi-Dirac (FD) de la componente


de velocidad z en presencia de un campo eléctrico.
Conductividad térmica y efectos termoeléctricos 215

realmente muy diferentes y, en este caso, el uso de la estadística Fermi-Dirac es


esencial para explicar los resultados experimentales.

7.4 CONDUCTIVIDAD TERMICA Y EFECTOS TERMOELECTRICOS


EN SISTEMAS DE ELECTRONES LIBRES

Al estudiar la conductividad térmica de los electrones libres, es necesario consi-


derar una muestra en la que no haya corriente eléctrica alguna, pero sí un gradiente
de temperatura. Entonces la función de distribución en cualquier punto se caracte-
riza, por la temperatura local y se debe considerar como una función de la posición
y de la energía. Al igual que antes, se supondrá que se trata de una muestra
isotrópica homogénea y, para simplificar, se supondrá que la temperatura varía única-
mente a lo largo de la dirección z. Desde un principio se trabajará con las estadís-
tica de Fermi-Dirac; el caso de la estadística Maxwell-Boltzmann se puede obtener
para una situación especial del resultado Fermi-Dirac, cuando se permite que la
energía de Fermi aumente y sea negativa.
En estas condiciones, la ecuación de Boltzmann para el estado estacionario,
utilizando la aproximación del tiempo de relajación acostumbrada, con r = r(v) se
puede expresar como sigue

(7.4-1)

En esta ecuación, las derivadas de la función de distribución real con respecto


a z y Vz, se han aproximado mediante los valores de la correspondiente función de
distribución de equilibrio análogamente al razonamiento que se empleó para la ecua-
ción (7.3-2). Se supone que el campo E0 sólo tiene una componente z. La ecuación
anterior se puede volver a escribir como sigue

f = fo + -r(eEo aJo - Vz afo). (7.4-2)


m avz az

Si se utiliza la expresión (5.5-20) para representar fo y si se recuerda que e1 es


una función de la temperatura, con la ayuda de (7 .3-19) se puede escribir la canti-
dad of0 /oz como sigue

=fo0-fo)[e-e1 + ae,]aT =[r!...(~) ~]f0 (1-f0 )aT (7.4-3)


kT T aT az aT T +T kT az .

A continuación, la ecuación de Boltzmann se puede escribir en la forma

(7.4-4)
216 Teoría del electrón libre de los metales

Al igual que antes, la densidad de la corriente eléctrica lz es

1 =-env
f vzf(v,z)g(v) d 3 v
=-en~---------- (7.4-5)
z z ff(v,z)g(v) d v ' 3

mientras que a la densidad de la corriente térmica Qz la representará la energía


portada por una partícula multiplicada por la compónente z de su velocidad, y por
la densidad de partículas, de donde,

_
Qz=n(ev,)=n
J evzf(v,z)g(v) dv
- (7.4-6)
J f(v,z)g(v) dv

Al substituir la función de distribución (7.4-4) en (7.4-5) y (7.4-6), se obtienen


expresiones análogas a (7 .3-7). Debido exactamente a las mismas razones que se
indicaron en relación con dicha ecuación, la integral del primer término del numerador de
estas expresiones (incluyendo [ 0 ), deben anularse y también debe desaparecer la integral
del segundo término del denominador (incluyendo [ 0 (1 - [ 0 )). Por tanto, se tiene

en f v!r [
kT/0 (1 - / 0) eE0 +
(
T
iJ(e1 fT)
---aT +T
e) iJT] 3
iJz d v
1 =~~--------~~~--------~--~--
% f 0 (v) d3 v f (7.4-7)

-n f v!r [ ( iJ(e1 /T) e2 ) iJT] 3


kT/0 (1- / 0 ) eE 0 e + eT aT + T i)z d v
Q = ____;:;_,__ _ _ ..;:,_;;--___;_---__;._____;;~
(7.4-8)
z Jf 0 (v) d 3 v

Sin entrar en los detalles de la evaluación de estas integrales y gracias a los


resultados obtenidos en la sección anterior, es evidente, que estas ecuaciones se
pueden expresar como

1, =--
en [ ( eE0 + 1 ,-
iJ(e-
1 /T) iJT) _ 1 iJT - ]
- - t +-- (et) (7.4-9)
m iJT iJz T iJz
y

-n [( iJ(e1 /T) iJT)- 1 iJT- 2 ]


Q, =--;;¡- eE0 + T ---a;¡- iJz (er) + T 0 z (e t) (7.4-10)

en donde las cantidades sobre las que se ha escrito una barra son los promedios
definidos por

(7.4-11)
Conductividad térmica y efectos termoeléctricos 217

Si se observa que mv; = mv 2 cos2 e, y se supone que a es independiente de


las variables angulares, entonces se puede integrar (7.4-11) sobre los ángulos para
obtener

_ m f
v2 tX(v)J0 (1 -Jo)· V2 dv 2 f'-----=------
e312 tX(e)J0 (l -Jo) de
(X = --
3kT f •o .
JI v2 dv
=-
3kT f e ¡,0 de
112
(7.4-12)

En las expresiones (7 .4-12) y (7 .3-1 0), se ve que cuando la distribución de


Fermi se reduce a una distribución de Maxwell (según la cual 1 -lo ~ 1 Y fo =
Ae-efkT), la Ci promedio se reduce a

(7.4-13)

análogamente a (7 .3-12) y los promedios se toman sobre la distribución de Maxwell-


Boltzmann. De igual manera, si la distribución es de tipo Fermi, para la que
kT <t. E¡, se puede emplear (7 .3-25) para representar f 0 (1 - fo ), en donde, aplicando
los mismos métodos usados para llegar a (7.3-26), fácilmente se puede demostrar que

ii = 1X(e1). (7.4-14)

Si no fluye una corriente eléctrica, lz = O, por lo cual, de acuerdo con (7 .4-9),


se debe tener

o(e /T) ar 1 ar (er)


eE 0 + T -1- - --= - - - - (7.4-15)
oT oz T oz i '

de donde,

Eo = _! [_!_ (et) + T o(e1 jT)] oT (7.4-16)


e T i oT oz

o bien,

Eo = T !..__ [(et)- e1
oT eiT
i] oT
oz . (7.4-17)

De acuerdo con esto, parece que aun en ausencia de una corriente, debe existir
un campo eléctrico cuando se tiene un gradiente de temperatura. De hecho, lo hay
y la ecuación anterior es la descripción fundamental del efecto termoeléctrico. Feno-
menológicamente se puede definir el coeficiente de Thomson como el coeficiente de
proporcionalidad que relaciona el campo eléctrico con el gradiente de temperatura
que lo origina, como sigue,

Eo = - ::/ -
q¡-ar
(7.4-18)
oz
218 Teoría del electrón libre de los metales

según lo cual, el coeficiente de Thomson fí debe estar dado por

fí = _ T !..._ [(st)- e1
iJT e'CT
'f]. (7.4-19)

De acuerdo con (7.4-9) y (7.4-10), también es evidente que si existe un campo


eléctrico aplicado que hace que fluya una corriente eléctrica, incluso cuando
oTjoz =O, la corriente térmica Qz no desaparece. Por el contrario, existe una co-
rriente térmica que es proporcional al campo eléctrico E 0 y, por tanto, a la corrien-
te eléctrica. Este efecto se denomina calentamiento Thomson y es muy diferente del
calentamiento ordinario irreversible de Joule que se relaciona con el paso de una
corriente por un medio resistivo. El voltaje que desarrolla un termopar por diferencia
unitaria de temperatura se defme como la diferencia de las potencias termoeléctricas
relacionadas con los dos constituyentes del par. Mediante un argumento termodiná-
mico sencillo,6 se puede demostrar que la potencia termoeléctrica absoluta {!J de
una substancia está relacionada con el coeficiente de Thomson mediante

(7.4-20)

por lo cual, de acuerdo con (7.4-19), se debe tener

f!jJ 'f- (s-r).


= e1
e'CT

Si lz =O, utilizando (7.4-15), el término relacionado con el campo eléctrico


más una contribución que incluye al gradiente de temperatura y la derivada de la
temperatura de la energía de Fermi, se puede eliminar de (7.4-10) para dar
-- __ 2

Qz = _u, iJT = - n ['f(e 2 t) - (st)]


(7.4-21)
iJz mT t

por lo cual, la conductividad térmica at es, sencillamente,


-- __2

u = ~ ['f(s t)- (et)]


2
(7.4-22)
' mT 'f ·

De acuerdo con esto, es evidente que la teoría del electrón libre de Fermi y la
representación del electrón libre de Boltzmann difieren sólo en algunos detalles de
los promedios y que ambos métodos llevan a una conductividad térmica del mismo
orden de magnitud, al igual que ambos predicen más o menos la misma conducti-
vidad eléctrica.
De acuerdo con las investigaciones experimentales de Wiedemann y Franz, la
relación atf(Tae), en donde ae es la conductividad eléctrica, es aproximadamente la
misma para casi todos los conductores metálicos, independientemente de la tempera-
tura. Puesto que a, = ne 2 r/m, la relación Wiedemann-Franz, se puede expresar como
-- _ _2
L = ..!!.!_ = _1_ 'f(s 2 t) - (et)
(7.4-23)
Tue e2T2 t2

6 M. W. Zemansky, Heat and Thermodinamics, McGraw-Hill Book Co., Inc., Nueva York
(1951) página 301.
Procesos de dispersión 219

Esto parece indicar que si r(e) es la misma función de energía para todas las
substancias metálicas, la relación Wiedemann-Franz será la misma para todos los
materiales. Puesto que cada factor de e contribuye kT a los promedios, la relación
Wiedemann-Franz será independiente de la temperatura. En realidad, si r(e) varía
lentamente con respecto a e, la relación Wiedemann-Franz será casi la misma incluso
si r(e) no es la misma función de energía para todas las substancias. En particular,
si la trayectoria libre media X e~ independiente de la energía, entonces, de acuerdo
con (7 .3-18), utilizando la representación clásica del electrón libre de Boltzmann, de
Drude y Lorentz, la conductividad térmica está dada por

(7.4-24)

en tanto que la relación Wiedemann-Franz se convierte en

(7.4-25)

independiente de la trayectoria libre media o la temperatura. La magnitud de L +


según está dada por (7 .4-25) y concuerda de manera aceptable con los valores deter-
minados en forma experimental para casi todos los metales puros.
Si se trata de evaluar la conductividad térmica y la relación Wiedemann-Franz,
por medio de la estadística de Fermi y los valores promedio, como se calcularon de
acuerdo con (7 .4-14), entonces se obtiene el resultado at = L = O! Esta situación
sorprendente se origina debido a la representación de / 0 (1 - [ 0 ) como una función
de l> y el método sólo aproximado de la integral de Fermi en el denominador
(como en (7.3-26)) de las expresiones para los promedios que conducen a (7.4-14),
no es lo suficientemente exacta para estos cálculos. Si e¡ se expresa como kTF en
(7.4-23), es evidente que, en realidad, esto sólo se refiere a una pequefia diferencia
entre dos cantidades muy grandes del orden de (k 2 /e 2 ) (TpfT)l, y las dos cantidades
propiamente dichas se deben expresar con gran exactitud a fin de que su diferencia
sea más o menos correcta. Un método más preciso, como el presentado por Smith, 7
da el resultado

(7.4-26)

(7.4-27)

7 .S PROCESOS DE DISPERSION

En todas las expostcwnes anteriores, la idea central era que los electrones
libres sufren colisiones instantáneas que tienden a hacerles volver a la distribución de
equilibrio; sin embargo, hasta ahora se ha evitado conscientemente el responder a la

7 R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman and Hall, Londres (1961)
página 328.
220 Teoría del electrón libre de los metales

pregunta "¿colisiones con qué? " La fmalidad de esta sección es analizar cualitativa-
mente la respuesta a tal pregunta. Como se verá en detalle en el siguiente capítulo,
los electrones libres que se mueven en forma independiente dentro del potencial de
una red cristalina perfectamente periódica no están sujetos en absoluto a interac-
ciones de dispersión con todos los átomos de la red. Es más, en las colisiones
elásticas que suceden entre los electrones se conservan la energía y cada componente
de la cantidad de movimiento; debido a ello, no se origina ningún cambio neto en la
corriente eléctrica ni en la térmica. Por tanto, los mecanismos de colisión que pro-
ducen la aleatorización de la distribución electrónica deben estar asociados con impu-
rezas, imperfecciones o faltas de periodicidad de un tipo u otro en el cristal.
Sea un cristal que no contiene átomos de impurezas o imperfecciones estruc-
turales en absoluto. Si no existiera el movimiento térmico de los átomos alrededor
de sus posiciones de equilibrio, el potencial eléctrico experimentado por un electrón
dentro del cristal sería perfectamente periódico y no habría mecanismos en absoluto
para hacer que los electrones volvieran al estado de equilibrio térmico por acción de
fuerzas eléctricas o magnéticas externas. Sin embargo, debido a las vibraciones tér-
micas de los átomos, en cualquier momento dado hay una leve aperiodicidad del
potencial dentro del cristal; ésta sirve para dispersar los electrones de conducción.
disipando cualquier velocidad de arrastre que puedan haber adquirido de los campos
aplicados externamente y devolviéndolos al estado de equilibrio térmico. Es evidente
que mientras más alta es la temperatura, tanto más fuertes son las vibraciones de red
y más alta la probabilidad de dispersión por unidad de tiempo. Por tanto, este
mecanismo de dispersión conduce a un tiempo libre medio [y, en consecuencia, de
acuerdo con (7.3-15), a una conductividad] que decrece al aumentar la temperatura.
Esto concuerda con las observaciones experimentales de metales puros.
Puesto que las vibraciones de red se pueden considerar como cuantos semejan-
tes a partículas de energía vibratoria (fonones), la interacción de dispersión entre los
electrones y los fonones se puede describir como un proceso de colisión casi mecá-
nico que incluye a los electrones libres y a los fonones, donde estos últimos se
comportan como partículas neutras cuya masa es mucho mayor que la del electrón. 8
Debido al hecho de que los fonones son neutros, la corriente no se conserva en
estas colisiones. Puesto que la "masa" del fonón es mucho mayor que la masa
electrónica, la fracción de energía que pierde el electrón en la interacción electrón-
fonón es pequeña, aunque por supuesto, el cambio de cantidad de movimiento del
electrón puede ser muy grande. Los electrones pueden interactuar con fonones de
modo acústico u óptico, aunque, dado que se requiere una energía térmica mucho
mayor para excitar a los fonones de modo óptico, la principal interacción a tempe-
raturas moderadas es con fonones acústicos. Las dos interacciones son similares en
sus aspectos cualitativos, aunque conducen a ciertas diferencias cuantitativas en los
coeficientes de transporte, sobre todo la dependencia del tiempo de relajación en
función de la temperatura (de ahí que la movilidad dependa de la temperatura).
A cualquier temperatura dada, el número de fonones disponibles es constante. Puesto
que los fonones se comportan como partículas masivas casi estacionarias, la probabi-
lidad de dispersión por unidad de distancia a lo largo de la trayectoria de un
electrón es una cantidad determinada de un modo puramente geométrico, la cual
sólo depende de la sección transversal geométrica efectiva relacionada con el fonón e
independiente de la velocidad del electrón. Por tanto, la trayectoria libre media es
independiente de la velocidad de partícula en estas circunstancias, como se hizo notar
en la sección 7 .2. El tiempo libre medio está dado por
A.
-r(v) =- (7.5-1)
V

8 Véase, por ejemplo, el problema 4 que aparece al final del capítulo 6.


Procesos de dispersión 221

en donde A es independiente de v, llegando a la relación (7.3-18) entre 7 y A. Por


supuesto, el número de fonones disponibles es una función de la temperatura y, por
tanto, A será una función de la temperatura a pesar de que es independiente de la
velocidad. Este mecanismo de dispersión de red o dispersión de fonón, es el proceso
dominante de dispersión en cristales relativamente puros y estructuralmente perfec-
tos, sobre todo en los rangos de temperaturas elevadas.
Generalmente, si hay un átomo de impureza en un cristal, esto altera el poten-
cial electrostático en las cercanías y crea una aperiodicidad en el campo de potencial
dentro del cristal, que puede actuar para dispersar electrones de conducción. Obvia-
mente, los detalles del proceso de dispersión dependen de la naturaleza del átomo de
impureza, su tamaño iónico, su valencia y la forma en que está enlazado dentro de
la red cristalina. En lo que respecta a otras cosas, la presencia de átomos de impu-
rezas en un cristal puro aumenta el tiempo libre medio que haya entre los eventos
de dispersión y lleva a una reducción de la conductividad eléctrica que será propor-
cional al contenido de impurezas. A decir verdad, este efecto se observa experimen-
talmente en gran número de substancias. 9 El mecanismo de dispersión de impurezas
casi siempre es dominante en cristales que son relativamente impuros o incluso en
muestras muy puras a temperaturas muy bajas, cuando el mecanismo de fonones es
débil. Las imperfecciones estructurales en la red cristalina, tales corno vacíos de red,
átomos intersticiales, dislocaciones y fronteras de grano, también conducen a aperio-
dicidades en el potencial del cristal y, por tanto, a centros de dispersión con los que
los electrones de conducción pueden interactuar. Entonces las propiedades de trans-
porte del cristal reciben la influencia en mayor o menor grado, de la perfección
estructural de la red. En algunas circunstancias, la dispersión de electrones por las
superficies de la muestra también puede ser importante. Ya se vio (en la sec-
ción 6.6) la forma en que la dispersión de superficie de los fonones es a veces un
factor importante en la componente reticular de la conductividad térmica a tempera-
turas bajas.
Si dos mecanismos independientes de dispersión (por ejemplo, la dispersión de
red y la de impurezas) operan simultáneamente para termalizar la función de distri-
bución de energía electrónica, se tendrán dos tiempos de relajación T 1 y T 2 , asocia-
dos con los mecanismos respectivos. En el ejemplo anterior, T 1 puede representar el
tiempo de trayectoria libre que transcurre entre los sucesos de dispersión de red y
r 2 el tiempo libre medio que pasa entre las dispersiones de impurezas. En estas
condiciones, el término de colisión de la ecuación de Boltzrnann se puede escribir
corno sigue

f- fo f- fo f- fo
=------=--- (7.5-2)

en donde

1 1 1
-=-+-. (7.5-3)
T T¡ T2

Esto hace ver que el efecto combinado de dos mecanismos de dispersión se


puede representar mediante un solo tiempo de relajación T relacionado con T 1 y T 2
mediante la fórmula de suma recíproca (7.5-3). De igual manera, si se tienen más de

9 Por ejemplo, esta es la razón por la que se requiere cobre de muy alto grado de pureza
para conductores eléctricos en sistemas comerciales de transmisión de potencia.
222 Teoría del electrón libre de los metales

dos mecanismos, su efecto se puede representar por medio de un solo tiempo de


relajación r dado por

1 1
-=¿-.
• 1 't¡
(7.5-4)

Puesto que, de acuerdo con (7.3-13), las movilidades son directamente propor-
cionales a los tiempos de relajación, las movilidades producidas por mecanismos
independientes de dispersión por separado pueden sumarse recíprocamente en la
misma forma para dar una movilidad combinada de la forma

1 1
-=¿-.
J1. i Jl.¡
(7.5-5)

Las trayectorias libres medias originadas por procesos de dispersión separados


también se pueden sumar recíprocamente para llegar a una trayectoria libre media gene-
ral No obstante, debe observarse que las fórmulas de suma (7.54) y (7.5-5) han de
aplicarse antes y no después de promediar sobre la velocidad.

7.6 EL EFECTO DE HALL Y OTROS EFECTOS


GALVANOMAGNETICOS

Hasta ahora se han estudiado sólo casos en los que un campo eléctrico actúa
sobre las partículas de un sistema de electrones libres. Si además se tiene un campo
magnético, la fuerza ejercida sobre una partícula de carga q está dada por la fuerza
de Lorentz
1
F = q(E + - v X B) (7.6-1)
e

y la ecuación de Boltzmann en el estado estacionario, utilizando la aproximación del


tiempo de relajación, se convierte en

(7.6-2)

La solución de esta ecuación incluye varios efectos galvanomagnéticos que se


originan en la interacción de campos eléctricos y magnéticos, y gradientes térmicos,
con las partículas de la distribución. Por ahora no se verán los detalles de la solu-
ción de la ecuación de Boltzmann, sino que la explicación se restringirá a la descripción
fenomenológica de estos efectos. En un capítulo posterior se hará un análisis más riguroso
de los fenómenos galvanomagnéticos y la forma en que se aplican a semiconductores,
en donde será más fácil llegar a soluciones analíticas exactas.
El más importante de los efectos galvanomagnéticos es el efecto de Hall, en el
que se produce un campo eléctrico en la dirección y como resultado de una corrien-
te que fluye en la dirección x y un campo magnético a lo largo de la dirección z,
según se ilustra en la figura 7.3. En esta figura, un electrón que se mueve con
velocidad vx está sometido a un empuje descendente debido a la fuerza de Lorentz.
En el estado estacionario no puede haber una fuerza neta ejercida sobre el electrón
El efecto de Hall y otros efectos galvanomagnéticos 223

Io-
vH (Medido con un
potenciómetro en
condiciones de
circuito abierto)

Figura 7.3. Geometría del experimento del efecto de Hall.

~- por tanto, lo que sucede es que se desarrolla un exceso de concentración de


electrones en el borde inferior de la muestra, hasta que se genera un campo electros-
tático Ey que equilibra exactamente a la fuerza de Lorentz. Por tanto,

q evxBo
F1 = - (v X B0 ) 1 - eE1 = - - - eE = O (7.6-3)
c e 1 '

por lo cual,

E = vxBo (7.6-4)
' e

Sin embargo, la densidad de corriente 10 es

10 = -nevx. (7.6-5)

Si se expresa Vx de (7.6-4) en función de 10 por medio de (7.6-5), el campo


.ie Hall Ey se puede expresar como

-loBo
E , = - - = Rl 0 B0 (7.6-6)
nec

m donde el coeficiente de Hall R está dado por


1
R=--. (7.6-7)
nec

El campo de Hall es directamente proporcional tanto a 10 , como a B 0 • El


.:oeficiente de Hall R es, sencillamente, la constante de proporcionalidad entre el
:.ampo de Hall y el producto 10 B 0 • El campo de Hall se puede determinar midiendo
ei voltaje de Hall VH de la figura 7.3 de una manera potenciométrica. Por tanto, el
.:ampo de Hall y el voltaje de Hall están relacionados por medio de

(7.6-8)
en donde y 0 es la anchura de la muestra. El coeficiente de Hall R se puede medir si
te conocen VH, 10 y Bo.
El coeficiente de Hall es inversamente proporcional a la densidad n de porta-
dores de carga de la muestra, y una medición de R constituye un modo sencillo de
224 Teoría del electrón libre de los metales

determinar n. Combinando las mediciones del coeficiente de Hall y la conductividad,


se puede obtener la movilidad /J., ya que, de acuerdo con (7 .6-7) y (7 .3-17),
1 JJ.
Ru= --(nep)= - -
nee e
o bien,
1
p = - - Ru. (7.6-9)
e

El análisis anterior del efecto de Hall se ha simplificado en exceso en el


sentido de que todos los portadores de carga no tienen la misma componente de
velocidad Vx y, por tanto, se debe promediar sobre la distribución de Vx. Por lo
general, el efecto de esto es cambiar el valor (7.6-7) por R mediante un pequeño
factor numérico.
De acuerdo con (7 .6-7) si los portadores de carga son electrones, R siempre
debe ser negativo. Se ha encontrado experimentalmente que R es positivo para
muchas substancias metálicas y semiconductoras. La aparición de un coeficiente de
Hall positivo se puede explicar, suponiendo que los portadores de carga son posi-
tivos, en lugar de negativos; pero la teoría del electrón libre de los metales no
proporcionan un modo racional para explicar la presencia de portadores de carga posi-
tivos. Los coeficientes de Hall positivos y la existencia de portadores de carga positivos se
pueden explicar mediante la teoría cuántica, como se verá en el siguiente capítulo.
En el arreglo experimental de la figura 7.3, se establece un gradiente de tem-
peratura a lo largo de la dirección y junto con el campo de Hall Ey. Esto se debe a
que, de acuerdo con la ley de Lorentz de la fuerza, toda fuerza ejercida vertical-
mente hacia abajo sobre los electrones es proporcional a Vx y, por tanto, sobre los
electrones más energéticos y rápidos, la fuerza ejercida v x 8 0 es mayor; en conse-
cuencia, estos electrones tienden a acumularse en la parte inferior de la muestra,
elevando su temperatura con respecto a la parte superior, donde permanecen los
electrones "más fríos". El gradiente de temperatura resultante crea un campo ter-
moeléctrico en la dirección y, el cual está dado por (7.4-17) y origina un voltaje
adicional diferente del voltaje de Hall, en las terminales y de la muestra. Este
fenómeno se conoce como efecto de Ettingshausen, y en algunos casos, puede inter-
ferir mucho en las mediciones de voltaje de Hall. Tal efecto en las mediciones de
Hall se puede eliminar si se utiliza una corriente alterna de muestra, cuyo periodo
sea corto en comparación con la constante térmica de tiempo de la muestra, en
combinación con un detector de corriente alterna.
Cuando la corriente eléctrica / 0 en el experimento del efecto de Hall, se
substituye por una corriente térmica, se puede medir todavía un campo eléctrico a
lo largo de la dirección y. En este caso, existe en promedio un transporte neto de
electrones más rápidos, dentro de la dirección x, desde el extremo vivo o caliente,
hasta el extremo frío de la muestra, y la fuerza v x B0 actúa sobre ellos, para
producir un campo eléctrico, más o menos en la misma forma en que se produce el
campo de Hall, cuando fluye una corriente eléctrica. Este fenómeno se denomina
efecto de Nernts. El campo de Nernst va acompañado por un gradiente de tempera-
tura a lo largo dat la dirección y al igual que lo que sucede con el campo de Hall;
esto origina un voltaje termoeléctrico adicional análogo al de Ettingshausen. El efec-
to termoeléctrico originado por el efecto de Nernst se denomina efecto de Righi-
Leduc.
En un campo magnético, los electrones se desplazan siguiendo trayectorias cur-
vas y no rectas; gracias a este hecho se ha descubierto que, por lo general, la
conductividad depende del campo magnético. Este fenómeno se llama magneto"esis-
tencia y se estudiará más detalladamente en un capítulo posterior.
Capacidad térmica de sistemas de electrones libres 225

7.7 CAPACIDAD TERMICA DE SISTEMAS DE ELECTRONES LIBRES

La teoría clásica del electrón libre de Drude-Lorentz, en la que se supone que


los electrones libres obedecen a la estadística de Maxwell-Boltzmann, lleva a la con-
clusión de que (suponiendo un electrón libre por átomo) la capacidad térmica de los
electrones libres debe ser -fnk, como lo da la figura (5.4-11). Entonces la capacidad
térmica total sería igual a la suma de la contribución reticular dada por la teoría de
Debye, y la contribución electrónica -fnk, y a temperaturas altas, en comparación
con la Debye, el valor límite de la capacidad térmica, sería -!nk. Sin embargo, esta
conclusión está en discordancia con los experimentos, ya que las observaciones in-
dican que el valor asintótico de la capacidad térmica a altas temperaturas difiere
muy poco del valor 3nk predicho por la teoría de Debye para la contribución
reticular sola. Aparentemente, esto indica que la capacida-d térmica de los electrones
libres es mucho más pequeña que el valor predicho a bc;se del modelo Drude-Lo-
rentz-Boltzmann. Esta fue una de las principales fallas del modelo original Drude-
Lorentz, que se propuso primero.
Como se verá más tarde, resulta que cuando se utilizan las estadísticas de
Fermi-Dirac, para describir la distribución de energía drl electrón libre, la capacidad
térmica electrónica calculada es mucho más pequeña q~tl' el valor 3/2nk dado por la
estadística de Boltzmann y, en efecto, es despreciable en comparación con la con tri-
bución reticular a temperaturas moderadas y altas. En consecuencia, el modelo del
electrón libre de Fermi está mucho más de acuerdo con las observaciones experimen-
tales que la teoría original de Drude-Lorentz. La explicación de calor específico
electrónico de substancias metálicas fue uno de los triunfos originales de la estadís-
tica cuántica.
La capacidad térmica del sistema del electrón libre de Fermi-Dirac es mucho
más pequeña porque ~AJo los electrones dentro de unos cuantos kT de la superficie
de la esfera de Fermi pueden recibir energía de una fuent~, térmica externa. Por lo
común, una partícula de un baño térmico externo a la temperatura T sólo dispone
de una energía de unos cuantos kT, para transmitirla a un electrón del sistema de
electrones libres de Fermi. Los electrones que se encuentran en un lugar profundo,
dentro de la esfera de Fermi no pueden interactuar con este tipo de cuerpos exter-
nos excitantes, ya que no existen estados desocupados dentro de unos cuantos kT
de energía, hacia los que puedan excitarse. Sólo los electrones que están cerca de la
superficie de Fermi, en donde existen estados desocupados disponibles, pueden par-
ticipar en las interacciones con una fuente térmica externa.
Para hacer un cálculo exacto de la capacidad térmica, es necesario tener en
cuenta la variación de primer orden de la energía de Fermi con la temperatura. Para
lograr esto, será necesario evaluar la integral

1= f oo
0
acb(e)
f 0 (e) & de. (7.7-1)

en donde / 0 es la función de Fermi y q¡{e) es una función de e que tiene la


propiedad de que
l/J(O) =O. (7.7-2)
Si (7.7-1) se integra por partes, puede verse con facilidad que 1 se puede
expresar en la forma

l = [f 0 (e)c/J(e) ]eo - feo l/J(e) ~de


a¡; = - feo l/J(c) ~
a¡; de, (7.7-3)
o o oe o iJ¡;
226 Teoría del electrón libre de los metales

ya que el producto f 0 (e)r/>(e) se anula en ambos límites. En la expansión de cf>(e)


como una serie de Taylor en torno al punto e= e1, puede escribirse como

f/>(e) = f/>(e¡) +(e- e¡) (of/>) e¡) (oiJe2f/>) t¡ + ... '


2
oe t¡ 1
+ 2(e- 2 (7.7-4)

por lo cual, (7.7-3) se puede expresar como

1 = a0 fj>(e1 ) + a 1 (of/>)
- + a2 (a24>)
- 2 + ... , (7.7-5)
oe t¡ oe •J

en donde

an = - - a¡; de.
1 J<Xl(e- e¡)"~ (7.7-6)
n! o oe

Ahora bien, si kT <{ e1, de acuerdo con (7 .3-19), a¡0 jae es despreciable para valores
negativos de e y los límites de la integral (7.7-6) se pueden extender a oo y - oo. Si
esto se hace, se encontrará que

a0 = - J <Xl
-a;¡
ofo [ J<Xl = 1
- de = fo
oe -oc
(7.7-7)

a1 =- J <Xl
-a;¡
ofo
(e- e1 ) - de= O
oe
(7.7-8)

(7.7-9)

La integral de (7.7-8) se anula porque at0 /ae es una función par de e- e¡ y


el integrando es, por tanto, una función impar de dicho argumento que, cuando se
integra desde - oo a + oo, debe dar cero. La integral de (7.7-9) se pone en la forma
antes indicada, mediante la substitución de x =(e- e¡)/kT; esta forma aparece en
casi todas las tablas estándar de integrales definidas. Al substituir estos valores en
(7.7-5), el resultado es

1= fp
<X> of/>
f 0 (e)-
oe
1t2 (a2 4>) + ...
de= fj>(e1 ) +- (kT) 2 - 2
6 oe •¡
(7.7-10)

Esta fórmula es conveniente para sacar valores aproximados de las integrales de


Fermi, donde la aproximación de la función 8 para a¡0 jae no es suficientemente
buena. Está restringida por la condición (7 .7 -2) y por la condición de que kT <{ e1. Este
método se puede usar para evaluar la relación Wiedemann-Franz para un gas de Fermi;
los detalles quedan como ejercicio para el lector.
Ahora suponga que se escoge

f/>(e) = f~g(e) de (7.7-11)


en donde
a¡p¡ae = g(e) (7.7-12)
Capacidad térmica de sistemas de electrones libres 227

siendo que g(e), como lo establece (5.2-22), se refiere a un sistema de electrones


libres. Por tanto, de acuerdo con (7.7-10),

n f
= oo/ 0 (e)g(e) de =
o
i''<TJ g(e) de + -nz (kT) (a.!!...) .
o 6
2
oe .,
(7.7-13)

Sin embargo, de acuerdo con (5.5-24),

1''(0)
n =Jo g(e) de. (7.7-14)

Al restar (7.7-14) de (7.7-13), se tiene,

6 (kT) 2(aag ) ~ g(e¡) [e¡(T)- e¡(O) J+ 6n2 (kT) 2 (aag ) .


o= f. •,<TJg(e) de+ n2
s¡(OJ e ., e .,
(7.7-15)

En la ecuación anterior se supuso que g(e) no varía mucho en el intervalo de


e¡(O) a e¡(1), que, para kT ~e¡ será sólo una pequeña fracción de e¡(O). Puesto que
g(e) es de la forma ce 1 12 con e igual a una constante. (7.7-15) se puede escribir
como sigue

n2 (kT)z
e1(T) = e1 (0)- - - - . (7.7-16)
12 e¡(T)

Para kT <{ e1 , el segundo término será una pequeña corrección que debe res-
tarse de la cantidad relativamente grande e¡(O) y la diferencia y e¡(1) y e¡(O) será
pequeña, en comparación con e¡(O). En estas circunstancias no se producirá un error
grande si e¡(1) en el término de corrección de (7.7-16) se substituye con e¡(O), lo
cual da, finalmente,

nz(kT\z] (7.7-17)
e¡(T) = e¡(O) [ 1 - 12 e¡(O)/ .

Para evaluar el calor específico electrónico, se escoge

cjJ(e) = f~ e g(e) de (7.7-18)

en donde

ocjJfoe = e g(e) y (7.7-19)

Entonces, al substituir en (7.7-10), se tiene que

oo ocjJ ioo
i f 0 (e)- de = e g(e)f0 (e) de = U (7.7-20)
o oe o
228 Teoría del electrón libre de los metales

U = l •,<T>
o
e g(e) de
n2
+- [ 0 J
(kT) 2 -(e g(e)) .
6 oe .,
También en este caso, si se usa el hecho de que g( e)= ce 1 12 , esto se puede
escribir como,

U = lO
<¡(O)
e g(e) de+
fe¡(T)

e¡(O)
e g(e) de
¡¡;2
+- (kT) 2 ·- g(e1 )
6
3
2

(7.7-21)

Aquí, U0 es el valor de cero absoluto de la energía interna, según se re-


presenta mediante la integral de e g(e) desde O hasta efO), y la integral de esta can-
tidad en el rango pequeño e,(O) a efT) se ha aproximado, siguiendo el mismo pro-
cedimiento que se utilizó en relación con (7.7-15). En el último término de (7.7-21),
g(e) se evalúa a efO) más que en ef1), lo cual introduce sólo un pequeño error. Al subs-
tituir el valor de ef1)-ef0) dado por (7.7-17) en (7.7-12), se puede escribir

(7.7-22)

De acuerdo con (5.2-22) y (5.5-25), g(ej(O)) se puede expresar como

g(e¡(O)) =
sJ2n m3f2[e¡(O)]If2 = 4nm
---¡;J -¡;r- -; (3n) l/J
,

que, puesto que según lo indica (5.5-25), la relación mjh 2 es igual a (3n/rr)21 3 j
(8et(O)), se puede escribir

3n 3n
g(e¡(O)) = 2e1 (0) = 2kTF. (7. 7-23)

Substituyendo este valor en (7. 7-22), se tiene, por último,

(7. 7-24)

La capacidad térmica se obtiene en la forma acostumbrada y el resultado es

e
" ar
= au = n2
2
nk(I..).
TF
(7. 7-25)

Esta expresión difiere del resultado clásico i:nk multiplicado por un factor
(rr 2 /3)(T/Tp), que resulta 0.03 para T=300°K y Tp=30,000°K [un valor típico
para metales simples, calculado a partir de (5.5-25)]. Por tanto, la componente
Capacidad térmica de sistemas de electrones libres 229

electrónica del calor específico, según se calcula mediante la estadística de Fermi,


resulta de sólo una pequeña fracción del valor de Drude-Lorentz fnk, y -es pequeña-
excepto a temperaturas muy bajas en comparación con la contribución reticular.
A temperaturas pequeñas, en comparación con la de Debye, la contribución reticular se
hace muy pequeña, aproximándose a cero, al igual que t 3 conforme T-+ O. En este
rango, la contribución electrónica frecuentemente es un factor importante y, en
ciertas gamas de temperaturas, puede ser incluso el efecto dominante. Se puede
reconocer fácilmente en los datos experimentales, debido a su dependencia lineal de
la temperatura, como lo indica (7. 7-25).

EJERCICIOS

l. Demuestre que si 'T es independiente de v, la función de distribución es una solución apro-

-m(v-vo) 2

f(v) = Ae 2kT
(donde Vu = ;;;- Eo)
ximada de la ecuación de Boltzmann en el caso en que la distribución de Maxwell-Boltzmann repre-
sente la función de distnbución de equilibrio y en donde v0 <{,(kT/m) 112 .
2. Suponiendo la estadística de Maxwell-Boltzrnann, evalúe fa partir de (7.3-12), suponga
que la dependencia de 'T sobre la energía está dada por 1 (E) =A e-s, en donde A y s son
constantes.
3. En un metal como el cobre (resistividad 1.7 X I0-6 ohms-cm), ¿Cuál es, aproximada-
mente, el máximo campo eléctrico para el que podría aplicarse el método del electrón libre de
Drude o Fermi estudiado en la sección 7 .3? ¿Cuál es la densidad de corriente para este valor
del campo?
4. A partir de (7.7-10) y (7.7-17), deduzca las fórmulas (7.4-26) y (7.4-27) para la con-
ductividad térmica y la relación de Wiedemann-Franz de un ga• de Fermi de electrones libres,
usando la aproximación kT 4;.efi0).
5. Si se adopta la representación del electrón libre de Fermi de una superficie metálica,
como se ilustra en el diagrama incluido, demuestre que existe una corriente de emisión termoió-
nica que puede fluir desde la barrera de potencial superficial, y que la densidad de la corriente
termoiónica está dada por

1 - 4TTem(kT)2 -<PotkT.
- h' e Jx.

Suponga que r/>0 , la función de trabajo es ~k T.


6. Demuestre que si la trayectoria libre media es independiente de la velocidad, la conduc-
tividad eléctrica de un gas de electrones libres de Maxwell-Boltzmann, puede expresarse como

a= 4ne 2Afy2TTmkT.
7. Describa físicamente el origen del efecto termoeléctrico. (Nota: considere una barra
larga, la mitad de la cual se mantiene a la temperatura T 1 y la otra a la temperatura T2 (>T 1 )
Y calcule los flujos electrónicos en ambas direcciones en la interfaz entre las dos regiones. Use la
estadística de Maxwell-Boltzmann.)

t</>(x)
T
r-
<Po

~~~~~~~~~~~~~•=O

Superficie
230 Teoría del electrón libre de los metales

LECTURAS RECOMENDADAS
F. J. Blatt, Theory o[ Mobility o[ Electrons in Solids, Salid State Physics, Advances in Research
and Applications, Vol. 4, Academic Press, Inc., Nueva York (1957), pp. 199-366.
J. R. Drabble y H. J. Goldsmid, Thermal Conduction in Semiconductors, Pergamon Press, Oxford
(1961).
J.-P. Jan, Galvanomagnetic and Thermomagnetic E[[ects in Metals, Salid State Physics, Advances
in Research and Applications, Vol. 5, Academic Press, Inc., Nueva York (1957), pp. 1-96.
E. H. Putley, The Hall E[[ect and Related Phenomena, Butterworth & Co., Ltd., Londres (1960).
F. Seitz, Modern Theory o[ Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo 4.
R. A. Smith, Wave Mechanics o[ Crystalline Solids, Chapman & Hall, Ltd., Londres (1961),
capítulo 1O.
J. Tauc, Photo-and Thermoelectric E[[ects in Semiconductors, Pergmon Press, Oxford (1962).
CAPITULO 8
Teoría cuántica de los electrones
en recles periódicas

8.1 INTRODUCCION

La teoría del electrón libre de los metales, desarrollada en el capítulo anterior,


se basa en la idea de que los electrones de conducción dentro de una substancia
metálica actúan como las partículas libres clásicas de un gas, sometidas sólo a las
limitaciones de la estadística de Fermi-Dirac. Desde el punto de vista de la mecánica
cuántica, no es evidente por qué debe suceder esto. Tampoco es evidente por qué
algunas substancias tienen gran cantidad de electrones libres y, por tanto son muy
buenas conductoras, mientras que otras apenas tienen algunos y se comportan como
aisladores.
El punto de vista más sencillo de la mecánica cuántica r<"specto a un electrón
. contenido en un cristal, es el de un solo electrón que se encuentra en un potencial
perfectamente periódico que tiene la periodicidad de la red. En este modelo de un
solo electrón de un sólido, el potencial periódico se puede considerar como resultado
de la distribución periódica de carga asociada con los núcleos iónicos situados en los
puntos reticulares, más el potencial "extendido" promedio (constante) aportado por
todos los demás electrones libres que pertenecen al cristal, de tal manera que se
tiene en cuenta la interacción promedio de un solo electrón con todos los demás.
En consecuencia, la solución de la ecuación de Schroedinger para un solo electrón
dentro de este potencial, proporciona un conjunto de estados de "un solo electrón"
que pueden estar ocupados exclusivamente por un electrón y, de hecho, que pueden
estar ocupados (de acuerdo con las limitaciones del principio de Pauli) por todos los
electrones del cristal, ya que el electrón único que se consideró inicialmente se
puede clasificar como típico de todos los electrones del sistema. La figura 8.1 mues-
tra una representación unidimensional del potencial de un cristal periódico, como el
que podría obtenerse siguiendo una trayectoria a lo largo de una de las direcciones
;} 00> de un cristal cúbico con una constante de red a. En lo que respecta a la
representación cuántica de un electrón, normalmente se supondrá que la periodicidad
del cristal se extiende al infinito en todas las direcciones; pero, por supuesto, en la
ruperficie de cualquier cristal real la periodicidad se interrumpe siendo entonces la
función del potencial algo semejante a lo que se ilustra en el extremo izquierdo de
la figura 8.1. El espaciamiento reticular no será muy uniforme cerca de una super-
ficie de esta naturaleza; pero, como cuestión práctica, generalmente se encontrará
que la periodicidad de red es casi perfecta después de unos cuantos espaciamientos
Jtómicos dentro del cristal.

231
232 Teoría cuántica de los electrones en redes periódicas

Se descubrirá que las funciones de onda de un ele~trón (denominadas funcio-


nes de Bloch) calculadas con el método anterior, siempre tienen ciertas propiedades
íntimamente relacionadas con la periodicidad reticular y que las energías electrónicas
permisibles ocurren en bandas de estados permitidos que están separados por regio-
nes de energía prohibidas. Dentro de las bandas de energía permitidas se notará que
el comportamiento dinámico de los electrones es muy similar al de las partículas
libres. La cuestión de si un cristal es un conductor o un aislador, dependerá de si
los estados electrónicos dentro de una banda o conjunto de bandas permisibles dadas
están llenos por completo o parcialmente vacíos. Además, se verá que el comporta-
miento colectivo de los electrones dentro de una banda de estados permisibles casi
llena, es muy semejante al de unos cuantos portadores de carga positiva en una

Superficie -x

Figura 8.1. Representación esquemática del potencial dentro de una red cristalina perfectamente
periódica. La barrera de potencial de la superficie se muestra a la izquierda.

banda casi vacía. Por tanto, la representación de un solo electrón libre sirve para
justificar el modelo del electrón libre desde un punto de vista fundamental y tam-
bién para contestar a ciertas preguntas difíciles que la teoría del electrón libre por sí
sola, ni siquiera podría tratar de explicar. No obstante, debe recordarse que el
método del electrón único es una aproximación en la que se omiten completamente
los detalles de las interacciones electrón-electrón.

8.2 EL TEOREMA DE BLOCH

El teorema de Bloch 1 es una proposición matemática relacionada con la forma


de las funciones de onda de un electrón para un potencial perfectamente periódico.
Sea una ecuación diferencial de la forma

d21/1
- 2 + f(x)ljl(x) =O (8.2-1)
dx

1 F. Bloch, Z. Physik 52, 555(1928); los matemáticos han estado familiarizados con el
mismo resultado con el nombre de Teorema de Floquet. Por ejemplo, véase E. l. Whittaker y
(;.N. Watson, Modern Analysis. Cambrid~~e University Press (1948), página 412.
El teorémo de Bloch 233

en donde f(x) es una función dada que es periódica con un periodo a, de tal
manera que

f(x +a)= f(x). (8.2-2)

Si es periódica la función de potencial V(x) para la ecuación unidimensional de


Schrodinger de la forma ( 4.8-5), entonces la ecuación de Schródinger será un caso
especial de la ecuación (8.2-1). Puesto que (8.2-1) es una ecuación diferencial lineal
de segundo orden, (para cualquier valor dado de energía e en 4.8-5) existen dos solu-
ciones independientes g(x) y h(x) tales que

t/J(x) = Ag(x) + Bh(x) (8.2-3)

representa la solución más general de (8.2-1). Puesto que f(x+a)=f(x), no sólo


g(x) y h(x), sino que también g(x+a) y h(x+a) satisfacen (8.2-1). Sin embargo,
.ualquier solución de (8.2-1) se puede expresar como una combinación lineal de g(x)
y h(x) de la forma (8.2-3). Entonces, en particular,

g(x + a)= o: 1 g(x) + o: 2 h(x)


(8.2-4)
h(x + a) = P1 g(x) + P2 h(x)
en donde a 1 , a 2 , {3 1 y {3 2 son constantes. Por tanto,

tf¡(x +a)= Ag(x +a)+ Bh(x +a)

(8.2-5)

Ahora, ¡J;(x +a) siempre se puede expresar en la forma

tf¡(x +a)= A.tf¡(x), (8.2-6)

en donde A es una constante, a condición de que se escoja el valor adecuado para A.


Al comparar (8.2-5) y (8.2-3), se observa que si (8.2-6) debe satisfacerse, entonces,

. (8.2-7)

Este sistema de ecuaciones homogéneas en A y B tienen soluciones diferentes a


A = B =O, sólo si

(8.2-8)

La solución de esta ecuación cuadrática en A sirve para determinar los dos valores
posibles de A para los que (8.2-6) es cierta. Si se les desigana como A¡ y ;\.2 ,

tf¡(x +a)= A. 1 t/l(x) (8.2-9)

tf¡(x + a) = A. 2 t/J(x).
234 Teoría cuántica de los electrones en redes periódicas

Si ahora se definen k 1 'y k 2 de tal modo que

(8.2-10)

y se define uk 1(x) y uk 2(x) como

uk,(x) = e-ik,xif¡(x)
(8.2-11)

si se utiliza (8.2·11), (8.2·9) y (8.2-10), es evidente que

(8.2-12)

La función uk entonces es periódica con un periodo a; de un modo similar esto


mismo es aplicable ~ uk 2 (x ). Por tanto, de acuerdo con (8.2-11 ), 1/l(x) puede escri-
birse siempre en la forma

(8.2-13)

en donde uk(x) es una función periódica con un periodo a, y en donde k representa


ya sea a k 1 o a k 2 tal y como se determinaron antes. Este es el teorema de Bloch
y todas las funciones de onda de un electrón para potenciales periódicos se pueden
escribir de este modo. En tres dimensiones, el teorema de Bloch se convierte en

(8.2-14)

Las funciones de onda (8.2-13) y (8.2-14) tienen claramente la forma de ondas


planas con un vector de propagación k modulado por una función cuya periodicidad
es la de la red cristalina.
La función de Bloch (8.2-13) se puede considerar como la manera más general
de escribir una solución de la ecuación de Schrodinger que conducr a la misma
densidad de probabilidad 1/1* 1/1 en cada célula unitaria del cristal. De acuerdo con
(8.2-13), es evidente que en la nésima célula unitaria, debido a la periodicidad de uk,

(8.2-15)
De igu?l manera,
1/J*(x + na)= e-iknal/l*(x) (8.2-16)
y
1/J*(x + na)if¡(x + na)= 1/J*(x)if¡(x). (8.2-17)

La función de onda tridimensional (9.3-14) tiene el mismo tipo de comportamiento.


En el caso unidimensional, para un cristal infinito, se puede encontrar una
solución formal a la ecuación de Schrodinger para cualquier valor de energía e
El modelo de Kronig-Penney de un cristal infinito unidimensional 235

dentro de ciertos rangos, y se tienen dos valores de k correspondientes a cada uno


de estos valores de e, por medio de (8.2-8) y (8.2-10). Los valores propios de
energía permitidos para dicho sistema, dentro de esos rangos, son continuos. Por
otra parte, si el cristal tiene una extensión finita, en cuyo caso, sobre la superficie
se deben satisfacer las condiciones físicas apropiadas de frontera, entonces, las solu-
ciones que satisfagan la ecuación de Schrodinger y, a la vez, las condiciones de
frontera pueden encontrarse pero, sólo para ciertos valores propios de energía discre-
ta. Puesto que por cada valor propio de energía se tienen sólo dos valores relacio-
nados de k, los valores permisibles de k forman también un conjunto discreto. En
este caso, la solución es muy similar a la que se encontró en relación con las
vibraciones mecánicas de una red periódica y que se analizó en la sección 3.3. Por
supuesto, cuando el número de átomos dentro del cristal se hace demasiado grande,
los valores permitidos de e y k, aunque siguen siendo discretos, se amontonan
mucho y en la mayoría de los casos se pueden considerar como bandas casi conti-
nuas de valores permisibles. Los cristales tridimensionales tienen el mismo comporta-
miento cualitativo, excepto que en este caso, se tienen más de dos valores permisi-
bles de k para cada valor propio de energía.
Por ejemplo, si se imponen condiciones periódicas de frontera a un cristal
unidimensional de N átomos (o si se supone que la red tiene la forma de un anillo
de N átomos), entonces, si la funcion de onda 1/1 debe tener un solo valor, es
necesario (utilizando (8.2-15)) que

t/l(x +Na)= eikNatf¡(x) = t/J(x) (8.2-18)

.JOr lo cual,
eikNa = 1

o bien,
2n:in
eika = (l)lfN =e--¡¡- (n = 0,1,2, ·· · N - 1), (8.2-19)

recordando la forma de las Nésimas raíces de unidad. Si se toma el logaritmo de


ambos lados de esta ecuación y se resuelve para k, se encontrará que, en estas
condiciones de frontera, los valores posibles de k son

2nn
k=-
n Na
(n = 0,1,2, ... N). (8.2-20)

Si N es grande, habrá muchos valores permitidos de k dados por (8.2-20) y, en


este caso, se puede considerar que forman un rango casi continuo de valores. Por
supuesto, los N valores distintos de k permitidos por (8.2-20) no corresponden al
mismo valor de energía. Por cada valor constante de e se tendrán sólo los dos
valores permitidos de k dados por (8.2-10).

8.3 EL MODELO DE KRONIG-PENNEY DE UN CRISTAL


INFINITO UNIDIMENSIONAL

Para el caso del potencial periódico infinito de un pozo cuadrado unidimen-


sional que se ilustra en la figura 8.2, se puede llegar a una solución exacta de la
236 Teoría cuántica de los electrones en redes periódicas

ecuación de Schródinger. Kronig y Penney 2 fueron los primeros en investigar esta


solución y, aunque se relaciona con un potencial periódico algo idealizado que cons·
tituye sólo una aproximación burda del que se encuentra en un cristal real, es de
gran utilidad porque sirve para ilustrar de un modo más explícito muchas de las
características físicas importantes del comportamiento cuántico de los electrones en
redes periódicas. Las funciones de onda asociadas con este modelo se pueden calcu·
lar con aproximación de un electrón, resolviendo la ecuación de Schrodinger

d 2 1/1 2m
dx 2 + ¡r- (e- V(x)(l/l(x) =O (8.3-1)

para un solo electrón dentro del potencial periódico V(x) según se ilustra en la fi.

¡V (x)
-Vo
o

u-J
U2
1 a+b~
(celda
unitaria)
u,(x)
--__..,X

Figura 8.2. Potencial periódico ideal de pozo cuadrado usado por Kronig y Penney para ilustrar
las características generales del comportamiento cuántico de los electrones en redes
periódicas.

gura 8.2. Puesto que, de acuerdo con la sección anterior, las funciones de onda deben
tener la forma de Bloch, se puede esperar que

(8.3-2)

Al substituir (8.3-2) en (8.3-1), se encuentra que la función u(x) debe satisfacer

d2u du ( 2m V(x))
dx2 + 2ik dx- k2 - cx2 + ¡¡2 u(x) =O (8.3-3)

en donde

(8.3-4)
Para el potencial de la figura 8.2, se encontrará que

(0 < x <a) {8.3-5)

2. R. de L. Kroni~ y W. G. Penney, Proc. Roy. Soc. Al30, 499 (1931).


El modelo de Kronig-Penney de un cristal infinito unidimensional 237

( -b <X< 0), (8.3-6)

en donde u 1 (x) representa el valor de u(x) dentro del intervalo (O<x<a) y u 2 (x)
representa el valor de u(x) dentro de (- b < x < 0), y en donde

(8.3-7)
Las ecuaciones rliferenciales (8.3-5) y (8.3-6) se resuelven fácilmente mediante
procedimientos normales y se obtiene

(0 < x <a) (8.3-8)

( -b <X< 0}, '(8.3-9)

en donde A, B, e y D son constantes arbitrarias. Se observará que la cantidad (3 es


puramente imaginaria para O< e< V0 .
El requisito de continuidad para la función de onda 1/J y su derivada en x = a
y x =- b, requiere que la solución u(x) satisfaga estas mismas condiciones, ya que
en (8.3-2) eikx es una función apropiada. Si se aplican estas condiciones de frontera
(y se recuerda que, dado que u(x) tiene la periodicidad de la red, u 1 (a)= u 2 (- b )), se
encuentra que

i(a. - k)A - i(a. + k)B = i(p - k)e - i(P + k)D


(8.3-10)
Aei<cx-k)a + Be-i<cx+k)a = ee-i<IJ-klb + Dei<IJ+k)b
i(a.- k)Aei(cx-k)a- i(a. + k)Be-i(cx+k)a = i(P- k)ee-i(/1-k)b- i(p + k)Dei(/l+k)b

Por tanto, los coeficientes A, B, e y D se pueden determinar como la solución


de un grupo de cuatro ecuaciones homogéneas simultáneas y lineales en dichas canti-
dades. Por supuesto, no existe ninguna otra solución aparte de A = B = e= D = O, a
menos que desaparezca el determinante de los coeficientes. Esto requiere que

1 1 1 1
a.-k -(a.+ k) P-k -(P +k)
ei(cx-k)a e-i(cx+k)a e-i(/1-k)b ei<fJH)b =O.
(a._ k)ei(cx-k)a -(a.+ k)e-i(cx+k)a (p _ k)e-i<IJ-k)b -(P + k)ei(/l+k)b
(8.3-11)

Al expander el determinante, se puede demostrar, después de muchas operacio-


nes algebraicas tediosas, pero directas, que (8.3-11) se puede expresar como

a.2 + p2
- ·--:¡;¡¡-sen a.a sen Pb + cos a.a cos Pb = cos k( a + b). (8.3-12)
238 Teoría cuántica de los electrones en redes periódicas

Puesto que en el rango (O< e< V0 ), {3 es imaginaria según lo define (8.3-7),


para estos valores de energía es más conveniente expresar (8.3-12) en una forma
ligeramente distinta. Haciendo que

f3 = iy (8.3-13)

en esta región y observando que cos ix = cosh x y sen ix = i senh x, la ecua-


ción (8.3-12) se puede escribir como sigue

y2 - a2
- 2- - senh yb sen aa + cosh yb cos cxa = cos k( a + b), (8.3-14)
ay

en donde 'Y es una cantidad real positiva en el intervalo (O< e< V0 ), al igual que {3
lo es en el intervalo (V0 <e<""). En consecuencia, es más conveniente usar
(8.3-12) cuando (V0 <e<oo) y (8.3-14) cuando (O<e< V0 ).
Las funciones de onda (8.3-2), como todas las funciones de onda, deben tener
un comportamiento adecuado conforme x tiende a ± oo. Puesto que u(x) es una
función periódica cuyos valores son los mismos en cada célula unitaria, no se en-
cuentran dificultades en este aspecto a condición de que el factor eikx de (8.3-2) se
mantenga finito en estas condiciones. Sin embargo, eikx cumple con lo anterior
tanto en + oo como en - oo sólo si k es real, por lo que eikx es oscilatoria. Si k
fuere imaginaria, eikx divergiría al infintio ya sea en + oo o - oo, y la expresión
resultante para ¡J¡(x) no se comportaría debidamente como función de onda. Por
tanto, se deben aceptar sólo funciones de la forma (8.3-2) con, valores reales de red
k. Las expresiones anteriores (8.3-12) y (8.3-13) tienen en el lado izquierdo una
función de la forma K 1 senaa+K 2 cosaa que debe ser igual a cosk(a+b). Si para
un valor dado de energía la función del lado izquierdo de estas ecuaciones cuenta
con un valor dentro del rango comprendido entre + 1 y - 1 . el valor requerido
para cos k(a+ b) se obtiene con un valor real para el argumento k(a+ b ), Por otro
lado, si el valor de la función del lado izquierdo de (8.3-12) o (8.3-14) queda fuera
de dicho rango, esto significaría que cos k(a + b) tendría que ser mayor que + 1 o
menor que - 1, lo cual, a su vez, requiere que el argumento k( a + b) sea un número
complejo con una parte imaginaria diferente a cero. En estas circunstancias, las
soluciones (8.3-2) no se comportarían debidamente en infinito y no satisfarían el
requisito físico para las funciones de onda del sistema. Las energías asociadas con
estos valores de k estarían prohibidas para el electrón.
Los lados izquierdos de (8.3-12) y (8.3-14) se pueden escribir en la forma
K 3 sen(aa -6), en donde K 3 =(K~ +KD 1 12 y tan 6 = K¡fK2. En esta forma (8.3-12)
y (8.3-14) se pueden escribir como sigue

(8.3-15)

en donde
a2 + {32
tan éJ =- 2af3 tan flb CVo <e< oo)
y
[1 +
(a2 + /)2 ] 1/2
4a 2 y2 senh 2 yb cos(aa - <5) = cos k(a + b), (8.3-16)

rn clonde
a2 + y2
tan <5 = 2ay tanh yb (O< e< V0 ).
El modelo de Kronig-Penney de un cristal infinito unidimensional 239

De acuerdo con estas expresiones, es evidente que en ambos casos, el lado


izquierdo tiene la forma de una función coseno por un factor de modulación cuya
amplitud es invariablemente mayor que la unidad. El valor de este factor de modu·
!ación en realidad, es un máximo para a= O (y, por tanto, para e= O), y se acerca
a la unidad en el límite de las energías grandes, en donde a ~ (3.
Cuando los lados izquierdos de (8.3·15) y (8.3-16) se grafican como una fun-
ción de la energía, en cuyo caso se debe observar a partir de (8.3-4) y (8.3-7) que

(8.3-17)

los resultados son como se ilustra en la figura 8.3. En esta figura, el lado izquierdo
de (8.3·15) o (8.3-16) aparece graficado en función de la energía. Cuando la orde·

f(•)

+,.
k==-
o+b

Figura 8.3. Gráfica de las funciones del lado izquierdo de (8.3-15) y (8.3-16) en función de la
energía. Las regiones sombreadas señalan las bandas de energía prohibidas en donde
el valor de k es complejo, las regiones no sombreadas son las bandas de energía
permisibles correspondientes a valores reales de k.

nada de la curva está entre + 1 y - 1, existe un valor real para k correspondiendo a


funciones de onda físicamente posibles. No obstante, fuera de estos límites, k debe
ser compleja con una parte imaginaria diferente a cero. Estos valores de k nunca
pueden producir funciones de onda con un significado físico; los rangos de energía
correspondientes están prohibidos y se ilustran en la figura 8.3 como las regiones
sombreadas. Por tanto, se tienen regiones alternas de valores propios permisibles y
regiones prohibidas. Estas regiones se denominan casi siempre bandas de energía
permisibles y prohibidas y el agrupamiento de los valores de energía permisibles en
estas bandas es una de las características típicas más importantes del comporta·
miento de los electrones en redes periódicas. Se puede demostrar que las bandas de
energía que tienen los mismos aspectos cualitativos que los que se indican en la
figura 8.3, se forman sea cual fuere la forma detallada del potencial, siempre y
cuando sea periódico.
240 Teoría cuántica de los electrones en redes periódicas

c(k)

1
1
1
1
1
1 1
/-Partícula libre
1 (e= ·Pk 212m l
1

1 •o
\ 1
'i
l\ A
1\ 1 1
1 1
1
1 1
1 1
1 1
1 1
1 1
1- k(•ol lk(•ol
-3,. -2,. ~ o _!!_ k _k ..1!_
-*
o•b o•b o•b o•b o+b o+b o+b

Figura 8.4. La energía € graficada como una función de k de acuerdo con (8.3-15) y (8.3-16).

Si se usan (8.3-1 5), (8.3-16), (8.3-4) y (8.3-7), se puede grafic:.~r una curva que
presente a la energía e como una función de k. En la figura 8.4 se muestra el
resultado de una manera esquemática. Las bandas de energía prohibidas y la relación
de e en función de k dentro de las diferentes bandas permitidas, se han asignado de
acuerdo con el patrón que aparece en la figura 8.3. Puesto que cos- 1 k(a + b) n0 es
una función de un solo valor, esta asignación es necesariamente arbitraria. Para
energías grandes, es aparente que la función e(k) se acerca a la relación del electrón
libre e= h2 k 2 /2m (que se ilustra con la curva punteada de la figura 8.4) de un
modo muy semejante dentro de las bandas permitidas. Así también, para energías
grandes, se ha encontrado que las bandas permitidas se hacen muy anchas y las
regiones prohibidas muy angostas. No obstante, la curva e(k) siempre tiene una
pendiente cero en los bordes de las bandas permisibles, es decir, cuando k = ± mr/
(a+ b), siendo n un entero. Este resultado se puede corroborar mediante la deriva-
ción directa de (8.3-1 S) y ( 8.3-16); pero aquí no se verán los detalles de estos
cálculos. Esta característica de la curva e(k) es muy general y se puede demostrar
que se presenta incluso en el caso tridimensionaL independientemente de la forma
matemática precisa de la función de potencial.

8.4 CANTIDAD DE MOVIMIENTO DEL CRISTAL


Y MASA EFECTIVA

Si la función uk(x) de (8.2-13) es una constante, la función de onda tiene la


forma e±ikx correspondiente a un electrón perfectamente libre cuya cantidad de
Cantidad de movimiento del cristal y moSil efectiva 241

movimiento es p = ± lik y cuya energía, de acuerdo con los resultados de la sec-


ción 4.9, sería

(8.4-1)

En la figura 8.4 se ilustra esta relación por medio de la curva punteada. Para
valores grandes de e, la relación real e en función de k se acerca mucho a esta
relación. De acuerdo con (8.2-13) y los resultados de la sección anterior, es evidente
que k es una constante del movimiento, que lik tiene las dimensiones de una canti-
dad de movimiento y que al aumentar la energía del electrón (haciéndose, por ende.
la partícula mucho más "libre"), los valores de k se aproximan en general a los de
la cantidad de movimiento de la partícula libre dividido.; entre h. Se puede ver con
facilidad que estas conclusiones se deben aplicar sea cual fu~re la forma partícular
que adquiera el potencial periódico. Por tanto, se acostumbra referirse a lik corno la
cantidad de movimiento del cristal y, corno se verá en breve, sucede en muchos
casos que el comportamiento dinámico del electrón dentro de la red cristalina, con
respecto a la cantidad de movimiento del cristal, es muy similar al de una partícula
libre con respecto a la cantidad de movimiento real. Para que quede perfectamente
clara la diferencia entre la cantidad de movimiento real y la cantidad de rnovi.Jnjento
del cristal, se debe observar que debido a la presencia del potencial de red, la
cantidad de movimiento real instantáneo de un electrón no es en absoluto una
constante del movimiento y no se calcula directamente por métodos de la mecánica
cuántica, excepto corno un valor promedio, en tanto que para un estado de energía
dado, la cantidad de movimiento del cristal lik es un valor constante perfectamente
bien definido al igual que lo es la cantidad de movimiento real de una partícula
libre de cierta energía.
Ahora se verá el movimiento de un electrón dentro de un cristal bajo la
influencia de un campo eléctrico aplicado. Para comprender mejor el movimiento de
un electrón en esta situación, se deberá localizar la función de onda superponiendo
soluciones que tienen distintos valores de k, corno se hizo en la sección 4.9. Si se
hace esto, la velocidad de grupo asociada con el "paquete de ondas" del electrón, es

dw 1 de
Vg = dk = h dk' (8.4-2)

en donde, por supuesto, e y w tienen una conexión a través de la relación de


Planck e= :liw. Supóngase que hay un campo eléctrico externo E que actúa sobre el
electrón, que adquiere un incremento en velocidad dvg en una distancia dx, en un
tiempo dt. Entonces, si se usa (8.4-2), se observa que

de eE de
de=-dk= -eEdx= -eEv dt= - - - d t (8.4-3)
dk g li dk '

de donde,
eE
dk= --dt (8.4-4)
li '
o bien,

dk dp
li - = - = -e E =F (8.4-5)
dt dt '
242 Teoría cuántica de los electrones en redes periódicas

en donde ahora se tiene el símbolo p para denotar la cantidad de movimiento del


cristal. La ecuación (8.4-5) indica que la capacidad de cambio respecto al tiempo de
la cantidad de movimiento del cristal es igual a la fuerza - eE. Por tanto, es análoga
a la ley de Newton, que demuestra que la cantidad de movimiento del cristal del
electrón en una red periódica cambia bajo la influencia de un campo aplicado, en la
misma forma que lo hace la cantidad de movimiento real de un electrón libre en el
vacío.
Si se deriva la expresión (8.4-2) con respecto al tiempo, el resultado es

(8.4-6)

que, usando (8.4-5), se puede escribir como sigue

(8.4-7)

en donde la masa efectiva m* está dada por

(8.4-8)

La expres10n (8.4-7) es fundamentalmente la ecuac10n de fuerza, de Newton.


El factor de proporcionalidad que relaciona a la fuerza eE y a la aceleración dgg/dt
se puede considerar como la masa efectiva del electrón. Sin embargo, la masa gravi-
tacional real del electrón no se relaciona directamente con la masa efectiva; se trata
de la cantidad d 2 e/dk 2 que es el factor importante. Si el electrón en realidad es
libre, entonces e y k se relacionan por medio de (8.4-1) y (8.4-8) se reduce a
m*= m. Si la energía es una función parabólica de k, que tiene la forma

(8.4-9)

entonces, la masa efectiva tiene un valor constante m*= h2 /2C y el comportamiento


dinámico del electrón será el mismo que el de una partícula libre con esta masa
efectiva. Si la energía no es una función parabólica de k, entonces dicha masa no
será constante con la energía y el comportamiento dinámico será el de una partícula
de masa variable complicándose con ello la situación. En cualquier caso, para una
primera aproximación, todo el efecto del potencial del cristal periódico reside en
substituir la masa del electrón libre por una masa efectiva.
Afortunadamente, la relación que asocia a e con k es casi siempre parabólica o
casi parabólica sobre el rango de energías accesible a un electrón dentro del cristal.
De acuerdo con la figura 8.4, parece ser que la curva e en función de k tiene
siempre una forma parabólica en la base y la parte superior de las bandas de energía
permisibles. Sin embargo, incluso cuando los electrones del sistema están en otras
regiones, lo importante es que la masa efectiva sea fundamentalmente constante
sobre un intervalo de energía, del orden de la cantidad promedio de energía que una
partícula puede adquirir o perder en un solo evento de dispersión, o entre varios
eventos de dispersión en un tiempo del orden del tiempo de relajación. Esta can-
tidad de energía es del orden de kT No obstante, a 300°K, kT representa sólo
0.025 eV, y la anchura total de una banda de energía que puede desempeñar un
papel importante en los procesos de transporte en substancias cristalinas típicas es
Representación de zona reducida; electrones y huecos 243

mucho mayor que esto casi siempre del orden de 1 eV. En eventos de dispersión
independientes o en intervalos entre eventos de dispersión sucesivos, un electrón estará
confinado casi siempH~ dentro de un corto segmento de la curva E en función de k,
que casi siempre se puede considerar como aproximadamente parabólico.
Esto hace ver que la representación del electrón libre en un metal está justi-
ficada en su mayor parte, y la única corrección importante es que la masa del
electrón libre debe substituirse en todos los casos por una masa efectiva apropiada
relacionada con la forma de la curva E en función de k, por medio de (8.4-8). En
consecuencia, se llega a la conclusión de que todos los resultados derivados en el
capítulo 7 basándose en la teoría del electrón libre, son correctos a condición de
que la masa del electrón se substituya con la masa efectiva apropiada. La masa
efectiva se puede deducir por comparación de los datos del calor específico electró-
nico que se han obtenido a través de la experiencia, con el resultado del electrón
libre dado por la ecuación (7. 7-25); también se puede L alcular desde el punto de
vista de la mecánica cuántica principiando con las funcione~ de onda atómicas auto-
consistentes para los átomos del cristal, que luego se combinan para dar un potencial
de cristal apropiado para la substancia en cuestión. Los valores calculados de este
modo concuerdan casi siempre con los que se determinan de un modo experimental.
Para la mayoría de los metales, la masa efectiva varía entre la mitad y el doble de
la masa del electrón libre, aunque para muchos metales de transición es mucho
mayor y para ciertos compuestos del tipo III-V puede ser mucho menor.

8.5 REPRESENTACION DE ZONA REDUCIDA;


ELECTRONES Y HUECOS

En la figura 8.3 se ilustra la asignacwn de rangos de valores para k dentro de


cada banda de energía permitida, lo cual produce la curva que aparece en la figu-
ra 8.4. Puesto que el único requisito que se debe llenar dentro de cada banda es
que - 1 .:;;; cos k(a + b) .:;;; + 1, es evidente que esa asignación de valores para k a
cada banda no es única. La ventaja de la asignación ilustrada en la figura 8.3 es que
lleva a lo que se llama representación extendida de la figura 8.4, en la que es muy
evidente la relación con la curva de la partícula libre E en función de k. Sin
embargo, se podría trasladar cualquiera de los segmentos de la curva que aparece en
la figura 8.4, a la derecha o a la izquierda, en forma paralela al eje k y a una
distancia 2mr/(a + b), en donde n es un entero y se seguirán satisfaciendo las rela-
ciones (8.3-15) y (8.3-16), ya que cualquier transformación de esta índole no varía
el valor de cos k( a + b ).
A veces es muy útil hacer una transformación particular de este tipo trasla-
dando los diferentes segmentos de la curva E en función de k a la derecha o la
izquierda, en forma paralela al eje k y a distancias que son múltiplos enteros de
2n/(a+b), de tal manera que todos queden dentro del intervalo -nf(a+b)<k<n/
(a + b). La representación resultante de la energía en función de la relaci0n de la
constante de propagación se conoce con el nombre de representación de zona redu-
cida. La representación de zona reducida de la curva de la figura 8.4 se ilustra en
la figura 8.5. En cualquier caso, se observará que las funciones de onda de Bloch
(8.2-13) satisfacen la condición de reflexión de Bragg (2.1-1) en los puntos k= nn/
(a + b ), como se vio en relación con las vibraciones mecánicas de la red de la
sección 3.3. En estos puntos, la velocidad de grupo h- 1 dE/dK es cero, correspon-
diendo a una onda estacionaria que representa a un electrón en reposo. Se puede
considerar que el electrón sufre una difracción interna por medio del potencial de
244 Teoría cuántica de los electrones en redes periódicas

dk)

_,._
O+b

Figura 8.5. Representación esquemática de la gráfica de € en función de k, de la figura 8.4,


transformada a la representación de zona reducida.

red en estas circunstancias. En una sección posterior se ampliarán los conceptos re-
lacionados con este tema.
En el cristal infinitamente grande de la sección 8.3, las energías permitidas
forman un continuo de valores dentro de las bandas permisibles. Sin embargo, si el
cristal tiene una extensión finita y contiene un total de N átomos, ya se vio, de
acuerdo con (8.2-20), que por el contrario, sólo se tendrán N estados propios permi-
sibles específicos de la cantidad de movimiento del cristal k dentro de cada banda
de energía permisible. De acuerdo con la figura 8.4, se puede ver que para una
energía dada e0 , los dos valores de cantidad de movimiento de cristal permisibles son
k(e 0 ) y - k(e 0 ). Desde el punto de vista físico, el primero representa un estado en
el que un electrón se mueve hacia la derecha con la cantidad de movimiento posi-
tivo del cristal k(e 0 ), en tanto que el segundo representa un estado en el que un
electrón se desplaza hacia la izquierda con una cantidad de movimiento del cristal
igual y opuesta. Evidentemente, la energía es la misma en ambos casos. El efecto del
espín de electrón, en este caso, al igual que en sistemas atómicos aislados, es dupli-
car el factor de degeneración asociado con todos los niveles de energía del sistema,
ya que se debe considerar que cada estado cuántico se ha dividido en dos alojando
uno de ellos a un electrón con "espín ascendente" y el otro, un electrón con ''espín
descendente". Entonces, cuando se incluye el efecto del espín electrónico, se debe
llegar a la conclusión de que dentro de cada banda de energía permisible del sistema
se tienen exactamente 2N estados cuánticos.
A una temperatura de cero absoluto, los electrones del sistema ocuparán estos
estados, uno por cada estado, como lo requiere el principio de exclusión de Pauli, a
partir del estado más bajo y en forma ascendente, hasta una energía dada que se
determina mediante el número de estados disponibles, su distribución de energía y el
número de electrones del cristal. Por supuesto, esta energía es la de Fermi del cristal
a la temperatura cero. En un cristal unidimensional, algunas de las bandas permisi-
bles estarán totalmente llenas, algunas completamente vacías y otras llenas sólo en
Representación de zona reducida; electrones y huecos 245

parte. 3 Si se aplica un campo eléctrico, es evidente que las bandas vacías no podrán
aportar ninguna corriente; sin embargo, también es cierto que no se puede obtener
una corriente de las bandas llenas. Esto se puede comprender observando que la
densidad de corriente que se produce en una banda dada será

(8.5-1)

en donde ¡:; es la velocidad promedio y n 0 el número de electrones por unidad de


volumen pertenecientes a dicha banda. No obstante, v se puede expresar como sigue

(8.5-2)

en donde la suma se toma de todas las velocidades a,.ociadas con los electrones
individuales dentro del volumen V del material. Por tanto, si se usa (8.5-2), la
expresión (8.5-1) se puede escribir como

(8.5-3)

Sin embargo, esto debe dar cero cuando se suma sobre una banda completa,
ya que debido a la simetría de las curvas de la figura 8.4 o la figura 8.5, alrededor
del eje E( k) por cada estado de velocidad positiva h- 1 aEjak correspondiente a un
punto de pendiente positiva, existe un estado correspondiente a una velocidad nega-
tiva de igual magnitud (con pendiente negativa) en k'=- k. Se debe llegar a la con-
clusión de que sólo las bandas que están parcialmente llenas pueden aportar un
flujo de corriente. Esto se comprende desde un punto de vista físico observando que
en la banda parcialmente llena existen siempre electroneo que se pueden excitar
gradualmente a estados desocupados de mayor energía y cantidad de movimiento,
mientras que en una banda llena, debido al principio de exclusión de Pauli, esta
excitación gradual de campo no puede ocurrir jamás debido a que todos los estados
están ya ocupados.
Un solo electrón en reposo en una banda vacía. ocupará el estado de energía
más bajo en la base de dicha banda, en ausencia de una excitación térmica, como se
puede ver en la figura 8.6. Si ahora se aplica un campo eléctrico E 0 al cristal, el
electrón experimentará una fuerza - eE0 y se excitará gradualmente a través de
estados de energía siempre creciente y cantidad de movimiento (negativa), adqui-
riendo una cantidad de movimiento cada vez mayor en la dirección - x, de acuerdo
con (8.4-5). De acuerdo con las predicciones de la teoría expuesta en las seccio-
nes 8.2-8.4, este proceso seguirá excitando al electrón a través de energías sucesiva-
mente más altas, hasta que llegue a la parte superior de la banda en x = rrfa, en
donde a es el espaciamiento reti~.ular. Puesto que los puntos x = rrfa y x = - rrfa son
equivalentes, se puede considerar que el electrón "reaparece" en x = rrfa, disminuyen-
do su energía a lo largo de la porción derecha de la curva conforme k va de rr/a a
cero, llegando al punto inicial en el que todo el proceso se repite. En estas circuns-
tancias, el movimiento del electrón es oscilatorio (oscilación de Zener). Es importan-
te observar que no existe un mecanismo inherente a la teoría de las seccio-
nes 8.2-8.4 que sirva para limitar este movimiento; más bien, éste continuará de un
modo indefinido de acuerdo con la teoría aquí delineada. Si el potencial fuera

3 La situación en los sistemas bidimensionales y tridimensionales es más complc1a. Fn estos


casos, la energía de diferentes bandas se puede superponer y más de una banda puede estar
parcialmente llena. Estos sistemas se estudiarán Pn detalle más adelante.
246 Teoría cuántica de los electrones en redes periódicas

r(k)

----•w+-----~~~----_,~-k
o

Figura 8.6. Un electrón que se encuentra cerca de la base de una banda permisible, sujeto a
fuerzas que tienden a acelerarlo a lo largo de la dirección -x.

perfectamente parabólico en lugar de tener la forma que se ilustra en la figura 8.6,


el electrón adquiriría una velocidad y energía ilimitadas. Entonces, se debe llegar a
la conclusión de que en cualquiera de los casos, el movimiento de un electrón libre
dentro de un potencial perfectamente periódico se realiza sin que lo impida la red,
en el sentido de que no se registran procesos de dispersión que detengan o aleato-
ricen la velocidad de un electrón, y que se relacionen con la misma
Sin embargo, si existe una desviación de la periodicidad perfecta de la red, este
resultado no se puede aplicar. En este caso existirá siempre la probabilidad de una
transición aleatoria repentina a un estado relacionado con otro valor de k dentro de
la banda. En promedio, estas transiciones aleatorias hacen que el electrón regrese a
k = O y se puede decidir que existe un proceso de dispersión asociado con el hecho
de que el potencial de red se aleja de la periodicidad perfecta. Esta desviación se
puede deber al hecho de que la red puede encontrarse a una temperatura superior al
cero absoluto, en cuyo caso las vibraciones térmicas que se establecen introducen
una leve aperiodicidad y las posiciones instantáneas de los átomos ya no coinciden
con precisión con la red periódica de sus posiciones de equilibrio. Esta situación se
puede analizar de acuerdo con una representación en la que los electrones se ven
dispersados por acción de los fonones. La desviaciones de la periodicidad pueden
causarse también por la presencia de átomos de impureza así como por vacíos de
red, átomos intersticiales dislocaciones y otros defectos estructurales de la red crista-
lina. Estos efectos dan como resultado los fenómenos de la dispersión de red, disper-
sión de impurezas y dispersión de defecto que se vieron en el capítulo anterior. El
estudio de los aspectos cuantitativos de estos procesos se pospondrá hasta un capí·
tulo subsecuente.
Estos procesos de dispersión hacen que el comportamiento de oscilación de Zener
no se presente jamás en la práctica. 4 Lo que en realidad sucede en todas las situa-
ciones experimentalmente factibles, es que un electrón que principia en O de la
figura 8.6, se acelera como lo describe la teoría de las secciones 8.2-8.4, hasta que
llega a un punto A a una pequeña distancia a lo largo de la porción parabólica
inferior de la curva. Su compartimiento en este rango es el de un electrón libre de
masa m*, como lo establece (8.4-8). En el punto A se ve dispersado por uno de los
mecanismos antes descritos, llegando en promedio nuevamente a O, en donde se

4 Se puede encontrar un estudio cuantitativo de la oscilación de Zener en E. Spenke,


Electronic Scmiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958), páginas 229, 257.
Representación de zona reducida; electrones y huecos 247

repite el ciclo. Entonces, el comportamiento es el de una partícula libre sujeta a


procesos de dispersión que se acaban de ver en el último capítulo, lo cual conduce a
la ley de Ohm, la conductividad térmica, el efecto termoeléctrico y todos los demás
resultados de la teoría del electrón libre de los metales, y la única diferencia es que
la masa del electrón se substituye por la masa efectiva en todos los procesos. La
distancia OA de la curva de e en función de k, de la figura 8.6, se ha exagerado
para facilitar la comprensión; pero en la mayoría de los casos que se presentan en la
práctica es mucho más pequeña.
Para una banda que contiene un número relativamente pequeño de electrones,
la corriente obtenida cuando se aplica un voltaje pequeño está dada por (85-3)
sumada sobre todos los electrones de la banda. Sin embargo, si la banda está casi
llena y se tienen sólo unos cuantos estados vacíos (que en el estado de equilibrio se
concentran cerca de la parte superior de la banda), 5 la ecuación de la corriente
(8.5-3) se expresa mejor escribiéndola en la forma

(8.5-4)

En este caso, la suma sobre i representa la adición sobre todos los estados de
velocidad ocupados por los electrones, la suma sobre ¡ representa la adición sobre
todos los estados de velocidad dentro de la banda y la suma sobre k representa la
adición sobre todos los estados de velocidad desocupados. Como se vio antes en
relación con (8.5-3), la suma sobre j, tomada sobre todos los estados de la banda, debe
desaparecer. La suma restante sobre los estados desocupados corresponde a una corrien-
te que podría producirse por un número correspondiente de portadores de carga po-
sztivos. Se puede (y es conveniente, como se verá más tarde) expresar la corriente de una
banda casi llena, como derivada del movimiento de un número comparativamente peque-
ño de estados electrónicos vacíos o huecos, que se comportan corno partículas positivas,
más que mediante un gran número de electrones. La velocidad asociada con un
hueco es la que tendría un electrón si ocupara un estado de energía vacío que
normalmente se encuentra en la parte superior de la banda de energía. Sin embargo,
puesto que la relación de e en función de k es cóncava hacia abajo, d 2 ejdk 2 es
negativa y da una masa electrónica efectiva negativa a partir de (8.4-8). Una par-
tícula con masa efectiva negativa experimenta una aceleración en una dirección
opuesta a la de la fuerza aplicada. Una partícula negativa con una masa efectiva
negativa entonces se acelerará en la misma dirección que el campo aplicado y presen-
tará el mismo comportamiento dinámico que una partícula positiva de masa positiva.
Por tanto, la situación de una banda casi llena se puede considerar como un caso en
que se abarca un número relativamente pequeño de partículas positivas de masa
positiva, que se designará como huecos, cuyas velocidades y cantidades de movi-
miento corresponden a los estados electrónicos desocupados dentro de la banda. En
un capítulo posterior se verá que en ciertos materiales, la naturaleza física y el
comportamiento dinámico de los huecos se comprenden con más facilidad relacionán-
dolos con los defectos en los enlaces electrónicos de valencia que unen a los átomos
más cercanos y proporcionan las fuerzas de cohesión que mantienen unido al cristal.

S En una banda parcialmente vacía, los electrones ocupan los estados de energía más bajos
disponibles en ausencia de una excitación térmica. Esto es aplicable también a la banda casi
llena, en donde el resultado es que los estado vados se localizan en la parte superior de la
banda. Por tanto, en una banda casi completamente llena, los estado~ vacíos '·gravitan" ascenden-
temente en un diagrama como el de la figura 8.5, en el que la ordenada representa la ener~ía de
un electrón.
248 Teoría cuántica de los electrones en redes periódicas

No se analizará detalladamente el comportamiento de los electrones y los huecos


bajo la influencia de la fuerza magnética; pero se puede demostrar6 que se mueven
como lo harían partículas negativas o positivas de masa efectiva m*, según lo que
establece (8.4-8), bajo la influencia de la fuerza magnética normal q(v x B)/c.

8.6 LA APROXIMACION DEL ELECTRON LIBRE

En las secciones anteriores se vio cómo un modelo particular de potencial


periódico (que se ilustra en la figura 8.2) condujo a la formación de bandas de
energía permisibles y a una relar;ión de e en función de k de la forma que aparece
en la figura 8.4. La forma de esta relación fue tal que la cantidad hk se podí::.
considerar ventajosamente como una "cantidad de movimiento del cristal" en cuyos
términos se podía explicar de un modo sencillo la dinámica de los electrones en los
campos de fuerza aplicados. La representación resultante del comportamiento elec-
trónico fue muy similar al del electrón libre del capítulo 7, excepto que la masa del
electrón libre se substituía por una masa efectiva y que los portadores de carga en
una banda casi llena tenían que considerarse como huecos positivos. Se dio énfasis al
hecho de que estas conclusiones cualitativas son independientes de la forma precisa
de la función de potencial, siempre y cuando sea periódico; se adoptó la función de po-
tencial de la figura 8.2 sólo con fines ilustrativos, ya que permitía una solución exacta
de la ecuación de Schrodinger.
En cristales reales, la función de potencial que se utiliza debe estar relacionada
de .algún modo con el potencial real experimentado por un electrón, debido a los
núcleos iónicos y a todos los demás electrones del cristal. Una solución exacta de
este problema, incluso en la aproximación de un sólo electrón, sería imposible de
lograr, por tanto, se acostumbra a plantear el problema desde el punto de vista de la
aproximación del electrón libre o la aproximación de enlace firme, cualquiera que
sea el más apropiado para la situación particular de que se trate.
En la aproximación del electrón libre, se supone que la energía total del
electrón es siempre grande en comparación con la energía potencial periódica. En
estas condiciones, las bandas permisibles serán anchas y las regiones de energía prohi-
bida muy angostas. Estas circunstancias nunca se realizan a la perfección en cristales
reales, dado que el potencial va siempre a - oo en los núcleos iónicos; pero para los
electrones más externos de muchos metales simples, incluyendo los alcalinos, los
requisitos se satisfacen aceptablemente en casi todo el volumen del cristal.
Si se adopta un modelo de potencial cristalino unidimensional para una mayor
facilidad, y el potencial periódico V(x) se escribe en la forma

(8.6-1)

en donde f(x) tiene la periodicidad de la red, la ecuación de Schrodinger (8.3-1) se


puede escribir como sigue

d 2 ~ +(k~+ yf(x))rf¡(x) =O. (8.6-2)


dx

6 R. A. Smith, Wave Mechanics o[ Crystalline Solids, John Wiley and Sons, Nueva York
(1961, página 458)
La aproximación del electrón libre 249

en donde k 0 está relacionada con la energía total e por medio de

(8.6-3)

Puesto que f(x) es periódica, se puede expresar como una serie de Fourier de
la forma
00

f<x>= ¿ c.e-2"i•xta (8.6-4)


n=- oo

siendo
c.= ~fa f(x)e2"inx/a dx, (8.6-5)
a o

en donde a es la constante de red del cristal. De acuerdo con (8.6-1), es evidente


que los coeficientes Cn se relacionan con los coeficientes de expansión de Fourier
del potencial periódico propiamente dicho a través de

(8.6-6)

en donde Vn se relaciona con los coeficientes de expansión de Fourier de V(x).


Puesto que las funciones de onda deben tener la forma de Bloch eikxuk(x), y,
dado que uk(x) debe ser una función periódica con un periodo a, expresable como
una serie de Fourier, se puede escribir

00

uk<x> = ¿ b.e-2"i•x/a (8.6-7)


n=- oo

tf¡(x) = eikxuk(x) = eikx ¿ b.e-2ninx/a. (8.6-8)



Para electrones perfectamente libres, -y= O y las soluciones se convierten en
funciones ondulatorias de partícula libre de la forma

(8.6-9)
En este límite uk(x) ~ b 0 y k~ k 0 , de tal modo que en el caso general, se
debe esperar que todos los valores de bn, excepto b 0 , se acerquen a cero conforme
-y tiende a cero. En consecuencia, se puede escribir una expresión aproximada para
la función de onda de la forma

(8.6-10)

que puede esperarse sea válida para valores pequeños de -y (es decir, para las condi-
ciones delineadas antes y de acuerdo con las cuales la aproximación del electrón
libre es válida). Es fácil ver que esta función de onda tiene la forma de Bloch, en
donde uk está dada por

uk<x> = bo +Y¿ b.e-2"i•xla. (8.6-11)


... o
250 Teoría cuántica de los electrones en redes periódicas

Al substituir (8.6-10) en la ecuación de Schrodinger (8.6-2), se obtiene

bo(k~ - k 2 )eik:J: + y L [(k~ - k~)b,. + b0 c,.]eik"x


.... o

(8.6-12)

en donde
k =k_ 2nn (8.6-13)
n
a

Puesto que el interés reside en la solución dentro del límite en donde 'Y-+ O,
como primera aproximación se puede hacer caso omiso del término -y 2 de ( 8.6-12);
entonces, multiplicando la ecuación completa por e-ikmx, integrando sobre la célula
unitaria desde x = O hasta x = a, se tiene que

b 0 (k~ - k 2 ) fa e2"imx/a dx + y L {[(k~ - k~)b,. + boc,.]


o .... o

X fa é"i(m-n)x/a dx} =O. (8.6-14)


Jo
Si m = O, la segunda integral desaparece para todos los valores de n en la
suma, por lo cual

or (8.6-15)

mientras que si m =1= O, la primera integral se desvanece y la segunda da cero, excep-


to cuando n = m, en cuyo caso se obtiene

o bien,
(8.6-16)

Entonces, a este orden de aproximación, de acuerdo con (8.6-15) y (8.6-3), la


relación entre e y k es la misma que la de una partícula libre. La función de onda
se obtiene substituyendo los valores (8.6-16) en lugar de bn en (8.6-10), de donde.

(8.6-17)

De acuerdo con (8.6-15) la corrección de primer orden para la energía de


partícula libre que se origina desde el potencial periódico es cero. La corrección de
energía de segundo orden se puede obtener reteniendo el término 'Y2 en (8.6-12). Al
multiplicar (8.6-12) por e-ikx e integrando desde x =O a x =a, se obtiene

(8.6-18)
La aproximación del electrón libre 251

La primera integral anterior es cero para todos los valores permisibles de n, en


tanto que la segunda integral es cero a menos que n =- n'. Por tanto, la ecuación
se reduce a

(8.6-19)

Si f(x) está dada como una serie de Fourier por medio de (8.6-4), entonces, al
substituir n por - n,
00
f(x) = :¿ c_"e2ttinxta, (8.6-20)
n=- oo

en tanto que, tomando el conjugado complejo de ambos lados de (8.6-4) y obser-


vando que puesto que f(x) es una función real, .f'(x) = f(x) se puede escribir tam-
bién

00
f<x> = :¿ c:e2ninxta. (8.6-21)
n=-oo

Puesto que los coeficientes de Fourier asociados con la representación de una


función dada son únicos, se debe tener

(8.6-22)

Usando la expresión de la primera aproximación (8.6-16) para los coeficientes


bn y la relación (8.6-22), la expresión (8.6-19) se puede escribir en la forma

(8.6-23)

Si se usa (8.6-3) y (8.6-6) para expresar este resultado en función de e y Vn,


se puede demostrar fácilmente que

(8.6-24)

Estas soluciones son satisfactorias sólo a condición de que k 2 no se acerque


a uno de los valores k~. Si k 2 ~k~ para algún valor de n, una de las cantidades
k 2 - k~ de los denominadores de los términos de suma de (8.6-17) tenderán a cero
y dicho término seguirá siendo muy grande a pesar de que r sea muy pequeño. En
este caso, la expresión supuesta (8.6-1 O) no es una buena aproximación para la
función de onda y se debe emplear otra forma. Entonces, si k 2 ~k~,

2nn
k = ± kn = ±k :¡: - . (8.6-25)
a
252 Teoría cuántica de los electrones en redes periódicas

Para el signo superior, esta ecuación da n =O, que se excluye de (8.6-17) en


cualquier caso y, por ende, no tiene ningún interés particular. Para el signo inferior
se obtiene

k= mt (8.6-26)
a

que, puesto que n puede tomar valores positivos y negativos, se refiere a todos los
puntos de borde de la banda. Será necesario utilizar un planteamiento por separado
para valores de k en las cercanías de estos puntos.
Supóngase ahora que k~ mrfa, de donde kn =k- (2rrnfa) ~- nrrfa. Por tanto,
k~~ k 2 y bn será muy grande de tal modo que en (8.6-17) la cantidad rbn ya no
será pequeña aunque r sea pequeña. En este caso se puede escribir la función de
onda aproximadamente como

(8.6-27)

considerando que los otros términos de la suma de (8.6-17) son despreciables en


comparación con el nésimo. Puesto que kn = - k en el borde de la banda, esta función
de onda (8.6-27) es una superposición de una onda que se propaga a lo largo del eje po-
sitivo x y otra que se propaga en dirección opuesta; por tanto, tiene el carácter de
una onda estacionaria. Esta situación física concuerda con el punto de vista de que la
función de onda del electrón sufre una reflexión de Bragg en k = ± mrfa. Si la fun-
ción de onda (8.6-27) se substituye en la ecuación de Schrodinger (8.6-2), utilizando
(8.64), se obtiene

Al multiplicar (8.6-28) por e-ikx y al integrar desde x =O hasta x =a, se


puede ver fácilmente que los términos segundo y tercero no contribuyen con nada y
que se obtiene una contribución del cuarto término sólo cuando n' = - n; el resul-
tado final de esta operación es, entonces,

De igual manera, al multiplicar (8.6-28) por e-•k"x = e


· "")x
-i(k- 2
a e integran·
do como antes, se puede demostrar que

Las dos ecuaciones anteriores se p01eden considerar como un conjunto de ecua-


ciones homogéneas que determinan a b 0 y bn. Como tales, las soluciones diferentes
a bo = bn =O existen sólo si desaparece el determinante del sistema, es decir, sólo si

1
k o2 - k2 y 2 c.* 1- 2 2 2 2
k2 _ k2 - (ko - k )(k 0 -k.)- y c. c.= O.
2 * (8.6-31)
1 c. O n
La aproximación del electrón libre 253

Esta ecuación es cuadrática en k~ y se puede resolver en la forma acostum-


brada para dar

(8.6-32)

que, utilizando {8.6-3), (8.6-16) y {8.6-13), se puede expresar como sigue

2
s(k) = 4ñm [ k 2 2nn) ±
+ ( k - --¡;-
2
J( ( k2 - k- 2nn)
--¡;-
2 2
) + (4miY.I)
-¡;r 2
] . (8.6-33)

En el borde de la banda k =k 71 = mrfa, y, en estos puntos, (8.6-33) se reduce a

(8.6-34)
en donde
Bn =~ (~) 2
2m a
(8.6-35)

representa la energía de partícula libre asociada con los puntos de borde de la


banda.
De acuerdo con los resultados de la sección 8.3, se sabe que en los puntos de
borde de la banda k=± mrfa, se produce una reflexión interna de Bragg que va
acompañada de una discontinuidad o "vacío de energía" en la curva de e en función
de k. 7 De acuerdo con esto, debe interpretarse que la ecuación (8.6-34) implica un
vacío de energía o banda prohibida con una anchura 21Vn l, en donde Vn es el
nésimo coeficiente de Fourier en la expansión de serie de Fourier del potencial reticular
periódico. Para valores de k de una magnitud mayor que mr/a se debe esperar que e(k)
sea mayor que el valor dado por (8.6-34) y que se acerque al valor del electrón libre pre-
dicho por (8.6-15), en donde k 2 difiere de k~ en una cantidad que puede hacer que 'Yhn
sea lo suficientemente pequeña de tal modo que el método que conduce a las ecuaciones
(8.6-1'6) y (8.6-24) sea legítimo. De igual manera, para valores de k con una magnitud
menor que mrfa, se puede esperar que e(k) sea menor que el valor dado por (8.6-34) y
que nuevamente se acerque a soluciones antes obtenidas, cuando k 2 difería de k~ por
una cantidad suficiente. Estas condiciones quedarán satisfechas si en (8.6-33) se
escoge el signo más para k> mr/a y el signo menos para k< mrfa. La solución
(8.6-15) o la segunda aproximación (8.6-24), que es mejor, en las regiones entre los
bordes de banda, junto con la solución (8.6-33) para las regiones cercanas a los
bordes de banda (los signos se seleccionan como se describió antes) conducen a una
relación entre e y k como la que se ilustra en la figura 8.7.
De acuerdo con esta figura, parece ser que las curvas de e en función de k son
aproximadamente parabólicas cerca de los puntos de borde de la banda. La masa
efectiva se puede establecer a partir de (8.4-8) mediante la derivación directa de
(8.6-33). Estos cálculos son muy elaborados y es más fácil proceder haciendo que

nn
k=-+k', (8.6-36)
a

7 El hecho de que la velocidad de grupo del electrón, en efecto es cero en estos puntos
como es de esperarse para las ondas estacionarias que se asocian siempre con la reflexión de
Bragg, se puede demostrar a partir de (8.6-33); los detalles de esta corroboración se les asignan
como ejercicio al lector.
254 Teoría cuántica de los electrones en redes periódicas

c(k)

-.,. .,.
o o

Figura 8.7. Representación esquemática de la relación € en función de k para la aproximación


del electrón libre, tal y como se obtiene a partir de (8.6-24) y (8.6-33)

en donde k' es pequeña en comparación con rr/a, en (8.6-33). Thspués de efectuar


algunas operaciones algebraicas, (8.6-36) se puede escribir en la forma

e( k)
2
1i
= 2m [(mt) 2+ k'2 + hl
-;;
mAe ~(n1t)2( 1i 2 )2]
\) + 4k'\-;; mAe1 (8.6-37)

en donde
Ae = 21V.I (8.6-38)

representa la anchura de la región de energía prohibida en k= nrr/a. Para puntos


cercanos al fondo de la banda superior, k' es muy pequeña y el radical de (8.6-37)
se puede expandir mediante el teorema del binomio que da, aproximadamente,

e(k) = e.
1 2
li k' (
+- Ae + - - 1+
2
4e)
A n ' (8.6-39)
2 2m Lle,

en donde En está dada por (8.6-35). Después de derivar dos veces y usar (8.4-8), es
evidente que
li 2 li 2 m
(8.6-40)
m* = d 2efdk 2 = d 2efdk' 2 = 1 + 4e. ·
Ae
Se puede demostrar de una manera similar que la masa efectiva para huecos
crrcanos a la parte superior de la banda inferior, es la misma que el valor de los
ele e trone~ dado por ( R.6-40).
La aproxifTIIlción del enlace firme 255

8.7 LA APROXIMACION DEL ENLACE FIRME

En la aproximación del electrón libre, la energía potencial del electrón se


supuso pequeña en comparacwn con su energía total. Esto condujo a un plantea-
miento aproximado en el que se encontraron bandas de energía prohibidas y permi-
tidas, y en donde la anchura de las bandas prohibidas era pequeña en comparación
con la de las bandas permitidas en el límite en el que se satisfacía la suposición
inicial. La aproximación del enlace firme parte de un punto de vista contrario, esto
es, que la energía potencial del electrón representa casi toda la energía; en este caso,
las bandas de energía permitidas son angostas en comparación con las bandas prohi-
bidas. En el modelo del electrón libre se supone que los átomos del cristal están tan
cerca unos de otros que las funciones de onda de los electrones de átomos circun-
vecinos se superponen en gran parte. Por tanto, existe una fuerte interacción entre
los átomos cercanos, y los estados de energía permisibles del cristal resultante tienen
muy poco parecido con las funciones de onda atómicas de los átomos individuales
de los que se compone el cristal. Sin embargo, la aproximación de enlace firme se
basa en la suposición de que los átomos del cristal están tan separados que la
función de onda de los electrones asociados con átomos vecinos se superponen sólo
en menor grado. La interacción entre átomos cercanos será relativamente débil en
este caso, y las funciones de onda y los niveles de energía permisibles de todo el
cristal estarán íntimamente relacionados con las funciones de onda y los niveles de
energía de los átomos aislados. Por supuesto, la pregunta de cuál de las dos aproxi-
maciones es correcta para una situación dada, depende del material particular de que
se trate. En algunas substancias, la aproximación del electrón libre es muy apropiada,
en tanto que en otras, la aproximación del enlace firme es mucho más correcta.
Existen también cristales para los que ninguna de ellas es adecuada ya que se trata
de una situación intermedia entre estos dos casos extremos.
Las funciones de onda del cristal en la aproximación del enlace firme se basan
en las funciones de onda de átomos aislados. Si la función de potencial relacionada
con un átomo aislado es V0 (r), entonces la solución de la ecuación de Schródinger

(8.7-1)

representa las funciones de onda electrónicas del átomo. Supóngase que la función
de onda de estado basal 1/1 0 no está degenerada y corresponde a una energía de
estado basal e0 • Si un gran número de átomos de este tipo se combinan en una red
periódica, de tal manera que el valor del potencial en las regiones que rodean a cada
átomo individual en donde la función de onda de estado basal es grande, no se ve
muy afectada por la presencia de los átomos vecinos, la función de onda del cristal
(por lo menos para estos estados de enlace más firme) se puede escribir como una
superposición lineal de funciones de onda atómicas de la forma

t/J(r) = L: ant/JoCr - r"), (8.7-2)


n

en donde los vectores r y r n se relacionan tal y como se indica en la figura 8.8. La


suma se toma sobre todos los átomos del cristal que, para mayor facilidad, se
supondrá que tienen una extensión infinita. Puesto que todos los átomos del cristal
son equivalentes, todos los coeficientes an deben tener el mismo valor absoluto; por
tanto, deben poder expresarse en la forma aél>n, en donde a y cf>n son cantidades
reales. Por la misma razón, la diferencia de fase cp entre cada par de átomos cerca-
256 Teoría cuántica de los electrones en redes periódicas

• • p • • •
• •
• •
• •

o • •

Figura 8.8. Geometría vectorial usada en el cálculo de la sección 8.7.

nos a lo largo de cualquier eje cristalino dado, debe ser la misma (aunque no
necesariamente es idéntica a lo largo de los tres ejes). Esto conduce a la selección
del factor de fase tPn = k • rn en donde k es un vector constante. Por último, si las
funciones 1/1 0 están normalizadas de tal modo que su integral tomada sobre todo el
espacio es la unidad y, si se desea conservar esta normalización, se debe tomar
a= l. En consecuencia, (8.7-2) se debe escribir en la forma 8

t/lk(r) = L eik-r"t/1 0(r - rn)· (8.7-3)


n

Estas funciones de onda satisfacen la ecuación de Schrodinger para todo el


cristal, con la función de potencial periódica de la figura 8.9, esto es,

(8.7-4)

El operador hamiltoniano total :Yf se puede escribir como la suma de dos


partes,

(8.7-5)

Potencial
1
r = rn

Figura 8.9. Funciones de potencial utilizadas en los cálculos de la sección 8.7.

8 Se puede demostrar que la ecuac10n (8.7-3) tiene la forma de una función de Bloch
semejante a (8.2-14). Los detalles de esta comparación se asignan como ejercicio.
La aproximación del enlace firme 257

siendo

(8.7-6)

y
(8.7-7)

De acuerdo con (8.7·1), es evidente que Jff ot/Jo = e0 ¡J; 0 , por lo cual, utilizan-
do (8.7-3),

J'f ot/lk = L eik '•Jff ot/lo(r- rn) =BoL eik '"t/lo(r- rn) = Bot/Jk· (8.7-8)
n n

Ahora, de acuerdo con (4.14-5), la energía e se puede encontrar determinando


el valor esperado del operador hamiltoniano, de donde, usando (8. 7-5) y (8.7-8),

f t/I:(Jffo + Jff')t/lk dv ft/lt L eikr"[V(r) -- V0 (J- rn)Jt/10(r- rn) dv

•~. ffN,ao ~•,+. . f.•N.d•


(8.7-9)

A condición de que se haga caso omiso de la pequeña superposición de las


funciones de ondas atómicas centradas en diferentes puntos de la red, las propieda-
des de normalización de las funciones t/Jo y la defmición (8.7-3) requieren que
i t/Jkt/Jk dv sea igual a .V, es decir, el número de átomos dE'l cristal. Si se usa este
hecho y se substituye el valor dado por (8.7-3) en lugar de t/Jk en el numerador de
(8.7-9), se obtiene

e= 60 + _!_ L \(L eik (r.-r,.)


N n m
J
v
t/JÓ(r- rm)[V(r)- V0(r- rn)]t/1 0(r- rn) dv}. (8.7-10)

Se verá que, debido a la periodicidad del cristal y a causa de la suma sobre todos
los valores de m, cada término de la suma sobre n da el mismo valor. El valor de la
suma sobre 11, por tanto es el valor de cualquier término de la suma (por ejemplo,
para mayor claridad, aquel para el que n = O) multiplicado por el número de tér-
minos de la suma, que es N En consecuencia, (8.7-10) se puede escribir como sigue

e( k)= e + Le- ik '"'


0
m
I v
t/ló(r- r"')[V(r)- V0(r)]t/1 0(r) dv, (8.7-11)

en donde la suma se toma sobre todos los átomos del cristal. Sin embargo, puesto
que la función de onda t/1 0 desciende casi siempre de un modo muy rápido con
respecto a la distancia y, puesto que las magnitudes de las integrales de (8.7-ll)
están gobernadas esencialmente por la cantidad de superposición entre dos funciones
de onda centradas en átomos separados por distancias r m, las contribuciom.s de los
términos de la suma se reducen con gran rapidez conforme aumenta rm. Por tanto,
generalmente se tiene como buena aproximación al considerar sólo los ténninos del
vecino más cercano. De acuerdo con esto, se hará caso omiso de todos los térn;inos
258 Teoría cuántica de los electrones en redes periódicas

que se relacionan con las contribuciones que van más allá de la del vecino más
cercano en (8.7-11). También se supondrá que las funciones de onda 1/Jo son es[é·
ricamente simétricas; en estas condiciones, todas las aportaciones del vecino más
cercano serán idénticas. En consecuencia, este método se reduce al caso en el que la
configuración electrónica de estado basal en el átomo aislado es la de un estado s
como es, por ejemplo, para los metales alcalinos, aunque la extensión a los estados p
es lo suficient~::mente directa y puede lograrse sin grandes problemas. 9
Para el caso m= O, la integral de (8.7-11) se convierte en

J.l/ló(r)[V(r)- V0 (r)]if¡ 0 (r) dv = -oc, (8.7-12)

mientras que, para los átomos más cercanos,

(8.7-13)

en donde rm es un vector que relaciona al átomo en el origen con el átomo vecino


más cercano. Puesto que el cálculo real de las integrales de superposición es mu}
complicado sólo se indicarán aquí los resultados en término de las cantidades que se
definieron antes como -a: y - {3. En estas circunstancias, la ecuación (8.7-11) se
puede escribir como sigue

e(k) = Bo -oc- f3 L e-ik •m, (8.7-14)


m

en donde la suma sólo considera los átomos más cercanos. En ei caso de un cristal
cúbico simple, las componentes del vector rm se pueden expresar como

rm = (±a,O,O), (O,±a,O), (O,O,±a), (8.7-15)

en donde a es la constante de red. La ecuación (8.7-14) da, entonces,

e(k) = e0 -oc- 2{3(cos kxa + cos kya + cos kza). (8.7-16)

De acuerdo con esta ecuación, es evidente que existe un rango de valores de


energía permisibles correspondientes a varios valores que pueden tener kx, k y y kz.
Los estados permisibles forman una banda de energía más o menos en la misma
fom1a en que sucede con las que se vieron en relación con la aproximación del
electrón libre.
De acuerdo con (8.7-16), el valor mínimo de la energía está en kx =kv=
kz =O en ese punto, es decir, en el origen de una gráfica con coordenadas ortogo·
nales (kx, k y, kz) en el espacio k. Los valores máximos se producen en los vértices

de un cubo dentro del espacio k cuyas coordenadas son ( ± ~.


± ~. ± ~). en don·
a a a
de todas las permutaciones de los signos 1- y -- entre las tres coordenadas se toman

9 Véa~e, por ejemplo, N 1· Mnlt y 11. Jones, Theory o[ Metals and Alloys, Dover Publica-
llon~. Nuev.1 York (1958), página 70.
La aproximación del enlace firme 259

para generar ocho puntos de los vértices. En estos sitios cada término de coseno
toma el valor - l. La diferencia de energía entre los puntos de energía máxima y
mínima es, de acuerdo con (8.7-16), 12 (3. Esta es la anchura de la banda de energía
correspondiente al estado s del átomo aislado. Si los átomos vecinos más cercanos están
muy separados, la superposición de las funciones de onda 1/; 0 (r) y 1/; 0 (r- rm), como
lo expresa el producto 1/; 0 (r)V; 0 (r- rm) en la integral (8.7-13), se hace muy pequeño
como sucede con el valor de {j según lo establece dicha ecuación. En el límite don-
de las distancias atómicas se hacen grandes (y es en este límite en donde son real-
mente adecuadas las aproximaciones en las que se basan los cálculos de enlace
firme), las bandas de energía permisible se hacen angostas acercándose a un solo
valor de energía discreta, correspondiendo al nivel energético del estado atómico s
conforme la separación se hace infinita. Esta variación de la anchura de banda con
el espaciamiento atómico se ilustra esquemáticamente en la figura 8.1 O

Niveles
Bandas atómicos
permitidas

Distancia
ES::>---------+- interatómica o
" • Espaciamiento o: 00

de equilibrio

Figura 8.10. Representación esquemática de la divhión de los niveles discretos de energía ató-
mica en bandas, conforme los átomos aislados se combinan en una red cristalina.

Para un electrón que se mueve en la dirección x, ky = kz =O. Si la cantidad


de movimiento es lo suficientemente pequeña de tal manera que kx ~ rrfa, el elec-
trón estará cerca de la base de la banda de energía. En estas condiciones, al aproxi-
mar el cos kxa en (8.7-16) mediante los dos primeros términos de su expansión de
serie, (8.7-16) se convierte en

(8.7-17)

Esto muestra que la relación E en función de kx es parabólica y que, por


tanto, el electrón se comporta básicamente como si fuera libre. Como siempre, la
cantidad llkx se puede interpretar como la componente x de un vector de cantidad
de movimiento del cristal p = llk. La masa efectiva está dada por

(8.7-18)
260 Teoría cUIÍntica de los electrones en redes periódica

De acuerdo con la simetría de la ecuación (8.7-16), es obvio que la masa


efectiva asociada con el movimiento en las direcciones y y para todas las cantida-
des pequeñas de movimiento, será la misma que la que se dio en (8.7-18) y, por
tanto, la masa efectiva es isotrópica o independiente de la dirección. No obstante,
no siempre sucede así, sobre todo en cristales no cúbicos; la masa efectiva en este
caso es anisotrópica con frecuencia, y debe considerarse como un tensor. Este punto
se verá más detalladamente en la siguiente sección. De acuerdo con (8.7-18), parece
que conforme aumenta la distancia reticular a, disminuye la masa efectiva; sin em-
bargo, lo que sucede es exactamente lo contrario, ya que conforme aumenta a, la
integral de superposición {3 disminuye con mucha mayor rapidez, de tal manera que
el producto {3a 2 disminuye rápidamente al incrementarse las distancias reticulares. Por
tanto, de acuerdo con (8.7-18), en el límite extremo del enlace firme, un electrón se
hace muy "pesado", lo c~al constituye una expresión del hecho de que, en estas
circunstancias, no se transfiere fácilmente de un átomo a otro.

8.8 DINAMICA DEL ELECTRON EN ESTRUCTURAS


BIDIMENSIONALES Y TRIDIMENSIONALES;
SUPERFICIES DE ENERGIA CONSTANTE
Y ZONAS DE BRILLOUIN

En esta sección se verá minuciosamente el comportamiento de los electrones en


redes periódicas bidimensionales y tridimensionales, utilizando siempre que se p_ue_da
el ejemplo del cálculo de la aproximación de enlace firme para la estructura cubica
simple, como ilustración de los principios generales en cuestión. Es evidente. que las
ecuaciones dinámicas de la sección 8.4 se pueden ex tender de un modo duecto a
una situación bidimensional, en cuyo caso se obtiene

(8.8-1)

para la velocidad del electrón, en donde Vk se refiere al operador gradiente en el


espacio ortogonal k cuyas coordenadas son (kx, ky, kz). Por tanto, se puede escribir

(8.8-2)

Si A es un vector cuyas componentes son las funciones de kx, ky y kz, cada


componente A~ (o:= x, y, z) debe satisfacer la relación

dA~= oA. dkx + iJAa '!_~ + iJA, dkz =(V kA). dk. (8.8-3)
dt okx dt oky dt okz dt ~ dt

El vector dA/dt, entonces puede expresarse, como el producto escalar del ten-
sor10 Vk A y el vector dk/dt, de donde,

dA dk
- - = (VkA) • -- (8.8-4)
dt dt '

lO t·:n l'l ¡1péndice B ~r incluye una hreve de~cripción del análisis ten~orial que se requiere
p.1ra l'ntrnder lo~ conccptm expucstm en este hhro.
Dinámica del electrón, superficies de P-nergía y zonas de Brillouin 261

cada componente del producto tensorial anterior conduce a una ecuación de la


forma (8.8-3). Al aplicar esta fórmula a (8.8-3), si se hace que k= p/h, se obtiene

(8.8-5)

Esta ecuación es básicamente la ecuación de fuerza de Newton dvg/dt = F/m*.


Sin embargo, es obvio que la recíproca de la masa efectiva es un tensor de la forma

(8.8-6)

Los elementos de este tensor son, claramente,

oe 2
(8.8-7)
li 2 okaokp'

lo cual demuestra que el tensor de masa efectiva recíproca es simétrico, es decir,


que

(1/m*)pa = (1/m*)afJ• (8.8-8)

En general, se debe considerar que la masa efectiva es un tensor debido a que


la curvatura de la relación e(k) no es necesariamente la misma a lo largo de todas
las direcciones posibles dentro del espacio k; en consecuencia, es posible que se
tenga una masa efectiva diferente para cada dirección posible.
Para el cristal cúbico s1mple de la sección 8. 7, para valon:s ka ~ 1, la ecua-
ción (8.7-16) se puede escribir en la forma

(8.8-9)

Esto permite ver que todos los elementos que están fuera de la diagonal del
tensor de masa efectiva (8.8-7) son cero, y que cada uno de los elementos sobre la
diagonal es igual a h2 /2{3t:z2, por lo cual el tensor se reduce a h2 /2{3a 2 por el tensor
unitario [Da¡¡]. La masa efectiva es claramente isotrópica en estas circunstancias y
puede representarse como la cantidad escalar h2 /2{32, lo cual concuerda con las
conclusiones de la sección anterior.
A continuación se investigará la forma de las superficies de energía constante
en el espacio k, para la estructura cúbica simple que se vio en la aproximación de
enlace firme en la sección anterior. La e~uación de estas superficies sencillamente es
(8.7-16) en donde e(k) se considera como una constante paramétrica. En relación
con (8.7-16) se mencionó que el valor mínimo de e se obtenía en el punto kx =
ky = kz = O, en donde todos los términos de coseno alcanzan el valor de la unidad.
Para valores de e ligeramente mayores que este mínimo, los cosenos deben estar
cerca de la unidad y, por tanto, los argumentos kxa, kya y kza deben ser todos muy
pequeños. En este caso, (8.7-16) se reduce a la forma antes indicada como (8.8-9),
que se puede reacomodar ligeramente para dar

2 2 2 e(k) e0 - oc - 6/3
kx + k, +k. = f3a 2 - {3a 2 = consl. (8J~-10)
262 Teoría cutintica de los electrones en redes periódicas

Evidentemente, esta es la ecuación de una esfera dentro del espacio k. La


forma esférica de todas las superficies de energía constante revela que los electrones
de esta región del espacio k se comportan como electrones libres; se observará en
(5.2-18) que, para partículas libres, es esférica la superficie de energía constante en
el espacio de la cantidad de movimiento. Conforme aumenta el valor de e, el radio
de la superficie esférica de energía constante también aumenta hasta que los valores
de k asociados con los puntos sobre la superficie se hacen tan grandes que la
aproximación ka < 1 ya no sigue siendo válida. En este caso, se debe usar la ecua-
ción más general (8.7-16) para graficar las superficies de energía constante y, confor-
me aumenta e, las superficies que se obtienen son como se ilustra en la figu-
ra 8.11(a-f). Al incrementarse e, la esfera se expande, se distorsiona un poco, como
sucede en (b) y en e= e 1 + 413 (en donde e 1 es el valor de e en el punto mínimo o
e0 -a- 613) adquiere una furma casi octohédrica como la que se presenta en (e).
En este punto, la superficie de energía toca el cubo limitante, cuyo lado es 2rr/a,
sobre el cual se hablará más tarde. Conforme e aumenta más todavía, la superficie
adquiere la forma que se ilustra en (d), y cuando e= e 1 + 813 adquiere la forma que
aparece en (e). En este punto la superficie se divide en ocho hojas. cada una de las
cuales se acerca al vértice del cubo conforme e tiende a su valor máximo para la
banda e1 + 12/3. Estas ocho ramas tienen una forma aproximada de octantes de una
esfera en el límite en que e se acerca a su valor máximo. La superficie de energía
constante tiene siempre una simetría cúbica en este ejemplo. Las intersecciones de la
superficie de energía constante con el plano kxky se ilustran en la figura 8.12. Se
puede considerar también que estas curvas son las de energía constante correspon-
dientes a un cristal bidimensional con una red cuadrada cuyo espaciamiento interató-
mico es a. De acuerdo con (8.7-16), es evidente que todos los estados dentro de la
banda deben tener una energía entre e 1 y e 1 + 12/3, y que todos los estados posibles
dentro de este rango de energía están representados por los valores de (kx, ky, kz)

que quedan dentro de los límites ( ± -,


1t
± -,
1t
± 1t)
- .
a a a
Si se tiene un número dado de electrones que pertenecen a esta banda de
energía y si la temperatura está en el cero absoluto, los estados electrónicos de
energía estarán todos ocupados hasta una energía de Fermi dada, de acuerdo con el
principio de exclusión de Pauli. Por tanto, la distribución de electrones quedará
dentro de un volumen en el espacio k que está limitado por una superficie de
energía constante y en donde el valor de la energía sobre la superficie es la energía
de Fermi e1. Con frecuencia, esta superficie se denomina superficie de Fermi. De
acuerdo con la exposición de la sección 5.5, se vio que la superficie de Fermi para
electrones libres es una esfera. Para electrones que están dentro de un potencial
periódico de un cristal, la superficie de Fermi puede ser también aproximadamente
esférica si la banda está casi vacía o casi llena; este hecho se ilustra claramente en la
figura 8.11(a) y (f) para el ejemplo que acaba de verse en detalle. A temperaturas
que sobrepasan al cero absoluto, algunos de los electrones se excitarán a estados de
energía superiores a e1 , quedando fuera de la superficie de Fermi, y se tendrán
algunos estados desocupados dentro de esta superficie. En consecuencia, la transición
entre los estados llenos y vacíos ya no será muy marcada. No obstante, si la
temperatura es pequeña en comparación con la de Fermi, la región de transición será
muy delgada y la validez esencial del cuadro de la superficie de Fermi no se verá
afectada.
A continuación se examinará lo que sucede en les puntos de la superficie del
cubo limitante que encierra al volumen del espacio k, que pueden ocupar los estados
electrónicos pertenecientes a esta banda. Para mayor simplicidad, primero se limitará
la atención solamente al plano kxky; las soluciones de este plano se relacionan con
Dinámica del electrón, superficies de energía y zona de Brillouin 263

(o) (ko«l) (b) (•«1+4/3)

(e) (• =• 1+4/3)

(e) (• =•1+8/3) (f) (•1+8/3« «1+12t:l)

Figura 8.11. Configuraciones sucesiva; de la superficie de Fermi para un cristal cúbico simple
con funciones de onda e'féricamente simétrica' en la aproximación en donde sólo
se toman en cuenta las interacciones del vcl in o má~ cercano. Al aumentar la
población electrónica en la banda, elevando con ello, el nivel de Fermi desde la
base de la banda ha~ta la parte superior de la misma, la superficie de Fermi pasa
de la forma casi esférica que aparece en (a), atravesando las formas intermedias
compleja~ (b)-(e), hasta llegar a la configuración cubo menos esfera en la zona de
Brillouin ca'i llena ilustrada en (f).

una red cristalina cuadrada bidimensional. Sea un punto en el borde superior (o


inferior) de la región cuadrada que se ilustra en la figura 8.12; la coordenada ky de
este punto es rrfa, en tanto que la coordenada kx puede tener cualquier valor
arbitrario, por ejemplo, kxo· Entonces, la longitud de onda A. del electrón estará
dada por

(8.8-11)
264 Teoría cuántica de los electrones en redes periódicas

en tanto que el seno del ángulo incidente e relacionado con un conjunto de planos
cristalinos paralelos al eje x, es

sen e= ky = nfa . (8.8-12)


Jk~ +k; Jk2
.xO
n2
+ a2
De acuerdo con esto, es obvio que la condición de Bragg (2.1-1) con n = 1, se
satisface mediante la función de onda electrónica en todos los puntos en esta parte
de la frontera. Del mismo modo, es fácil verificar que la condición de Bragg (relacio-
nada ahora con un ángulo incidente que se indica como un conjunto equivalente de
planos paralelos al eje y), se satisface en todos los puntos del borde derecho (o
izquierdo) del cuadrado limit.mte. El electrón, considerado como una onda, se difrac-
ta internamente mediante la red, siempre que su vector de cantidad de movimiento
toque esta frontera cuadrada. Los puntos del espacio k que quedan más allá de los
límites de estas fronteras corresponden a los puntos que están fuera de la banda de
energía más baja, perteneciendo a otras bandas que se originan en estados atómicos
de energía más alta que el estado basal. Los límites de las regiones del espacio k
ocupadas por las bandas más altas, se determinan mediante la orientación de las
fronteras a lo largo de las cuales se pueden producir reflexiones de Bragg (n > 1) de
orden más alto. Siempre existe un vacío de energía entre las bandas, como se ilustra
en la figura 8.10; por ejemplo, siempre que se cruza el borde de la región cuadrada
encerrada por las líneas kx = ± rr/a, ky = ± rr/a, debe ocurrir una discontinuidad de
energía acompañada de una reflexión interna de Bragg. El interior de la región
contiene la totalidad de estados pertenecientes a la banda de energía más baja.
Se observará que el vector k tiene las mismas dimensiones que la red recí-
proca. En la sección 2.6 se demostró que la condición de reflexión de Bragg puede
escribirse como
(8.8-13)

en donde k es el vector de propagación y en donde G/2rr es un vector que va desde


el origen hasta cualquier punto de la red recíproca. Para una red cuadrada bidimen-
sional de puntos cuyo espaciamiento reticular es a, la red recíproca es una red
cuadrada con un espaciamiento reticular 1/a. Si para mayor facilidad se considera
que el origen está en un punto de red, los vectores G tienen la forma

2n •
G,.. = -(¡,u" + viy. ) (8.8-14)
a

en donde ¡.¡. y v son enteros y en donde ix e iy son vectores unitarios en las


direcciones kx y k y, respectivamente. Si se usa esta forma para el vector G, (8.8-13)
se convierte en

¡.¡.k" + vk, = --1t (¡.¡. 2 + v2 ). (8.8-15)


a
Esta ecuación representa una familia de líneas rectas en el plano kxky. Sus
intersecciones kx y ky son
.. np.z+v2
k" mtcrseccwnes: - -- - - -
a fJ.
(8.8-16)

ky intersecciones:
a v
Diruímica del electrón, superficies de energía y zona de Brillouin 265

Cada una de estas líneas representa una frontera a lo largo de la cual se


produce una reflexión de Bragg y que puede formar la frontera entre estados perte-
necientes a diferentes bandas de energía. Si se toma 11 = O, v = ± 1, y 11 = ± 1, v = O
en (8.8-15), se obtienen las cuatro líneas kx = ± rr/a y ky = ± rr/a que encierran la
región ilustrada en la figura 8.12, cuyo interior contiene todos los estados de la

Figura 8.12. Contornos de energía constante dentro de la zona de Brillouin, para una red
cuadrada bidimensional, usando sólo funciones de onda esféricamente simétricas y
las interacciones del vecino más cercano. Se forma el mismo patrón mediante los
trazos de la superficies de Fermi de la figura 8.11 para la red tridimensional sobre
el plano kxky.

banda de energía más baja del cristal. Esta reg10n del espacio k se denomina la
primera zona de Brillouin (esta terminología ya se introdujo en relación con los
cálculos unidimensionales que se vieron en la sección 3.3). Si ahora se considera
J1 = ± 1, v = ± 1, se obtienen las cuatro líneas kx ±ky = 2rr/a y kx ± ky = - 2rrfa.
Estas cuatro líneas aparecen grafícadas en la figura 8.13(a). En estas fronteras, la
condición de Bragg (2.1-1) se satisface con el orden de reflexión n, que es igual a 2.
Esto se puede demostrar a través de los mismos métodos que se emplearon antes en
conexión con las fronteras de la primera zona de Brillouin. La región encerrada
entre la primera zona de Brillouin y estas cuatro líneas intersectoras contiene todos
los estados correspondientes a la segunda banda de energía (que se relacionaría con
el segundo nivel atómico de energía más baja si la aproximación del enlace firme
fuera válida). Esta se conoce como la segunda zona de Brillouin, que tiene la misma
área que la primera y, en efecto, las cuatro secciones independientes de esta zona se
pueden trasladar al interior de la primera moviendo las secciones paralelas a los ejes
en distancias que sean enteros múltiples de 2rr/a. Por tanto, las cuatro secciones
encajan como piezas de un rompecabezas para formar una región cuadrada que es
una réplica exacta de la primera zona, como lo ilustran las líneas punteadas de la
figura 8.13{a). La última representación de la segunda zona es, sencillamente, la
266 Teoria cuántica de los electrones en redes periódicas

Ir,

c:_--:_1 Pnmera zona


[~' Segunda zona
r::-l Tercera zona
_j

~] Cuarta zona
(e)
o

• Quinta zona

Figura 8.13. Construcción de las zonas de Brillouin para una red cuadrada bidimensional (a)
Primera y segunda zona~, (b) construcción de la tercera zona, (e) las primeras
cinco zonas.

representación de zona reducida de la secc1on 8.5. La justificación de una transfor-


mación de este tipo con referencia al modelo de Kronig-Penney ya se vio en esa
misma sección.
Expresado con más precisión, si

(8.8-17)

es una función de onda del sistema que satisface las ecuaciones de Schrodinger y
todas las condiciones de frontera pertinentes, y si se define

. ('2-
k , -_k_ lx n_,;rr)
- -
. (2nyn)
ly - - -
. (211zí'C)
lz - - ' (8.8-18)
a a a
Dinámica del electrón, superficies de energía y zona de Brillouin 267

en donde ix, iy e iz son vectores unitarios a lo largo de las direcciones kx, k y, kz y


en donde nx, ny, nz son enteros, la misma función de onda se puede expresar como

= eik' •v(r), (8.8-19)

en donde v(r) es nuevamente una función periódica que tiene la periodicidad de la


red. De donde la función de onda se puede escribir en la forma de Bloch en
términos de k o el vector de onda transformado k'. Se debe observar que (8.8-18)
se puede escribir también como

k'= k- G (8.8-20)

en donde G/2n es un vector que conecta dos puntos reticulares de la red recípro-
ca.11 La transformación (8.8-18) o (8.8-20) puede usarse siempre para llegar a una
representación de zona reducida en la que la zona transformada ocupa la misma
región del espacio k que la primera zona. La situación es muy similar a la que se
encontró en la sección 3.3 en el caso de las vibraciones mecánicas de una cadena
lineal de masas discretas puntuales y que se vio en relación con la figura 3.8.
Las zonas más altas se pueden construir mediante una ampliación del proce-
dimiento usado para llegar a la forma de la primera y segunda zonas. En (8.8-15), si
se toma 11 = O, v = ± 2 ó 11 = ± 2, v = O, se obtienen las cuatro líneas kx = ± 2n/a,
ky = ± 2n/a, como se indica en la figura 8.13(b). También en este caso es evidente
que la reflexión de Bragg se desarrolla a lo largo de estas líneas y la primera
reacción es asignar todos los espacios que quedan fuera de la segunda zona y dentro
del área encerrada por estas cuatro líneas, a la tercera zona de Brillouin. Sin em-
bargo, esto no es correcto, ya que esta área es mucho mayor que la de la primera y
segunda zonas, y cada zona de Brillouin debe encerrar la misma superficie dentro del
espacio k. En realidad, existen líneas de reflexión adicionales de Bragg que pasan
por esta superficie y forman fronteras que dividen este espacio en las zonas tercera,
cuarta, quinta y sexta. El criterio que se sigue para saber de qué zona se trata es el
siguiente: al desplazarse a lo largo de una línea radial general que no atraviesa
ninguna intersección de las líneas de reflexión de Bragg, principiando desde el ori-
gen, se debe pasar por la primera, la segunda, la tercera, la cuarta, • • • etc., zonas
sucesivamente, y cada línea de reflexión de Bragg que se cruce forma la frontera a
lo largo de la trayectoria radial entre una zona y la siguiente zona vecina más alta.
En consecuencia, al seguir adelante desde el origen por la línea OA, se penetra en la
tercera zona en C y se sale de ella en D, con la siguiente línea de reflexión de
Bragg que intersecta a OA, más allá de D, se penetra en la cuarta zona. No obs-
tante, si se desplaza a lo largo de la línea OB, se entra a la tercera zona en E y se
sale de ella en F, que se queda· sobre la línea kx = n/a que es ahora la tercera línea
de reflexión de Bragg desde el origen, a lo largo de la trayectoria OB. Más allá de
F, por la línea OB queda una parte de la cuarta zona. De donde, la tercera zona se
compone de los ocho triángulos que se ilustran en la figura 8.13(b). Nuevamente es
obvio que estos ocho triángulos se pueden ensamblar de tal modo que formen un
cuadrado dentro de la primera zona, si se someten a una traslación apropiada de
acuerdo con (8.8-18). Las fronteras de la cuarta zona se forman, en parte, por las

11 En efecto, la expresión (8.8-20) es en realidad la definición fundamental de esta trans-


formación, mientras que (8.8-18) se refiere específicamente a una transformación de esta natura-
leza en el caso particular de la red cúbica simple.
268 Teoría cuántica de los electrones en redes periódicas

líneas para las que J.1 = ± 1, v = ± 2, y J.1 = ± 2, v = ± 1 (en donde se toman todas las
permutaciones posibles de los signos más y menos). Se obtiene una familia de ocho
líneas (tales como kx ± 2kx =- Srr/a), que conduce a las fronteras de las zonas
cuarta y quinta, como se indica en la figura 8.13(c), por los procedimientos antes
descritos. Evidentemente, este método de cálculo se puede extender ad infinitum
para encontrar tantas zonas como se desee. Al construir las fronteras de las zonas de
Brillouin, de este modo, generalmente conviene principiar con vectores G cuyas
magnitudes (según se obtienen a partir de [8.8-14] o su equivalente en otra estruc-
tura cristalina) son tan pequeñas como sea posible, y luego procediendo al siguiente

(a)

(d)
(e)

Figura 8.14. Configuración de la primera zona de Brillouin para (a) una red cúbica simple, (b)
una red cúbica centrada en el cuerpo, (e) una red cúbica centrada en la cara y
(d) una red hexagonal.

conjunto de vectores G más cortos, Juego a los siguientes más reducidos y así
sucesivamente. Puesto que la condición de reflexión de Bragg implica la formación
de ondas estacionarias a una incidencia normal, la velocidad de grupo y, por ende, el
gradiente de e normal a la frontera de cualquier zona de Brillouin, debe desaparecer,
es decir,

(-aro)
ak .l a la frontera
1
= n · Vkw =- n · Vke =O
li
(8.8-21)

en la zona de frontera, si n es un vector unitario normal a la frontera. Se puede


verificar esta conclusión general a partir de los resultados del modelo de potencial de
Aisladores, semiconductores y metales 269

Kronig-Penney, la aproximación del electrón libre y la aproximación del enlace firme.


Estos detalles quedan como ejercicio para el lector.
La extensión de estos resultados para incluir redes tridimensionales es total-
mente directa. Por supuesto, en este caso las zonas de Brillouin son regiones tridi-
mensionales del espacio k encerradas por planos a lo largo de los cuales se satisface
la condición de Bragg. Las ecuaciones de estas fronteras de plano se obtienen de la
ecuación (8.8-13) al igual que sucedió en el caso bidimensional. Nuevamente cada
zona tiene un volumen equivalente y las partes separadas de las zonas más altas se
pueden juntar para formar una réplica de la primera zona, aplicando la transfor-
mación apropiada de (8.8-20). Es evidente que la primera zona de Brillouin para una
red cúbica simple es un cubo cuyo lado es 2Tr/a. La forma de la primera zona de
Brillouin para las redes cúbicas centrada en la cara y centrada en el cuerpo, así
como para la estructura hexagonal, se ilustran en la figura 8.14. La zona para la red
cúbica centrada en el cuerpo es un dodecaedro rómbico en el que todas las caras
son planos { 11 O} dentro del espacio k. La zona para la red cúbica centrada en la
cara es un tetradecaedro, un poliedro de 14 caras, que tienen una orientación {110}
y { 111}. La superficie de Fermi debe tener, en todos los casos, las propiedades de
simetría de la zona de Brillouin correspondiente que, a su vez, se relacionan con las
propiedades de simetría de la red cristalina.

8.9 AISLADORES, SEMICONDUCTORES Y METALES

En la seccwn 8.5 se demostró que no se puede obtener una corriente eléctrica


en bandas vacías o bandas totalmente llenas. Por tanto, cualquier conductividad
eléctrica que presente un cristal debido al movimiento de electrones libres, se debe
al movimiento de electrones dentro de las bandas de energía que están sólo parcial-
mente llenas. Esta observación constituye la base de la diferencia entre los aisladores,
los conductores metálicos y los semiconductores.
En un aislador, el número de electrones dentro del cristal es apenas el sufi-
ciente para llenar completamente cierto número de bandas de energía. Sobre estas
bandas de energía existe una serie de bandas totalmente llenas; pero entre las bandas
llenas y vacías se encuentra una región de energía prohibida tan ancha que es
prácticamente imposible, a temperaturas físicamente posibles, excitar térmicamente
un número importante de electrones para que atraviesen esta región desde la parte
superior de la banda llena más alta a la base de la banda vacía más baja. Entonces,
todas las bandas están ya sea llenas o vacías y no puede fluir una corriente de
electrones libres. Esta situación se ilustra en la figura 8.15(a).
Si es muy pequeño el vacío de energía .1€ entre las bandas llenas y vacías en este
tipo de cristal, y, por tanto, se tiene una probabilidad estadística apreciable de que
los electrones puedan excitarse térmicamente de estados cercanos a la parte superior
de la banda llena, para atravesar el vacío, hasta los estados cercanos a la base de la
banda vacía. Se dispondrá de un número limitado de electrones libres para conduc-
ción de corrientes eléctricas en la banda superior casi vacía y, además, los estados
electrónicos vacíos que quedan cerca de la parte superior de la banda más baja
permiten que esta banda contribuya al flujo de corriente eléctrica a través del meca-
nismo de conducción por huecos. Un material de esta naturaleza se conoce como
semiconductor; su conductividad eléctrica es casi siempre mucho menor que la de un
metal debido a la concentración limitada de electrones libres y huecos y, además,
depende enormemente de la temperatura, que aumenta con gran rapidez al incremen-
tarse ésta, ya que la probabilidad de la excitación térmica se incrementa con la
270 Teoría cuántica de los electrones en redes periódicas

temperatura. Por supuesto, la conductividad eléctrica de un semiconductor es tam-


bién una función del vacío de energía ..::le- La diferencia entre los aisladores y los
semiconductores es sólo de grado; todos los semiconductores pueden hacerse aisla-
dores ideales conforme la temperatura se acerca al cero absoluto, debido a que
entonces la probabilidad asociada con la excitación térmica se hace tan pequeña que
tiende a desaparecer. Del mismo modo, a temperaturas lo suficientemente elevadas
(que con frecuencia son imposibles de alcanzar en la práctica debido a que el cristal
se funde o se evapora), todos los aisladores presentan propiedades semiconductoras.
La estructura de las bandas de un semiconductor aparece ilustrada en la figu-
ra 8.15(b).
Si el número de electrones de un cristal no base.! para llenar por completo la
banda de energía más elevada, sino que la deja sólo llena en parte, muchos de ellos
pueden comportarse como electrones libres y servir como carga o portadores de
carga. En la figura 8.15(e) se ilustra esta situación. Un cristal de esta índole pre-
sentará todas las propiedades características de un conductor metálico, por ejemplo,
alta conductividad eléctrica y térmica y una gran reflectividad óptica.

Distribución
de Fermi-Dirac Banda "casi vacía"
Banda "vacía" ---~--
Electrones térmicamente Banda superior

6•
excitados
\-~------ ;_;= l Ban:~;~ ~:~~~:l=:_:nte llena l-
superpuesta

~~T ~~ ~j~&~~~
E d 1 •
sta os e ectronico~
~~ :wd~- Banda inferior;;
vacíos ~~y~~9~L );;:;: casi llena /;
W(///~%
w~lena/;/~
W'ff~
2LL/.'///h
?/íllenaW

0gUenaW
o
(o) Aislador (bl Semiconductor (el Metal (d)Metal
(Banda parcial- (Banda
mente llena) superpuesta)

Figura 8.15. Diagrama de las bandas de energía de (a) un aislador, (b) un semiconductor, (e)
un conductor metálico (banda parcialmente llena) y (d) un conductor metálico
(bandas superpuestas).

La determinación del número de estados electrónicos disponibles en una banda


de energía dada de una substancia particular, no es un procedimiento del todo
directo y, en general, implica el uso de técnicas de cálculo de la mecánica cuán tic a
que están fuera del alcance de esta obra. Si se supusiera que siempre es válida la
aproximación del enlace firme, las bandas de energía siempre se originarían de los
niveles de energía de los átomos aislados, las funciones de onda de una banda dada
se compondrían siempre de una combinación lineal de las funciones de onda del
estado electrónico de energía correspondiente de los átomos aislados y el factor de
degeneración, asociado con un nivel de energía dado en la banda de energía, sería el
mismo que el del nivel correspondiente del átomo libre. De acuerdo con esto, se
Aisladores, semiconductores y metales 271

tendría una banda ls ccrrespondiente al nivel ls, una banda 2s, una banda 2p, una
banda 3s, una banda 3p, una banda 3d y así sucesivamente. De acuerdo con la
ecuación (8.2-20), el número de niveles de cada banda sería N y, puesto que la
degeneración de cada nivel es el mismo que el del nivel atómico correspondiente, el
aúmero de estados cuánticos electrónicos (incluyendo la degeneración de espín) de
cada banda sería el que se indica en la tabla 8.1.

TABLA 8.1.

Banda No. de estados

Is 2N
2s 2N
2p 6N
3s 2N
3p 6N
3d ION

Por ejemplo, ahora se verá un metal alcalino como el sodio. El sodio tiene dos
electrones Is, dos electrones 2s, seis electrones 2p y un solo electrón 3s. En un
cristal de N átomos se tienen, entonces, 2N electrones ls, 2N electrones 2s, 6N
electrones 2p y N electrones 3s. Si se comparan estas cifras con las que se dan en la
tabla 8.1, se llega a la conclusión de que las bandas ls, 2s y 2p, están totalmente
llenas; pero que la banda 3s, que contiene 2N estados, sólo está llena a la mitad.
Por tanto, se puede esperar que el sodio -junto con todos los demás metales al-
calinos- sea un conductor metálico, como en efecto lo es. Por otro lado, si se
acepta estríctamente este método, debe esperarse que el magnesio, cuya estructura
atómica es Is 2 )2s 2 2p 6 )3s 2 , sea un aislador o semiconductor, ya que ahora la banda
3s está llena. El hecho de que el magnesio (y otros elementos alcalinotérreos)
sean metales, se debe al hecho de que la energía de las bandas 3s y 3p se super-
pone y algunos de los electrones "se derraman" de la banda 3s a la 3p, dejando
a la primera no del todo llena y haciendo que está última esté parcialmente ocu-
pada, como se ilustra en la figura 8 lS(d). En realidad, las funciones de onda 3s
y 3p de estas bandas se entremezclan intensamente, de modo que ni siquiera es del
todo correcto referirse a las bandas en esta forma. A decir verdad, el método
sencillo del enlace firme ya no es una buena aproximación que permita describir el
comportamiento de los electrones s y p en la capa exterior de valencia de la
mayoría de las substancias metálicas; esta mezcla de las bandas s y p para los
electrones de valencia es más bien la regla que la excepción. Por ejemplo, en el caso
del silicio, los estados 3s y 3p se combinan en dos bandas que no se superponen, en
donde cada una de ellas contiene 4N estados, de tal manera que los electrones de
valencia 4N ocupan por completo la banda inferior para fonnar la configuración de
banda de un semiconductor como la de la figura 8.15(b).
La superposición de bandas se produce a pesar de que existe un vacío de
energía en todos los puntos en la frontera de la zona de Brillouin que separa las dos
bandas. Usando la zona cuadrada de la figura 8.12 como ejemplo, se puede ver
claramente cómo se presenta esta situación. La superficie de Fermi en esta figura
toca primero la frontera de zona a lo largo de los ejes kx y ky a una energía
E= e 1 + 4(3; pero la zona de Brillouin y la banda de energía correspondiente no
~stán completamente llenas hasta que e -- <: 1 + 8(3. Puede suceder que el vacío de
energía entre esta banda y la siguiente, en la dirección de los ejes kx y k y, sea
272 Teoría cuántica de los electrones en redes periódicas

menor que 4(3, que es la energía adicional requerida para llenar por completo la
banda inferior. Si esto sucede, los electrones se derramarán hacia la banda superior
en las direcciones kx y ky antes de que se llenen por completo los vértices de la
zona original, dando como resultado la situación de superposición de bandas que se
mencionó anteriormente. Esta situación se ilustra en la figura 8.16. Debe recalcarse

~(k)

Esquinas no llenas
Electrones que de la banda inferior
llenan parcialmente (conducción por huecos)
la sigUI en te
zona superior

Los electrones
"se derraman"
sobre la
siguiente banda
(conducción
por electrones)
Esquinas de la
zona no llena

(a) .,.
a
- - ~(k) Relación a lo largo de la trayectoria OA
- - - <(k) Relación a lo largo de la trayectoria OB
(b)

Figura 8.16. (a) Un caso en el que los estados de energía más bajos dentro de la banda más
alta (en los centros de los lados de la zona cuadrada, sobre los ejes kx y kY.)
tienen una energía más baja que los estados de energía más alta de la banda más
baja (en las esquinas de la zona). En estas circunstancias, los electrones comienzan
a ocupar la banda más alta antes que la más baja esté completamente llena. (b)
Representación esquemática de la relación de f en función de k en la dirección
OA (las curvas continuas) y OB (curvas punteadas) que ilu~tra de un modo ligera·
mente distinto la situación descrita en (a)

que cuando se presenta esta circunstancia, la supostcton simple del enlace firme de
las funciones atómicas de onda asociadas con un solo nivel ya no es válida y que las
bandas de energía se deben volver a calcular, suponiendo una mezcla de funciones
de onda relacionadas con ambas bandas. También debe hacerse notar que en esta
situación, tanto la conducción electrónica efectuada por los electrones que se derra-
man hacia la banda superior, como la conducción de huecos realizada por los es-
tados vacíos en la parte superior de la banda más baja, se producen de un modo
simultáneo. La superficie de Fermi entonces tiene dos ramas separadas, una para
electrones en la zona externa y otra para huecos en la zona original. Si la masa
efectiva del hueco es menor que la del electrón, esta situación conduce a un coefi-
ciente positivo de Hali.l 2 Así se puede comprender una de las discrepancias más
inquietantes de la teoría original del electrón libre de los metales.

12 En un capítulo posterior se verá la forma en que esto sucede.


Densidad de la función de estados y Cllmbios de fase 273

Se observa que la teoría cuántica permite entender en términos generales, por


qué las propiedades eléctricas de los conductores metálicos y los aisladores son tan
marcadamente distintos, aun a pesar de que con frecuencia se requiere un cálculo de
mecánica ondulatoria muy elaborado para establecer con exactitud las superficies de
énergía y las funciones de onda relacionadas con las bandas electrónicas de valencia
en una substancia en particular.

8.10 DENSIDAD DE LA FUNCION DE ESTADOS


Y CAMBIOS DE FASE EN ALEACIONES BINARIAS

En el capítulo 5 se derivó la función de densidad de estados para partículas


libres en la forma de la ecuación (5.2-22). Intuitivamente, parece obvio que la fun-
ción de densidad de estados para los electrones dentro de los cristales debe ser la
misma que la que se obtuvo antes, excepto quizá que se debe incluir la masa
efectiva en lugar de la masa inercial. En breve se verá que esto es cierto, a condi-
ción de que las superficies de energía constante sean esféricas. Sin embargo, si las
superficies de energía constante se desvían de la forma esférica, la función de den-
sidad de estados se hace mucho más compleja.
Para principiar, es importante indicar que los valores permisibles para la can-
tidad de movimiento del cristal hk, cuando se imponen condiciones periódicas de
frontera, de acuerdo con (8.2-20), son los mismos que los valores permisibles de la
cantidad de movimiento inercial de una partícula libre, como lo establece (5.2-15).
El volumen de espacio de la cantidad de movimiento por estado cuántico, entonces
es el mismo que antes y la tarea de determinar la densidad de estados puede
lograrse, como antes, encontrando el número de estados cuánticos dv entre las super-
ficies de energía constante correspondientes a las energías e y e +de, calculando el
volumen del espacio de la cantidad de movimiento entre las dos superficies y divi-
diendo entre t/h 3 , el volumen por estado cuántico. El elemento de volumen del
espacio de cantidad de movimiento se puede escribir como sigue
h3
dvP = p2 sen(} dp d(} d</J = 8n: 3 k 2 sen 8 dk d(} d</J, (8.10-1)

por lo cual, el número de estados dentro del volumen es

dvP 1 1 dk
lh 3 = -4 3 k 2 sen(} dk d(} d</J = - 3 - • k 2 sen(} de d(} d<jJ. (8.10-2)
z n: 4n: de

El número de estados dv = g( e) de en el rango dt: energía de alrededor de e se


obtiene integrando sobre los ángulos polares O y cf> en el espacio k. De donde,

1 ffk 2 sen(} d8 dcp 1 f dSk (8.10-3)


g(e) = 4n: 3 (defdk) = 4n: 3 Js (defdk)'

en donde dSk representa el elemento de superficie de área k 2 sen OdO dcf> sobre la
superficie de energía constante dentro de la zona de Brillouin. Es evidente que si se
conoce la función e(k), la densidad de estados se puede calcular, en principio, a
partir de (8.10-3). Sin embargo, desafortunadamente la forma matemática de e(k) es
274 Teoría cuántica de los electrones en redes periódicas

tan compleja en casi todos los casos de interés práctico, que la integración se puede
efectuar sólo por métodos númericos. Para la red cúbica simple en la aproximación
del enlace firme, la función e(k) para una banda s está dada por (8.7-16) y la
densidad correspondiente de la función de estados, según lo establece (8.10-3), es
como se ilustra en la figura 8.1 7.

Figura 8.17. Curva de densidad de estados para una red cúbica simple de acuerdo con la
aproximación del enlace firme, como se calculó a partir de (8.10-3) y (8.7-16).

Cerca de la base de la banda de energía de este ejemplo en particular, la


forma de e(k) está rlada por (8.8-9); entonces, se tiene, para esta región.

de 2
y dk = 2{Ja k. (8.10-4)

Puesto que e es independiente de 8 y cp en estas circunstancias, (8.10-3) se


puede integrar sobre estos ángulos para que dé

n
i i"
dk 2 "
g(e) = -4 13 k 2 -d
eoo
sen e dO de/> = k2 2 -d
ne
dk , (8.10-5)

o bien, usando (8.10-4),

(8.10-6)

Si se usa (8.7-18) para expresar {Xl 2 en términos de la masa efectiva, esto se


puede escribir como

g(e) 8~
= _v_"'-~' m*312Je--e (e - e1 ~ 12{1),
h3 1 (8.10-7)

que, a condición de que el origen de la energía se tome en la base de la banda, es


la expresión parabólica acostumbrada de la densidad de estados de' electrón libre, en
donde la masa inercial se ha substituido por la masa efectiva m*. De un modo algo
similar, se puede demostrar que para energías cercanas a la parte superior de la
Densidad de la función de estados y cambios de fase 275

banda, en donde las superficies de energía constante vuelven a tener una forma
esférica, se puede escribir

g(e) =
sJ2n m* 312 J---c-·
-¡:;r &1 + 12/3 - & (e1 + 12p - e ~ 12/3). (8.10-8)

Esta función de densidad de estados se desvanece en la parte superior de la


banda, en donde e= e 1 + 12{3, y aumenta parabólicamente para energías decre-
cientes. En consecuencia, se puede considerar como una función de densidad de
estados de partículas libres para conducción por huecos en una banda casi llena. Las
funciones de densidad de estados de electrón libre (8.1 0- 7) y (8.1 0-8), se obtuvieron
en relación a un ejemplo específico; pero se puede demostrar que se obtienen las
mismas expresiones para cualquier estructura cúbica, ya sea que la aproximación de
enlace firme se aplique o no. En los metales del grupo de transición, una banda más
bien angosta que se origina en los estados atómicos 3d, que alojan a 1ON electrones,
se superpone a la banda electrónica de valencia 4s, dando origen a una curva de
densidad de estados para los electrones de valencia como la que se ilustra esquemá-
ticamente en la figura 8.18. A esta curva peculiar de densidad de estados se deben
muchas de las propiedades características de estos metales.

g(•)
d-Banda

Figura 8.18. Característica de superposición de las bandas s- y d- de los metales de transición.

La forma de la curva de densidad de estados y el concepto de la superficie de


Fermi para los electrones de valencia dentro de la zona de Brillouin, se ha utilizado
para explicar ciertos cambios de fase que se relacionan con las aleaciones binarias de
cobre, plata y oro con metales divalentes y trivalentes. El cobre, la plata y el oro
puros son todos elementos nomovalentes que tienen una estructura cúbica cen-
trada en la cara. Por ejemplo, si se principia con plata pura y se agregan cantidades
crecientes de cadmio, la estructura cúbica centrada en la cara que se denomina de
fase a se conserva hasta una concentración determinada de cadmio (llamada límite
a), que es un punto en el que se produce un cambio de fase y la estructura del
cristal cambia de cúbica centrada en la cara a cúbica centrada en el cuerpo, siendo
esta última denominada fase (3. Si la concentración de cadmio se incrementa más
todavía, la estructura cúbica centrada en el cuerpo de fase (j es estable sobre cierto
rango de concentración después del cual se llega a otro punto de transición (deno-
minado límite (j) y la fase (j se transforma en una fase 'Y cuya estructura es un
arreglo cúbico muy complejo en el que se tienen aproximadamente 52 átomos por
célula unitaria. A concentraciones de cadmio todavía mayores, se llega al límite 'Y y
27 6 Teoría cuántica de los electrones en redes periódicas

se forma una fase hexa~onal 'TI de empaquetamiento compacto. Las aleaciones de


otros metales nobles y las que se logran con otros aditivos multivalentes, siguen el
mismo patrón general de cambios de fase aunque los límites a:-, {j- y r- son diferen-
tes en cada sistema individual.
Hume-Rothery 13 sefialó que los límites a:-, {j- y r- de estos sistemas de aleacio-
nes se producen siempre en ciertas razones bien definidas de electrones de valencia
por átomo. En consecuencia, parece ser que el límite {j se alcanza siempre en el
punto en el que se tiene justamente alrededor de 3/2 de electrones de valencia por
cada átomo del cristal, y el límite 'Y se obtiene a una relación de electrón de
valencia por átomo de 21/13. Jones 14 explicó estas observaciones empíricas de
acuerdo con las bases fundamentales. En primer lugar, se debe observar que para el
metal puro monovalente cúbico centrado en la cara que está en la fase a:, la zona de
Brillouin (reducida) para los electrones de valencia es como se indica en la figu-
ra 8.14(e). Puesto que los electrone~ de valencia de los metales nobles son de tipo s,
se puede esperar que esta zona de Brillouin contenga 2N estados electrónicos. En el
caso del metal puro, la zona está llena sólo a la mitad debido a que el número total
de electrones de valencia es N, en este caso. Para mayor facilidad se supondrá, como
lo supuso Jones, que la superficie de Fermi dentro de la zona es esférica en todo
momento. 15 Basándose en esta simple suposición, se puede calcular la curva de
densidad de estados para la zona de Brillouin de un modo muy sencillo; el resultado
aparece ilustrado de una manera esquemática en la figura 8.19. La función de den-
sidad de estados es, sencillamente, una parábola del electrón libre hasta que la esfera
de Fermi toca la frontera de la zona. Sin embargo, a partir de este punto, las
fronteras de la zona cortan partes de la esfera de Fermi y un incremento dado del
radio (correspondiente a un incremento específico de energía) abarca sólo un nú-
mero relativamente pequefio de estados en las esquinas de la zona de Brillouin. La
curva de densidad de estados decrece con gran rapidez, acercándose a cero cuando el
radio de la esfera de Ferrni es igual al radio de la esfera circunscrita. Se puede

La esfera de Fermi
¡-toca la zona de la frontera

Figura 8.19. Representación de la curva de densidad de estados de la red cúbica simple basada
en la idea de la superficie esférica de Fermi que se expande dentro de la zona de
Brillouin, tal y como la empleó Jones.

13 W. Hume-Rothery, The Metallic State, Clarendon Press, Oxford (1931), página 328.
14 H. Jones, Proc. Roy. Soc. 144, 225 (1934); 147, 396 (1934). Véase también N. Mott y
H. Jones, op. cit. página 170.
15 Esta suposición es más apropiada en este caso que en el del cubo simple, cuyas super-
ficies de Fermi se ilustran en la figura 8.11, debido a que la zona de Brillouin circundante tiene
una forma más esférica. En cualquier caso, la forma exacta de la superficie de Fermi no es
particularmente importante para energías TTIIlyores que la que se requiere para que la superficie
de Fermi roce apenas la frontera de la zona.
Densidad de lo función de estados y cambios de fose 277

observar la misma conducta general en la curva de densidad de estados de la figu-


ra 8.17, que se relaciona con una red cúbica simple.
Cuando los átomos de un metal multivalente forman una aleación con la fase
a: monovalente, aumenta el número de electrones libres por átomo, se eleva el nivel
de Fermi y también aumenta el radio de la esfera de Fermi dentro de la zona de
Brillouin asociada con los electrones de valencia. Más allá del punto en el que la
esfera de Fermi toca la frontera de zona, se produce un gran incremento de energía
electrónica con cada pequeño incremento de concentración de electrones libres y,
por tanto, con cada pequeño aumento en la concentración del aditivo multivalente.
En este punto, se obtendrá una energía electrónica total más baja si el cristal sufre
un cambio de fase a una red cuya zona de Brillouin dé acomodo a una esfera
inscrita de mayor tamaño y, en efecto, esto es lo que sucede. La fase a: cúbica
centrada en la cara cambia a una fase (j cúbica centrada en el cuerpo, cuya zona de
Brillouin [figura 8.14(b)] tiene, en efecto, una esfera inscrita de mayor tamaño,
aunque se trate del mismo volumen. Si se hace una adición posterior del elemento
multivalente de la aleación, el radio de la esfera de Fermi aumenta más todavía y
por último toca la superficie de la zona de Brillouin de fase (j. Nuevamente se
produce un cambio de fase, la zona de Brillouin de la fase 'Y resultante viene a ser
un poliedro complejo de 36 caras que tiene una forma más bien esférica 16 que el
dodecaedro rómbico asociado con la fase (j y cuya esfera inscrita es, por ende,
mayor todavía.
De acuerdo con estos argumentos, se pueden hacer cálculos cuantitativos de los
límites a:-, (j- y -y-. En la fase a:, la esfera de Fermi llega primero a la frontera de
zona en las direcciones {lll} dentro del espacio k. El plano (111) que forma parte
del poliedro de la zona de Brillouin tiene [de acuerdo con (8.8-13)], la ecuación

kx +k,+ k,.= 3nfa. (8.10-9)

En el punto de contacto, en el centro de la cara (111), kx = ky = kz = rra, por


lo cual, el radio de la esfera de Fermi es el punto de contacto, kc, debe ·estar dado
por

(8.10-10)

En estas condiciones, el volumen de la esfera de Fermi es 4rrkU3, ó


4 ./frr(rr/a )3, en tanto que se puede demostrar fácilmente que el volumen total de la
zona es la mitad del volumen de un cubo de lado 4rrfa, ó 32(rr/a) 3 . La razón del
volumen de la esfera inscrita a la zona es, por tanto, la relación de estos dos
números, o sea, rr y3/8. El número promedio de electrones de valencia por átomo es
el número por átomo cuando la zona está llena (es decir, 2) por la fracción del
número de estados dentro de la zona que están ocupados. El número de electrones
de valencia por átomo para el límite a: es, entonces, rr y3/4 ó 1.362. Los valores de
los límites (j- y -y- se pueden obtener usando los mismos procedimientos generales.
En la tabla 8.2 se ilustran los valores obtenidos en comparación con los valores
derivados empíricamente por Humes-Rothery.
Naturalmente, puesto que las superficies de Fermi no pueden ser perfectamente
esféricas, las estimaciones de Jones deben considerarse sólo aproximaciones; sin em-
bargo, se ha encontrado que concuerdan muy bien con los límites de fase determi-
nados de un modo experimental. Los diagramas de fase de sistemas de aleaciones
más complejos se entienden a menudo de acuerdo con las superficies de energía

16 Véase F. Seitz, Modern Theory o[ Solids, McGraw-Hill Book Company, Inc., Nueva
York (1940), figura 13, página 433.
278 Teoría cuántica de los electrones en redes periódictJS

TABLA 8.2.
Relación electrón-átomo

Límite de fase Hume-Rothery· Jones


a 1.362
p 1.5 1.480
y 1.615 1.538

electrónica y la función de densidad de estados dentro de la zona de Brillouin; pero


los detalles de los cálculos y las respuestas resultantes son muy complejas.

EJERCICIOS
l. Demuestre que si en el modelo del potencial de la figura 8.2, usado en relación con el
cálculo de Kronig-Penney, se permite que V0 se haga infinitamente grande y b tienda a cero en
tal forma que el producto P =- {j2ab/2 se mantenga fijo, entonces la ecuación (8.3-12) se
convierte en

sen aa
P--
aa
+ cos aa =cuska.

Si se hace una gráfica de la función del lado izquierdo, se observará que se comporta de un
modo similar a (8.3-15) y (8.3-16) como se ilustra en la figura 8.3. La cantidad P se puede
considerar como la "potencia de dispersión de un solo pico de potencial".
2. Demuestre que en el caso que se vio en el ejercico 1 anterior, la cantidad de/dk
desaparece en los bordes de la banda (k = nTr/a ).
3. Demuestre que para la- aproximación unidimensional del electrón libre que se vio en la
sección 8.6, de/dk desaparece en los bordes de la banda.
4. Demuestre que para la aproximación de enlace firme en la red cúbica simple que se vio
en la sección 8. 7, n • V.e desaparece en todos los puntos sobre las fronteras cúbicas de la
primera zona de Brillouin.
5. Demuestre explícitamente que los poliedros que aparecen en la figura 8.14(b) y (e) son
las formas correctas correspondientes a la primera zona de Brillouin para las redes cúbica cen-
trada en el cuerpo y cúbica centrada en la cara, respectivamente.
6. Encuentre la relación e(k) para una banda s (funciones de onda esféricamente simétri-
cas) en la aproximación de enlace firme para un cristal cúbico centrado en el cuerpo. Tom,!l·ep
cuenta sólo las integrares de superposición del vecino más cercano. Grafique las formas de las
superficies de energía constante para varias energías dentro de la zona. Demuestre que estas
superficies son esféricas, como sucede en el caso de los electrones libres, para energías cercanas a
la base de la banda. Demuestre también que n • v'.e se desaparece;: en las fronteras de la zona.
7. Obtenga todos los resultados que se requieren en el eJercicio 6 anterior, para una banda
s en un cristal cúbico centrado en la cara de acuerdo con la aproximación del enlace firme,
teniendo .m cuenta sólo la superposición de las funciones de onda del vecino más cercano.
8. Haga un diagrama rsimilar al de la figura 8.13(c)] dentro del plano k, de las primeras
=
cinco zonas de Brillouin de una red bidimensional definida por los vectores de base a aix, b =
3aiy Nota: no se pueden usar las fórmulas (2.5-5) para definrr una red recíproca bidimensional,
debido a que el producto transversal no se puede definir en un espacio bidimensional. Proceda a
partir de las defmiciones fundamentales (2.5-1) y (2.5-2).
9. Demuestre explícitamente, a partir de los resultados de la sección 8.7, que la densidad
de estados cerca de la parte superior de la banda de energía, para el cristal cúbico simple, que
se vio en detalle en esa sección, está dada por la ecuación (8.10-8).
LO. Demuestre que la relación limitante de electrón de valencia por átomo para la tase (3
(cúbica centrada en el cuerpo) de una aleación binaria del tipo que se vio en la sección 8.10, es
1.489. Puede tomar en cuenta la suposición del cálculo de Iones.
11. Demuestre que la función de onda (8.7-3) que se usó en el cálculo de la aproximación
de enlace firme, se puede expresar como una función de Bloch de la forma (8.2-14).
Lecturas recomendadas 279

LECTURAS RECOMENDADAS
W. Hume-Rothery, The Metallic State, Clarendon Press, Oxford (1931).
H. Jones, The Theory of Brillouin Zones and Electronic States in Crystals, North Holland Pu-
blishing Co., Amsterdarn (1960).
N. F. Mott y H. Jones, Theory of Metals and Alloys, Dover Publications, Inc., Nueva York
(1958).
S. Raimes, The Wave Mechanics of Electrons in Metals, Interscience Publishers, Nueva York
(1961).
F. Seitz, Modern Theory of Solids, McGraw-Hill Book Co., lnc., Nueva York (1940).
R. A. Smith, Wave Mechanics of Crystalline Solids, John Wiley & Sons, Inc., Nueva York (1961).
E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958).
A. H. Wilson, Theory of Metals, 2.a Edición, Cambridge University Press, Nueva York (1953).
CAPITULO 9
Semieonductores electrónicos
unifortnes en equilibrio

9 .l SEMICONDUCTORES

En los capítulos anteriores la preocupacwn principal consistía en entender las


propiedades eléctricas y térmicas de los conductores y los aisladores metálicos, así
.:omo comprender por qué unas substancias son muy buenos conductores eléctricos y
otras, muy deficientes. Estos objetivos se han logrado en general y, a partir de ahora
la atención se centrará en un análisis detallado de las propiedades de los semiconduc-
tores. Hay tres razones por las que esto es algo muy conveniente. En primer lugar
casi siempre se puede usar la estadística de Maxwell-Boltzmann para estudiar la
mecánica estadística de los portadores de carga en semiconductores. Esto significa
que se pueden obtener soluciones analíticas exactas para muchos problemas de semi-
.:onductores que se pueden resolver sólo mediante métodos numéricos o aproximados
en el caso de los metales, en donde se debe utilizar la estadística de Fermi-Dirac.
Comprender los efectos de esta índole en los semiconductores puede proporcionar
.:onocimientos físicos valiosos respecto a sus equivalentes en substancias metálicas.
En resumen, los procesos electrónicos se pueden comprender con mayor facilidad y
profundidad en los semiconductores que en otras clases de cristales. En segundo
lugar, la tecnología del crecimiento de cristales ha hecho posible producir cristales de
ciertas substancias semiconductoras (principalmente germanio y silicio) de una pureza
y perfección cristalina fantásticas, en un grado mucho mayor de lo que se puede
vbtener en la actualidad con metales y aisladores. La existencia de estos cristales casi
perfectos permite al experimentador observar las propiedades de transporte electró-
nico, los efectos termoeléctricos y galvanométricos con facilidad y precisión, teniendo
la certeza de que lo que está tratando de observar no lo oscurecerán los efectos
provocados por impurezas o imperfecciones estructurales en la red cristalina. Por
tanto en los semiconductores se pueden observar e interpretar con facilidad los
fenómenos que, en las substancias metálicas, serían difícil o imposible medir con
precisión o explicar de un modo cuantitativo. Por último, los semiconductores han
adquirido una enorme importancia tecnológica durante las dos últimas décadas. Se
han llegado a utilizar para fabricar todo tipo de dispositivos electrónicos incluyendo
rectificadores, transistores, fotoceldas, reguladores de voltaje, amplificadores paramé-
tricos y dispositivos de conmutación. La apreciación de las propiedades funda-
mentales del transporte electrónico en estas substancias tiene una aplicación directa
en la comprensión y el análisis del funcionamiento de todas las estructuras de dispo-
sitivos que actualmente tienen importancia técnica.

281
282 Semiconductores electrónicos uniformes en equilibrio

El semiconductor es una substancia cristalina que tiene una estructura de ban-


das de energía en la que una banda de estados electrónicos, completamente llena a
la temperatura cero, se separa de otra que está totalmente vacía al cero absoluto.
por medio de una región angosta de energías prohibidas. Esta estructura de banda se
ilustra esquemáticamente en la figura 9.l(a). En el cero absoluto, el semiconductor
es un aislador perfecto, ya que no cuenta con bandas parcialmente llenas. Sin em-
bargo, a temperaturas más altas, algunos electrones de la banda de valencia pueden
adquirir la suficiente energía térmica aleatoria para excitarse a través de la banda
prohibida con el fin de convertirse en electrones de conducción en la banda de
conducción que hasta entonces estaba vacía. Los estados vacíos que quedan en la
banda inferior o de valencia pueden contribuir también a la conductividad compor-
tándose como huecos positivamente cargados. Fs evidente que el número de electro-

Electrones de conducción
/ _ térmicamente excitados
Banda "de conducción"
vacía -
~e~~~-----------
Región prohibida
t:u (Banda de energía prohibida)

Estados vacíos de la banda


de valencia (huecos)
(o) 0°K ( b) Temperatura ambiente (300° K)

Figura 9.1. Bandas de conducción y valencia de un semiconductor (a) al cero absoluto, (b) a la
temperatura ambiente, mostrando electrones y huecos térmicamente excitados.

nes de conducción y el número de huecos debe elevarse al incrementarse la tempe-


ratura y, por tanto, la conductividad eléctrica también aumenta al subir la tempera-
tura.
El mecanismo físico de la conducción por electrones y huecos en semiconduc-
tores covalentes, tales como el carbono (diamante), germanio y silicio, que forman
cristales con la estructura del diamante de la figura 1.9, se puede entender con
mayor claridad en la figura 9.2. En esta figura se muestra la estructura calculada de
bandas de energía del diamante graficada en función del espaciamiento interatómico,
como se hizo en la figura 8.1 O. Los diagramas correspondientes al silicio y al ger-
manio son muy similares. Cuando N átomos aislados se combinan en un cristal, los
niveles atómicos 2s y 2p se amplían a bandas de energía; conforme el espaciamiento
interatómico disminuye, estas bandas se hacen cada vez más anchas y terminan por
superponerse. Cuando la distancia interatómica se hace más pequeña todavía, el
continuo de lo que originalmente eran los estados 2s y 2p se divide una vez más en
dos bandas, cada una de las cuales cuenta ahora precisamente con 4 N estados. A la
distancia interatómica de equilibrio a, estas bandas están separadas por un "vacío de
energía" o región prohibida cuya anchura es ll.e. Puesto que la estructura electró-
nica del carbono es ls 2 )2s 2 2p 2 , se tienen 4 N electrones de valencia disponibl.- que
bastan exactamente para llenar la más baja de las dos bandas y formar la banda de
valencia del cristal. La banda superior se convierte en la de conducción. La región
de energía prohibida en condiciones normales tiene una anchura aproximada de 7 e V
en el diamante, 1.2 eV en el silicio y 0.7 eV en el germanio. Debido a la expansión
Semiconductores 283

tu=7eV (Diamante)
1 z'ev '(Silicio!
(Germanio)

~~~--~6~N~es~t-ad~o-s-+ 2 P
>Niveles átómicos
ffiin:s:o-2~N~e-,st-ad-¡-o-s---¡. 2•

\~nD~=-------------~2~N~e~s~ta~d~o~s---t'•
-----+--:---::-:----:---::-::-:---------;;;;t- _ Espaciamiento
a(= Valor de equilibrio 00 interatómico
del diamante)

Figura 9.2. Las bandas que se originan de los estados atómicos ls, 2s y 2p del carbono
(diamante) como función de la distancia interatómica. [De acuerdo con W. Shock-
ley, Electrons and Holes in Semiconductors, D. van Nostrand Co., lnc., Nueva York
(1950).]

ténnica de la red, este "vacío de energía" tiene una dependencia débil en función
de la temperatura; de acuerdo con la figura 9.2, es evidente que el vacío en la
energía disminuye confonne se expande el cristal. También es obvio, de acuerdo con
este diagrama, que A. e. será una función de la presión, haciéndose mayor confonne
se reduce el espaciamiento interató!llico mediante la aplicación Je presión por me-
dios hidrostáticos o de otra naturaleza. Más a la izquierda del punto A de la
figura 8.10, en donde se superponen las bandas ls y 2s, se pierde el carácter s y p
de los estados electrónicos; por tanto, en la banda de valencia del semiconductor, las
funciones de onda del electrón son una mezcla de funciones de onda atómicas s y p.
Los electrones de la banda de valencia son los que fonnan los enlaces cova-
lentes de parejas de electrones tetraédricamente dispuestos entre los átomos, en la
figura 1.9. La excitación ténnica de un electrón de la banda de valencia a la de
conducción corresponde físicamente a la supresión de un electrón de la pareja del
enlace covalente por medio de la agitación ténnica de la red. Por tanto, el electrón
se convierte en un electrón libre fuera del enlace covalente de la red y queda
disponible para funcionar como portador de carga a fin de conducir una corriente a
través del cristal. Este proceso se describe esquemáticamente en la figura 9.3(a),
aunque se debe recordar que el patrón de enlaces usado es una versión bidimensional
de lo que en realidad es una red tridimensional de enlaces tetraédricos. la excitación
de un electrón deja un defecto localizado en la estructura del enlace covalente del
cristal, que se puede identificar como un estado de banda de valencia que podría ser
ocupado por un electrón; pero que en realidad está vacío. Este defecto constituye el
"hueco" de la sección 8.5. Tanto el electrón libre como el hueco son migratorios; el
electrón libre puede ''vagar" dentro del cristal en una fonna aleatoria, impelido por
la energía ténnica que pueda adquirir de la propia red. Del mismo modo, el hueco
puede desplazarse porque un electrón de un enlace covalente adya~ente al hueco
puede moverse con suma facilidad hacia el hueco, completando así la pareja de
enlace en el sitio original del hueco; pero transfiriendo la ubicación del hueco al
284 Semiconductores electrónicos uniformes en equilibrio

sitio de donde provino el electrón. Esta migración del hueco también puede produ-
cirse por una agitación térmica de la red. Los electrones libres y los huecos se
moverán también en respuesta a un campo eléctrico y pueden dar origen a una
corriente macroscópica que fluye por el cristal. En la figura 9.3(b) se ilustra esta
situación. En este caso, todos los electrones del-cristal, tanto en la banda de conduc-
ción como en la de valencia están sometidos a la fuerza - eE que actúa a la derecha
del diagrama. Los electrones libres se mueven hacia la derecha produciendo un flujo
de corriente convencional a la izquierda, debido a su carga negativa. Además un
electrón de un enlace covalente adyacente a un hueco se puede desplazar a la
derecha hacia el sitio vacío del electrón asociado con él, y el hueco se desplaza
hacia la izquierda al sitio de donde provino este electrón; este proceso se puede
repetir y el resultado neto es una transferencia neta de un electrón hacia la derecha
que va acompañada del movimiento del hueco hacia la izquierda, es decir, en la

11 11 11 11 11 11 11 11 11 "
=@=@=@=@=@= =@=@=@=@=@=
11 11 11 11 11 11 11 11 11 11
=@=@=@=@=@= =@=@=@=@=@=
11 ll ()¡¡---iT-e 11
11 11 e11 11 11
=@=@-@=@=@= =@j~'~@=@=@=
11 11 11 11 11 11 11 11 11 11
=@=@=@=@=@= =@=@=@=@=@=
11 11 11 11 11 11 11 11 11 11
=@=@=@=@=@= @=@=@=@=@=
11 11 11 11 _.11 11 11 11 11 11
Electrones de _.....-. -E
enlace covalente
(o) (b)

Figura 9.3. (a) Un electrón libre y un hueco producidos por la ionización térmica de un
electrón que originalmente se encontraba en un enlace covalente. (b) Movimiento
del electrón libre (a la derecha) y el hueco (a la izquierda) cuando se aplica un
campo eléctrico tal y como se indica.

dirección en que la partícula de carga positiva se movería bajo la influencia de un


campo aplicado. La corriente neta de electrones hacia la derecha da origen nueva-
mente a un flujo convencional de corriente hacia la izquierda que puede represen-
tarse como una corriente de huecos positivos en tal dirección. Así pues, el flujo de
la corriente puede deberse tanto al movimiento de electrones libres como a la migra-
ción de electrones de valencia dentro y fuera de estados vacíos de la banda de
valencia, que se puede considerar mejor como la migración de huecos positivos.

9.2 SEMICONDUCTORES INTRINSECOS


Y SEMICONDUCTORES CON IMPUREZAS

Un semiconductor en el que los huecos y los electrones se crean exclusiva-


mente mediante una excitación térmica a través de la banda prohibida de energía, se
conoce como semiconductor intrínseco. Los huecos y los electrones creados de esta
Semiconductores intrínsecos y semiconductores con impurezas 28S

manera a menudo se denominan portadores intrínsecos de carga y la conductividad


originada por estos portadores se llama conductividad intrínseca. En un semiconductor
intrínseco, las concentraciones de electrones y huecos siempre deben ser las mismas, ya
que la excitación térmica de un electrón origina inevitablemente sólo un hueco.
La población de huecos y electrones en un semiconductor intrínseco se des-
cribe estadísticamente de acuerdo con la función de distribución Fermi-Dirac y las
funciones de densidad de estados para las bandas de valencia y conducción. Puesto
que la parte baja de la banda de conducción y la parte superior de la de valencia
muestran una dependencia esencialmente parabólica de su relación e y k, el compor-
tamiento de los electrones y los huecos en estas regiones es fundamentalmente el de
una partícula libre, con los factores apropiados de masa efectiva. Los electrones y
los huecos se ven raramente excitados hacia las regiones de las bandas de conducción
y valencia en donde sus propiedades pueden diferir del comportamiento de una
partícula libre a temperaturas físicamente posibles de manera que los efectos de
estas excitaciones se pueden desechar para fines prácticos. Entonces, las funciones de
densidad de estados que se van a usar son en esencia las de las partículas libres y
la densidad de estados de la banda de conducción está dada por

ge(e) de= sJh32n m*


n
312 Je -ee de (9.2-1)

y la densidad de estados de la banda de valencia es

g v( e) de= h3 m*P V ~de


Sj2n (9.2-2)
312
t>v- t '

en donde m~ es la masa efectiva de los electrones de la banda de conducción y m;


es la masa efectiva de los huecos de la banda de valencia. 1 Por supuesto, la densidad
de estados en la región prohibida ev <e < ec es cero. En la figura 9.4 aparece una
gráfica de la curva de densidad de estados correspondiente a un semiconductor
intrínseco. Si m; y m~ son precisamente iguales, la energía de Fermi debe quedar

Figura 9.4. Función de densidad de estados de un semiconductor intrínseco.

1 Los subíndices n y p se refieren a los portadores de carga negativos y positivos. Esta


regla se aplicará de un modo invariable.
286 Semiconductores electrónicos uniformes en equilibrio

exactamente en el centro de la región prohibida. Esto es lo correcto debido a que.


de otra manera, la población de electrones en la banda de conducción y los hue-
cos de la banda de valencia, obtenidos integrando el producto de la función de densidad
de estados y el factor de probabilidad f 0 (e) para los electrones en la banda de
conducción, ó 1 - f 0 (e) para los huecos en la banda de valencia, no sería idéntica.
La situación se representa diagramáticamente en la figura 9.5(a). Si y m~ no son m;
iguales (y este es el caso general), la energía de Fermi debe sufrir un pequeño ajuste
ascendente o descendente, alejándose del centro exacto de la banda prohibida de
energía, para igualar las integrales de población y, por tanto, debe quedar cerca,
pero no en el centro de la región prohibida. En la figura 9.5(b) se muestra esta
circunstancia. En una sección posterior se investigará más detalladamente la estadís-
tica de huecos y electrones.

·t 1
-fo(•l
g(•l
1
1
1---uc<•l
Probabilidad f0
1
de ocupación 1
1
de electrones _Producto
f0 (. l9c(• l

., .,
.... Producto
[1-f0 (•l]uv<•l ....
''
Probabilidad
1- t0 para huecos
''
'/' ,
9v<•l
1
f 0 =0 1
2
(o) m~ =m~ (b) m*p =m*,

Figura 9.5. Función de distribución, nivel de Fermi, función de densidad de estados y pobla-
ciones de electrones y huecos de un semiconductor intrínseco (a) en donde
mp =m~ y (b) en donde mp >m~. Ui "ampliación" de la distribución de Fermi se
ha exagerado aquí para ilustrar con mayor claridad; en realidad, a 300°K, la distri-
bución de Fermi sería más bien como la función "escalón" que se encuentra para
T=O.

Es muy fácil introducir cantidades muy pequeñas de substancias tales como


arsénico, antimonio u otros elementos pertenecientes al grupo V de la tabla perió-
dica, en cristales puros de silicio o germanio, como impurezas de substitución, es
decir, como átomos de impurezas que ocupan sitios de la red que normalmente
estarían ocupados por átomos del semiconductor covalente. Los átomos del grupo V
tienen cinco electrones de valencia. Cuatro de ellos se usan para formar enlaces
covalentes con átomos circunvecinos del semiconductor y el quinto se enlaza al
átomo de impureza sólo mediante fuerzas electrostáticas que son muy débiles y, por
ende, se pueden ionizar con facilidad mediante la agitación térmica de la red a
Semiconductores intrínsecos y semiconductores con impurezas 287

temperaturas ordinarias para proporcionar una conducción electrónica adicional. En-


tonces, el átomo de impureza que queda se convierte en un ion positivo, que, sin
embargo, es inmóvil, en vista de que está fuertemente unido a cuatro átomos vecinos
por medio de los enlaces covalentes normales. Esta situación se ilustra en la figu-
ra 9.6(a). En cristales que contienen este tipo de impureza existen más electrones
que huecos (aunque algunos huecos siguen estando presentes debido a los pares
hueco-electrón que se siguen creando térmicamente de vez en cuando). Estos cristales
se denominan semiconductores tipo n, designados así porque la mayoría de los
portadores de carga son electrones negativos. La componente de la conductividad
eléctrica que se produce por los átomos impureza se llama conductividad de impu-
reza. Una substancia cuya mayoría de portadores se origina debido a átomos de
impureza, se conoce como semiconductor con impurezas. Los átomos del grupo V
de substitución se llaman con frecuencia átomos donadores, ya que cada uno de
ellos dona un electrón libre adicional al cristal. Se requiere tan poca energía (como
se verá en breve) para ionizar un átomo de impureza donadora típico del grupo V
en Si y Ge, que prácticamente todas las impurezas del grupo V en estos materiales
se ionizan a temperaturas superiores a aproximadamente 20°K.

11 11 11 11 11 11 11 11
~lectrón =~
hbre
=@ =@ =@ =
O..,l.l
=@=@=@=®=
11 11 11 Hueco---¡¡"' 1 11 11
=@=@~@=@= =@~@=@=@=
11 11 ' ~. 11 11 ' ,t 11 11
=@=®=(e/=@= =®=@~CGt=@=
1111 11 11 11 11 '~u 11
=@=@=@=@= =®=®=@=@=
11 11 11 11 11 11 11 11

(a) (tipo·n) (b) (tipo-p)

Figura 9.6. (a) Electrón libre originado por la ionización de un átomo de impureza de arsénico
de substitución, (b) hueco libre producido por la ionización de un átomo de indio
de impureza de substitución.

Si en lugar de los átomos del grupo V se introducen en la red átomos de


impurezas del grupo lli (Al, Ga, In, etc.), se observará un efecto muy distinto. Estos
átomos tienen sólo tres electrones de valencia que se usan para formar enlaces
covalentes con tres átomos cercanos; pero el cuarto enlace siempre carece de un
electrón. En efecto, existe un hueco adicional que se crea en la estructura del enlace
covalente en el átomo de la impureza. Este hueco puede emigrar fácilmente aleján-
dose del sitio de la impureza debido a que un electrón adicional del enlace covalente
cercano puede emigrar al sitio de la impureza y llenar el cuarto enlace de par de
electrones (que, por supuesto, representa una carga negativa en el átomo de impu-
reza); a continuación, el hueco se asocia con el átomo cercano que no se puede
distinguir de un hueco térmicamente formado. En la figura 9.6(b) se ilustra esta
situación. La energía necesaria para la migración del hueco lejos del sitio de la
impureza es del orden de la energía que se requiere para eliminar el electrón adicio-
nal de un átomo donador. En consecuencia, excepto a temperaturas muy bajas,
todos los huecos serán migratorios y todos lo átomos de impurezas del grupo IIl
tendrán la naturaleza de iones negativos inmóviles. En cristales que contienen predo-
minantemente este tipo de impureza se tienen más huecos que electrones, aunque
288 Semiconductores electrónicos uniformes en equilibrio

.t ·t
lectrones
Electrones

.,_-+-_
Nivel de F Nivel de Fermi
-"---- intrínseco-
.,

Huecos

fo= o fo= O

(a) tipo-n ( b) tipo-p


Figun 9.7. Función de distribución nivel de Fermi y poblaciones de electrones y huecos para
(a) un semiconductor con impurezas tipo n y (b) un semiconductor con impurezas
tipo p. Una vez más, como en la figura 9.5, la "ampliación" de la distribución de
Fermi se exagera con fines ilustrativos.

siempre habrá algunos electrones que se originan debido a la excitación térmica. Los
cristales de esta índole se conocen con el nombre de semiconductores tipo p, dado
que los portadores de carga mayoritarios son positivos. Los átomos de substitución
del grupo III se clasifican casi siempre como átomos receptores, debido a que pue-
den recibir un electrón de la -estructura del enlace covalente liberando un hueco
móvil. Cuando en un cristal semiconductor existen impurezas de ambos tipos, la
conductividad es invariablemente mayor que la referente a un semiconductor puro o
intrínseco a la misma temperatura, debido a los portadores .1e carga lldicionales
originados por los átomos de impurezas y, en general, mientras más grande es 1~
concentración de impurezas, tanto mayor es la conductividad.
La representación estadística de los semiconductores tipo n y p se caracterizan
por la presencia del nivel de Fermi superior (para el tipo n) o inferior (para el tipo
p) a la posición asociada con el cristal puro o intrínseco. Por ejemplo, en un cristal
tipo n, no puede haber más electrones que huecos, a menos que el nivel de Fermi
se ajuste de un modo ascendente en relación con la posición intrínseca, y viceversa
para el tipo p, como se ilustra en la figura 9.7. Conforme varían la temperatura y la
concentración de impurezas, la posición del nivel de .Fermi cambia de un modo muy
complejo. Este tema se ampliará más adelante.

9.3 ESTADISTICA DE HUECOS Y ELECTRONES;


EL CASO DEL SEMICONDUCTOR INTRINSECO

En condiciones de equilibrio térmico, el número de electrones dn 0 por unidad


de volumen que tienen una energía dentro del rango de alrededor de e en la banda
Estadística de huecos y electrones; el caso del semiconductor intrínseco 289

de conducción de cualquier semiconductor, intrínseco o con impurezas, de acuerdo


con los resultados del capítulo 5, es

d n0 -- f ( ) ( )
10 e 9c e
d S-- sJ2.n mn*3/2 J~!.....!!de
----¡;:r- (9.3-1)
1 +e kT

en donde f 0 (e) representa la función de distribución de Femli en equilibrio (5.5-20)


y gc(e) es el factor de densidad de estados (9.2-1). Ahora, ~€, la anchura de la
región de energía prohibida, es casi siempre del orden de 1 eV y kT a la tempera-
tura ambiente (300°K) es aproximadamente 1/40 eV. Si la energía de Fermi está
dentro de la región prohibida, a varias unidades kT lejos del borde de la banda de
conducción (es decir, si €e- e¡'> kl), entonces para todas las energías pertenecientes
a la banda de conducción, el factor exponencial del denominador de la función de dis-
tribución de Fermi es mucho mayor que la unidad. Por tanto, la función de distribución
de Fermi se puede representar en relación con la banda de conducción como
fo(s) ~ e-(e-e¡)/kT (9.3-2)

que es una función de distribución con una forma esencialmente maxwelliana. La


situación en este caso es prácticamente la que se vio en el capítulo 5 en conexión
.:on la ecuación (5.5-27). Puesto que ya se indicó en la figura 9.5 que la energía de
Fermi para un semiconductor intrínseco debe quedar dentro de la región prohibida
de energía, y dado que kT ~ ~€ a todas las temperaturas accesibles, como se señaló
mtes, la condición €e- e¡'> kT se satisface siempre en la práctica y siempre se
puede utilizar la expresión (9.3-2) para semiconductores intrínsecos mejor que la que
es más complicada, (5.5-20). En realidad, en la mayoría de los casos relacionados
.:on semiconductores con impurezas, se descubrirá que esta condición se satisface, lo
.:ual también permite utilizar (9.3-2) para estos semiconductores. Por ejemplo, es
evidente que esta simplificación sería válida para los semiconductores con impurezas
de la figura 9. 7. En las figuras 9.5 y 9. 7 se puede ver que la "cola" exponencial de
la función de distribución de Fermi es la única parte de dicha función que tiene una
superposición con las bandas de c0nducción y valencia. La parte de la función de
Fermi en las cercanías de la energía de Fermi, que es invariablemente la parte que
origina dificultades matemáticas, coincide en todos los casos con una región en
dor.de la densidad de los estados electrónicos disponibles es cero. La aproximación
de simplificación (9.3-2) se conoce con el nombre de aproximación de Boltzmann.
Si se utiliza esta aproximación en (9.3-1) y se integra para obtener el número
total de electrones por unidad de volumen en la banda de conducción, se encuentra
.:¡ue

-
nO = I~
00
dn O
J
8 2n.
= --
h3 m*3f2
n
e•¡lkT I00

~
--
Je-e e e-•tkT de · (9.3-3)

En realidad, los límites de integración deben ser desde Ee hasta la parte supe-
nor de la banda de conducción, sea donde fuere; sin embargo, puesto que !o(€)
desciende muy rápidamente al incrementarse e (-por lo menos para valores razonables
de temperatura), la mayoría de los electrones se concentran en los estados cercanos
J. la base de la banda de conducción. En tanto que la parte superior de la banda
tenga una energía muchas unidades kT mayor que Ee, no hay mucha diferencia en el
290 Semiconductores electrónicos uniformes en equilibrio

hecho de si se integra a la parte superior de la banda o a infmito. Cuando se hace


la substitución

¡;-Be
X=-- (9.3-4)
e kT

la integral (9.3-3) se puede expresar en la forma

(9.3-5)

De acuerdo con (5.4-4), el valor de la integral antenor es r(3/2) = y1r/2. Si se


substituye e.ste valor para la integral, el resultado sería

(9.3-6)
en donde
(9.3-7)

El valor numérico de la cantidad Uc se puede escribir (usando las unidades


cgs) como

(9.3-8)

en donde m 0 es la masa inercial del electrón. Para m:; = rn 0 y T = 300°K, esto da


Uc = 2.51 X 10 19 cm- 3 .
El número de huecos Po por unidad de volumen en la banda de valencia de
un semiconductor, se puede encontrar de un modo similar. En este caso se puede
expresar como dp 0 , el número de huecos en la banda de valencia dentro del rango
de energía de alrededor de e,

(9.3-9)

La cantidad [po(e) es la probabilidad de que un hueco esté asociado con un


estado cuántico de energía e, en otras palabras, que dicho estado estará desocupado.
Esta probabilidad es justamente, uno menos la probabilidad de ocupación f 0 (e).
Puesto que [ 0 (e) está dada por (5.5-20), se puede ver fácilmente que

1
/po(e) = 1-/o(e) = 1 - 1 + e<• .,J!kT - 1 + e<•' •JikT. (9.3-10)

Nuevamente, si la energia de Fermi tiene varias unidades kT por encima del


borde de la banda de valencia, es decir, si e¡- Ev ~ kT, el factor exponencial del
denominador de la expresión (9.3-10) ¡;s mucho mayor que la unidad, para todos los
valores de e en la banda de valencia, se puede hacer que

(9.3-11)

Esta es la aproximación de Boltzmann para los huecos en la banda de valencia.


Si se usa (9.3-11) y la función de densidad de estados (9.2-2) en (9.3-9) y se i,r.tegra
Estadística de huecos y electrones; el caso del semiconductor intrínseco 291

sobre la banda de valencia, se obtiene

(9.3-12)

También en este caso el límite inferior de la integral es - oo y no la base de


la banda de valencia; esta simplificación se justifica más o menos con el mismo
argumento que se usó en relación (9.3-3) para la banda de conducción. Cuando se
hace la substitución

8v- e
X=-- (9.3-13)
v kT

la integral se puede expresar en la forma

(9.3-14)

que se puede evaluar como una función r-, como antes, para dar

(9.3-15)

con

(9.3-16)

El valor numérico de Uv puede obtenerse a partir de (9.3-8), substituyendo en


la fórmula mp por m~.'
Se puede demostrar con facilidad que el producto m 0 p 0 es una función exclusiva
de la banda prohibida de energía t:.e, las masas efectivas y la temperatura, e indepen-
diente del nivel de Fermi o del contenido de impurezas. Por tanto, al multiplicar las
expresiones (9.3-6) y (9.3-15) para n 0 y p 0 , ~e puede obtener

(9.3-17)

Si se usa (9.3-7) y (9.3-16), esto se puede escribir en la forma

(9.3-18)

Para una substancia semiconductora dada, las masas efectivas y la banda prohi-
bida de energía ~e son fijas; de donde, el producto n 0 p 0 de un material dado debe
ser una función exclusiva de la temperatura. Esta es esencialmente una ley de acción
de las masas que rige las concentraciones relativas de huecos y electrones en un
material en particular. Si el semiconductor se encuentra en un estado intrínseco o
puro, las concentraciones de huecos y electrones deben ser iguales, como se vio
antes, debido a que sólo los huecos y los electrones que pueden estar presentes son
los que se generan en pares mediante la excitación térmica de los electrones de la
banda de valencia. En consecuencia, en este tipo de materiales,

Po = n0 = n¡(T) (9.3.19)
292 Semiconductores electrónicos uniformes en equilibrio

en donde n¡(T) representa el número de huecos o electrones por unidad de volumen


dentro de una muestra intrínseca del semiconductor en cuestión a la temperatura T.
En una muestra de la misma substancia que no es intrínseca, sino más bien un
semiconductor con impurezas, el número de huecos y electrones ya no es el mismo:
sin embargo, de acuerdo con (9.3-17), el producto n 0 p 0 debe ser el mismo para este
material que para la substancia intrínseca. Por tanto, se puede escribir, de acuerdo
con (9.3-19),

(9.3-20)

siendo

(9.3-21)

como lo establece (9.3-18). De acuerdo con estos resultados, la concentración de


portadores en un semiconductor intrínseco tiene una gran dependencia de la tempe-
ratura, aumentando rápidamente conforme se incrementa esta última y, de igual
manera, depende enormemente de la banda prohibida de energía Lle, decreciendo
con gran rapidez al aumentar Lle.
La relación de la acción de las masas (9.3-17) ó (9.3-20) recuerda claramente
las leyes que gobiernan las concentraciones relativas de iones en substancias que
están débilmente ionizadas, por ejemplo, los iones H+ y OH- en sistemas acuosos.
En realidad los semiconductores se pueden comprender como un ejemplo de la
teoría clásica de Arrenhius sobre los electrolitos débilmente ionizados en relación
con un sistema en el que un enlace covalente se disocia en un electrón y un hueco
con la energía de disociación Lle.
En una muestra puramente intrínseca, en donde las concentraciones de huecos y
electrones son iguales, se pueden igualar las expresiones (9.3-6) y (9.3-15), tomar el
logaritmo de ambos lados de la ecuación resultante y resolver para la energía de
Fermi, lo cual da

(intrínseca). (9.3-22)

Puesto que Uv y Uc están dadas por (9.3-16) y (9.3-7), se puede expresar este
resultado en la forma

(intrínseca), (9.3-23)

usando el símbolo e¡¡ para denotar la energía de Fermi de un semiconductor intrín-


seco. De acuerdo con esto, es evidente que en un semiconductor intrínseco la ener-
gía de Fermi queda desplazada del centro del vacío de energía sólo por una canti-
dad relativamente pequeña de energía, según lo indica el segundo término del lado
derecho de (9.3-23). Si m;= m~, el nivel de Fermi se encuentra exactamente en el
punto medio de la región prohibida, como sr señaló con anterioridad.

9.4 ENERGIA DE IONIZACION DE CENTROS DE IMPUREZAS

Un centro donador de un semiconductor se compone de un icn fijo de carga


+e con el que está enluado débilmente un electrón. Si la energía de enlace es lo
Energía de ionización de centros de impurezas 293

suficientemente pequeña, la "órbita" del electrón será tan grande en comparación


con el espaciamiento interatómico, que la trayectoria del electrón alrededor del ion
donador 2 abarcará muchos átomos. En estas circunstancias, es correcto pensar que el
electrón está sumergido en un medio uniforme polarizable cuya constante dieléctrica K,
es la constante dieléctrica macroscópica del cristal semiconductor, ya que la fuerza elec-
trostática entre el ion donador y el electrón entonces se modificará en promedio, por la
polarización de los muchos átomos que intervienen. La representación es similar a la
de un átomo de hidrógeno dentro de un medio uniforme continuo, cuya constante
dieléctrica es " si se puede imaginar esta situación. Esta representación será válida
siempre y cuando K tenga tal magnitud que las órbitas de Bohr sean grandes en
comparación con el espaciamiento interatómico.
Ahora se puede calcular el tamaño de las órbitas y los niveles de energía
asociados de acuerdo con la teoría de Bohr que se vio en la sección 4.5. Sería más
exacto usar la mecánica ondulatoria del átomo de hidrógeno para estos cálculos;
pero puesto que se sabe que la teoría de Bohr y el promedio de la mecánica
ondulatoria de las distancias nucleares electrónicas son casi las mismas, se puede
confiar en que la teoría simple de Bohr dará respuestas adecuadas para esta situa-
ción que es muy similar. La condición de cuantización para la cantidad de movi-
miento angular orbital se aplica en ambos casos, de modo que la ecuación (4.5-2)
sigue siendo correcta, a condición de que la masa electrónica se substituya por m~.
Por otra parte, debido a la polarización del cristal, la fuerza electrostática entre el
ion donador y el electrón enlazado se reduce en un factor ", haciéndose e2 /Kr~, de
tal manera que la ecuación (4.5-3) ahora se debe escribir como sigue

(9.4-1)

A continuación, las ecuaciones (9.4-1) y (4.5-2) se pueden resolver como ecua-


ciones simultáneas para rn y wn, dando [(en analogía con (4.5-4) y (4.5-5)],

(9.4-2)

Wn=~li3
m:e
2
4
(9.4-3)
n K

Las energías cinética y potencial ahora se pueden evaluar como se hizo en


(4.5-6) y (4.5-7), recordando, sin embargo, que la energía potencial ahora está dada
por - e2/K.rn, por lo cual la energía total es

(9.4-4)

La teoría de Bohr para el átomo de hidrógeno se expresa mediante las ecua-


ciones anteriores con m~= m 0 y K = l. De acuerdo con (9.4-2), es ev.idente que las

2 Aunque describe la situación, esto no constituye un buen lenguaje de mecánica cuántica;


sería más exacto decir que la función de onda del electrón se extiende sohre muchas distancias
interatómicas, de tal manera que se incluyen muchos átomos dentro de la región en donde la
densidad de probabilidad es grande.
294 Semiconductores electrónicos uniformes en equilibrio

órbitas de Bohr para el centro donador son más grandes que las órbitas del hidm.
geno por un factor K y también por un factor m 0 /m~. Para el germanio tipo 11.
K= 16 y m~~ m 0 /4, de tal manera que el radio de la primera órbita de Bohr es 64
veces el radio de la primera órbita de Bohr del hidrógeno. El valor del hidrógeno ea
0.528A, de tal suerte que el valor para el átomo donador en el germanio es alredo-
dor de 34 A. En efecto, esto es considerablemente mayor que la distancia interáto-
mica (que es más o menos 2.44A para el germanio), de donde, esta representaciÓII
del centro donador está justificado en este caso desde el punto de vista físico.
La energía de ionización del centro donador, de acuerdo con (9.4-4), es menor
que la del átomo de hidrógeno por un factor 1/K 2 y también por un factor
m~/m 0 • Para el caso del germanio, esto representa (1/256) • (1/4) = 1/1024. Enton-
ces, podría esperarse que la energía de ionización para el estado basal de un átomo do-
nador sea aproximadamente 1000 veces menor que la del estado basal del átomo
de hidrógeno (13.6 eV). En consecuencia, se llega a la cantidad 0.013 eV para la
energía de ionización de un átomo donador en el germanio. Este valor concuerda
aceptablemente con los valores determinados en la práctica y que se obtuvieron
por la medición de concentraciones de portadores en función de la temperatura
y por la absorción óptica en el infrarrojo, según lo indica la tabla 9.1. Los valo-
res más elevados de energía de ionización observados para el silicio, se explican
en parte por la constante dieléctrica menor (K = 12) de este material, y en parte por
las masas efectivas más grandes de los electrones del silicio. Las características de los
centros receptores se pueden comprender siguiendo el mismo razonamiento, utilizan-
do una representación que comprenda un ion receptor negativamente cargado y un
hueco de carga positiva dentro de un medio dieléctrico uniforme.

TABLA 9.1.
Energías de ionización de centros donadores
y receptores en Ge y Si

Impureza Ge Si
p 0.012 eV 0.045 eV
As 0.0127 0.05
Sb 0.010 0.039
B 0.0104 0.045
Al 0.0102 0.06
Ga 0.0108 0.07
In 0.0112 0.16

Por tanto, se puede considerar que los electrones cedidos por átomos dona-
dores se originan en estados donadores localizados dentro del vacío de energía prohi-
bida, a unas cuantas centésimas de electrón volt por d•bajo de la banda de conduc-
ción. De igual manera se puede considerar que los huecos cedidos por los átomos
receptores se crean cuando los electrones, que normalmente deberían ocupar los
estados cercanos a la parte superior de la banda de valencia, se desplazan a niveles
receptores que estaban vacíos en un principio, y cuya energía se localiza a unas
cuantas centésimas de electrón volt por encima de la banda de valencia. Este patrón
de niveles donadores y receptores se ilustra en la figura 9.8(a). La representación
correspondiente de la densidad de estados aparece en la figura 9.8(b).
Estadística de los semiconductores con impurezas 295

E t Banda de conducción
Electrones
_ / de conducción
•e ""'""'~-=--=-~:.__-=--- Ee

----~Niveles donado::s
Electrones de la banda de valencia
que ocupan los niveles receptores

... L f /Niveles
_ _ _ _¿ _ r~eptores •.,
•• ••

Banda de valencia

(a) (b)

Figura 9.8. (a) Diagrama de bandas de energía de un semiconductor con impurezas indicando
los niveles donador y receptor, (b) curva correspondiente a la densidad de estados.

9.5 ESTADISTICA DE WS SEMICONDUCTORES CON IMPUREZAS

Antes de estudiar la mecánica estadística verdadera de los semiconductores con


impurezas, es necesario examinar una característica sutil de la estadística de ocupa-
ción de los niveles donadores y receptores. Si se confinara el estudio a los niveles
donadores uno se sentiría tentado a llegar a la conclusión de que la probabilidad de
ocupación asociada con dichos niveles estaría dada por la función de equilibrio de
Fermi (5.5-20), siendo e= ea. Sin embargo, esto no es del todo correcto, debido a
la degeneración del espín de los niveles donadores. Existen en realidad dos estados
cuánticos asociados con cada nivel de impurezas donadoras correspondientes a las
dos orientaciones del espín permisibles del electrón sobre el átomo donador. No
obstante, tan pronto como se ocupa uno de estos estados, se excluye la ocupación
del otro, ya que los requisitos de valencia del ion donador se satisfacen con un solo
electrón. Esta situación altera el problema estadístico que conduce a la función de
distribución.
Sea un sistema que tiene niveles de energía de este tipo, como se ilustra en la
figura 9.9. Se supondrá que los electrones que ocupan los niveles son partículas

No. nivel de energía 2 3 4


1------1 1----------11n

Energía ., •z .3 .4 ., ."
Degeneración g, 9z g3 g4 9¡ glt

No. de electrones N, Nz N3 N4 N¡ N"

Figura 9.9. Niveles de energía y notación usada en los cál..,ulos de la sección 9.5.
296 Semiconductores electrónicos uniformes en equilibrio

indistinguibles y que existen N¡ electrones en el iésimo nivel cuya degeneración es g¡.


El número de formas de insertar el primer electrón en los estados cuánticos pertene--
cientes al iésimo nivel, es g¡; el número de maneras de colocar el segundo es g¡- ~
dado que la ocupación del primer estado por el primer electrón excluye la ocupa-
ción del estado de espín opuesto; el número de maneras de insertar el tercero es
g¡- 4 y así sucesivamente. Para el iésimo, el número será g¡- 2N¡ + 2. El número
total de modos de arreglar N¡ electrones no distinguibles en g¡ estados, en estas
circunstancias, es

g¡(g¡- 2)(g¡- 4) ··· (g¡- 2N¡ + 2)


(9.5-1)
N¡!

El factor N¡! del denominador se incluye porque las distribuciones que son
idénticas a excepción de la permutación de los electrones entre ellas mismas no
deben contarse como distribuciones diferentes, ya que los electrones no son distin-
guibles unos de otros. El número total de formas de lograr una distribución en la
que se tengan N 1 , N 2 • • • N n electrones en los niveles 1, 2, • • • n, es el producto
de los factores de la forma (9.5-1) sobre los niveles del sistema. Esta es precisamente
la cantidad Q(N1 N 2 • • • Nn) del capítulo 5 [véase, por ejemplo, (5.5-3)]. Por tanto.
para este sistema se tiene

(9.5-21

La función de distribución resultante se determina maximizando In Qa como


antes, utilizando el método de los multiplicadores lagrangeanos que se desarrolló en
el capítulo 5, siendo el resultado

en donde Et es la energía de Fermi definida del modo acostumbrado. Para los


niveles donadores, el número de átomos donadores es la mitad de la cantidad de
estados de espín o sea, 1/2g¡, de tal manera que para este sistema se puede escribir

N-
n - d
(9.5-4)
d - 1 + te(~d E¡)/kT

en donde Na es la concentración de átomos donadores de impurezas, Ea es la


energía de los niveles donadores y na es el número de electrones por unidad de
volumen que ocupan los niveles donadores (es decir, la concentración de donadores
no ionizados). Evidentemente, la función de Fermi está modificada por la presencia
del factor 1/2 que va en el denominador antes del término exponencial.
De manera similar, se puede demostrar que si Na es la concentración de áto-
mos de impureza receptores y Ea la energía de los niveles receptores, la concentra-
ción de huecos asociada con Jos átomos receptores (o sea, la densidad de los sitios
receptores no ionizados) Pa, será

Pa = } + te<•! Ea)/kT •