Está en la página 1de 319

ELECTROMAGNETISMO, CIRCUITOS Y

SEMICONDUCTORES
Manuel Arrayás y José Luis Trueba

ELECTROMAGNETISMO, CIRCUITOS
Y SEMICONDUCTORES

Universidad Rey Juan Carlos


CRÉDITOS A RELLENAR POR LA EDITORIAL
A los que están siempre ahı́,
incluso cuando se les necesita.
Manuel Arrayás

A mis chicas Maite, Ainhoa, Cristina y Lucı́a,


y a todos los que nos han apoyado.
José Luis Trueba
Contenidos

Contenidos IX

Prefacio XI

1. Cinemática y vectores 1
1.1. Unidades del Sistema Internacional 1
1.2. Magnitudes escalares y vectoriales 2
1.3. Vectores 3
1.4. Vector velocidad 7
1.5. Vector aceleración 9
1.6. Componentes intrı́nsecas de la aceleración 12
1.7. Ejercicios 15
2. Dinámica 17
2.1. Leyes de Newton 17
2.2. Trabajo 19
2.3. Energı́a 22
2.4. Sistemas de partı́culas: centro de masas 25
2.5. Momento angular 25
2.6. Rotaciones planas de un cuerpo rı́gido 28
2.7. Ejercicios 31
3. Carga eléctrica 33
3.1. Propiedades de las cargas eléctricas 33
3.2. Fuerza electrostática 34
3.3. Conductores y dieléctricos 36
3.4. Procesos de carga en conductores y dieléctricos 37
3.5. Ejercicios 39
4. Campo eléctrico 41
4.1. Campo eléctrico creado por cargas puntuales 41
4.2. Distribuciones continuas de carga 43
4.3. Movimiento de una carga de prueba 46
4.4. Energı́a potencial electrostática 47
4.5. Potencial electrostático 48
4.6. Ejercicios 51
x Contenidos

5. Ley de Gauss 53
5.1. Flujo eléctrico 53
5.2. Ley de Gauss 54
5.3. Campo creado por una esfera homogénea 56
5.4. Campo creado por un cilindro homogéneo 58
5.5. Campo creado por un plano homogéneo 60
5.6. Campo creado por un condensador plano 62
5.7. Ejercicios 63
6. Campo eléctrico en los medios materiales 65
6.1. Conductores en equilibrio electrostático 65
6.2. Campo y potencial creados por una esfera conductora 68
6.3. Campo eléctrico en un dieléctrico 70
6.4. Capacidad y condensadores 73
6.5. Almacenamiento de energı́a eléctrica 76
6.6. Ejercicios 78
7. Corriente eléctrica 81
7.1. Corriente eléctrica en un cable conductor 81
7.2. Ley de Ohm 84
7.3. Fuerza electromotriz 88
7.4. Potencia en los circuitos eléctricos 90
7.5. Ejercicios 92
8. Magnetismo 95
8.1. Fuerza magnética 95
8.2. Carga de prueba en un campo magnético uniforme 97
8.3. Fuerza magnética sobre una corriente eléctrica 101
8.4. Momento de torsión magnético sobre una espira 103
8.5. Ejercicios 107
9. Campo magnético 109
9.1. Campo magnético creado por cargas puntuales 109
9.2. Ley de Biot-Savart 110
9.3. Campo magnético creado por una espira circular 113
9.4. Campo magnético creado por un solenoide 115
9.5. Ley de Gauss del magnetismo 117
9.6. Ley de Ampère 119
9.7. Ejercicios 122
10.Materiales magnéticos 125
10.1. Momento magnético de un electrón 125
10.2. Magnetización 126
10.3. Diamagnetismo 128
10.4. Paramagnetismo 130
10.5. Ferromagnetismo 131
10.6. Ejercicios 133
Contenidos xi

11.Inducción electromagnética 135


11.1. Fem inducida 135
11.2. Fem de movimiento 135
11.3. Ley de Faraday 137
11.4. Ley de Lenz 139
11.5. Inducción mutua y autoinducción 140
11.6. Energı́a magnética almacenada en un inductor 142
11.7. El generador eléctrico 143
11.8. Ejercicios 146
12.Ondas electromagnéticas 149
12.1. Ecuaciones de Maxwell 149
12.2. Movimiento ondulatorio 152
12.3. Ondas electromagnéticas en el vacı́o 155
12.4. Espectro electromagnético 160
12.5. Ejercicios 161
13.Circuitos elementales 163
13.1. Elementos localizados 163
13.2. Leyes de Kirchhoff 164
13.3. Resistencias 165
13.4. Resistencias en serie y en paralelo 166
13.5. Divisor de voltaje 167
13.6. El puente de Wheatstone 168
13.7. Multı́metros 169
13.8. Ejercicios 170
14.Circuitos equivalentes 173
14.1. Equivalente Thévenin 173
14.2. Equivalente Norton 176
14.3. El efecto de la carga 177
14.4. Ejercicios 180
15.Circuitos que dependen del tiempo 183
15.1. Condensadores 183
15.2. Condensadores en serie y en paralelo 184
15.3. Carga de un condensador mediante una fuente de corriente 185
15.4. Descarga de un condensador a través de una resistencia 185
15.5. Circuito RC - Integrador 187
15.6. Circuito CR - Diferenciador 188
15.7. Inductores 190
15.8. El transformador 191
15.9. Ejercicios 192
16.Análisis en frecuencia de circuitos reactivos 195
16.1. Se nales armónicas 195
16.2. Potencia y decibelios 197
16.3. Análisis en frecuencia 199
16.4. Fasores 200
16.5. Ley de Ohm generalizada 203
xii Contenidos

16.6. Potencia en circuitos reactivos 205


16.7. Ejercicios 205
17.Filtros 207
17.1. Se nales con ruido 207
17.2. Circuito CR - filtro pasa alta 208
17.3. Circuito RC - filtro pasa baja 209
17.4. Gráficas de Bode 210
17.5. Circuitos resonantes - filtros de ancho de banda 212
17.6. Dise no de un filtro 214
17.7. Ejercicios 215
18.Semiconductores 217
18.1. Semiconductores, metales y dieléctricos 217
18.2. Teorı́a de bandas para la conducción 218
18.3. Semiconductores intrı́nsecos 220
18.4. Semiconductores extrı́nsecos 223
18.5. Movimiento de electrones y huecos 226
18.6. Difusión 230
18.7. Ejercicios 233
19.Barreras y Uniones 235
19.1. La barrera del borde 235
19.2. Uniones p-n 239
19.3. Diodos 242
19.4. Polarización inversa de un diodo 242
19.5. Polarización directa 244
19.6. Aplicaciones de los diodos 247
19.7. Ejercicios 250
20.Transistores bipolares 253
20.1. Un poco de historia 253
20.2. Transistores bipolares 253
20.3. La ecuación de Ebers-Moll 257
20.4. La velocidad de respuesta del transistor 260
20.5. Ejercicios 263
21.Transistores de efecto campo 265
21.1. Principios básicos 265
21.2. JFET, transistores de efecto campo de unión p-n. 266
21.3. MOSFET, transistor de campo de óxido de metal. 267
21.4. Curvas universales caracterı́sticas de los FET 269
21.5. Principales parámetros de los FET 271
21.6. Ejercicios 272
22.Circuitos con diodos 274
22.1. Curva caracterı́stica I-V para un diodo 274
22.2. Rectificación 275
22.3. Fuente de voltaje no regulada 275
22.4. Circuito regulador con diodo Zener 278
22.5. Limitadores 279
Contenidos xiii

22.6. Ejercicios 280


23.Circuitos con transistores 282
23.1. Amplificador de corriente 282
23.2. Interruptor 283
23.3. Seguidor de emisor 285
23.4. Fuente de corriente 288
23.5. Amplificador de emisor común 289
23.6. La ecuación de Ebers-Moll aplicada 291
23.7. Ejercicios 293
Referencias 296
Prefacio

Este libro está pensado para impartir un curso introductorio de Electromag-


netismo, Teorı́a de Circuitos y Semiconductores. Al estar dirigido principalmente a
alumnos de los primeros cursos de Ingenierı́a, Informática y Ciencias Experimentales,
no se presuponen más conocimientos que los normales de cursos preuniversitarios.
Aunque el material se presenta de manera secuencial y unificada, cubrir todo en
un semestre serı́a una tarea demasiado ambiciosa. Cada capı́tulo se divide en secciones,
algunas de las cuales pueden omitirse. Se ha incluido suficiente material para que el
instructor tenga cierta flexibilidad a la hora de dise nar el curso. Los temas 1 y 2 son un
breve resumen de álgebra vectorial y mecánica. El resto de los conceptos necesarios se
introducen cuando se hace uso de ellos. Un curso de electromagnetismo básico deberı́a
incluir los capı́tulos del 3 al 12. Para una introducción a la Teorı́a de Circuitos podrı́an
seguirse los temas 13, 14, 15, 16, 17, 22 y 23 de manera autocontenida. Para un curso
de Semiconductores, los capı́tulos del 18 al 21.
El libro también incluye numerosos ejemplos, figuras y problemas al final de cada
capı́tulo. Se ha dado la solución de cada problema para que el estudiante pueda por
sı́ mismo comprobar su progreso. Al final del libro se han incluido las referencias
básicas que hemos manejado para escribirlo, ası́ como un detallado ı́ndice de los
conceptos y materias tratados.
Queremos agradecer a las doctoras Inmaculada Leyva e Irene Sendi na sus correc-
ciones y sugerencias. En un libro como éste es inevitable que algunos errores hayan
sido pasados por alto, de los cuales somos los únicos responsables. Finalmente, damos
las gracias a nuestros alumnos por lo que hemos aprendido de ellos.

Los autores
Fuenlabrada, 2007

xv
Capı́tulo 1

Cinemática y vectores

1.1. Unidades del Sistema Internacional


Cualquier disciplina cientı́fica trata de observar una parte de la naturaleza y cuan-
tificar sus propiedades. Para ello, hay que convertir lo observado en una magnitud
que pueda compararse con otras magnitudes semejantes, lo que se hace utilizando
ciertos patrones convencionales que conforman un sistema de unidades. Ası́ se elige
un conjunto de magnitudes fundamentales y sus correspondientes unidades para su
utilización práctica. Aquı́ se usará el Sistema Internacional (SI), en el cual las mag-
nitudes fundamentales y sus correspondientes unidades son las que se pueden ver en
la Tabla 1.1.
Además de estas unidades fundamentales se definen también las llamadas uni-
dades derivadas, que son productos y cocientes de las unidades fundamentales sin la
inclusión de factores numéricos. Un ejemplo bien conocido es el newton (N), la uni-
dad de fuerza, que se puede expresar en términos de unidades fundamentales como
1 N = 1 kg · m · s−2 . También utilizamos una unidad suplementaria para medir ángulos
planos, el radián (rad), unidad definida de tal modo que la medida de un ángulo en
radianes es la longitud del arco de la circunferencia de radio unidad que abarca ese
ángulo.
La enorme diversidad de escalas que abarca la fı́sica (desde el electrón y los quarks
a las galaxias y cúmulos de galaxias) hace necesario adquirir cierta familiaridad con

Magnitud Unidad Sı́mbolo


Longitud metro m
Tiempo segundo s
Masa kilogramo kg
Cantidad de sustancia mol mol
Temperatura kelvin K
Carga eléctrica culombio C
Intensidad luminosa candela cd

Tabla 1.1. Magnitudes y unidades fundamentales en el Sistema Internacional.

1
2 Cinemática y vectores

Prefijo Significado Sı́mbolo


tera 1012 T
giga 109 G
mega 106 M
kilo 103 k
mili 10−3 m
micro 10−6 µ
nano 10−9 n
pico 10−12 p

Tabla 1.2. Algunos múltiplos y submúltiplos de las unidades del SI.

los prefijos que se utilizan para indicar múltiplos y submúltiplos de las unidades.
Algunos de estos prefijos se pueden ver en la tabla 1.2.

Análisis dimensional
Una técnica que permite muchas veces valorar un problema de manera cualitativa es el
análisis dimensional. Consiste en asignar una dimensión a cada magnitud fı́sica, que
ha de relacionarse por productos y potencias con las dimensiones de las magnitudes
fundamentales de la tabla 1.3.
La dimensión de una magnitud fı́sica cualquiera permite conocer su relación con
las magnitudes fundamentales. Por ejemplo, la densidad de masa de un cuerpo tiene
dimensión [Densidad] = ML−3 , pues es una masa dividida por una longitud al cubo
(volumen), indistintamente del sistema de unidades usado. De aquı́, la unidad de la
densidad en el Sistema Internacional es 1 kg · m−3 .
A veces se usan combinaciones de magnitudes fı́sicas cuyo resultado no tiene
dimensiones ni unidades. Como ejemplos, recordemos el ı́ndice de refracción de un
medio, la densidad relativa de un cuerpo respecto a la del agua, etc. También hay
cantidades a las que se le asigna una unidad pero no tienen dimensión. Ejemplos son
los ángulos medidos en radianes o los niveles de ruido medidos en decibelios.
Uno de los aspectos más útiles del análisis dimensional es que permite un sencillo
test para determinar la incorrección de una ecuación, pues cada término de una ecua-
ción debe tener la misma dimensión que el resto de términos. Veamos un ejemplo.
Al hacer un problema de dinámica hemos obtenido que la aceleración de un cuerpo
es a = F/m + vt, donde F es una fuerza aplicada sobre el cuerpo, m es la masa del
cuerpo, v es su velocidad y t es el tiempo. Esta ecuación no puede ser correcta, pues la
dimensión del tercer término es L, mientras que la dimensión del primer y del segundo
término es LT−2 .

1.2. Magnitudes escalares y vectoriales


La cinemática describe el movimiento de los cuerpos. Comenzaremos estudiando el
movimiento de una partı́cula puntual (un punto material sin volumen). Esto permite
describir aproximadamente el movimiento de los cuerpos cuando ni la forma ni las
Vectores 3

Dimensión Sı́mbolo
[Longitud] L
[Tiempo] T
[Masa] M
[Cantidad de sustancia] N
[Temperatura] Θ
[Carga eléctrica] Q
[Intensidad luminosa] Cd

Tabla 1.3. Dimensiones fundamentales.

dimensiones del cuerpo tienen importancia en el movimiento. Éste es el caso de un


coche circulando por una autopista. Pero hay que tener cuidado, pues con el movi-
miento tipo partı́cula puntual no podrı́amos analizar adecuadamente un trompo que
el coche sufriera durante el viaje. Otro ejemplo: la Tierra se puede considerar un
punto material cuando estudiamos su movimiento alrededor del Sol, pero no cuando
estudiamos su rotación alrededor de un eje que pasa por su centro, en la cual inter-
vienen su forma y sus dimensiones. Dejaremos el estudio de las rotaciones para más
adelante, centrándonos ahora en la cinemática de la partı́cula.
En general, a medida que transcurre el tiempo, la posición de la partı́cula cambia.
Para estudiar la relación entre posición y tiempo, primero hemos de elegir un origen
de espacio y de tiempo. Para el tiempo, clásicamente no hay demasiados problemas,
pues podemos elegir el instante t = 0 como aquél en que nos interesa empezar a
estudiar el movimiento. Con respecto a él, cualquier instante posterior t viene dado
por un número y una unidad (en el SI es el segundo). Una cantidad fı́sica que, como
el tiempo, viene dada por un sólo número y una unidad se llama magnitud escalar.
Otras magnitudes escalares son la masa, la carga, la temperatura, etc.
Para determinar la medida del espacio tenemos una complicación extra. Escoja-
mos un origen de espacios, que llamaremos punto O. Imaginemos que queremos dar
la posición de otro punto P . Hay infinitos puntos que están a la misma distancia que
P del origen O (todos ellos situados en la superficie de una esfera). Con respecto
al origen, P no queda determinado por un único número y una unidad. Esto ocurre
porque la posición no es una magnitud escalar, sino una magnitud vectorial y nece-
sita en general más de un número, además de una unidad, para determinarla. Otras
magnitudes vectoriales en fı́sica son la velocidad, la fuerza, el campo eléctrico, etc.
Ası́ como las magnitudes escalares se manipulan siguiendo las reglas de la aritmética,
que suponemos bien conocidas, las magnitudes vectoriales se manipulan con las reglas
del álgebra vectorial que resumimos en el siguiente apartado.

1.3. Vectores
Un vector a en el espacio tridimensional de la fı́sica clásica se puede representar
gráficamente mediante un segmento de recta orientado con origen en un punto P y
extremo en un punto Q (figura 1.1).
El módulo del vector a es el valor numérico de la distancia entre el punto origen
4 Cinemática y vectores

a
a−b a a+b

P b

Figura 1.2. Método gráfico para hallar


Figura 1.1. El vector a tiene como origen
la suma y la resta de dos vectores.
el punto P y como extremo el punto Q,
como indica la flecha.

P y el punto extremo Q. Lo denotaremos por |a| o simplemente a.


La dirección de a es la dada por la recta sobre la cual están P y Q.
El sentido de a viene determinado por la flecha, que indica que el vector va desde
P hasta Q.
Módulo, dirección y sentido son las tres propiedades que determinan un vector. Es
conveniente definir lo que se conoce como vector unitario y vector opuesto a uno dado.
Un vector unitario es cualquiera que tenga módulo igual a uno (sin dimensiones).
Dado un vector a, su vector opuesto −a es aquél que tiene mismo módulo y
dirección que a pero sentido contrario.
Se definen dos operaciones básicas que conforman lo que se conoce como álgebra de
vectores.
Multiplicación de un escalar p por un vector a. Esta multiplicación da como resul-
tado otro vector pa con las siguientes caracterı́sticas: (1) tiene la misma dirección
que a, (2) su módulo es igual al producto del valor absoluto de p multiplicado
por el módulo de a, es decir, |pa| = |p||a|, y (3) su sentido es igual al de a, si p es
positivo, y contrario al de a si p es negativo. Se dice que, con respecto al vector
a, el vector pa es paralelo si p es positivo y antiparalelo si p es negativo.
Suma de dos vectores. El vector suma a + b es otro vector que se calcula gráfi-
camente con la regla del paralelogramo (figura 1.2). Se define también la resta
a − b de dos vectores como el vector obtenido sumando el primero al opuesto del
segundo.

Sistema de referencia
Para manipular los vectores se elige un sistema de referencia dado por un punto origen
y una base de vectores. Una base, en el caso tridimensional, es un conjunto de tres
vectores diferentes, no paralelos y no coplanarios. De esta manera, cualquier vector
se puede escribir como combinación lineal de los vectores de la base.
Utilizaremos fundamentalmente el sistema de referencia cartesiano de coordena-
das rectangulares, que constituye el triedro de la figura 1.3. Está formado por el punto
origen O, y tres vectores unitarios y mutuamente perpendiculares, con origen en O,
llamados i, j, k. Estos vectores se colocan de tal manera que el triedro que forman es
dextrógiro, esto es, el giro de cada uno de ellos hacia el siguiente se hace a derechas
(en sentido contrario al de las agujas de un reloj). La dirección que determina el vector
Vectores 5

z
az
k
j a
i ax a
O y y
x O

Figura 1.3. El sistema de referencia de


coordenadas cartesianas está formado por Figura 1.4. Componentes de un vector a
el origen O y los vectores unitarios i, j y en el sistema de referencia de coordenadas
k, que son mutuamente perpendiculares. cartesianas.

i se conoce con el nombre de eje x, la que determina el vector j se llama eje y, y la


que determina el vector k se llama eje z.
Veamos cómo se expresa un vector a en el sistema de referencia de coordenadas
cartesianas (figura 1.4):

Lo primero es colocar el origen de a en el punto O.


El extremo de a se proyecta mediante planos perpendiculares sobre cada eje.
La distancia desde O hasta la proyección del extremo del vector a sobre el eje x se
llama componente x del vector a y se escribe ax (nótese que ax es una magnitud
escalar y está dada por un número y una unidad, por ejemplo ax = 0, 5 m). Del
mismo modo, la distancia del origen a la proyección del extremo del vector a
sobre el eje y se llama componente y del vector a y se escribe ay . Finalmente,
la distancia del origen a la proyección del extremo del vector a sobre el eje z se
llama componente z del vector a y se escribe az .
Una vez se han determinado las componentes de a en el sistema de referencia, se
puede escribir
a = ax i + ay j + az k. (1.1)

Cuando se utiliza el sistema de referencia {O, i, j, k}, las operaciones entre vectores
que hemos definido quedan:

La multiplicación de un número p por un vector a tiene como resultado otro


vector (pa) de componentes

pa = (pax ) i + (pay ) j + (paz ) k. (1.2)

La suma de los vectores a y b es un vector que tiene por componentes

a + b = (ax + bx ) i + (ay + by ) j + (az + bz ) k. (1.3)

Por aplicación directa de la regla dada por la ecuación (1.2), el vector opuesto al
vector a es
−a = −ax i − ay j − az k. (1.4)
6 Cinemática y vectores

También podemos escribir la resta de dos vectores como


a − b = (ax − bx ) i + (ay − by ) j + (az − bz ) k. (1.5)
Una aplicación directa del teorema de Pitágoras permite obtener el módulo del
vector a, que es un número real positivo |a| = a dado por
q
2 2 2
|a| = a = (ax ) + (ay ) + (az ) . (1.6)
Aparte del módulo, el resto de la información sobre un vector a (su dirección y
sentido) viene descrita por un vector unitario ua , que es un vector de módulo uni-
dad y que tiene la misma dirección y sentido que a. Este vector, en componentes
cartesianas, se escribe
a a  a  a 
x y z
ua = = i+ j+ k, (1.7)
|a| a a a
y se llama vector unitario asociado a a. Por la última expresión, tenemos que
a = a ua , (1.8)
es decir, todo vector se puede escribir como el producto de su módulo por un
vector unitario paralelo a él. En muchas aplicaciones utilizaremos esta descom-
posición.

Vector de posición
Se puede asociar a cada punto del espacio un vector para determinar su posición
respecto al sistema de referencia elegido. Para ello, dado un punto P se define su
vector de posición rP como aquel vector cuyo origen es el origen O del sistema de
referencia y cuyo extremo es el punto P (figura 1.5). Si se escribe rP en el sistema de
referencia en función de sus componentes,
rP = xP i + yP j + zP k, (1.9)
los tres números (xP , yP , zP ) se llaman coordenadas del punto P en el sistema de
referencia {O, i, j, k}. Por tanto, la expresión (1.9) define un punto P en este sistema.
A menudo, el movimiento del sistema estudiado se realiza sobre un plano. En
este caso, se suele escoger el sistema de referencia de manera que el movimiento tenga
lugar en alguno de los planos xy, xz o yz. Por ejemplo, si tomamos el plano xy, las
componentes de un vector a serán sólo dos, pues podemos olvidarnos de la componente
z, que es siempre nula. Se puede escribir entonces a = ax i + ay j. En otras ocasiones, el
movimiento que nos interesa es rectilı́neo, es decir, se realiza sobre una recta. Podemos
colocar entonces el sistema de referencia de manera que el movimiento se realice sobre
un eje, por ejemplo el eje x, y olvidarnos de los otros dos. Al hacerlo ası́, los vectores
tienen una única componente.
La posición de una partı́cula puntual, en un instante determinado, con respecto a
un sistema de referencia cartesiano, vendrá dada por el punto P en el que se encuentra,
con vector de posición rP . Las componentes del vector de posición se miden en metros,
de manera que, por ejemplo, podemos tener rP = 1, 2 m i+0, 7 m j+3, 2 m k. Indicarı́a
que la partı́cula se encuentra situada en un punto tal que, desde el origen, hay que
recorrer para llegar a ella 1, 2 m a lo largo del eje x, luego 0, 7 m paralelamente al eje
y, y finalmente 3, 2 m paralelamente al eje z.
Vector velocidad 7

z
P
r P
P
xP yP
O

Figura 1.5. Vector de posición de un punto P y sus coordenadas en un sistema de referencia


cartesiano.

Q
∆r
O y
P
x

Figura 1.6. Trayectoria de una partı́cula puntual en 3 dimensiones. En general, la trayectoria


no coincide con el vector desplazamiento.

1.4. Vector velocidad


Supongamos que una partı́cula se mueve en el espacio siguiendo una curva C que
llamamos trayectoria (ver la figura 1.6). En un instante de tiempo dado t1 se encuentra
en un punto P con vector de posición rP . Al transcurrir el tiempo, la posición de la
partı́cula cambia en general. Esto quiere decir que su vector de posición depende
del tiempo, lo cual escribimos mediante la notación r(t). Ası́, el vector de posición
del punto P satisface rP = r(t1 ). En el intervalo de tiempo ∆t, la partı́cula varı́a
su posición a lo largo de la trayectoria C, de manera que en el instante t1 + ∆t, se
encuentra en el punto Q con vector de posición rQ = r(t1 + ∆t).
Se define el vector desplazamiento ∆r entre P y Q a la diferencia dada por
∆r = rQ − rP = r(t1 + ∆t) − r(t1 ), (1.10)
como se ve en la figura 1.6. La velocidad media de la partı́cula entre los puntos P y
Q es el cociente entre desplazamiento e intervalo de tiempo,
∆r r(t1 + ∆t) − r(t1 )
vm = = . (1.11)
∆t ∆t
Es claro que, dado que el intervalo de tiempo ∆t es siempre positivo, la velocidad
media es un vector paralelo al desplazamiento de la partı́cula. La unidad de velocidad
en el SI es la unidad de longitud dividida por la unidad de tiempo, es decir, 1 m · s−1 .
8 Cinemática y vectores

Pero, si miramos la figura 1.6 con atención, notaremos que existe una diferen-
cia clara entre la dirección del vector desplazamiento entre los puntos P y Q y la
trayectoria real que ha seguido la partı́cula entre esos puntos. Para minimizar esta
diferencia y tener más información sobre la trayectoria real, una buena idea es hacer
muy pequeño el intervalo de tiempo ∆t, de manera que el vector desplazamiento ∆r
tenga módulo muy pequeño y se asemeje a la trayectoria real C. En términos de ve-
locidad, esto significa definir la velocidad instantánea en el instante t (o simplemente
velocidad) como el lı́mite de la velocidad media cuando el intervalo de tiempo tiende
a cero,  
r(t + ∆t) − r(t)
v(t) = lı́m vm = lı́m . (1.12)
∆t→0 ∆t→0 ∆t
La expresión a la derecha de la ecuación (1.12) se conoce con el nombre de derivada
del vector de posición r(t) con respecto al tiempo y su notación es
dr
v(t) = . (1.13)
dt
La velocidad es un vector ligado a la partı́cula, de manera que se suele dibujar con
origen en el punto en que está la partı́cula en cada instante de tiempo.
El módulo del vector velocidad indica el espacio recorrido por la partı́cula en la
unidad de tiempo.
La dirección del vector velocidad es la recta tangente a la trayectoria C en cada
punto (para verlo no hay más que imaginar cómo es el vector desplazamiento
infinitesimal, es decir, cuando P y Q están muy próximos en la figura 1.6).
El sentido del vector velocidad indica hacia dónde tiende a moverse la partı́cula
en un instante posterior.

Derivadas
Dado que podemos escribir los vectores por medio de sus componentes en el sistema
de referencia de coordenadas cartesianas, tenemos que el vector de posición r(t) es

r(t) = x(t)i + y(t)j + z(t)k, (1.14)

donde x(t), y(t), z(t) son funciones reales del tiempo t. Es importante notar que
los vectores de la base i, j, k son constantes (no dependen de t), lo cual no ocurre,
en general, en otros sistemas de referencia (por ejemplo, en coordenadas polares).
Esta caracterı́stica del sistema de referencia de coordenadas cartesianas que estamos
utilizando hace que muchas operaciones del análisis vectorial se simplifiquen mucho.
En concreto, la derivada del vector r con respecto a t resulta
dr dx dy dz
v(t) = = i+ j + k, (1.15)
dt dt dt dt
es decir, basta derivar las componentes del vector, que son funciones reales. En otras
palabras, el vector velocidad es, en coordenadas cartesianas, una composición de las
velocidades a lo largo de cada eje,

v(t) = vx i + vy j + vz k. (1.16)
Vector aceleración 9

f (t) df /dt
ctn cntn−1
sen (ct) c cos (ct)
cos (ct) −c sen (ct)
ect cect
ln (ct) 1/t

Tabla 1.4. Derivadas de algunas funciones elementales. En estas expresiones, c y n son


constantes, et es la función exponencial, y ln (t) es el logaritmo neperiano.

Conviene recordar algunas propiedades de las derivadas de funciones reales.

La derivada de una constante es igual a cero. La derivada de una constante c


multiplicada por una función f (t) es

d df
(cf (t)) = c . (1.17)
dt dt
La derivada de una suma de funciones es
d df dg
(f (t) + g(t)) = + . (1.18)
dt dt dt
La derivada de un producto de funciones es

d dg df
(f (t)g(t)) = f +g . (1.19)
dt dt dt
Si f (x) es una función de x y x(t) es una función de t, la derivada de f respecto
a t satisface la regla de la cadena,

d df dx
[f (x(t))] = . (1.20)
dt dx dt
Las derivadas de algunas funciones particulares aparecen en la tabla 1.4.

1.5. Vector aceleración


Otro vector ligado a la partı́cula es el vector aceleración, que describe cómo cambia
la velocidad de la partı́cula al transcurrir el tiempo. Se define como la derivada del
vector velocidad con respecto al tiempo,
 
v(t + ∆t) − v(t) dv
a(t) = lı́m = . (1.21)
∆t→0 ∆t dt

Por su definición, la unidad de aceleración en el SI es 1 m · s−2 . Las leyes de Newton


proporcionan la aceleración de una partı́cula a partir del estudio de las fuerzas que
actúan sobre ella, como veremos en el siguiente capı́tulo.
10 Cinemática y vectores

Si el vector velocidad no cambia con el tiempo, es decir, si es constante, entonces


la aceleración es cero y se dice que la partı́cula sigue un movimiento uniforme. Por otro
lado, si el vector aceleración es constante en el tiempo se dice que el movimiento es
uniformemente acelerado. Estos dos casos pueden ser sencillos pero no son en absoluto
los más generales. La aceleración de un cuerpo suele variar de alguna manera. Al
estudiar la ley de Coulomb veremos que la aceleración de una partı́cula cargada en
un campo eléctrico depende de la posición, es decir, es diferente en cada punto de la
trayectoria de la partı́cula.
El problema fundamental de la cinemática es obtener la velocidad y la posición
del cuerpo a partir de la aceleración. Supongamos que la aceleración de una partı́cula
a(t) es un vector conocido que depende del tiempo. Además conocemos la velocidad
v0 = v0x i + v0y j + v0z k, y la posición del cuerpo r0 = x0 i + y0 j + z0 k, en el instante
inicial t = 0. Queremos obtener la velocidad v(t) y la posición r(t) de la partı́cula en
todos los instantes de tiempo.
El primer paso es calcular la velocidad de la partı́cula. Para ello partimos de la
definición a = dv/dt, donde la aceleración es conocida. Despejando dv,

dv = a(t) dt. (1.22)

Esta ecuación indica que, en un intervalo de tiempo infinitesimal dt (en el cual supone-
mos que la aceleración no ha cambiado), la velocidad ha tenido un cambio infinitesimal
dv. Podemos proceder ahora de la siguiente forma. Si queremos conocer el cambio ∆v
de la velocidad ocurrida entre el instante t = 0 y el instante t, dividimos el intervalo de
tiempo ∆t = t − 0 en un número muy grande de intervalos infinitesimales dt iguales.
En cada uno de ellos, el cambio en la velocidad está dado por la ecuación (1.22), de
modo que el cambio total en ∆t será la suma de los cambios en todos los dt. Esto se
escribe formalmente como
X X
∆v = dv = a(t) dt, (1.23)

donde estamos sumando las contribuciones de cada intervalo infinitesimal. Pero ésta
no es una suma al uso, pues la longitud de los intervalos dt tiende a cero. En los casos
en que hay que hacer una suma de este tipo, en lugar de escribirla como (1.23) se
escribe Z v Z t
∆v = dv = a(t) dt, (1.24)
v0 0

y la suma se conoce con el nombre de integral.

Integrales
En una integral, la cantidad que se suma es una función de la variable que aparece
después de la letra d. Por ejemplo, la primera integral de la ecuación (1.24) es una
suma en velocidades, y la segunda integral es una suma en tiempos. Si conocemos los
valores inicial y final entre los que se está sumando, decimos que la integral es definida.
En estos casos, los valores inicial y final se llaman lı́mites de la integral definida y
se escriben abajo y arriba del sı́mbolo integral, respectivamente. Por ejemplo, en la
ecuación (1.24), la primera integral es una suma en velocidades de la cantidad 1 (lo
que aparece multiplicando a dv) desde el valor inicial v0 hasta el valor final v. La
Vector aceleración 11
R
f (t) f (t) dt
c ct
ctn ctn+1 /(n + 1), (n 6= −1)
c/t c ln (t)
sen (ct) −(1/c) cos (ct)
cos (ct) (1/c) sen (ct)
ect (1/c)ect

Tabla 1.5. Integrales indefinidas de algunas funciones elementales. En estas expresiones, c


y n son constantes. En cada caso, se puede sumar al resultado una constante arbitraria.

segunda integral es una suma en tiempos de la cantidad a(t) entre el valor inicial t = 0
y el valor final t. Es importante notar que, en una igualdad de integrales definidas,
los lı́mites deben corresponderse: el lı́mite inferior del tiempo t = 0 corresponde a la
velocidad inicial v0 , y el lı́mite superior del tiempo t corresponde a la velocidad v en
ese mismo instante.
Como ocurre en el caso de las derivadas, si los vectores vienen expresados por
componentes en un sistema de referencia de coordenadas cartesianas, podemos escribir
la integral de cualquier vector a(t) entre los valores 0 y t como
Z t Z t  Z t  Z t 
a(t) dt = ax (t) dt i + ay (t) dt j + az (t) dt k, (1.25)
0 0 0 0

de modo que integrar un vector en coordenadas cartesianas es una simple composición


de integrales de funciones escalares.
En general, la integral de una función está relacionada con el problema de calcular
el área bajo una curva y es la operación inversa de derivar. Se dice que g(t) es una
primitiva de f (t) si dg/dt = f . Ahora, si g(t) es una primitiva de f (t), se puede
calcular la integral indefinida (sin lı́mites) de f (t) con respecto a t como
Z
f (t) dt = g(t) + c, (1.26)

donde c es una constante. En el caso de una integral definida, lo que se tiene es


Z t2
f (t) dt = g(t2 ) − g(t1 ). (1.27)
t1

La tabla 1.5 muestra las integrales de algunas funciones elementales.

Velocidad y posición en función de la aceleración


Si hacemos la primera integral de la ecuación (1.24) obtenemos
Z t
∆v = v − v0 = a(t) dt. (1.28)
0
12 Cinemática y vectores

ut
v
un
a

Figura 1.7. Vectores velocidad y aceleración en un punto P de la trayectoria de una partı́cu-


la. Se especifican los vectores unitarios tangente y normal.

Dado que a es una función vectorial conocida del tiempo, en principio la integral
definida que falta se puede hacer en cada caso particular. Como consecuencia, se
encuentra una expresión para v(t), dada por
Z t
v(t) = v0 + a(t) dt, (1.29)
0

en donde la velocidad inicial v0 es un dato del problema. Una vez obtenida la velo-
cidad, el siguiente paso es encontrar la ley de movimiento de la partı́cula r(t). Para
ello usamos que v = dr/dt. Integrando de nuevo entre el instante inicial t = 0 y un
instante cualquiera t, se obtiene
Z t
r(t) = r0 + v(t) dt. (1.30)
0

Como vemos, todo se reduce a calcular dos integrales definidas, las de las ecuaciones
(1.29) y (1.30).
Un caso particular de las expresiones (1.29) y (1.30) es el del movimiento uni-
formemente acelerado, que es aquel en que la aceleración a es constante. Al hacer las
integrales se obtienen las conocidas expresiones

v = v0 + at, (1.31)
1
r = r0 + v0 t + at2 . (1.32)
2

1.6. Componentes intrı́nsecas de la aceleración


En la figura 1.7 vemos la trayectoria de una partı́cula. En un punto dado P de esta
trayectoria se han dibujado los vectores velocidad y aceleración. Como ya sabemos,
el vector velocidad es tangente a la trayectoria, y su sentido apunta en la dirección
del movimiento en cada punto. Es posible definir en cada punto P un vector unitario
tangente a la trayectoria ut , de tal modo que

v = v ut , (1.33)

donde v es el módulo de la velocidad. Es importante notar que ut cambia de un punto


a otro de la trayectoria, pues la dirección y el sentido de la velocidad lo hacen. El
vector aceleración en cada punto de una trayectoria curva se dirige siempre hacia
Componentes intrı́nsecas de la aceleración 13

el lado cóncavo de la trayectoria. Esto ocurre porque en una trayectoria curva la


dirección del vector velocidad varı́a hacia ese lado, como podemos ver en la figura 1.7.
Aplicando la definición de la aceleración en el punto P como la derivada de la
velocidad, de la ecuación (1.33) se obtiene

dv dv dut
a= = ut + v . (1.34)
dt dt dt
Esta expresión indica que el vector aceleración tiene dos componentes en cada punto
de la trayectoria de una partı́cula. La primera de ellas es la componente tangente y
se suele denominar aceleración tangencial at , dada por

dv
at = , (1.35)
dt
es decir, es la componente de la aceleración debida al cambio del módulo de la ve-
locidad. Cuando sólo hay aceleración tangencial, no cambia la dirección del vector
velocidad y como consecuencia, los vectores velocidad y aceleración son paralelos.
Esto ocurre sólo en un movimiento rectilı́neo.
Dado que la aceleración tangencial tiene en cuenta los cambios en el módulo de la
velocidad, el segundo sumando de la ecuación (1.34) sólo tiene en cuenta los cambios
en la dirección de la velocidad. Este segundo vector está dirigido a lo largo de la recta
perpendicular al vector tangente en cada punto (ver Ejercicios). La componente de la
aceleración a lo largo de esta dirección se llama aceleración normal an . Si definimos el
vector unitario normal un como un vector perpendicular a la tangente y que apunta
al centro de curvatura1 de la trayectoria en cada punto, entonces podemos escribir

a = at u t + an u n , (1.36)

en donde at y an reciben el nombre de componentes intrı́nsecas de la aceleración; at


es la aceleración tangencial dada por la ecuación (1.35) y an es la aceleración normal.
Por argumentos geométricos, la aceleración normal se puede escribir como

v2
an = , (1.37)
r
donde r es el radio de curvatura de la trayectoria en el punto dado. Ası́, un movimiento
en el cual el módulo de la velocidad es constante está acelerado si la trayectoria es
curva: tendrá una aceleración normal dirigida a lo largo del vector unitario un .

Movimiento circular
Un tipo de movimiento sencillo para ver cómo actúan las componentes de la ace-
leración, es el movimiento circular, en el que la trayectoria de la partı́cula es una
circunferencia de radio R (ver la figura 1.8). En la figura, se han dibujado los ejes
x e y de tal modo que, en el instante inicial, la partı́cula se encuentra en el eje x e
inicia un movimiento en sentido antihorario a lo largo de la circunferencia de radio
1 El centro de curvatura de un punto de la trayectoria es el centro de la circunferencia que más se
aproxima a la trayectoria en ese punto. El radio de esta circunferencia se llama radio de curvatura
de la trayectoria en ese punto.
14 Cinemática y vectores

y v
ut
un
j θ
x
O i

Figura 1.8. Componentes intrı́nsecas de la aceleración en el movimiento circular.

R. Podemos escribir el vector de posición de la partı́cula en todo instante de tiempo


como
r = x i + y j = R cos θ i + R sen θ j, (1.38)
siendo θ el ángulo que forma el vector de posición con el eje x en cada instante de
tiempo. En la figura 1.8 se ve que los vectores tangente y normal a la trayectoria en
cada punto, para este tipo de movimiento, son

ut = − sen θ i + cos θ j, (1.39)


un = − cos θ i − sen θ j. (1.40)

La velocidad se obtiene derivando la expresión (1.38) respecto al tiempo. Teniendo en


cuenta la expresión (1.39), se obtiene


v=R ut . (1.41)
dt
Esto implica que el módulo de la velocidad en un movimiento circular es

v=R . (1.42)
dt
La cantidad dθ/dt expresa cómo cambia el ángulo θ con el tiempo. En consecuencia
se llama velocidad angular y se escribe

ω= , (1.43)
dt
de tal modo que resulta
v = R ω. (1.44)
La unidad SI de la velocidad angular es 1 rad · s−1 , como fácilmente se deduce de
su definición (1.43). En consecuencia, en un movimiento circular, las componentes
intrı́nsecas de la aceleración a = dv/dt ut + v 2 /R un son


at = R , (1.45)
dt
2
an = R ω . (1.46)
Ejercicios 15

La cantidad dω/dt se llama aceleración angular y su unidad es 1 rad · s−2 .


Un caso particular es cuando la velocidad angular es constante (movimiento cir-
cular uniforme). En este caso se cumple que at = 0. La única aceleración de la
partı́cula es normal, necesaria para que la trayectoria se curve. En el movimiento cir-
cular uniforme, dado que ω es constante, la partı́cula siempre tarda el mismo tiempo
en dar una vuelta completa a la circunferencia. Este tiempo T se llama periodo del
movimiento y está dado por
2π 2πR
T = = . (1.47)
ω v
La posición de la partı́cula en el movimiento circular uniforme satisface

r(t) = r(t + T ), (1.48)

es decir, cuando pasa un tiempo igual a T , la partı́cula vuelve al mismo punto. El


movimiento circular uniforme es un caso de movimiento periódico.

1.7. Ejercicios
1. Consideremos la ecuación v = ax/t + bt2 , donde x es una posición, v es una
velocidad y t es un tiempo. Determinar las dimensiones de a y b para que la
ecuación sea consistente.
Solución: [a] = 1, [b] = LT−3 .
2. La magnitud de la fuerza electrostática F entre dos cargas puntuales q1 y q2 ,
separadas por una distancia d, es
q1 q2
F =k ,
d2
donde k es una constante. Determinar la dimensión de k y sus unidades en el
Sistema Internacional.
Solución: [k] = ML3 T−2 Q−2 , y sus unidades son kg · m3 · s−2 · C−2 .
3. Una partı́cula se mueve en un plano de manera que su posición varı́a en el tiempo
según
r(t) = x0 cos (ωt)i + (v0 /ω) sen (ωt)j,
donde x0 , v0 y ω son constantes. Calcular la velocidad y la aceleración de esta
partı́cula.
Solución: La velocidad es v(t) = −x0 ω sen (ωt)i + v0 cos (ωt)j, y la aceleración es
a(t) = −x0 ω 2 cos (ωt)i − v0 ω sen (ωt)j.
4. Una partı́cula se mueve en una dimensión en el seno de un fluido con una ace-
leración que depende de la velocidad según a = −kv, donde k es una constante.
Su velocidad inicial era v0 y su posición inicial era x0 . Encontrar la velocidad v
y la posición x de la partı́cula en todo instante.
Solución: v(t) = v0 e−kt , x(t) = x0 + v0 /k (1 − e−kt ).
5. La aceleración de los cuerpos debida a la atracción terrestre tiene un valor g =
9, 8 m · s−2 y se dirige perpendicularmente a la superficie terrestre y hacia abajo.
Ası́, cuando un cuerpo se mueve bajo la acción de la gravedad, su movimiento se
realiza en el plano que forman la velocidad inicial y la vertical. Considerar una
partı́cula que se encuentra inicialmente a una altura h sobre la superficie terrestre
16 Cinemática y vectores

y cuya velocidad inicial es v0 paralela a la superficie de la Tierra. Calcular su


velocidad y su posición en todo instante.
Solución: Si tomamos el eje x paralelo a la superficie de la Tierra y el eje y como
altura medida desde el suelo, resulta que las componentes de la velocidad son
vx = v0 , vy = −gt, y las componentes de la posición son x = v0 t, y = h−(1/2)gt2 .
6. Un proyectil se lanza desde el suelo con velocidad inicial v0 formando un ángulo
α con la horizontal. Calcular el alcance del proyectil (distancia horizontal a la
que llega) y su altura máxima.
Solución: d = (v02 /g) sen (2α), h = (v02 /2g) sen2 α.
7. Demostrar que la derivada du/dt de un vector unitario u(t) es perpendicular
al propio vector unitario. En general esto ocurre para todo vector de módulo
constante. Se necesita la definición del producto escalar que se puede mirar en el
siguiente tema.
8. Una partı́cula se mueve con una aceleración a = 5 m · s−2 j. En t = 0, la partı́cula
se encontraba en r0 = 8 m j, y tenı́a una velocidad v0 = 5 m · s−1 i. Determinar
la ley de movimiento r(t) de la partı́cula, la ecuación de su trayectoria y las
componentes intrı́nsecas de la aceleración. √
Solución:
√ r(t) = 5t i + (8 + 2, 5 t2 )j, y = 8 + x2 /10, at = 5t/ 1 + t2 , an =
5/ 1 + t2 .
9. Una partı́cula que parte del reposo sigue una trayectoria circular de 2 m de radio
con una aceleración tangencial constante de 0, 5 m · s−2 . En un punto dado de su
trayectoria, tiene una velocidad de 3 m · s−1 . Calcular su velocidad angular y el
módulo de su aceleración en este punto y determinar la posición del punto del
que hablamos.
Solución: ω = 1, 5 rad · s−1 , a = 4, 53 m · s−2 . Tomando la posición inicial de la
partı́cula en θ = 0, la posición del punto del problema viene dada por θ = 4, 5 rad.
Capı́tulo 2

Dinámica

2.1. Leyes de Newton


En el capı́tulo anterior se ha descrito el movimiento de una partı́cula sin atender a lo
que lo provoca. Según Aristóteles, el movimiento de un cuerpo era provocado por la
acción continua de una causa. Mediante experimentos con planos inclinados, Galileo
demolió esta hipótesis y estableció que no era necesaria ninguna causa para que un
objeto en movimiento rectilı́neo continuara moviéndose. Galileo llamó inercia a la
tendencia de los cuerpos a resistir cambios en su movimiento. En 1687, Isaac Newton,
basándose en parte en las intuiciones de Galileo (sus Discorsi fueron publicados en
1638) y desarrollando nuevos métodos de cálculo, estableció con la publicación de sus
Principia las leyes del movimiento de los cuerpos. En la dinámica de Newton, las
interacciones entre cuerpos se llaman fuerzas y la consecuencia de la existencia de
fuerzas sobre un cuerpo es el cambio de su estado de reposo o movimiento.
Las leyes de Newton son válidas siempre que el movimiento se estudie con respecto
a un sistema de referencia inercial (un sistema de referencia en reposo o en movimiento
rectilı́neo uniforme). Un sistema de referencia fijo en la Tierra es aproximadamente
inercial para los sistemas fı́sicos que vamos a estudiar.
Primera ley de Newton. Todo cuerpo permanece en su estado de reposo o de
movimiento rectilı́neo uniforme a menos que sea obligado a cambiar ese estado
por fuerzas que actúen sobre él. En ambas circunstancias, se dice que el cuerpo
está en un estado de equilibrio mecánico. A esta tendencia de los cuerpos a
resistir cambios en su movimiento se le llama inercia. La magnitud asociada a
esta propiedad se llama masa. La masa m de un cuerpo es una cantidad escalar
y su unidad en el SI es el kg.
Segunda ley de Newton. El cambio de movimiento de un cuerpo es proporcio-
nal a la fuerza total que actúa sobre él y ocurre en la dirección de la lı́nea recta
en la que la fuerza actúa.
Para expresar matemáticamente esta ley, definimos la cantidad de movimiento
que posee un cuerpo o su momento lineal p como

p = mv, (2.1)

cuya unidad es 1 kg · m · s−1 . La fuerza debe de ser una magnitud vectorial, y se


mide en newtons (N), que es una unidad derivada tal que 1 N = 1 kg · m · s−2 Si

17
18 Dinámica

F es la fuerza total (la suma vectorial de todas las fuerzas) que actúa sobre un
cuerpo, el cambio de su momento lineal es igual a F, es decir,
dp
= F. (2.2)
dt
En los casos en que, durante su evolución, la masa del cuerpo permanece cons-
tante, la ecuación (2.2) sirve para determinar la aceleración del cuerpo como

1
a= F. (2.3)
m
No ocurre ası́ en casos como el de un cohete que se propulsa en el vacı́o mediante
la emisión de gases o en el de una partı́cula que se desintegra en otras.
Tercera ley de Newton. Si un cuerpo ejerce una fuerza F sobre otro, entonces
el segundo ejerce una fuerza en sentido opuesto −F sobre el primero. Esta tercera
ley es, a veces, mal interpretada diciendo que las dos fuerzas se anulan entre sı́ por
ser iguales y de signo opuesto, pero esto es falso porque cada fuerza actúa en un
cuerpo diferente.

Por tanto, en la dinámica newtoniana los cuerpos interaccionan entre sı́ a través de
fuerzas, de tal manera que la fuerza total sobre un cuerpo determina su aceleración.
La (2.2) se llama ecuación de movimiento del cuerpo dado, a partir de la cual, como
se comentó en el capı́tulo anterior, se puede obtener la posición del cuerpo en cada
instante de tiempo por integración con ayuda de las condiciones iniciales.
El ejemplo más sencillo de ecuación de movimiento es el caso de una partı́cula
libre. Se llama ası́ a una partı́cula tal que la fuerza total sobre ella es nula. En este
caso, la ecuación de movimiento se reduce a la expresión F = 0, es decir, a = 0, de
donde se deduce que la partı́cula sigue un movimiento uniforme. Si la velocidad inicial
es cero, la partı́cula permanece en reposo. Si es distinta de cero, la partı́cula sigue una
trayectoria recta. Estos son los dos casos recogidos en la primera ley de Newton.

Interacciones fundamentales
En la actualidad, se cree que todas las fuerzas son manifestaciones de cuatro úni-
cas interacciones fundamentales entre las partı́culas elementales que forman toda la
materia del universo.

La interacción gravitatoria es, según la teorı́a newtoniana, la atracción entre


partı́culas que tienen masa. Si dos partı́culas tienen masas m1 y m2 y están
separadas una distancia r, la fuerza gravitatoria con que una de ellas atrae a la
otra tiene un módulo
m1 m2
Fg = G 2 , (2.4)
r
donde G = 6, 67 × 10−11 N · m2 · kg−2 es la constante de Newton de la gravedad, y
está dirigida a lo largo de la recta que une sus centros. La interacción gravitatoria
es la principal responsable del movimiento de estrellas, planetas, etc.
La interacción electromagnética es la que aparece entre partı́culas debida a la
carga eléctrica de éstas. Es normalmente muchı́simo más intensa que la interac-
ción gravitatoria, de tal manera que es la principal responsable de la estructura
Trabajo 19

de los átomos. Del mismo modo, es la responsable de la aparición de fuerzas de


rozamiento y cohesión molecular.
La interacción fuerte se da entre los componentes de los núcleos atómicos para
mantenerlos unidos. Tiene una intensidad aún mayor que las fuerzas electro-
magnéticas pero su alcance es muy reducido, de modo que no se observa a nivel
macroscópico.
La interacción débil no tiene un papel tan directo como el electromagnetismo y
la interacción fuerte en la estructura de la materia ordinaria, pero es relevante
en la transformación de un neutrón en un protón, por ejemplo.
Este libro se refiere sobre todo a las propiedades y consecuencias de interacciones a
nivel macroscópico y en especial de la electromagnética. En este capı́tulo haremos
un breve repaso de la gravedad terrestre al introducir los conceptos básicos de la
dinámica.
La fuerza gravitatoria con que la Tierra atrae a un cuerpo de masa m situado a
una altura h de su superficie se llama peso. Su módulo viene dado según (2.4) por
mMT
Fg = G , (2.5)
(RT + h)2

siendo MT = 5,98 × 1024 kg la masa de la Tierra y RT = 6,37 × 106 m el radio medio


de la Tierra. Si h es mucho menor que RT , se puede aproximar RT + h por RT . De
este modo, Fg = mg, donde g = GMT /RT2 ≈ 9,8 m · s−2 , es la llamada aceleración de
la gravedad que se puede considerar la misma para todos los cuerpos en las cercanı́as
de la superficie terrestre.
Si un cuerpo de masa m se mueve únicamente bajo la acción de la gravedad, de
la segunda ley de Newton se extrae que la aceleración del cuerpo es
Fg
a= = −g j, (2.6)
m
donde hemos tomado el eje y perpendicular al suelo y hacia arriba. En consecuencia,
el cuerpo sigue un movimiento uniformemente acelerado.

2.2. Trabajo
Según las leyes de Newton, la consecuencia de la existencia de fuerzas sobre un cuerpo
es el cambio de movimiento del cuerpo. Es posible preguntarse si una fuerza es más
o menos eficiente para provocar que el cuerpo sobre el que actúa cambie de posición.
La cantidad fı́sica que mide esta eficiencia se llama trabajo.
El trabajo realizado por una fuerza constante F (es decir, una fuerza cuyo valor
no depende de la posición ni del tiempo) durante el desplazamiento en lı́nea recta ∆r
de una partı́cula sobre la que actúa la fuerza, es igual a la componente de la fuerza
en la dirección del desplazamiento multiplicada por el módulo del desplazamiento. La
operación matemática que da este resultado recibe el nombre de producto escalar. Por
tanto, el trabajo en este caso se expresa como

W = F · ∆r. (2.7)

La unidad SI de trabajo es el julio, definido como 1 J = 1 N · m.


20 Dinámica

α
b
a
b

Figura 2.1. El producto escalar de dos vectores es un número real que depende del ángulo
que forman.

Producto escalar de dos vectores


El producto escalara · b de dos vectores es un número real dado por

a · b = a b cos α, (2.8)

donde α es el ángulo que forman entre sı́ los vectores a y b (ver la figura 2.1). En
la ecuación (2.8), a y b son los módulos de los vectores a y b, respectivamente. Esta
ecuación permite también demostrar tres propiedades muy interesantes del producto
escalar.

El módulo a de un vector a cumple que a2 = a · a.


Dos vectores no nulos tienen producto escalar igual a cero si y sólo si son per-
pendiculares.
La proyección de un vector a en la dirección de otro vector b es ab = (a · b)/b
(ver figura 2.1).

Los vectores unitarios i, j y k satisfacen las expresiones i · i = j · j = k · k = 1,


i · j = j · k = i · k = 0, de modo que en coordenadas cartesianas rectangulares, el
producto escalar de dos vectores se puede escribir como

a · b = a x bx + a y by + a z bz . (2.9)

El trabajo que realiza una fuerza F en el desplazamiento en lı́nea recta de una


partı́cula es máximo (y la fuerza será más eficiente para realizar ese desplazamiento),
cuando fuerza y desplazamiento son paralelos. El trabajo es cero cuando fuerza y
desplazamiento son perpendiculares.
Un ejemplo sencillo es el trabajo realizado por la fuerza de la gravedad en la caı́da
libre de un bloque de masa m desde un punto A, de altura hA , hasta un punto B, de
altura hB , según la figura 2.2. Tomando el eje y como altura medida desde el suelo, la
fuerza gravitatoria se escribe Fg = −mg j, y el desplazamiento es ∆r = (hB − hA )j.
Por tanto, el trabajo de la fuerza gravitatoria en este desplazamiento es

W = −mg j · (hB − hA ) j = mghA − mghB , (2.10)

pues j · j = 1.
Trabajo 21

hA

hB

Figura 2.2. Caı́da libre de un bloque entre dos puntos A y B. Se elige el sistema de referencia
de manera que la caı́da se produce a lo largo del eje y.

Trabajo realizado por una fuerza variable


En general, la fuerza F sobre la partı́cula puede depender de la posición y del tiempo,
en cuyo caso tenemos una fuerza variable. Además, la propia trayectoria puede no ser
rectilı́nea. La expresión (2.7) no es válida. Para generalizarla, se divide la trayectoria
de la partı́cula, entre los puntos inicial y final, en un número indefinido de desplaza-
mientos infinitesimales dr, dentro de cada uno de los cuales se puede considerar que
la fuerza es constante y la trayectoria recta. El trabajo infinitesimal dW en uno de
estos desplazamientos resulta, usando la expresión (2.7),

dW = F · dr. (2.11)

El trabajo total realizado por la fuerza a lo largo de toda la trayectoria de la partı́cula,


entre un punto inicial A y un punto final B (ver la figura 2.3), es una suma en
el continuo (se suma en desplazamientos infinitesimales), de manera que se escribe
formalmente como la integral
Z B
W = F · dr. (2.12)
A

Un ejemplo de cálculo del trabajo para una fuerza variable aparece en el movimiento
de una masa atada al extremo de un muelle horizontal de constante elástica k. Consi-
deremos un muelle en reposo al que atamos un cuerpo. La posición x = 0 corresponde
al punto de equilibrio del muelle. Estiramos el muelle hasta un punto x = A y lo
soltamos: el muelle se contrae. La fuerza con que el muelle actúa sobre la masa que
tiene en su extremo es F = −kx, siendo el signo negativo para expresar que el muelle
tira de la masa al contraerse hacia el punto de equilibrio. Calculemos el trabajo que
realiza esta fuerza en el movimiento de la masa desde x = A hasta x = 0. Tomamos
un desplazamiento infinitesimal dx y usamos la expresión (2.12). Obtenemos
Z 0
1 2
W = (−kx) dx = kA , (2.13)
A 2

donde se ha usado que una primitiva de la función x es x2 /2.


22 Dinámica

F
A
dr
rA B
rB
O
Figura 2.3. En una trayectoria curva, el trabajo se calcula sumando las contribuciones
infinitesimales de un conjunto de desplazamientos dr dentro de los cuales la fuerza es apro-
ximadamente constante y la trayectoria es aproximadamente recta.

Potencia
Resulta interesante conocer no sólo el trabajo que realiza una fuerza, sino también la
velocidad con la que lo realiza. Se define la potencia de una fuerza como el trabajo
que realiza por unidad de tiempo,
dW
P = . (2.14)
dt
Si usamos la expresión (2.11) para el trabajo infinitesimal realizado por la fuerza en
un desplazamiento dr de la partı́cula, resulta
F · dr
P = = F · v, (2.15)
dt
es decir, se puede escribir la potencia como el producto escalar de la fuerza por la
velocidad de la partı́cula. La unidad de potencia es el vatio, siendo 1 W = 1 J · s−1 .

2.3. Energı́a
El concepto de energı́a está ı́ntimamente relacionado con el de trabajo. Consideremos
una partı́cula de masa m que, bajo la acción de las fuerzas F1 , F2 , . . . que actúan sobre
ella, se mueve desde un punto inicial A hasta un punto final B. El trabajo total W
realizado sobre la partı́cula en su desplazamiento entre estos puntos se puede calcular
sumando los trabajos que realizan cada una de las fuerzas que actúan sobre ella, es
decir Z B
W = (F1 + F2 + . . .) · dr = W1 + W2 + . . . , (2.16)
A
siendo W1 el trabajo que realiza la fuerza F1 , W2 el trabajo que realiza la fuerza F2 ,
etc.

Energı́a cinética
La segunda ley de Newton ofrece un camino alternativo para obtener el trabajo total
realizado sobre una partı́cula. Si F = F1 +F2 +. . . es la fuerza total sobre la partı́cula,
Energı́a 23

ha de cumplirse F = ma, donde a es la aceleración. Por tanto,


Z B
W =m a · dr. (2.17)
A

Por las definiciones cinemáticas de velocidad y aceleración, tenemos que

dv 1
a · dr = · v dt = v · dv = d(v 2 ), (2.18)
dt 2
pues por la propiedades del producto escalar, v · v = v 2 , de manera que derivando se
obtiene la última igualdad de la expresión (2.18). Substituyendo en la ecuación (2.17),
resulta Z B
1 1 1
W = m d(v 2 ) = mvB 2
− mvA 2
, (2.19)
2 A 2 2
es decir, independientemente de las fuerzas que actúan, el trabajo total es igual al
valor de la cantidad (1/2)mv 2 calculada en el punto final B menos el valor de la
misma cantidad evaluada en el punto inicial A. Se llama energı́a cinética Ec de la
partı́cula a la cantidad
1
Ec = mv 2 , (2.20)
2
y el resultado (2.19) se expresa normalmente diciendo que el trabajo total es igual a
la variación de energı́a cinética,

W = ∆Ec = Ec (final) − Ec (inicial). (2.21)

Por su definición, la unidad SI de energı́a es el julio, igual que la unidad de trabajo.


Este resultado, conocido con el nombre de teorema trabajo-energı́a, dice que el trabajo
de la fuerza total sobre un cuerpo cambia el módulo de la velocidad del cuerpo, es decir,
varı́a su energı́a cinética. Un aspecto interesante del resultado dado por la ecuación
(2.21) es que la energı́a cinética de una partı́cula es el trabajo que esta partı́cula puede
realizar hasta que se para, por ejemplo al chocar con otra.

Energı́a potencial
En general, el trabajo realizado por una fuerza sobre una partı́cula depende de la
trayectoria que sigue esa partı́cula (por ejemplo el trabajo realizado por las fuerzas
de rozamiento). Sin embargo, existen determinadas fuerzas con la propiedad de que
el trabajo que realizan sólo depende de las coordenadas de los puntos inicial y final
de la trayectoria seguida. Estas fuerzas reciben el nombre de fuerzas conservativas.
Consideremos de nuevo el ejemplo en el que obtenı́amos el trabajo realizado por
la fuerza de la gravedad en la caı́da de un cuerpo desde un punto A hasta un punto
B (figura 2.2). Habı́amos calculado

W = mghA − mghB . (2.22)

Esto se puede escribir como

W = −[Ug (B) − Ug (A)] = −∆Ug , (2.23)


24 Dinámica

donde
Ug = mgh (2.24)
es una función de la posición del cuerpo (la altura h en este caso) y se llama energı́a
potencial gravitatoria. Ası́, el trabajo que realiza la gravedad en el movimiento del
bloque es igual a menos la variación de la energı́a potencial entre los puntos inicial y
final.
A cada fuerza conservativa F se puede asociar una función de las coordenadas
llamada energı́a potencial UF . El trabajo realizado por la fuerza conservativa F es
igual a menos la variación de la energı́a potencial entre los puntos inicial y final,

W = −∆UF = −[UF (final) − UF (inicial)]. (2.25)

Esto implica que el trabajo que realiza una fuerza conservativa a lo largo de cualquier
trayectoria cerrada es cero.

Conservación de la energı́a
Si todas las fuerzas que actúan sobre un cuerpo son fuerzas conservativas, el trabajo
total realizado sobre el cuerpo es, por un lado, igual a menos la suma de las variaciones
de las energı́as potenciales asociadas a cada fuerza y, por otro lado, igual a la variación
de la energı́a cinética del cuerpo,

W = −∆U1 − ∆U2 − . . . = ∆Ec . (2.26)

De aquı́, resulta que


∆ (Ec + U1 + U2 + . . .) = 0, (2.27)
es decir, se llega al principio de conservación de la energı́a mecánica: cuando actúan
sobre un sistema sólo fuerzas conservativas, la energı́a total del sistema ET permanece
constante durante el movimiento, siendo

ET = Ec + U 1 + U 2 + . . . . (2.28)

En el ejemplo anterior del cuerpo que cae entre A y B, si despreciamos el rozamiento


del aire (que es una fuerza no conservativa), actúa sólo la fuerza gravitatoria. Ası́, por
la conservación de la energı́a, se tiene
1 1
mv 2 + mghA = mvB
2
+ mghB . (2.29)
2 A 2
Por tanto, como hA es mayor que hB , resulta que vA es menor que vB : el bloque se
acelera desde el punto A hasta el punto B.
Si actúan fuerzas no conservativas, como el rozamiento, ocurre que éstas no tienen
asociada una energı́a potencial, de manera que el principio de conservación de la
energı́a mecánica no se cumple. En este caso, el trabajo Wnc que realiza esta fuerza
no conservativa se puede escribir como

Wnc = ∆ (Ec + U ) , (2.30)

donde U es la energı́a potencial de las fuerzas que son conservativas (si las hay).
Sistemas de partı́culas: centro de masas 25

2.4. Sistemas de partı́culas: centro de masas


Hasta aquı́ hemos considerado la mecánica de una partı́cula puntual. Para estudiar el
movimiento de sistemas materiales, es necesario considerar el conjunto de partı́culas
que lo componen.
Todo cuerpo o sistema de partı́culas posee un punto especial llamado centro
de masas. Si el cuerpo está formado por un conjunto de N partı́culas de masas
{m1 , m2 , . . . , mN }, situadas en puntos con vectores de posición {r1 , r2 , . . . , rN }, su
centro de masas es un punto situado en
PN PN
i=1 mi ri i=1 mi r i
rCM = PN = , (2.31)
i=1 mi
M
P
donde M = mi es la masa total del sistema. Podemos ahora escribir el momento
lineal total del cuerpo como
N
X N
d X
p= pi = mi ri = M vCM , (2.32)
i=1
dt i=1

es decir, el momento lineal total es igual al producto de la masa total por la velocidad
del centro de masas. La segunda ley de Newton aplicada a todo el cuerpo dice que
dp
Fext = = M aCM , (2.33)
dt
donde Fext es la fuerza externa total sobre el cuerpo (la suma de todas las fuerzas
externas que actúan sobre cada partı́cula del sistema). Las fuerzas internas que ejercen
entre sı́ las partı́culas del sistema no contribuyen a la expresión (2.33) porque se
cancelan dos a dos usando la tercera ley de Newton. El resultado (2.33) implica que el
centro de masas de un cuerpo se mueve como si todas las fuerzas externas estuvieran
actuando sobre él, y toda la masa del cuerpo estuviera concentrada en este punto.
Si, por ejemplo, lanzamos hacia arriba una caja llena de pelotas de tenis, algunas
pelotas se saldrán de la caja durante el movimiento y se alejarán, pero el centro de
masas del sistema se moverá como una partı́cula puntual, con una masa igual a la
masa total del sistema, sobre la que actúa la fuerza de la gravedad según la segunda
ley de Newton. Este tipo de movimiento ya lo hemos estudiado, de manera que sólo
nos queda considerar el movimiento de cada pelota con respecto al centro de masas.

2.5. Momento angular


La descripción del movimiento de un sistema de partı́culas respecto a un origen de
coordenadas, sea o no éste el centro de masas, resulta muy complicada en cuanto el
sistema consta de más de dos partı́culas. Sin embargo, un caso particular en que esto se
simplifica es el del cuerpo o sólido rı́gido. Un cuerpo rı́gido es un sistema de partı́culas
en el que las distancias entre las partı́culas permanecen constantes durante todo el
movimiento. Si estudiamos cómo se mueve un cuerpo rı́gido y decidimos ignorar el
movimiento de su centro de masas, sólo queda una cosa que el cuerpo pueda hacer:
rotar alrededor de él.
26 Dinámica

a×b

a b
α

Figura 2.4. El producto vectorial de dos vectores es otro vector.

La cantidad mecánica que determina cómo rota una partı́cula respecto a un punto
fijo dado se llama momento angular L, y se define como

L = r × p. (2.34)

Su unidad SI es 1 kg · m2 · s−1 . En la ecuación (2.34), r es el vector de posición de


la partı́cula respecto al punto fijo y p = mv es el momento lineal de la partı́cula.
El signo × representa un nuevo tipo de producto entre vectores, llamado producto
vectorial.

Producto vectorial de dos vectores


El producto vectorial a × b de dos vectores es otro vector c tal que su módulo c
está dado por
c = a b sen α, (2.35)
donde α es el ángulo que forman entre sı́ los vectores a y b (ver la figura 2.4). Su
dirección es perpendicular al plano que forman los vectores a y b, y su sentido viene
dado por una de las siguientes reglas:

La primera dice que, si colocamos la mano derecha con los dedos ı́ndice, corazón
y pulgar formando un triedro, y tomamos el ı́ndice en la dirección y sentido de a,
y el corazón en la dirección y sentido de b, entonces el pulgar nos da el sentido
del producto vectorial a × b. Es la regla de la mano derecha.
La segunda regla es muy parecida, pero el triedro se compone con los dedos
ı́ndice, corazón y pulgar de la mano izquierda. Se toma el corazón en la dirección
y sentido de a, el ı́ndice en la dirección y sentido de b, y entonces el pulgar nos
da el sentido de a × b. Es la regla de la mano izquierda.
La tercera regla se aplica con la mano derecha, colocando los cuatro dedos ma-
yores haciendo un barrido desde el vector a al vector b, de manera que el pulgar
nos da el sentido de a × b. Es la regla del sacacorchos o regla del tornillo.

Una propiedad interesante del producto vectorial es que es anticonmutativo, es decir,


a × b = −b × a, de modo que el producto vectorial de un vector por sı́ mismo es
el vector nulo. Por otro lado, y dada la definición de este producto, resulta que dos
vectores no nulos tienen producto vectorial igual a cero si y sólo si son paralelos.
El producto de cualquiera de los vectores de base i, j y k de nuestro sistema
de referencia de laboratorio por sı́ mismo es, por tanto, nulo (i × i = 0, etc). Con
Momento angular 27

r v
m

Figura 2.5. Momento angular de una partı́cula en movimiento circular.

respecto al producto vectorial de uno de ellos por otro, el resultado es siempre el


tercero con un signo dado por el orden en que se multiplican: si el producto tiene el
orden i → j → k → i → . . ., entonces lleva un signo + (por ejemplo, i × j = +k),
pero si el producto lleva el orden contrario, entonces lleva un signo − (por ejemplo,
k × j = −i). Ası́, en coordenadas cartesianas rectangulares, el producto vectorial se
expresa como

a × b = (ay bz − az by ) i + (az bx − ax bz ) j + (ax by − ay bx ) k. (2.36)

Para recordar esta expresión, se puede escribir simbólicamente como un determinante


de la siguiente manera
i j k

a × b = ax ay az (2.37)
bx by bz

Momento angular en un movimiento circular


Una buena manera de entender por qué el momento angular describe las rotaciones
es calcular el momento angular de una partı́cula puntual que sigue un movimiento
circular. Consideremos que la trayectoria de una partı́cula de masa m es una circun-
ferencia de radio r en el plano xy, con centro en el origen. La partı́cula recorre la
circunferencia en sentido antihorario (ver la figura 2.5). Usando la ecuación (2.34), el
momento angular de esta partı́cula con respecto al origen, en un punto cualquiera de
su trayectoria, es
L = m r × v = mrv k = mr2 ω k, (2.38)
donde se han usado las reglas del producto vectorial aplicadas al caso en que los
vectores que se multiplican son perpendiculares, y también que la velocidad angular
viene dada por v = rω. En esta expresión, se puede ver que aparecen el radio de
la trayectoria, la velocidad con que la recorre y el eje con respecto al cual rota la
partı́cula, especificado mediante un vector unitario.
Es interesante notar cómo se relaciona la dirección y el sentido del momento
angular con el eje respecto al cual rota la partı́cula. En general, el vector unitario que
determina la dirección y el sentido del momento angular, que en el caso del ejemplo
es el vector k, nos determina el eje con respecto del cual rota el cuerpo. En el ejemplo
considerado, es el eje z positivo, ası́ que la partı́cula gira en sentido antihorario: para
verlo, conviene utilizar la regla del tornillo, colocando el pulgar de la mano derecha
28 Dinámica

ω
d1
r1
O r2
d2

Figura 2.6. Rotación de un cuerpo rı́gido alrededor de un eje. Todos los puntos del cuerpo
giran con la misma velocidad angular.

apuntando a lo largo del vector k o eje z positivo, de modo que el resto de los dedos
nos indican cómo rota el cuerpo.

2.6. Rotaciones planas de un cuerpo rı́gido


Vamos a suponer que, durante la rotación de un cuerpo rı́gido, existe una lı́nea del
cuerpo que se mantiene fija (figura 2.6). Decimos entonces que el cuerpo realiza una
rotación plana con respecto a este eje. En este caso, todos los puntos del cuerpo rı́gido
rotan alrededor de este eje con la misma velocidad angular ω, y es esta velocidad
angular la que queremos conocer.
Un punto del cuerpo, de vector de posición ri respecto a un punto O del eje,
de masa mi , sigue un movimiento circular de radio di (siendo di la distancia entre el
punto i y el eje de rotación) con velocidad angular ω (ver figura 2.6). El momento
angular de este punto respecto a O está dado por

L i = mi r i × v i , (2.39)

donde vi es su velocidad.
Supongamos que el eje fijo de rotación es un eje principal de inercia, lo cual
sucede en dos casos: el eje de rotación es un eje de simetrı́a del cuerpo, o el plano
perpendicular al eje de rotación en el punto O es plano de simetrı́a del cuerpo. En
este caso, el momento angular total del cuerpo se puede escribir como
X X 
L= Li = mi d2i ω k, (2.40)

es decir, las contribuciones de cada punto que afectan al momento angular total son
del mismo tipo que el momento angular de una partı́cula en movimiento circular
respecto al centro del cı́rculo. En consecuencia, el momento angular total tiene la
dirección y sentido del eje de rotación. En la ecuación (2.40) hemos supuesto que el
eje de rotación es el eje z positivo.
Rotaciones planas de un cuerpo rı́gido 29

Momento de inercia y vector velocidad angular


La cantidad entre paréntesis en la expresión (2.40) se conoce con el nombre de mo-
mento de inercia I del cuerpo rı́gido y es el producto de la masa total del cuerpo por
un factor geométrico (con dimensiones de área) que depende de la forma del cuerpo
y del eje de rotación. Es una constante para un cuerpo rı́gido dado y un eje fijo dado.
Por otro lado, interesa definir el vector velocidad angular del cuerpo ω, de tal
modo que
ω = ω k. (2.41)
Es un vector cuyo módulo es la velocidad angular ω = v/r y cuya dirección y sentido
son los del eje con respecto al cual rota el cuerpo. Con estas definiciones, el momento
angular del cuerpo rı́gido respecto a un eje fijo es

L = I ω. (2.42)

Momento de torsión
En general, la variación con
P respecto al tiempo del momento angular total de un
sistema de partı́culas L = Li = ri × pi es la suma de las variaciones del momento
angular de cada partı́cula, que se puede escribir como
dLi dri dpi
= × p i + ri × . (2.43)
dt dt dt
La derivada de la posición es la velocidad, y la derivada del momento lineal es la
fuerza neta Fi aplicada a la partı́cula. Dado que la velocidad y el momento lineal son
paralelos, resulta
dLi
= ri × F i = τ i . (2.44)
dt
La cantidad que aparece en el segundo miembro de esta ecuación se conoce con el
nombre de momento de torsión τ i de la partı́cula con respecto a un punto O tomado
como origen. Su unidad es 1 N · m y expresa la eficiencia de las fuerzas para provocar
un giro. Cuando sumamos las contribuciones de todas las partı́culas, el cambio del
momento angular total resulta
dL X dLi X X
= = ri × F i = τi = τ, (2.45)
dt dt
donde τ es el momento de torsión total τ del sistema. Para calcular el momento
de torsión total es necesario conocer en qué punto se aplican las fuerzas. Cuando el
sistema de partı́culas que tenemos es un cuerpo rı́gido en rotación plana, su momento
angular se puede escribir mediante la ecuación (2.42). Su variación temporal está dada
por
dL dω
=I . (2.46)
dt dt
Igualando ahora las expresiones (2.45) y (2.46), llegamos a lo que se conoce como
segunda ley de Newton para la rotación plana de un cuerpo rı́gido

τ =I . (2.47)
dt
30 Dinámica

Figura 2.7. Una rueda gira al aplicar fuerzas iguales y de sentido opuesto sobre ella porque
el momento de torsión total es no nulo.

El momento de torsión total de las fuerzas exteriores sobre un cuerpo rı́gido es igual
al momento de inercia del cuerpo multiplicado por su aceleración angular.
Cuando la fuerza total aplicada sobre una partı́cula es nula, la primera ley de
Newton nos asegura que ésta va a seguir un movimiento uniforme, sin aceleración. Sin
embargo, cuando esto mismo ocurre sobre un cuerpo rı́gido, en general, hay no sólo
dinámica de traslación, dada por el movimiento de su centro de masas, sino también
dinámica de rotación. Y puede haber dinámica de rotación incluso cuando la suma de
las fuerzas sobre el cuerpo es nula. El truco está en que estas fuerzas estén aplicadas
en puntos diferentes del cuerpo. Si es ası́, aunque la fuerza total sea cero y, por tanto,
el centro de masas del cuerpo no tenga ninguna aceleración, el momento de torsión
sobre este cuerpo puede ser no nulo, en cuyo caso adquirirá una aceleración angular
de rotación con respecto a un eje.

Rotación de una rueda

Un ejemplo es el caso de una rueda de radio R que hacemos girar con las manos
(figura 2.7). Si hacemos una fuerza de módulo F hacia abajo con la mano izquierda,
y una fuerza del mismo módulo pero hacia arriba con la mano derecha en los puntos
indicados en la figura 2.7, la fuerza total sobre la rueda es cero, ası́ que no hay
aceleración del centro de masas de la rueda y éste no se desplaza. El momento de
torsión con respecto al centro de la rueda es

τ = r1 × F1 + r2 × F2 = (−R) i × (−F ) j + R i × F j = 2RF k, (2.48)

que es un vector no nulo aunque la fuerza total sobre la rueda sea nula.
El módulo del momento de torsión τ = 2RF es proporcional a la aceleración
angular que adquiere la rueda al rotar respecto a un eje que pasa por su centro. El
vector unitario que determina la dirección y el sentido del vector τ , que en este caso es
el vector k, nos determina el eje con respecto del cual rota la rueda. En este ejemplo,
es el eje z positivo, ası́ que la rueda gira en sentido antihorario.
Ejercicios 31

2.7. Ejercicios

1. Sea un triángulo rectángulo, de manera que su hipotenusa está colocada verti-


calmente. Un teorema debido a Galileo dice que el tiempo que tardarı́a en caer
un cuerpo a lo largo de la hipotenusa es el mismo que tardarı́a en hacerlo a lo
largo de uno de los catetos (con la hipotenusa siempre situada verticalmente).
Demostrarlo.
2. Un cohete se mueve en el espacio exterior a velocidad constante v0 . Su misión
requiere que cambie su trayectoria en 45◦ sin variar el módulo de la velocidad.
Para ello, el cohete expulsa, en un determinado instante, una masa de gas igual
a un 1/100 de su masa. Calcular la velocidad con la que es expulsado este gas.
Solución: Tomando el eje x en la dirección de la velocidad
√ inicial del cohete, la
velocidad final del cohete es  v √
cohete = v 0 (i + j) /
 √ 2 y la velocidad con que se
expulsa el gas es vgas = v0 (100 2 − 99)i − 99j / 2.
3. Puesto que la Tierra rota alrededor de un eje que pasa por sus polos, la aceleración
efectiva de la gravedad en el ecuador es ligeramente inferior a la que existirı́a si
la Tierra no rotase. Estimar la magnitud de este efecto.
Solución: Usando que el radio de la Tierra es RT = 6,37 × 106 m y que su periodo
es de 24 horas, la gravedad en el ecuador resulta gef = 9, 77 m · s−2 .
4. Un bloque de masa m se encuentra en reposo sobre el borde izquierdo de un
bloque más pesado, de masa M . La superficie de separación entre ambos bloques
es una superficie horizontal que presenta una fuerza de rozamiento fr = µmg
opuesta al movimiento de un bloque sobre otro. El bloque de masa M tiene
ruedas, de manera que su movimiento sobre el suelo no presenta rozamiento.
Una fuerza horizontal constante de módulo F se aplica al bloque de masa m,
poniéndolo en movimiento sobre el otro. Si el bloque de masa M recorre una
distancia D sobre el suelo, ¿qué distancia recorre el bloque de masa m sobre el
otro en el mismo tiempo?
Solución: d = D(M F/(µgm2 ) − M/m − 1).
5. Una partı́cula puntual de masa m se apoya sobre la parte superior de una esfera
lisa de radio R. Si la partı́cula comienza a moverse desde el reposo, ¿en qué punto
abandonará la esfera?
Solución: La partı́cula abandonará la esfera cuando el ángulo α que forma su
vector de posición desde el centro de la esfera con la vertical satisface cos α = 2/3.
6. Dada la masa m de una esfera y el radio R del cı́rculo, determinar la altura mı́ni-
ma h, de la cual debe partir la esfera, para completar con éxito la curva en lazo
mostrada en la figura 2.8. Suponer que la bola desliza sin girar y sin rozamiento
y que su velocidad inicial es nula. Calcular las reacciones de la superficie (fuerza
normal) sobre la bola en los puntos A y B.
Solución: h = 5R/2, NA = 0, NB = 6mg.
7. Un vagón de ferrocarril de masa M = 1000 kg, sin techo y con un área en el
suelo de 10 m2 , se mueve sin rozamiento a lo largo de raı́les rectilı́neos con una
velocidad de 5 m · s−1 . En un momento dado, comienza a llover verticalmente
a razón de 0, 001 litros · cm−2 · s−1 . Calcular la velocidad y la aceleración del
vagón. Determinar la fuerza que se necesitarı́a para mantenerlo a una velocidad
constante de 5 m · s−1 .
Solución: v = 50/(10 + t), a = −50/(10 + t)2 , F = 500 N.
32 Dinámica

h
11111111111111111111
00000000000000000000
B
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
Figura 2.8.

8. Un cable inextensible y de masa despreciable está enrollado en un cilindro sólido


de masa M y radio R que puede girar alrededor de su eje. Se tira del cable con
una fuerza F . Determinar la aceleración angular del cilindro. Dato: el momento
de inercia del cilindro respecto a su eje es M R2 /2.
Solución: dω/dt = 2F/(M R).
9. Una varilla de longitud L y masa M puede girar sin rozamiento respecto a un
punto fijo O situado a una distancia L/3 de uno de sus extremos (la varilla
está clavada en la pared en ese punto). Inicialmente, la varilla está en reposo en
posición horizontal, sujeta con una mano. Al soltarla, comienza a girar. Calcular
la aceleración angular con la que rota si su momento de inercia con respecto al
punto O es I = M L2 /9.
Solución: dω/dt = 3g/(2L).
Capı́tulo 3

Carga eléctrica

3.1. Propiedades de las cargas eléctricas


Faraday, uno de los padres del electromagnetismo, llegó a comentar que algún dı́a se
cobrarı́an impuestos por el uso de la energı́a eléctrica. Hoy, todos pagamos estos im-
puestos, pero no sólo eso. La interacción electromagnética es la principal responsable
de la estructura atómica, las neuronas transportan las órdenes del cerebro a través de
impulsos eléctricos, diferentes formas de energı́a se transforman en energı́a eléctrica
para su transporte y uso, etc.
Si frotamos una varilla de vidrio con un paño de seda, el espacio que rodea a
ambos cuerpos adquiere ciertas propiedades que podemos visualizar. Por ejemplo,
si se esparcen pequeños trozos de papel en las cercanı́as del vidrio, algunos de estos
trozos son atraı́dos por la varilla. Esta atracción es parecida a la atracción gravitatoria
que sienten todos los cuerpos entre sı́, pero millones de millones de veces más intensa.
Experimentos sencillos como éste muestran que los cuerpos manifiestan una propiedad
llamada carga eléctrica, que es una magnitud escalar que puede ser positiva o negativa.
También hay cuerpos que no poseen esta propiedad, debido a que la cantidad de carga
positiva es igual a la cantidad de carga negativa en ellos. Estos cuerpos se denominan
eléctricamente neutros.
La primera propiedad que se deduce de los experimentos con cuerpos cargados
es que las cargas del mismo signo se repelen y las cargas de signo opuesto se atraen.
Si colocamos una varilla de vidrio cargada positivamente al lado de una bola de acero
cargada negativamente y colgada por un hilo del techo, observaremos que la bola se
acerca a la varilla. Esto significa que se ha producido una interacción entre la carga
negativa de la bola y la carga positiva de la varilla, y que esta interacción es atractiva.
Si hacemos un experimento parecido entre dos cuerpos cargados negativamente, llega-
remos a la conclusión de que la interacción es, en este caso, repulsiva. Podemos notar
aquı́ una diferencia fundamental entre la carga y la masa: la interacción gravitatoria,
debida a la masa de los cuerpos, es siempre atractiva. La unidad SI de carga es el
culombio (C).
Un cuerpo puede tener una carga positiva de 0,17 C y otro una carga negativa de
−5,4 mC. En principio cualquier valor de la carga eléctrica parecerı́a posible, pero no
es ası́. Esta segunda propiedad es una consecuencia de la estructura fundamental de la
materia, y se conoce con el nombre de principio de cuantización de la carga eléctrica.
Se puede expresar este principio de la siguiente forma: todos los cuerpos materiales

33
34 Carga eléctrica

poseen una carga eléctrica cuyo valor es siempre algún múltiplo entero de una carga
fundamental e = 1,6 × 10−19 C. Es decir, si medimos la carga de un cuerpo y esta
carga vale Q, siempre se cumple que hay algún número entero n (positivo o negativo)
tal que
Q = ne. (3.1)
Por tanto, un cuerpo puede tener una carga igual a 8546 e, o igual a −17568 e, pero
no hay ningún cuerpo que tenga una carga igual a 157,25 e.
Una tercera propiedad es la aditividad de la carga eléctrica. Con esto se quiere
expresar que la carga neta de un conjunto de cargas es igual a la suma de las cargas
que forman este conjunto (cada una con su signo). Por ejemplo, si tenemos en una
región del espacio tres cargas de valores Q1 = 4,5 µC, Q2 = −3,6 µC y Q3 = 0,2 µC, la
carga neta de esta región será Q = Q1 + Q2 + Q3 = 1,1 µC. No hay que olvidar que la
carga eléctrica es una propiedad de los cuerpos materiales. Sin soporte material no hay
carga y el movimiento de la carga está ligado al movimiento del soporte material. A
menudo, los cuerpos cargados entran en contacto, y la carga se transfiere de un cuerpo
a otro. En todos los casos, se cumple que, en un proceso de transferencia de carga, la
carga neta siempre se conserva. Esta propiedad se llama principio de conservación de
la carga.

3.2. Fuerza electrostática


El estudio de la interacción entre cargas en reposo se llama electrostática, y se fun-
damenta en la ley que obtuvo Coulomb, en 1785, para describir cuantitativamente la
fuerza entre dos cuerpos cargados que están en reposo uno respecto del otro en un
sistema de referencia cartesiano. La ley de Coulomb se refiere a la situación mostrada
en la figura 3.1. En ella se tienen dos cargas puntuales q1 y q2 separadas por una
distancia r12 y situadas en el vacı́o. Ambas cargas están en posiciones fijas r1 y r2 con
respecto al sistema de referencia. La fuerza electrostática Fe,12 se refiere a la fuerza
que ejerce la carga q1 sobre la carga q2 . Esta fuerza viene dada en términos del vector
de posición relativo de q2 respecto de q1 ,

r12 = r2 − r1 . (3.2)

El vector r12 tiene por módulo la distancia r12 entre las dos cargas, esto es |r12 | = r12 ,
su dirección es a lo largo de la recta que une las dos cargas y su sentido va desde la
carga q1 a la carga que experimenta la fuerza q2 . El vector unitario u12 , dado por
r12 r2 − r1
u12 = = , (3.3)
r12 |r2 − r1 |

determina la dirección y sentido de r12 . La ley de Coulomb se escribe


q1 q2
Fe,12 = k 2 u12 , (3.4)
r12

siendo k la constante de Coulomb. Su valor en el vacı́o es

k = 9 × 109 N · m2 · C−2 , (3.5)


Fuerza electrostática 35

r q
q 12 2
1
r
1
r
2

O
y
x

Figura 3.1. Posiciones de las cargas puntuales q1 y q2 respecto del sistema de referencia de
laboratorio con origen en el punto O.

aunque es más común escribir


1
k= , (3.6)
4πε0
donde
ε0 = 8, 85 × 10−12 C2 · N−1 · m−2 , (3.7)
es la permitividad del vacı́o. En comparación con ella, la permitividad del aire, en
condiciones normales de presión y temperatura, es εaire = 1, 0005 ε0 , es decir, la ley
de Coulomb en el aire es prácticamente igual que la ley de Coulomb en el vacı́o.
Por eso las conclusiones que obtengamos estudiando la electrostática en el vacı́o son
válidas, con muy buena aproximación, para la electrostática en el aire.
Como se observa en la expresión (3.4), la interacción electrostática entre cargas
puntuales disminuye como el inverso del cuadrado de la distancia entre las cargas.
Esto significa que el valor de la interacción decrece muy rápidamente a medida que
las cargas se separan de modo que, si las cargas están muy lejos una de otra, apenas
se afectan. Otra caracterı́stica esencial es que la fuerza está dirigida a lo largo de la
recta que une la carga q1 con la carga q2 que experimenta la interacción. El sentido de
la fuerza electrostática depende del valor del producto de las cargas q1 q2 , de manera
que si q1 q2 > 0 (las cargas tienen el mismo signo), entonces la fuerza es repulsiva,
y si q1 q2 < 0 (las cargas tienen signo opuesto), la fuerza es atractiva, como ocurre
experimentalmente. Por último, es fácil ver que la fuerza Fe,21 que ejerce q2 sobre q1
satisface
Fe,21 = −Fe,12 , (3.8)
ası́ que la fuerza que ejerce q2 sobre q1 tiene el mismo módulo, la misma dirección y
sentido opuesto que la fuerza que ejerce q1 sobre q2 , cumpliéndose la tercera ley de
Newton.
La ley de Coulomb se generaliza fácilmente en el caso de tener una distribución
discreta de cargas puntuales (es decir, un número entero de cargas puntuales indivi-
duales separadas una de otra) según el llamado principio de superposición: las fuerzas
aplicadas sobre la misma partı́cula se suman como vectores (figura 3.2). Por tanto,
36 Carga eléctrica

F
{1,2}0
F
20

q0
q
1
F
10

q2

Figura 3.2. Fuerza que ejercen 2 cargas puntuales q1 y q2 sobre otra carga puntual q0 . En
este ejemplo se supone que las tres cargas tienen el mismo signo, como se puede deducir del
sentido de los vectores que representan las fuerzas.

la fuerza que ejerce una distribución discreta de cargas puntuales {q1 , q2 , . . . , qN }


con vectores de posición {r1 , r2 , . . . , rN }, sobre una carga puntual q0 con vector de
posición r0 , es
Fe,{1,2,...,N }0 = Fe,10 + Fe,20 + . . . + Fe,N 0 . (3.9)

3.3. Conductores y dieléctricos


La materia ordinaria está formada por átomos, cuyas longitudes tı́picas son del orden
de 10−10 m. A pesar de su pequeño tamaño, los átomos están formados por com-
ponentes más elementales. La zona central o núcleo está formada por dos tipos de
partı́culas que se llaman protones y neutrones. El protón es una partı́cula con una
masa mp = 1, 7 × 10−27 kg y una carga positiva qp = +e = 1, 6 × 10−19 C. A su vez, el
neutrón es una partı́cula sin carga cuya masa es prácticamente igual que la del protón.
En torno al núcleo, en cada átomo, existe un cierto número de electrones formando
una especie de nube, de modo que casi todo el volumen de un átomo es el de su nube
electrónica. Cada electrón tiene una carga negativa qe = −e = −1, 6 × 10−19 C y
una masa me = 9, 1 × 10−31 kg. Su carga es la misma que la del protón pero de signo
opuesto, mientras que su masa es mucho más pequeña que la de protones y neutrones,
por eso la masa de un átomo está concentrada en su núcleo.
Dado que la carga de un electrón es de igual magnitud pero de signo opuesto a
la de un protón, es obvio que un átomo que posea tantos protones como electrones no
tiene carga neta, por lo que será neutro. Pero el número de electrones de un átomo
puede variar, bien porque los pierda, en cuyo caso el átomo se convierte en un ion
positivo o catión, o porque los gane, y el átomo se convierte en un ion negativo o
anión. En ambos casos, la carga neta de un átomo será siempre igual a un número
entero de veces la carga fundamental e.
Veamos ahora cómo es posible que la carga eléctrica pueda moverse en el inte-
rior de un material. La mayor o menor facilidad que tiene la carga para moverse en
el interior de un material se llama conductividad eléctrica. Pero la pregunta es por
qué hay sustancias mejores conductoras (con mayor conductividad) que otras.
Procesos de carga en conductores y dieléctricos 37

Los electrones de un átomo se distribuyen en diferentes capas u orbitales, atraı́dos


por la carga positiva del núcleo. Debido a que esta atracción disminuye mucho con la
distancia, los electrones de las última capas (las más alejadas del núcleo) son atraı́dos
con menor fuerza que los de las capas más internas, existiendo además un efecto de
repulsión entre los electrones de diferentes capas. Ası́, las últimas capas de un átomo
pueden perder o admitir más fácilmente electrones. Estas últimas capas reciben el
nombre de capas u orbitales de valencia.
Las sustancias en la naturaleza, por lo general, están formadas por átomos de di-
ferentes elementos enlazados entre sı́ eléctricamente. En las sustancias que presentan
enlaces iónicos (iones positivos y negativos de diferentes elementos se atraen eléctri-
camente) y covalentes (los átomos que forman las moléculas comparten uno o más
electrones de la última capa), todos los electrones de valencia son necesarios para el
enlace atómico, de manera que no quedan electrones que puedan moverse por el inte-
rior del material. Por eso la mayorı́a de estas sustancias tienen baja conductividad y
se les llama aislantes o dieléctricos. La carga eléctrica se mueve con mucha dificultad
en el interior de un material aislante, como la goma, la madera y muchos plásticos.
Los materiales metálicos presentan otro tipo de enlace. En el estado sólido, los
átomos forman una red espacial o cristal, cuya estructura se repite periódicamente.
Los átomos individuales que forman la red interaccionan con sus vecinos de tal manera
que parte de los electrones de valencia intervienen en el enlace y parte se colectivizan,
pasando a pertenecer al conjunto cristalino. A estos últimos se les llama electrones
libres. La causa por la cual los metales son buenos conductores de la electricidad es que
poseen muchos electrones de este tipo. También existen algunos materiales, llamados
semiconductores que actúan como aislantes en determinadas condiciones ambientales
y como conductores en otras.
En realidad, no existen materiales totalmente conductores ni totalmente aislantes,
sino una gama casi completa de comportamientos intermedios, en los que la facilidad
para conducir carga está más o menos acentuada. Pero la conductividad de un metal
puede ser mil millones de veces mayor que la de un aislante como el vidrio. Por
ejemplo, en un cable común de un aparato eléctrico, la carga fluye a través de varios
metros de alambre conductor desde el enchufe conectado a la red eléctrica hacia el
aparato, y luego regresa por otro alambre en el mismo cordón, en lugar de pasar
directamente de un alambre a otro a través de una pequeña fracción de centı́metro de
aislamiento plástico. Por esta razón supondremos casi siempre que un buen aislante
tiene conductividad nula.

3.4. Procesos de carga en conductores y dieléctricos


Existen diferentes maneras de cargar los cuerpos. Todos hemos experimentado los
efectos de cargar nuestro cuerpo por fricción: tras arrastrar los pies por una alfombra,
sentimos un chispazo al tocar el pomo de una puerta. En este caso, se arrancan
literalmente electrones que pasan de un cuerpo a otro. La energı́a mecánica se emplea
en romper los enlaces que mantienen unidos a los electrones en un cuerpo y, al quedar
libres, pueden transferirse a otro. También se puede transferir carga por contacto (no
es conveniente tocar las patillas metálicas de los chips de los ordenadores al manejarlos,
pues podrı́amos dañarlos al depositar carga en ellos).
Si el material en que hemos depositado carga es un aislante, la carga normalmente
38 Carga eléctrica

_
+ ___ _
+
+
+
_ +
_ + ___ _
_ + + +
_ +
_ + +

Figura 3.3. Carga por inducción. Una varilla cargada negativamente se acerca a una bola
de hierro inicialmente neutra colgada del techo por un hilo. Se observa que la bola es atraı́da
por la varilla, debido a que se ha producido un exceso de carga positiva en la región de la
bola cercana a la varilla, contrarrestada por un exceso de carga negativa en la región de
la bola más alejada de la varilla. Si se conecta a tierra esta región más alejada, y se retira
después la varilla, casi inmediatamente la bola de hierro queda cargada positivamente, con
el exceso de carga positiva colocada en toda la superficie de la bola.

se queda ligada al punto de contacto. Es posible entonces tener una distribución de


carga no uniforme. Por ejemplo, al pasar la mano por la pantalla de un ordenador o
un televisor se siente un cosquilleo debido a que la carga acumulada en el cristal se
transfiere a la mano. Esa carga está formada por electrones que provienen del haz que
incide sobre la pantalla por detrás, algunos de los cuales se acumulan en el cristal. Sin
embargo, si el material es un buen conductor, la carga depositada en él puede moverse
por el interior del material. Como las cargas del mismo signo se repelen, tenderán a
separarse minimizando la repulsión entre ellas. Cuando dejan de moverse, se dice que
se ha alcanzado el equilibrio electrostático, momento en el cual todo el exceso de carga
se ha situado en la superficie del conductor.
Otra manera de cargar un conductor es por inducción. Por ejemplo, consideremos
una esfera metálica inicialmente neutra suspendida de un hilo no conductor, a la cual
acercamos una varilla cargada negativamente según se puede ver en la figura 3.3.
La carga de la varilla repele a los electrones situados en la parte de la esfera más
cercana a la varilla. Ası́, mientras mantengamos la varilla cerca de la esfera, la parte
de ésta más próxima a la varilla presenta un exceso de carga positiva, mientras que
la parte de la esfera más alejada presenta un exceso de carga negativa. Si tocamos
momentáneamente el lado más lejano, los electrones pueden ser conducidos hasta el
suelo: la esfera se ha puesto a tierra. La tierra es el concepto por el que designamos
un depósito enorme de carga, y nuestro planeta es uno de ellos, de ahı́ el nombre.
Por consiguiente, la esfera habrá quedado cargada positivamente si a continuación
dejamos de tocarla.
En realidad, la carga por inducción no se restringe a los conductores, sino que
puede presentarse en todos los materiales. En el caso de los dieléctricos, en lugar de
movimiento de electrones libres, lo que ocurre al acercar la varilla cargada es una
reorientación o polarización de la carga eléctrica en las moléculas del material, de
manera que los centros de las distribuciones de carga positiva y negativa en cada
molécula dejan de coincidir, como se muestra en la figura 3.4. Se genera ası́ un exceso
de carga (llamada carga ligada en este caso) de signo opuesto a la de la varilla en
la superficie cercana a ésta. El centro de carga de un cuerpo es un punto que se
Ejercicios 39

_
_+ + _
___ _
_ +
_ +
_ +
_ +

Figura 3.4. Polarización de un dieléctrico por inducción.

define de manera análoga al centro de masas (visto en el capı́tulo 2). Si tenemos N


cargas puntuales del mismo signo {q1 , q2 , . . . , qN }, situadas en puntos con vectores de
posición {r1 , r2 , . . . , rN }, su centro de carga es un punto situado en
PN PN
i=1 qi ri i=1 qi ri
rCQ = PN = , (3.10)
i=1 qi
Q
P
siendo Q = qi la carga total. En una molécula neutra, podemos considerar el centro
de carga positiva y el centro de carga negativa. Si la molécula no está polarizada, estos
dos puntos coinciden. Sin embargo, en una molécula polarizada la posición de los dos
centros de carga será diferente.
Una última aclaración. Muchas veces se dice que carga positiva es transferida
a algún sitio o que se distribuye de algún modo. No hay nada erróneo en ello, pues
decir que se se añade carga positiva equivale a decir que se quita carga negativa: es
el balance de carga total lo que importa.

3.5. Ejercicios
1. La fuerza gravitatoria con la que se atraen 2 electrones satisface la ley de Newton

m2e
Fg = G ,
r2

donde G = 6, 7 × 10−11 m3 · kg−1 · s−2 es la constante universal de la gravedad,


me es la masa de un electrón y r es la distancia que separa a ambos electrones.
Determinar si esta fuerza gravitatoria atractiva puede compensar la repulsión
electrostática Fe debida a la ley de Coulomb.
Solución: Fg = 2, 4 × 10−43 Fe . Por tanto, la fuerza gravitatoria es despreciable
frente a la electrostática y no puede compensarla. Esto ocurre en la mayorı́a de
los casos en las aplicaciones eléctricas, por lo que casi siempre despreciaremos la
atracción gravitatoria entre partı́culas cargadas.
2. Calcular la fuerza que ejerce una carga de 1 nC sobre otra de 2 nC si están sepa-
radas 1 cm. Determinar la masa que deben tener ambas cargas para que la fuerza
gravitatoria entre ellas equilibre su repulsión electrostática.
Solución: Fe = 1, 8 × 10−4 N, m = 16, 4 kg.
40 Carga eléctrica

3. En el modelo de Böhr del átomo de hidrógeno, un electrón circunda a un protón


en una órbita de radio r = 5, 3×10−11 m. Determinar la fuerza de atracción entre
el protón y el electrón y calcular la velocidad del electrón en su órbita.
Solución: Fe = 8, 2 × 10−8 N, v = 2, 2 × 106 m · s−1 .
4. Calcular la fuerza que una carga puntual de 1 mC, situada en el punto (1, 0, 0) cm,
ejerce sobre otra de 1 C situada en el √ punto (0, 1, 1) cm.
Solución: Fe = 3 × 1010 (−i + j + k) / 3 N.
5. En los vértices de un cuadrado de 1 m de lado hay 4 cargas iguales de 10−10 C
cada una. Calcular la fuerza que ejercen las demás sobre la que está en el vértice
superior derecho y hacia dónde se dirige esta fuerza.
Solución: Fe = 1, 7 × 10−10 N. La fuerza se dirige a lo largo de la diagonal del
cuadrado que pasa por la carga y hacia el exterior.
6. En los vértices de un triángulo equilátero de lado L hay tres cargas de valores q,
−q y 2q. Calcular la fuerza electrostática ejercida sobre la última.
Solución: Elegimos el sistema de referencia de manera que la carga −q está sobre
el eje x positivo, q está sobre el eje x negativo, y 2q está sobre el eje y positivo.
En este caso, la fuerza sobre 2q es Fe = 2kq 2 /L2 i.
7. Cinco cargas iguales de valor q están igualmente espaciadas en un semicı́rculo
de radio a, de tal manera que dos de ellas están en los extremos del semicı́rculo.
Determinar la fuerza que ejerce esta distribución de cargas sobre una carga Q
situada en el centro del semicı́rculo.
Solución: Colocamos el sistema de referencia de manera que el centro del se-
micı́rculo está en el origen, y todas las cargas están
√ en el semiplano superior del
plano xy. La fuerza resulta Fe = −(kqQ/a2 )(1 + 2) j.
8. Dos bolas idénticas, de masa m = 1g y carga q, se encuentran suspendidas del
mismo punto del techo por hilos inextensibles de la misma longitud L = 20 cm. En
el equilibrio, las cargas están separadas por una distancia d = 10 cm. Determinar
la carga de cada bola.
Solución: q = 5, 3 × 10−8 C.
9. Dos protones se encuentran situados sobre un eje vertical, separados una distancia
2d = 2×10−10 m. Se sitúa a la misma distancia de ambos, separado del eje vertical
una distancia x ≪ d, un electrón inicialmente en reposo. Calcular la fuerza sobre
el electrón y determinar el movimiento que realizarı́a y su frecuencia.
Solución: Fe = 4,6 x hacia el eje vertical. Es un MAS de frecuencia angular
ω = 2,1 rad · s−1 .
10. Dos cargas puntuales q1 = 1 mC, q2 = −2 mC, están situadas en el eje x, en los
puntos x1 = 1 cm, x2 = −2 cm. Determinar en qué punto del eje x se podrı́a
colocar una tercera carga para que la fuerza electrostática sobre ella fuera nula.
Solución: x = 8, 24 cm.
Capı́tulo 4

Campo eléctrico

4.1. Campo eléctrico creado por cargas puntuales


Al analizar con cuidado la expresión de la ley de Coulomb para la interacción en-
tre dos cargas puntuales en reposo, nos encontramos con el problema de la acción a
distancia. Según la ley de Coulomb, la fuerza electrostática actúa instantáneamente
entre cargas que se encuentran separadas una de otra, y sin embargo ninguna interac-
ción puede propagarse a velocidad infinita. La noción de campo eléctrico resuelve este
problema. Históricamente la electrostática se desarrolló como el estudio de fenóme-
nos eléctricos macroscópicos. Ası́, las idealizaciones que emplearemos para su estudio,
como las cargas puntuales o los campos eléctricos en un punto dado, deben entender-
se como herramientas matemáticas que permiten comprender los fenómenos a nivel
macroscópico, aunque puedan no tener significado a nivel microscópico.

Definición de campo eléctrico


Consideremos una carga puntual q, con vector de posición r, que experimenta una
fuerza electrostática Fe debida a la acción de otra carga puntual q0 que está en r0 . Las
cargas están arbitrariamente lejos una de otra. Podemos pensar que la carga fuente
q0 ha modificado el espacio que la rodea de tal manera que, en cada punto de este
espacio, ha creado un campo eléctrico. Ası́, la interacción entre la carga fuente q0 y
la carga q ya no es una acción a distancia, sino una interacción de contacto entre
el campo eléctrico que crea q0 en el punto r y la carga q que se encuentra también
en ese punto. Para obtener el campo eléctrico creado por q0 en r, suponemos que q
es pequeña en comparación con q0 , de tal manera que no afecta considerablemente
al proceso de medición del campo eléctrico. Se dice entonces que q es una carga de
prueba. Podemos escribir la fuerza electrostática Fe que ejerce q0 sobre q como

Fe = q E. (4.1)

Lo que hemos hecho en la ecuación (4.1) es separar la parte de la fuerza que depende
de la carga de prueba q de la parte que depende de la carga fuente q0 y del punto del
espacio r en el que se mide la fuerza. Se define el campo eléctrico como
Fe
E= , (4.2)
q

41
42 Campo eléctrico

es decir, es la fuerza electrostática ejercida sobre una carga de prueba q dividida por
la propia carga de prueba. La unidad SI de campo eléctrico es 1 N · C−1 . Se usa a
menudo otra unidad, llamada voltio (V), tal que 1 V = 1 N·m·C−1 . Con ella la unidad
de campo eléctrico resulta 1 V · m−1 .

Distribuciones discretas de cargas puntuales


En consecuencia, por aplicación de la ecuación (4.2), cuando la fuente del campo
eléctrico es una carga puntual q0 situada en el punto P0 , con vector de posición r0 , de
la ley de Coulomb se obtiene que el campo eléctrico E(r) creado por q0 en el punto
P , con vector de posición r, es
uP0 P r − r0
E(r) = kq0 = kq0 , (4.3)
|r − r0 |2 |r − r0 |3
donde uP0 P es el vector unitario que apunta desde el punto P0 al punto P , de manera
que las dos expresiones para el campo eléctrico que aparecen en la ecuación (4.3) son
totalmente equivalentes.
En el caso de tener distribuciones discretas de cargas puntuales, el campo eléctrico
satisface también, como lo hacı́a la fuerza electrostática, el principio de superposición,
indicando que los campos eléctricos que actúan en el mismo punto se suman como
vectores. Por tanto, el campo eléctrico creado por una distribución discreta de cargas
puntuales {q1 , q2 , . . . , qN }, situadas en los puntos {r1 , r2 , . . . , rN }, sobre un punto r,
es
E{1,2,...,N } (r) = E1 (r) + E2 (r) + . . . + EN (r). (4.4)

Lı́neas de campo eléctrico


Una manera muy útil de representar gráficamente un campo es a través de las lı́neas
de campo, que son lı́neas tangentes al campo en cada punto del espacio. En el caso
eléctrico, estas lı́neas son también tangentes a la fuerza que experimenta una carga de
prueba en ese punto por la definición (4.1). Sin embargo, las lı́neas de campo eléctrico
no tienen por qué coincidir con la trayectoria que seguirı́a la carga de prueba, ya que
la trayectoria no depende sólo de la aceleración sino también de la velocidad. Veremos
un ejemplo de esto en el apartado 4.3.
En la figura 4.1 se muestran las lı́neas de campo eléctrico de una carga puntual
positiva. El espaciado de las lı́neas se relaciona directamente con la intensidad del
campo eléctrico, de manera que, a medida que nos alejamos de la carga, el campo
eléctrico se debilita y las lı́neas se separan. Adoptaremos, pues, el convenio de dibujar
un número fijo de lı́neas desde una carga puntual, siendo tal número proporcional al
valor de la carga, y además dibujaremos las lı́neas simétricamente alrededor de la carga
puntual, de manera que la intensidad del campo venga determinada por la densidad
de las lı́neas. Para una carga positiva, las lı́neas se alejan de la carga, y decimos que
la carga positiva es una fuente del campo. Para una carga puntual negativa, las lı́neas
se dirigen hacia la carga, que se denomina sumidero del campo.
En la figura 4.2 se muestran las lı́neas de campo para dos cargas puntuales po-
sitivas iguales, separadas por una pequeña distancia. Como se ve en la figura, muy
cerca de cada carga el campo es aproximadamente igual al que producirı́a esa carga,
pues la otra está comparativamente muy lejos. Ası́, las lı́neas de campo cerca de cada
Distribuciones continuas de carga 43

+Q +Q +Q

Figura 4.1. Lı́neas de campo eléctrico de Figura 4.2. Lı́neas de campo eléctrico de
una carga puntual positiva dos carga puntuales positivas iguales.

carga son radiales y equidistantes. Además, como las cargas son iguales, se pinta
el mismo número de lı́neas partiendo de cada una. A distancia muy grande de las
cargas, un observador no podrı́a distinguir si se trata de una carga de valor 2q o de
dos cargas cercanas de valor q. Esto se refleja en las lı́neas que, a gran distancia de
las cargas, son radiales y equidistantes. Por último, en el espacio entre ambas cargas,
podemos imaginar cómo se comportarı́a una carga positiva de prueba: serı́a repelida
por ambas, de manera que las lı́neas en la zona intermedia tienden a escapar de las
cercanı́as de las cargas. Como vemos, las lı́neas de campo nos dan mucha información
sobre el propio campo sin necesidad de calcularlo explı́citamente. El caso de una carga
positiva y otra negativa puede verse en la figura 4.8.

4.2. Distribuciones continuas de carga


En situaciones macroscópicas, la distribución de carga en un cuerpo no se puede des-
cribir adecuadamente como un conjunto discreto de cargas puntuales en su interior.
Para mostrar esta imposibilidad consideremos un trozo de material de un volumen
dado V en el que medimos una carga Q = −1 C. Si las cargas puntuales que con-
tribuyen a Q son básicamente electrones, habrı́a que tener en cuenta la posición, en
el interior del material, de unas 1019 partı́culas, calcular el campo eléctrico que crea
cada una de ellas, y sumar todos estos campos para hallar el campo eléctrico total
que crea ese volumen. Esto es, a todas luces, intratable.
En general, no es práctico considerar un cuerpo cargado como una distribución
discreta de cargas puntuales. En lugar de esto, se considera la carga en un cuerpo
macroscópico como una distribución continua en su interior. Según esta descripción,
el volumen total del cuerpo, que tiene una carga total Q, se puede dividir en un
número indeterminado de pequeños elementos de volumen que tienen cada uno una
carga infinitesimal dq. Cada uno de estos elementos contribuye al campo eléctrico
total que crea la distribución con un elemento de campo dE, que se supone que tiene
la forma dada por la ley de Coulomb. El campo total se obtiene después sumando los
elementos de campo dE, pero tal suma no es una suma discreta sino una suma en el
44 Campo eléctrico

dq
r0
r P

Figura 4.3. El campo eléctrico total en un punto P creado por una distribución continua de
carga es la suma continua de los elementos de campo creados por las cargas infinitesimales
dq que forman la distribución. Estos elementos de campo siguen la ley de Coulomb.

continuo, es decir, una integral.


Consideremos un cuerpo (figura 4.3) con una carga total Q. Escogemos un punto
cualquiera P0 del interior del cuerpo, con vector de posición r0 . Alrededor de P0 se
toma un trozo infinitesimal de material en el que hay una carga infinitesimal que es-
cribiremos como dq. Dado que estamos ante una carga distribuida en un muy pequeño
espacio, el campo eléctrico que crea en un punto P se puede aproximar por el de una
carga puntual de valor dq según la ley de Coulomb. En efecto, si r es el vector de
posición del punto P en el cual queremos calcular el campo eléctrico dE creado por
la carga dq, entonces
r − r0
dE = k dq . (4.5)
|r − r0 |3
Para calcular ahora el campo total que crea toda la distribución continua de carga
en el punto P se han de sumar las contribuciones de todos los elementos de carga dq.
Como estamos en una situación continua, en la que no se pueden contar uno a uno
estos elementos de carga, esta suma se escribe como la integral
Z
r − r0
E(r) = k dq , (4.6)
Q |r − r0 |3

que nos da la expresión general del campo eléctrico creado por una distribución conti-
nua de carga estática. En cualquier caso, esta expresión puede ser difı́cil de manejar.
En el siguiente capı́tulo veremos un camino que, en ocasiones, simplifica mucho las
cosas para calcular un campo eléctrico en situación de alta simetrı́a.

Campo eléctrico creado por un filamento en su eje


Un ejemplo de distribución homogénea de carga es el que aparece en el cálculo del
campo eléctrico creado en un punto P por un filamento rectilı́neo de carga homogénea
Q y longitud L como podemos ver en la figura 4.4. Carga homogénea es la que se
distribuye en el cuerpo de tal modo que a volúmenes iguales corresponden cargas
iguales. En este caso, la carga se distribuye homogéneamente a lo largo de una lı́nea
de longitud L, es decir, todos los trozos de longitud dℓ dentro de la lı́nea tienen la
Distribuciones continuas de carga 45

dx0 P
x
L

Figura 4.4. Cálculo del campo eléctrico creado por una carga rectilı́nea finita en un punto
P de su eje. Un segmento infinitesimal de longitud dx0 crea un campo en P que puede
considerarse como el creado por una carga puntual.

misma carga dq. Se define la densidad lineal de carga λ como la carga por unidad de
longitud,
dq
λ= , (4.7)
dℓ
cuya unidad es 1 C · m−1 . Una manera sencilla de expresar que una distribución lineal
de carga es homogénea es decir que la densidad lineal de carga es uniforme, siendo la
misma en todos los puntos de la distribución. En este caso, todos los puntos tienen
densidad lineal
Q
λ= , (4.8)
L
siendo Q la carga total y L la longitud total. En el siguiente capı́tulo veremos también
las definiciones de densidad superficial y densidad volumétrica.
Volvamos al ejemplo de la figura 4.4. Por conveniencia, situamos el filamento
de carga en el eje x, desde el origen x0 = 0 hasta el punto x0 = L. El punto P
se encuentra también en el mismo eje y a la derecha del filamento, en x > L. En
consecuencia, el campo en P tiene la forma

E = E i, (4.9)

donde E será positivo o negativo dependiendo de si la carga del filamento es positiva


o negativa. Para calcular el valor de E en P , escogemos arbitrariamente un segmento
infinitesimal de filamento cargado, de longitud dx0 , cuyo centro se encuentra a distan-
cia x0 del origen. Según la ecuación (4.7), este segmento tiene una carga dq = λ dx0 .
El campo eléctrico, de valor también infinitesimal y de módulo dE puede ser calculado
en el punto P mediante la ley de Coulomb,

kλ dx0
dE = . (4.10)
(x − x0 )2

Para calcular el campo que crea toda la distribución lineal de carga, se ha de integrar la
expresión (4.10) a todos los puntos del filamento, teniendo en cuenta que λ es constante
a lo largo del filamento por tratarse de una distribución de carga homogénea. Se llega
ası́ a la expresión
Z L
kλ kQ
E= 2
dx0 = , (4.11)
0 (x − x 0 ) x(x − L)

donde se ha usado que λ = Q/L.


46 Campo eléctrico

R h
v0
m E0 x

l d

Figura 4.5. Desviación de una carga positiva por un campo eléctrico uniforme.

4.3. Movimiento de una carga de prueba


Conocida la manera de calcular el campo eléctrico E que crea cierta distribución de
carga estática, consideremos el comportamiento de una carga de prueba q inmersa en
un campo eléctrico. La segunda ley de Newton establece que una partı́cula de masa
m sometida a una fuerza externa F sufre una aceleración a = F/m. Por la definición
de campo eléctrico dada en la ecuación (4.2), la carga de prueba está sometida a una
fuerza electrostática Fe = qE. Por tanto la aceleración que adquiere debida al campo
eléctrico externo es
q
a = E, (4.12)
m
siendo m la masa de la partı́cula cargada. Si se conoce el campo eléctrico externo y
se mide la aceleración de una carga de prueba inmersa en él, la ecuación (4.12) nos
informarı́a de la relación carga-masa de la partı́cula.

Carga de prueba en un campo eléctrico uniforme


Consideremos la situación de la figura 4.5. En ella, una partı́cula de masa m y carga
q entra con velocidad inicial v0 en una región R en la que hay un campo eléctrico E0
uniforme perpendicular a v0 (dibujado en la figura mediante sus lı́neas de campo, que
son paralelas y equidistantes entre sı́). Fuera de esta región, no hay campo eléctrico1 .
Tomamos como eje x uno paralelo a la velocidad inicial de la carga, y como eje
y uno paralelo al campo eléctrico E0 . Mientras está en la región R, de longitud l, la
carga tiene una aceleración constante

qE0
a= , (4.13)
m
1 El campo eléctrico al que se refiere este ejemplo se crea por un par de placas metálicas paralelas, con
la misma carga pero de signo opuesto. Este dispositivo se llama condensador plano, y se tratará en
el apartado 5.6. Por ahora, nos basta con saber que el campo que crea un condensador plano es
prácticamente nulo fuera de la región entre las placas, y es uniforme entre las placas, siendo su
dirección perpendicular a ambas placas y dirigido desde la placa positiva a la negativa
Energı́a potencial electrostática 47

dirigida a lo largo del eje y. Por tanto, dentro de R, la carga efectúa un movimiento
parabólico (semejante al movimiento de proyectiles), desviándose debido al campo
eléctrico.
Después de R, la carga entra en una región en la que no hay campo eléctrico, de
modo que no siente ninguna aceleración y sigue un movimiento rectilı́neo uniforme
hasta que choca con una pantalla situada a distancia d. La altura h a la cual la
carga choca con la pantalla se puede determinar usando las reglas de la cinemática,
obteniéndose  
qE0 l l
h= +d . (4.14)
mv02 2
Muchas aplicaciones tecnológicas, como el monitor del ordenador, el tubo de
imagen de un televisor o el osciloscopio, se basan en esta idea. Esencialmente estos
dispositivos constan de un tubo de rayos catódicos y una pantalla fluorescente. El
tubo de rayos catódicos es un tubo de vacı́o en el que se acelera y desvı́a un haz de
electrones mediante campos eléctricos y magnéticos. Los campos que desvı́an el haz se
crean perpendiculares al tubo mediante placas metálicas cargadas. El haz es inyectado
en uno de los extremos del tubo y viaja hacia el otro extremo, donde impacta con la
pantalla. Ésta al ser bombardeada emite luz.

4.4. Energı́a potencial electrostática


En el capı́tulo 2, vimos que el trabajo que realiza una fuerza en el desplazamiento de
la partı́cula sobre la que actúa es una medida de lo eficaz que es esa fuerza para que
la partı́cula realice ese desplazamiento. Cuando la fuerza es conservativa, el trabajo
que realiza se relaciona con la variación de una energı́a potencial.
Consideremos ahora una carga de prueba q que se mueve bajo la influencia del
campo eléctrico E creado por cierta distribución de carga. El trabajo que realiza la
fuerza eléctrica Fe = qE en una trayectoria de la carga de prueba q desde el punto A
al punto B es
Z B
W = Fe · dr. (4.15)
A
La fuerza electrostática es conservativa, debido a que el campo electrostático no de-
pende explı́citamente ni de la velocidad de la carga de prueba ni del tiempo. El trabajo
realizado por la fuerza electrostática sobre una carga de prueba se escribe entonces
W = −[Ue (B) − Ue (A)] = −∆Ue , (4.16)
donde Ue es la energı́a potencial electrostática. Ahora bien, dado que el campo eléctrico
es la fuerza por unidad de carga, podemos definir la energı́a potencial por unidad de
carga como
W = −q[V (B) − V (A)], (4.17)
donde
Ue
V = , (4.18)
q
se llama potencial electrostático, y la variación
−W
∆V = V (B) − V (A) = , (4.19)
q
48 Campo eléctrico

se llama diferencia de potencial entre A y B. La unidad de potencial electrostático


(y de diferencia de potencial) es el voltio, pues 1 V = 1 J · 1 C−1 . Es importante
notar que ni la energı́a potencial electrostática ni el potencial electrostático se pueden
determinar en sentido absoluto: sólo tienen sentido las diferencias entre sus valores
en puntos diferentes. Por eso es común establecer valores de referencia para estas
cantidades, como se especificará más adelante.

Energı́a de una carga en un campo electrostático


Supongamos que sobre una carga de prueba sólo ejerce trabajo la fuerza electrostática.
Dado que es conservativa, según el principio de conservación de la energı́a la suma de
la energı́a cinética y la energı́a potencial electrostática resulta
1
mv 2 + qV = constante. (4.20)
2
De aquı́, si q se mueve desde el punto A al punto B,
1 1
mv 2 − mv 2 = −q [V (B) − V (A)] . (4.21)
2 B 2 A
Como consecuencia,
Si q es una carga positiva, se acelera cuando se dirige hacia puntos de menor
potencial y se frena cuando se dirige a puntos de mayor potencial.
Si q es una carga negativa, se frena cuando se dirige hacia puntos de menor
potencial y se acelera cuando se dirige hacia puntos de mayor potencial.
Volvamos al caso de la figura 4.5, donde una carga positiva q de masa m, con veloci-
dad inicial v0 , entra en la región entre las placas de un condensador plano, donde hay
un campo eléctrico E0 uniforme, de tal manera que la velocidad inicial de entrada es
perpendicular al campo eléctrico. Como vimos en el apartado 4.3, esta carga adquiere
una aceleración a = (q/m)E0 paralela al campo eléctrico, de modo que efectúa un
movimiento parabólico en el plano que forman los vectores v0 y E0 , curvándose hacia
la placa negativa del condensador. Como se desprende de la figura 4.5, durante la
trayectoria de la carga, la velocidad tiene una componente positiva en la dirección
del campo eléctrico, por lo que el trabajo efectuado por la fuerza electrostática sobre
la carga es positivo. Por otro lado, al moverse la carga hacia la placa negativa del
condensador, lo hace hacia puntos de menor potencial, disminuyendo su energı́a po-
tencial. Ası́, su energı́a cinética debe crecer, es decir, la carga se acelera hacia la placa
negativa.

4.5. Potencial electrostático


Veamos la relación entre el campo eléctrico y el potencial creados por cierta distri-
bución de carga estática Q. Para ello consideramos el trabajo dW realizado por la
fuerza electrostática Fe = q E en un desplazamiento infinitesimal dr de una carga de
prueba q. Según la expresión (4.19), se satisface la igualdad
dW q E · dr
dV = − =− = −E · dr. (4.22)
q q
Potencial electrostático 49

E B
q
A
q0

Figura 4.6. Una carga puntual positiva q0 en reposo, crea un campo eléctrico que actúa
sobre una carga de prueba q. La diferencia de potencial electrostático creado por la carga q0
entre los puntos A y B es la que experimenta q.

Si la carga de prueba q se mueve entre dos puntos A y B, la diferencia de potencial


entre estos puntos es una suma de diferencias de potencial infinitesimales dadas por la
expresión (4.22). En consecuencia, la diferencia de potencial entre A y B es la integral
de la ecuación (4.22),
Z B
∆V = V (B) − V (A) = − E · dr. (4.23)
A

La relación (4.23) entre campo y potencial implica que el potencial electrostático no


depende de la carga de prueba. Lo que sı́ depende de la carga de prueba q es la
variación de su energı́a potencial electrostática cuando se mueve entre A y B, dada
por
Z B
∆Ue = Ue (B) − Ue (A) = −q E · dr. (4.24)
A
Se puede dar una expresión para el potencial electrostático en función de las coor-
denadas de un punto genérico teniendo en cuenta que siempre queda una constante
de integración por determinar. Esta constante de integración se puede fijar asignando
un origen de potencial, para ası́ determinar diferencias respecto a él. A partir de la
ecuación (4.23), resulta Z
V (r) = − E · dr. (4.25)

Potencial creado por cargas puntuales


Como ejemplo, calculemos el potencial creado por una carga puntual q0 situada en
reposo en el origen. Esta carga ejerce una fuerza electrostática, en virtud del campo
que crea, sobre una carga de prueba q que, inicialmente, se encuentra en reposo en un
punto A a una distancia rA de q0 (según la figura 4.6). La carga q se mueve entonces
a lo largo de la recta que pasa por el origen y el punto A. Eventualmente, pasa por un
punto B a distancia rB de q0 . Utilizando la ley de Coulomb para el campo eléctrico
creado por q0 y el hecho de que el potencial no depende de la trayectoria seguida,
podemos tomar un desplazamiento radial, de manera que dr = dr ur , y
Z B Z B
kq0 kq0 kq0
∆V = V (B) − V (A) = − E · dr = − 2
dr = − . (4.26)
A A r rB rA
50 Campo eléctrico

Dada la expresión obtenida, se puede elegir un origen de potencial a distancia infinita


de la carga de prueba, es decir, elegir un potencial nulo en el infinito. Esto puede
hacerse siempre que no haya cargas fuente a distancia infinita de q0 . Ası́, el potencial
electrostático creado por una carga puntual q0 , situada en el origen, es

kq0
V (r) = , (4.27)
r
siendo V∞ = 0.
De manera completamente análoga, el potencial creado por la carga fuente q0
situada en r0 es
kq0
V (r) = . (4.28)
|r − r0 |
Como se ve en estas expresiones, el potencial electrostático creado por una carga
puntual positiva es siempre positivo (si es cero en el infinito) y el potencial creado por
una carga puntual negativa es siempre negativo (si es cero en el infinito). En otras
palabras, el potencial que crea una carga positiva es mayor en todo punto que en el
infinito, y el potencial que crea una carga negativa es menor en todo punto que en el
infinito.
Para distribuciones discretas de cargas puntuales, el potencial electrostático sa-
tisface el principio de superposición, como el campo eléctrico, pero esta vez los po-
tenciales que actúan en el mismo punto se suman como escalares. Ası́, el potencial
creado por una distribución discreta de cargas puntuales {q1 , q2 , . . . , qN }, situadas en
los puntos {r1 , r2 , . . . , rN }, sobre un punto r, es

V{1,2,...,N } (r) = V1 (r) + V2 (r) + . . . + VN (r). (4.29)

Superficies equipotenciales
Una manera muy útil de representar gráficamente el potencial electrostático es a
través de superficies equipotenciales. Una superficie equipotencial es el conjunto de
los puntos para los cuales el potencial electrostático es constante. Por ejemplo, en el
caso de una carga puntual q0 situada en el origen, el potencial que crea es V = kq0 /r.
Por tanto, los puntos con el mismo valor de r tienen el mismo potencial. Esto indica
que las superficies equipotenciales son, en este caso, superficies esféricas centradas en
q0 . Hay pues infinitas superficies equipotenciales, cada una de ellas dada por un valor
de r.
Un par de ejemplos de superficies equipotenciales aparecen en las figuras 4.7 y 4.8.
En la segunda de estas figuras se ven las lı́neas de campo y superficies equipotenciales
creadas por un dipolo eléctrico, que es un par de cargas puntuales de igual magnitud
y signo opuesto, q y −q, separadas por una distancia a muy pequeña.
Dado que ∆V = −W/q, resulta que la fuerza electrostática sobre una carga q no
ejerce trabajo cuando esta carga se mueve sobre una superficie equipotencial. Esto
ocurre porque, sobre la superficie equipotencial, se cumple que ∆V = 0, de modo que
W = 0 y la carga de prueba no varı́a su energı́a potencial electrostática al moverse
sobre una superficie equipotencial.
Una segunda propiedad es que el campo eléctrico que crea una distribución de
carga es siempre perpendicular a las superficies equipotenciales creadas por la misma
Ejercicios 51

+Q +Q −Q

Figura 4.7. Superficies equipotenciales y Figura 4.8. Superficies equipotenciales


lı́neas de campo creadas por una carga y lı́neas de campo creadas por un dipo-
puntual positiva. lo elećtrico.

distribución. Esto es una consecuencia de la expresión (4.22) ya que, cuando el des-


plazamiento dr es a lo largo de una superficie equipotencial, el potencial no cambia,
de modo que dV = −E · dr = 0, con lo cual el campo eléctrico ha de ser ortogonal al
desplazamiento.
Por último, las lı́neas de campo eléctrico apuntan en el sentido en que disminuye
el potencial. De nuevo, esto puede comprobarse en las figuras 4.7 y 4.8, y también
mirando la ecuación (4.22). Si el desplazamiento infinitesimal dr de la carga de prueba
es paralelo al campo eléctrico, resulta que el valor de la diferencia de potencial dV es
negativo y alcanza su valor mı́nimo.

4.6. Ejercicios
1. Se tienen dos cargas puntuales q1 = 4 nC y q2 = −2 nC en los puntos P1 (0, 0, 0) y
P2 (4 m, 3 m, 0), respectivamente. Calcular el campo eléctrico en el punto P2 (0, 3 m, 0).
Solución: E = 9/8 V · m−1 i + 4 V · m−1 j.
2. Un dipolo eléctrico es un sistema formado por cargas puntuales opuestas q y −q
separadas por una pequeña distancia a. Obtener el campo eléctrico creado por
un dipolo en un punto de su mediatriz a distancia d del eje del dipolo. Aproximar
el resultado anterior si a ≪ d.
Solución: E = kqa/[d2 + (a/2)2 ]3/2 , dirigido paralelamente al vector que une la
carga positiva con la carga negativa del dipolo. Cuando a ≪ d, E = kqa/d3 .
3. Un filamento rectilı́neo de longitud L tiene una carga positiva Q distribuida
homogéneamente a lo largo de su longitud. Calcular el campo eléctrico en un
punto P de su mediatriz √ a distancia d del filamento.
Solución: E = 2kQ/(d L2 + 4d2 ). El campo se dirige a lo largo de la mediatriz,
desde el filamento hacia el punto P .
4. Un filamento cerrado en forma de anillo de radio a tiene una carga Q distribuida
homogéneamente en su longitud. El anillo está situado en el plano xy, con centro
en el origen. Determinar el campo eléctrico en un punto P situado en el eje z.
Solución: E = kQz/(a2 + z 2 )3/2 k.
5. Obtener la ecuación (4.14) para la altura a la que llega una carga q tras ser
acelerada por un campo uniforme.
52 Campo eléctrico

6. Tres cargas puntuales iguales de valor q se encuentran inicialmente situadas en


el infinito. Se van trayendo una a una y se colocan en los vértices de un triángulo
equilátero de lado L. Determinar la variación de la energı́a potencial electrostática
del sistema.
Solución: ∆Ue = 3kq 2 /L.
7. Se consideran dos cargas puntuales q1 = 4 nC y q2 = −2 nC en los puntos
P1 (0, 0, 0) y P2 (4 m, 3 m, 0), respectivamente. Calcular la energı́a electrostática
de este sistema de cargas y determinar la variación de energı́a potencial de la
carga q2 si se mueve desde el punto P2 al punto P3 (3 m, 0, 0).
Solución: Ue = −14, 4 × 10−9 J. ∆Ue = −9, 6 × 10−9 J.
8. Supongamos que la carga q2 del problema anterior se encuentra en el punto P2
en reposo, y luego se mueve hasta el punto P3 . Calcular con qué velocidad llega
a este punto si tiene una masa m = 2 × 10−12 kg.
Solución: v = 310 m · s−1 .
9. En una región R existe un campo eléctrico uniforme E = 2 × 103 V · m−1 i + 4 ×
103 V·m−1 j. Se consideran los tres puntos A(0, 0, 0), B(4 cm, 0, 0) y C(4 cm, 3 cm, 0)
en la región. Determinar las diferencias de potencial entre cada pareja de estos
puntos.
Solución: VB − VA = −80 V, VC − VB = −120 V, VC − VA = −200 V.
10. Consideremos un condensador plano, que genera un campo eléctrico uniforme
E = 2 × 103 V · m−1 i en cierta región del eje x. El potencial del punto x = 0 es
V0 = 120 V. Determinar el potencial de los puntos x = 2 cm y x = 8 cm. Calcular
la posición del punto que se encuentra a potencial nulo.
Solución: V2 = 80 V, V8 = −40 V, x0 = 6 cm.
Capı́tulo 5

Ley de Gauss

5.1. Flujo eléctrico


Una cantidad importante cuando se estudian las propiedades de un campo vectorial,
como es el caso del campo eléctrico, es el flujo del campo a través de una superficie.
Para entender bien el significado del flujo, consideremos un campo eléctrico uniforme
E. En la figura 5.1 se han dibujado algunas lı́neas eléctricas correspondientes a un
campo uniforme. Se considera también una superficie plana de área S. La cuestión es
cuántas de las lı́neas de este campo eléctrico atraviesan la superficie.
En primer lugar, el número N de lı́neas de campo que atraviesan una superficie es
proporcional al campo pues la intensidad del campo viene determinada por la densidad
numérica de las lı́neas. En segundo lugar, este número ha de ser proporcional al área
S de la superficie, pues si el área se hace mayor más lı́neas atravesarán la superficie.
Por tanto, tenemos una dependencia del tipo

N ∝ E S. (5.1)

La expresión (5.1) es aún incompleta porque N depende también de la orientación


de la superficie, como se ve en la figura 5.1. Para tener esto en cuenta, se considera
un vector unitario normal n perpendicular a la superficie en cada punto. En el caso
de una superficie plana, como la de la figura 5.1, todos los puntos tienen el mismo
vector n. En este caso, es fácil ver que el número de lı́neas que atraviesan la superficie

S
α E

Figura 5.1. Algunas lı́neas de un campo eléctrico uniforme atraviesan una superficie. El
flujo eléctrico es proporcional al número de estas lı́neas.

53
54 Ley de Gauss

depende de la componente del vector E a lo largo del vector n, es decir, del producto
escalar de estos vectores,

N ∝ E S cos α = (E · n) S = E · S, (5.2)

donde, en el último término, se ha definido el vector S de la superficie plana como


S = S n. La cantidad

Φe = E · S, (si E uniforme y S plana) , (5.3)

se llama flujo del campo eléctrico uniforme E a través de la superficie plana. La unidad
de flujo eléctrico es 1 V · m.
Cuando el campo eléctrico no es uniforme en la superficie (no tiene el mismo
valor en todos los puntos de ella) o bien la superficie no es plana (el vector normal
n no es el mismo en cada uno de sus puntos), la expresión (5.3) no es correcta. Para
generalizarla, se toma un elemento de superficie de área infinitesimal dS con vector
dS = dS n, dentro de la cual el producto escalar E · n es aproximadamente uniforme y
el flujo (infinitesimal) a través del elemento de área se puede expresar mediante (5.3)
como
dΦe = E · dS. (5.4)
Para calcular el flujo a través de toda la superficie se han de sumar en el continuo
las contribuciones de cada una de las regiones infinitesimales de área dS. Resulta
entonces la expresión general Z
Φe = E · dS. (5.5)
S

5.2. Ley de Gauss


La ley de Gauss es uno de los resultados fundamentales del electromagnetismo. Mien-
tras que la ley de Coulomb sólo es válida en situaciones estáticas, la ley de Gauss es
general y válida para cualquier campo eléctrico. Esta ley es una relación directa entre
el flujo eléctrico a través de una superficie cerrada y la carga que se encuentra en el
espacio encerrado por esa superficie.
Consideremos el campo creado por una carga puntual q situada en el origen y
calculemos el flujo de este campo a través de la superficie de una esfera con centro en la
carga y radio a. La situación se muestra en la figura 5.2. Según se ve en esta figura, el
hecho de tener una superficie esférica en este caso se traduce en que el campo eléctrico
creado por la carga y el vector normal a la superficie S en cada punto son paralelos. El
resultado, sin embargo, no va a depender de cómo sea la superficie mientras encierre
a la carga puntual. Usando la ley de Coulomb para el campo eléctrico creado por la
carga, se cumple
kq
E · dS = 2 dS, (5.6)
r
donde r es la distancia que hay entre la carga y un punto cualquiera del espacio. Para
puntos de la esfera, tomamos r = a para calcular el flujo a través de ella. Aplicando
ahora la definición de flujo (5.5), se llega a
I I
kq
Φe = E · dS = 2
dS, (5.7)
S S a
Ley de Gauss 55

+Q

Figura 5.2. Cálculo del flujo del campo creado por una carga puntual situada en el origen a
través de la superficie de una esfera con centro en la carga. En las operaciones, es importante
notar que el campo eléctrico y el vector normal son paralelos en cada punto de la superficie
esférica.

donde el cı́rculo en la integral significa que la superficie sobre la que se integra es una
superficie cerrada (es una buena forma de no olvidarlo). Sacando fuera de la integral
todas las constantes, I
kq
Φe = 2 dS. (5.8)
a S
Lo que queda por hacer es sencillo: la integral en una superficie del elemento de área
dS es, simplemente, el área total S de la superficie. Por tanto, dado que el área de
una esfera de radio a es 4πa2 , y teniendo en cuenta que k = 1/(4πε0 ),
kq q
Φe = S = 4πkq = . (5.9)
a2 ε0
Hemos obtenido que el flujo no depende del radio a de la esfera. Si lo pensamos un
poco, esto tiene sentido. Dado que el flujo cuenta el número de lı́neas de campo que
atraviesan una superficie, una vez tenemos una superficie que encierra la fuente de
las lı́neas, que es la carga puntual q, da lo mismo el radio de esa superficie, e incluso
da lo mismo su forma mientras encierre a q. En otras palabras, el flujo a través de
una superficie cerrada sólo depende de las fuentes y sumideros de lı́neas que encierra
la superficie. Las fuentes y sumideros que se encuentren fuera de la superficie cerrada
no pueden afectar al flujo a través de ésta porque las lı́neas que crean entran y salen
de la superficie dando lugar a un flujo neto nulo.
La ley de Gauss resume todo esto: el flujo eléctrico a través de una superficie
cerrada cualquiera es igual a la carga total encerrada por ella, que llamaremos Qint ,
dividida por ε0 , I
Qint
E · dS = . (5.10)
S ε0
En esta expresión, el factor 1/ε0 sólo aparece por cuestiones de unidades. Lo impor-
tante es la presencia de Qint , que es la suma de las fuentes y sumideros que dan lugar
a lı́neas de campo que atraviesan la superficie un número impar de veces y dan, por
tanto, contribución neta al flujo. Como un ejemplo, en la figura 5.3 se han pintado
algunas lı́neas del campo creado por cierta distribución de carga Q. El flujo de es-
te campo a través de la superficie S es Q1 /ε0 , siendo Q1 la carga encerrada por la
56 Ley de Gauss

Q1
Q _ Q1
S

Figura 5.3. Según la ley de Gauss, el flujo a través de la superficie de la figura es Q1 /ε0 .

superficie. El resto de la carga, que es Q − Q1 , es fuente de lı́neas de campo que no


atraviesan la superficie, o que la atraviesan un número par de veces, de modo que
esta carga no contribuye al flujo.

5.3. Campo creado por una esfera homogénea


La ley de Gauss permite calcular el flujo de cualquier distribución de carga a través de
cualquier superficie cerrada en situaciones en que ni siquiera tenemos una expresión
para el propio campo. Sólo se necesita conocer la carga que encierra la superficie que
consideremos. Se llama superficie gaussiana aquella superficie cerrada a través de la
cual calculamos el flujo.
Una de las aplicaciones de la ley de Gauss es el cálculo de campos eléctricos
cuando la distribución de carga presenta alta simetrı́a. Para conocer el campo que crea,
en estos casos se puede elegir una superficie gaussiana en la que el campo eléctrico es
uniforme. El flujo de este campo se relaciona con la carga encerrada por la superficie
gaussiana que hemos elegido y ası́ se puede obtener el módulo del campo.
Un ejemplo de cálculo de un campo mediante la ley de Gauss es el creado por una
esfera de radio R con una carga Q distribuida homogéneamente en todo su volumen.
Se define la densidad volumétrica de carga ρ como la carga por unidad de volumen
que hay en una porción infinitesimal de la distribución,

dq
ρ= . (5.11)
dV

La unidad de densidad volumétrica de carga es 1 C·m−3 . Cuando la carga se distribuye


homogéneamente en un volumen V, todos los puntos de este volumen tienen la misma
densidad de carga, igual a
Q
ρ= , (5.12)
V
y se dice que la densidad de carga es uniforme. Para la esfera de nuestro problema,
la densidad volumétrica uniforme de carga tiene un valor

3Q
ρ= . (5.13)
4πR3
Campo creado por una esfera homogénea 57

n E(r)

P
Q

Figura 5.4. Esfera de carga homogénea y superficie gaussiana para el cálculo del campo
eléctrico.

Pasemos a calcular el campo eléctrico. Colocamos el origen del sistema de re-


ferencia en el centro de la esfera, según la figura 5.4. Por razones de simetrı́a de la
distribución de carga, suponemos que el campo eléctrico en un punto P :
Tiene dirección radial, según el vector unitario ur . Para comprender esto, ima-
ginemos un elemento de volumen cualquiera del interior de la esfera y su simétrico
con respecto a la recta que une el centro de la esfera y el punto P . Las contri-
buciones de estos dos elementos de volumen se suman en el punto P para dar,
efectivamente, un campo en la dirección del vector ur .
Su módulo depende de la distancia r al centro de la esfera, pues la distribución de
carga sólo depende de esta cantidad (un caso particular es el de una distribución
esférica homogénea).
Cuando se cumplen estas dos suposiciones, decimos que el campo eléctrico tiene si-
metrı́a esférica y escribimos
E(r) = E(r) ur . (5.14)
Ahora, hemos de elegir una superficie gaussiana en la que el campo valga lo mismo
en todos sus puntos. Dada la expresión (5.14), esta superficie gaussiana particular es
la de una esfera concéntrica con la esfera de carga y cuyo radio r sea la distancia
desde el origen hasta el punto donde se va a calcular el campo eléctrico. El vector
normal exterior n a la esfera de radio r en cada punto es paralelo al campo eléctrico
en ese mismo punto (ver la figura 5.4), de manera que el flujo a través de la superficie
gaussiana es I I
Φe = E · dS = E(r) dS. (5.15)
Sr Sr

Sr significa que se está calculando el flujo a través de la esfera de radio r. Pero E(r)
es uniforme en esa esfera, de manera que es una constante para la integral y se puede
escribir I
Φe = E(r) dS = E(r)S(r) = 4πr2 E(r), (5.16)
Sr

donde S(r) es el área de la esfera de radio r. Por otro lado, según la ley de Gauss,
Qint
Φe = . (5.17)
ε0
58 Ley de Gauss

ρR/3ε0

E(r)

R
r

Figura 5.5. Módulo del campo eléctrico E(r) creado por una esfera homogénea con carga Q
y radio R, frente a la distancia r al centro de la esfera. Se observa que E(r) tiene un máximo
en la superficie de la esfera (r = R). También se observa cómo E(r) crece linealmente con r
en el interior de la esfera y decrece como 1/r2 en el exterior.

Igualando las expresiones (5.16) y (5.17), se llega a


Qint
E(r) = . (5.18)
4πε0 r2
Tenemos ahora dos regiones diferentes del espacio donde calcular el campo eléctrico:
En la región exterior a la esfera, definida por la condición r > R, una esfera
gaussiana contiene toda la carga, ası́ que Qint = Q, y resulta
Q ρR3
E= u r = ur , si r > R. (5.19)
4πε0 r2 3ε0 r2
En la región interior a la esfera, definida por la condición r < R, una esfera
gaussiana contiene sólo una fracción de la carga total, dada por
4πr3 ρ
Qint = ρVint = , (5.20)
3
donde Vint es el volumen encerrado por la esfera gaussiana. Por tanto,
Qr ρr
E= ur = ur , si r < R. (5.21)
4πε0 R3 3ε0
Si se representa el módulo del campo eléctrico frente a la distancia r al centro de la
esfera, se obtiene la figura 5.5.

5.4. Campo creado por un cilindro homogéneo


Calculemos el campo eléctrico creado por un cilindro de altura infinita y radio R con
una densidad volumétrica de carga ρ uniforme en su interior. Colocamos el origen del
Campo creado por un cilindro homogéneo 59

O P E(r)
n

Figura 5.6. Superficies gaussianas para calcular el campo eléctrico creado por un cilindro
de altura infinita homogéneamente cargado.

sistema de referencia en un punto cualquiera del eje del cilindro, como se ve en la


figura 5.6.
La distribución de carga posee en este caso simetrı́a cilı́ndrica. Esto significa que
podemos suponer que el campo eléctrico creado por esta distribución en un punto P :
Tiene dirección radial, según el vector unitario ur de la figura 5.6. En este caso,
este vector unitario es perpendicular al eje del cilindro en cada punto y se dirige
desde el eje al punto P . Para comprobar esto, primero se toman dos elementos de
volumen iguales en el interior del cilindro que sean simétricos respecto al plano
perpendicular al eje y que pasa por el punto P . Esto nos convencerá de que
el campo tiene dirección perpendicular al eje del cilindro. Tomemos ahora dos
elementos de volumen con la misma altura y simétricos respecto a la recta que
pasa por el eje y el punto P . Ası́ veremos que el campo se dirige desde el eje
hacia el punto P .
Su módulo depende de la distancia r al eje del cilindro, pues la distribución
de carga sólo depende de esta cantidad (un caso particular es una distribución
cilı́ndrica homogénea).
Con estas propiedades de simetrı́a de la distribución, podemos escribir el campo como

E(r) = E(r) ur , (5.22)

pero es importante notar que r y ur significan aquı́ cosas distintas que en el caso de la
esfera, como ya hemos comentado y se ve en la figura 5.6. Como superficie gaussiana
tomaremos la superficie de un cilindro infinito de radio r con el mismo eje que el
cilindro de carga. El flujo a través de esta superficie resulta
Z
Φe = E(r) dS = E(r)S(r) = 2πrhE(r), (5.23)
Sr

donde h es la altura del cilindro gaussiano (es infinita, pero veremos que no apare-
cerá en el resultado final). Usando la ley de Gauss, llegamos a
Qint
E(r) = . (5.24)
2πε0 rh
60 Ley de Gauss

ρR/2ε0

E(r)

R
r

Figura 5.7. Módulo del campo eléctrico E(r) creado por una cilindro de altura infinita
homogéneamente cargada, de radio R, frente a la distancia r al eje del cilindro. El campo
tiene un máximo en la superficie del cilindro r = R. Se observa que E(r) crece linealmente
con r en el interior del cilindro y decrece como 1/r en el exterior.

Aparecen también en este caso dos regiones diferentes donde calcular el campo:
En la región exterior al cilindro de carga, definida por la condición r > R, el
cilindro gaussiano contiene toda la carga, ası́ que

Qint = ρπR2 h, (5.25)

y resulta
ρR2
E= ur , si r > R. (5.26)
2ε0 r
En la región interior al cilindro de carga, definida por la condición r < R, el
cilindro gaussiano contiene sólo una fracción de la carga total, dada por

Qint = ρπr2 h, (5.27)

de manera que resulta


ρr
E= ur , si r < R. (5.28)
2ε0
En la gráfica de la figura 5.7 se representa el módulo del campo eléctrico frente a la
distancia r al eje del cilindro de carga.

5.5. Campo creado por un plano homogéneo


Consideremos ahora el campo creado por un plano infinito con carga distribuida
homogéneamente en su superficie. Se define la densidad superficial de carga σ como
la carga por unidad de superficie que hay en un elemento de superficie dS de la
distribución,
dq
σ= , (5.29)
dS
Campo creado por un plano homogéneo 61

Sb

i
x=0
Figura 5.8. Lı́neas del campo eléctrico creado por un plano infinito cargado homogénea-
mente y situado en x = 0. En cada punto, el campo eléctrico es perpendicular al plano.

cantidad cuya unidad es 1 C · m−2 . Cuando la distribución superficial es homogénea,


σ es uniforme en todos los puntos de la superficie y tiene un valor
Q
σ= , (5.30)
S
donde Q es la carga total y S es la superficie total donde se distribuye la carga. En el
caso del plano infinito, su superficie es infinita, de manera que no tiene sentido definir
su carga total Q. Hablaremos pues de un plano infinito con una densidad superficial
de carga σ.
Colocamos el plano infinito en la posición x = 0, perpendicular al eje x y supo-
nemos que σ es positiva. Como vemos en la figura 5.8, la distribución de carga posee
simetrı́a plana, ya que las lı́neas de campo en cada punto del espacio son perpen-
diculares al plano y su sentido es desde el plano hasta el punto considerado, por lo
que

E i, x > 0,
E= (5.31)
−E i, x < 0,

donde el cambio de signo aparece porque, en los puntos a la derecha del plano (x > 0),
el campo es hacia la derecha y, en los puntos a la izquierda del plano (x < 0), el campo
es igual pero hacia la izquierda. Como superficie gaussiana podemos considerar un
cilindro con eje ortogonal al plano infinito de carga y área de la base Sb , situado de tal
manera que el centro de su eje está en el plano de carga y una de sus tapas incluye al
punto donde se calcula el campo (ver figura 5.8). El flujo del campo eléctrico está dado
por Φe = 2Φb , donde Φb es el flujo a través de cada tapa del cilindro (nótese que el
flujo a través de la superficie lateral del cilindro es cero según se ve en la figura 5.8).
Ahora, según la ley de Gauss, se cumple
σSb
2ESb = , (5.32)
ε0
de donde
σ
E= . (5.33)
2ε0
62 Ley de Gauss

A
d −Q
+Q

Figura 5.9. En el condensador plano de la figura cada una de las dos placas paralelas tiene
un área A y la separación entre las placas es d. El tamaño tı́pico de las placas suele ser mucho
mayor que la distancia entre ellas, de manera que se puede aproximar el campo eléctrico por
el que crean dos planos infinitos paralelos.

Por tanto, el campo eléctrico que crea un plano infinito de densidad de carga σ situado
en x = 0 es
 σ
2ε0 i, x > 0,
E= (5.34)
− 2εσ0 i, x < 0.

Aparte de cambios de signo a cada lado del plano, el campo que crea un plano infinito
no depende de la distancia al plano.

5.6. Campo creado por un condensador plano


Un condensador de placas paralelas o condensador plano consta idealmente de dos
placas metálicas iguales y muy delgadas, paralelas entre sı́ y con el mismo área A en
su superficie (ver figura 5.9). En una de las placas del condensador se coloca una carga
positiva Q y en la otra una carga igual y de signo opuesto −Q. Este dispositivo es útil
para almacenar carga eléctrica, y cuando tratemos circuitos eléctricos veremos más
aplicaciones. El campo eléctrico que crea un condensador plano es aproximadamente
uniforme en la región comprendida entre las placas y nulo fuera de esta región.
Dado que las placas del condensador están formadas por material conductor, la
carga depositada en cada placa se distribuye homogéneamente en su superficie. Como
la distancia entre las placas d suele ser mucho menor que las longitudes caracterı́sticas
en las superficies de cada placa del condensador, el campo eléctrico creado por el
condensador se puede aproximar bien por el que crean dos planos infinitos cargados
con densidades homogéneas de carga superficial

Q Q
σ1 = σ = , σ2 = −σ = − , (5.35)
A A
respectivemente. Usando el resultado del apartado 5.5 para un condensador plano,
con buena aproximación se tiene que:

Fuera de la región entre las placas, el campo es nulo, pues se oponen los campos
uniformes producidos por cada placa.
Dentro de la región entre las placas del condensador, el campo es perpendicular
a las placas y se dirige desde la placa positiva a la placa negativa. Es un campo
Ejercicios 63

uniforme de módulo
σ Q
E= = . (5.36)
ε0 ε0 A
A partir del campo eléctrico podemos calcular la diferencia de potencial entre las
placas del condensador. Para ello, suponemos que la placa positiva (con carga Q) se
encuentra situada en x = 0 y tiene un potencial V+ y la placa negativa (con carga
−Q) se encuentra a distancia d, en x = d, y tiene un potencial V− . Usamos la ecuación
(4.26) para la diferencia de potencial, obteniendo
Z 0
Qd
∆V = V+ − V− = − E dx = E d = . (5.37)
d ε0 A

5.7. Ejercicios
1. Determinar el flujo del campo eléctrico uniforme E = 2 × 103 V · m−1 j + 4 ×
103 V · m−1 k a través de la superficie cuadrada cuyos vértices se encuentran en
los puntos A(0, 0, 0), B(10 cm, 0, 0), C(0, 10 cm, 0), D(10 cm, 10 cm, 0).
Solución: Φe = 40 V · m.
2. Calcular el flujo del campo eléctrico del ejercicio anterior a través de la superficie
de un cı́rculo en el plano xy, de centro el origen y radio 5 cm.
Solución: Φe = 2π V · m.
3. Determinar el flujo del campo eléctrico E(x) = 2 × 103 (x − 1 m) k a través
de la superficie cuadrada cuyos vértices se encuentran en los puntos A(0, 0, 0),
B(10 m, 0, 0), C(0, 10 m, 0), D(10 m, 10 m, 0). En la expresión del campo, x está da-
da en centı́metros.
Solución: Φe = 8 × 105 V · m.
4. Se tienen tres cargas puntuales q1 = 4 nC, q2 = −2 nC, q3 = −2 nC, en los
puntos P1 (0, 0, 0), P2 (4 m, 3 m, 0), P3 (4 m, 4 m, 3 m), respectivamente. Calcular el
flujo eléctrico a través de la superficie de una esfera de centro el origen y 6 m de
radio.
Solución: Φe = 226 V · m.
5. Dadas las cargas del problema anterior, calcular el flujo eléctrico a través de la
superficie de un cubo centrado en el origen, cuyas aristas son paralelas a los ejes
de coordenadas y tienen 6 m de longitud.
Solución: Φe = 452 V · m.
6. Un cilindro de radio R y altura 2R tiene una densidad volumétrica de carga ρ
uniforme. Calcular el flujo del campo eléctrico creado por este cilindro a través
de la superficie de un cubo, concéntrico con el cilindro, que tiene cuatro aristas
de longitud 3R paralelas al eje del cilindro.
Solución: Φe = 2πR3 ρ/ε0 .
7. Una esfera de radio R centrada en el origen tiene una densidad volumétrica
de carga que varı́a con la distancia r al centro de la esfera según la expresión
ρ = ρ0 (1 − r2 /R2 ), siendo ρ0 una constante. Determinar el campo eléctrico en
todos los puntos del espacio.
Solución: E = ρ0 (5R2 r − 3r3 )/(15ε0 R2 ), para r < R. E = 2ρ0 R3 /(15ε0 r2 ), para
r>R
8. Determinar el potencial creado por una esfera de radio R, carga Q distribuida
homogéneamente, y centro en el origen.
64 Ley de Gauss

Solución: V = −Qr2 /(8πε0 R3 ) + 3Q/(8πε0 R), para r < R. V = Q/(4πε0 r), para
r>R
9. Determinar el potencial creado por un cilindro de altura infinita y radio R, cuyo
eje es el eje z y que tiene una densidad volumétrica de carga ρ uniforme.
Solución: V = −ρr2 /(4ε0 ), para r < R. V = −ρR2 /(4ε0 ) − ρ/(2ε0 ) ln (r/R),
para r > R
10. Determinar el potencial creado por un condensador plano de área A, carga Q
y distancia entre placas d en un punto de su interior a distancia x de la placa
positiva.
Solución: V = V+ − Qx/(ε0 A).
11. Dos esferas, cada una de radio R, tienen una densidad de carga uniforme +ρ
y −ρ respectivamente. Se disponen de manera que solapan parcialment e como
puede verse en la figura 5.10, siendo la distancia entre sus centros d. Demo strar
que el campo en la región de solapamiento es constante y encontrar su va lor.
Pista: Usa la ley de Gauss para calcular el campo eléctrico dentro de una esfera
cargada uniformemente.
Solución: E = ρ d/(3ε0 ) dirigido desde el centro de la esfera de carga positiva al
de la carga negativa.

R R

Figura 5.10.
Capı́tulo 6

Campo eléctrico en los medios materiales

6.1. Conductores en equilibrio electrostático


En este capı́tulo vamos a estudiar el comportamiento de los materiales conductores
y dieléctricos cuando se les aplica un campo eléctrico externo. Cuando se llega al
equilibrio y ya no se mueven cargas en el interior del material, el campo en el interior
es menor que el campo externo aplicado. En los conductores, las cargas eléctricas se
mueven casi libremente, obedeciendo fuerzas eléctricas externas o internas. El hecho
de existir cargas libres en su interior tiene un efecto crucial en el campo eléctrico.
Supongamos que un trozo de cobre tiene un exceso de carga positiva en una re-
gión dentro de él. Las cargas positivas se repelen entre sı́, de manera que se alejan
intentando reducir la fuerza eléctrica entre ellas. Cuando cesan de moverse se alcanza
el equilibrio electrostático (ver el apartado 3.4), al que se llega casi instantáneamente.
A menos que las cargas libres sean extraı́das del conductor por algún agente externo,
impidiendo que llegue el equilibrio, todas las cargas positivas se sitúan en la superficie
del conductor haciendo mı́nima la repulsión entre ellas. El interior queda completa-
mente neutro como se ve en la figura 6.1. En resumen, en condiciones de equilibrio
electrostático todo el exceso de carga de un conductor se sitúa en la superficie.
La distribución de carga en la superficie de un conductor en equilibrio no es, en
general, homogénea. Como veremos en el apartado 6.2, la carga neta del conductor
en equilibrio se sitúa, preferiblemente, en las zonas de la superficie que tienen mayor
curvatura, es decir, en las puntas. Sin embargo, cuando la superficie del conductor
tiene una curvatura uniforme, como es el caso de una esfera o un cilindro infinito, la
distribución de carga superficial en el equilibrio es homogénea.

+ +
+
++ + +
++++ +
+
+
Figura 6.1. Un exceso de carga positiva en el interior de un conductor se redistribuye casi
inmediatamente en la superficie del material.

65
66 Campo eléctrico en los medios materiales

− +
− +
− +
− +
− +
− +

Figura 6.2. Un conductor en el seno de un campo eléctrico externo anula el campo en su


interior mediante la redistribución de carga en su superficie.

Campo eléctrico en un conductor en equilibrio

Consideremos ahora lo que ocurre con el campo eléctrico. Si aplicamos la ley de


Gauss a una superficie gaussiana coincidente con la superficie del material conductor
se obtiene que, como no hay carga interior en el equilibrio, el flujo eléctrico es nulo.
Por tanto, en condiciones de equilibrio electrostático, el campo eléctrico en el interior
de un material conductor es nulo.
Veamos qué ocurre si situamos un conductor en el seno de un campo eléctrico
externo, como en la figura 6.2. Las cargas inducidas por el campo externo se sitúan
en la superficie del conductor, creando un campo que altera las lı́neas eléctricas del
campo exterior. Dado que, en el equilibrio, no hay campo en el interior del conductor,
las lı́neas del campo externo tienen por sumideros cargas negativas en la superficie del
conductor, y las positivas son fuentes de otras lı́neas. Por tanto, las lı́neas no penetran
en el material. Esto ocurre incluso si existe un hueco en el interior del conductor: tal
hueco no sufrirá el campo externo. Como consecuencia, un material conductor actúa
como un blindaje de cualquier carga o dispositivo electrónico situado en su interior
frente a posibles campos exteriores. Este efecto se conoce como efecto de pantalla y
el conductor que lo crea se llama jaula de Faraday. Ası́, se utilizan mallas metálicas
para proteger los componentes electrónicos de los ordenadores y los monitores.
Otro aspecto interesante de los conductores en equilibrio es el valor del campo
eléctrico en su superficie. Dado que el campo en el interior es cero y no lo es, en general,
en el exterior, aparece una discontinuidad del campo en la superficie del conductor, es
decir, tiene dos valores diferentes dependiendo de si llegamos a la superficie desde el
interior o el exterior. Un ejemplo de esta situación es el condensador plano, que tiene
campo nulo fuera de las placas y campo no nulo y uniforme en la región entre ellas.
En realidad, esta discontinuidad es una idealización. La carga que se acumula en
la superficie lo hace en una capa muy delgada de espesor comparable al tamaño de los
átomos. Ası́, el campo es continuo pero varı́a muy rápidamente cerca de la superficie,
de tal modo que crece desde cero hasta su valor en el exterior en una longitud muy
pequeña. Si aproximamos la capa de transición por una superficie de espesor nulo,
como haremos en los ejemplos, resulta que el campo eléctrico en esa superficie es
discontinuo.
Conductores en equilibrio electrostático 67

Es

Figura 6.3. Un elemento de superficie de un conductor se puede aproximar por una superficie
plana. La ley de Gauss da entonces el valor del campo en ese elemento de superficie.

Discontinuidad del campo eléctrico.


Las propiedades de la distribución de carga y el campo en el interior de un conductor
en condiciones de equilibrio electrostático tienen su reflejo en el potencial. Dado que,
en el interior de un material conductor en equilibrio, el campo eléctrico es nulo tanto
si el conductor es macizo como si tiene cavidades o huecos, la relación entre campo y
potencial implica que el potencial electrostático es constante en todos los puntos del
interior. En particular, toda superficie de un conductor en equilibrio es una superficie
equipotencial.
Como consecuencia el campo eléctrico en la superficie de un conductor en equili-
brio es ortogonal a la superficie en cada punto, pues sabemos que las lı́neas de campo
son, en cada punto, ortogonales a las superficies equipotenciales. Por tanto, si defi-
nimos el vector unitario n como uno normal a la superficie en cada punto, el campo
eléctrico en la superficie del conductor es

Es = Es n, (6.1)

siendo nulo en el interior. En esta ecuación Es es el valor de la discontinuidad del


campo en la superficie del conductor.
El valor de la discontinuidad del campo Es puede calcularse. Para ello, aproxi-
mamos un trozo infinitesimal de la superficie del conductor por una superficie plana
de área dS, como vemos en la figura 6.3. Consideramos ahora una superficie gaussiana
cerrada, con dos caras planas paralelas a la superficie del conductor de área dS (una
en su interior y otra en el exterior). Dado que el campo es ortogonal a la superficie
del conductor en el exterior y nulo en el interior, el flujo del campo a través de la
superficie gaussiana tiene un valor

dΦe = Es dS. (6.2)

Por otro lado, la carga neta encerrada por la superficie gaussiana es σ dS. Aplicando
la ley de Gauss, resulta
σ
Es = , (6.3)
ε0
donde σ es el valor de la densidad de carga en la superficie infinitesimal dS. Dado
que la distribución de carga no es, en general, homogénea, el campo en la superficie
de un conductor tiene valores diferentes en cada punto, de acuerdo a las expresiones
(6.1) y (6.3).
68 Campo eléctrico en los medios materiales

2
Q/4πε R
0

E(r)

R r

Figura 6.4. Módulo del campo eléctrico E(r) creado por una esfera conductora en equilibrio
frente a la distancia r al centro de la esfera. Se observa una discontinuidad de la función
E(r) en la superficie de la esfera, es decir, en r = R. Esta discontinuidad tiene un valor
Es = Q/(4πε0 R2 ) = σ/ε0 .

6.2. Campo y potencial creados por una esfera conductora


Una aplicación sencilla de los conceptos presentados en el apartado anterior se muestra
en el siguiente ejemplo. Supongamos que una carga positiva Q se deposita en una
esfera metálica de radio R. Casi inmediatamente se alcanza el equilibrio y la carga
Q se distribuye homogéneamente en la superficie de la esfera, pues todos los puntos
de la esfera tienen la misma curvatura (su radio de curvatura es igual, en todos los
casos, al radio de la esfera).
El cálculo del campo eléctrico mediante la ley de Gauss es bastante directo. Por
la simetrı́a esférica del problema, E = E(r) ur . Tenemos dos regiones diferentes en el
espacio:
En el interior de la esfera el campo es nulo (como en cualquier conductor en
equilibrio),
E(r) = 0, si r < R. (6.4)
En la región exterior a la esfera hay que tener en cuenta toda la carga, de modo
que el campo eléctrico resulta
Q
E(r) = , si r > R. (6.5)
4πε0 r2
El resultado obtenido se puede representar gráficamente frente a la distancia r al
centro de la esfera (figura 6.4). Se observa claramente una discontinuidad del campo
eléctrico en la superficie del conductor (dada por r = R), como consecuencia de haber
asumido que la carga se distribuye en una superficie de espesor nulo, en lugar de en
una capa muy delgada. El valor de la discontinuidad es
Q σ
Es = E(R+ ) − E(R− ) = −0= , (6.6)
4πε0 R2 ε0
Campo y potencial creados por una esfera conductora 69

Q/4πε R
0

V(r)

R
r

Figura 6.5. Potencial electrostático V (r) creado por una esfera conductora cargada de radio
R y carga Q en equilibrio frente a la distancia r al centro de la esfera.

pues la densidad de carga superficial en la esfera es homogénea y vale σ = Q/(4πR2 ).


El potencial electrostático
R se puede calcular a partir de la expresión para el campo
usando la relación V = − E · dr. Tomando dr = dr ur , se obtiene

V1 , r < R,
V = Q (6.7)
V2 + 4πε0 r , r > R,

donde V1 y V2 son constantes de integración. Para determinar V2 podemos imponer la


condición de que el potencial en el infinito sea cero. Esto implica que V2 = 0. Ahora,
para determinar V1 usamos que el potencial es una función continua, con un único
valor en cada punto. Esto quiere decir, en particular, que el valor del potencial en
r = R es único, por lo cual
Q
V1 = . (6.8)
4πε0 R
Ası́, finalmente,
(
Q
V = 4πε0 R , r ≤ R,
(6.9)
Q
4πε0 r , r ≥ R.

El potencial de la esfera conductora (incluida su superficie) es por tanto

Q
Vesf = . (6.10)
4πε0 R

En la figura 6.5 se representa el potencial obtenido en función de la distancia r al


centro de la esfera. Se observa claramente que el potencial eléctrico es una función
continua en r = R sin variaciones apreciables en sus cercanı́as.
70 Campo eléctrico en los medios materiales

Figura 6.6. Un elemento infinitesimal de la superficie de un material conductor se puede


aproximar por una superficie esférica. Ası́ se obtiene una explicación del efecto de puntas.

Distribución de carga en un conductor


El ejemplo anterior permite comprender cualitativamente cómo es la distribución de
carga en la superficie de un conductor en equilibrio, incluyendo una explicación del
llamado efecto de puntas.
Aproximemos una pequeña zona de la superficie de un conductor por una super-
ficie esférica de radio r, como en la figura 6.6. Según acabamos de ver en el apartado
anterior, el campo eléctrico y el potencial electrostático en ese elemento de superficie
están relacionados por la expresión
Vesf
Es = , (6.11)
r
donde r es el radio de curvatura del elemento de superficie. Dado que la superficie de
un material conductor es equipotencial, Vesf es una constante, con lo cual se llega a
que el campo eléctrico en la superficie de un conductor va como la inversa del radio
de curvatura de esa superficie. Por otro lado, como Es = σ/ε0 según la ecuación (6.3),
se tiene que
ε0 Vesf
σ= . (6.12)
r
Las expresiones (6.11) y (6.12) tienen una consecuencia clara: tanto la densidad de
carga como el campo eléctrico son mayores en las zonas en que el radio de curvatura
r es menor. En particular, si el conductor tiene una punta, la densidad de carga y
el campo eléctrico pueden ser muy grandes en ella, incluso aunque el potencial no lo
sea.
Si el campo eléctrico en una punta de un conductor supera un valor crı́tico,
llamado resistencia dieléctrica del medio a su alrededor (para el aire, por ejemplo,
este valor es del orden de Emax = 3 × 106 V · m−1 ), se produce la ionización del
medio dieléctrico, liberándose electrones en una fracción de los átomos o moléculas
del medio. Este efecto se llama ruptura dieléctrica: el campo eléctrico es capaz entonces
de separar cargas positivas y negativas del aire (o de otro medio), produciendo una
corriente de carga capaz incluso de perturbar la llama de una vela. Un ejemplo es la
descarga de un relámpago en una tormenta.

6.3. Campo eléctrico en un dieléctrico


Lo que caracteriza a un material dieléctrico es la ausencia de cargas libres en su
interior. Debido a ello, al colocar el material dieléctrico en un campo eléctrico externo,
Campo eléctrico en un dieléctrico 71

−+ −+−+
−+ −+ −+
−+ −+ −+
−+ −+ −+
−+ −+ −+
−+ −+ −+
−+ −+ −+
−+ −+ −+
−+ −+ −+
−+ −+ −+
−+ −+ −+
−+ −+ −+
Figura 6.7. Sección transversal de un condensador plano, en la que se observan las lı́neas
del campo eléctrico del condensador cuando se introduce un material dieléctrico entre sus
placas. Por polarización de las moléculas del material, el campo eléctrico en el interior del
dieléctrico disminuye.

no existe la posibilidad de anular el campo en el interior del material colocando


cargas libres en la superficie, tal como hacen los conductores. En lugar de ello, las
moléculas de un material dieléctrico se polarizan, como anticipábamos en el apartado
3.4, actuando como dipolos y disminuyendo el campo en el interior del material sin
anularlo completamente. Veamos cómo ocurre esto.

Polarización
Las moléculas de los materiales suelen tener simetrı́a de carga, de manera que los
centros de carga positiva y negativa de la molécula coinciden. Decimos que estos
materiales no están polarizados. En algunos casos, como el agua, la geometrı́a de las
moléculas es tal que estos centros de carga no coinciden, diciéndose entonces que el
material tiene una polarización permanente.
Por sencillez, supongamos que tenemos un material sin polarización permanente.
Cuando se aplica a este material un campo externo, el centro de carga negativa de
cada molécula se desplaza con respecto al centro de carga positiva, de modo que la
molécula se polariza. Podemos ver esta polarización como un dipolo eléctrico, esto
es, un par de cargas puntuales q y −q separadas por una pequeña distancia a (ver
figura 4.8). En un dipolo, se define el momento dipolar eléctrico como la cantidad

p = q a, (6.13)

en donde el vector a tiene por módulo la distancia a entre las cargas positiva y negativa
del dipolo y por dirección y sentido los del vector que va desde la carga positiva a la
carga negativa. La unidad de momento dipolar es 1 C · m.
En la figura 6.7, un material dieléctrico se coloca entre las placas de un conden-
sador plano que crea un campo eléctrico uniforme dirigido desde su placa positiva a la
negativa. Como consecuencia de la aplicación de este campo externo, las moléculas del
dieléctrico se han polarizado de tal modo que, como vemos en la figura, los momentos
dipolares moleculares se han alineado en sentido opuesto al campo.
72 Campo eléctrico en los medios materiales

Aparece entonces en la superficie del material cercana a la placa positiva del


condensador (a la izquierda en la figura) una carga neta negativa. La densidad de
carga de esta superficie alcanza entonces cierto valor negativo −σP . Análogamente,
en la superficie cercana a la placa negativa del condensador (a la derecha en la figura)
aparece una carga neta positiva. La densidad de carga en esta superficie tiene un valor
positivo +σP
Sin embargo, existe una diferencia muy importante entre las cargas que se sitúan
en la superficie de un conductor en equilibrio y las que se sitúan en la superficie de
un material dieléctrico polarizado como el de la figura 6.7. Las primeras son cargas
libres que se pueden mover a través del conductor. Por su parte, las últimas son cargas
ligadas o cargas de polarización, incapaces de moverse a través del material porque
están ligadas a moléculas determinadas.

Permitividad de un dieléctrico
Una vez tenemos un dieléctrico polarizado, como el de la figura 6.7, las cargas de
polarización equilibran parcialmente el campo externo. Como vemos en la figura, no
todas las lı́neas de campo eléctrico que parten de la placa positiva del condensador
llegan a la placa negativa, pues algunas de ellas son absorbidas por la carga de pola-
rización negativa en la superficie izquierda del dieléctrico. De igual manera, la carga
de polarización positiva de la superficie derecha del dieléctrico es fuente de nuevas
lı́neas eléctricas que llegan a la placa negativa. En consecuencia, el campo eléctrico
en el interior del material dieléctrico es menor que el campo eléctrico en el vacı́o para
la misma carga libre en las placas del condensador.
Podemos cuantificar esto del siguiente modo. En la superficie izquierda del ma-
terial (figura 6.7), la densidad superficial de carga efectiva, que da lugar al campo
eléctrico en el interior, es
σ = σ0 − σP , (6.14)
donde σ0 es la densidad de carga libre en la placa positiva del condensador y σP es
la densidad de carga ligada en la superficie izquierda del material dieléctrico. Por su
parte, en la superficie derecha del material la densidad superficial de carga efectiva es

−σ = −σ0 + σP . (6.15)

El campo eléctrico en el interior del material se puede escribir entonces como el creado
por un condensador plano cuya densidad de carga superficial en la placa positiva es σ
y cuya densidad en la placa negativa es −σ. La intensidad del campo eléctrico tiene
entonces un valor
σ σ0 − σP
E= = . (6.16)
ε0 ε0
Si no existiese material dieléctrico entre las placas del condensador, el campo eléctrico
serı́a E0 = σ0 /ε0 , de tal modo que podemos escribir la expresión (6.16) como
σP
E = E0 − . (6.17)
ε0
Con esta ecuación podemos comprender lo que está pasando. El campo eléctrico E en
el interior el dieléctrico tiene en cuenta todas las cargas no balanceadas, tanto libres
como ligadas. Por su parte, el campo externo E0 sólo tiene en cuenta cargas libres.
Capacidad y condensadores 73

La relación entre la densidad de carga de polarización σP y el campo eléctrico E


en un material depende del tipo de dieléctrico. En los llamados materiales homogéneos,
isotrópicos y lineales, los únicos que trataremos en este libro, la densidad de carga de
polarización es proporcional al campo según la expresión

σP = χe ε0 E, (6.18)

donde χe es un número sin dimensiones, casi siempre positivo y caracterı́stico de


cada material, llamado susceptibilidad eléctrica. En estos casos, sustituyendo (6.18)
en (6.17), resulta
E0 E0
E= = , (6.19)
1 + χe εr
siendo
εr = 1 + χ e , (6.20)
un número sin unidades llamado constante dieléctrica o permitividad relativa del ma-
terial. Se define la cantidad ε = εr ε0 como la permitividad (absoluta) del medio. Según
(6.19), las expresiones calculadas hasta ahora para campos eléctricos y potenciales en
el vacı́o, son válidas en un medio dieléctrico sustituyendo ε0 por ε.
Para el vacı́o, obviamente, εr = 1. Para el resto de los materiales es mayor que
1. A temperatura ambiente, por ejemplo para el aire, εr = 1,0005, muy cercana a la
del vacı́o. Para el papel, εr = 3,7. Para la porcelana, εr = 7, etc. Como el campo en
un medio es menor que el campo en el vacı́o, εr > 1. Para un conductor perfecto, εr
tiende a infinito, de manera que el campo en su interior es cero.

6.4. Capacidad y condensadores


Si depositamos una carga Q en un conductor, ésta se distribuye en su superficie, de
tal manera que todos los puntos del conductor adquieren un potencial Vc respecto
al nivel cero (aquel en que no hay carga en la superficie del conductor). Se define la
capacidad eléctrica del conductor como el cociente entre la carga de su superficie y el
potencial respecto al nivel cero, esto es
Q
C= . (6.21)
Vc

La unidad SI de capacidad es el faradio (F) que se define como 1 F = 1 C · V−1 . El


faradio es una unidad relativamente grande, de tal modo que las capacidades tı́picas
vienen dadas en submúltiplos de esta unidad según la tabla 1.2, como el microfaradio
(1 µF = 10−6 F), el nanofaradio (1 nF = 10−9 F) o el picofaradio (1 pF = 10−12 F).
La capacidad de un conductor da una medida de cuánta carga puede almacenar.
Depende de la geometrı́a del conductor y de las propiedades eléctricas del espacio
que lo rodea. Por ejemplo, la capacidad de un conductor esférico en el vacı́o se puede
calcular a partir del potencial de su superficie Vc = Q/(4πε0 R). Resulta

Q
C= = 4πε0 R, (6.22)
Vc
que como vemos no depende de la carga depositada Q.
74 Campo eléctrico en los medios materiales

+Q +Q −Q +Q −Q
−Q

(a) (b) (c)

Figura 6.8. (a) Un condensador plano está formado por dos placas planas de pequeño grosor,
de la misma forma y tamaño, situadas paralelamente una respecto de otra. La distancia
entre las placas suele ser muy pequeña en comparación con el tamaño de cada placa. Las
placas están cargadas con cargas de la misma magnitud pero de signo opuesto. (b) En un
condensador cilı́ndrico, las placas tienen forma de corteza cilı́ndrica de pequeño grosor. (c)
Un condensador esférico está formado por dos conductores de forma esférica.

Condensadores
La capacidad es una magnitud fı́sica especialmente importante para describir las pro-
piedades de ciertos dispositivos eléctricos llamados condensadores. En general, un
condensador es un dispositivo formado por dos conductores con la misma geometrı́a
(por ejemplo, dos placas planas de la misma forma y tamaño, dos conductores cilı́ndri-
cos con el mismo eje o dos conductores esféricos concéntricos) situados muy cerca uno
de otro pero sin tocarse. Uno de los conductores se carga con una carga Q y el otro
con una carga −Q. En la figura 6.8 se ve un esquema de un condensador plano, un
condensador cilı́ndrico y un condensador esférico. El espacio entre los dos conductores
que forman el condensador suele rellenarse con algún material dieléctrico o bien se
deja vacı́o.
Las placas de un condensador se suelen denominar también armaduras. Cuando
se sitúan sobre las armaduras de un condensador cargas de la misma magnitud pero
de signo opuesto y se llega al equilibrio electrostático, la armadura de carga positiva
adquiere un potencial V+ , que excede al potencial V− de la armadura de carga negativa
en una cantidad ∆V , es decir,
∆V = V+ − V− . (6.23)
Se define la capacidad de un condensador como el cociente entre la carga Q situada
en la armadura positiva y la diferencia de potencial ∆V entre la armadura positiva y
la negativa,
Q
C= . (6.24)
∆V
La cantidad C depende de los detalles de fabricación del condensador, y mide la
posibilidad de almacenamiento de carga pues con un valor grande de C el condensador
alamcena más carga con la misma diferencia de potencial aplicada en sus armaduras.

Cálculo de la capacidad de un condensador


Para calcular la capacidad de un condensador, el procedimiento es el siguiente. Pri-
mero, se supone una carga Q en una de sus armaduras, y una carga −Q en la otra.
Capacidad y condensadores 75

Se calcula el campo eléctrico que crea esta distribución de carga en el equilibrio para
puntos situados en la región entre las armaduras. A partir del campo, se determina
la diferencia de potencial ∆V entre la armadura positiva y la negativa. Finalmente,
se calcula la capacidad C del condensador mediante el cociente C = Q/∆V .
Para un condensador plano, el campo eléctrico que crea y la diferencia de poten-
cial entre sus armaduras se calcularon en el apartado 5.6. El resultado es que el campo
en cualquier punto de la región entre las armaduras del condensador es uniforme y
tiene un módulo E = Q/(ε0 A), donde A es el área de cada armadura. La dirección
del campo es ortogonal a las armaduras y se dirige desde la armadura positiva hacia
la negativa. La diferencia de potencial entre las placas es
Qd
∆V = V+ − V− = Ed = . (6.25)
ε0 A
La capacidad resulta, por tanto,
Q ε0 A
C= = , (6.26)
∆V d
una expresión que muestra que, como se habı́a adelantado, la capacidad depende sólo
de factores geométricos (el área de las placas y la distancia entre ellas) y del material
que se coloca entre las placas. En el caso estudiado, al ser este material el vacı́o,
aparece en la capacidad la permitividad del vacı́o ε0 , pero se pueden insertar otros
materiales, modificando ası́ la capacidad del condensador.
El procedimiento usado para calcular la capacidad de un condensador plano se
puede repetir para un condensador esférico y uno cilı́ndrico. La capacidad de un
condensador esférico resulta
4πε0 ab
C= , (6.27)
b−a
donde a es el radio de la esfera de carga positiva y b es el radio de la superficie esférica
de carga negativa que la rodea. La de un condensador cilı́ndrico es
2πε0 L
C= , (6.28)
log (b/a)
donde L es la longitud del condensador, a el radio del cilindro interior de carga positiva
y b el radio de la superficie cilı́ndrica de carga negativa que la rodea.

Condensadores con dieléctricos entre sus placas


Si un material dieléctrico se introduce entre las placas de un condensador, la capacidad
de éste puede aumentar considerablemente. Esto se debe a que, como hemos visto, el
dieléctrico altera el campo eléctrico entre las placas, de tal modo que, si E0 es el campo
eléctrico en el vacı́o, el campo en el interior del material dieléctrico es E = E0 /εr ,
siendo εr la constante dieléctrica o permitividad relativa del material.
La reducción del valor del campo eléctrico entre las placas de un condensador
cuando se introduce entre ellas un dieléctrico tiene consecuencias importantes en la
capacidad del condensador. Efectivamente, el campo eléctrico E se reduce respecto
al del vacı́o E0 según la expresión E = E0 /εr . Por tanto, la diferencia de potencial
entre las placas ∆V se reduce con el mismo factor. Esto implica que la capacidad
76 Campo eléctrico en los medios materiales

del condensador C cuando se introduce un dieléctrico aumenta con respecto a la


capacidad del mismo condensador cuando entre las placas hay vacı́o C0 de tal modo
que
C = εr C 0 . (6.29)

Por ejemplo, la capacidad de un condensador plano con un dieléctrico entre sus placas
es
εr ε0 A εA
C= = , (6.30)
d d
donde ε es la permitividad del medio. El hecho de que la capacidad aumente al insertar
un dieléctrico es la razón por la cual se suelen fabricar los condensadores con diferentes
materiales entre sus placas.
Una aplicación sencilla en la que aparecen los condensadores es la fabricación de
algunos teclados para ordenadores. Cada una de las teclas de estos teclados está mon-
tada sobre una placa metálica separada de otra placa inferior por un dieléctrico. Al
presionar esta tecla, la placa superior baja presionando el dieléctrico. Esto aumenta
la capacidad del condensador formado por ambas placas, pues la distancia entre ellas
disminuye. Los circuitos del ordenador detectan este aumento de capacidad, recono-
ciendo ası́ qué tecla ha sido pulsada.

6.5. Almacenamiento de energı́a eléctrica

Un condensador almacena carga eléctrica cuando se establece una diferencia de poten-


cial entre sus placas. La diferencia de potencial entre estas placas la establece algún
dispositivo que actúe como fuente de trabajo. Ejemplos de tales dispositivos son las
baterı́as o pilas. Cuando una pila de V0 = 1, 5 V se conecta a un condensador, la dife-
rencia de potencial entre sus placas acaba siendo ∆V = V0 = 1, 5 V. Para hacer esto,
la pila hace un trabajo para depositar carga negativa en una armadura del condensa-
dor, extrayéndola de la otra armadura, que queda ası́ cargada positivamente. La carga
que se almacena finalmente en la armadura positiva del condensador está determinada
por su capacidad según la expresión Q = C∆V .
En general, para cargar cualquier conductor hay que realizar un trabajo, pues
para incrementar su carga se necesita vencer la repulsión electrostática debida a las
cargas ya presentes en él. Este trabajo contra la fuerza electrostática, realizado por
un agente externo, se almacena en el conductor en forma de energı́a potencial elec-
trostática de las cargas que hemos almacenado en el conductor.
Como vimos en el apartado 4.4, al mover una carga q entre dos puntos cuya
diferencia de potencial es ∆V , el trabajo que realiza la fuerza electrostática es W =
−q∆V . Si q es una carga positiva, inicialmente en reposo, que queremos mover a un
punto de mayor potencial que el inicial, el trabajo electrostático W es negativo, de
modo que según el teorema trabajo-energı́a, la energı́a cinética de la carga disminuye,
lo cual es imposible ya que era cero inicialmente. Por lo tanto, la fuerza electrostática
no puede mover la carga en este caso. Un agente externo debe ser capaz de realizar
al menos un trabajo Wext = −W = q∆V para que la carga positiva pueda vencer la
repulsión electrostática y moverse al punto de mayor potencial.
Almacenamiento de energı́a eléctrica 77

Energı́a almacenada en un condensador


Cuando una baterı́a está cargando un condensador, ha de ser capaz de ir llevando
carga positiva desde la placa negativa hasta la placa positiva venciendo la repulsión
electrostática. El trabajo que realiza la baterı́a Wbat es como hemos visto igual y
de signo opuesto al trabajo (negativo) realizado por la fuerza electrostática en ese
proceso. Este trabajo se almacena como energı́a potencial electrostática Ue de las
cargas sobre las armaduras del condensador. Ası́, tenemos que la energı́a potencial
almacenada por un condensador es

Ue = Wbat , (6.31)

siendo Wbat el trabajo que ha realizado la baterı́a para cargar el condensador com-
pletamente.
Para calcular este trabajo, consideremos un condensador durante el proceso de
carga. Inicialmente, el condensador tiene carga nula y diferencia de potencial nula
entre sus placas. Empieza el proceso de carga al conectar este condensador a una
baterı́a de potencial V0 , de tal manera que sabemos que la diferencia de potencial
final entre las placas del condensador será V0 y que la carga final en la placa positiva
será Q = CV0 .
En un instante dado del proceso de carga, la diferencia de potencial entre las
armaduras del condensador tiene un valor V (menor que V0 ) y la carga situada en
la armadura positiva es q = CV , siendo C la capacidad del condensador. Podemos
calcular ahora el trabajo infinitesimal dWbat realizado por la baterı́a para colocar una
carga adicional dq en la placa positiva del condensador, dejando una carga −dq en la
placa negativa. Este trabajo es
q
dWbat = V dq = dq, (6.32)
C
donde se ha usado la definición de capacidad y se ha tenido en cuenta que q es la
carga ya depositada en la placa positiva.
Si integramos la ecuación (6.32) entre el valor inicial de la carga en la placa
positiva del condensador (que es cero) y el valor final (que es Q), obtendremos el
trabajo total realizado por la baterı́a durante todo el proceso de carga, es decir, la
energı́a potencial electrostática total Ue que hemos almacenado en el condensador.
Resulta Z Q
q Q2 CV02 QV0
Ue = dq = = = , (6.33)
0 C 2C 2 2
donde V0 = ∆V es la diferencia de potencial final entre las armaduras del condensador.

Energı́a de un campo eléctrico


Hay otra manera más interesante de interpretar el resultado (6.33). En el proceso de
carga se crea un campo eléctrico entre las placas del condensador, de manera que el
trabajo realizado para cargar el condensador se puede tomar como el trabajo necesario
para crear este campo eléctrico. La energı́a almacenada en el condensador se puede
considerar energı́a del campo eléctrico creado.
Consideremos un condensador plano. En este caso, la relación entre el módulo
del campo eléctrico E y la diferencia de potencial entre armaduras V0 está dada por
78 Campo eléctrico en los medios materiales

V0 = Ed, siendo d la distancia entre las placas del condensador. La capacidad del
condensador es C = εA/d, donde ε es la permitividad dieléctrica del material entre
las placas (igual a ε0 en el caso del vacı́o) y A es el área de cada placa. Usando la
ecuación (6.33), la energı́a del campo eléctrico creado por el condensador plano es

CV02 1
Ue = = εE 2 (Ad) . (6.34)
2 2
Dado que la cantidad Ad es igual al volumen V del espacio comprendido entre las
placas del condensador, es también, aproximadamente, igual al volumen de la región
del espacio donde el campo eléctrico creado por el condensador es relevante.
Se puede definir la densidad de energı́a eléctrica ue como la energı́a de un campo
eléctrico por unidad de volumen,
ε 2
ue = E . (6.35)
2
Este resultado es general aunque se haya deducido para un condensador plano. La
densidad de energı́a ue en cada punto es una función que depende del cuadrado del
campo eléctrico en ese punto (del mismo modo que la intensidad de una onda mecánica
depende del cuadrado de su amplitud, una analogı́a que resultará más clara cuando
tratemos las ondas electromagnéticas).
Cuando un campo eléctrico E está definido en una determinada región del espacio
de volumen V, la intensidad de este campo eléctrico puede depender del punto del
espacio, de manera que la relación entre densidad de energı́a eléctrica y energı́a del
campo eléctrico no es simplemente Ue = ue V. En su lugar, se tiene la forma final
Z Z
ε 2
Ue = ue dV = E dV, (6.36)
V V 2
que es una ecuación general que nos da la energı́a requerida para crear cualquier
campo.

6.6. Ejercicios
1. Una carga puntual q = 7,5 mC se sitúa en el centro de una corteza esférica
conductora, inicialmente cargada con una carga Q = −2,5 mC. Esta corteza
tiene un radio interior a = 1 mm y un radio exterior b = 2 mm. Describir la
distribución de carga resultante en la esfera una vez se alcanza el equilibrio y
calcular el campo eléctrico que crea esta distribución.
Solución: En la superficie interior de la esfera hay una carga Qa = −q = −7,5 mC
y, en la superficie exterior, una carga Qb = q + Q = 5 mC. El campo eléctrico
es radial y tiene un valor E = q/(4πε0 r2 ) si r < a, E = 0 si a < r < b, y
E = (q + Q)/(4πε0 r2 ) si r > b.
2. Determinar el potencial electrostático creado por la distribución de carga del
ejercicio anterior.
Solución: V = q/(4πε0 r) + (q + Q)/(4πε0 b) − q/(4πε0 a) si r ≤ a, V = (q +
Q)/(4πε0 b) si a ≤ r ≤ b, y V = (q + Q)/(4πε0 r) si r ≥ b.
3. Se tienen dos esferas conductoras muy alejadas entre sı́, de radios a y b. La primera
esfera tiene una carga inicial Q y la segunda está descargada. Determinar el
Ejercicios 79

potencial de ambas esferas en el equilibrio. Supongamos que unimos la superficie


de ambas esferas mediante un cable conductor neutro de grosor despreciable. Al
volver al equilibrio, calcular la carga de cada una de las esferas y su potencial.
Solución: Antes de unir las esferas, Va = Q/(4πε0 a) y Vb = 0. Tras unirlas,
Qa = aQ/(a + b), Qb = bQ/(a + b), Va = Vb = Q/(4πε0 (a + b)).
4. Un dieléctrico de permitividad relativa εr = 2, 6 se sitúa entre las placas de
un condensador plano de área A = 10 cm2 y carga Q0 = 10−12 C. Determinar
el campo eléctrico E en el interior del dieléctrico y la densidad de carga de
polarización σP que se sitúa en su superficie.
Solución: E = 43, 5 V · m−1 , σP = 6, 1 × 10−10 C · m−2 .
5. Un condensador esférico está formado por una esfera conductora de radio a y
una corteza esférica concéntrica de radio interior b. Calcular su capacidad.
Solución: C = 4πε0 ab/(b − a).
6. Un condensador cilı́ndrico está formado por un cilindro conductor de radio a y
longitud L, y una corteza cilı́ndrica concéntrica de radio interior b. Calcular su
capacidad.
Solución: C = 2πε0 L/ log (b/a).
7. La capacidad de un condensador cuando entre sus placas hay vacı́o es de 1,2 µF.
Este condensador se carga conectándolo a una baterı́a que mantiene entre sus
placas una diferencia de potencial de 12 V. Sin desconectar el condensador de
la baterı́a se inserta entre sus placas un dieléctrico. Como resultado, fluye desde
una placa hacia la otra, pasando por la baterı́a, una carga adicional de 2,6 ×
10−5 C. Determinar la permitividad relativa del material. Decidir cuáles de estas
cantidades crecen, decrecen o no varı́an al introducir el dieléctrico: capacidad,
carga, diferencia de potencial, campo eléctrico y energı́a eléctrica.
Solución: εr = 2,8. Aumentan la carga, la capacidad y la energı́a, se mantienen
el campo y el potencial.
8. El condensador del ejercicio anterior se carga, cuando entre sus placas hay vacı́o,
con la misma baterı́a. Ahora se desconecta de ella y después se introduce entre sus
placas un dieléctrico de permitividad relativa εr = 2,8. Decidir cuáles de estas
cantidades crecen, decrecen o no varı́an al introducir el dieléctrico: capacidad,
carga, diferencia de potencial, campo eléctrico y energı́a eléctrica.
Solución: Aumenta la capacidad, se mantiene la carga, y disminuyen el potencial,
el campo y la energı́a.
9. Las armaduras de un condensador plano, de área A, están separadas una distancia
d, y entre ellas se introduce un dieléctrico de espesor d/2 y permitividad relativa
εr . Determinar la energı́a del campo eléctrico creado por este condensador una
vez cargado mediante una baterı́a de diferencia de potencial V0 .
Solución: Ue = (ε0 εr )/(1 + εr )V02 A/d.
10. Determinar la energı́a del campo eléctrico creado por una esfera conductora de
carga Q y radio R.
Solución: Ue = Q2 /(8πε0 R).
Capı́tulo 7

Corriente eléctrica

7.1. Corriente eléctrica en un cable conductor


Una corriente eléctrica es un conjunto de partı́culas cargadas en movimiento ordenado.
Esto es aplicable a los iones que se mueven en una disolución electrolı́tica, a las cargas
en un plasma (un gas ionizado) o a los electrones en un material conductor.
Un conjunto de cargas libres se pueden mover colectivamente por la acción de
un campo eléctrico. Existen también otras situaciones en que las cargas eléctricas
se mueven colectivamente. Por ejemplo, una masa de fluido en la que hay partı́cu-
las cargadas (una nube en la atmósfera es un caso tı́pico) puede moverse debido a
diferencias de presión en el medio, dando lugar a una corriente de convección. Otra
posibilidad se da en un material magnetizado, en donde aparece una corriente de mag-
netización superficial debido a la orientación de los momentos magnéticos atómicos
al colocar el material en un campo magnético externo. Incluso existe una corriente de
desplazamiento en los materiales cuando su polarización cambia.

Corriente continua y corriente alterna


En este capı́tulo vamos a centrarnos en la corriente de conducción, en la que un
conjunto de cargas libres del interior de un conductor neutro se mueven en una deter-
minada dirección debido a un campo eléctrico aplicado. Estas corrientes son las que
aparecen principalmente en los circuitos eléctricos.
Dentro de las corrientes de conducción en un material conductor en forma de fi-
lamento rectilı́neo (un cable), es común distinguir entre corriente continua y corriente
alterna. Un flujo de carga en el interior de un cable constituye una corriente continua
(dc son sus siglas en inglés) cuando el sentido del movimiento colectivo de la carga es
siempre el mismo. Cuando el sentido del movimiento colectivo de la carga varı́a en el
tiempo, de tal modo que durante un intervalo la carga se mueve en un sentido dado,
luego en el sentido opuesto durante otro intervalo de tiempo, luego vuelve a cambiar
y ası́ sucesivamente, entonces se dice que tenemos una corriente alterna (abreviado
ac en inglés) a lo largo del cable.

Velocidad de arrastre
Veamos en qué situación aparece una corriente eléctrica en un conductor. En los
metales existe carga libre compuesta por electrones. Estos electrones tienen libertad

81
82 Corriente eléctrica

E
A

Figura 7.1. Movimiento neto de los electrones libres en un filamento conductor, de sección
A, al que se aplica un campo eléctrico.

para moverse a lo largo de toda la red de átomos que componen el metal. Debido a
que el metal se encuentra a una cierta temperatura, en equilibrio con su entorno,
sus electrones libres poseen cierta energı́a cinética. Por tanto, se están moviendo
constantemente en una especie de danza desordenada o caótica con velocidades tı́picas
del orden de 106 m · s−1 , sufriendo colisiones con los átomos de la red.
Consideremos un trozo de material conductor en forma de cable rectilı́neo de
longitud L y sección uniforme A, como se ve en la figura 7.1. Al aplicar un campo
eléctrico E a lo largo del filamento, los electrones libres se verán afectados por el
campo y tenderán a moverse hacia la región de mayor potencial, en sentido opuesto
al campo eléctrico. Por tanto, al movimiento original básicamente desordenado se
superpone ahora otro movimiento en sentido opuesto al campo creado: cada electrón
se ve acelerado por una fuerza Fe = −e E.
Finalmente, se llega a un equilibrio en el cual el movimiento de cada electrón se
puede considerar uniforme a lo largo del filamento conductor, determinado por una
velocidad constante va , en sentido opuesto al campo externo, llamada velocidad de
arrastre, que es del orden de 10−3 m · s−1 .
Una manera de estimar la velocidad de arrastre de los electrones libres en un
cable conductor es la siguiente. Usando la segunda ley de Newton, un electrón de
masa me y carga −e tiene una aceleración a dada por las fuerzas que actúan sobre él.
En primer lugar está la fuerza debida al campo eléctrico E, dada por la expre-
sión Fe = −e E. Para representar fenomenológicamente el efecto de las colisiones del
electrón con los átomos de la red, que frenan su movimiento, podemos utilizar una
fuerza de amortiguamiento viscoso o rozamiento. Se puede establecer una analogı́a
con el amortiguamiento que sufre un cuerpo en el aire al caer desde una altura deter-
minada, que provoca que una pluma y una piedra caigan con velocidades distintas a
pesar de que la aceleración gravitatoria es la misma para ambas. La fuerza de amorti-
guamiento viscoso se puede escribir como Fa = −b v, pues se opone a la velocidad de
la partı́cula como toda fuerza de rozamiento. El coeficiente b se llama coeficiente de
amortiguamiento y depende de la forma de la partı́cula y del medio en que se mueve.
En consecuencia, la ecuación de movimiento promedio de un electrón a lo largo
de un cable conductor se puede escribir, de manera aproximada, como

me a = −e E − b v. (7.1)

Cuando se aplica inicialmente el campo eléctrico, la velocidad promedio de los electro-


nes es cero (las trayectorias desordenadas de su movimiento térmico tienen direcciones
aleatorias, de tal modo que el promedio de la velocidad es nula a lo largo de cualquier
dirección). Si la velocidad es cero, la ecuación (7.1) nos dice que aparece una acele-
Corriente eléctrica en un cable conductor 83

ración promedio en los electrones en sentido opuesto al campo, de tal modo que su
velocidad en ese sentido crece rápidamente. Al crecer la velocidad, aparece la fuerza
de amortiguamiento en sentido opuesto a la velocidad, de tal modo que la aceleración
va decreciendo. Llega un momento en que la fuerza de amortiguamiento se hace tan
grande como la fuerza eléctrica. Entonces, la aceleración promedio de los electrones
se hace cero. A partir de ese instante, los electrones se mueven con una velocidad
constante, que es la velocidad de arrastre. Su valor se obtiene de la ecuación (7.1)
tomando nula la aceleración,
e
va = − E. (7.2)
b

Situación de equilibrio electrostático


Si los electrones se mueven en promedio con velocidad va , al llegar al extremo del
filamento o cable conductor, se empiezan a acumular allı́. Esta acumulación de carga
crea un campo eléctrico de sentido contrario al campo exterior que aplicábamos al
cable. Finalmente, se acumula tanta carga que el campo que ésta crea es capaz de
compensar el campo aplicado, con lo cual se alcanza el equilibrio electrostático y deja
de haber movimiento. El campo en el interior del conductor se anula y la velocidad de
arrastre acaba haciéndose cero. Esta es la explicación microscópica de las propiedades
de los conductores en equilibrio electrostático que hemos visto en capı́tulos anteriores.
El tiempo en que se llega al equilibrio se puede estimar a partir de la ecuación
(7.1). Cuando el campo se hace cero, se tiene

me a = −b v. (7.3)

El tiempo de relajación te necesario para que los electrones se paren, y se llegue al equi-
librio electrostático, se puede obtener aproximadamente de esta expresión haciendo
v = va , y también a = −va /te . El resultado es
me
te = , (7.4)
b
que suele ser del orden de 10−14 s, es decir, el equilibrio se alcanza casi instantánea-
mente.

Circuito eléctrico
Una corriente eléctrica implica una situación de no equilibrio. Por tanto, si quisiéramos
mantener una corriente eléctrica a lo largo de un cable conductor, tendrı́amos que
idear alguna manera de extraer electrones del extremo del conductor en donde se
están acumulando e inyectarlos por el extremo opuesto. Para mantener una corriente
eléctrica, necesitamos un camino cerrado formado por conductores y dispositivos que
los unen. Tal camino se llama circuito eléctrico.
Cuando un aparato eléctrico se conecta a la red mediante un cable conductor,
se consigue un camino cerrado entre el enchufe y el aparato, a través del cual fluye
corriente eléctrica. Esto nos plantea un curioso enigma. La velocidad de arrastre de
los electrones a través del cable es, como antes hemos comentado, muy peque na: un
electrón recorre una distancia de 10−3 metros en cada segundo. ¿Cómo es entonces
posible que encendamos el interruptor y una lámpara se encienda de manera casi
84 Corriente eléctrica

Figura 7.2. Un circuito de canicas es un ejemplo mecánico que permite comprender la gran
velocidad con que se propaga la energı́a eléctrica.

instantánea aunque del interruptor a la lampara haya una distancia de varios metros?
Una estimación simple darı́a un tiempo de varios miles de segundos.
La respuesta podemos verla con ayuda de la figura 7.2. Un tubo está lleno de
canicas, por lo que si se introduce una por un extremo, inmediatamente otra es ex-
pulsada por el otro lado. Incluso si cada canica sólo viaja una peque na distancia, el
efecto es virtualmente instantáneo. Con la electricidad, este efecto ocurre a la veloci-
dad de la luz, es decir a unos 3 × 108 m · s−1 , que es la velocidad con que el campo
eléctrico se propaga a lo largo del cable, aunque los electrones viajan a una velocidad
mucho menor.

7.2. Ley de Ohm


Consideremos de nuevo el filamento conductor de la figura 7.1 recorrido por una
corriente eléctrica. Supongamos que el número de electrones libres por unidad de
volumen en el conductor es ne y que estos se mueven con una velocidad de arrastre
va . Para caracterizar la corriente a lo largo del conductor se define el vector densidad
de corriente eléctrica j como la carga libre que atraviesa, por unidad de tiempo, una
unidad de superficie transversal al movimiento, o la carga por unidad de volumen
multiplicada por la velocidad,
q
j= v = −ene va , (7.5)
V

La unidad de densidad de corriente es 1 C · s−1 · m−2 .


Es importante notar que, según la definición (7.5), se elige el sentido de la co-
rriente como opuesto al movimiento real de los electrones, es decir, se toma para la
densidad de corriente el sentido del flujo de carga positiva. El motivo de esto es que,
antes de descubrirse los electrones, Benjamin Franklin asumió que la carga eléctrica
que se movı́a a lo largo de un conductor era carga positiva. Más tarde, cuando se
descubrió que en un metal se mueven los electrones, se decidió mantener el criterio
de Franklin. Este criterio se conoce como sentido convencional del flujo, que es el que
seguiremos aquı́.
Si utilizamos para la velocidad de arrastre el valor que hemos estimado en la
ecuación (7.2) y lo introducimos en la definición (7.5), encontraremos una relación
entre la densidad de corriente a lo largo de un filamento conductor y el campo eléctrico
necesario en el conductor para producir esta corriente,

ne e2
j= E = σe E, (7.6)
b
donde σe es el coeficiente de proporcionalidad entre la densidad de corriente y el
campo eléctrico en un conductor y se llama conductividad eléctrica del material.
Ley de Ohm 85

Conductividad y resistividad
La conductividad de un material depende del tipo de material, de la temperatura y
del campo aplicado, pero no de su forma o su tamaño. Aunque el sı́mbolo que hemos
utilizado para la conductividad es el mismo que el que usamos anteriormente para la
densidad superficial de carga, es importante no confundir ambos conceptos. De hecho,
tienen unidades diferentes. La unidad de conductividad eléctrica es 1 C·V−1 ·m−1 ·s−1 .
Esta unidad también se escribe como 1 siemen/m.
La inversa de la conductividad se llama resistividad del material y se simboliza
como
1
ρe = , (7.7)
σe
que tampoco se debe confundir con una densidad volumétrica de carga. La unidad
de resistividad es inversa de la unidad de conductividad. Resulta útil definir el ohmio
(Ω) como 1Ω = 1 V · s · C−1 . De este modo, la unidad de resistividad es 1 Ω · m.
En la tabla 7.1 podemos ver algunos valores tı́picos de resistividad para diver-
sos materiales. Vemos que los conductores de la tabla (metales) tienen muy baja
resistividad, mientras que los aislantes tienen alta resistividad. También observamos
que algunos materiales, tales como el Germanio y el Silicio, tienen una resistividad
intermedia.
En general, la resistividad de un material depende de la temperatura, algo com-
prensible si recordamos que la temperatura es una medida de la energı́a cinética del
movimiento desordenado de los portadores de carga. En los metales, la resistividad
aumenta con la temperatura, pero en los semiconductores esto no es cierto. Para
muchos materiales, y en un limitado rango de temperaturas, podemos expresar la
dependencia de la resistividad con la temperatura mediante la ecuación
ρ = ρ0 [1 + α(T − T0 )]. (7.8)
En esta expresión, ρ y ρ0 son las resistividades a temperaturas T y T0 respectiva-
mente (medidas en Kelvin), y α es el coeficiente de temperatura de la resistividad del
material, con unidades de K−1 .

Material Resistividad (Ω·m) Material Resistividad (Ω·m)


Conductores Semiconductores
Aluminio (Al) 2.82×10−8 Carbono (C) 3.5×10−5
Cobre (Cu) 1.72×10−8 Germanio (Ge) 0.5a
Oro (Au) 2.44×10−8 Silicio (Si) 20-2300a
Hierro (Fe) 9.7×10−8 Aislantes
Mercurio (Hg) 95.8×10−8 Mica 1011 − 1015
Plomo (Pb) 22×10−8 Vidrio 1010 − 1014
Nicromo (aleación) 100×10−8 Goma 1013 − 1016
Plata (Ag) 1.59×10−8 Teflón 1016
Tungsteno (W) 5.6×10−8 Madera 3×1010

Tabla 7.1. Resistividades de diversos materiales a 20 ◦ C. En los casos en que aparece un


superı́ndice a , el valor depende de la pureza del material.
86 Corriente eléctrica

I
S

A B
Figura 7.3. Corriente eléctrica a lo largo de un cable conductor rectilı́neo y homogéneo
de sección uniforme S y longitud L. El valor de la intensidad de corriente depende de la
diferencia de potencial entre los extremos A y B del cable y de la resistencia del cable,
según la ley de Ohm. La corriente se dirige desde el extremo de mayor potencial al de menor
potencial si se considera el sentido convencional del flujo.

Intensidad de corriente eléctrica


El flujo del vector densidad de corriente j a través de una sección transversal S del
cable conductor se llama intensidad de corriente eléctrica I,
Z
I= j · dS. (7.9)
S

En esta expresión, el vector dS está definido, como en el caso del flujo eléctrico, como
el producto dS n, siendo n el vector unitario normal a la sección transversal del cable,
y dS el área de un trozo infinitesimal de esta sección. La unidad de intensidad de
corriente es el amperio (A), definido de tal manera que 1 A = 1 C · s−1 .
Cuando la carga fluye a través de un hilo conductor de sección uniforme S, como
el de la figura 7.3, podemos suponer que la densidad de corriente j es paralela al vector
normal n y uniforme en la superficie S. Resulta entonces

dQ
I = jS = ene va S = , (7.10)
dt
y la intensidad de corriente I es la cantidad total de carga positiva que atraviesa una
sección S del cable por unidad de tiempo.
Podemos usar ahora la ecuación (7.6) para encontrar una relación entre la in-
tensidad de corriente I en un filamento conductor rectilı́neo de sección uniforme y el
campo eléctrico en el material. Se encuentra entonces que

ES
I= . (7.11)
ρe

siendo S el área de la sección transversal del filamento.

Resistencia y ley de Ohm


Supongamos que estamos interesados en calcular la intensidad de corriente I que
circula a lo largo de una porción de cable de longitud L. Si la diferencia de potencial
entre los extremos A y B del cable es V = VA − VB (ver la figura 7.3), y el cable es
homogéneo, el campo eléctrico a lo largo de este cable se puede considerar uniforme, de
Ley de Ohm 87

A B A B
Figura 7.4. Representación esquemática de un cable de resistencia nula y de una resistencia.

valor E = V /L, y dirigido desde el punto de mayor potencial A al de menor potencial


B. Por tanto, la ecuación (7.11) queda

V
I= , (7.12)
R

y la corriente va desde A hacia B. La cantidad R, definida como

L
R = ρe , (7.13)
S

se llama resistencia del trozo de cable conductor de longitud L y sección S. La unidad


de resistencia es 1 Ω. La ecuación (7.12) relaciona la intensidad de corriente a lo largo
de un cable conductor con la diferencia de potencial entre los extremos del cable.
La resistencia de un conductor es la oposición al paso de la corriente a través de su
interior, ya que para una misma diferencia de potencial, si R aumenta, la corriente
disminuye. Es lógico que la resistencia aumente con la longitud del cable y disminuya
con su grosor, como sucede con el paso del agua a través de una tuberı́a.
Cuando la carga eléctrica fluye a través de un cable metálico, sufre colisiones
con la red cristalina del metal comos hemos visto. Cada colisión tiene por efecto una
transferencia de energı́a cinética a la estructura del metal, y esto provoca que el con-
ductor se caliente cuando la carga fluye a través de él. El conjunto de estas colisiones
da lugar macroscópicamente a la resistencia R. Por ello, cuanto más largo y estrecho
sea el cable, mayor número de colisiones habrá y mayor resistencia, como muestra la
expresión (7.13). Si no existiesen estas colisiones, ocurrirı́a que una vez producida una
corriente en un anillo metálico, ésta durarı́a por siempre sin necesidad de mantener
una diferencia de potencial. Esto no es posible en la mayorı́a de materiales, aunque
ocurra en el caso de los llamados superconductores.
Cuando R no depende de la diferencia de potencial aplicada, o de la corriente que
circula por el material, se dice que éste es un material óhmico y que cumple la ley de
Ohm (7.12). En los circuitos, los cables conductores siguen la ley de Ohm, y también
lo hacen otros dispositivos a los que llamamos resistencias. Hay otros dispositivos que
cumplen relaciones I-V diferentes, como los condensadores, las bobinas, los diodos y
los transistores.
El valor de las resistencias en los circuitos son muy diferentes. Por ejemplo,
los cables conductores tı́picos suelen tener resistencias muy pequeñas (del orden de
10−2 Ω por cada metro de cable), de tal modo que se suelen despreciar. De manera
simbólica, un cable conductor con resistencia despreciable se dibuja como una lı́nea
recta. Las resistencias que se usan para limitar la corriente a través del circuito o
producir luz o calor (filamentos de bombilla, tostadoras, etc), suelen tener valores de
R no despreciables y se simbolizan mediante una lı́nea en zig-zag. Estos sı́mbolos se
han dibujado en la figura 7.4.
88 Corriente eléctrica

7.3. Fuerza electromotriz


Consideremos ahora cómo es posible fı́sicamente mantener una corriente eléctrica. Ya
hemos comentado que necesitamos, en primer lugar, establecer un camino cerrado
formado por cables conductores y dispositivos que permiten el paso de la corriente
a través de su interior. Este camino cerrado se llama circuito. En segundo lugar,
necesitamos un campo eléctrico a lo largo del circuito que mueva las cargas libres para
que exista flujo. Vamos a analizar ahora cuál es la naturaleza del campo eléctrico que
realiza esta función y de dónde proviene.
Volvamos al caso del cable conductor de la figura 7.3. Entre los extremos del
cable existe una diferencia de potencial V = VA − VB , de modo que hay un campo
electrostático E0 = V /L a lo largo del interior del cable, dirigido desde el punto A
hacia el punto B. Una carga positiva q, inicialmente situada en el extremo A del
conductor, sentirá entonces una fuerza electrostática qE0 hacia el extremo B, de
manera que se moverá hacia este extremo, produciéndose la corriente eléctrica.
El trabajo por unidad de carga realizado por el campo electrostático E0 para
mover cargas positivas desde A hacia B es igual a la diferencia de potencial VB − VA
cambiada de signo (recordar la definición de diferencia de potencial electrostático en
el capı́tulo 4), es decir,
Z B
WAB
= E0 · dr = V = IR, (7.14)
q A

donde se ha usado la ley de Ohm (7.12). En consecuencia, el trabajo del campo


electrostático E0 permite una corriente eléctrica en el cable.
Pero un circuito es un camino cerrado. Esto implica que, para mantener una
corriente en un circuito completo, hace falta que exista un campo eléctrico E en el
circuito tal que su trabajo por unidad de carga a lo largo de la trayectoria cerrada C
del circuito no sea cero, esto es
WC
6= 0. (7.15)
q
En esta expresión, el subı́ndice simplemente indica que la trayectoria es un circuito
cerrado. Es fácil ver que esta condición no la puede cumplir un campo electrostático
como E0 que aparece cuando hay una diferencia de potencial entre los extremos de un
cable. La razón de esto es que todo campo electrostático es conservativo, de manera
que su trabajo sólo depende de los puntos inicial y final. Si ambos puntos son el mismo,
como ocurre en un circuito cerrado, entonces el trabajo es nulo. Como consecuencia,
un campo electrostático no puede mantener una corriente en un circuito.
Por tanto, a menos que se suministre a un circuito una energı́a que no provenga de
un campo eléctrico conservativo, no podrá haber corriente en ese circuito. Los dispo-
sitivos que proporcionan energı́a al circuito se llaman fuentes de fuerza electromotriz,
fuentes de voltaje o generadores eléctricos).
Se define la fuerza electromotriz (fem) E como el trabajo por unidad de carga
que realiza un campo eléctrico E a lo largo de una trayectoria cerrada. La ecuación
(7.15) que indica la condición para que haya corriente en un circuito se puede escribir
en función de la fuerza electromotriz como
WC
E= 6= 0. (7.16)
q
Fuerza electromotriz 89

E0
+ A + A
E0 E’ E0 I E0 E’
− B − B

E0
Figura 7.5. Esquema de una fuente de fem conectada a un circuito. El campo no conser-
vativo E′ proporcionado por la fuente permite el establecimiento de corriente a lo largo del
circuito al ser capaz de llevar cargas positivas desde el terminal negativo al terminal positivo
de la fuente en contra del campo conservativo E0 .

La unidad de fuerza electromotriz es la misma que la de potencial, es decir 1 V,


pero no es estrictamente una diferencia de potencial electrostática pues, como ya
hemos demostrado, el campo eléctrico que la proporciona no puede ser un campo
conservativo. Este campo eléctrico no conservativo está creado por la fuente de fem
que conectemos al circuito.

Fuentes de fuerza electromotriz


Un esquema del funcionamiento de una fuente de fem se ve en la figura 7.5. Si la fuente
no está conectada a un circuito externo, tiene cierta carga positiva en su terminal
positivo A y cierta carga negativa en el terminal opuesto B. Como consecuencia, existe
una diferencia de potencial V (A) − V (B), que supondremos constante, entre ambos
terminales. Obviamente, esto implica que aparece un campo eléctrico conservativo E0
dirigido desde el terminal positivo al terminal negativo de la fuente.
Este campo eléctrico conservativo podrı́a mover carga negativa del interior de
la fuente hacia el terminal positivo y carga positiva hacia el terminal negativo, en
un proceso que descargarı́a los terminales. Para evitarlo, la fuente ha de realizar un
trabajo por unidad de carga contra el campo conservativo E0 , que podemos describir
en términos de un campo no conservativo E′ , de sentido opuesto a E0 , y que aparece
sólo en el interior de la fuente de fem. Dado que la fuente no está conectada a un
circuito, en su interior ha de ser precisamente E′ = −E0 .
Cuando conectamos la fuente de fem a un circuito a través de cables conductores,
la diferencia de potencial V (A) − V (B) entre los terminales de la fuente provoca que
se genere una corriente eléctrica I en el circuito externo, desde el terminal positivo
A hacia el terminal negativo B. El campo electrostático E0 determinado por esta
diferencia de potencial se puede considerar uniforme en todo el circuito.
Una carga positiva q que llega al terminal B de la fuente desde el terminal A
a través del circuito externo reduce su potencial en una cantidad V (A) − V (B), de
manera que la fuente tendrá que hacer un trabajo extra por unidad de carga igual
a esta cantidad para que esta carga vuelva al terminal positivo por su interior y
mantener ası́ la corriente a lo largo del circuito externo. En el interior de la fuente la
90 Corriente eléctrica

corriente va desde el terminal negativo al terminal positivo.


En consecuencia, cuando la fuente está conectada a un circuito y fluye corriente,
el campo no conservativo E′ en su interior ha de ser mayor (o igual, en el caso ideal)
que el campo conservativo E0 . Teniendo en cuenta que el campo conservativo hace
trabajo nulo a lo largo del circuito completo, la fuerza electromotriz proporcionada
al circuito es I Z A
E= (E0 + E′ ) · dr = E′ · dr, (7.17)
C B
que es claramente no nula. De este modo, hemos resuelto el problema de generar
corriente en un circuito cerrado mediante la introducción de un campo no conservativo
E′ en el interior de la fuente de fem. Mientras, en el resto del circuito se tiene un campo
electrostático E0 determinado por la diferencia de potencial entre los terminales de
la fuente.
En una fuente de fem ideal, E′ = −E0 en el interior de la fuente independien-
temente de la corriente que circule por el exterior. Por tanto, la fuerza electromotriz
E resulta igual a la diferencia de potencial V (A) − V (B) entre los terminales de la
fuente, pues
Z A Z A
E= E′ · dr = − E0 · dr = V (A) − V (B). (7.18)
B B
Sin embargo una fuente real ha de realizar un trabajo mayor para mover las cargas
positivas hacia el terminal positivo por el interior, de tal modo que E > V (A) − V (B).
En teorı́a de circuitos, se modela el comportamiento real de la fuente mediante una
resistencia interna.
Existen muchos dispositivos capaces de funcionar como fuentes de fem en la
práctica, como las baterı́as y pilas, que funcionan en base a ciertas reacciones quı́micas,
las células solares, que usan radiación, o los generadores eléctricos de corriente alterna,
que aprovechan el fenómeno de inducción magnética.
La baterı́a es un conjunto de células quı́micas. Cada una de ellas consta de dos
electrodos metálicos, llamados terminales, sumergidos en una solución conductora lla-
mada electrolito. Las reacciones quı́micas entre los conductores y el electrolito cargan
positivamente uno de los terminales de la baterı́a y negativamente el otro. Si se co-
nectan los terminales mediante un cable conductor externo, existirá una diferencia de
potencial que permitirá la corriente eléctrica a lo largo del cable. Como consecuencia,
se dice que una baterı́a transforma un trabajo quı́mico (el realizado por las reaccio-
nes entre el electrolito y los terminales) en energı́a eléctrica (la acumulada por los
terminales cargados, que están a diferente potencial). Representaremos todo disposi-
tivo que, como una baterı́a, es capaz de generar una diferencia de potencial constante
mediante los sı́mbolos que pueden verse en la figura 7.6.

7.4. Potencia en los circuitos eléctricos


Una fuente de fem realiza un trabajo (quı́mico, mecánico, etc) para mantener sus
terminales a una diferencia de potencial dada. Cuando se conecta la fuente a un
circuito, se origina una corriente eléctrica, de tal manera que la energı́a potencial de
una carga positiva situada en el terminal positivo, debida a la diferencia de potencial
entre los terminales de la fuente, se convierte en energı́a cinética cuando la carga se
mueve a lo largo del circuito.
Potencia en los circuitos eléctricos 91

+
+

-
Figura 7.6. Representación esquemática de una fuente de voltaje. El signo negativo indica
la fuente de electrones, y el positivo el destino.

Potencia suministrada por una fuente de fem


Calculemos ahora cuánta energı́a por unidad de tiempo proporciona una fuente a
un circuito. Para ello, consideremos una carga positiva de valor infinitesimal dq. El
trabajo infinitesimal que realiza la fuente para que esta carga dé una vuelta completa
al circuito es igual a la fuerza electromotriz de la fuente multiplicada por la carga,

dW = dq E. (7.19)

Este trabajo es energı́a eléctrica suministrada al circuito. Dado que la carga dq forma
parte de la corriente I que circula por el circuito, tenemos que dq = Idt, según la
ecuación (7.10). De esta manera,

dW = IEdt. (7.20)

El trabajo por unidad de tiempo es la potencia PE suministrada por la fuente al


circuito, que podemos escribir

dW
PE = = IE. (7.21)
dt
La unidad de potencia es el vatio (W), que cumple 1 W = 1 A · V.

Potencia disipada en un conductor


El establecimiento de una corriente en un conductor trae consigo un proceso de pérdida
de energı́a cinética de las cargas debido a las colisiones con átomos de la red del metal.
La energı́a perdida por estas cargas es ganada por los átomos de la red, acumulándose
en forma de energı́a interna del conductor. Esto hace que el metal se caliente cuando
la corriente circula por él. El incremento de energı́a interna del cable se llama calor
Joule y es igual a la disipación de energı́a cinética de las cargas que circulan a través
del cable.
Consideremos de nuevo el cable conductor rectilı́neo de la figura 7.3, en cuyos
extremos se ha aplicado una diferencia de potencial V = V (A) − V (B), de manera
que hay un campo electrostático E0 = V /L dirigido desde A hacia B. El trabajo que
realiza este campo electrostático para mover una carga positiva infinitesimal dq desde
A hasta B es ZB
dW = dq E0 · dr = dq[V (A) − V (B)] = dq V. (7.22)
A
92 Corriente eléctrica

Este trabajo se transforma en energı́a cinética de la carga dq que a su vez pasa a


formar parte de la energı́a interna del cable. Dado que podemos escribir dq = Idt, la
potencia disipada por las cargas en movimiento resulta

dW
Pdis = = IV. (7.23)
dt
Si el cable tiene una resistencia R, podemos escribir la ecuación (7.23) de otra manera
usando la ley de Ohm V = IR. Ası́, se obtiene que la potencia disipada por una
resistencia en un circuito es
V2
PR = RI 2 = . (7.24)
R
Esta potencia es la que da lugar al calor que desprenden una tostadora, una plancha,
un radiador o el filamento de una bombilla cuando pasa corriente. Obviamente, si
se considera despreciable la resistencia del cable, también se está despreciando la
potencia que disipa.
Lo dicho para el cable vale también para cualquier dispositivo del circuito, de
manera que la ecuación (7.23) expresa la disipación de energı́a por unidad de tiempo
de un dispositivo de un circuito (excepto la fuente de fem, claro está, que no disipa sino
suministra energı́a), con una diferencia de potencial V entre sus terminales, cuando lo
atraviesa una corriente I. Toda la potencia PE que suministra la fuente a un circuito
se disipa en sus componentes. Por ejemplo, si el circuito consta de dos resistencias R1
y R2 , se ha de cumplir que

PE = Pdis = PR1 + PR2 . (7.25)

7.5. Ejercicios
1. Consideremos un cable de cobre tı́pico de un circuito, con una sección de 0,8 mm
de radio, una densidad de 8,9 g · cm−3 y una masa molar de 63,5 g · mol−1 . Si
se supone que hay un electrón libre por cada átomo de Cobre y la velocidad
de arrastre de los electrones es de 4,1 × 10−5 m · s−1 , determinar la intensidad
de corriente que atraviesa el cable. Dato: el número de átomos por cada mol de
Cobre es 6,02 × 1023 .
Solución: I = 1,1 A.
2. Si el cable del ejercicio anterior tiene una longitud de 10 cm y la resistividad del
Cobre es de 1,72 × 10−8 Ω · m, calcular su resistencia, la diferencia de potencial
entre sus extremos para conducir esa corriente y el campo eléctrico en el interior
del cable.
Solución: R = 8,6 × 10−4 Ω, V = 9,5 × 10−4 V, E = 9,5 × 10−3 V · m−1 .
3. Una resistencia en un circuito tiene una resistividad de 6,8 × 10−5 Ω · m a 270 K, y
8,2 × 10−5 Ω · m a 370 K. Calcular el coeficiente de temperatura de la resistividad
del material.
Solución: α = 2 × 10−3 K−1 .
4. Un trozo de material conductor en forma de cilindro tiene radio r y longitud L. Se
estira hasta doblar su longitud manteniendo constante su volumen. Determinar
cómo cambia su resistencia.
Solución: Se multiplica por 4.
Ejercicios 93

5. Consideremos el campo eléctrico E = 2×103 V·m−1 i−4×103 V·m−1 j y la curva


cerrada C formada por el perı́metro de un cuadrado de 10 cm de lado, con centro
en el origen y lados paralelos a los ejes x e y, respectivamente con orientación
antihoraria. Calcular el trabajo de esta campo para mover una carga q = 10−3 C
a lo largo de cada lado de C, y la fem total.
Solución: A lo largo de los lados paralelos al eje x, el trabajo es de 0, 2 J y −0, 2 J,
respectivamente. A lo largo de los lados paralelos al eje y, el trabajo es de −0, 4 J
y 0, 4 J, respectivamente. La fem es cero porque el campo es estático.
6. En una calculadora, una pila de 1,5 V produce una corriente de 0,17 mA que
alimenta la calculadora. Determinar la potencia suministrada por la pila y la
energı́a suministrada a la calculadora en 1 hora.
Solución: P = 0,26 mW, U = 0,92 J.
Capı́tulo 8

Magnetismo

8.1. Fuerza magnética


Se observa en la naturaleza que hay ciertos materiales que actúan como imanes. Inicial-
mente, se pensaba que el magnetismo era totalmente independiente de la electricidad.
En este contexto se estudiaron ciertas aplicaciones de los materiales magnéticos, como
las brújulas. Pero esta idea cambió cuando Oersted observó en 1819 que una corriente
eléctrica ejerce una fuerza sobre una brújula y, sobre todo, cuando Ampère descu-
brió que una corriente eléctrica ejerce una fuerza sobre otra y obtuvo una expresión
para describir esa fuerza.
La aguja de una brújula, colocada sobre una superficie horizontal, gira hasta que
una de sus puntas indica el Norte geográfico. El extremo de la aguja que apunta al
Norte se llama polo norte magnético y el otro extremo se llama polo sur magnético.
La brújula es un ejemplo de imán permanente y nos servirá para introducir algunos
de los conceptos básicos sobre magnetismo.
Experimentalmente se observa que los imanes interaccionan entre ellos de tal
manera que los polos del mismo signo se repelen y los polos de signo opuesto se atraen,
al igual que las cargas eléctricas. Existe, sin embargo, una diferencia fundamental entre
imanes y cargas eléctricas: no se han observado nunca monopolos magnéticos, que son
los equivalentes magnéticos a las cargas eléctricas aisladas.
La interacción entre imanes sugiere que, alrededor de ellos, existen campos magné-
ticos que afectan al espacio que los rodea, del mismo modo que alrededor de las
cargas hay campos eléctricos creados por ellas. Estos campos magnéticos son campos
vectoriales que interaccionan con otros imanes haciendo que roten o se muevan. Por
ejemplo, el campo magnético de la Tierra afecta a las agujas de los imanes, haciendo
que roten hasta que su polo norte indica el Norte geográfico, que es, a su vez, polo
sur magnético de la Tierra.

Lı́neas de campo magnético


Para conocer cómo es el campo magnético que crea un imán permanente, una técnica
sencilla consiste en pintar sus lı́neas de campo magnético. Estas lı́neas son, por analogı́a
con las lı́neas de campo eléctrico, tangentes en cada punto al vector campo magnético.
En la figura 8.1 se han dibujado algunas lı́neas del campo magnético creado por
una barra de imán, y también las correspondientes a un imán en forma de U. En ambos

95
96 Magnetismo

N S
N S

Figura 8.1. Diagrama de las lı́neas de campo magnético de una barra de imán y de un
imán en forma de U. Son lı́neas que se cierran por el interior del material. Por el exterior,
sus fuentes son los polos norte y sus sumideros son los polos sur de cada imán.

casos pueden observarse ciertas caracterı́sticas esenciales de las lı́neas magnéticas. La


primera de estas caracterı́sticas es que, en el espacio que rodea a los imanes, los polos
norte del imán actúan como fuentes de campo, mientras que los polos sur actúan
como sumideros de campo. Es decir, los polos norte son al campo magnético lo que
las cargas positivas al campo eléctrico, y los polos sur juegan en magnetismo el mismo
papel que las cargas negativas en electricidad.
Una segunda propiedad de las lı́neas magnéticas se deriva del hecho de la im-
posibilidad de aislar un monopolo magnético: por el interior de un imán, las lı́neas
magnéticas se cierran desde el polo sur al polo norte. En consecuencia, las lı́neas
magéticas son cerradas y no tienen por fuente o sumidero el infinito.

Fuerza magnética sobre una carga eléctrica


Escribiremos el campo magnético creado por determinada fuente, como un imán,
mediante la notación B. Supongamos que en determinada región del espacio se ha
creado un campo magnético. Estamos interesados en conocer qué efecto tiene este
campo magnético en el movimiento de una carga de prueba q que se encuentra en esa
región. Este efecto viene descrito como una fuerza sobre la carga de prueba.
Los experimentos indican que, cuando una carga de prueba q, con velocidad v,
se sitúa en el seno de un campo magnético B, sufre una fuerza magnética Fm dada
por la expresión
Fm = q v × B. (8.1)
De esta ecuación se puede extraer que la unidad SI de campo magnético es el tesla
(T), definido de tal modo que 1 T = 1 kg · s−1 · C−1 . Esta fuerza magnética tiene
ciertas similitudes con la fuerza que ejerce un campo eléctrico E sobre una carga de
prueba q, dada por Fe = qE. Las similitudes son que, en ambos casos, la fuerza es
proporcional a la carga de prueba y al módulo del campo que la afecta.
Sin embargo, existen dos diferencias básicas entre la fuerza eléctrica y la fuerza
magnética. La primera de ellas es que la fuerza eléctrica es paralela al campo eléctrico,
mientras que la fuerza magnética es perpendicular al campo magnético, debido a la
aparición del producto vectorial × en su definición. En la figura 8.2 se han dibujado
los vectores velocidad, campo magnético y fuerza magnética en una carga q. La fuerza
magnética es un vector perpendicular al plano formado por los vectores v y B, y su
Carga de prueba en un campo magnético uniforme 97

Fm B
α
q
v
Figura 8.2. Fuerza magnética sobre una carga en movimiento. En este ejemplo, la carga es
positiva.

sentido es el dado por las reglas del producto vectorial. Por ejemplo, usando la regla
del triedro en la mano derecha, si se coloca el dedo ı́ndice a lo largo del vector v y el
dedo corazón a lo largo del vector B, el pulgar estará colocado a lo largo del vector
Fm si la carga es positiva, y en sentido opuesto si la carga es negativa.
La segunda diferencia entre la fuerza eléctrica y la fuerza magnética sobre una
carga de prueba es que, en el último caso, la fuerza depende de la velocidad de la
carga. El módulo de la fuerza magnética sobre la carga viene dado por la expresión

Fm = |q|vB sen α, (8.2)

donde |q| es el valor absoluto de la carga, v es el módulo de la velocidad de la carga, B


es el módulo del campo magnético y α es el ángulo que forman los vectores velocidad
v y campo magnético B. De aquı́ es fácil ver que, a diferencia de la fuerza eléctrica,
para que exista fuerza magnética sobre una carga, es necesario que la carga esté en
movimiento y además que la dirección de la velocidad no sea paralela a la dirección
del campo magnético.

8.2. Carga de prueba en un campo magnético uniforme


Como vimos en el apartado 4.3, cuando una carga de prueba q positiva, de masa m,
entra en la región entre las placas de un condensador, donde hay un campo eléctri-
co E uniforme, la carga adquiere una aceleración a = (q/m) E paralela al campo
eléctrico, de modo que efectúa un movimiento parabólico en el plano que forman los
vectores velocidad inicial v0 y campo eléctrico E, curvándose hacia la placa negativa
del condensador. La situación se ha dibujado en la figura 8.3(a).
El caso magnético análogo es el de una carga positiva q, de masa m, que entra con
velocidad inicial v0 en la región entre los polos norte y sur de un imán en U. El campo
magnético B del imán se considera uniforme y se dirige desde el polo norte hacia el
polo sur, según la figura 8.3(b). La velocidad inicial de la carga es perpendicular al
campo magnético. Su aceleración en cada punto del espacio entre los polos del imán
satisface la ecuación
q
a = v × B. (8.3)
m
En consecuencia, la carga se desvı́a inicialmente a lo largo de la dirección perpendi-
cular a la velocidad inicial y al campo magnético.
Es útil en estas situaciones dibujar el campo magnético perpendicular al papel.
Un campo magnético dirigido hacia fuera del papel se expresa con puntos, y un campo
98 Magnetismo

E B

(a) (b)
Figura 8.3. (a) Una carga positiva entra entre las placas de un condensador y se acelera
hacia la placa negativa. (b) Una carga positiva entra entre los polos norte y sur de un
imán en U, de tal manera que la velocidad inicial es perpendicular al campo magnético. Su
velocidad no cambia en módulo, pero la trayectoria de la carga se curva ortogonalmente al
plano formado por la velocidad inicial y el campo magnético.

dirigido hacia el papel se expresa con cruces. Ası́ se ha hecho en la figura 8.4, que
significa exactamente lo mismo que la figura 8.3(b) pero desde un punto de vista
diferente. Se observa cómo la carga se desvı́a en la dirección del plano ortogonal al
campo magnético. Dado que la aceleración es, en cada punto, ortogonal al campo, si
la carga no abandona la región donde hay campo esta desviación se mantendrá en
cada punto. Si el campo magnético es uniforme, la carga queda entonces confinada en
esta región realizando un movimiento circular.
Para comprobar esa afirmación es útil calcular el trabajo realizado por la fuerza
magnética sobre la carga. Dado que la fuerza magnética es Fm = q v × B, el trabajo
está dado por
Z
Wm = q (v × B) · dr = 0. (8.4)

Para notar que este trabajo es nulo, basta recordar que los vectores desplazamiento
infinitesimal dr y velocidad v son paralelos, de manera que el producto escalar de

Figura 8.4. La misma situación de la figura 8.3(b). En este caso, estamos mirando desde
el polo norte del imán hacia el polo sur. Las cruces indican que el campo magnético apunta
hacia dentro del papel. La trayectoria de la carga positiva se observa ahora con más claridad.
Carga de prueba en un campo magnético uniforme 99

la ecuación (8.4) es cero. Dado que el trabajo es igual a la variación de la energı́a


cinética de la carga, resulta que

1 
Wm = m v 2 − v02 = 0, (8.5)
2
de manera que el módulo de la velocidad de la carga no cambia.
Como vimos al analizar las componentes intrı́nsecas de la aceleración en el capı́tu-
lo 1, el hecho de que el módulo de la velocidad no cambie indica que la aceleración
tangencial de la partı́cula es nula. Sin embargo, puede haber aceleración normal, que
se encarga de los cambios en la dirección y el sentido del vector velocidad. La acele-
ración normal es siempre perpendicular a la trayectoria y está dada por la expresión

v02
aN = , (8.6)
r

donde v0 es el módulo de la velocidad (que no cambia si no hay aceleración tangencial)


y r es el radio de curvatura de la trayectoria en el punto dado.
En el caso que estamos analizando de una carga de prueba que entra con velocidad
inicial v0 en una región con un campo magnético uniforme ortogonal a la velocidad, el
módulo de la aceleración de la carga ha de ser igual a la aceleración normal. Calculando
el módulo en la ecuación (8.3),
qv0 B
aN = . (8.7)
m
Dado que aN es una constante cuando B es uniforme, el radio de curvatura r de la
trayectoria de la carga permanece constante, de manera que la trayectoria es circular.
El radio r de la trayectoria circular se puede obtener igualando las expresiones (8.6)
y (8.7), de donde
mv0
r= . (8.8)
qB
El periodo T del movimiento, que es el tiempo que tarda la carga en realizar una
vuelta completa, también puede calcularse a partir de su expresión T = 2πr/v para
un movimiento circular uniforme. Usando la ecuación (8.8),

2πr 2πm
T = = . (8.9)
v0 qB

Este periodo se conoce con el nombre de periodo de ciclotrón. Es interesante notar


que no depende de la velocidad de la carga, lo cual permite caracterizar algunas pro-
piedades de las partı́culas subatómicas en las cámaras de niebla. En particular, un
experimento de este tipo condujo a Carl Anderson, en 1932, al descubrimiento del
positrón como una de las partı́culas que bombardean la Tierra en forma de rayos
cósmicos provenientes del espacio exterior. El positrón es una partı́cula idéntica al
electrón pero de carga positiva. Su existencia habı́a sido anteriormente predicha por
Paul Dirac en su ecuación para el comportamiento cuántico relativista de los electro-
nes. El descubrimiento de Anderson supuso el espaldarazo definitivo a la ecuación de
Dirac y, en general, al desarrollo de las llamadas teorı́as cuánticas de campos.
100 Magnetismo

Figura 8.5. Una carga positiva sigue una trayectoria helicoidal en un campo magnético
uniforme si la velocidad inicial de la carga no es ortogonal al campo magnético.

Carga en un campo magnético no transversal

El caso que hemos estudiado, en que la carga realiza un movimiento circular, ocurre
cuando (i) la velocidad inicial de la carga es ortogonal al campo magnético, y (ii)
el campo magnético es uniforme. Si alguna de estas condiciones no se cumple, el
movimiento de la carga no es, en general, circular.
Por ejemplo, si la velocidad inicial no es ortogonal al campo magnético pero éste
es uniforme, podemos descomponer su velocidad en dos componentes, una de ellas
paralela al campo magnético y la otra perpendicular. En la dirección perpendicular al
campo magnético, el movimiento es circular, con un radio dado por la ecuación (8.8).
Sin embargo, en la dirección paralela al campo magnético la aceleración es nula, como
se desprende de la ecuación (8.3), y tenemos un movimiento rectilı́neo uniforme. La
composición de un movimiento circular uniforme en el plano perpendicular al campo
magnético más un movimiento rectilı́neo uniforme en la dirección paralela al campo
magnético es un movimiento helicoidal, como vemos en la figura 8.5.
Cuando el campo magnético no es uniforme, la ecuación (8.8) indica que el movi-
miento de una carga perpendicular al campo no es circular, pues el radio de curvatura
de la trayectoria decrece al aumentar el valor del campo. Por ejemplo, en la figura

Figura 8.6. Una carga positiva entra en una región donde hay un campo magnético con
una velocidad inicial que no es ortogonal al campo. La intensidad del campo aumenta hacia
la derecha, de tal modo que la trayectoria helicoidal de la carga va disminuyendo su radio.
Fuerza magnética sobre una corriente eléctrica 101

8.6, vemos una carga positiva que entra en una región en la que el campo magnético
va aumentando a medida que la carga avanza en movimiento helicoidal. Por tanto, el
radio de la trayectoria de la carga va disminuyendo progresivamente.

8.3. Fuerza magnética sobre una corriente eléctrica


Consideremos ahora el caso del efecto de un campo magnético sobre una corriente
eléctrica. Cuando una corriente I circula por un alambre conductor en el seno de un
campo magnético B, la fuerza magnética sobre la corriente es la suma de las fuerzas
sobre cada una de las cargas que producen la corriente al moverse.
Consideremos un segmento infinitesimal de cable conductor de longitud dℓ, que
podemos aproximar por un segmento recto de sección S uniforme, como en la figura
8.7. Supongamos que este cable transporta una corriente I y que se encuentra situado
en una región en la que hay un campo magnético externo B.
Desde un punto de vista macroscópico, y recordando las caracterı́sticas promedio
del movimiento de cargas en el interior de un cable conductor, que vimos en el capı́tulo
7, se puede asumir que las cargas libres que dan lugar a la corriente eléctrica son
electrones de carga −e que se mueve por el interior del cable con una velocidad va
igual a la velocidad de arrastre de los electrones en el cable. Por la ecuación (7.5),
esta velocidad se relaciona con la densidad de corriente eléctrica j mediante
1
va = − j, (8.10)
ene
donde ne es el número de electrones libres por unidad de volumen en el cable. La carga
total dQ que se mueve a la velocidad de arrastre en el interior del cable conductor se
puede escribir como la carga −e de un electrón multiplicada por el número ne Sdℓ de
electrones libres en el interior del cable,

dQ = −ene Sdℓ. (8.11)

Por tanto, la fuerza magética sobre esta carga dQ que se mueve a velocidad va en
presencia de un campo magnético B resulta

dFm = −ene Sdℓ va × B = Sdℓ j × B, (8.12)

donde se ha usado la relación (8.10). Esta expresión nos da el resultado que buscába-
mos para la fuerza magnética sobre un elemento de corriente de longitud infinitesimal
dℓ.
Si consideramos ahora un cable conductor de longitud finita L y sección uniforme
S que transporta una corriente de densidad j en presencia de un campo magnético B,
la fuerza magnética total Fm es igual a la suma de las fuerzas sobre cada elemento
infinitesimal de cable, dadas cada una de ellas por una expresión como (8.12). Al ser
una suma en el continuo, la fuerza total resulta igual a la integral
Z
Fm = Sdℓ j × B, (8.13)
L

donde la integral se realiza a lo largo de la longitud L del cable.


102 Magnetismo

B dF
dl

Figura 8.7. Un segmento infinitesimal de cable conductor, de longitud dℓ y sección S,


conduce una corriente I. La fuerza magnética sobre este segmento es la suma de las fuerzas
sobre cada una de las cargas en movimiento que forman la corriente.

Para escribir la expresión (8.13) en términos de la intensidad de corriente I a lo


largo del cable, es útil definir el vector unitario uI como aquél que da la dirección y
sentido de la corriente por el interior del cable (con sentido contrario al movimiento
real de los electrones según el criterio convencional). Recordando también la relación
I = jS entre densidad de corriente j e intensidad de corriente I en un cable rectilı́neo
de sección uniforme, podemos escribir
I
j= uI , (8.14)
S
de donde se obtiene que la fuerza magnética sobre el cable es
Z
Fm = Idℓ uI × B. (8.15)
L

Fuerza magnética sobre un cable rectilı́neo


Un caso particularmente sencillo de la expresión (8.15) ocurre cuando tenemos un
filamento rectilı́neo, de longitud L y sección uniforme, que transporta una corriente I
en el seno de un campo magnético B uniforme. En este caso, el cálculo de la integral
(8.15) es directo porque los factores que aparecen en el integrando se pueden tomar
como constantes.
Se tiene el mismo uI para todos los puntos del cable por ser éste recto, de manera
que es una constante. Como el campo magnético B también tiene el mismo valor en
todos los puntos del cable (es uniforme), se puede escribir
Z
Fm = IuI × B dℓ. (8.16)
L

La integral del elemento de longitud a lo largo del cable es, obviamente, la longitud
L total del cable. Se llega entonces a la expresión

Fm = ILuI × B. (8.17)

La fuerza magnética sobre una corriente rectilı́nea debida a un campo uniforme es


ortogonal al plano formado por la corriente y el campo magnético.
Momento de torsión magnético sobre una espira 103

_ +
_ E +
_ +
_ I +
B

Figura 8.8. La fuerza magnética sobre una corriente en una placa metálica produce una
diferencia de potencial entre bordes opuestos de la placa según el efecto Hall.

Efecto Hall
Una aplicación sencilla e interesante de la fuerza magnética sobre una corriente es el
llamado efecto Hall, según el cual cuando una placa metálica por la que circula una
corriente I se coloca en un campo magnético transversal, aparece una diferencia de
potencial entre bordes opuestos de la placa.
La situación es la de la figura 8.8. En ella tenemos un campo magnético uniforme
B perpendicular a una placa metálica que está situada en el plano del papel. En la
placa metálica hay una corriente eléctrica uniforme I dirigida hacia arriba, de tal
modo que los electrones libres se mueven con velocidad va en sentido opuesto.
El campo magnético produce, sobre cada electrón, una fuerza magnética dirigida
hacia el borde izquierdo de la placa. Esto implica que existirá una deriva de electrones
libres hacia ese borde, que queda cargado negativamente, mientras el borde derecho
queda cargado positivamente. El campo eléctrico E creado por esta distribución de
carga en los bordes de la placa va creciendo a medida que más electrones se dirigen
hacia el borde izquierdo, llegando un momento en que la fuerza eléctrica Fe = eE
sobre un electrón libre equilibra a la fuerza magnética Fm = eva B, y se alcanza el
equilibrio. En el equilibrio, tenemos una diferencia de potencial entre bordes opuestos
de la placa, de tal modo que el borde derecho está a mayor potencial que el borde
izquierdo. Éste es el llamado efecto Hall normal o negativo, que se observa en la
mayorı́a de los metales, como el oro, la plata, el cobre, etc.
Existen, sin embargo, ciertos metales, como cinc y cobalto, y materiales como los
semiconductores, en los que se produce un efecto Hall opuesto o positivo, debido a
que, en ellos, los portadores de corriente son cargas positivas (realmente, son huecos
dejados por electrones que faltan en la estructura atómica). En este caso, la velocidad
de los portadores positivos tiene el mismo sentido que la corriente eléctrica, de tal
modo que la fuerza magnética sobre cada uno de ellos los mueve hacia el borde
izquierdo de la placa, dejando el borde derecho cargado negativamente. Se produce
la misma diferencia de potencial que en el caso anterior, pero esta vez el borde de
mayor potencial es el borde izquierdo. En consecuencia, el efecto Hall permite conocer
qué tipos de portadores de corriente existen en un material conductor.

8.4. Momento de torsión magnético sobre una espira


Una espira de corriente es un cable conductor cerrado sobre sı́ mismo. En la figura 8.9
podemos observar una espira cuadrada de lado L formada por un cable arrollado en
N vueltas. Coloquemos esta espira en el seno de un campo magnético uniforme B.
104 Magnetismo
z
F1 3
y

1
2 B

I F2
x 4

Figura 8.9. Una espira cuadrada de corriente en presencia de un campo magnético uniforme
no sufre fuerza magnética neta.

La fuerza magnética Fm sobre la espira de N vueltas es


Fm = N F, (8.18)
donde F es la fuerza magnética sobre 1 vuelta de la espira. Dado que es una espira
cuadrada, formada por cuatro cables rectos, y el campo magnético es uniforme, po-
demos utilizar la expresión (8.17) para calcular la fuerza sobre 1 vuelta de la espira
sumando las fuerzas sobre cada lado. Como se ve en la figura 8.9, el campo es paralelo
a dos de los lados de la espira, de modo que la fuerza sobre ellos es cero. Resulta
entonces
Fm = N IL (u1 + u2 ) × B, (8.19)
donde u1 y u2 son los vectores unitarios que nos dan la dirección y sentido de la
corriente en los lados de la espira no paralelos al campo magnético. Estos vectores
unitarios son opuestos entre sı́, de manera que su suma es cero. En conclusión, Fm = 0
y el campo no ejerce fuerza magnética sobre la espira.
En general, un campo magnético uniforme no ejerce fuerza magnética sobre una
espira. Pero esto no significa que el campo magnético no afecte a la espira de algún
modo. Como vimos en el capı́tulo 2, cuando la fuerza total sobre un cuerpo es nula, el
centro de masas del cuerpo no tiene aceleración. Sin embargo, si las fuerzas, aunque
compensadas, se aplican en puntos diferentes del cuerpo, entonces el cuerpo puede
rotar al adquirir una aceleración angular.
La rotación plana de un cuerpo rı́gido viene descrita por la ecuación

τ ∝ , (8.20)
dt
donde τ es el momento de torsión del cuerpo con respecto al eje de rotación (que
suponemos eje principal de inercia) y ω es el vector velocidad angular. Lo que indica
la ecuación (8.20) es que, si el momento de torsión total de las fuerzas exteriores
sobre un cuerpo es no nulo, entonces el cuerpo adquirirá una aceleración angular, y
rotará con esta aceleración alrededor de un eje.
El momento de torsión de un cuerpo respecto a un eje es el vector
X
τ = ri × F i , (8.21)
donde ri es el vector de posición del punto de aplicación de la fuerza Fi con respecto
al eje y la suma se realiza sobre todas las fuerzas que actúan sobre el cuerpo. Con-
sideremos de nuevo la espira cuadrada de N vueltas y lado L por la que circula una
Momento de torsión magnético sobre una espira 105

Figura 8.10. Una espira cuadrada por la que circula una corriente tiene un momento
magnético dado por el vector m de la figura.

corriente I, según la figura 8.9. Aplicando la ecuación (8.21), el momento de torsión


total de la fuerza magnética sobre la espira con respecto a un eje perpendicular a ella
y que pasa por su centro es

τ m = N IL (r1 × u1 + r2 × u2 ) × B. (8.22)

Pero r1 es opuesto a r2 , y u1 es opuesto a u2 , de manera que esto se simplifica en


este caso, llegando a

τ m = 2N IL (r1 × u1 ) × B = N IL2 k × B. (8.23)

En conclusión, la espira comienza a girar con una aceleración angular inicial propor-
cional a la cantidad τm = N IL2 B. El eje de rotación es el eje x negativo, dado por
la dirección y sentido de τ m .

Momento magnético de una espira


La expresión (8.23) se puede escribir también como

τ m = m × B, (8.24)

donde, en el caso de la figura 8.9, el vector m tiene el valor m = N IS k, siendo


S = L2 el área de la superficie encerrada por la espira. Este vector sólo depende
de las caracterı́sticas de la espira (su corriente y su forma). Se le llama momento
magnético de la espira. La unidad de momento magnético es 1 A · m2 .
En general, para una espira plana de N vueltas que encierra una superficie de
área S, por la que circula una corriente I, su momento magnético está dado por

m = N IS n, (8.25)

siendo n un vector unitario de dirección ortogonal al plano de la espira y cuyo sen-


tido depende del sentido de la corriente en la espira. Se calcula mediante la regla
del tornillo o sacacorchos (se colocan los cuatro dedos mayores de la mano derecha
siguiendo el sentido de la corriente, y el pulgar sigue entonces el sentido de n), como
en la figura 8.10. Cuando el momento magnético de la espira no es paralelo al campo
magnético externo, la ecuación (8.24) nos dice que la espira tiene un momento de
torsión magnético no nulo. En este caso, en ella aparece una aceleración angular con
la que rota respecto a un eje dado por la dirección y sentido del momento de torsión.
106 Magnetismo

m
B
α
N

S
Figura 8.11. Una barra de imán en presencia de un campo magnético externo rota hasta
que su polo norte apunta en la dirección del campo.

Momento magnético de un imán


Los imanes permanentes también tienen un momento magnético m muy similar al
de una espira de corriente (desde el punto de vista magnético, una pequeña barra de
imán es equivalente a una espira de corriente, como veremos en el capı́tulo siguiente).
En el caso de una barra de imán como la de la figura 8.11, éste es un vector cuya
dirección es paralela al eje de la barra y que apunta desde el polo sur al polo norte del
imán. Ası́, cuando se coloca la aguja de una brújula sobre una superficie horizontal,
el campo magnético terrestre provoca un momento de la fuerza magnética sobre la
aguja que la hace girar hasta que su polo norte apunta al norte geográfico.
En un caso general de una barra de imán con momento magnético m situado en
una región en la que hay un campo magnético uniforme B, el módulo del momento
de torsión magnético es, aplicando las propiedades del producto vectorial,

τm = mB sen α, (8.26)

siendo α el ángulo formado por los vectores m y B. Cuando α no es cero, la barra


comienza a rotar con una aceleración angular proporcional a sen α tratando de colocar
su momento magnético paralelo al campo magnético externo. A medida que rota, su
aceleración angular se hace menor, hasta que se anula cuando α = 0. A partir de ese
instante, la barra seguirı́a rotando a velocidad angular constante si no fuera porque
empieza a actuar el momento de torsión en sentido opuesto. Aparece una aceleración
angular negativa que frena la barra y acaba haciéndola girar en sentido opuesto (fi-
gura 8.11). Este movimiento cı́clico se repite hasta que, finalmente, el rozamiento y
los efectos de inducción (que estudiaremos más adelante) hacen que el polo norte de
la barra se quede en reposo apuntando en el sentido del campo magnético externo B.

Motor eléctrico
Otra aplicación del efecto de rotación producido en una espira por un campo magnéti-
co es el motor eléctrico. Se llama motor eléctrico a un dispositivo capaz de transformar
energı́a eléctrica en energı́a mecánica. Por ejemplo, en un reproductor de discos, la
corriente continua generada por las pilas se transforma en energı́a mecánica capaz de
hacer girar el disco a velocidad angular constante.
Ejercicios 107

Un motor eléctrico elemental de corriente continua está formado por una espira
de N vueltas y área S recorrida por una corriente continua I que se suministra
de una fuente de fem externa. La espira gira porque se encuentra sumergida en un
campo magnético uniforme B creado por un imán. Para evitar que la espira realice
un movimiento pendular como el de una barra de imán situada en una superficie sin
rozamiento en presencia de un campo magnético, se ha de invertir el sentido de la
corriente eléctrica en la espira cada vez que ésta da media vuelta. Esto se consigue
mediante un dispositivo llamado colector, que está conectado a los terminales de la
espira. El efecto de velocidad de rotación constante en el motor se logra teniendo
varios pares de polos de imán situados simétricamente alrededor de la espira.

8.5. Ejercicios
1. Una carga puntual positiva q entra con una velocidad de 3 × 103 m · s−1 en
una región donde existe un campo eléctrico de 1, 5 × 103 V · m−1 ortogonal a la
velocidad inicial de la carga. En esa región existe también un campo magnético
uniforme B0 , ortogonal tanto al campo eléctrico como a la velocidad inicial de la
carga. Determinar el valor de B0 para que la carga no se desvı́e de su trayectoria
y salga de esta región con la misma velocidad con la que entró.
Solución: B0 = 0, 5 T.
2. Una carga puntual q = −1 nC de masa m = 0, 5mg se sitúa, inicialmente en
reposo, en una región en la que hay un campo eléctrico E = 2, 5 × 103 V · m−1
dirigido a lo largo del eje y. Determinar su aceleración a0 . En un instante dado
t = 5 ms se aplica un campo magnético uniforme B = 0, 1T a lo largo del eje z.
Determinar la aceleración de la carga a en ese instante. 
Solución: a0 = −5 × 10−3 j m · s−2 , a = 10−9 i − 5 × 10−3 j m · s−2 .
3. Un protón (de carga e = 1, 6 × 10−19 C y masa m = 1, 7 × 10−27 kg) se acelera
desde el reposo mediante una diferencia de potencial V = 1000 V. Después entra
en una región donde hay un campo magnético B = 0, 9 T perpendicular a su ve-
locidad. Calcular la velocidad del protón en esta región, el radio de su trayectoria
circular y su periodo.
Solución: v = 4, 3 × 105 m · s−1 , r = 5, 1 mm, T = 7, 4 × 10−8 s.
4. Se considera un alambre conductor que pasa por los puntos P M Q, donde P (0, 0, 0),
M (1 cm, 0, 0) y Q(1 cm, 2 cm, 0). Este alambre conduce una corriente eléctrica de
12 mA en el sentido P M Q, y está inmerso en un campo magnético uniforme
de 0, 5 T dirigido a lo largo del eje z. Determinar la fuerza magnética sobre el
alambre P M Q, y también sobre el alambre P Q que conduce la misma corriente.
Solución: Fm = 6 × 10−5 (−2i + j) N.
5. Demostrar que la fuerza que ejerce un campo magnético uniforme sobre una
espira circular de corriente es cero.
6. Calcular la fuerza que ejerce un campo magnético uniforme B dirigido a lo largo
del eje z sobre un cable de corriente en forma de semicircunferencia de radio a
y centro en el origen, situado en el plano xy y que conduce una corriente I en
sentido antihorario.
Solución: Fm = 2IaB j.
7. Una espira cuadrada de 10 vueltas y 5 cm de lado, situada en el plano xy con
centro en el origen, conduce una corriente de 2 mA en sentido horario. Determinar
108 Magnetismo

su momento magnético.
Solución: m = −5 × 10−5 A · m2 k.
8. La espira del ejercicio anterior está sumergida en un campo magnético uniforme
B = 0, 2 T dirigido a lo largo del eje y negativo. Calcular el momento de torsión
sobre la espira y describir cómo rotará ésta.
Solución: τ = −10−5 N · m i.
9. El momento magnético de una espira circular de 2 vueltas y 1 cm de radio es
m = 6, 3 × 10−7 (i + j) A · m2 . Esta espira está inmersa en un campo magnético
de 0, 5 T dirigido a lo largo del eje z. Calcular la corriente eléctrica sobre la espira
y determinar el momento de torsión magnético sobre ésta.
Solución: I = 1,4 mA, τ = 3, 2 × 10−7 (i − j) N · m.
10. Un cable circular de radio R y masa m, transporta una corriente I. Se encuen-
tra levitando en posición horizontal sobre un solenoide como se mues tra en la
figura 8.12. ¿Cuál será el valor del módulo del campo magnético B que crea el
solenoide en el cable?
Solución: B = mg/(2πRIcosθ).

B
I
B

R θ

Figura 8.12.
Capı́tulo 9

Campo magnético

9.1. Campo magnético creado por cargas puntuales


Hemos visto en el capı́tulo anterior cómo afecta un campo magnético al movimiento
de una carga de prueba y cómo afecta a una corriente eléctrica. Hemos supuesto que
el campo magnético estaba creado por algún tipo de fuente, como puede ser un imán
permanente. Vamos a estudiar ahora cuál es el campo magnético que crean las cargas
eléctricas en movimiento y las corrientes eléctricas.
Una carga eléctrica puntual en reposo crea un campo eléctrico dado por la ley
de Coulomb. Si la carga está en movimiento, también crea un campo magético en el
espacio a su alrededor.
Consideremos la situación de la figura 9.1, en la cual una carga puntual q en el
vacı́o tiene una velocidad v en el instante en que está situada en un punto P0 con
vector de posición r0 . Siempre que la velocidad de la carga sea pequeña comparada
con la velocidad de la luz c = 3 × 108 m · s−1 (para cargas con velocidades comparables
a c, el campo tiene una expresión algo más complicada), el campo magnético B(r)
creado por esta carga en un punto P de vector de posición r está dado por
µ0 q r − r0
B(r) = v× , (9.1)
4π |r − r0 |3
donde µ0 es una constante llamada permeabilidad del vacı́o, que tiene un valor

µ0 = 4π × 10−7 N · A−2 , (9.2)

y que se relaciona con la permitividad del vacı́o ε0 mediante la expresión


1
µ 0 ε0 = . (9.3)
c2
El campo magnético creado por una carga puntual (9.1) presenta ciertas simili-
tudes y diferencias con el campo eléctrico creado por la misma carga, dado por
q r − r0
E(r) = . (9.4)
4πε0 |r − r0 |3
Para empezar, no existe campo magnético si la carga no está en movimiento, a dife-
rencia del campo eléctrico, que no depende de la velocidad de la carga. El módulo del

109
110 Campo magnético

v r − r0

q B

Figura 9.1. Una carga puntual en movimiento crea un campo magnético. Su dirección es
perpendicular al plano formado por la velocidad de la carga y el vector de posición del punto
en que se calcula en campo con respecto al punto donde está la carga. El sentido del campo
se calcula mediante las reglas del producto vectorial.

campo eléctrico es
1 q
E(r) = , (9.5)
4πε0 |r − r0 |2
mientras que el módulo del campo magnético creado por la misma carga es
µ0 qv sen α
B(r) = , (9.6)
4π |r − r0 |2
donde α es el ángulo que forman el vector velocidad y el vector de posición relativa
r − r0 . Tanto E como B dependen del inverso del cuadrado de la distancia a la carga,
pero B depende también de la velocidad de la carga y del ángulo que forma con el
vector de posición relativa, de tal manera que el campo magnético es nulo si ambos
vectores son paralelos.
Pero la diferencia más clara entre el campo eléctrico (9.4) y el campo magnético
(9.1) está en su dirección. El campo eléctrico tiene la dirección de la recta que une la
carga q y el punto P donde se calcula el campo. Por el contrario, el campo magnético
tiene una dirección perpendicular al plano que forman la velocidad de la carga y la
recta que une la carga con el punto P . En consecuencia, el campo eléctrico y el campo
magnético son ortogonales.
La comparación entre el campo eléctrico y el magnético creados por una carga
puntual q se puede poner de manifiesto escribiendo el campo magnético como
µ0 q 4πε0
B(r) = v× E(r), (9.7)
4π q
que, teniendo en cuenta la relación (9.3), da lugar al resultado
v
B(r) = 2 × E(r). (9.8)
c
En conclusión, aunque una carga en reposo produce únicamente un campo eléctrico
a su alrededor, la misma carga en movimiento produce un campo eléctrico y uno
magnético, perpendiculares entre sı́ y relacionados por la expresión (9.8). Los campos
eléctrico y magnético son consecuencias de una única propiedad de la materia.

9.2. Ley de Biot-Savart


Dado que una carga en movimiento produce un campo magnético, una corriente
eléctrica a lo largo de un cable conductor produce también un campo magnético,
Ley de Biot-Savart 111

r − r0
I dl

dB

Figura 9.2. Una corriente en un cable infinitesimal produce un campo magnético dado por
la ley de Biot-Savart.

pues corriente no es sino carga en movimiento. La expresión del campo magnético ge-
nerado por una corriente eléctrica a lo largo de un cable se llama ley de Biot-Savart.
Para obtenerla, vamos a partir de la expresión del campo magnético creado por
una carga en movimiento (9.1), aunque la ley que obtengamos es un resultado que se
comprueba experimentalmente. Consideremos un segmento infinitesimal de cable de
longitud dℓ y sección S, cuyo centro está situado en la posición dada por el vector
r0 , y que conduce una corriente I, según la figura 9.2. Podemos suponer que los
portadores de carga son electrones libres que se mueven a la velocidad de arrastre
va en sentido opuesto a la corriente. Por tanto, el campo magnético creado por esta
porción infinitesimal de cable se puede aproximar bien por el creado por una carga
dQ = −ene S dℓ que se mueve a velocidad va = −j/(ene ), siendo j la densidad de
corriente eléctrica en el cable. Usando la expresión (9.1) para el campo magnético,
llegamos a
µ0 Sdℓ r − r0
dB(r) = j× . (9.9)
4π |r − r0 |3
Podemos escribir la relación entre el vector densidad de corriente j y la intensidad
de corriente I en el cable como j = (I/S) uI , donde el vector unitario uI indica el
sentido de la corriente. De este modo, la ecuación (9.9) se escribirá

µ0 Idℓ r − r0
dB(r) = uI × . (9.10)
4π |r − r0 |3

Cuando se considera un cable de longitud no infinitesimal, hay que sumar las con-
tribuciones de todos los elementos de longitud infinitesimal del cable, cada una de
ellas dada por la ecuación (9.10). Esto implica integrar esa expresión a lo largo de la
longitud ℓ del cable. Se llega ası́ al resultado
Z
µ0 Idℓ r − r0
B(r) = uI × . (9.11)
ℓ 4π |r − r0 |3

Esta expresión es la ley de Biot-Savart.


112 Campo magnético

Figura 9.3. Lı́neas del campo magnético creado por un alambre de corriente recto e infinito.
Son circunferencias centradas en el alambre y ortogonales a él. Su sentido lo da la regla del
sacacorchos.

Campo magnético creado por una corriente rectilı́nea infinita


Consideremos un alambre recto muy largo por el que circula una corriente I, como
vemos en la figura 9.3. En los puntos del espacio situados lejos de los extremos del
cable, el campo magnético creado por él se puede aproximar sin problemas por el
campo de un alambre recto infinito. Las lı́neas de este campo magnético, como vemos
en la figura 9.3, son circunferencias centradas en el alambre y perpendiculares a él.
El sentido del campo magnético a lo largo de estas circunferencias se puede calcular
mediante la regla del sacacorchos (se coloca el pulgar de la mano derecha en el sentido
de la corriente y los cuatro dedos mayores nos dan el sentido del campo magnético en
las circunferencias).
Calculemos una expresión para el campo magnético que crea un alambre recto e
infinito de corriente usando la ley de Biot-Savart. Para ello, situamos el sistema de
referencia de manera que el alambre se sitúe en el eje z, con la corriente I apuntando
en sentido positivo. De este modo, el elemento de longitud es dℓ = dz, los puntos del
alambre están en r0 = z k, donde z va desde menos infinito hasta infinito, y el vector
que da la dirección y sentido de la corriente es uI = k.
Usando la expresión (9.11), el campo en un punto P de vector de posición r =
r ur , donde r es la distancia entre el punto P y el alambre y ur es un vector unitario
que apunta desde el alambre hasta el punto P (ver la figura 9.4), resulta
Z ∞
µ0 I r
B(r) = dz k × ur 2 . (9.12)
−∞ 4π (r + z 2 )3/2

I r − r0
uI
O P
ur

Figura 9.4. Cálculo del campo magnético creado por un alambre infinito según la ley de
Biot-Savart. Posiciones y vectores.
Campo magnético creado por una espira circular 113

Figura 9.5. Lı́neas del campo magnético creado por una espira de corriente.

Sacando de la integral todo lo que no depende de z, queda


Z ∞
µ0 Ir 1
B(r) = k × ur dz 2 . (9.13)
4π −∞ (r + z 2 )3/2

Haciendo el cambio de variables x = z/r, y después el cambio de variables x = tan α


la integral anterior es
Z ∞ Z ∞ Z π/2
1 1 1 1 2
dz = 2 dx = 2 cos α dα = . (9.14)
−∞ (r2 + z 2 )3/2 r −∞ (1 + x2 )3/2 r −π/2 r2

De este modo, el campo magnético creado por un alambre recto e infinito por el que
circula una corriente I se puede escribir como

µ0 I
B(r) = uI × ur . (9.15)
2πr
La dirección y sentido del campo magnético vienen dados por el producto vectorial
uI × ur . El campo es ortogonal al plano creado por estos dos vectores, y su sentido
está determinado en cada punto por la regla del sacacorchos, con el pulgar de la mano
derecha a lo largo de la corriente, como se ve en la figura 9.3. El módulo del campo
magnético sólo depende de la distancia r al alambre, y es

µ0 I
B= . (9.16)
2πr

9.3. Campo magnético creado por una espira circular


Las lı́neas del campo magnético de una espira de corriente tienen el aspecto general
que se ve en la figura 9.5. Son lı́neas cerradas que rodean a la espira. El sentido de
las lı́neas se puede conocer a partir del sentido de circulación de la corriente. Para
ello se utiliza la regla del sacacorchos: si se colocan los cuatro dedos mayores de la
mano derecha según la circulación de la corriente, el pulgar nos indicará el sentido del
campo magnético en el eje de la espira, y de ahı́ se deduce en el resto de los puntos.
Es interesante notar la semejanza entre las lı́neas del campo magnético creado
por una espira de corriente y las del campo magnético de una pequeña aguja de imán
permanente, colocado de tal modo que los momentos magnéticos de la espira y el imán
sean paralelos. Esto no es casual, pues la espira es el modelo fı́sico que representa un
114 Campo magnético
y
dl
a x
θ

dB

z
Figura 9.6. Diagrama para el cálculo del campo magnético creado por una espira circular
de corriente en su eje. Es cómodo tomar el sistema de referencia con origen en el centro de
la espira y el eje z como eje de la espira.

imán elemental: un electrón que gira en una órbita de radio igual al de la espira
en sentido contrario a la corriente en ella. El campo magnético refleja este hecho: el
campo de una espira de corriente es, a suficiente distancia de ella, un campo dipolar
magnético.
Calculemos el campo magnético que crea una espira circular de N vueltas y radio
a, que conduce una corriente I, en un punto del eje de la espira. Según la figura 9.6,
el elemento de longitud en la espira es el elemento de arco. Dado que un ángulo dθ en
una circunferencia es igual a la longitud dℓ del arco que abarca dividida por el radio
a de la circunferencia, tenemos la relación dℓ = a dθ. Además, un punto cualquiera
de la espira tiene un vector de posición dado por r0 = a cos θ i + a sen θ j, siendo θ
el ángulo formado por r0 con el eje x. Este ángulo determina todos los puntos de la
espira al variar entre los valores 0 y 2π.
Queremos calcular el campo magnético en un punto arbitrario P del eje de la
espira, de modo que su vector de posición será
r = z k, (9.17)
siendo z la distancia que hay entre el punto P y el centro de la espira. Sólo falta escribir
las componentes del vector unitario uI que determina el sentido de circulación de la
corriente en la espira. Según la figura 9.6,
uI = − sen θ i + cos θ j. (9.18)
Teniendo ahora en cuenta que el campo que crean N vueltas de espira es igual a N
veces el campo que crea 1 vuelta, se llega a la expresión de la ley de Biot-Savart,
Z
µ0 N Ia 2π z cos θ i + z sen θ j + a k
B(z) = dθ 3/2
. (9.19)
4π 0 (a2 + z 2 )
Las integrales que resultan, componente a componente, son muy sencillas. Las com-
ponentes x e y se anulan, de modo que el campo tiene sólo componente z, estando
dirigido a lo largo del eje de la espira hacia el punto P . El resultado es
µ0 N I a2
B(z) = k. (9.20)
2 (a2 + z 2 )3/2
Campo magnético creado por un solenoide 115

Figura 9.7. Lı́neas del campo magnético creado por un solenoide. El sentido de las lı́neas
en el interior se calcula mediante la regla del sacacorchos.

El valor máximo del campo se obtiene en el centro de la espira. En este punto, z = 0,


de manera que la ecuación (9.20) se reduce a
µ0 N I
B(0) = k. (9.21)
2a
Por otro lado, a grandes distancias de la espira, z domina en el denominador, de tal
modo que se puede aproximar el resultado (9.20) por

µ0 N Ia2
B(z ≫ a) = 3 k, (9.22)
2 |z|

que tiene la forma tı́pica 1/(distancia)3 de un campo dipolar a grandes distancias. De


hecho, si tenemos en cuenta que el momento dipolar de la espira es

m = N Iπa2 k, (9.23)

podemos escribir el campo en un punto del eje a grandes distancias de la espira como
µ0 m
B(z ≫ a) = 3, (9.24)
2π |z|
es decir, resulta un campo paralelo al momento magnético. De la misma forma, el
campo magnético creado por una aguja de imán permanente en un punto de su eje, a
grandes distancias, tiene la forma dada por la ecuación (9.24), donde m es el momento
magnético del imán. De nuevo, aparece la relación de equivalencia entre espiras y
agujas de imán.

9.4. Campo magnético creado por un solenoide


Supongamos que tenemos un cilindro de longitud ℓ y sección circular de radio R. Si
se enrolla un alambre a su alrededor muchas veces, en forma de hélice de muchas
vueltas, el dispositivo resultante se llama solenoide y se puede ver en la figura 9.7.
El solenoide desempeña en magnetismo un papel análogo al de un condensador en
electrostática, pues proporciona un campo intenso y aproximadamente uniforme en
la región acotada por el alambre enrollado.
116 Campo magnético

−a dz b

Figura 9.8. Diagrama para el cálculo del campo magnético creado por un solenoide en su
eje. Tomamos el sistema de referencia con el eje z como eje del solenoide.

Como vemos en la figura 9.7, cuando una corriente eléctrica recorre un solenoide
largo (tal que su longitud es mucho mayor que su radio) y de muchas vueltas por
unidad de longitud, las lı́neas del campo magnético producido son aproximadamente
paralelas al eje del solenoide y están muy juntas unas de otras, lo que indica que, en
el interior del solenoide, el campo magnético es intenso y aproximadamente uniforme.
Fuera del solenoide, las lı́neas están mucho más espaciadas, indicando que el campo
es mucho menos intenso. Existe una estrecha semejanza entre las lı́neas del campo
magnético creado por un solenoide y las del campo magnético creado por un imán
permanente de la misma forma y tamaño.
Para calcular el campo magnético que crea un solenoide en un punto de su eje,
que es aproximadamente igual al campo en todos los puntos del interior del solenoide,
vamos a usar el resultado del apartado anterior para el campo creado por una espira
de corriente en su eje. Suponemos que el alambre se enrolla en el solenoide muy
apretadamente en cada vuelta, de manera que se puede despreciar el paso de rosca.
Ası́, el solenoide se puede ver como un conjunto de N espiras circulares de radio R
que conducen una corriente I todas en el mismo sentido. El campo magnético del
solenoide en su eje es entonces la suma de los creados por las espiras.
Colocamos el sistema de referencia como en la figura 9.8, con el eje del solenoide
como eje z. Los extremos del solenoide están en los puntos z0 = −a y z0 = b. El
campo que crea una espira de dN vueltas en el punto del eje de coordenada z es el
dado en la expresión (9.20) tomando el radio de la espira como R, es decir,
µ0 I dN R2
dB = 3/2
k. (9.25)
2 [R2 + (z − z0 )2 ]
Pero en el solenoide hay espiras desde z0 = −a hasta z0 = b, de manera que hemos
de sumar (integrar) todos estos campos. Un elemento de longitud dz0 del solenoide
contiene dN = (N/ℓ) dz0 espiras, donde ℓ = a + b. De este modo, obtenemos que el
campo que crea un solenoide en su eje está dado por
Z b
N dz0 µ0 I R2
B= k. (9.26)
−a ℓ 2 [R2 + (z − z0 )2 ]3/2

Integrando en la variable z0 , llegamos a la expresión


!
µ0 nI a+z b−z
B= p +p k, (9.27)
2 R2 + (z + a)2 R2 + (b − z)2
Ley de Gauss del magnetismo 117

µ 0nI
µ 0nI/2

−a b z

Figura 9.9. Módulo del campo magnético creado por un solenoide en su eje. El campo es
constante excepto cerca de los extremos.

donde n = N/ℓ es el número de vueltas por unidad de longitud del solenoide.


Pasemos ahora a los valores lı́mite. En primer lugar, si el solenoide es muy largo,
el campo magnético en su interior se puede aproximar por la expresión (9.27) con las
cantidades a y b tendiendo a infinito. Al tomar estos lı́mites obtenemos
B = µ0 nI k, (9.28)
es decir, un campo intenso y uniforme en el interior del solenoide. Este campo se
puede hacer aún mucho mayor si colocamos en el interior del solenoide un núcleo
ferromagnético que, como veremos después, puede aumentar el campo en un factor de
10000 o más. Este dispositivo (un solenoide largo con un núcleo ferromagnético) posee
un campo magnético grande y aproximadamente uniforme en sus cercanı́as y se llama
electroimán. Sus aplicaciones son muchas, especialmente en el diseño de motores y
generadores eléctricos y en dispositivos de investigación en fı́sica de altas energı́as.
Otro caso lı́mite interesante es el campo cerca de uno de los extremos del sole-
noide. Para calcularlo, en la expresión (9.27) podemos tomar z = −a y hacer b tender
a infinito. Al hacerlo, obtenemos
µ0 nI
B= k, (9.29)
2
es decir, el campo cerca de los extremos del solenoide es aproximadamente igual a la
mitad del campo en el interior. Según nos alejamos de los extremos del solenoide hacia
el exterior, el campo decae prácticamente hasta cero. Esto puede verse en la expresión
(9.27) haciendo z tender a infinito. Este comportamiento aproximado, que se puede
ver en la figura 9.9, es muy parecido al del campo eléctrico de un condensador plano.

9.5. Ley de Gauss del magnetismo


De modo análogo al caso del flujo del campo eléctrico que vimos en el capı́tulo 5,
dado un campo magnético B y una superficie S, el flujo magnético a través de S es
proporcional al número de lı́neas magnéticas que atraviesan la superficie S, cada una
con su signo (ver la figura 9.10).
En forma matemática, el flujo magnético del campo B a través de la superficie
S se escribe Z
Φm (S) = B · dS, (9.30)
S
118 Campo magnético

S
α B

Figura 9.10. El flujo magnético a través de una superficie se refiere al número de lı́neas
magnéticas que atraviesan esa superficie.

donde se ha tomado el vector infinitesimal de superficie como dS = dS n, siendo n


un vector unitario normal a la superficie en cada punto y dS el área de un elemento
de superficie infinitesimal. La integral se realiza sobre la superficie total S, sumando
las contribuciones de cada elemento de superficie. La unidad de flujo magnético es el
Weber, definido como 1 Wb = 1 T · m2 .
Cuando el campo magnético B es uniforme en la superficie S a través de la cual
calculamos el flujo, y además S es una superficie plana, de manera que el vector
normal n es uniforme en todos sus puntos, la integral de la ecuación (9.30) es muy
fácil de resolver, siendo el resultado
Φm = B · S = BS cos α, (9.31)
donde S = S n, siendo S el área total de la superficie. En la última igualdad, B es el
valor del módulo del campo magnético en los puntos de S y α es el ángulo que forman
el campo magnético y el vector normal n, según se ve en la figura 9.10. En este caso,
el flujo calculado mediante la fórmula (9.31) es el flujo en la dirección determinada
por el campo magnético. Obviamente, si la superficie S es la encerrada por una espira,
hay que tener en cuenta el número de vueltas N de esta espira para calcular el área
de la superficie.
Si la superficie S a través de la cual estamos calculando el flujo es una superficie
cerrada, podemos esperar que exista una relación análoga a la ley de Gauss del campo
eléctrico Φe = Qint /ε0 . Recordemos que esta relación era una consecuencia del hecho
de que las cargas positivas y negativas son, respectivamente, fuentes y sumideros de
lı́neas eléctricas, de manera que las cargas que hay dentro de la superficie cerrada S
generan lı́neas eléctricas que salen de la superficie o entran en ella, contribuyendo al
flujo. Por su parte, las cargas que no están encerradas por S generan lı́neas que, si
entran en la superficie, luego salen de ella, y a la inversa, no contribuyendo por tanto
al flujo eléctrico.
En el caso del campo magnético, las lı́neas de campo son siempre cerradas porque
no existen cargas magnéticas aisladas o monopolos magnéticos. Esto implica que toda
lı́nea magnética que entra en una superficie cerrada tiene que salir necesariamente
de ella. Como consecuencia, el flujo magnético a través de una superficie cerrada
será siempre cero. La expresión matemática de esta ley es
I
B · dS = 0, (9.32)
S
otra de las ecuaciones fundamentales del electromagnetismo. En esta expresión, el
cı́rculo en la integral indica que S es una superficie cerrada.
Ley de Ampère 119

B
α
ut B t

Figura 9.11. Componente Bt de un campo magnético uniforme B tangente a un filamento


rectilı́neo.

9.6. Ley de Ampère


La ley de Gauss del campo eléctrico permite obtener la expresión de los campos que
crean distribuciones de carga con un alto grado de simetrı́a. Sin embargo, dado que
la ley (9.32) no relaciona el campo con sus fuentes, no es posible obtener con ella
la expresión de los campos magnéticos creados por distribuciones de corriente. En el
caso de distribuciones de corriente en equilibrio (magnetostáticas), a veces es posible
usar la simetrı́a de la distribución para calcular el campo mediante la ley de Ampère.

Circulación de un campo magnético


Consideremos primero un segmento recto orientado de longitud ℓ que está sumergido
en un campo magnético uniforme B. El hecho de que esté orientado implica que se
puede definir en cada punto del segmento un vector unitario ut tangente, cuyo sentido
viene determinado por la orientación del segmento. En cada punto del segmento con-
sideraremos el valor de la componente del campo magnético tangente. Según vemos
en la figura 9.11, esta componente tiene un valor

Bt = B · ut = B cos α, (9.33)

donde α es el ángulo que forma el vector tangente con el campo magnético. El producto
de la componente del campo tangente al segmento y la longitud del segmento es

Bt ℓ = B · (ℓ ut ) , (9.34)

cantidad cuya unidad es 1 T · m.


Si, en lugar de un segmento, tenemos una curva C cualquiera, y además el campo
magnético no es uniforme, podemos dividir la curva C en trozos infinitesimales de
longitud dℓ. En cada uno de ellos, el campo magnético es aproximadamente uniforme
y el vector tangente también. Por tanto, en cada trozo de la curva C, el producto de la
componente tangente del campo por la longitud del trozo de curva es Bt dℓ = B·(dℓ ut ).
Definimos el vector desplazamiento infinitesimal a lo largo del trozo de curva como
dr = dℓ ut , de tal modo que Bt dℓ = B · dr. Para encontrar ahora el valor total basta
sumar las contribuciones de cada uno de los trozos infinitesimales de longitud dℓ.
Llegamos entonces a la expresión
Z Z
Υ= Bt dℓ = B · dr, (9.35)
C C

que se llama circulación del campo magnético B a lo largo de la curva C.


120 Campo magnético

Ley de Ampère
La ley de Ampère es una relación directa entre la circulación de un campo magnético
a lo largo de una curva cerrada y la corriente neta que atraviesa la superficie encerrada
por esa curva, siempre que la corriente no presente discontinuidades (veremos lo que
significa esta excepción, y cómo se salva, en el capı́tulo 12).
Consideremos un cable rectilı́neo e infinito (en el eje z) que conduce una corriente
I en el sentido del eje z positivo. Calculemos la circulación del campo magnético que
crea este cable a lo largo de una circunferencia C de radio a, con centro en el origen, y
situada en el plano xy, orientada en sentido antihorario. Como vimos en el apartado
9.2, las lı́neas del campo magnético que crea el cable son circunferencias con centro
en el cable, situadas en planos perpendiculares a él, y cuyo sentido viene dado por
la regla del sacacorchos. En particular, la circunferencia C es una lı́nea magnética.
Por tanto, en cada punto de C el campo magnético es paralelo al vector tangente, y
podemos escribir
B · dr = B dℓ. (9.36)
La circulación de B a lo largo de la circunferencia C resulta
I I
Υ(C) = B · dr = B dℓ, (9.37)
C C

donde el cı́rculo en la integral indica que C es una curva cerrada (el único caso en que
se aplica la ley de Ampère). El campo magnético creado por el cable tiene por módulo
la expresión B = µ0 I/(2πr), donde r es la distancia al cable. En todos los puntos
de la circunferencia C, esta distancia es el radio de la circunferencia, de manera que
r = a para los puntos de C. Entonces,
I I
µ0 I µ0 I
Υ(C) = dℓ = dℓ, (9.38)
C 2πa 2πa C
habiendo sacado de la integral todas las constantes. Lo que queda es la integral en la
circunferencia C del elemento de longitud dℓ. Esta integral es, obviamente, la longitud
ℓ = 2πa de la circunferencia. Por tanto,

Υ(C) = µ0 I, (9.39)

resultado que no depende del radio de la curva C.


La generalización de este resultado (9.39) es la ley de Ampère: la circulación de
un campo magnético a lo largo de una curva cerrada C es igual a µ0 veces la corriente
IC que atraviesa la superficie encerrada por la curva. Expresada matemáticamente,
I
B · dr = µ0 IC . (9.40)
C

Es necesario tener presente que para que la ecuación (9.40) sea válida, la corriente ha
de ser continua, es decir, que no se interrumpa en ningún punto.
Como un ejemplo, en la figura 9.12 se ha dibujado una curva cerrada orientada
C, de tal modo que la superficie encerrada por C está atravesada por dos corrientes I1
e I2 en sentidos opuestos. Según la ley de Ampère, la circulación del campo magnético
a lo largo de C será, simplemente, Υ(C) = µ0 IC = µ0 (I1 − I2 ).
Ley de Ampère 121

I1
C

I2
dl

Figura 9.12. La superficie que encierra una curva cerrada orientada C es atravesada por dos
corrientes I1 e I2 . La regla del sacacorchos, según la orientación escogida para C, implica que
la corriente I1 atraviesa la superficie encerrada por C en sentido positivo, mientras que I2
en sentido negativo. Por tanto, según la ley de Ampère, la circulación del campo magnético
a lo largo de C vale µ0 (I1 − I2 ).

Campo magnético creado por un toroide


Para que la ley de Ampère pueda ser utilizada en un problema de cálculo de un
campo magnético creado por alguna corriente, es necesario que podamos escribir la
circulación de este campo magnético como el producto de la intensidad del campo por
alguna longitud. Esto requiere, en primer lugar, elegir la curva cerrada C tangente
a las lı́neas de campo magnético, lo cual implica conocer a priori esta dirección. Un
caso en que podemos hacer esto, debido a la simetrı́a de la distribución de corriente,
es el del campo que crea una bobina toroidal en su interior.
Una bobina toroidal o toroide (ver la figura 9.13) está formada por un cable
conductor enrollado N veces alrededor de un núcleo en forma de anillo. El radio
interior del toroide es a y el radio exterior es b. El campo que crea el toroide en
el exterior es aproximadamente nulo, como el de un solenoide largo. En el interior,
las lı́neas magnéticas son circunferencias concéntricas con el toroide, cuyo sentido
depende del sentido de la corriente I en la bobina, y que se calcula mediante la regla
del sacacorchos.
Para calcular el campo magnético interior del toroide con la ley de Ampère po-
demos usar una curva cerrada C que sea una circunferencia de radio r interior al
toroide orientada como las lı́neas magnéticas, según la figura 9.13. De esta manera,
al ser C una lı́nea magnética, el campo es paralelo al vector tangente en cada punto,
de manera que B · dr = B dℓ. La circulación resulta
I I
Υ(C) = B dℓ = B dℓ, (9.41)
C C

pues suponemos que el campo depende sólo de la distancia r al centro de la circunfe-


rencia por simetrı́a. La integral de dℓ a lo largo de C es la longitud de C, dada por
ℓ = 2πr. Por tanto, la circulación es

Υ(C) = 2πrB. (9.42)


122 Campo magnético

a
b

I
I

Figura 9.13. Una bobina toroidal de N vueltas, radio interior a y radio exterior b, por la
que circula una corriente I crea un campo magnético en su interior cuyas lı́neas son circun-
ferencias concéntricas con el toroide y cuyo sentido se calcula con la regla del sacacorchos.
Para calcular el campo con la ley de Ampère se calcula la circulación a lo largo de una
circunferencia C de radio r interior al toroide.

Según la ley de Ampère, esta circulación ha de ser igual a µ0 veces la corriente neta
IC que atraviesa la superficie encerrada por C. Dado que el toroide tiene N vueltas
de cable conductor, la corriente neta es IC = N I, de donde

2πrB = µ0 N I. (9.43)

Despejando el campo magnético, llegamos al resultado

µ0 N I
B= , a < r < b. (9.44)
2πr
Este tipo de campos se usan para confinar partı́culas cargadas en enormes toroides
llamados tokamaks.

9.7. Ejercicios
1. Una carga q = −1 nC se mueve con velocidad v = 103 m · s−1 a lo largo del
eje x de tal modo que, en el instante t = 0, se encuentra situada en el origen.
Determinar el campo magnético en el punto P (0, 1 mm, 0) en los instantes t = 0
y t = 1 ms.
Solución: B(0) = −10−7 T k, B(1 ms) = −10−16 T k.
2. Hallar la fuerza magnética que una carga q0 , con velocidad constante v0 y en
movimiento rectilı́neo, ejerce sobre otra carga q, con velocidad v, que se mueve
paralelamente a la anterior y a una distancia d de ella. Hacer el cálculo en el
momento en que ambas cargas están a la misma altura.
Solución: Las cargas se atraen con una fuerza (µ0 qq0 vv0 )/(4πd2 ).
3. Dos cables conductores muy largos, rectos y paralelos, están separados por una
distancia de 6, 5 cm y conducen corrientes de 15 mA y 7 mA en el mismo sentido.
Calcular la fuerza magnética entre los cables por unidad de longitud. Hacer el
Ejercicios 123

mismo cálculo en el caso de que las corrientes en los cables tengan sentidos
opuestos.
Solución: En el caso en que los cables conducen corrientes paralelas, la fuerza
entre ellos es atractiva y, si son corrientes antiparalelas, la fuerza es repulsiva. El
valor de la fuerza por unidad de longitud en ambos casos es de 3, 2×10−10 N·m−1 .
4. Determinar el campo magnético en el centro de una espira cuadrada de 5 cm de
lado por la que circula una corriente de 15 mA.
Solución: B = 3, 4 × 10−7 T. El campo es ortogonal al plano de la espira y su
sentido es el dado por la corriente según la regla del sacacorchos.
5. Una espira circular de radio a y N vueltas conduce una corriente I. La espira
está situada en el plano xz con centro en el origen y la corriente tiene en ella
sentido antihorario. Una segunda espira circular del mismo radio a y N vueltas
está situada en el plano xy, con centro en el punto P (0, 2a, 0), y conduce una
corriente antihoraria del mismo valor I. Determinar el campo magnético en el
punto P .  
Solución: B = µ02aNI
k + 5√ 1
5
j .
6. Un solenoide de 1300 vueltas por metro transporta una corriente de 1 mA. El eje
del solenoide es el eje z y la corriente recorre el solenoide en sentido antihorario
en el plano xy. Se tiene también un cable de corriente rectilı́neo en el eje del
solenoide que conduce una corriente de 5 mA en el sentido del eje z negativo.
Determinar el campo magnético en un punto P del interior del solenoide situado
en el eje x, en x = 1 cm. 
Solución: B = −10−7 j + 1, 6 × 10−6 k T.
7. Un cable recto e infinito tiene un radio R y conduce una corriente I distribuida
uniformemente en su sección. Determinar el campo magnético creado por este
cable en todos los puntos del espacio. Hallar los puntos para los cuales el campo
magnético es máximo.
Solución: Las lı́neas de fuerza magnética son circunferencias perpendiculares al
cable cuyo centro está en el eje del cable y cuyo radio r es la distancia al eje.
El sentido del campo se establece con el de la corriente, mediante la regla del
sacacorchos. La intensidad del campo es

µ0 Ir/2πR2 , r < R
|B| = (9.45)
µ0 I/2πr, r<R
Capı́tulo 10

Materiales magnéticos

10.1. Momento magnético de un electrón


Una espira de corriente posee un momento magnético de tal manera que es capaz de
rotar en presencia de un campo magnético externo. Consideremos ahora una imagen
muy simplificada de un electrón en una órbita circular alrededor del núcleo de un áto-
mo, según la figura 10.1. Puede verse esto como una corriente (carga en movimiento)
cerrada. Por tanto, un electrón en órbita alrededor de un núcleo posee un momento
magnético.
Es sencillo calcular el momento magnético del electrón debido a la trayectoria
circular de la figura 10.1. Su momento magnético m es el de una espira circular de 1
vuelta y radio r recorrida por una corriente I = q/t = −e/T = −ev/(2πr), donde −e
es la carga del electrón y T = 2πr/v es el periodo de su órbita a velocidad v. Resulta
entonces
−evr
m = ISn = n, (10.1)
2
siendo n el vector normal dado por el movimiento del electrón, tal como se muestra
en la figura. Por otro lado, el momento angular del electrón respecto al centro de la
órbita circular es
L = me r × v = me rv n, (10.2)

según la expresión (2.38), donde me es la masa del electrón, y n es el vector unitario


normal a la superficie encerrada por la circunferencia, que determina el sentido de
recorrido de la órbita. El vector n se calcula con la regla del sacacorchos a partir del

n
−e r
m v
Figura 10.1. Un electrón en órbita circular de radio r alrededor del núcleo de un átomo

125
126 Materiales magnéticos

sentido de la velocidad. Por tanto, podemos escribir


−e
m= Le , (10.3)
2me
relacionando momento magnético con momento angular orbital. En mecánica cuántica
se define el magnetón de Böhr del electrón como
eh̄
µB = = 9,3 × 10−24 A · m2 , (10.4)
2me
que es una unidad de momento magnético atómico. En esta definición, h̄ = 1, 05 ×
10−34 kg · m2 · s−1 es la constante de Planck normalizada, una unidad de momento
angular. Ası́, llegamos a la expresión
Le
m = −µB . (10.5)

Esta ecuación es válida en la mecánica clásica, pero no en la mecánica cuántica que es
la teorı́a correcta para explicar las propiedades de las partı́culas a escala atómica. Para
obtener una expresión correcta, a la ecuación (10.5) hay que sumarle la contribución
debida al llamado momento angular intrı́nseco o espı́n del electrón Se . Teniendo en
cuenta esta contribución, se obtiene la expresión final para el momento magnético de
un electrón en órbita alrededor del núcleo, que es
 
Le Se
m = −µB −γ , (10.6)
h̄ h̄

donde γ es el factor giromagnético del electrón, que es un número sin unidades muy
cercano a −2.

10.2. Magnetización
Cada átomo en un material puede tener un momento magnético, cuya contribución
principal es la suma vectorial de los momentos magnéticos de sus electrones. Depen-
diendo de esta suma, un átomo puede tener un momento magnético permanente o
no.
La existencia de momentos magnéticos atómicos permanentes determina el com-
portamiento del material en presencia de un campo magnético externo. Esto ocurre
porque los momentos magnéticos atómicos pueden rotar y alinearse, del mismo modo
que el de una espira, en presencia de un campo magnético externo B0 , de tal manera
que pueden hacer variar el valor del campo magnético en el interior del material. Por
ejemplo, si existe en un material cierta alineación parcial de los momentos atómicos
en dirección y sentido paralelos a un campo magnético externo, entonces la intensidad
del campo magnético total es mayor que la debida únicamente al campo externo. De
manera análoga, una alineación parcial de los momentos atómicos en sentido opuesto
a un campo externo disminuye el campo total.
El proceso de alineamiento de los momentos magnéticos atómicos dentro de un
material se llama magnetización del mismo. Consideremos, por ejemplo, un material
en forma de cilindro que está magnetizado de manera homogénea en dirección paralela
Magnetización 127

Im
M

Figura 10.2. Corriente superficial de magnetización Im en un cilindro magnetizado en


dirección paralela a su eje. Se muestra una sección del cilindro, en la que se observan las
corrientes electrónicas elementales que dan lugar a la corriente superficial.

a su eje, como vemos en la figura 10.2. En este caso, una porción de los momentos
magnéticos atómicos del material está parcialmente orientada paralelamente al eje del
cilindro. Las corrientes electrónicas elementales que crean estos momentos orientados,
por la regla del sacacorchos, han de estar dirigidas según se ve en la figura, de tal
manera que su efecto se cancela con corrientes adyacentes en el interior del material
y no se observa corriente neta allı́. Sin embargo, no se cancelan en la superficie del
material, dando lugar a una corriente superficial macroscópica neta Im , dirigida como
se ve en la figura, que provoca que el material magnetizado se comporte como un
solenoide por el que circula una corriente Im . Por tanto, este material crea un campo
magnético Bm que se puede medir y que es paralelo a la alineación de los momentos
magnéticos atómicos.
Se define el vector magnetización M de un material como el momento magnético
neto por unidad de volumen de material. Su dirección y sentido están determinados
por la suma de los momentos magnéticos atómicos que hay en la porción de material
que estamos considerando (ver la figura 10.2). La corriente superficial Im en un ma-
terial magnetizado está relacionada con el vector magnetización M y su dirección y
sentido vienen dados por la regla del sacacorchos aplicada al vector M.
Si la magnetización no fuese uniforme, esta corriente circulará también por el
interior del material. En todo caso, Im se debe al movimiento de electrones alrededor
de los núcleos atómicos y no es, por tanto, un movimiento de electrones libres como
en un cable conductor al aplicar una diferencia de potencial. Para distinguir a Im de
la corriente de conducción debida al movimiento de electrones libres, se le suele llamar
corriente de magnetización. Ambas pueden estar presentes en un material conductor.
Consideremos el cilindro uniformemente magnetizado de la figura 10.2, recorrido
por una corriente de magnetización superficial Im , al que se le enrollan n vueltas
por unidad de longitud de un cable conductor por el que circula una corriente de
conducción I. Dado que I e Im son paralelas en este caso, podemos escribir el campo
magnético total B en el interior del material como el de un solenoide de corriente I
más el campo debido a la corriente de magnetización Im , es decir,

B = B0 + Bm . (10.7)

Es común definir la susceptibilidad magnética del material χm de tal modo que

Bm = χ m B0 , (10.8)
128 Materiales magnéticos

donde χm es una cantidad sin unidades. El campo magnético total en el material


resulta
B = B0 + χm B0 = (1 + χm ) B0 = µr B0 . (10.9)
En la última igualdad se ha definido la permeabilidad relativa del material µr como

µr = 1 + χ m . (10.10)

Volviendo a nuestro ejemplo del cilindro magnetizado, dado que el campo aplicado es
B0 = µ0 nI, el módulo del campo total resulta

B = µnI, (10.11)

en función de la corriente de conducción I únicamente, sustituyendo la permeabilidad


del vacı́o µ0 por la permeabilidad absoluta del material

µ = µr µ0 . (10.12)

Para el vacı́o, µr = 1. Para los distintos materiales, la permeabilidad relativa tiene


diferentes comportamientos, lo cual permite clasificarlos en tres categorı́as principales:
diamagnéticos, paramagnéticos y ferromagnéticos.

10.3. Diamagnetismo
Llamamos diamagnetismo al efecto por el cual un campo magnético aplicado a un
material induce en éste una magnetización que tiene sentido opuesto al campo apli-
cado.
El diamagnetismo aparece en todos los materiales pero, dado que los momen-
tos magnéticos inducidos por este efecto suelen ser muy pequeños, queda a menudo
enmascarado por efectos paramagnéticos o ferromagnéticos (de los que hablaremos
luego). En la práctica, sólo se observa el diamagnetismo si el momento magnético
intrı́nseco de los átomos o moléculas del material es nulo en ausencia del campo ex-
terno aplicado, pues entonces no existen los otros efectos. En este caso, decimos que
el material es diamagnético.
En las sustancias diamagnéticas, el campo externo aplicado induce momentos
magnéticos orbitales opuestos a él, con lo cual el campo magnético total es menor que
el aplicado. Como consecuencia, en los materiales diamagnéticos χm es un número
negativo tı́picamente muy pequeño, y µr es un número muy cercano a la unidad,
pero levemente menor que 1. En la tabla 10.1 podemos observar algunos valores de la
susceptibilidad magnética (a temperatura ambiente) para sustancias diamagnéticas.
Para comprender cómo un campo magnético aplicado induce momentos orbitales
atómicos opuestos a él, consideremos el ejemplo de la figura 10.3. Dos electrones, cada
uno de carga −e, se mueven inicialmente en órbitas circulares del mismo radio r con
la misma velocidad v pero en sentidos opuestos. Esto quiere decir que, inicialmente, el
momento magnético neto de ambos electrones es cero (asumimos que tienen espines
antiparalelos entre ellos).
Se considera ahora un campo magnético externo B0 uniforme y perpendicular
a la trayectoria de ambos electrones. De esta manera, aparece una fuerza magnética
Fm = −ev × B0 sobre cada electrón, dirigida a lo largo de la dirección normal a su
Diamagnetismo 129
v v
−e −e

v v
−e −e

Figura 10.3. Dos electrones se mueven en órbitas circulares iguales con la misma velocidad
pero en sentido opuesto. Un campo magnético externo aplicado perpendicularmente a ambas
órbitas modifica la velocidad de los electrones creando un momento magnético neto en sentido
opuesto al campo aplicado.

trayectoria. Sin embargo, en uno de los electrones la fuerza magnética se dirige hacia
el exterior de la trayectoria circular, mientras que, en el otro, la fuerza magnética se
dirige hacia el centro de la trayectoria.
Como consecuencia de la fuerza magnética sobre los electrones, la aceleración
normal de cada uno de ellos cambia: cuando la fuerza magnética es hacia el exterior
de la trayectoria, la aceleración normal del electrón decrece, pero si la fuerza magnética
es hacia el centro de la trayectoria, la aceleración normal crece. Dado que la aceleración
normal en la trayectoria circular es an = v 2 /r, y los electrones están confinados en
órbitas de radio fijo, resulta que la velocidad del primer electrón disminuye, mientras
que la del segundo electrón aumenta.
Antes de aplicar el campo magnético externo, los momentos angulares orbitales
de ambos electrones eran iguales y de sentido opuesto, de manera que la suma de

Material χm
Hidrógeno −9,9 × 10−9
Nitrógeno −5,0 × 10−9
Sodio −0,2 × 10−5
Cobre −1,0 × 10−5
Bismuto −1,7 × 10−5
Diamante −2,2 × 10−5
Plata −2,6 × 10−5
Mercurio −3,2 × 10−5
Oro −3,6 × 10−5

Tabla 10.1. Susceptibilidad magnética de diversas sustancias diamagnéticas a 20 ◦ C. En los


casos de gases, se ha supuesto que la presión es de 1 atm.
130 Materiales magnéticos

ambos era cero. Como hemos supuesto que sus espines eran antiparalelos, teniendo
en cuenta la ecuación (10.6) resulta que el momento magnético neto era cero. Una
vez aplicado el campo externo, la velocidad de los electrones ha cambiado, haciéndolo
también su momento angular orbital. En particular, y teniendo en cuenta la regla del
sacacorchos en la figura 10.3, el momento angular orbital final tiene la dirección y
sentido del campo aplicado B0 . De esta manera, ha aparecido un momento magnético
neto diferente de cero que, según la ecuación (10.6), se opone al campo aplicado.
El efecto diamagnético que hemos estudiado es prácticamente independiente de
la temperatura. Como hemos comentado está a menudo enmascarado por efectos pa-
ramagnéticos o ferromagnéticos, que aparecen cuando los átomos o moléculas del ma-
terial tienen un momento magnético intrı́nseco no nulo. Por otro lado, como veremos a
continuación, el paramagnetismo disminuye al aumentar la temperatura, de tal modo
que, al menos idealmente, todos los materiales son diamagnéticos a temperaturas lo
suficientemente altas. Comentemos por último que los materiales superconductores
son perfectamente diamagnéticos, en el sentido que su susceptibilidad magnética es
χm = −1. Esto quiere decir que un superconductor anula en su interior cualquier cam-
po magnético aplicado. Este hecho experimental se conoce con el nombre de efecto
Meissner.

10.4. Paramagnetismo
En los materiales paramagnéticos, los momentos magnéticos intrı́nsecos atómicos o
moleculares tienden a alinearse parcialmente con un campo magnético externo, de
manera que el campo magnético se hace mayor que el aplicado. En los materiales
paramagnéticos, la susceptibilidad magnética χm es un número pequeño y positivo que
como veremos decrece cuando aumenta la temperatura, y la permeabilidad relativa
µr es un número cercano a la unidad pero levemente mayor que 1. Tenemos en la
tabla 10.2 algunos valores de la susceptibilidad magnética para ciertas sustancias
paramagnéticas.
El paramagnetismo aparece cuando los átomos o moléculas de una sustancia
tienen un momento magnético permanente asociado al momento angular orbital o de
espı́n de sus electrones. En ausencia de un campo magnético externo estos momentos
magnéticos permanentes están orientados al azar debido al movimiento térmico.

Material χm
Oxı́geno 2,1 × 10−6
Magnesio 1,2 × 10−5
Aluminio 2,3 × 10−5
Tungsteno 6,8 × 10−5
Titanio 7,1 × 10−5
Platino 3,0 × 10−4

Tabla 10.2. Susceptibilidad magnética de diversas sustancias paramagnéticas a 20 ◦ C. En


los casos de gases, se ha supuesto que la presión es de 1 atm.
Ferromagnetismo 131

Sin embargo, cuando se aplica un campo magnético B0 sobre el material, aparece


un momento torsión τ m sobre cada momento magnético atómico o molecular m, dado
por la expresión τ m = m × B0 . Entonces, como vimos en el capı́tulo 8, el momento
magnético tiende a alinearse paralelo al campo magnético aplicado.
Este efecto viene contrarrestado por el efecto térmico sobre los átomos y molécu-
las del material, que tiende a dirigir aleatoriamente los momentos magnéticos del
mismo. Como consecuencia, sólo una pequeña fracción de los momentos magnéticos
atómicos de la sustancia quedan dirigidos paralelamente al campo magnético. Debido
a esto, el paramagnetismo es un efecto débil y la susceptibilidad magnética de los ma-
teriales paramagnéticos es muy pequeña. Aún ası́, el efecto es mucho más importante
que el diamagnetismo para sustancias paramagnéticas (con momentos magnéticos
atómicos permanentes), por lo cual éstas ocultan los efectos diamagnéticos.
Otro aspecto importante del paramagnetismo, a medida que aumenta la tempe-
ratura del material, es la tendencia de los momentos magnéticos a orientarse alea-
toriamente, haciendo que la fracción de momentos atómicos alineados con el campo
externo decrezca. Consecuentemente, la magnetización de los materiales paramagnéti-
cos decrece con la temperatura T del material. Esto implica que una sustancia pa-
ramagnética a temperatura ambiente se convertirá en diamagnética si aumentamos
suficientemente su temperatura.

10.5. Ferromagnetismo
Una tercera clase de sustancias tiene un comportamiento magnético más acusado que
lo visto anteriormente: son los materiales ferromagnéticos. Estas sustancias presentan
una magnetización permanente, debida a la tendencia de los momentos magnéticos
de sus átomos o moléculas a alinearse por su interacción mutua. El ferromagnetismo
se presenta en sustancias que son imanes naturales, como la magnetita, y también en
el hierro, el cobalto, el nı́quel y en aleaciones de estos metales entre sı́.
En los materiales ferromagnéticos, existe una interacción cuántica entre los espi-
nes S1 y S2 de dos electrones, de tal manera que la energı́a debida a esta interacción
tiene la forma −J S1 · S2 , donde J es una cantidad, llamada integral de intercambio,
que depende de la distancia entre los electrones. Obviamente, si J es una cantidad
positiva, la energı́a de un par de espines electrónicos paralelos es menor que la de un
par de espines antiparalelos, de tal manera que se favorece que los espines cercanos
estén paralelos en el equilibrio incluso en ausencia de un campo magnético externo.
Este es el caso de los materiales ferromagnéticos. También podrı́a ocurrir que J fuese
negativa, en cuyo caso se favorecerı́a la presencia de espines antiparalelos, es decir,
una magnetización neta nula. Esto ocurre en los materiales antiferromagnéticos.
En una sustancia ferromagnética, en ausencia de un campo magnético aplicado, la
interacción entre espines electrónicos cercanos provoca una orientación de estos espi-
nes en regiones de tamaño normalmente microscópico, llamadas dominios magnéticos,
cuyas dimensiones van desde 10−12 m3 hasta 10−8 m3 , y que contienen desde 1017 has-
ta 1021 átomos. Dentro de estos dominios, los momentos magnéticos atómicos están
muy alineados, de tal manera que cada uno de los dominios tiene una magnetización
neta cuya dirección depende de la estructura cristalina de la sustancia (ver la figu-
ra 10.4a). La magnetización total de un trozo de sustancia será en general nula, pues
los dominios tienen magnetizaciones orientadas a lo largo de direcciones diferentes de
132 Materiales magnéticos

(a) (b) (c)


Figura 10.4. (a) Dominios magnéticos en un material ferromagnético en ausencia de campo
externo. (b) Magnetización por crecimiento de dominios favorables a un campo externo
aplicado. (c) Magnetización por orientación de dominios paralelamente al campo aplicado.

tal manera que la suma de todas ellas sea prácticamente nula.


Cuando se aplica un campo magnético externo al material ferromagnético, ocu-
rren dos efectos, debidos a la aparición de momentos de la fuerza magnética sobre los
momentos magnéticos de los dominios:

Los dominios cuya magnetización está orientada favorablemente al campo apli-


cado crecen (más electrones alinean su momento magnético en esa dirección),
mientras que los dominios con magnetización opuesta al campo aplicado decre-
cen (figura 10.4b).
La magnetización neta de cada uno de los dominios tiende a alinearse paralela-
mente al campo aplicado (figura 10.4c).

La consecuencia de estos dos efectos es una magnetización total muy elevada en el


material y paralela al campo aplicado, de manera que el campo magnético total en
el interior del material es mucho mayor que el campo externo, y el material se ha
convertido en un imán. Los materiales ferromagnéticos, por tanto, suelen tener valores
positivos muy elevados de la susceptibilidad magnética χm .
El ferromagnetismo depende de la temperatura, de tal modo que cada sustan-
cia ferromagnética tiene una temperatura crı́tica, llamada temperatura de Curie, por
encima de la cual la sustancia se convierte en paramagnética. Esto ocurre porque el
movimiento térmico aleatorio de los átomos crece cuando aumenta la temperatura, y
este efecto tiende a destruir los dominios magnéticos al vencer las fuerzas de interac-
ción entre espines. La temperatura de Curie del hierro es de 770 ◦ C, la del cobalto es
de 1080 ◦ C, y la del nı́quel es de 370 ◦ C.
Veamos un aspecto crucial del comportamiento de los materiales ferromagnéti-
cos. Un trozo de material ferromagnético se coloca en el seno de un campo magnético
uniforme B0 cuya intensidad podemos variar (si B0 es el campo creado por un solenoi-
de que colocamos rodeando al material ferromagnético, podemos variar la corriente
que pasa por el solenoide). Comenzamos con un valor B0 = 0 y vamos aumentando
este valor. En cada caso, medimos el campo total B en el interior del material y
representamos este valor frente al campo externo B0 según la gráfica de la figura 10.5.
Al ir aumentando el valor de B0 desde cero, el valor del campo interno B crece
rápidamente, ya que la alineación de los momentos magnéticos se va haciendo cada vez
mayor. Si continuamos aumentando el campo aplicado, se alcanza un punto en el que
no se pueden alinear más momentos magnéticos. Se dice entonces que se ha alcanzado
Ejercicios 133

B P
Br

B ap
Figura 10.5. Histéresis en un material ferromagnético en presencia de un campo externo.
En la figura Bap = B0 .

la saturación, a partir de la cual el campo interno sólo crece en la misma medida que
lo haga el campo externo aplicado. Llegamos ası́ al punto P de la figura 10.5.
Si ahora desde P se reduce el valor de B0 , esperando que B decrezca a lo largo
de la misma lı́nea por la que creció, esto no ocurre. Parte de la alineación de los
dominios magnéticos permanece al reducir el campo externo y existe un valor Br de
campo magnético interno incluso al apagar completamente el campo externo. Este
valor se llama campo remanente y el efecto que hemos descrito se llama ciclo de
histéresis del material. En el punto en el que B0 se ha hecho cero y B = Br , se dice
que el material se ha convertido en un imán permanente.
Cuando B0 no es cero, podemos definir en promedio la susceptibilidad magnética
χm o la permeabilidad relativa µr del material ferromagnético. Se observa que el valor
de µr es ahora muy grande. Por ejemplo, en el hierro es del orden de 5000, en una
aleación de hierro y nı́quel puede ser del orden de 25000, etc. El campo interno total
es mucho mayor que el campo aplicado.
Si la histéresis del material no es muy grande (es decir, Br es pequeño), se dice
que el material es magnéticamente blando, como el llamado hierro dulce. Estos ma-
teriales se usan en la construcción de los núcleos de transformadores y electroimanes,
pues interesa a veces revertir el sentido del campo o apagarlo. Sin embargo, cuando
la histéresis es grande, como en el acero al carbono, por ejemplo, el campo interno
permanece mucho tiempo después de apagar el externo, de manera que estos mate-
riales se usan en la fabricación de imanes permanentes o en las cintas de grabación
magnética.

10.6. Ejercicios
1. Un electrón de masa m = 9, 1 × 10−31 kg sigue una órbita circular de radio
r = 5 × 10−11 m a velocidad v = 2 × 106 m · s−1 en el plano xy en sentido horario.
Determinar su momento angular orbital y el momento magnético debido a esta
contribución.
Solución: Le = −9, 1 × 10−35 kg · m · s−2 k, me = 8, 1 × 10−24 A · m2 k.
2. Un cilindro tiene una magnetización homogénea M = 20000 A · m−1 paralela a
su eje. Determinar el campo magnético en el interior de este cilindro.
Solución: B = 0, 025 T.
3. Un solenoide de 5 vueltas por centı́metro posee un núcleo de hierro. Cuando
134 Materiales magnéticos

la corriente que circula por el devanado es de 2, 5 A, el campo magnético en


el interior del solenoide es de 1, 4 T. Determinar la permeabilidad relativa del
material.
Solución: µr = 890.
4. Un solenoide de 20 vueltas por metro transporta una corriente de 1, 5 A. Calcular
el campo magnético en su interior. Repetir el cálculo si el solenoide se llena con
un material de susceptibilidad magnética χm = 20.
Solución: B0 = 3, 8 × 10−5 T. B = 7, 9 × 10−4 T.
5. En el solenoide del problema anterior, determinar el campo magnético producido
por las corrientes de magnetización y la propia magnetización.
Solución: Bm = 7, 5 × 10−4 T. M = 597 A · m−1 .
Capı́tulo 11

Inducción electromagnética

11.1. Fem inducida


Hemos visto que una corriente eléctrica produce un campo magnético. En 1831, Fara-
day descubrió el efecto inverso: se puede inducir una corriente eléctrica en un circuito
por medio de un campo magnético.
La experiencia muestra que existen varias formas de utilizar un campo magnético
para generar una corriente eléctrica. Por ejemplo, coloquemos un imán permanente
cerca de una espira. Si no hay movimiento relativo entre el imán y la espira, la corriente
que circula por ésta es nula, pues no está conectada a ninguna fuente de fem. Cuando
aproximamos el imán a la espira se comprueba que ha aparecido una corriente en ella.
Si alejamos el imán, la corriente tiene sentido contrario. También se generarı́a una
corriente en la espira si moviéramos ésta pero no el imán.
La corriente en la espira se llama corriente inducida pues ha sido producida por
un campo magnético variable en el tiempo (el creado por el imán en la espira al haber
movimiento relativo entre ellos). Dado que siempre se necesita una fuente de fem para
producir una corriente, la misma espira se ha comportado en este ejemplo como una
fuente de fem. Esta fem se conoce como fem inducida.
Hay otras maneras de inducir una fem en una espira sin variar un campo magnéti-
co. Una de ellas consiste en cambiar el área interior de la espira (estirándola, por
ejemplo) y otra consiste en cambiar la orientación de la espira respecto al campo
magnético rotándola.
El fenómeno de producción de una fem con ayuda de un campo magnético se
llama inducción electromagnética. Los ejemplos que hemos visto de producción de
una fem en un circuito con ayuda de un campo magnético son manifestaciones de la
ley de Faraday, quien descubrió que, cuando el flujo magnético a través de la superficie
encerrada por un circuito cambia en el tiempo, entonces se induce una fem en el propio
circuito.

11.2. Fem de movimiento


Consideremos en detalle una de las maneras de inducir una fem con ayuda de un
campo magnético uniforme y constante. Supongamos que una varilla conductora de
longitud ℓ se mueve, por acción de algún agente externo (podemos moverla con la

135
136 Inducción electromagnética

Figura 11.1. Una varilla conductora de longitud ℓ se mueve a velocidad constante v en


presencia de un campo magnético B perpendicular a la varilla y a la velocidad.

mano) con velocidad v constante de manera perpendicular a un campo magnético


uniforme y constante B, según se observa en la figura 11.1.
Cada una de las cargas positivas que hay en la varilla conductora se mueven
entonces con esa velocidad v, de manera que sienten una fuerza magnética de módulo
Fm = qvB y dirigida hacia la parte de arriba de la varilla (usar para verlo la regla
de la mano derecha). Del mismo modo, cada carga negativa en la varilla siente la
misma fuerza pero dirigida hacia abajo. En consecuencia, se va acumulando carga
positiva en el extremo superior de la varilla y carga negativa en el extremo inferior.
Esto ocurre hasta que la fuerza eléctrica de atracción entre las cargas positivas y
negativas equilibra a la fuerza magnética que trata de separar las cargas. Al llegar a
este equilibrio, ya no se acumula más carga en los extremos de la varilla.
Las cargas que hay en los extremos al llegar al equilibrio han dado lugar a una
diferencia de potencial, llamada fem de movimiento. Este fem existe mientras se mueva
la varilla y actúa de manera análoga a la fem de una baterı́a, pero hay una diferencia:
en una baterı́a, la fem se produce por reacciones quı́micas en su interior, pero en la
varilla la fem de movimiento la crea el trabajo mecánico del agente externo que mueve
la varilla en el seno de un campo magnético.
En el equilibrio, la magnitud de la fem de movimiento se puede calcular igualando,
sobre cada carga, la fuerza magnética, que trata de llevarla hacia un extremo de la
varilla, y la fuerza eléctrica que tiene sentido contrario

qvB = qE, (11.1)

donde E es el campo eléctrico creado por las cargas de signos opuestos que hay en los
extremos de la varilla. Este campo eléctrico crea una diferencia de potencial entre los
extremos que está dada por ℓE, y que es la fem inducida en la varilla. En consecuencia,
de la ecuación (11.1) se obtiene
Eind
vB = , (11.2)

de donde la fem de movimiento inducida en la varilla resulta

Eind = vBℓ, (11.3)

ecuación que se cumple en el caso particular en que la varilla, el campo magnético y la


velocidad son perpendiculares dos a dos, B es uniforme y constante y v es constante.
Supongamos que ahora conectamos a los extremos de la varilla un circuito con una
resistencia R a través de dos raı́les conductores estacionarios, como en la figura 11.2.
Ley de Faraday 137

Fm v

Figura 11.2. Una varilla conductora se mueve sobre dos raı́les conductores estacionarios
conectados a una resistencia.

Debido a que la varilla está actuando como una fuente de fem, se produce una corriente
inducida en el circuito formado por la varilla, los raı́les y la resistencia. La corriente
a través de la resistencia está dada por
Eind vBℓ
I= = . (11.4)
R R
La resistencia disipa energı́a en forma de calor. La potencia disipada por la resistencia
viene dada por el producto de la corriente que la atraviesa y la diferencia de potencial
VR entre sus terminales, esto es,
(vBℓ)2
P = IVR = IEind = , (11.5)
R
de manera que, en un tiempo t, la energı́a que ha disipado la resistencia es
(vBℓ)2
U =Pt= t. (11.6)
R
La cuestión es de dónde saca esta energı́a la resistencia, es decir, quién realiza el
trabajo de alimentar el circuito. La fem de movimiento aparece porque hay una fuerza
magnética que actúa sobre las cargas de un conductor que se mueve en el seno de un
campo magnético. Al conectar una resistencia al circuito, circula por él una corriente

inducida. El campo externo B produce entonces una segunda fuerza magnética Fm

sobre la corriente inducida, dada por la expresión Fm = IℓB, que está dirigida en
sentido contrario al movimiento de la varilla (para verlo, usar la regla de la mano

derecha en la figura 11.2). Ası́, la fuerza Fm se opone a la velocidad v y frenarı́a el
movimiento de la varilla si no hubiera un agente externo (nuestra mano), que debe

estar ejerciendo una fuerza igual a Fm y de sentido opuesto para mantener la varilla
a velocidad constante v. Esto significa que es el agente externo el que está realizando
un trabajo igual a la energı́a (11.6) para alimentar el circuito. En otras palabras,
la varilla conductora y el campo magnético externo convierten trabajo mecánico en
energı́a eléctrica de la misma forma que una baterı́a convierte energı́a quı́mica en
energı́a eléctrica. Este es el fundamento de un generador eléctrico.

11.3. Ley de Faraday


La ley de Faraday de la inducción electromagnética relaciona la fem inducida en un
circuito con el cambio de flujo magnético a través de la superficie encerrada por él.
138 Inducción electromagnética

Consideremos, por ejemplo, la fem de movimiento que aparece al mover la varilla


conductora de la figura 11.1. El valor de la fem inducida en la varilla era Eind = vBℓ.
Si consideramos el eje x como aquel a lo largo del cual se está moviendo la varilla con
velocidad constante v, resulta v = dx/dt, de manera que podemos escribir

dx
Eind = Bℓ . (11.7)
dt
Dado que el área de la superficie encerrada por la varilla, los raı́les y la resistencia en
la figura 11.2 es S = ℓx, entonces Eind = BdS/dt, o bien, como el campo magnético
es constante,
d(BS)
Eind = . (11.8)
dt
Al usar la regla del sacacorchos en la figura 11.2 para obtener el vector normal a la
superficie encerrada por el circuito según el sentido de la corriente inducida, notamos
que este vector normal tiene sentido opuesto al campo magnético. De este modo, el
flujo magnético a través de la superficie encerrada por el circuito es

Φm = B · S = S B · n = −BS. (11.9)

Si se comparan las ecuaciones (11.8) y (11.9), se llega a que la fem inducida en la


varilla (y, por tanto, en el circuito) se puede escribir como

dΦm
Eind = − . (11.10)
dt
Esta es la expresión matemática de la ley de Faraday de la inducción. Esta ley implica
que existe una fem inducida en un circuito cuando el flujo magnético a través de la
superficie encerrada por el circuito varı́a en el tiempo. El signo menos en la ecuación
(11.10) se interpreta diciendo que la fem inducida se opone a la causa que la produce,
que es la variación del flujo magnético. Esta idea es lo que expresa la ley de Lenz, que
veremos a continuación.
Podemos escribir la fem inducida en un circuito cerrado C en función del campo
eléctrico E creado en el circuito según la expresión (7.17), es decir,
I
Eind = E · dr, (11.11)
C

siendo dr un desplazamiento infinitesimal a lo largo del circuito con el sentido de la


corriente inducida. Por otro lado, podemos escribir el flujo magnético a través de la
superficie S encerrada por el circuito C como
Z
Φm = B · dS, (11.12)
S

donde dS = dS n es un vector infinitesimal de superficie. Con estas dos expresiones,


la ley de Faraday (11.10) también puede escribirse
I Z
d
E · dr = − B · dS. (11.13)
C dt S
Ley de Lenz 139

B(t)

Figura 11.3. Una espira situada en un campo magnético uniforme perpendicular a ella. El
campo magnético varı́a uniformemente en el tiempo, creando una fem inducida en la espira
según la ley de Faraday.

Veamos un caso sencillo de aplicación de la ley de Faraday. Consideremos una


espira de N vueltas que encierra un área S. La espira está inmersa en un campo
magnético uniforme perpendicular a ella, como en la figura 11.3. El campo magnético
varı́a uniformemente en el tiempo, de manera que, en t = t0 , su valor es B0 y en un
instante posterior t = t1 , su valor es B1 . Vamos a calcular la fem inducida en la espira
durante este intervalo de tiempo.
El primer paso es calcular el flujo magnético a través de la espira en la dirección
del campo magnético. Dado que éste es uniforme y la espira encierra una superficie
plana y el campo es paralelo al eje de la espira, el flujo es Φ = N SB, ya que han de
tenerse en cuenta todas las vueltas de la espira. Utilizando ahora la ley de Faraday
(11.10) se obtiene
dΦ dB
Eind = − = −N S , (11.14)
dt dt
pues lo único que varı́a es el campo magnético. Para calcular la derivada del campo
magnético usamos que su variación es uniforme. Por tanto
B1 − B0
Eind = −N S . (11.15)
t1 − t0
El signo de la fem inducida depende del valor de la diferencia B1 − B0 . Si el campo
crece en el tiempo, B1 − B0 > 0, la fem inducida es negativa y la corriente inducida
tendrı́a un sentido. Si el campo decrece en el tiempo, B1 − B0 < 0, la fem inducida
es positiva y la corriente inducida tendrı́a el sentido contrario.

11.4. Ley de Lenz


Una fem inducida conduce una corriente en un circuito igual que lo hace la fem de
una baterı́a. En la baterı́a, la corriente se dirige desde el terminal positivo hacia el
terminal negativo a través del circuito. Lo mismo ocurre con la corriente inducida,
pero es necesario conocer cómo se asignan los terminales positivo y negativo en este
caso. Esto viene dado por la ley de Lenz.
Una observación básica es que el campo magnético neto que penetra un circuito
está formado por dos contribuciones. La primera es el campo magnético externo que
produce un cambio en el flujo y da lugar a la fem inducida. Además, hay una segunda
contribución dada por el campo magnético creado por la propia corriente inducida,
que se llama campo magnético inducido.
140 Inducción electromagnética

S N
+

Figura 11.4. Un imán se acerca a una espira. La ley de Lenz asigna la polaridad de la fem
inducida en la espira y el sentido de la corriente inducida.

La ley de Lenz dice que la fem inducida resultante de un campo magnético variable
tiene tal polaridad que la corriente inducida genera un campo magnético inducido que
se opone a la variación del flujo magnético original. Para aplicar correctamente esta
ley en conjunción con la ley de Faraday es útil seguir el siguiente esquema:

1. Se determina si el flujo magnético que atraviesa el circuito es creciente o decre-


ciente en el tiempo.
2. El sentido del campo magnético inducido se toma como opuesto al cambio del
flujo original.
3. La regla del sacacorchos, aplicada al campo magnético inducido, nos dice el sen-
tido de la corriente inducida y la polaridad de la fem inducida.
4. Por último, podemos aplicar la ley de Faraday en la forma


|Eind | = − , (11.16)
dt

para conocer el valor numérico de la fem inducida, una vez asignada su polaridad.

Veamos un ejemplo sencillo. Consideremos un imán permanente que se acerca a una


espira, según la figura 11.4. El circuito asociado a la espira consta de una resistencia
R. Aplicamos la ley de Lenz. El flujo magnético a través de la espira crece (hacia
la derecha) porque el campo magnético del imán sobre la espira crece al acercarse.
Ası́, el campo magnético inducido debe tener un sentido contrario al crecimiento del
flujo, por la ley de Lenz, y debe entonces dirigirse hacia la izquierda. Para crear un
campo magnético inducido hacia la izquierda, el sentido de la corriente inducida debe
ser antihorario, como se ve en la figura 11.4 aplicando la regla del sacacorchos. Este
sentido de la corriente nos da la polaridad de la fem inducida (indicada por los signos
+ y − en la figura, ya que en los circuitos se sigue el convenio de que en una fuente
la corriente va por su interior, del terminal negativo al positivo).

11.5. Inducción mutua y autoinducción

Hemos visto cómo se puede inducir una fem en una espira si la mantenemos fija y
movemos un imán cercano, o bien si dejamos fijo el imán y movemos o rotamos la
espira. Veamos ahora otro método de inducir fem en una bobina, formada por un
alambre conductor enrollado N veces alrededor de algún tipo de núcleo.
Inducción mutua y autoinducción 141

Figura 11.5. Una bobina conductora, conectada a una fuente de fem variable, se coloca
cerca de otra bobina sin conectar. En la segunda aparece una fem inducida.

Inducción mutua
Se sitúan cerca una de otra dos bobinas, una de ellas llamada bobina primaria y
la otra bobina secundaria, según la figura 11.5. La bobina primaria se conecta a un
generador de corriente variable, que envı́a una corriente I1 a través de ella. La bobina
secundaria no se conecta a nada. La corriente que conduce la bobina primaria crea un
campo magnético en sus cercanı́as. Una fracción significativa de este campo penetra
en la bobina secundaria y produce a través de ella un flujo magnético variable, pues
I1 es una corriente variable. Ası́ se induce una fem en la bobina secundaria.
El efecto por el cual una corriente variable en un circuito produce una fem in-
ducida en otro circuito cercano se llama inducción mutua. De acuerdo con la ley de
Faraday de la inducción, la fem E2 inducida en el circuito secundario es
dΦ2
E2 = − , (11.17)
dt
donde Φ2 es el flujo, a través del circuito secundario, del campo magnético producido
por la corriente variable I1 del circuito primario. Por tanto, Φ2 es proporcional a I1
y podemos escribir
dI1
E2 = −M , (11.18)
dt
donde la constante M , dada por la expresión
Φ2
M= , (11.19)
I1
se llama inductancia mutua. La unidad de inductancia mutua es el Henry (H), definido
como 1 H = 1 Wb · A−1 . Escrita en la forma (11.18) es claro que la fem inducida en
el circuito secundario se debe a la corriente variable en el circuito primario.
La inductancia mutua M depende, entre otros factores menos importantes, de
la geometrı́a de los circuitos. Para guiar las lı́neas magnéticas y aumentar el flujo,
se emplean núcleos ferromagnéticos en las bobinas. Aunque M se puede calcular
analı́ticamente en algunos casos sencillos, lo normal es medirla experimentalmente.

Autoinducción
En todos los ejemplos de fem inducida que hemos visto hasta ahora, el campo magnéti-
co ha sido producido por alguna fuente externa, como un imán u otro circuito. Sin
embargo, esto no es absolutamente necesario. Se puede inducir una fem en una bobina
si se cambia el campo magnético que ella misma produce. Para verlo, consideremos
142 Inducción electromagnética

Figura 11.6. Sı́mbolo de un inductor en un circuito.

una bobina conectada a una fuente de fem variable, de manera que la corriente I
que circula por la bobina es también variable. Esta corriente crea un flujo magnético
variable a través de la propia bobina, de modo que, siguiendo la ley de Faraday, se
induce una fem extra en la bobina. El efecto por el cual una corriente variable en un
circuito induce una fem en el mismo circuito se conoce como autoinducción.
Como en el caso de la inducción mutua, conviene reescribir la ley de Faraday
en función de la variación de la corriente. Para ello se introduce una constante L,
llamada autoinductancia, dada por la expresión
Φ
L= , (11.20)
I
donde Φ es el flujo magnético a través del circuito e I es la corriente variable que
circula por él. La fem inducida en el propio circuito es, entonces,
dI
E = −L . (11.21)
dt
Una bobina o solenoide con muchas vueltas y núcleo ferromagnético se llama
inductor y, frecuentemente, su autoinductancia es mucho mayor que la del resto del
circuito, de manera que sólo se tiene en cuenta la fem inducida en el inductor, des-
preciándose la del resto del circuito.
El sı́mbolo de un inductor en un circuito es el de la figura 11.6. Dado que la fem
autoinducida en un inductor se opone a la causa que la produce, que es la fem del
variable del generador conectado al circuito, podemos tomar un inductor como un
elemento del circuito en el que cae potencial eléctrico. Esto implica que se comporta
en un circuito como una resistencia pero, en lugar de caer en él un potencial dado
por VR = IR, cae un potencial dado por la ecuación (11.21) cambiada de signo. En
un inductor de un circuito cae un potencial VL dado por
dI
VL = L , (11.22)
dt
y ası́ lo estudiaremos en los capı́tulos dedicados a circuitos.

11.6. Energı́a magnética almacenada en un inductor


Al igual que un condensador almacena energı́a eléctrica, un inductor almacena energı́a
magnética. Esta energı́a proviene del trabajo necesario para establecer una corriente
a través del inductor.
Consideremos un inductor conectado a un generador cuyo potencial se varı́a uni-
formemente desde 0 hasta V , su valor final. La corriente a través del inductor cre-
cerá desde 0 hasta su valor final, apareciendo una fem inducida dada por
dI
E = −L , (11.23)
dt
El generador eléctrico 143

cuya polaridad se opone a la del generador, de manera que el generador tiene que rea-
lizar un trabajo para vencer esta fem inducida. El trabajo realizado por el generador
para mover una carga dq a través del inductor es
dI dq
dW = −Edq = L dq = L dI = LIdI, (11.24)
dt dt
de manera que el trabajo total realizado por el generador para establecer una corriente
que crece desde 0 hasta su valor final I, igual a la energı́a magnética Um almacenada
por el inductor, es
Z I
LI 2
Um = W = LIdI = . (11.25)
0 2
Hay otra manera más general de interpretar este resultado. Al establecer una corriente
a través del inductor, éste crea un campo magnético, de manera que el trabajo reali-
zado para establecer la corriente es también el trabajo necesario para crear ese campo
magnético. La energı́a almacenada en el inductor es la energı́a del campo magnético.
Consideremos que el inductor es un solenoide sin núcleo ferromagnético de longi-
tud ℓ, sección de área S y n vueltas por unidad de longitud, que conduce una corriente
I. La autoinductancia de este solenoide resulta

L = µ0 n2 Sℓ, (11.26)

(ver ejercicios), y el campo magnético que se crea en su interior vale B = µ0 nI. Por
tanto, la energı́a magnética que almacena es

LI 2 B2
Um = = V, (11.27)
2 2µ0
pues V = S ℓ es el volumen interior del solenoide, y es también, aproximadamente,
igual al volumen de la región del espacio donde el campo magnético creado por el
solenoide es relevante. Se define entonces la densidad de energı́a magnética um como
la energı́a de un campo magnético por unidad de volumen. En el caso del solenoide,

Um B2
um = = . (11.28)
V 2µ0
En el caso general en que un campo magnético está definido en una determinada
región del espacio de volumen V, su intensidad dependerá del punto del espacio, y
también lo hará la densidad de energı́a magnética um . La energı́a magnética en este
caso general está dada por la expresión
Z Z
B2
Um = um dV = dV. (11.29)
V V 2µ0

11.7. El generador eléctrico


Prácticamente toda la enegı́a eléctrica que se utiliza en el mundo se produce en forma
de corriente eléctrica a través de generadores eléctricos. El funcionamiento de estos
generadores se basa en la inducción electromagnética para producir una fem sinusoidal
144 Inducción electromagnética

B
n α
ω

ε
Figura 11.7. Un generador eléctrico simple

cuando enormes bobinas rotan en presencia de campos magnéticos producidos por


electroimanes.
Un generador eléctrico simple está formado por una espira de N vueltas y área
S que rota con velocidad angular constante ω entre los polos de un electroimán que
produce un campo magnético uniforme B, según vemos en la figura 11.7. El electro-
imán se llama inductor del generador, y la espira se llama inducido. Los terminales
del inducido están conectados solidariamente a unos anillos metálicos deslizantes que
giran al rotar la espira. Cada uno de estos anillos roza a una escobilla de grafito (se
usa este material para evitar chispazos), de manera que la diferencia de potencial
entre los terminales de la espira, que es la misma que hay entre los anillos deslizantes,
es igual a la diferencia de potencial entre las escobillas de grafito. Las escobillas son
los terminales del circuito externo al que el generador alimenta.
Consideremos una situación inicial en la que el vector normal a la espira forma
un ángulo α0 con el campo magnético uniforme del electroimán. Empezamos ahora a
hacer un trabajo mecánico rotando la espira con velocidad angular ω constante. Esto
significa que el ángulo α que forman la normal a la espira y el campo magnético del
electroimán va variando en el tiempo según la expresión

α = α0 + ωt. (11.30)

Según la ley de Faraday, se induce entonces una fem E en la espira dada por

E =− , (11.31)
dt
donde Φ es el flujo magnético a través de la espira,

Φ = N SB cos α = N SB cos (α0 + ωt). (11.32)

Entonces la diferencia de potencial creada por el generador, y aplicada al circuito


externo mediante las escobillas, es

E = N SBω sen (α0 + ωt) = A sen (α0 + ωt), (11.33)

donde
A = N SBω, (11.34)
es una constante caracterı́stica del generador, llamada amplitud o valor de pico de
la fem sinusoidal. La unidad de fem de pico es 1 V. En consecuencia, un generador
El generador eléctrico 145

ε
−A

1/2f 1/f 3/2f


t

Figura 11.8. Representación gráfica de una fem sinusoidal.

eléctrico transforma energı́a mecánica, la necesaria para rotar la espira, en energı́a


eléctrica.
En la figura 11.8 se ha representado el valor de la diferencia de potencial E entre
los terminales de un generador eléctrico frente al tiempo t, suponiendo que la fase
inicial α0 es cero por simplicidad (siempre se puede elegir α0 a conveniencia eligiendo
el origen de tiempos apropiadamente). Como vemos en esta figura, la fem E es una
función periódica sinusoidal, de amplitud A y frecuencia angular ω. La unidad de
frecuencia angular es 1 rad · s−1 . La interpretación fı́sica de esta cantidad se aclara
definiendo la frecuencia f de la fem E como
ω
f= , (11.35)

que es el número de veces que la fem alcanza su valor máximo A (o mı́nimo −A) en
un segundo, contando a partir del momento en que tiene ese mismo valor. La unidad
de frecuencia es el Herzio (Hz), definido como 1 Hz = 1 s−1 . El inverso de la frecuencia
2π 1
T = = , (11.36)
ω f
se llama periodo de la fem y su unidad es 1 s. El periodo es el tiempo que pasa
desde que la fem tiene su valor máximo (o mı́nimo) hasta que vuelve a tenerlo. En
la práctica es común dar las caracterı́sticas de la fem de un generador de corriente
alterna mediante su valor de pico A y su frecuencia f . Conocidos estos datos, es
directo escribir la fem como E = A sin (2πf t) (asumiendo que α0 es cero).
Como hemos visto, la fem proporcionada por un generador eléctrico cambia su
polaridad a medida que rota la espira, lo cual es propio de la corriente alterna. Ası́,
si se conecta un circuito externo al generador, que se suele denominar circuito de
carga, a través de él habrá una corriente alterna que cambia su sentido con la misma
frecuencia f con la que la fem cambia su polaridad. En los circuitos, el sı́mbolo de un
generador que proporciona una fem de este tipo es el que vemos en la figura 11.5.
Algunas centrales eléctricas queman combustible fósil (carbón, gas o petróleo)
para calentar agua y producir gas presurizado que hace girar enormes turbinas cuyos
ejes están unidos al generador, mientras que otras usan cascadas de agua o energı́a
nuclear como fuente de trabajo mecánico. Si el circuito de carga, o conjunto de dis-
positivos a los que el generador proporciona energı́a eléctrica, está desconectado del
146 Inducción electromagnética

Turbina Generador

Figura 11.9. Un generador eléctrico que proporciona energı́a a un edificio.

generador, se dice que éste funciona bajo una condición sin carga porque no hay co-
rriente en el circuito externo y el generador no proporciona energı́a eléctrica. En este
caso, el único trabajo que hay que realizar sobre la turbina es el necesario para vencer
la fricción y otras pérdidas mecánicas en el interior del generador y el necesario para
mantener el campo magnético, ası́ que el consumo de energı́a es mı́nimo.
Supongamos ahora que se conecta un circuito de carga al generador (como los
edificios mostrados en la figura 11.9). Existe una corriente alterna I a través del
circuito, de modo que esta misma corriente recorre la espira del generador. La espira
tiene un momento magnético m que no tenı́a en la condición sin carga y, dado que
está inmersa en un campo magnético, siente un momento de torsión magnético que
trata de hacerla rotar para colocar su eje paralelo al campo magnético. Obviamente,
no se crea energı́a mecánica de rotación de la nada, ası́ que este momento de torsión
(que se suele denominar contramomento del generador) ha de oponerse a la rotación
inducida por la turbina. En consecuencia, a mayor corriente cedida por el generador,
mayor es el contramomento y más trabajo mecánico habrá que realizar para mantener
la espira rotando a velocidad angular constante. Es decir, la turbina debe hacer un
trabajo mayor cuando la corriente es mayor, quemando más combustible por ejemplo.

11.8. Ejercicios
1. Una espira de 20 vueltas encierra un área de 10−3 m2 . La espira está inmersa en
un campo magnético uniforme perpendicular a ella de tal manera que, en t = 0,
B = 0, 03 T, y en t = 0, 1 s, B = 0, 01 T. Calcular la fem inducida en la espira
durante ese intervalo de tiempo y su polaridad.
Solución: Eind = 4 mV.
2. Una espira cuadrada de lado a, N vueltas y resistencia R está situada en el plano
xy, con su centro en el origen. Esta espira está inmersa en un campo magnético
dado por las ecuaciones

B = B0 k, y > 0,
B = 0, y < 0,

donde B0 es una constante. Calcular la magnitud y sentido de la corriente in-


ducida en la espira cuando ésta se desplaza con velocidad constante v0 en los
siguientes casos: (a)v = v0 i, (b) v = v0 j, (c) v = −v0 j.
Solución: (a) Iind = 0. (b) Iind = (N av0 B0 )/R, en sentido horario. (c) Iind =
(N av0 B0 )/R, en sentido entihorario.
3. Una espira de 50 vueltas encierra un área de 0, 02 m2 . La espira está inmersa en
Ejercicios 147

un campo magnético uniforme y constante B = 0, 18 T. Inicialmente, el eje de


la espira es paralelo al campo. Comienza a rotar uniformemente y, al cabo de
t = 0, 1 s, el eje de la espira forma un ángulo de 30◦ con el campo. Calcular la
fem inducida en la espira durante ese intervalo de tiempo y su polaridad.
Solución: Eind = 2, 4 V.
4. Un campo magnético uniforme y constante de 0, 15 T es perpendicular a una
espira circular de 1 vuelta y 0, 3 m de radio. La espira se deforma uniformemente
en un cuadrado al cabo de 0, 5 s. Encontrar la magnitud de la fem media inducida
en la espira durante ese tiempo y su polaridad.
Solución: Eind = 0, 018 V.
5. Sobre una espira cuadrada, de lado a = 1 cm, 1 vuelta y resistencia R = 100 Ω,
descansa un cable conductor rectilı́neo muy largo, paralelo a un lado de la espira
y a una distancia d = 0, 25 cm del centro de ésta. El cable conduce una corriente
I = 1 mA. Si esta corriente se va a cero uniformemente en 0, 1 s, determinar la
corriente inducida durante ese tiempo en la espira.
Solución: Iind = 2, 2 × 10−13 A.
6. Dos varillas conductoras paralelas, ambas de longitud ℓ y resistencia R, se mue-
ven con la misma velocidad v perpendicular a su longitud en el mismo sentido.
Perpendicular a ambas varillas y a su velocidad hay un campo magnético B.
Determinar la fem inducida en cada varilla.
Eind = vBℓ, Iind = 0.
7. Una varilla conductora de masa m y longitud ℓ cae debido a su propio peso
moviéndose sin rozamiento entre dos raı́les verticales. Los raı́les están conectados
entre sı́ por arriba por una resistencia R. Hay un campo magnético uniforme y
constante B perpendicular al plano formado por varilla y raı́les. En el equilibrio,
determinar la fem inducida en la varilla y su polaridad, la corriente a través de
la resistencia, y la velocidad de caı́da de la varilla.
Solución: Eind = vBℓ, Iind = vBℓ/R, v = mgR/(B 2 ℓ2 ).
8. Un solenoide de longitud ℓ = 8 cm y sección de área S = 0, 5 cm2 contiene
n = 6500 vueltas por metro y carece de núcleo ferromagnético. Calcular la auto-
inductancia del solenoide.
Solución: L = 2 · 10−4 H.
9. Un solenoide de longitud ℓ y número de vueltas N1 está conectado a un generador
de corriente alterna, de tal manera que la corriente a través del solenoide es
I = I0 sen (2πf t). En el interior del solenoide se coloca una bobina de número
de vueltas N2 y sección de área S2 . Suponiendo que todas las lı́neas del campo
en el interior del solenoide pasan por la bobina, determinar la fem inducida en
ésta y el coeficiente de inductancia mutua.
Solución: Eind = −(µ0 N1 N2 S2 /ℓ)2πf cos (2πf t). M = µ0 N1 N2 S2 /ℓ.
10. Un generador de corriente alterna está formado por una bobina circular de 25
vueltas y radio a = 140 mm que gira con una velocidad angular ω = 300 rad · s−1
en un campo magnético B = 0, 2 T. Determinar la fem de pico, la frecuencia y el
periodo de la fem generada.
Solución: E0 = 92 V, f = 48 Hz, T = 0, 021 s.
Capı́tulo 12

Ondas electromagnéticas

12.1. Ecuaciones de Maxwell


Hasta ahora hemos estudiado las leyes que rigen el comportamiento de cargas y co-
rrientes y su relación con los campos eléctricos y magnéticos. Estas leyes conforman
las llamadas ecuaciones de Maxwell, que constituyen una descripción completa de los
fenómenos electromagnéticos a nivel clásico (bajo hipótesis de comportamiento no
cuántico de partı́culas y campos).

Ley de Gauss del campo eléctrico


La primera ecuación de Maxwell corresponde a la ley de Gauss del campo eléctrico,
que vimos en el capı́tulo 5 y que es la expresión matemática del hecho de que las
fuentes y sumideros de lı́neas de campo eléctrico son las cargas eléctricas. Esta ley
dice que el flujo eléctrico a través de una superficie cerrada S es igual a la carga total
Qint encerrada por ella dividida por ε0 ,
I
Qint
Φe = E · dS = , (12.1)
S ε0
donde dS = dS n es el elemento vectorial de área de la superficie, siendo n un vector
unitario normal exterior a la superficie S en cada punto y dS el área de un trozo
infinitesimal de la superficie en torno a ese punto. El cı́rculo en el sı́mbolo de la
integral es una manera de indicar que S ha de ser una superficie cerrada. En la
figura 12.1 se observa una superficie gaussiana S, su vector normal en un punto n y
el campo eléctrico E en ese mismo punto.

E
n
S

Figura 12.1. Una superficie gaussiana (cerrada), el valor del vector normal exterior y el
campo eléctrico en uno de sus puntos. En general, ambos vectores no son paralelos, como se
puede ver.

149
150 Ondas electromagnéticas

B
n
S
ut
C
E

Figura 12.2. Una trayectoria cerrada C y una superficie S encerrada por C. Se indican
el vector tangente ut (paralelo al desplazamiento dr a lo largo de C), el campo eléctrico E
en un punto de C, el vector normal n (paralelo al elemento vectorial de superficie dS), y el
campo magnético B en un punto de S. Nótese que los sentidos del vector tangente a C y el
vector normal a S están relacionados entre sı́ por la regla del sacacorchos.

Ley de Gauss del campo magnético


Como vimos en el capı́tulo 9, las lı́neas de campo magnético son siempre lı́neas cerra-
das, o dicho de otro modo, no existen o no se han encontrado monopolos magnéticos
(cargas magnéticas aisladas). Esto implica que toda lı́nea magnética que entra en
una superficie cerrada tiene que salir necesariamente de ella. Como consecuencia, el
flujo magnético a través de una superficie cerrada será siempre cero. La expresión
matemática de esta ley es I
Φm = B · dS = 0. (12.2)
S

Ley de Faraday
La tercera ecuación fundamental es la ley de Faraday de la inducción: existe una fem
inducida en un circuito cuando el flujo magnético a través de la superficie encerrada
por el circuito varı́a en el tiempo.
La fem inducida en un circuito cerrado C se puede escribir en función del campo
eléctrico E, I
Eind = E · dr, (12.3)
C
siendo dr un desplazamiento infinitesimal a lo largo del circuito con el sentido de
la corriente inducida. Se puede escribir también el flujo magnético a través de una
superficie S encerrada por C como
Z
Φm = B · dS, (12.4)
S

donde dS = dS n es un vector infinitesimal de superficie. La ley de Faraday se expresa


entonces matemáticamente como
I Z
d
E · dr = − B · dS, (12.5)
C dt S
en donde la regla del tornillo determina la relación entre el sentido del vector normal
a la superficie S y el del vector tangente a la curva C. En la figura 12.2 tenemos un
ejemplo de trayectoria cerrada C y una superficie S encerrada por ella.
Ecuaciones de Maxwell 151

Ley de Ampère-Maxwell
La última ecuación de Maxwell es una generalización de la ley de Ampère que vimos
en el capı́tulo 9: la circulación de un campo magnético a lo largo de una curva cerrada
C es igual a µ0 veces la corriente IC que atraviesa la superficie encerrada por la curva.
Dada una curva cerrada orientada C (con un sentido de giro determinado a lo largo
de ella), su circulación se escribe
I
Υ= B · dr, (12.6)
C

siendo el desplazamiento infinitesimal dr paralelo en cada punto de C al vector tan-


gente ut . De este modo, la ley de Ampère se puede escribir
I
B · dr = µ0 IC . (12.7)
C

Para que esta ley sea válida es necesario que la corriente IC sea continua, es decir,
que no se interrumpa en ningún punto.
Interesa escribir la corriente IC que atraviesa una superficie S encerrada por C
en función del vector densidad de corriente j, definido en el capı́tulo 7. La relación
entre la corriente que atraviesa una superficie y el vector densidad de corriente en ella
era Z
IC = j · dS. (12.8)
S
La ley de Ampère (12.7) queda escrita entonces como
I Z
B · dr = µ0 j · dS. (12.9)
C S

En esta ecuación, j está relacionada con todas las corrientes que atraviesan la superficie
S, tanto si son corrientes en un conductor como si son corrientes de magnetización
en un material. También aquı́ la regla del sacacorchos relaciona el sentido del vector
normal a la superficie S en dS con el del vector tangente a C en dr. Un ejemplo de
aplicación de esta ley es la propia figura 12.2, sustituyendo el campo eléctrico de la
figura por el campo magnético, y el campo magnético de la figura por la densidad de
corriente j.
Sin embargo, la ley de Ampère, tal como está escrita en la ecuación (12.9), es
incompleta, básicamente porque necesita que la corriente sea continua. Para verlo,
basta considerar una superficie S cerrada. En este caso, la circulación del campo
magnético ha de ser nula, pues no hay una curva C que delimite una superficie ya
cerrada. Obviamente, esto significa que
I
j · dS = 0. (12.10)
S

Esta ecuación no puede ser cierta en todos los casos. Si una corriente está cargando
una placa conductora a través de un hilo y S es una superficie cerrada que encierra
la placa, existe un flujo de corriente a través de S que es la carga que la atraviesa por
unidad de tiempo, es decir, hemos de sustituir la ecuación (12.10) por la igualdad
I
dq
j · dS = − , (12.11)
S dt
152 Ondas electromagnéticas

donde q es la carga que entra en S. Por la ley de Gauss (12.1), esto se puede escribir
como I I
d
j · dS + ε0 E · dS = 0. (12.12)
S dt S

Este ejemplo permitió a James Clerk Maxwell generalizar la expresión (12.9) para
incluir el caso de una corriente discontinua. La solución es sustituir el segundo término
de la ley de Ampère (12.9) por el que aparece en la ecuación (12.12). Resulta entonces
la ecuación I Z Z
d
B · dr = µ0 j · dS + ε0 µ0 E · dS, (12.13)
C S dt S
que es la cuarta ecuación general del electromagnetismo, y que se conoce con el nombre
de ley de Ampère-Maxwell. En ella, el último sumando de la ecuación (12.13) se llama
corriente de desplazamiento.
Las ecuaciones fundamentales (12.1), (12.2), (12.5) y (12.13) se llaman ecuaciones
de Maxwell, y constituyen seguramente uno de los mayores logros en la historia de la
fı́sica teórica.

Ecuaciones del electromagnetismo estático


Cuando los campos eléctrico y magnético no varı́an en el tiempo, se tiene el caso
estático. Las derivadas de ambos campos respecto al tiempo son nulas y las ecuaciones
de Maxwell (12.1), (12.2), (12.5) y (12.13) quedan reducidas a
I
Qint
E · dS = , (12.14)
ε0
IS
B · dS = 0, (12.15)
IS
E · dr = 0, (12.16)
C
I Z
B · dr = µ0 j · dS. (12.17)
C S

Las dos primeras ecuaciones resultan inalteradas. Esto es lógico, porque reflejan el
hecho de que las fuentes y sumideros de lı́neas de campo eléctrico son las cargas
eléctricas, y que el campo magnético no tiene fuentes ni sumideros.
Por su parte, la ecuación (12.16) establece que la circulación de un campo eléctri-
co estático a lo largo de una curva cerrada es cero. Esto indica que el campo eléctri-
co estático es conservativo, es decir, se puede escribir en términos de un potencial
electrostático. Por último, la ecuación (12.17) es la ley de Ampère para el campo
magnético estático. Las ecuaciones estáticas separan completamente electricidad y
magnetismo, tratándolo como si fueran fenómenos diferentes.

12.2. Movimiento ondulatorio


Las ecuaciones de Maxwell, además de resumir todas las leyes del electromagnetismo,
son capaces de predecir también la existencia de ondas electromagnéticas. Antes de
Movimiento ondulatorio 153

estudiar estas soluciones de las ecuaciones de Maxwell, veamos algunas propiedades


generales de las ondas.
Cuando se produce una perturbación de las propiedades de un medio material en
un punto de este medio que llamaremos foco, esta perturbación se propaga a resto de
los puntos del medio con un retraso que depende de la distancia al foco. Al movimiento
de la perturbación en el medio se le llama movimiento ondulatorio u onda.
En una onda no se propaga materia, sino energı́a. Los puntos del medio a los
cuales la perturbación llega en el mismo instante de tiempo tienen el mismo estado
de perturbación y constituyen lo que se denomina frente de onda. Según la forma
geométrica de los frentes de onda, se dice que las ondas son planas, cilı́ndricas, esféri-
cas, etc.
La perturbación que se propaga puede ser una magnitud escalar, o una magnitud
vectorial. Si la dirección en la cual varı́a esta magnitud coincide con la dirección de
propagación de la misma, se dice que tenemos ondas longitudinales, como las ondas
sonoras. Si, por otro lado, la dirección en la cual varı́a la magnitud es perpendicular
a la dirección de propagación de la misma, se dice que es una onda transversal, como
las ondas en la superficie de un lı́quido.

Ondas escalares en una dimensión

Para describir el movimiento ondulatorio en una dimensión espacial, que tomaremos


como eje x, necesitamos conocer la función y(x, t) que da el estado y de la perturbación
para cada punto x del eje de propagación en cada instante de tiempo t. Se elige el
origen de coordenadas de modo que el foco de la perturbación se encuentra en el
punto x = 0.
Supongamos que, en el instante inicial t = 0, el estado de la perturbación está da-
do por y(x, 0) = f (x). Si la perturbación se propaga a velocidad constante v, llamada
velocidad de propagación, y además la perturbación no se ve atenuada al propagarse,
entonces en el instante t habrá recorrido una distancia vt a lo largo del eje x positivo,
y tendrá un estado dado por y(x, t) = f (x − vt). Por su parte, para los puntos del
eje x negativo, podemos cambiar el signo a la velocidad y decir que el estado de la
perturbación es y(x, t) = f (x + v t).
Por el teorema de Fourier, existe una manera de descomponer las ondas unidimen-
sionales que hemos visto en suma de ondas armónicas, en las cuales la perturbación
inicial f (x) es una función sinusoidal. Las ondas armónicas unidimensionales que se
propagan sin atenuarse a lo largo del eje x positivo se pueden escribir como

y(x, t) = A sen k(x − v t), (12.18)

siendo A la amplitud de la onda (el valor máximo que puede tomar la perturbación
en cada punto), y k el número de onda, con unidades de inversa de longitud. En la
figura 12.3 podemos ver el aspecto de la perturbación y en el instante inicial t = 0 y
en un instante posterior t. Se observa que, en cada punto del eje, la perturbación y
realiza un movimiento periódico entre los valores y = −A e y = A. La distancia en el
eje x de propagación entre dos puntos consecutivos que, en todo momento, tienen el
mismo estado de perturbación se llama longitud de onda λ. Estos dos puntos deben
satisfacer la condición y(x, t) = y(x + λ, t). Usando la expresión (12.18) para la onda
154 Ondas electromagnéticas

λ
A

t1

y
t
0

−A

Figura 12.3. Perturbación armónica unidimensional para el instante inicial t = 0 y para un


instante posterior t. La longitud de onda λ es la distancia entre dos puntos consecutivos con
el mismo estado de perturbación.

armónica, esta condición se concreta en

A sen k(x − v t) = A sen k(x + λ − v t), (12.19)

de donde kλ = 2π, o bien



λ= . (12.20)
k
El número de onda k es el número de longitudes de onda en la distancia 2π.
Por otro lado, dada la periodicidad del movimiento en cada punto del eje de
propagación, podemos definir el periodo T como el tiempo que tarda cada punto en
volver a un estado de perturbación dado. Por la expresión (12.18), se ha de cumplir

A sen k(x − v t) = A sen k(x − v t − v T ), (12.21)

por lo que
2π λ
T = = . (12.22)
kv v
La frecuencia temporal f de la perturbación armónica, que es el número de veces que
la perturbación en un punto repite su estado durante 1 s, es la inversa del periodo,
1 kv v
f= = = , (12.23)
T 2π λ
y su unidad SI es el Herzio (Hz). La frecuencia angular ω se define como

ω = 2π f = = k v, (12.24)
T
y su unidad SI es 1 rad · s−1 .
Dada la definición (12.24) de la frecuencia angular, se puede escribir la pertur-
bación armónica unidimensional que se propaga a lo largo del eje x positivo de la
forma
y(x, t) = A sen (k x − ω t), (12.25)
Ondas electromagnéticas en el vacı́o 155

donde la velocidad de propagación de la perturbación es

ω λ
v= = . (12.26)
k T

Ondas escalares en varias dimensiones

En dos dimensiones, una perturbación escalar en un medio queda descrita mediante


una función h(x, y, t). Ondas en dos dimensiones aparecen, por ejemplo, cuando ti-
ramos una piedra al centro de un estanque. Se suelen denominar, según la forma de
su frente de ondas, planas, circulares, etc. En tres dimensiones una onda está des-
crita mediante una función h(x, y, z, t) = h(r, t). Existen ondas esféricas, cilı́ndricas,
planas, elipsoidales, etc. Por ejemplo, la onda unidimensional dada por la ecuación
(12.25) es una onda plana, pues sus frentes son los planos ortogonales al eje x en cada
punto.
En general, una onda plana en tres dimensiones, con foco en el origen, que se
propaga con velocidad v a lo largo del eje dado por un vector unitario u, se puede
escribir como
h(r, t) = f (u · r − v t). (12.27)

Vemos que, si u = i, tenemos la onda en el eje x. En el caso de una onda plana


armónica en tres dimensiones, la función f es de tipo sinusoidal, de modo que podemos
expresar el estado de la perturbación como

h(r, t) = A sen k(u · r − v t), (12.28)

o bien, en términos de la frecuencia angular ω = k v, y del vector de onda k = k u,

h(r, t) = A sen (k · r − ω t). (12.29)

12.3. Ondas electromagnéticas en el vacı́o

Las ecuaciones de Maxwell, además de resumir todas las leyes del electromagnetismo
que hemos visto hasta ahora, son capaces de predecir también la existencia de las
ondas electromagnéticas y de explicar cómo se propaga la luz.

Ecuaciones de Maxwell en el vacı́o

Cuando consideramos el comportamiento de los campos eléctrico y magnético en una


región del espacio vacı́o lejos de las cargas y corrientes que los han creado, decimos
que estamos estudiando los campos en el vacı́o. El conocimiento de estos campos es
importante para establecer conclusiones sobre la radiación electromagnética, es decir,
la propagación de energı́a eléctrica y magnética a través del espacio. Si tomamos las
156 Ondas electromagnéticas

ecuaciones de Maxwell en una región donde q = 0 y j = 0, llegamos a las ecuaciones


I
E · dS = 0, (12.30)
IS
B · dS = 0, (12.31)
IS Z
d
E · dr = − B · dS, (12.32)
C dt S
I Z
d
B · dr = ε0 µ0 E · dS. (12.33)
C dt S

Las soluciones de estas ecuaciones para el campo eléctrico y el campo magnético en


cada punto del espacio r y en cada instante de tiempo t constituyen las llamadas ondas
electromagnéticas. Debido a que en las ecuaciones (12.32) y (12.33), las variaciones
temporales del campo eléctrico dan lugar a variaciones espaciales del campo magnético
y a la inversa, la radiación electromagnética es capaz de mantenerse por sı́ misma,
viajando grandes distancias a través del espacio.
Como hemos visto en el apartado 12.2, las ondas se pueden escribir en el espacio
como una composición de ondas planas armónicas en tres dimensiones. Será suficien-
te para nosotros comprobar qué condiciones imponen las ecuaciones de Maxwell en
el vacı́o (12.30)–(12.33) a los campos eléctrico y magnético dados por este tipo de
ondas. En este caso, en lugar de ondas escalares como las de la ecuación (12.29), la
perturbación que se propaga está formada por dos vectores (los campos eléctrico y
magnético). Escribiremos las ondas electromagnéticas planas armónicas como

E = E0 sen (k · r − ω t), (12.34)


B = B0 sen (k · r − ω t). (12.35)

En estas expresiones, como en la ecuación (12.29), el vector r indica el punto del


espacio y t es el instante de tiempo considerados. El vector k es el vector de onda y
su dirección y sentido nos dice hacia dónde se propaga la radiación electromagnética,
y ω es la frecuencia angular. E0 y B0 son vectores que supondremos constantes y que
representan las amplitudes vectoriales de los campos eléctrico y magnético respecti-
vamente. Estas ondas se llaman monocromáticas.
Para simplificar los cálculos, podemos elegir nuestro sistema de referencia de tal
manera que la onda se propaga a lo largo del eje z en sentido positivo. En este caso,
las ecuaciones (12.34) y (12.35) resultan

E = E0 sen (kz − ωt), (12.36)


B = B0 sen (kz − ωt). (12.37)

Condiciones impuestas por la ley de Gauss


Veamos las condiciones que la ley de Gauss para los campos eléctrico y magnético en
el vacı́o imponen sobre las ondas monocromáticas dadas por las ecuaciones (12.36) y
(12.37). La ley de Gauss para el campo eléctrico en el vacı́o está dada por la ecuación
(12.30), y el campo eléctrico es el de la ecuación (12.36).
Ondas electromagnéticas en el vacı́o 157

z
L

y
x
Figura 12.4. Un cubo de lado L con centro en el origen para aplicar la ley de Gauss.

Consideremos, como superficie gaussiana, un cubo de lado L con centro en el ori-


gen y con aristas paralelas a los ejes de coordenadas, tal como vemos en la figura 12.4.
El vector constante E0 en función de sus coordenadas es
E0 = E0x i + E0y j + E0z k. (12.38)
El flujo a través del cubo de la figura 12.4 es igual a la suma de los flujos a través
de cada una de sus caras. Para que este flujo sea igual a cero, cumpliendo la ley de
Gauss, se ha de imponer (ver Ejercicios) que
E0z = 0, (12.39)
es decir, el campo eléctrico ha de ser perpendicular a la dirección de propagación (que
era el eje z). En general, esta condición se puede escribir
E0 · k = 0. (12.40)
De la misma manera, para que la ley de Gauss se mantenga para el campo magnético
B de una onda plana armónica, se ha de cumplir que sea perpendicular a la dirección
de propagación de la onda,
B0 · k = 0. (12.41)

Condiciones impuestas por la ley de Faraday


Pasemos ahora a examinar la ley de Faraday (12.32) para los campos en el vacı́o dados
por las expresiones (12.36) y (12.37), en donde, por la ley de Gauss, ya sabemos que
tanto E0 como B0 no tienen componente z, esto es,
E0 = E0x i + E0y j, (12.42)
B0 = B0x i + B0y j. (12.43)
Para aplicar la ley de Faraday, consideremos, por ejemplo, la curva de la figura 12.5,
que es un cuadrado de lado L en el plano yz y centrado en el origen, con orientación
antihoraria.
La circulación del campo eléctrico (12.36) a lo largo del cuadrado C de la figu-
ra 12.5 resulta (ver Ejercicios),
I  
kL
E · dl = −2E0y L sen cos (ω t). (12.44)
C 2
158 Ondas electromagnéticas

z
L

n
y
x
Figura 12.5. Un cuadrado de lado L en el plano yz y con centro en el origen para aplicar
la ley de Faraday.

Por otro lado, el flujo del campo magnético (12.37) a través de la superficie que
encierra el cuadrado de la figura 12.5 es (ver Ejercicios)
Z  
B0x L kL
B · dS = −2 sen sen (ω t). (12.45)
S k 2

Ahora, según la ley de Faraday (12.32), la derivada temporal de este flujo, cambiada
de signo, ha de ser igual a la circulación (12.44). Haciendo la derivada con respecto
al tiempo del flujo magnético (12.45), y cambiando el signo, resulta
Z  
d B0x Lω kL
− B · dS = 2 sen cos (ω t). (12.46)
dt S K 2

Igualando esto a la circulación del campo eléctrico (12.44), llegamos a la conclusión


k
B0x = − E0y , (12.47)
ω
lo cual relaciona una componente del campo eléctrico con otra del campo magnético.
Podrı́amos haber realizado estas operaciones para otra trayectoria C. Si lo hacemos
para un cuadrado de lado L en el plano xz y con centro en el origen, llegaremos a una
conclusión muy parecida a la de la ecuación (12.47). En concreto, obtendremos que
k
B0y = E0x . (12.48)
ω
Una manera sencilla de cumplir las condiciones (12.47) y (12.48) es tomar el sistema
de referencia de tal modo que el campo eléctrico vaya en la dirección del eje x y el
campo magnético vaya en la dirección del eje y. En este caso, la ecuación (12.48) es
una relación entre las componentes no nulas de ambos campos. Resulta entonces

E0 = E0 i, (12.49)
k
B0 = B 0 j = E0 j. (12.50)
ω
En consecuencia, la ley de Faraday determina los vectores E0 y B0 , que sólo dependen
de la amplitud E0 (dada por las condiciones iniciales de un problema concreto).
Ondas electromagnéticas en el vacı́o 159

y
B
z

x E
Figura 12.6. Evolución temporal y espacial de una onda plana armónica. La dirección de
propagación es el eje z, la dirección del campo eléctrico es el eje x, y la del campo magnético
es el eje y. El periodo temporal de los campos es T = 2π/ω, y la longitud de onda es
λ = 2π/k.

Las leyes de Gauss y de Faraday nos han permitido establecer la siguiente conclu-
sión importante: en una onda plana armónica en el vacı́o, los vectores k (que determina
la dirección de propagación de la onda electromagnética), E y B son mutuamente or-
togonales. Además, los módulos del campo eléctrico E y el campo magnético B están
relacionados mediante la ecuación
|B| k
= . (12.51)
|E| ω
Una imagen de la evolución temporal y espacial de los campos eléctrico y magnético
de una onda plana armónica se ve en la figura 12.6. Para cada punto del espacio,
las intensidades de los campos varı́an en el tiempo de manera periódica y sinusoidal,
con un periodo que está relacionado con la frecuencia angular ω según la fórmula
T = 2π/ω. De la misma forma, en cada instante de tiempo, la variación de los campos
con el punto z del espacio es según una función periódica sinusoidal, cuyo periodo
espacial o longitud de onda es λ = 2π/k. En la figura se observa cómo es posible
que los campos sean ortogonales a la dirección de propagación de la onda. Las ondas
electromagnéticas son un ejemplo importante de este tipo de comportamiento en la
naturaleza, que en general se denomina onda transversal.

Condiciones impuestas por la ley de Ampère-Maxwell


Las leyes de Gauss y Faraday permiten obtener, para una onda electromagnética plana
armónica en el vacı́o que se propaga a lo largo del eje z positivo, las expresiones
E = E0 sen (k z − ω t) i, (12.52)
k
B = E0 sen (k z − ω t) j, (12.53)
ω
y aún nos falta satisfacer la ley de Ampère-Maxwell,
I Z
d
B · dr = ε0 µ0 E · dS. (12.54)
C dt S
Si C es la trayectoria de la figura 12.5 y S es la superficie plana encerrada por C, se
llega a la condición (ver Ejercicios)
k ω
E0 = ε 0 µ 0 E0 , (12.55)
ω k
160 Ondas electromagnéticas

Región Longitud de onda (m) Frecuencia (Hz)


Radio > 0,01 < 3 × 109
Microondas 0,01 − 10−4 3×109 − 3 × 1012
Infrarrojo 10−4 − 7 × 10−7 3 × 1012 − 4,3 × 1014
Visible 7×10−7 − 4 × 10−7 4,3 × 1014 − 7,5 × 1014
Ultravioleta 4×10−7 − 10−9 7,5 × 1014 − 3 × 1017
Rayos X 10−9 − 10−11 3 × 1017 − 3 × 1019
Rayos gamma < 10−11 > 3 × 1019

Tabla 12.1. Espectro electromagnético.

es decir,
 ω 2 1
= . (12.56)
k ε0 µ 0
El valor numérico del producto de la permitividad y la permeabilidad del vacı́o es
igual al inverso de la velocidad de la luz en el vacı́o c al cuadrado. Por tanto,
r
ω 1
= = c, (12.57)
k ε0 µ 0

donde c = 3 × 108 m · s−1 . Dado que, en una onda plana armónica, la cantidad ω/k es
la velocidad de propagación de la onda, como vimos en la ecuación (12.26), las ondas
electromagnéticas se propagan a una velocidad igual a c .
Hemos obtenido, finalmente, una solución de las ecuaciones de Maxwell en el
vacı́o en forma de onda plana armónica propagándose a la velocidad de la luz c a lo
largo del eje z. Esta solución es

E = E0 sen k(z − c t) i, (12.58)


E0
B= sen k(z − ct) j, (12.59)
c
en donde el valor de k viene determinado por la frecuencia f de la onda según

2π f
k= . (12.60)
c
Como las ondas electromagnéticas se propagan a la velocidad de la luz, Maxwell
infirió que la luz es una forma de radiación electromagnética.

12.4. Espectro electromagnético


El espectro electromagnético está formado por las diferentes formas en que aparecen
las ondas electromagnéticas. En el espectro, estas ondas están caracterizadas por su
frecuencia f o bien por su longitud de onda λ = c/f . En la tabla 12.1 se muestran
las frecuencias tı́picas de las diferentes formas en que aparece la radiación electro-
magnética.
Ejercicios 161
E
luz visible

ultravioleta infrarrojo

2 4 6 8 10 λ (10 7 m)

Figura 12.7. Energı́a emitida por el Sol en función de la frecuencia.

Las radiación de menor frecuencia y mayor longitud de onda está constituida por
las ondas de radio: para longitudes de onda del orden de centı́metros tenemos ondas
de radar, para longitudes del orden de metros tenemos ondas de televisión (TV) y de
frecuencia modulada (FM) y longitudes de onda del orden de kilómetros corresponden
a onda media.
La radiación de microondas tiene mayor frecuencia que la de radio y se produce
tı́picamente en circuitos eléctricos. Este tipo de radiación tiene una frecuencia cercana
a la de resonancia de las moléculas de agua.
Lo que se conoce normalmente como luz aparece en tres regiones del espectro
electromagnético. La de menor frecuencia de las tres es la radiación infrarroja, que se
produce por las vibraciones de los átomos o moléculas de los cuerpos a una tempera-
tura dada. Más frecuencia tiene la luz visible y ultravioleta, generadas en transiciones
entre estados energéticos de los electrones en los átomos.
A mayor frecuencia resultan los rayos X, que se emiten cuando se bombardean
metales con electrones muy energéticos. Tienen aplicaciones médicas y se usan para
investigar la estructura atómica. La radiación de mayor frecuencia son los rayos gam-
ma. Se producen en transiciones nucleares y tienen un enorme poder de penetración
en la materia.
En la figura 12.7 se muestra muy esquemáticamente la energı́a emitida por el
Sol en función de la frecuencia de emisión. Como vemos, el máximo de esta energı́a
aparece a frecuencias correspondientes a la luz visible, es decir, aquellas frecuencias
para las cuales el ojo humano es sensible. Además es una coincidencia muy importante
para la vida que la atmósfera de la Tierra sea prácticamente transparente a estas
mismas frecuencias (deja pasar la radiación correspondiente a la luz visible), algo
que no ocurre, afortunadamente para la vida en la Tierra, con casi toda la radiación
ultravioleta e infrarroja.

12.5. Ejercicios
1. Demostrar que, para que el campo eléctrico dado por la ecuación (12.38), satisfaga
la ley de Gauss en el vacı́o, dada por la ecuación (12.30), a través del cubo de la
figura 12.4, ha de cumplirse la ecuación (12.39).
2. Dado el campo eléctrico (12.36), con E0 = E0x i+E0y j, y dada la curva orientada
de la figura 12.5, demostrar que la circulación del campo a lo largo de la curva
está dada por la ecuación (12.44).
3. Dado el campo magnético (12.37), con B0 = B0x i + B0y j, y dada la superficie
encerrada por el cuadrado de la figura 12.5, demostrar que el flujo magnético a
162 Ondas electromagnéticas

través de la superficie está dado por la ecuación (12.45).


4. Dadas las expresiones (12.52) y (12.53) para los campos eléctrico y magnético de
una onda plana armónica, aplicar la ley de Ampère-Maxwell dada por la ecuación
(12.54) al circuito de la figura 12.5 y demostrar que se ha de cumplir la condición
(12.55).
5. Se llama vector de Poynting de una onda electromagnética al vector P = 1/µ0 E×
B. Este vector describe adecuadamente el flujo de energı́a propagada por la onda.
Calcular el vector de Poynting para la onda monocromática dada por las ecua-
ciones (12.58) y (12.59) y hacer un diagrama de su intensidad frente al punto del
espacio z para t = 0.
Solución: P = E02 /(µ0 c) sen2 k(z − ct) k.
6. Cierta luz amarilla tiene una longitud de onda λ = 6 × 10−7 m. Determinar su
frecuencia, su periodo y el módulo de su vector de onda.
Solución: f = 5 × 1014 Hz, T = 2 × 10−15 s, k = 1, 05 × 107 rad · m−1 .
Capı́tulo 13

Circuitos elementales

13.1. Elementos localizados


En este capı́tulo comenzamos el estudio de la teorı́a de circuitos. Un circuito no es
más que una interconexión de componentes eléctricos y electrónicos que realizan una
determinada función. Los campos electromagnéticos asociados o producidos en un
circuito tienen una variación temporal y espacial que están relacionadas entre sı́ por
la velocidad de la luz. Si el periodo T de variación de estos campos es suficientemente
grande, entonces la longitud espacial λ = cT asociada a la variación del campo (donde
c es la velocidad de la luz) será mucho mayor que la longitud asociada a los elementos
del circuito, con lo cual podremos emplear la teorı́a de elementos localizados.
En condiciones de parámetros localizados, las leyes del electromagnetismo se con-
sideran válidas en su aproximación cuasiestacionaria, salvo para determinados elemen-
tos, como pudieran ser condensadores o inductores, en donde la variación temporal ha
de tenerse en cuenta. Sin embargo, incluso empleando esta aproximación en circuitos
muy simples, debido a que las condiciones de contorno son complicadas, serı́a muy
difı́cil calcular los campos. La teorı́a de circuitos da un conocimiento mucho menos
detallado pero permite obtener las magnitudes que interesan, esto es la potencia y
el intercambio energético entre los componentes del circuito, en función de voltajes e
intensidades.

Figura 13.1. Circuito simple en el que se transporta energı́a desde un generador a una carga
a través de un circuito que pasa por una pared conductora.

163
164 Circuitos elementales

A B

Figura 13.2. Dos elementos conectados en paralelo formando un circuito. Los puntos A y
B son nodos.

En la figura 13.1 podemos ver un circuito simple en el que se ha dibujado el flujo


de energı́a a frecuencia moderada. La baterı́a proporciona voltaje y por la resistencia
circula corriente. Esta descripción es equivalente a la descripción en función de cam-
pos, en la que el circuito actúa como una especie de guı́a de la energı́a transportada
por los campos de la fuente a la resistencia. Vemos que, a frecuencias moderadas, una
parte de la energı́a se extiende al espacio alrededor del circuito. Pero, a frecuencias
suficientemente altas, la energı́a se puede irradiar a casi todo el espacio y el circuito
se convierte en una antena. En este último caso el modelo de elementos localizados
deja de servir.

13.2. Leyes de Kirchhoff


Un circuito es un camino cerrado formado por dispositivos eléctricos y electrónicos
conectados entre sı́ mediante cables conductores. Cada uno de los dispositivos de un
circuito está asociado a una representación simbólica en un diagrama. Ası́, los cables
conductores se representan en los circuitos mediante lı́neas.
Para proporcionar energı́a al circuito se requiere una fuente de voltaje o fuente
de fem, como por ejemplo una baterı́a, un alternador, una dinamo, una célula solar,
etc. Este dispositivo funciona transformando energı́a (quı́mica, mecánica, solar, etc)
en la energı́a eléctrica necesaria para proporcionar una diferencia de potencial entre
sus terminales, conectados al resto del circuito. De esta manera, en el circuito aparece
una corriente eléctrica, es decir, un flujo de electrones, que se mantiene mientras la
fuente de voltaje mantenga la diferencia de potencial.
El sentido de la corriente eléctrica se toma por razones históricas como el opuesto
al del movimiento de los electrones, de manera que la corriente va desde el terminal
positivo de la fuente de voltaje hacia el terminal negativo a través del circuito (y
desde el terminal negativo hasta el positivo por el interior de la fuente de voltaje).
Un par de reglas codifican las relaciones entre intensidades y entre voltajes en un
circuito:

La suma de las corrientes que entran en un punto de unión de varios elementos


en un circuito es igual a la suma de las corrientes que salen. Los ingenieros suelen
referirse a este punto como un nodo (el punto A en la figura 13.2 es uno de tales
puntos). Esta regla no es más que la ley de conservación de la carga expresada
para circuitos. Se conoce como ley de Kirchhoff para las corrientes.
Elementos conectados en paralelo tienen la misma diferencia de potencial entre
sus extremos. En la figura 13.2 podemos ver a la izquierda que el salto de potencial
de A a B a través del camino de arriba será igual al salto a través del camino de
abajo. Esta regla o ley de Kirchhoff para los voltajes, se enuncia también como:
Resistencias 165

I1 V1
I2

+

− +
V5 + −
V2

I4


+
+

I3
V4 V3

Figura 13.3. Leyes de Kirchhoff. La suma de las corrientes que entran en un nodo tiene que
ser igual a la suma de las que salen. En el caso de la izquierda I2 = I1 + I3 + I4 . A través
de un camino cerrado, la suma de los voltajes vale cero. En el caso de la derecha tendrı́amos
V1 + V2 + V3 + V4 + V5 = 0.

la suma de las diferencias de voltaje a través de un circuito cerrado vale cero, ya


que si vamos de A a B por arriba y volvemos de B a A por abajo, el cambio de
potencial experimentado es nulo.
Detrás de estas dos reglas subyace la hipótesis de parámetros localizados de la que
hablábamos al principio. Ası́ la primera y la segunda ley pueden derivarse de forma
rigurosa a partir de las ecuaciones de la conservación de la carga y de la relación entre
campo y potencial. En la figura 13.3 podemos ver gráficamente representadas estas
leyes.

13.3. Resistencias
En electrónica, lo importante es la relación entre el voltaje y la corriente en un circuito.
El juego consiste en fabricar y hacer uso de dispositivos con distintas caracterı́sticas
de corriente I frente a voltaje V .
Como vimos en el capı́tulo 7, la ley de Ohm dice que, para determinados dis-
positivos, cuando por ellos pasa una corriente eléctrica I debida a una diferencia de
potencial V que se le ha aplicado, existe una relación dada por

V = RI, (13.1)

siendo R la resistencia eléctrica del dispositivo. A los dispositivos electrónicos que


cumplen esta relación lineal entre la corriente I que circula por ellos y la diferencia
de voltaje V aplicado a sus terminales, se les suele llamar resistencias (en inglés, se
distingue con nombres distintos el dispositivo, resistor, y la propiedad fı́sica, resistan-
ce, pero no en espa nol - esperemos que, por el contexto, en lo que sigue quede claro).
La ley de Ohm no se aplica a todos los dispositivos. Hay dispositivos, tales como
condensadores, inductores, etc, que cumplen otras relaciones como veremos después.
Normalmente los fabricantes hacen resistencias de determinados valores y garantizan
la exactitud de estos valores dentro de cierto rango llamado de tolerancia. Si un fabri-
cante asegura que una resistencia tiene de valor nominal R y una tolerancia del 5 %,
significa que el valor de la resistencia, en las condiciones de trabajo habituales, es el
que dice salvo un error de ±0,05 × R en la unidades en las que R esté dada.
166 Circuitos elementales

V
I

Figura 13.4. Ley de Ohm

Resulta a veces útil recurrir a la analogı́a de la corriente eléctrica como una co-
rriente de agua (se trata, después de todo, de un fluido de electrones). En la figura 13.4,
podemos ver de manera gráfica la ley de Ohm. La fuente de voltaje proporciona el des-
nivel necesario (potencial) para que el agua (la corriente) fluya a través de la tuberı́a
(resistencia).
Al atravesar la corriente eléctrica una resistencia, se disipa energı́a en forma de
calor. La potencia disipada viene dada por la expresión

P = IV. (13.2)

Para el caso de una resistencia, usando la ley de Ohm, las siguientes formas son
equivalentes:
V2
P = I 2R = . (13.3)
R
Obviamente, el dispositivo que proporciona la energı́a que disipa una resistencia en
un circuito es la fuente de voltaje. La potencia que suministra una fuente de voltaje
a un circuito viene dada también por la ecuación (13.2), siendo I la corriente que
atraviesa la fuente y V la diferencia de potencial entre sus terminales.

13.4. Resistencias en serie y en paralelo


Vamos a ver un par de aplicaciones de las leyes de Kirchhoff y la de Ohm para cal-
cular asociaciones de resistencias de manera que varias de ellas se puedan sustituir
por otra equivalente o viceversa. La industria fabrica resistencias con unos determina-
dos valores y, normalmente, en las aplicaciones se necesitan otros. Para resolver este
problema, una buena opción es obtener el valor deseado mediante combinaciones de
otras resistencias, bien en serie o bien en paralelo.
Veamos primero la asociación en serie de dos resistencias, que se conectan como
se ve en la figura 13.5. En este caso, el conjunto de las dos resistencias se comporta
en un circuito como si hubiera una sola resistencia equivalente cuyo valor es igual a
la suma de las resistencias individuales,

RT = R1 + R2 . (13.4)

La expresión (13.4) se puede entender de manera intuitiva: si vamos por un camino


que ofrece cierta resistencia en una parte y otra resistencia en el resto, la dificultad
Divisor de voltaje 167

R1

R1 R2
R2

Figura 13.5. Asociación en serie Figura 13.6. Asociación en paralelo

de recorrer el camino total será la suma de la dificultad de cada parte. Para probar la
relación (13.4), podemos hacer uso de las leyes de Kirchhoff. Si cerramos el circuito de
la figura 13.5 conectando sus terminales a los de una fuente de voltaje VT , podemos
aplicar al punto de unión de las dos resistencias la primera ley. Encontramos entonces
que I1 = I2 = IT , siendo I1 e I2 las corrientes que circulan por cada resistencia e
IT la intensidad que circula por la fuente. Por otro lado, VT = V1 + V2 aplicando la
segunda ley, donde V1 y V2 son las caı́das de voltaje en cada resistencia. Hecho esto,
y utilizando la ley de Ohm, encontramos el resultado (13.4).
En el caso de una asociación en paralelo de dos resistencias, éstas se conectan de
la manera que se ve en la figura 13.6. Una forma intuitiva de obtener el valor de la
resistencia equivalente se basa en el concepto de conductancia, que es la inversa de la
resistencia, es decir, la facilidad de ir de un punto a otro. Si tenemos dos puntos unidos
por varios caminos, la conductancia total dependerá de la suma de las conductancias
de cada camino. Si escribimos esto en función de la resistencia, resulta
1 1 1
= + . (13.5)
RT R1 R2
Para demostrarlo, podemos recurrir de nuevo a las reglas de Kirchhoff. Si conectamos
los terminales del circuito de la figura 13.6 a los de una fuente de voltaje VT , escogemos
uno de los puntos de unión de las dos resistencias, resulta IT = I1 + I2 . La segunda
ley de Kirchhoff implica VT = V1 = V2 . Usando ahora estas dos relaciones junto con
la ley de Ohm obtenemos el resultado (13.5).
Es muy común, al empezar a estudiar teorı́a de circuitos, que se tienda a calcular
todo mediante las fórmulas aprendidas. Pero aparte de que las fórmulas son a veces
difı́ciles de recordar, los valores de las resistencias que uno tiene en el laboratorio
no son exactos y tienen un porcentaje de tolerancia o error. Es por ello convenien-
te desarrollar en las aplicaciones prácticas algo de intuición. Por ejemplo, si en un
montaje en serie una de las resistencias es mucho mayor que la otra, la mayor es la
que va a dominar principalmente el comportamiento de la asociación, y es importante
comprender esto sin necesidad de hacer ninguna cuenta. Por el contrario, en el caso
de una asociación en paralelo es la menor la que domina.

13.5. Divisor de voltaje


Consideremos el circuito divisor de voltaje. Podemos ver el montaje de este circuito
en la figura 13.7, en donde Vin es un voltaje de entrada conocido que puede haber
sido proporcionado por una baterı́a u otra fuente de voltaje. En la figura, Vin se toma
con respecto al llamado valor de tierra Vtierra , de manera que se puede considerar que
168 Circuitos elementales

R1

Vin
R2 Vout

Figura 13.7. Divisor de voltaje

el terminal negativo de la fuente tiene potencial Vtierra y el terminal positivo tiene


potencial Vin + Vtierra .
Encontremos cuál será el voltaje de salida Vout en función del voltaje de entrada
Vin y las resistencias R1 y R2 . De nuevo, Vout se toma con respecto al valor de tierra
Vtierra .
Una primera forma de calcular el voltaje de salida pasa por calcular primero la
intensidad I a través de las resistencias en serie. Una vez hecho esto, Vout = IR2
(para entender esta última expresión conviene observar en la figura 13.7 que Vout es
igual a la diferencia de potencial V2 entre los terminales de la resistencia R2 ).
Una segunda manera, más intuitiva, de calcular Vout se basa en utilizar implı́cita-
mente el hecho de que la corriente eléctrica es la misma a través de las dos resistencias,
por lo cual se cumple que
 
V2 IR2 R2
= ⇒ Vout = Vin (13.6)
V1 + V2 IR1 + IR2 R1 + R2

donde se ha usado que Vin = V1 + V2 y que Vout = V2 .


Una tercera manera de obtener la expresión (13.6) es notar que, como las co-
rrientes por las resistencias son iguales, las caı́das de voltaje son proporcionales a las
propias resistencias. Por ejemplo, si R2 es la mitad de la resistencia total, el voltaje
de salida será la mitad del voltaje total. Si R2 es 10 veces mayor que R1 , la salida
será aproximadamente el 90 % del voltaje de entrada.
Este circuito tiene muchas aplicaciones. Si por ejemplo se dispone de una fuente
de 12 V, y se desea alimentar un dispositivo que funciona a 5 V, normalmente se
emplea un divisor para reducir el voltaje.

13.6. El puente de Wheatstone


El puente de Wheatstone es un circuito eléctrico que permite comparar resistencias
de una manera muy exacta. En la figura 13.8 podemos ver que el circuito es realmente
simple. Consiste de cuatro resistencias, conectadas en dos ramas paralelas, cada una
de las cuales contiene dos resistencias en serie. Resolvamos primero el problema de
encontrar la diferencia de potencial entre los puntos A y B. Existen varias formas, pero
una rápida y elegante es la siguiente: cada rama se considera un divisor de voltaje,
Multı́metros 169

V0

R1 R2
VA VB

R4 R3

Figura 13.8. Puente de Wheatstone

por lo cual podemos escribir


   
R4 R3
VA = V0 , VB = V0 , (13.7)
R1 + R4 R2 + R3
de manera que  
R4 R2 − R1 R3
VA − VB = V0 . (13.8)
(R1 + R4 )(R2 + R3 )
El puente se dice que está balanceado o equilibrado cuando esta diferencia de potencial
se anula, es decir, cuando se cumple

R4 R2 = R1 R3 . (13.9)

Una aplicación tı́pica de este circuito consiste en la determinación de resistencias. Si


se tiene una resistencia desconocida, y tres conocidas, lo único que hay que que medir
es la diferencia de potencial entre los puntos A y B (ver Ejercicios).

13.7. Multı́metros
Hay numerosos instrumentos que permiten medir voltajes y corrientes en un circuito.
El osciloscopio permite ver voltajes en función del tiempo en varios puntos de un
circuito. Las sondas lógicas y los analizadores permiten trazar se nales en circuitos
digitales. Los multı́metros permiten medir voltajes, corrientes y resistencias con buena
precisión, sin embargo debido a que su respuesta es lenta no pueden reemplazar al
osciloscopio cuando se trata de se nales que varı́an en el tiempo de manera rápida.
Existen dos tipos: el analógico y el digital. El funcionamiento de un multı́metro
depende del tipo, pues el analógico capta corriente, mientras que el digital capta vol-
taje. En la figura 13.9 se puede ver un dibujo esquemático de un voltı́metro analógico,
también llamado VOM (voltı́metro, ohmnı́metro y miliamperı́metro). Un multı́metro
analógico consta de una aguja fijada a un eje giratorio. Cuando circula corriente por
los terminales de una bobina enrollada al eje, se induce en ella un campo magnéti-
co que tiende a alinearse con el del imán externo. El giro que provoca en el eje el
momento de torsión ası́ generado es proporcional, como vimos en el capı́tulo 8, a la
corriente que circula por la bobina.
170 Circuitos elementales

N S

Figura 13.9. Esquema de un multı́metro analógico.

Por otro lado, los voltı́metros digitales se basan en dispositivos semiconductores


tales como amplificadores operacionales. Un voltı́metro digital está compuesto por un
circuito sensible a la diferencia de potencial y otro circuito de lectura. Se caracteriza
por presentar una impedancia de entrada muy grande.
Un VOM puede medir corrientes máximas de 50 µA cuando la aguja ha alcanzado
el tope en la escala, requiriéndose para ello una diferencia de voltaje tı́pica de 0,25 V.
Para medir corrientes mayores se usa una resistencia en paralelo (llamada “shunt” en
inglés), de manera que la caı́da de voltaje sea la anterior. Idealmente deberı́a tener una
resistencia interna nula, ya que el amperı́metro ha de colocarse en serie en el circuito
cuya corriente se quiere medir. Los multı́metros suelen tener además una baterı́a que
suministra una peque na corriente para medir resistencias.

13.8. Ejercicios
1. Con una fuente de voltaje, de valor V0 , se ha de alimentar un circuito formado
por 10 resistencias iguales, de valor R. Determinar si se han de conectar las
resistencias en serie o en paralelo para que la potencia consumida por el circuito
sea lo mayor posible.
Solución: La potencia es en cada caso Pserie = V02 /(10 R) y Pparalelo = (10 V02 )/R.
Se conectarı́an en paralelo, como ocurre con los electrodomésticos en los hogares.
2. Supongamos que en un circuito divisor de voltaje con dos resistencias de valores
R1 = 5 kΩ y R2 = 15 kΩ, el voltaje de entrada es Vin = 20 V. Calcular la corriente
en el circuito y el voltaje de salida Vout tomado en R2 .
Solución: I = 1 mA, Vout = 15 V.
3. En un puente de Wheatstone como el de la figura 13.8, calcular el valor de una de
sus resistencias, por ejemplo, R1 , en función de las otras tres y de las diferencias
de potencial V0 y VAB = VA − VB .
Solución: R1 = R4 [V0 R2 − VAB (R2 + R3 )]/[V0 R3 + VAB (R2 + R3 )].
4. Un amperı́metro analógico de 50 µA posee una resistencia interna de 5 kΩ. ¿Qué re-
sistencia en paralelo con el amperı́metro serı́a necesaria para poder medir corrien-
tes de 0–1 A? Se tienen resistencias con tolerancias del 5 %.
Solución: Rshunt = 250 mΩ.
5. ¿Qué resistencia en serie es necesaria para convertir el amperı́metro del ejercicio
anterior en un multı́metro capaz de medir voltajes de 0–10 V? Las resistencias
ahora tienen tolerancias del 1 %.
Solución: R = 195 kΩ.
Ejercicios 171

6. Se quiere calcular el valor de una resistencia midiendo de manera simultánea la


corriente que circula por ella y el voltaje. Para ello se dispone de una fuente
de voltaje de 20 V, un amperı́metro de 50 µA con 5 kΩ de resistencia interna, y
un voltı́metro digital con 20 MΩ de impedancia de entrada. Dibujar los circuitos
capaces de hacer esas medidas simultáneas.
Solución: Se colocan en serie la fuente, el amperı́metro y la resistencia. Las posi-
ciones de estos elementos no importan mucho. El voltı́metro se puede colocar en
paralelo con la fuente o con la resistencia.
7. Empleando los circuitos del ejercicio anterior, se quieren medir resistencias de
20 kΩ, 200 Ω y 2 MΩ.¿Qué error se comete en cada caso al calcular R midiendo
el voltaje y la intensidad?
Solución: Cuando se conecta el voltı́metro en paralelo con la fuente, el error
común para las tres resistencias viene de la lectura del voltaje y resulta ser
1,25 %. En el caso de conectar el voltı́metro en paralelo con la resistencia, el
error aparece en la intensidad: 1 % para 20 kΩ, 0,001 % para 200 Ω y 10 % para
2 MΩ.
Capı́tulo 14

Circuitos equivalentes

14.1. Equivalente Thévenin


En el capı́tulo anterior vimos que un conjunto de resistencias podı́an sustituirse por
una resistencia total asociándolas en serie o en paralelo. Esto puede generalizarse a
partes del circuito en donde, además, intervienen fuentes de voltaje y de corriente. Ası́,
se puede sustituir una parte del circuito por otra equivalente a la hora de analizarlo.
En este capı́tulo veremos dos posibles maneras de hacer esto y lo aplicaremos al
problema de medir la diferencia de potencial con un multı́metro y a la clarificación
de los conceptos de impedancia de entrada y de salida.
Imaginemos que tenemos un circuito divisor de voltaje y lo conectamos a una
resistencia que llamaremos resistencia de carga Rload . La situación se muestra en
la figura 14.1. Supongamos que el voltaje de entrada es Vin = 30 V y que las tres
resistencias R1 , R2 y Rload tienen 10 kΩ. Si queremos hallar cuál es el voltaje de salida
Vout tenemos varias opciones. La primera de ellas consiste en sustituir las resistencias
R2 y Rload por una resistencia equivalente y ası́ obtener un nuevo divisor de voltaje.
Gráficamente esto está representado en la figura 14.2.
Este método tiene el inconveniente de que, cada vez que se cambia la resistencia
de carga del divisor de voltaje Rload , tenemos que rehacer los cálculos. Hay una manera
mucho más útil de tratar estos circuitos, gracias al llamado teorema de Thévenin, que
dice:

Vin

R1
Vout

R2 Rload

Figura 14.1. Divisor de voltaje cargado

173
174 Circuitos equivalentes

+30V +30V

10k 10k
Vout Vout

10k 10k Rload 10k 10k

Figura 14.2. Equivalencia del divisor de voltaje con una resistencia de carga.

Cualquier par de terminales de una red de resistencias y fuentes de voltaje


es equivalente a una fuente de voltaje conectada en serie a una resistencia.

En la figura 14.3 está enunciado este teorema de forma gráfica. Entre los terminales
A y B, toda la red de resistencias y fuentes de voltaje puede sustituirse por una
fuente de voltaje de valor VT h y una resistencia de valor RT h . Este teorema resulta
sorprendente, pues cualquiera que sea el conjunto de resistencias y fuentes que tenga-
mos en un circuito, éste conjunto puede sustituirse por una sola resistencia y una sola
fuente. Las ecuaciones que describen circuitos con resistencias y fuentes son lineales.
Existe un método para resolver sistemas lineales llamado eliminación gaussiana que
permite reducir el número de incógnitas. El teorema de Thévenin puede demostrarse
empleando este método.
El voltaje de Thévenin VT h es el que resulta cuando el circuito original se deja en
abierto, es decir, cuando no se conecta ninguna carga entre los terminales de salida
A y B del circuito,
VT h = Vabierto . (14.1)
En la figura 14.3 se puede ver que, si medimos la diferencia de potencial entre los
terminales A y B cuando el circuito está abierto, el voltaje que medimos coinci-
dirá necesariamente con VT h .
En cuanto a la resistencia de Thévenin RT h , ésta se obtiene como el cociente
entre el voltaje de Thévenin VT h y la corriente que circula entre los terminales de
salida A y B cuando los conectamos mediante un cable cortocircuitándolos,

RT h = VT h /Icortocircuito . (14.2)

B
RTh
B

+
− VTh
A A

Figura 14.3. Equivalente de Thévenin.


Equivalente Thévenin 175

+30V
RTh
10k
+15V 5k
+ V
− Th 10k Rload

10k 10k Rload

Figura 14.4. Equivalente Thévenin de un divisor y resistencia de carga.

Una manera alternativa de calcular RT h es igualarla con la resistencia equivalente


entre los terminales A y B cuando todas las fuentes de voltajes se sustituyen por sus
resistencias internas, o cortocircuitos si las fuentes se pueden considerar ideales.
Como ejemplo, calculemos el equivalente Thévenin del circuito divisor de la fi-
gura 14.1. En este caso, los terminales A y B serán el de salida Vout y la tierra
respectivamente. Sin la resistencia de carga Rload , el voltaje de salida, entre A y B
resulta
R2
VT h = Vin . (14.3)
R1 + R2
Por otro lado, la intensidad que circuları́a desde A a B al unirlos vendrı́a dada por
Icortocircuito = Vin /R1 , con lo cual,
R1 R2
RT h = . (14.4)
R1 + R2
Este resultado no es más que la resistencia equivalente entre A y B que corresponde
a la asociación de R1 y R2 en paralelo cuando Vin se hace igual a 0. Podrı́amos haber
calculado RT h ası́, suprimiendo la fuente Vin y calculando la resistencia total.
Existe un método muy general para obtener la resistencia en un punto de un
circuito que es aplicar en ese punto un incremento de voltaje ∆V , encontrar entonces
el incremento de corriente que circula por ese mismo punto ∆I, y el cociente ∆V /∆I
es la resistencia. Para obtener RT h , en el caso del divisor, se suma a Vout un peque no
voltaje ∆V , se calcula entonces el incremento de la corriente en este punto y el cociente
resulta la asociación en paralelo de ambas resistencias (ver Ejercicios).
Una vez tenemos el equivalente Thévenin podemos resolver el problema del cir-
cuito divisor cargado (con la resistencia de carga conectada). Mirando la figura 14.4,
el voltaje de salida viene dado por Vout = IRload , siendo I = VT h /(RT h + Rload . Por
tanto, si aplicamos el teorema de Thévenin, cada vez que cambiemos la carga lo único
que hay que recalcular es la asociación en serie de la resistencia de Thévenin RT h con
la de carga Rload .
Cualquier fuente de tensión no ideal gotea cuando se carga, es decir, al alimentar
un circuito con una fuente, no todo el voltaje que suministra la fuente le llega al
circuito, sino que existe una pérdida, fuga o goteo. Lo que gotea una fuente depende
de su impedancia de salida, y es precisamente la cantidad RT h la que describe esta
propiedad elegantemente.
176 Circuitos equivalentes
B

IN RN

A A

Figura 14.5. Equivalente Norton.

14.2. Equivalente Norton


Además del equivalente Thévenin existe otro modelo para tratar una red dada de
fuentes y resistencias. Se trata de sustituir todo por una fuente ideal de corriente con
una resistencia en paralelo como puede verse en la figura 14.5. Una fuente de corriente
ideal es un dispositivo que mantiene una corriente constante independientemente de
lo que se conecte a ella. Hay dispositivos que se comportan como fuentes de corriente,
como los transistores. En realidad no existe el comportamiento completamente ideal,
de modo que se suele describir el comportamiento real asociando una resistencia in-
terna a la fuente, ya sea de corriente o de voltaje. El sı́mbolo que emplearemos para
la fuente de corriente es el que podemos ver en la parte derecha de la figura 14.5.
Veamos la relación entre el equivalente Thévenin y el de Norton sobre la figu-
ra 14.5. Habı́amos dicho que VT h era el voltaje de salida sin carga, es decir, cuando
el circuito estaba abierto. Se tiene entonces que cumplir la relación

IN = VT h /RN . (14.5)

Por otro lado, si cortocircuitamos la salida, el modelo de Thévenin daba

Icortocircuito = VT h /RT h . (14.6)

Como Icortocircuito es igual a IN , de estas dos últimas expresiones resulta

RN = RT h , (14.7)

con lo cual tenemos el siguiente teorema (de Norton):


En cuanto a lo que concierne a cualquier carga conectada a su salida, un
circuito lineal compuesto de resistencias, fuentes de voltaje y fuentes de
intensidad, es equivalente a una fuente ideal de intensidad IN conectada
en paralelo con una resistencia RN . El valor de la corriente es igual a la
corriente del circuito lineal cortocircuitado. El valor de la resistencia es igual
a la resistencia que se medirı́a a la salida si la carga se quitase y las fuentes
se reemplazasen por sus resistencias internas (si son fuentes ideales, por
cortocircuitos).
Veamos la utilidad del equivalente Norton en un ejemplo concreto. En la figura 14.6
podemos ver un circuito del que conocemos su equivalente Norton al que hemos conec-
tado una resistencia de carga. Con el equivalente Norton es fácil calcular la corriente
El efecto de la carga 177

IN RN Rload

Figura 14.6. Equivalente Norton con resistencia de carga.

que circula por la carga. Lo que se obtiene es un divisor de corriente, en el cual,


RN
Iload = IN . (14.8)
RN + Rload
A diferencia del divisor de voltaje, la resistencia de carga sólo aparece en el denomi-
nador.

14.3. El efecto de la carga


Imaginemos que tenemos una fuente de voltaje de 20 V y necesitamos alimentar un
circuito con 10 V. Como ya sabemos, mediante un divisor de voltaje formado por dos
resistencias iguales, se puede reducir el voltaje inicial a la mitad, como se ve en la
figura 14.7. Diferentes valores de R dan lugar a divisores de tensión con el mismo
valor de VT h pero distinto valor de RT h .
Vamos a suponer que tenemos varias resistencias R con una tolerancia del 1 %,
esto es, el fabricante asegura que la resistencia, en las condiciones de trabajo ha-
bituales, tiene un error de ± 0,01 en las unidades en que esté dado su valor. Para
diferentes valores de R, un multı́metro ideal (un aparato que da valores de voltaje
con precisión infinita) darı́a en todos los casos 10 V para el valor de salida del circuito
de la figura 14.7. Sin embargo, no existen multı́metros ideales y los reales poseen una
resistencia interna Rin como la dibujada en la figura 14.7.
Midamos con un multı́metro analógico los valores del voltaje de salida del circuito
de la figura 14.7. Para valores de R iguales a 1 kΩ, 10 kΩ y 100 kΩ, obtenemos los
resultados recogidos en la tabla 14.1. Cuando R = 1 kΩ, la lectura del multı́metro
es de de 9,95 V, que al ser comparados con los 10 V ideales, están dentro del error
debido a la tolerancia de las resistencias. Si R = 10 kΩ, se miden 9,76 V, con lo cual
se empieza a observar el efecto de la resistencia interna del aparato de medida. En la

20V

R Rin

Figura 14.7. Un divisor que reduce el voltaje a la mitad. Para diferentes valores de R
tenemos circuitos con el mismo VT h pero distinta RT h .
178 Circuitos equivalentes

+20V

100k RTh
+10V 50k
100k +
− VTh Rin

Figura 14.8. La lectura del multı́metro es de 8 V (difiere de la ideal que son 10 V). Rin
puede ser estimada a partir del equivalente de Thévenin del divisor.

ultima medición, con R = 100 kΩ, este efecto es muy importante y el multı́metro da
8,05 V.
Veamos si podemos, con estos datos, calcular la resistencia interna del multı́me-
tro. Para simplificar los cálculos podemos suponer que la lectura que hemos obtenido
en el caso R = 100 kΩ es de 8 V. Tenemos un divisor de voltaje con resistencias igua-
les. Su resistencia de Thévenin RT h es la asociación de dos resistencias de 100 kΩ
en paralelo, es decir, RT h = 50 kΩ, como podemos ver en la figura 14.8. Como la
lectura del multı́metro es de 8 V en lugar de los 10 V ideales, resulta que la caı́da
de tensión en RT h ha de ser de 2 V. Las caı́das de tensión han de ser proporcionales
a los valores de las resistencias, de modo que la resistencia interna del multı́metro
será Rin = 50 kΩ × 8/2 = 200 kΩ.
En alguna parte del multı́metro se encuentra una anotación que dice 20000 Ω/V.
Esta especificación significa que, si se usa el multı́metro en su escala de 1 V (esto
significa que la aguja llegarı́a a su tope cuando lo conectamos a una diferencia de 1 V),
entonces la resistencia de entrada del aparato serı́a de 20 kΩ. ¿Tiene sentido entonces
la estimación que hacı́amos antes? La tiene porque es fácil imaginar qué hay dentro

R Vout (V) Comentario


1 kΩ 9,95 V Valor dentro de la tolerancia de R
10 kΩ 9,76 V Aparece un peque no efecto de la carga
100 kΩ 8,05 V Hay un efecto importante de la carga

Tabla 14.1. Medidas con un multı́metro analógico.

R Vout (V) Comentario


100 kΩ 9,92 V Valor dentro de la tolerancia de R
1 MΩ 9,55 V Aparece un peque no efecto de la carga
10 MΩ 6,69 V Hay un efecto importante de la carga

Tabla 14.2. Medidas con un multı́metro digital.


El efecto de la carga 179

out A

Zout, A
in out in out in B
A B

Zin, B

Figura 14.9. El circuito A alimenta o excita al circuito B.

de un multı́metro para permitir cambiar de escala: un conjunto de resistencias que se


conectan en serie. Por tanto, en la escala de 10 V, que es la que hemos usado para
nuestras medidas, la resistencia interna ha de ser de 200 kΩ que es la que habı́amos
calculado.
En la tabla 14.2 está resumido el experimento para un multı́metro digital. En
el último caso, RT h = 5 MΩ. La caı́da de voltaje en la resistencia del multı́metro es
aproximadamente de 2/3 del total, por lo que una estimación simple da una resistencia
interna Rin = 10 MΩ. Efectivamente, al mirar las especificaciones técnicas del aparato
que hemos utilizado, encontramos que Rin ≥ 10 MΩ para todas las escalas. Por lo
visto, un multı́metro digital suele ser mucho mejor que uno analógico, al menos en lo
que respecta a su resistencia interna.

Impedancias de entrada y de salida


En la mayorı́a de las aplicaciones, la salida de un circuito se usa para alimentar o
excitar otro circuito. Por ejemplo, hemos visto que la salida de un divisor de tensión
excitaba al multı́metro que medı́a el voltaje. Esto nos lleva a un problema que se
presenta una y otra vez. Cuando se acopla un circuito de carga a un circuito fuente,
la carga puede cambiar el comportamiento de este último (en el caso considerado
antes, hemos visto que la resistencia del multı́metro afectaba al divisor de tensión).
Para predecir y controlar este problema necesitamos conocer primero la resisten-
cia interna o de entrada en el multı́metro Rin y, por otro lado, también la resistencia de
salida del circuito fuente Rout (que, como veı́amos, puede calcularse a través del equi-
valente Thévenin). Para circuitos que dependen del tiempo, cuando están presentes
componentes tales como condensadores, bobinas, etc, estos conceptos se generalizan a
los de impedancia de entrada Zin e impedancia de salida Zout . Por tanto, un circuito
presenta una impedancia de entrada si actúa para otro circuito como carga, y una
impedancia de salida si, a su vez, excita a otro que hace de carga. Conocer estas
impedancias resulta de gran utilidad a la hora de diseñar circuitos.
En la figura 14.9 puede verse que el circuito A excita al circuito B. No queremos
que el circuito B cambie las caracterı́sticas o afecte al funcionamiento del circuito
A. Entonces, lo que buscamos a la hora de diseñar el circuito B es que B cargue al
circuito A lo suficientemente poco para causar la mı́nima atenuación de la señal. Este
problema se reduce al diseño de un divisor de voltaje. Si tratamos las impedancias
180 Circuitos equivalentes

como resistencias, se puede ver que, si la relación entre las impedancias de salida y
de entrada es de 1:10, el divisor entrega a la salida 10/11 de la se nal de entrada (la
atenuación que sufre es menor que el 10 % y, para la mayorı́a de las aplicaciones, es
suficiente). Ası́, una buena regla para tener presente a la hora de diseñar es
Zin de B
Zout de A ≤ . (14.9)
10
Esta regla permite diseñar fragmentos de circuitos de manera independiente, ya que
no se tiene que considerar A y B como un todo, sino por separado, y sólo tener la
receta (14.9) en la cabeza a la hora de acoplarlos.

+20 V
+20 V +V
1k
10 k 0,2 mA
Vout
Vout 10 k
Vout
10 k
20 k
10 k 1k
-10 V

Figura 14.10. Figura 14.12.


Figura 14.11.

14.4. Ejercicios
1. Consideremos el circuito de la figura 14.2, en donde Vin = 30 V y las tres resis-
tencias R1 , R2 y Rload valen 10 kΩ. Usando, por un lado, las reglas de asociación
de resistencias y, por otro, el concepto de equivalente Thévenin, demostrar que
el voltaje de salida del circuito es Vout = 10 V.
Solución: Si se asocian R2 y Rload en paralelo, resulta un divisor de voltaje de
10 kΩ y 5 kΩ. Por otro lado, el equivalente de Thévenin resulta VT h = 15 V y
RT h = 5 kΩ, con lo que Vout = VT h Rload /(Rload + RT h ).
2. Tenemos un divisor de voltaje de 20 V con R1 y R2 iguales y de valor 10 kΩ.
Aplicamos un aumento de 1 V a la salida (conectando la salida por ejemplo a
una fuente que proporcione 11 V). Calcular el aumento de corriente ∆I que se
produce en la salida y obtener la resistencia equivalente de Thévenin.
Solución: Se tiene que I1 = (Vin − Vout )/R1 y que I2 = Vout /R2 . Por lo tanto,
al incrementar Vout , resulta ∆I = I2 − I1 = ∆V (1/R1 + 1/R2 ) = 0,2 mA y
RT h = 5 kΩ.
3. Para el circuito de la figura 14.6, obtener la ecuación (14.8) del divisor de co-
rriente.
4. Para el multı́metro digital de la tabla 14.2, demostrar que su resistencia interna
es Rin = 10 MΩ.
5. El teorema de máxima transferencia de potencia establece que, en un circuito
eléctrico de corriente continua, la máxima transferencia de potencia a la carga
Ejercicios 181

ocurre cuando la resistencia de la carga es igual a la resistencia equivalente de


Thévenin. Demostrarlo.
6. Calcular el equivalente de Thévenin para el circuito mostrado en la figura 14.10.
Solución: RT h = 5 kΩ, VT h = 5 V.
7. Obtener el equivalente de Thévenin para el circuito mostrado en la figura 14.11.
Dar la respuesta con un 10 % y un 1 % de precisión.
Solución: VT h = 1,5; 1,53 V y RT h = 0,8; 0,84 kΩ.
8. Calcular el equivalente de Thévenin para el circuito mostrado en la figura 14.12.
Solución: VT h = 4 V, y RT h = 20 kΩ.
Capı́tulo 15

Circuitos que dependen del tiempo

15.1. Condensadores
En los circuitos que hemos considerado hasta ahora, los voltajes e intensidades perma-
necı́an constantes en el tiempo. Sin embargo, es posible que los voltajes e intensidades
sean variables en el tiempo. Aparecen en este caso dos nuevos elementos que a tener
en cuenta: condensadores e inductores o bobinas. En el caso de circuitos con voltajes
y corrientes constantes estos dos elementos no juegan papel alguno, ya que el conden-
sador se comporta como un interruptor abierto y el inductor como uno cerrado. Sin
embargo, en circuitos variables en el tiempo ambos elementos presentan propiedades
que dependen del modo en que los voltajes y las corrientes varı́an. Estos componentes,
combinados con resistencias, completan el trı́o de elementos lineales pasivos que for-
man la base de prácticamente todos los circuitos. En este capı́tulo trataremos algunos
circuitos en donde intervienen condensadores e inductores o bobinas. Comencemos
analizando los primeros.
Los condensadores permiten construir circuitos que recuerdan su historia reciente,
esto es, circuitos con memoria. Esta habilidad permite hacer circuitos temporizadores
(circuitos que permiten que algo suceda después de que otra cosa haya ocurrido),
de entre los cuales los más importantes son los osciladores. Esta propiedad también
permite construir circuitos que responden principalmente a cambios (diferenciador) o
a promedios (integradores) y, los más importantes, circuitos que favorecen un rango
de se nales de frecuencias determinadas sobre otras (filtros).
Los condensadores se representan, en los diagramas de circuitos, mediante el
sı́mbolo que podemos ver en la figura 15.1. Este sı́mbolo recuerda al de un condensador
plano, aunque en realidad hay gran variedad de formas y tama nos. Para conocer cómo
se comporta un condensador, basta aplicar la regla

Q = CV, (15.1)

donde Q es la carga acumulada en la placa positiva del condensador, C es la capacidad


del condensador, y V es la diferencia de potencial entre sus placas. Veı́amos que la
capacidad era una medida de lo grande que es un condensador, esto es, cuánta carga
era capaz de almacenar cuando se conecta a una diferencia de potencial V . Para
el estudio de los condensadores en circuitos, se requiere, sin embargo, una relación
entre voltaje y corriente. Esto lo conseguimos tomando la derivada con respecto del

183
184 Circuitos que dependen del tiempo

V Q

Figura 15.1. Sı́mbolo para condensador. Figura 15.2. Analogı́a con un recipiente que
contiene agua.

tiempo de la expresión (15.1) teniendo en cuenta que la capacidad es una constante.


Se obtiene entonces
dV
I=C . (15.2)
dt
Esta relación expresa que mientras mayor sea la corriente, más rápido cambia el vol-
taje. La analogı́a con un fluido resulta útil para entender esto mejor. En la figura 15.2,
un recipiente (un condensador de capacidad C) tiene agua (carga Q) hasta una cierta
altura (voltaje V ). Si se llena o vacı́a el recipiente mediante una manguera, el nivel del
agua cambiará (subirá o bajará) más rápida o lentamente dependiendo de lo grande
que sea el caudal de la manguera (intensidad I). Es importante notar que, en la ecua-
ción (15.2), la corriente es la que se dirige desde la placa negativa del condensador a
la placa positiva. Éste es el sentido positivo estándar. Si la corriente fuera en sentido
inverso, llevarı́a un signo menos en la expresión (15.2).

15.2. Condensadores en serie y en paralelo

La capacidad total de varios condensadores asociados en paralelo es igual a la suma


de las capacidades individuales de cada condensador. En la figura 15.3 podemos ver
dos condensadores asociados en paralelo. Es fácil ver cuál es la capacidad total de la
asociación. Si conectamos el circuito a una diferencia de potencial V , entonces ten-
dremos que QT = Q1 + Q2 , donde QT es la carga total almacenada por la asociación.
Empleando ahora la definición de capacidad, se llega a

CT = C1 + C2 . (15.3)

Para condensadores asociados en serie, como muestra la figura 15.4, la fórmula es

1 1 1
= + . (15.4)
CT C1 C2

En este caso la carga en cada condensador es la misma. Se deja para los ejercicios
demostrar estas expresiones. Como vemos, la asociación en paralelo de las capacidades
es como la asociación en serie de resistencias, y la asociación en serie de las capacidades
es como la asociación en paralelo de las resistencias.
Carga de un condensador mediante una fuente de corriente 185

C1

C1 C2

C2

Figura 15.3. Asociación en paralelo. Figura 15.4. Asociación en serie.

15.3. Carga de un condensador mediante una fuente de co-


rriente
Empezaremos viendo cómo se comportan los condensadores en el caso sencillo mos-
trado en la figura 15.5. Tenemos un condensador conectado a una fuente de corriente
constante I (para crear una de estas fuentes de corriente ideal se necesita el empleo
de transistores). El comportamiento del voltaje en el condensador Vcap en función del
tiempo t es fácil de comprender, ya que al ser I constante, la derivada del voltaje
también lo es, por lo que el voltaje frente al tiempo es una recta, como podemos ver
en la figura 15.6. Esta se nal recibe el nombre de se nal de rampa. Una aplicación
práctica de este comportamiento es la generación de se nales de voltaje triangulares,
como muestra la figura 15.7.
Otros casos que veremos a continuación son el de la descarga de un condensador
a través de una resistencia, y el de la carga de un condensador a través de una fuente
de voltaje y una resistencia.

15.4. Descarga de un condensador a través de una resistencia


Supongamos que tenemos un condensador cargado de capacidad C, de tal modo que
la diferencia de potencial inicial entre sus placas es V0 . Para descargarlo, unimos las

I1

Vcap
Vcap

I
2

C
I
t

Figura 15.5. Condensador cargado por Figura 15.6. Voltaje frente al tiempo en
una fuente de corriente. el condensador. I1 > I2
186 Circuitos que dependen del tiempo

descarga
carga Vcap
descarga
C
carga

Figura 15.7. Generación de una se nal triangular.

placas mediante una resistencia de valor R. El esquema de este circuito se puede ver
en la figura 15.8. Para conocer el comportamiento del voltaje del condensador V frente
al tiempo, se aplica la ecuación (15.2) al circuito y resulta
dV
−C = I. (15.5)
dt
donde el signo menos es debido a que la corriente va desde la placa positiva del
condensador a la placa negativa (el condensador se está descargando). Esta misma
corriente es la que atraviesa la resistencia. Usando la ley de Ohm (I = VR /R, donde
VR es el voltaje en la resistencia), y teniendo en cuenta que el voltaje en el condensador
es igual al de la resistencia en este circuito, obtenemos
dV V
−C = . (15.6)
dt R
Esto es una ecuación diferencial para el voltaje del condensador: una ecuación en la
que al mismo tiempo aparecen V y su derivada. La solución de esta ecuación, dado
que en el instante inicial el voltaje vale V0 , es

V = V0 e−t/RC , (15.7)

V0
Vcap

37%

R C
RC
t

Figura 15.8. Descarga de un conden- Figura 15.9. Voltaje frente al tiempo en


sador mediante una resistencia (circuito el condensador.
RC).
Circuito RC - Integrador 187

que se puede verificar sencillamente sustituyéndola en la ecuación (15.6). Esta solución


se ha dibujado en la figura 15.9. El producto RC se llama constante de tiempo del
circuito y es una medida del tiempo que tarda el condensador en descargarse. De
hecho, cuando ha pasado un tiempo t = RC, el voltaje ha decaı́do en el condensador
un 37 %. Conviene recordar este número.
Analicemos fı́sicamente lo que ha ocurrido. El voltaje del condensador, que ini-
cialmente era V0 , se aproxima a cero a medida que transcurre el tiempo, pero a
una velocidad que va disminuyendo conforme se acerca a ese valor. Si, por ejemplo,
V0 = 10 V, R = 1 kΩ y C = 1 µF, entonces la intensidad inicial en el condensador es
I = V0 /R = 10 mA y, por tanto, la velocidad inicial con la que varı́a el voltaje en el
condensador V es de −104 V · s−1 . Pero, tan pronto como V comienza a disminuir,
esta velocidad comienza a decrecer, por lo que, idealmente, tendrı́amos que esperar
un tiempo infinito para descargar completamente un condensador.

15.5. Circuito RC - Integrador


Consideremos ahora al circuito mostrado en la figura 15.10. Se trata de una fuente
de voltaje, que mantiene una tensión constante V0 , en serie con una resistencia y un
condensador, inicialmente descargado. La ecuación que describe el comportamiento
del voltaje en el condensador Vout es
dVout
C = I. (15.8)
dt
Por otro lado, en el circuito se tiene que la diferencia de potencial en la resistencia es
VR = V0 − Vout , de modo que la corriente que la atraviesa es
V0 − Vout
I= . (15.9)
R
Igualando estas expresiones, se obtiene
dVout V0 − Vout
C = , (15.10)
dt R

V0

99%
V0 R
+
Vout

− Vout 63%

C
RC 5RC
t

Figura 15.10. Condensador cargado me- Figura 15.11. Voltaje frente al tiempo a
diante una fuente de voltaje a través de la salida. Coincide con el voltaje del con-
una resistencia en serie. densador.
188 Circuitos que dependen del tiempo

que es de nuevo una ecuación diferencial para Vout . Para resolverla, se necesita una
condición inicial, como es que en el instante inicial t = 0 el condensador esté descar-
gado, de modo que su voltaje inicial sea Vout = 0. La solución resulta entonces
 
Vout = V0 1 − e−t/RC , (15.11)

dibujada en la figura 15.11.


Analicemos fı́sicamente lo que ocurre. El voltaje del condensador se aproxima al
valor del voltaje aplicado V0 a medida que transcurre el tiempo, pero a una velocidad
que, como en el caso de la descarga, va disminuyendo conforme se acerca a ese valor.
Tan pronto como Vout comienza a aumentar, esta velocidad comienza a decrecer, por
lo que realmente nunca podrı́amos alcanzar el voltaje final V0 (tendrı́amos que esperar
un tiempo infinito). A efectos prácticos, después de transcurrido un tiempo igual a
cinco veces la constante de tiempo del circuito, esto es, 5RC, el voltaje ha alcanzado
el 99 % de su valor final y por consiguiente Vout ≈ V0 (en el instante t = RC, el
condensador está cargado al 63 %).
El circuito que acabamos de ver puede usarse como una aproximación a un circui-
to integrador. Si de alguna manera somos capaces de mantener Vout ≪ V0 , entonces
podrı́amos escribir la ecuación (15.10) como

dVout V0 − Vout V0
= ≈ . (15.12)
dt RC RC
El tiempo durante el cual es válida esta aproximación depende de lo grande que sea
la constante de tiempo RC. Ahora bien, mientras la expresión (15.12) sea válida, lo
que tenemos es un circuito que, a la salida, da la integral de la se nal de entrada, pues
la solución de la ecuación (15.12) es simplemente,
Z
1
Vout (t) = V0 (t) dt + cte, (15.13)
RC

suponiendo como caso más general que V0 depende del tiempo.


Una fuente que proporciona un voltaje elevado, en serie con una resistencia gran-
de, satisface usualmente la condición expresada anteriormente para muchas aplica-
ciones. De hecho, es una buena aproximación en muchos casos para una fuente de
intensidad ideal. Si recordamos el circuito de la figura 15.5, en el que se cargaba
el condensador con una fuente de corriente, podemos ver que efectivamente, lo que
tenı́amos a la salida era la integral del voltaje de entrada, que era en ese caso una
función escalón.

15.6. Circuito CR - Diferenciador


Veamos ahora el circuito mostrado en la figura 15.12. El circuito es como el anterior,
salvo que el condensador está intercambiado con la resistencia. El voltaje entre los
terminales del condensador es V0 − Vout , de modo que podemos escribir

d Vout
C (V0 − Vout ) = . (15.14)
dt R
Circuito CR - Diferenciador 189

V0

V0
C
+ Vout

Vout
37%
R

RC
t

Figura 15.12. Circuito CR. Figura 15.13. Voltaje de salida.

Al conectar la fuente de voltaje V0 al condensador y la resistencia, la diferencia de


voltaje inicial en el condensador es cero, de manera que en el instante inicial t = 0,
Vout = V0 . Si resolvemos entonces la (15.14) con esta condición inicial, resulta

Vout = V0 e−t/RC , (15.15)

que es el mismo tipo de curva que veı́amos en el proceso de descarga de un con-


densador. De nuevo el voltaje decae el 37 % del valor inicial transcurrido un tiempo
igual a RC. Sin embargo, cuando V0 varı́a en el tiempo, este circuito es útil como
diferenciador.
Supongamos que elegimos los valores de R y C de tal manera que son suficien-
temente peque nos para que se cumpla la condición dVout /dt ≪ dV0 /dt. Entonces,
usando la expresión (15.14), podemos escribir

dV0 Vout
C ≈ , (15.16)
dt R

o bien,
dV0
Vout (t) = RC . (15.17)
dt
Lo que obtenemos es una salida proporcional a la velocidad de cambio de la se nal de
entrada. Como veı́amos antes para el caso del circuito integrador, el producto RC es el
que nos da la condición para que la salida pueda considerarse la derivada de la se nal
de entrada. Recordando la discusión que surgió al hablar del equivalente Thévenin, al
elegir este producto se debe de tener en cuenta no cargar mucho la se nal de entrada
V0 tomando R demasiado peque na (R es la impedancia de salida que ve la fuente V0 ).
Cuando veamos la respuesta de estos circuitos en el dominio de la frecuencia, llegare-
mos a obtener un criterio más adecuado para el valor caracterı́stico RC en función de
la potencia transmitida. Estos circuitos son muy útiles para detectar cuándo empieza
o acaba un pulso cuadrado, de manera que se usan mucho en electrónica digital. En
la figura 15.14 tenemos un pulso cuadrado como se nal de entrada y la salida después
de pasar por un diferenciador.
190 Circuitos que dependen del tiempo

Vin
Vout

Figura 15.14. Aplicación del circuito diferenciador para detectar los cambios en una se nal
cuadrada.

15.7. Inductores

Un inductor es esencialmente una bobina de hilo conductor enrollado alrededor de


una barra o núcleo ferromagnético. El núcleo, dada su gran permeabilidad, hace que
el flujo magnético sea mucho mayor en él que en el aire. Una corriente que varı́a a
través de la bobina induce una fuerza electromotriz en la propia bobina mediante el
fenómeno de autoinducción, según veı́amos en el capı́tulo 11. La ley de Faraday da
una expresión para el voltaje en la bobina

dΦ dI dI
V =N =L , (15.18)
dI dt dt

donde N es el número de vueltas de la bobina, Φ el flujo magnético y L es la autoin-


ductancia de la bobina.
Como pasaba con los condensadores, la relación entre la corriente y el voltaje es
algo más complicada que la simple proporcionalidad dada por la ley de Ohm. Además,
la potencia asociada con la corriente que circula por un inductor no se disipa en forma
de calor como sucede con el caso óhmico, sino que se almacena en forma de energı́a del
campo magnético que crea la propia bobina. Tan pronto se interrumpe esta corriente
inductiva, toda esta energı́a es devuelta al circuito.
Al mirar con detalle la expresión (15.18), es fácil ver que, si se conectan los ter-
minales de una bobina a una fuente de voltaje V0 , se obtiene para la corriente a través
de la bobina un comportamiento igual al del voltaje de la figura 15.5. Los inductores
sirven como limitadores y selectores en circuitos de sintonización, formando parte de
filtros. Un inductor es, de alguna manera, lo opuesto a un condensador, de modo
que la combinación de ambos permite seleccionar componentes de una determinada
frecuencia en una se nal. Una aplicación sencilla y bastante útil de los inductores es
el transformador.
El transformador 191

Figura 15.15. Sı́mbolo de un transformador

15.8. El transformador
Un transformador es un dispositivo formado por dos inductores, llamados primario
y secundario respectivamente, enrollados en torno al mismo núcleo ferromagnético.
En la figura 15.15 se ve el sı́mbolo que se utiliza para un transformador con núcleo
laminado. La misión del núcleo es incrementar la autoinducción de la bobina primaria
y guiar el flujo del campo magnético a través de la secundaria. Para evitar pérdidas
de flujo debidas a corrientes inducidas, el núcleo suele estar laminado.
La fuerza electromotriz inducida en cada bobina es proporcional al número de
vueltas que tienen: la fem en la bobina primaria Ep es proporcional a su número de
vueltas Np y la fem Es en la bobina secundaria es proporcional a Ns . Dado que se
supone que no hay pérdidas de flujo magnético, se ha de satisfacer entonces que
Ep Np
= . (15.19)
Es Ns
Según esta expresión, si Np < Ns , existe a la salida (bobina secundaria) una ganancia
de voltaje. Se dice entonces que el transformador es ascendente. Si, por otro lado,
Np < Ns , el transformador es descendente. Otro aspecto básico de un transformador
viene de que, según veı́amos, una bobina no disipa energı́a. Al conservarse la energı́a
en un transformador (no tenemos en cuenta pérdidas de flujo en el núcleo ni resistencia
en los cables), la potencia de entrada es la misma que la de salida, de tal modo que

Ep I p = Es I s . (15.20)

Como consecuencia, un transformador ascendente disminuye la corriente, y uno des-


cendente la aumenta.
Consideremos la situación mostrada en la figura 15.16. En este caso, la bobina
secundaria no está conectada a ningún circuito y podemos ignorarla. La primaria se
comporta como un inductor, en el que el voltaje de entrada es Vin = Ep , la corriente

Iin
Np Ns ε
Vin εp s
L

Figura 15.16. Transformador abierto.


192 Circuitos que dependen del tiempo

I
Np Ns ε
Vin εp s RL
L

Figura 15.17. Transformador cargado.

en el circuito de la bobina primaria es Iin , y se cumple la ecuación de inducción


Vin = L(dIin /dt).
Supongamos ahora que conectamos una carga a la bobina secundaria, como
muestra la figura 15.17. Como consecuencia, aparece en la secundaria una corrien-
te Is = Es /RL . Aunque no hay ninguna conexión entre las dos bobinas, la aparición
de corriente en la bobina secundaria afecta a la corriente total I en la primaria. Para
ver esto, empleamos la conservación de la energı́a en las bobinas (15.20), junto con la
ecuación (15.19), para escribir
Ns
Ip = Is , (15.21)
Np
y, por tanto, la corriente total inducida en la primaria resulta

I = Iin + Ip ≈ Ip , (15.22)

al ser Iin despreciable normalmente.


Se puede calcular la resistencia de entrada Rin que experimenta la fuente. Está da-
da por
 2
Vin E s Np Np Np Es
Rin = = × = . (15.23)
I Ns I s Ns Ns Is
Pero Is = Es /RL , de modo que

Rin = (Np /Ns )2 RL . (15.24)

Un transformador reduce o incrementa la impedancia de entrada, con respecto a la


de salida, en un factor que depende del cuadrado de la razón del número de vueltas.

15.9. Ejercicios
1. Demostrar las expresiones (15.3) y (15.4) para la capacidad de una asociación de
condensadores en paralelo y en serie.
2. Demostrar que la expresión (15.11) es una solución de la ecuación (15.10) con la
condición inicial de que Vout = 0 cuando t = 0.
3. En un circuito RC de carga de un condensador, la fuente proporciona un voltaje
V0 = 10 V, la resistencia es R = 1 kΩ y la capacidad del condensador es C = 1 µF.
Determinar la velocidad inicial con la que varı́a el voltaje en el condensador y la
misma velocidad en el instante en que el voltaje del condensador es Vout = 1 V.
Solución: (dVout /dt)0 = 104 V · s−1 , (dVout /dt)1 = 9 × 103 V · s−1 .
Ejercicios 193

4. En el circuito de la figura figura 15.18, determinar el voltaje en el condensador


en función del tiempo.
Solución: VC = V0 {1 − exp[−(R1 + R2 )t/(CR1 R2 )]}[R2 /(R1 + R2 )].
5. Una bobina de coeficiente de autoinducción L se conecta a una fuente de voltaje
V0 constante. Calcular la corriente que recorre el circuito en función del tiempo.
En la práctica, ¿podrı́a esta corriente hacerse infinita manteniendo V0 constante?
Solución: I = V0 t/L. En la práctica habrı́a que tener en cuenta la resistencia
interna de la fuente y de la bobina.
6. En el circuito de la figura 15.19, calcular la corriente en función del tiempo.
Solución: I = V0 [1 − exp(−Rt/L)]/R.
7. En el circuito del ejercicio anterior, calcular el voltaje en la bobina en función
del tiempo.
Solución: VL = V0 exp(−Rt/L).

R1 R

V0 + R2 C V0 + L
− −

Figura 15.19.
Figura 15.18.
Capı́tulo 16

Análisis en frecuencia de circuitos reactivos

16.1. Se nales armónicas


En este capı́tulo estudiaremos circuitos cuyos voltajes e intensidades dependen del
tiempo de forma periódica. Comenzaremos describiendo matemáticamente cierto ti-
po de se nales conocidas como sinusoidales, cosenoidales o armónicas (por se nales
designaremos indistintamente voltajes y corrientes presentes en un circuito).
Una se nal armónica es el tipo de se nal que se obtiene del enchufe de la pared
y suelen ser bastante comunes. Existe además una razón fundamental para motivar
que nos detengamos en ellas. Según el teorema de Fourier, cualquier se nal periódica,
de la forma que sea, puede descomponerse en la suma de una se nal constante en el
tiempo (o continua) y se nales armónicas. En vez de armónica, se suele emplear la
palabra alterna, y ası́ se habla de corriente alterna, tensión o voltaje alternos, etc.
Una se nal armónica de 10 µV a 1 MHz es una se nal matemáticamente descrita
por
V = A sen (2πf t + φ), (16.1)
en donde A es la amplitud de la se nal, igual a 10 µV en el ejemplo que tenemos,
y f es la frecuencia, o número de ciclos por segundo, 1 MHz en este caso. La fase φ
depende del instante donde tomemos el origen de tiempo t = 0. A veces se define la
frecuencia angular ω = 2πf dada en radianes por segundo (rad/s). Todas las se nales
armónicas se pueden escribir en la forma dada por la ecuación (16.1).
En la figura 16.1 hemos dibujado se nales de distinta amplitud y frecuencia. La
amplitud está asociada con el valor máximo que puede tomar la se nal, mientras que
la frecuencia está asociada al número de veces que oscila en un intervalo de tiempo.
A mayor frecuencia más oscilaciones y más arrugada pintaremos la se nal usando la
misma escala de tiempo. El inverso de la frecuencia es el periodo T = 1/f , y da el
tiempo que tarda la se nal en repetirse.
El concepto de fase es un poco más complicado de entender. Las dos se nales
de la figura 16.1 tienen un valor igual a 0 cuando t = 0 y además incrementan su
valor inicialmente cuando se incrementa el tiempo, por lo que ambas vienen descritas
mediante la función (16.1) con distintas amplitudes y frecuencias, pero con la misma
fase φ = 0.
Se puede hablar de la fase de una se nal determinada por el valor que tiene la
se nal en un determinado instante de tiempo, normalmente considerado el inicial. La

195
196 Análisis en frecuencia de circuitos reactivos

V
0

−A

1/2f 1/f 3/2f 2/f

A*
V

−A*
1/2f* 1/f*
t

Figura 16.1. Ondas con diferentes amplitudes A∗ > A y frecuencias (f , f ∗ ) pero igual fase.
En este caso, φ = 0 y f ∗ = f /2.

figura 16.2 muestra como se puede determinar la fase de una se nal. Se han dibujado
esta vez dos se nales con la misma amplitud y frecuencia pero distinta fase. La primera
se nal parece retrasada, esto es movida hacia la derecha, respecto a la pintada con lı́nea
discontinua por la cantidad φ = π/6. Esta se nal no alcanza el valor 0 hasta que no ha
transcurrido un tiempo igual a 1/(12f ). Este retraso se representa matemáticamente
por un signo negativo, por lo que la se nal vendrı́a dada por A sen (ωt − π/6). La
segunda se nal parece adelantada (movida hacia la izquierda) por una cantidad igual
a φ = π/2, por lo que en este caso la expresión matemática serı́a A sen(ωt + π/2).
Nótese que la curva podrı́a escribirse como A cos (ωt), o en otras palabras, el coseno
es una se nal adelantada en π/2 al seno, o el seno es una se nal retrasada en π/2 al
coseno según el convenio que estamos siguiendo.
No tiene mucho sentido hablar de diferencia de fases entre ondas de distinta
frecuencia, ya que esta diferencia dependerı́a del tiempo. En el ejemplo de dos se nales
de distinta frecuencia dibujadas en la figura 16.1, si cogemos de referencia el instante
t = 0, tendrı́an la misma fase, pero si cogiéramos cualquier otro instante, entonces
tendrı́an fases diferentes. Por tanto, cuando se habla de diferencia de fases, uno se
refiere a se nales de la misma frecuencia. Entonces, sı́ que tiene sentido ya que esta
diferencia es independiente del tiempo. La diferencia de fases entre las se nales de la
figura 16.2 vale ∆φ = 2π/3.
Las se nales armónicas además son soluciones de ciertas ecuaciones diferenciales
que describen muchos fenómenos que ocurren en la naturaleza incluido el compor-
tamiento de circuitos lineales. Los circuitos vistos hasta ahora son circuitos lineales.
Un circuito lineal es aquél que tiene la propiedad de que cuando se excita por va-
rias se nales, su respuesta es la suma de las respuestas que producirı́an las mismas
se nales aplicadas individualmente. Expresado más formalmente, si O(A) es la res-
puesta de un circuito cuando actúa sobre él la se nal A, entonces el circuito es lineal si
O(A + B) = O(A) + O(B). La respuesta de un circuito lineal, excitado por una onda
armónica, es otra onda armónica, de la misma frecuencia, pero cuya amplitud y fase
Potencia y decibelios 197

φ=−π/6

V 0

φ=π/2

−A

1/2f 1/f 3/2f


t

Figura 16.2. Dos ondas, una retrasada o con fase negativa y otra adelantada o con fase
positiva. La mostrada con lı́nea discontinua corresponde a φ = 0.

pueden haber cambiado. Por ello se puede describir el comportamiento del circuito
mediante su respuesta en frecuencia o espectro: el modo en que cambia la amplitud
y la fase de una se nal armónica aplicada en función de su frecuencia.
En electrónica, las se nales con las que uno se encuentra están en un rango de
frecuencias de unos pocos Hz a varios MHz. Se pueden generar frecuencias menores
con circuitos bastante complejos. También es posible generar frecuencias mayores, por
encima de los 2000 MHz, pero se requieren lı́neas de transmisión especiales o guı́as
de ondas. A estas frecuencias tan altas (microondas), la descripción de los circuitos
mediante elementos localizados deja de ser válida y hace falta considerar los campos
electromagnéticos involucrados.

16.2. Potencia y decibelios


Una fuente de corriente continua de magnitud V , que mantiene una corriente I en un
circuito de resistencia R, necesita entregar al circuito una potencia constante dada
por P = V I = I 2 R = V 2 /R. Estas expresiones también son válidas en circuitos en
los que la fuente mantiene un voltaje que varı́a en el tiempo, y ası́ podemos hablar
de la potencia instantánea que la fuente emplea en mantener una corriente I en el
circuito.
Sin embargo, resulta útil definir para se nales periódicas una potencia promedio.
Se define la potencia media o promedio como la potencia total en un intervalo de
tiempo igual al periodo de la se nal, dividida entre el periodo, esto es
Z
1 T
Pm = V (t)I(t)dt, (16.2)
T 0
donde T es el periodo de la se nal.
Si tenemos una fuente que suministra un voltaje dado por V0 sen(2πf t) a una
resistencia de valor R, entonces podemos calcular la potencia suministrada en un
198 Análisis en frecuencia de circuitos reactivos

Descripción dB
Umbral de percepción 0
Crujir del viento en las hojas de los árboles 10
Silbido 20
Conversación normal ∼ 1m de distancia 65
Ruido dentro de un coche 80
Concierto de rock 120
Nivel de dolor 130

Tabla 16.1. Diversos sonidos percibidos por el oı́do humano tomando de referencia el umbral
de percepción igual a 1,0 × 10−12 W/m2 .

periodo  
Z T Z T
1 V (t)2 V2 1 2π V02
Pm = dt = 0 sen2 t dt = . (16.3)
T 0 R R T 0 T 2R
Se define el valor eficaz de una se nal (en inglés root mean square o r.m.s) como la
raı́z cuadrada del valor medio del cuadrado de la se nal.
v !
u
u 1Z T
Vef = t 2
V (t) dt . (16.4)
T 0

En el ejemplo anterior, el valor del voltaje efectivo de la fuente serı́a Vef = V0 / 2.
Para las se nales sinusoidales es bastante frecuente dar la amplitud en función de su
valor efectivo, ya que conocido
√ éste es inmediato calcular la potencia media. El factor
de conversión es entonces 2. A veces la amplitud real se nombra por amplitud de
pico y también se suele de dar la amplitud de pico a pico (pp), es decir el doble de su
valor. En Espa na la tensión de los hogares es de 310 V y la frecuencia de 50 Hz, por
tanto, la tensión eficaz vale ∼ 220V.
Para comparar la potencia relativa de dos se nales se podrı́a decir que una resulta
tres veces mayor que la otra. Sin embargo, ya que a veces estas razones son de varios
millones, se usan logaritmos en base 10. Ası́, se define el decibelio (dB) como diez
veces el logaritmo en base 10 de la razón entre dos potencias que queremos comparar,
 
P1
1 dB = 10 log10 . (16.5)
P0
Esta definición es una consecuencia de la manera en la que el oı́do humano responde
a los cambios en la potencia del sonido. Lo mı́nimo que una persona normal puede
percibir es una potencia por unidad de superficie de 1,0 × 10−12 W/m2 . Si usamos
este umbral de referencia como P0 , y lo comparamos con la potencia de diversos
fenómenos que producen sonido, resulta muy natural emplear la escala de decibelios.
En la tabla 16.1 podemos ver algunos valores.
Podemos usar esta unidad para expresar ganancias de voltaje entre la salida y la
entrada de un circuito cuando tenemos se nales armónicas. Si tenemos un circuito con
una resistencia de entrada igual a R, y lo excitamos con un voltaje igual a Vin sen (wt),
Análisis en frecuencia 199

filtro compensador

frecuencias audibles

20Hz 200Hz 2kHz 20kHz


f

Figura 16.3. Respuesta en frecuencias de un altavoz.

2
la potencia promedio empleada resulta Vin /(2R). Si a la salida del circuito tenemos un
voltaje igual a Vout sen (wt + φ), que usamos para excitar una carga del mismo valor
2
R, entonces la potencia entregada valdrá Vout /(2R). Podemos escribir la ganancia de
voltaje en decibelios mediante la expresión
 
Vout
Ganancia de voltaje = 20 log10 . (16.6)
Vin
En términos de razones de voltajes,
√ +3 dB son aproximadamente equivalentes a una
razón de amplitudes igual a 2 ≃ 1,4 veces; +6 dB son aproximadamente equivalentes
a una razón de amplitudes igual a 2; +20
√ dB corresponden exactamente a una razón
igual a 10; −3 dB son equivalentes a 1/ 2 ≃ 0,7, y −6 dB a 1/2.

16.3. Análisis en frecuencia


Los circuitos con componentes reactivos, como se conocen colectivamente a los con-
densadores e inductores, se comportan de manera más complicada que los circuitos
resistivos, en los que sólo intervienen resistencias. Los circuitos reactivos tienen un
comportamiento que depende de la frecuencia de la se nal (por ejemplo un divisor de
voltaje tendrá una razón de división que varı́a con la frecuencia). Además, los circuitos
con componentes reactivos “corrompen” o modifican las se nales, como hemos visto
con el diferenciador e integrador en el capı́tulo 15.
Al igual que las resistencias, los elementos reactivos son lineales. Esto quiere
decir que la amplitud de la se nal de salida es proporcional a la de entrada. Por lo
tanto es particularmente útil analizar estos circuitos preguntándose cómo el voltaje
de salida (amplitud y fase), depende del voltaje de entrada, siendo éste último una
función armónica de frecuencia determinada. La respuesta en frecuencias es la razón
entre el voltaje de salida y de entrada en función de la frecuencia de entrada. Un
gráfico de la respuesta en frecuencias da la misma información que el conocimiento
del comportamiento temporal del circuito, y a veces incluso es más apropiado.
200 Análisis en frecuencia de circuitos reactivos

V(t)

I(t)

Figura 16.4. Condensador conectado a Figura 16.5. La corriente a través de un


una fuente alterna. condensador tiene un desfase positivo de
π/2 respecto al voltaje.

Imaginemos que tenemos un altavoz y conocemos su respuesta en frecuencias


dada por la lı́nea continua en la figura 16.3. En el altavoz, el voltaje se traduce en
ondas de presión en función de la frecuencia. Serı́a deseable que el altavoz tuviera una
respuesta plana, es decir, de amplitud constante para todo el rango de frecuencias
audibles, ya que no queremos que suene más fuerte para un tono y menos para otro.
Esto se puede conseguir introduciendo un filtro pasivo, representado por la curva dis-
continua, con una respuesta inversa en el circuito amplificador de la radio o televisión
a la que pertenece el altavoz.
Otra ventaja de trabajar en el dominio de las frecuencias es que se puede gene-
ralizar la ley de Ohm, cosa que en el dominio temporal no era posible, reemplazando
la palabra resistencia por impedancia. La impedancia se convierte ası́ en la resistencia
generalizada de bobinas, condensadores y resistencias. Los circuitos con inductores y
condensadores se dice que tienen reactancia. Por tanto, en general,

Impedancia = Resistencia + Reactancia. (16.7)

A menudo se dice que un condensador a una frecuencia dada tiene cierta impedan-
cia, en lugar de cierta reactancia. Esto es porque el concepto de impedancia se usa
indistintamente para todo.

16.4. Fasores
En el circuito mostrado en la figura 16.4, que consta de un condensador conectado a
una fuente V (t) = V0 sen ωt, la corriente valdrá

dV (t)
I(t) = C = CωV0 cos ωt. (16.8)
dt
La amplitud de la corriente resulta proporcional a la frecuencia y a la capacidad
del condensador, y la fase cambia en π/2 (va adelantada 90◦ respecto al voltaje),
según podemos ver en la figura 16.5. Esto pone de manifiesto lo que enunciábamos
en la sección anterior respecto a cambios en la fase y en la amplitud. Si en vez de un
Fasores 201

condensador tuviéramos una resistencia, aplicando la ley de Ohm la amplitud de la


corriente serı́a V0 /R, pero la fase serı́a la misma que la del voltaje.
Para generalizar la ley de Ohm, obviamente un sólo número (la amplitud) no
nos vale, ya que necesitamos tener también información sobre la fase. Si además que-
remos asociar elementos (en serie o en paralelo), en vez de trabajar con funciones
trigonométricas resulta mucho más fácil representar voltajes y corrientes mediante
números complejos, y usar su álgebra. Sin embargo, no debemos olvidar que las co-
rrientes y los voltajes son cantidades reales (observables y medibles) y por tanto
debemos tener reglas para volver a la descripción real. Considerando que estamos
hablando de una onda con una sola frecuencia angular ω, usaremos las siguientes
reglas:

1. Asociamos a cada voltaje o intensidad un número complejo definido por la am-


plitud y la fase de la se nal,

V (t) = V0 cos (ωt + φ) ⇒ Vb = V0 eiφ . (16.9)

Los números complejos Vb e Ib que representan voltajes o intensidades se llaman


fasores.
2. Podemos volver a la descripción real multiplicando el fasor por eiωt y tomando
seguidamente la parte real,

V (t) = ℜ(Vb eiωt ). (16.10)

Es frecuente escribir el fasor como A b = A0 6 φ. En muchos libros también se usa j en


lugar de i para representar la unidad imaginaria.
Como ejemplo, una intensidad cuya representación compleja viene dada por el
fasor Ib = 56 π/2 corresponderı́a a la función real I(t) = −5 sen ωt.

Los números complejos


Presentamos aquı́ un breve resumen de la teorı́a de los números complejos. Un número
complejo se expresa en la forma
z = a + ib. (16.11)
Las letras a y b representan números reales y sobre la i hablaremos en breve. Decimos
que a es la parte real de z y b la parte imaginaria, y escribiremos

a = ℜ(z), b = ℑ(z). (16.12)

Podemos sumar y restar dos números complejos z = a + bi y w = c + di de la siguiente


manera,

z + w = (a + c) + (b + d)i,
z − w = (a + c) − (b + d)i. (16.13)

El producto está definido por

zw = (a + bi)(c + di) = (ac − bd) + (ad + bc)i. (16.14)


202 Análisis en frecuencia de circuitos reactivos

y P
r
φ
x

Figura 16.6. El plano de Argand. Cada punto P representa un número complejo.

Estos resultados se pueden obtener a partir de las reglas usuales del álgebra y consi-
derar la siguiente regla de oro
i · i = i2 = −1. (16.15)
Debido a esta propiedad, los número complejos proporcionan soluciones de problemas
que no pueden resolverse con números reales. Por ejemplo, podemos escribir raı́ces
cuadradas de números negativos.
Decimos que dos números complejos son conjugados uno de otro si sus partes
reales son iguales, y sus partes imaginarias son iguales pero de signo opuesto. Si
z = a + bi, denotaremos por z ∗ = a − bi a su complejo conjugado. Se puede comprobar
que

z + z ∗ = 2ℜ(z),
z − z ∗ = 2i ℑ(z). (16.16)

El producto de un número complejo por su conjugado resulta un número real,

zz ∗ = a2 + b2 . (16.17)

Este resultado permite determinar el cociente de dos números complejos: sean u, z, y


w tres números complejos tales que

uw = z, w 6= 0. (16.18)

Diremos entonces que u es el cociente de z entre w y escribiremos u = z/w.Para


determinar el valor de u, multiplicamos ambos lados de la (16.18) por w∗ . Como ww∗
es un número real, podemos eliminarlo del lado izquierdo de la ecuación multiplicando
ambos lados a su vez por 1/ww∗ . El resultado es

z zw∗
u= = . (16.19)
w ww∗
Se define el módulo de un número complejo como la raı́z cuadrada positiva de la suma
de los cuadrados de su parte real y su parte imaginaria. Si el número es z = x + yi,
podemos expresar su módulo como
p √
|z| = x2 + y 2 = zz ∗ . (16.20)

La expresión de un número complejo como pareja (x, y), siendo x la parte real e y la
imaginaria, sugiere la notación de las coordenadas de un punto en el plano xy o plano
Ley de Ohm generalizada 203

cartesiano. En la figura 16.6 podemos ver que la distancia al origen r representarı́a el


módulo del número complejo z. A cada número complejo se le puede asociar un vector
de posición, y este vector puede representarse mediante sus coordenadas polares (r, φ),
con lo cual podemos escribir el número complejo como

z = x + yi = r cos φ + i r sen φ = r(cos φ + i sen φ). (16.21)

Ésta es la forma polar de un número complejo. El ángulo φ se llama argumento de z


(arg z) y se puede calcular como
y
φ = arctan = φ0 + 2πk, k = 0, ±1, ±2, ... (16.22)
x
siendo φ0 un valor particular. Nosotros llamaremos valor principal del arg z al valor
de φ que satisface
−π < φ ≤ π. (16.23)
Para tratar con fasores, necesitamos definir la función exponencial compleja. La fun-
ción exponencial compleja ez ha de reducirse a la función real ex si z toma valores
reales. Se define entonces

ez = ex+iy = ex (cos y + i sen y). (16.24)

Podemos comprobar que si ℑ(z) = 0, tenemos la función exponencial real. Por otro
lado, para un número imaginario puro z = iy, resulta la identidad de Euler

eiy = cos y + i sen y. (16.25)

A partir de esta última expresión, y empleando la ecuación (16.21), podemos repre-


sentar cualquier número complejo z como

z = |z| eiφ , (16.26)

siendo |z| su módulo y φ su argumento.

16.5. Ley de Ohm generalizada


El uso de fasores permite generalizar la ley de Ohm a circuitos que contienen conden-
sadores e inductores. Para ello primero definiremos la reactancia de un condensador.
Supongamos una fuente de voltaje alterna conectada en serie a una resistencia como
mostraba la figura 16.4. Imaginemos que elegimos el instante inicial de manera que el
voltaje de la fuente venga dado por V (t) = V0 cos ωt. Podemos representar la fuente
alterna mediante el fasor Vb = V0 y escribir

V (t) = ℜ(V0 eiωt ). (16.27)

La corriente que circula por el circuito viene dada entonces por

dV (t)
I(t) = C = −V0 Cω sen ωt, (16.28)
dt
204 Análisis en frecuencia de circuitos reactivos

y esta última expresión puede escribirse como


   
V0 eiωt V0 eiωt
I(t) = ℜ =ℜ , (16.29)
1/iωC XC
definiéndose para un condensador la reactancia a frecuencia ω como
XC = 1/iωC. (16.30)
Por ejemplo, un condensador de 1µF a la frecuencia de 60Hz tendrı́a una reactancia
de −2653i Ω, y a 1MHz de −0,16i Ω. Si la fuente de voltaje es continua, esto es ω = 0,
la reactancia es infinita. Esto expresa el hecho de que un condensador no deja pasar
corriente continua en el estado estacionario.
Si hacemos un análisis similar para un inductor, sustituyendo el condensador por
una bobina, encontramos que podemos definir la reactancia como
XL = iωL. (16.31)
Podemos ver que en circuitos con condensadores e inductores, las corrientes y los
voltajes se desfasan 90◦ al atravesar esos elementos.
Cuando describimos, en términos de fasores, circuitos que contienen condensado-
res y bobinas, podemos asociar a esos elementos números imaginarios puros llamados
reactancias. Si existen además resistencias, asociamos a éstas números reales. Para
describir la relación corriente–voltaje, expresada de manera fasorial, entre dos puntos
de un circuito, podemos escribir un número complejo cuya parte imaginaria resulte
de la contribución de las reactancias y la real de la contribución de las resistencias
entre esos puntos. Ese número complejo recibe el nombre de impedancia y lo repre-
sentaremos por Z.
La relación entre los fasores de corriente y de voltaje en un circuito puede expre-
sarse mediante una ley de Ohm generalizada,
Ib = Vb /Z, (16.32)
donde Vb representa el voltaje de un circuito de impedancia Z que da lugar a una
b La impedancia Z de varios elementos conectados en
corriente representada por I.
serie o en paralelo obedece las mismas reglas que las asociaciones de resistencias,
teniendo en cuenta que se opera ahora con números complejos,
Z = Z1 + Z2 + Z3 + · · · (asociación en serie), (16.33)
1 1 1 1
= + + + ··· (asociación en paralelo). (16.34)
Z Z1 Z2 Z3
A continuación resumimos las fórmulas para las impedancias de resistencias, conden-
sadores e inductores,
ZR = R, (16.35)
ZC = 1/iωC = −i/ωC, (16.36)
ZL = iωL. (16.37)
Con estas reglas, podemos analizar los circuitos de corriente alterna con los mismos
métodos empleados para circuitos de corriente continua. Las leyes de Kirchhoff resul-
tan las mismas pero aplicadas a fasores, la expresión para un divisor de voltaje queda
igual cambiando R por Z, etc.
Potencia en circuitos reactivos 205

16.6. Potencia en circuitos reactivos


En el circuito de la figura 16.4 que consta de una fuente alterna de voltaje y un
condensador, existe un desfase de 90◦ entre el voltaje y la intensidad, como se ve en
la figura 16.5. Para calcular la potencia promedio en un periodo, empleamos entonces
la definición dada por la ecuación (16.2) y resulta Pm = 0. Si se hace lo mismo
sustituyendo el condensador por un inductor, también se encuentra Pm = 0.
Existe otra forma de calcular la potencia promedio usando fasores. Se puede
demostrar (ver Ejercicios) que

Pm = ℜ(Vbef Ibef

) = ℜ(Vbef
∗ b
Ief ), (16.38)

en donde el subı́ndice ef√indica el valor efectivo. En el caso armónico el fasor efectivo


es el fasor dividido por 2 como ya veı́amos.
Para ver que esto funciona, vamos a calcular el caso del condensador. Imaginemos
que el voltaje tiene una amplitud efectiva de 1 V. Tenemos entonces

Vbef = 1, Ibef = Vbef /ZC = iωC,


Pm = ℜ(Vbef Ib∗ ) = ℜ(−iωC) = 0,
ef (16.39)

lo cual es la potencia promedio que obtenı́amos antes.


Se suele definir el factor de potencia como
Pm
factor de potencia = . (16.40)
b b
|V | |I|

Podemos ver que el factor de potencia va de 0 para circuitos puramente reactivos


a 1 para circuitos puramente resistivos. Matemáticamente representa el coseno del
ángulo de desfase entre el voltaje y la intensidad. Las compa nı́as eléctricas cobran a
los clientes normales en función de la potencia media que gastan, pero a las industrias
en función del factor de potencia. Esto es porque los componentes reactivos hacen que
no se transmita la potencia a la carga, ya que almacenan la energı́a. Sin embargo, a
la compa nı́a eléctrica le cuesta producir esta energı́a.

16.7. Ejercicios
1. Si en un caso como el dibujado en la figura 16.2 nos dieran el valor ∆t como
la diferencia o retraso de una se nal respecto a la otra, ¿cómo se calcuları́a la
diferencia de fases conociendo la frecuencia f ?
Solución: ∆φ = 2πf ∆t.
2. Calcular la corriente eficaz para una onda diente de sierra, de periodo T , tal que
I = I0 t/T . √
Solución: Ief = I0 / 3.
3. Aplicando la definición de dB, verificar
√ que +3 dB equivalen aproximadamente
a una razón de amplitudes igual a 2 ≃ 1,4, +6 dB aproximadamente
√ equivalen
a 2, +20 dB a 10 exactamente, −3 dB son equivalentes a 1/ 2 ≃ 0,7 y −6 dB a
1/2.
4. Comprobar las siguientes propiedades:
206 Análisis en frecuencia de circuitos reactivos

La suma de un número complejo y su conjugado es igual al doble de la parte


real del número original.
La diferencia de un número complejo y su conjugado es igual al doble de la
parte imaginaria del número original.
El producto de un número complejo por su conjugado resulta igual a la suma
de los cuadrados de su parte real e imaginaria.
El complejo conjugado del producto de dos números complejos es igual al
producto del complejo conjugado de cada número.
El número complejo que resulta de aplicar la función exponencial a un número
imaginario puro, tal que ℜ(z) = 0, posee módulo unidad.
5. Obtener la expresión (16.31) para la reactancia de una bobina.
6. Demostrar que en un periodo, la potencia media disipada en un circuito compues-
to por una fuente de corriente alterna en serie con un condensador y un inductor
es nula. Hacerlo primero sin usar fasores y repetir la demostración empleándolos.
7. Demostrar que la potencia promedio para dos se nales dadas por I(t) = I0 cos(ωt+
φ1 ) y V (t) = V0 cos(ωt + φ2 ) se puede calcular como la parte real del producto
del fasor del valor efectivo de una de ellas por el complejo conjugado del fasor
efectivo asociado a la otra (16.38). Pista: emplear la expresión para la parte real
dada por (16.16).
8. Demostrar que el factor de potencia es igual a cos θ, siendo θ el desfase entre la
intensidad y el voltaje. Se puede usar la demostración del ejercicio anterior.
Capı́tulo 17

Filtros

17.1. Se nales con ruido

Vamos a ver la utilidad de la descripción en frecuencias de circuitos con componentes


lineales y analizaremos una de sus principales aplicaciones: los filtros.
Imaginemos que tenemos una se nal proveniente de un satélite o de una sonda
espacial que nos llega a la Tierra distorsionada. En la figura 17.1 podemos ver una
se nal con un periodo de 1 ms contaminada con ruido. El ruido está causado por
componentes de mayor frecuencia que a naden ese aspecto arrugado a lo que de
otra manera parecerı́a una se nal armónica. Lo que nos llega de un satélite no es
exactamente ası́, ya que la se nal que hemos dibujado tiene un periodo relativamente
grande para las ondas que realmente emite un satélite cuyas frecuencias van del orden
de 3 a 30 GHz. De todas maneras el ejemplo nos vale para enunciar el problema:
queremos quedarnos con la mayor parte de la se nal buena, quitando en lo posible
toda la distorsión.

1ms

Figura 17.1. Se nal contaminada con ruido.

207
208 Filtros

Vin
Z1

Vout
Z2

Figura 17.2. Divisor de voltaje generalizado.

17.2. Circuito CR - filtro pasa alta


Vamos a ver primero un circuito diferenciador CR como el del capı́tulo 15, pero
esta vez en el dominio de la frecuencia. Tenemos pues el caso que nos mostraba la
figura 15.12, pero esta vez la se nal de entrada será una onda armónica de frecuencia
ω. Nos interesa calcular el voltaje de salida en función del voltaje de entrada. Esto es
lo que se llama función de transferencia.
Podemos tratar el circuito como un divisor de voltaje generalizado según podemos
ver en la figura 17.2, asociando a la entrada y salida los fasores Vbin y Vbout . Por lo
tanto no tenemos más que sustituir en la fórmula generalizada del divisor de voltaje,
Z2
Vbout = Vbin , (17.1)
Z1 + Z2
los valores Z1 = 1/iωC y Z2 = R para obtener

Vbout R
= . (17.2)
b
Vin R + 1/iωC

Si tomamos módulo en la expresión (17.2) resulta


R
|Vbout | = |Vbin | . (17.3)
[R2 + 1/ω 2 C 2 ]1/2

Ya que |Vbout | = Vout es la amplitud de la se nal armónica, podemos escribir


Vout 2πf RC
= . (17.4)
Vin [1 + (2πf RC)2 ]1/2
En la figura 17.3 hemos representado en función de la frecuencia esta expresión,
también llamada función de respuesta en frecuencias.
La amplitud de la se nal de salida se aproxima a la amplitud de la se nal de
entrada a partir de una frecuencia llamada de corte, o también punto de −3 dB del
filtro.√Esta frecuencia es f3dB = 1/(2πRC). A esta frecuencia la razón de voltajes es
de 1/ 2 = 0,7 y la de potencias es justamente 1/2. A frecuencias bajas el circuito no
deja pasar mucha se nal, mientras que a frecuencias altas pasa casi toda la que entra.
Recibe por tanto el nombre de filtro pasa alta.
Circuito RC - filtro pasa baja 209

Vout/ Vin
0.7

f3dB=1/2πRC
f

Figura 17.3. Respuesta en frecuencia de un filtro pasa alta.

Cuando tratábamos este circuito en el dominio temporal veı́amos que la razón


entre el voltaje de salida y el de entrada se hacı́a igual a 1/e = 0,37 cuando el tiempo
transcurrido era t0 = RC, de manera que a tiempos mayores la se nal se atenuaba
cada vez más. En el dominio de las frecuencias, la se nal pasa a partir de la frecuencia
f3dB = 1/(2πt0 ), determinada por el mismo t0 = RC, mientras que a frecuencias
menores la se nal no pasa.
Lo que ocurre en el dominio de la frecuencia es de alguna manera lo inverso de lo
que pasa en el dominio temporal. De hecho, el comportamiento en frecuencias de un
diferenciador se parece al de un integrador en el dominio temporal (ver la figura 15.11).

17.3. Circuito RC - filtro pasa baja


Consideraremos ahora el caso en el que cambiamos el orden del condensador y la
resistencia, como hacı́amos en el circuito integrador representado en la figura 15.10.
La se nal de entrada será una onda armónica de frecuencia ω. Como antes, nos interesa
calcular el voltaje de salida en función del voltaje de entrada y asociaremos a ambos
los fasores Vbin y Vbout . Tratando el circuito como un divisor de voltaje generalizado
resulta, intercambiando Z1 con Z2 en (17.1), la función de transferencia

Vbout 1/iωC
= . (17.5)
Vbin R + 1/iωC
Tomando el módulo en ambas partes y reordenando los términos resulta para las
amplitudes la relación
Vout 1
= . (17.6)
Vin [1 + (2πf RC)2 ]1/2
En la figura 17.4 hemos representado la función respuesta de este circuito. De nuevo,
el comportamiento justifica el nombre de filtro pasa baja. La amplitud de la se nal de
salida es aproximadamente igual a la amplitud de la se nal de entrada a frecuencias
menores que f3dB = 1/2π(RC), llamada de frecuencia de corte o punto de −3 dB del
filtro. A partir de esa frecuencia existe una atenuación cada vez mayor.
210 Filtros

0.7

Vout/ Vin

f3dB=1/2πRC
f

Figura 17.4. Respuesta en frecuencia de filtro pasa baja.

17.4. Gráficas de Bode


En la sección anterior, a partir de la función de transferencia obtenı́amos la razón de
amplitudes y la representábamos frente a la frecuencia usando una escala lineal. Sin
embargo, la función de transferencia también nos da información sobre la respuesta
en fase del filtro, es decir, sobre la diferencia de fase entre la se nal de salida y la de
entrada.
Las funciones respuestas en amplitud y fase frente al logaritmo de las frecuencias,
con la fase expresada en grados y las amplitudes en decibelios, se conocen como
gráficas de Bode. Resulta útil aproximar estas gráficas por lı́neas rectas.

Función respuesta para la fase


Hemos calculado la respuesta en amplitud en las ecuaciones (17.4) y (17.6). Vamos
ahora a calcular la función respuesta para la fase. Empezaremos calculando la res-
puesta en fase de un filtro pasa baja. Podemos racionalizar la expresión (17.5) para
separar la parte real de la imaginaria multiplicando numerador y denominador por el
complejo conjugado del denominador. Hecho esto resulta

Vbout (1/iωC)(R − 1/iωC) 1 − iωRC


= = . (17.7)
Vbin 2
R + 1/(ωC) 2 1 + (ωRC)2

Al dividir la parte imaginaria entre la parte real de (17.7), resulta un desfase igual a

φ = arctan (−ωRC) = − arctan(2πf RC). (17.8)

De forma similar, partiendo de la función de transferencia (17.2), la respuesta en fase


para un filtro pasa alta resulta
 
1
φ = arctan . (17.9)
2πf RC
Gráficas de Bode 211

ganancia(dB)
0

−10

−20

0.1 f3dB f3dB 10 f3dB

90
fase en grados

45

0
0.1 f3dB f3dB 10 f3dB
f

Figura 17.5. Representación de Bode para un filtro pasa alta.

Representación de Bode para un filtro pasa alta

Estamos ya en disposición de representar la respuesta en amplitud y fase de un filtro


pasa alta. La relación de amplitudes recibe también el nombre de ganancia G. En la
representación de Bode la ganancia se expresa en decibelios según la expresión (16.6).
Para un filtro pasa alta, a partir de la expresión (17.4), la ganancia resulta

"  2 #
1
G(dB) = −10 log10 1 + . (17.10)
2πf RC

La representación de Bode para la fase está dada por la ecuación (17.9). En la figura
figura 17.5 hemos pintado en trazo grueso ambas funciones frente a la frecuencia en
escala logarı́tmica.
Resulta más sencillo aproximar estas curvas por lı́neas rectas sin necesidad de
calcularlas numéricamente. Para el caso de la amplitud, cuando f ≈ 5f3dB , entonces
el argumento del logaritmo es prácticamente igual a 1 con lo que G = 0. Cuando
f es suficientemente peque no, hasta f ≈ 0,2f3dB , el argumento está dominado por
1/(2πf CR)2 y por tanto el crecimiento es lineal, de unos 20 dB/década. Una década
es un factor 10 en la frecuencia. De modo equivalente se puede decir que el crecimiento
es de 6 dB/octava, donde una octava es hacer la frecuencia 2 veces mayor. Las dos
rectas coinciden en el punto donde f = f3dB .
Para la curva de desfase también es posible una aproximación lineal. Todo el
cambio de fase se supone que ocurre entre 1/10 de la frecuencia de corte y 10 veces la
frecuencia de corte, es decir un intervalo de dos décadas centrado en la frecuencia de
corte. En los extremos de este intervalo, el error de aproximar la curva por una recta
horizontal es de unos 6◦ . La diferencia de fases es de 45◦ a la frecuencia de corte.
212 Filtros

ganancia(dB)
0

−10

−20

0.1 f3dB f3dB 10 f3dB


fase en grados
0

−45

−90
0.1 f3dB f3dB 10 f3dB
f

Figura 17.6. Representación de Bode para un filtro pasa baja.

Representación de Bode para un filtro pasa baja


De manera análoga, para un filtro pasa baja las funciones de respuesta resultan, según
(17.6) y (17.8),
h i
2
G(dB) = −10 log10 1 + (2πf RC) , φ = − arctan (2πf RC) . (17.11)

En la figura 17.6 hemos representado estas funciones junto a su aproximacı́on lineal. La


discusión anterior es aplicable salvo que ahora para frecuencias peque nas el argumento
del logaritmo se hace igual a 1.

17.5. Circuitos resonantes - filtros de ancho de banda


Cuando se combinan condensadores con inductores es posible hacer circuitos que po-
seen picos en sus funciones de respuesta, llamados picos de resonancia. Estos circuitos
encuentran aplicaciones en transmisión y recepción de se nales.

Filtro de paso de banda


Consideremos el circuito mostrado en la figura 17.7. Este circuito se conoce con el
nombre de sintonizador y se emplea para seleccionar una frecuencia particular de una
se nal. Como L y C pueden ser variables, se puede elegir la frecuencia que queremos
seleccionar. Podemos analizar el circuito encontrando la impedancia equivalente de la
asociación en paralelo del condensador y la bobina,
1 1 1 1
= + = + iωC, (17.12)
ZLC ZL ZC iωL
de modo que
i
ZLC = . (17.13)
(1/ωL) − ωC
Circuitos resonantes - filtros de ancho de banda 213

R Vout 0.7 ∆3dB

Vout/ Vin
Vin
L C
f
0
f

Figura 17.7. Filtro de paso de banda. Figura 17.8. Respuesta del circuito re-
sonante.

Esta impedancia
√ se hace infinita a√una denominada frecuencia de resonancia igual a
f0 = 1/(2π LC) (esto es, ω0 = 1/ LC). Por tanto, la función respuesta presenta un
pico a esta frecuencia.
En combinación con la resistencia R tenemos un divisor de voltaje cuya respuesta
en amplitud se muestra en la figura 17.8. En ella se ha pintado la ganancia frente a
la frecuencia, dada por

Vout 1
= . (17.14)
Vin  2 1/2
f f0
1+ Q2 f0 − f

Hemos escrito la respuesta en lo que se conoce como forma estándar para un circuito
RLC. Para ello, se introduce el factor de calidad Q = ω0 RC. A partir de este factor se
puede obtener
√ la anchura del pico ∆3dB en los puntos a −3 dB (en donde la amplitud
se reduce 1/ 2) del valor en el pico) según

f0
Q= . (17.15)
∆3dB
p
En este caso se puede comprobar que efectivamente Q = R C/L. El factor Q también
se puede definir como

Energı́a almacenada promedio


Q = 2π , (17.16)
Energı́a perdida promedio

en donde el promedio se evalúa durante un ciclo. Una manera de obtener el denomi-


nador de este cociente es calcular la energı́a perdida como la potencia media disipada
en un ciclo multiplicada por el periodo, es decir Pm T . La potencia disipada es la
2
potencia que se pierde en la resistencia, cuyo valor es R IR . En cuanto a la energı́a
almacenada promedio, se almacena en el condensador y en la bobina, y por tanto,
denotando el promedio en un periodo por <>, queda

< 12 LIL2 + 12 CVC2 >


Q = 2π 2 > . (17.17)
T < RIR
214 Filtros

Vin R Vout

Vout/ Vin
L

C
f
0
f

Figura 17.9. Filtro de muesca o trampa. Figura 17.10. Respuesta del filtro de
RLC en serie. muesca.

Podemos calcular este cociente a la frecuencia particular de resonancia. A la frecuencia


de resonancia, la energı́a que se almacena en el condensador y en la bobina es la misma,
de modo que r
< LIL2 > < CVC2 > C
Q = ω0 2 = ω0 2 =R . (17.18)
< RIR > < RIR > L
Hemos visto tres maneras de hallar Q: escribiendo la función respuesta en amplitud
en forma estándar (17.14), empleando la anchura del pico a −3 dB (17.15), y por
último en función de la energı́a almacenada y disipada en un ciclo (17.16) cuando se
trabaja a la frecuencia de resonancia. El fenómeno de la resonancia aparece en otros
sistemas lineales disipativos, como puede ser un muelle con rozamiento, cavidades
electromagnéticas, etc.

Filtro de muesca o trampa


En el filtro anterior el condensador y el inductor estaban conectados en paralelo. Otra
variedad de filtros RLC se usan con el condensador y el inductor conectados en serie.
En la figura 17.9 podemos ver uno de ellos, llamado de trampa. La razón es que
este filtro permite el paso de todas la se nales excepto aquellas cuyas frecuencias se
encuentran en la banda de resonancia.
La condición de resonancia significa que en la función de transferencia tenemos
un extremo. Se puede demostrar que la√impedancia de la asociación LC se anula a
la frecuencia de resonancia f0 = 1/(2π LC), que resulta la misma que en el filtro
de paso de banda. En la figura 17.10 hemos pintado la respuesta en amplitud. Este
circuito es una trampa para se nales con frecuencia cercanas a f0 , ya que son guiadas
a tierra. El factor de calidad del circuito es ahora Q = ω0 L/R.

17.6. Dise no de un filtro


Volvamos al comienzo del capı́tulo. Dada la se nal representada en la figura 17.1,
queremos quitarle el ruido y para ello usaremos un filtro RC.
Lo primero que se debe decidir es si se quiere que el filtro deje pasar las frecuencias
altas o las bajas. La frecuencia de la se nal que nos interesa tiene un periodo de 1
Ejercicios 215

ms, es decir una frecuencia de 1 kHz. En la figura se ve que hay unos 16 máximos
debido al ruido en la se nal, con lo cual la frecuencia del ruido estará en torno a los
16 kHz. Ya que lo que se quiere es dejar pasar la primera se nal, lo que necesitamos
es un filtro pasa baja, es decir un filtro como el que dibujábamos en la figura 15.10.
Ahora necesitamos elegir los valores de R y C. En primer lugar, R dependerá de la
carga. Supongamos que la carga a la que vamos a conectar el filtro es Rload = 100 kΩ.
Como hemos visto en el capı́tulo 14, la impedancia de salida del filtro ha de ser menor
en un 10 % a la de carga, para asegurarnos que no afectamos el funcionamiento del
filtro por el efecto divisor de tensión. La impedancia de salida del filtro depende de
la frecuencia, pero en el caso más desfavorable, cuando la impedancia es la máxima
posible, valdrá R (mirando el equivalente de Thévenin del filtro, el caso más desfa-
vorable ocurre cuando ω = 0, y entonces ZT h = R). Por lo tanto, de la condición
R ≤ Rload /10, se concluye que una buena elección es R = 10 kΩ.
El valor de C viene condicionado por la frecuencia de corte f3dB . Se podrı́a elegir
f3dB = fseñal , pero el problema es que en realidad la se nal no está compuesta de una
sola frecuencia, sino que incluye un rango que no queremos atenuar. Como queremos
que la se nal de alta frecuencia sea atenuada lo máximo posible y la de baja frecuencia
lo mı́nimo, elegiremos f3dB = 2fseñal = 2 kHz. Con ello se puede comprobar que la
se nal original resulta atenuada en un 11 %, es decir, obtenemos el 89 % de la se nal a
la salida del filtro empleando la expresión (17.6). En cuanto al ruido, podemos ver que
su frecuencia se halla a 8f3dB , es decir, a 3 octavas o 23 veces la frecuencia de corte.
En la parte lineal de la representación de Bode, cada octava implicaba una caı́da de
6 dB, por lo que la amplitud se verá reducida 23 veces. Esto es una estimación ya
que no estamos en la parte lineal de la curva, pero la respuesta correcta, usando de
nuevo la ecuación (17.6), es que la amplitud se reduce en un factor 8,06. Con toda
esta discusión, C = 1/(2πf3dB R) ≈ 0,008 × 10−6 F, con lo cual podemos elegir un
condensador de 0,01 µF.

17.7. Ejercicios
1. Demostrar que el ángulo entre dos números complejos en el plano de Argand
viene dado por el arco cuya tangente es el cociente entre la parte imaginaria y la
parte real del cociente de ambos. Pista: escribir las partes real e imaginaria del
cociente como suma y resta del número y su conjugado y usar la forma polar de
los números complejos.
2. Demostrar la expresión (17.9) para la respuesta en fase para un filtro pasa alta.
3. Justificar la aproximación lineal de la figura 17.6 para un filtro pasa baja.
4. Sustituir el condensador por un inductor en un filtro pasa alta y pasa baja y
calcular sus funciones de respuesta en frecuencia. Dibujar esquemáticamente sus
gráficas de Bode y comprobar que son las mismas que las representadas en las
figuras 17.5 y 17.6. p
/Vin = 1/ 1 + [R/(ωL)]2 , φ = arctan (R/(ωL)).
Solución: Voutp
Vout /Vin = 1/ 1 + (ωL/R)2 , φ = − arctan (ωL/R).
5. Obtener la ecuación (17.14) para la función respuesta en amplitud del filtro mos-
trado en la figura 17.7. Comprobar que el intervalo entre las frecuencias de los
puntos de −3 dB vale ∆3dB = f0 /Q.
6. Demostrar que a la frecuencia de resonancia, la energı́a almacenada en la bobina
216 Filtros

del circuito de la figura 17.7 es la misma que la que se almacena en el condensador.


7. A partir de las igualdades dadas en la expresión (17.18) para el factor de calidad
a frecuencia resonante, obtener el valor Q = ω0 CR.
8. Para el circuito representado en la figura 17.9, calcular la frecuencia de resonancia
y el factor de calidad.√
Solución: f0 = 1/2π LC, Q = 2πf0 L/R.
9. La frecuencia de resonancia no es la misma para circuitos RLC. Depende de
cómo están conectados los elementos. Para comprobarlo, calcular la frecuencia
de resonancia en un circuito con un condensador en serie con la asociación en
paralelo de los otros dos. Compararlo con la frecuencia de resonancia de un filtro
de ancho de banda. p
Solución: ω0 = 1/ LC − (L/R)2 .
Capı́tulo 18

Semiconductores

18.1. Semiconductores, metales y dieléctricos


Si aplicamos un campo eléctrico a un volumen lleno de partı́culas neutras no aparece
corriente eléctrica. De esta manera, un volumen lleno con un gas de átomos neutros
de cualquier sustancia, por ejemplo plata, es un aislante o dieléctrico que se puede
considerar ideal. Sin embargo, en estado sólido, la plata presenta una conductividad
1022 veces mayor que la del vidrio. Una sustancia, dependiendo del cristal que forma
(de su ordenamiento formando distintos tipos de redes), puede ser aislante o conduc-
tora. Ası́, el carbono puede ordenarse de una forma conocida como grafito, que es un
buen conductor, y de otra forma conocida como diamante que es un aislante casi per-
fecto. En un gas, los átomos o moléculas se pueden considerar como entes individuales
ya que están muy separados entre sı́, mientras que en un sólido las propiedades no
dependen tanto de los átomos individuales como de los enlaces entre ellos.
Supongamos que tenemos un cristal como el mostrado en la figura 18.1. Para
formar el enlace imaginemos que cada átomo pierde un electrón de valencia. Esos
electrones quedan entonces libres para saltar de la proximidad de un núcleo a otro. Se
puede decir que se colectivizan. Habrá unos 1022 electrones por centı́metro cúbico en
el metal (dibujados como puntos negros) que pueden responder libremente a la acción
de un campo externo, generándose corriente eléctrica. Esta situación es la del enlace
metálico.
Veamos el caso opuesto, en donde todos los electrones de valencia intervienen
en el enlace entre átomos y ninguno se colectiviza. En la figura 18.2 podemos ver un
cristal de silicio (Si). El átomo de silicio posee 4 electrones de valencia. Al formar la
red, comparte esos electrones con sus vecinos, de manera que a su alrededor orbitan 8
electrones según podemos ver representados mediante las lı́neas que unen los átomos
en la figura: los cuatro que tenı́a y otros 4 provenientes de sus vecinos. La carga
negativa que posee cada átomo de la red en promedio es de 4 electrones, la misma que
tenı́a individualmente. En este caso no existe carga disponible que libremente pueda
responder a un campo externo y por consiguiente su comportamiento será el de un
buen dieléctrico.
Sin embargo, cualquier defecto en la red, cualquier impureza debida a la presencia
de un átomo extraño, incluso calor, son capaces de destruir algunas de las ligaduras
electrónicas. Entonces, en menos cantidad que en el caso de un conductor, existirán

217
218 Semiconductores

Si

Figura 18.1. Diagrama esquemático de Figura 18.2. Diagrama esquemático de


la red cristalina de un metal. La red de la red cristalina del silicio. Las lı́neas
iones cargados positivamente está inmer- que unen los átomos representan ligadu-
sa en un gas de electrones libres. ras electrónicas.

electrones libres que pueden conducir corriente. Este comportamiento es el de un


semiconductor.
La conductividad de estos materiales no es ni muy grande ni muy pequeña. Es
menor que la de algunos materiales conductores, como el cobre, el hierro, el aluminio,
el oro o la plata, pero mucho mayor que la de dieléctricos como el vidrio, la madera o
el papel. Otra importante propiedad que poseen es la dependencia de la conductividad
con la temperatura de forma muy marcada. Dicho de otro modo, su resistencia al paso
de la corriente eléctrica depende mucho de la temperatura.
Estas dos propiedades, a primera vista nada espectaculares, hacen de estos ma-
teriales los protagonistas de la tecnologı́a electrónica actual. Capas delgadas de ma-
teriales semiconductores, unas sobre otras, se usan para controlar el flujo de corriente
eléctrica en los circuitos, para detectar y amplificar se nales de radio, para producir
oscilaciones en los transmisores, para fabricar interruptores digitales, etc.

18.2. Teorı́a de bandas para la conducción


Un tratamiento riguroso para explicar el comportamiento de los semiconductores re-
querirı́a mecánica cuántica. Sin embargo, es posible un tratamiento clásico para in-
troducir los conceptos de la teorı́a de bandas y huecos.
Calculemos primero el campo que mantiene unidos los electrones en un cristal
ideal de Si a 0 K, por lo que todos los electrones de valencia participan en el enlace.
Usaremos propiedades del Si y algunas hipótesis:

El Si tiene número átomico Z = 14. En las capas más externas posee 4 electrones
de valencia. Por consiguiente, la carga total positiva que sienten estos electrones es
igual al número de protones menos el número de electrones de las capas internas,
es decir 4e.
Supondremos que el campo que mantiene unido a estos electrones de valencia
con el núcleo se puede calcular como un campo creado por cargas puntuales
empleando la ley de Coulomb.
El Si cristaliza en forma de diamante, con cada átomo de la red dentro de un
tetraedro, con 4 vecinos en cada vértice. La distancia a cada vecino, también
llamada constante reticular, vale a0 = 0,54 nm. Supondremos que la distancia
Teorı́a de bandas para la conducción 219

entre los electrones de valencia y el conjunto del núcleo más los electrones internos
es a0 .
Con estas hipótesis, el módulo del campo eléctrico que siente un electrón es |E| =
2×1010 V/m, 10000 mayor que el necesario para desencadenar rayos en una tormenta.
Está claro que el Si se comporta en estas condiciones como un dieléctrico perfecto, ya
que un campo externo, sumado al que mantiene unido al electrón con el núcleo, sólo
deformará un poco las órbitas electrónicas, pero no habrá corriente.
Veamos ahora cuánta energı́a harı́a falta para liberar un electrón. La fuerza que
mantiene ligado al electrón viene dada por |Fe | = e|E|. Para liberarlo, deberı́amos
aplicar al menos una fuerza de igual magnitud, y alejarlo una distancia a0 . Ası́ para
hacerlo libre necesitarı́amos suministrarle una energı́a Eg = a0 e|E|. El subı́ndice g
viene de la palabra inglesa gap que significa espacio, intervalo, salto. Si suponemos que
el campo eléctrico es del mismo orden que el calculado anteriormente, |E| ∼ 1010 V/m
para el Si en las condiciones ideales anteriores, entonces Eg ≈ 5 eV. Un electrón-voltio
eV es la energı́a que adquiere un electrón acelerado por una diferencia de potencial
de 1 V. Por tanto, 1 eV = 1,6 × 10−19 J.
En general, podemos decir que si Eg ≥ 3 eV, el cristal se comportará como un
dieléctrico, con una resistencia infinita. Si, por el contrario, Eg ≤ 3 eV, será más
fácil que se rompan algunos enlaces y se creen electrones libres. El comportamiento
será el de un semiconductor, con conductividad distinta de cero y resistencia finita.
Por ejemplo, para el antimoniuro de indio (InSb), Eg ≃ 0,17 eV. La energı́a que posee
la radiación infrarroja es del mismo orden, y cuando se ilumina con luz infrarroja
un semiconductor de este tipo se vuelve conductor. Otro semiconductor tı́pico es el
arseniuro de galio (GaAs), con Eg ≃ 1,4 eV.
A temperatura finita, los átomos de la red se ponen a vibrar y será más fácil
romper enlaces, con lo cual la resistencia eléctrica disminuye cuando la temperatura
aumenta en los semiconductores. En los metales, la resistencia aumentaba con la
temperatura.
Se dice que los electrones que participan en el enlace ocupan la banda de valencia
del sólido, estando todos ellos en un rango energético menor que aquellos que se
encuentran en la llamada banda de conducción. La banda de conducción es el rango
energético en el que se hallan los electrones colectivos del cristal. Ambas bandas o
rangos energéticos están separadas por un intervalo que es igual a Eg llamado banda
prohibida. Esto se puede ver de un modo gráfico empleando los diagramas de bandas.
En la figura 18.3 podemos ver el diagrama de bandas para un semiconductor
como el Si a temperatura ambiente, y en la figura 18.4 para un aislante. En general,
un material puede conducir electricidad si la banda de valencia, la de conducción, o
ambas, no están completamente llenas de electrones o completamente vacı́as. Si están
vacı́as, está claro que no hay portadores y no habrá corriente, pero también hace falta
que haya espacio en una banda para que los portadores que se encuentran en ella
puedan moverse. Si en un material la banda de conducción y la de valencia están
completas no habrı́a corriente. Si la banda de valencia se halla medio vacı́a y la de
conducción totalmente vacı́a entonces sı́ puede haber corriente, como suele ser el caso
de un metal monovalente, formado por átomos con un solo electrón en la capa de
valencia.
En un aislante, normalmente la banda de conducción se encuentra vacı́a mien-
tras que la de valencia está llena. En un semiconductor como el representado en la
220 Semiconductores

Energia Energia
Banda
de conduccion
Banda
de conduccion
Eg = 5 eV
Eg = 1 eV

Banda de valencia
Banda de valencia

Figura 18.3. Diagrama de bandas pa-


Figura 18.4. Diagrama de bandas para
ra un semiconductor. La banda de con-
un aislante. La banda de conducción se
ducción contiene algunos electrones exci-
encuentra vacı́a mientras que la de valen-
tados térmicamente que han abandonado
cia completamente llena.
la banda de valencia.

figura 18.3, debido a que Eg no es demasiado grande, existen electrones con suficiente
energı́a térmica como para saltar esta barrera y pasar a la banda superior. La banda
de conducción contiene electrones que han abandonado la banda de valencia dejando
espacios vacı́os en ella o huecos.
Los huecos no son partı́culas, sino espacios vacı́os dejados por electrones. Sin
embargo, el concepto de hueco fue introducido en 1933 por Frenkel para nombrar a la
partı́cula capaz de crear una corriente eléctrica en un semiconductor y que transpor-
ta la misma carga eléctrica que el electrón pero con signo positivo. De esta manera
se asignaban propiedades de masa y carga a estos espacios vacı́os. En las próximas
secciones, cuando discutamos cómo se mueven los electrones de las capas parcial-
mente ocupadas cuando se aplica un campo eléctrico, veremos lo útil que resulta la
descripción de Frenkel.

18.3. Semiconductores intrı́nsecos


Los semiconductores intrı́nsecos son aquellos en los cuales la concentración de huecos
y electrones libres está determinada únicamente por Eg y por la temperatura a la que
se encuentran.
Imaginemos un cristal de Si como el que dibujamos en la figura 18.5, en el que
no existen defectos ni impurezas, y que se halla a temperatura T . La pregunta que
nos haremos es cuántos enlaces estarán rotos o cuántos electrones habrá en la banda
de conducción.
El movimiento caótico de la red debido a la energı́a térmica tiende a romper
los enlaces. Por consiguiente, el efecto de la temperatura será la creación de pares
de electrones y huecos. Se sabe que el valor medio de la energı́a de este movimiento
caótico viene dado por kB T , siendo

kB = 1,38 × 10−23 J/K = 8,6 × 10−5 eV/K, (18.1)

la constante de Boltzmann. A temperatura ambiente (300 K), la energı́a térmica es


kB T ≈ 0,026 eV, mientras que a una temperatura de 200◦ C, es kB T ≈ 0,043 eV (la
conversión entre grados centı́grados y Kelvin viene dada por K = ◦ C + 273,15).
Semiconductores intrı́nsecos 221

Si

Figura 18.5. Cristal de Si a T 6= 0, en donde se puede ver un par electrón-hueco

En general para semiconductores kB T ≪ Eg , lo que sugiere que la energı́a térmica


es incapaz de romper enlace alguno, pero lo que ocurre es que kB T da el valor medio
de la energı́a térmica, pero no el valor para cada átomo del cristal en un determinado
instante. Habrá átomos que posean una energı́a mucho mayor y otros mucho menor
que kB T , siendo los primeros capaces de perder electrones de enlace. La mecánica
estadı́stica nos dice que la probabilidad de que existan átomos con una energı́a igual
a Eg en un determinado instante, cuando se halla el cuerpo con una energı́a promedio
kB T , viene dada por la exponencial del cociente con signo negativo. Por consiguiente,
el número de pares electrón-hueco creados cada segundo por unidad de volumen del
semiconductor vendrá dado por
 
Eg
P1 = α exp − , (18.2)
kB T

siendo α un coeficiente de proporcionalidad diferente para cada tipo de semiconductor.


Por otro lado, cuando un electrón libre se encuentra con un hueco, se aniqui-
lan mutuamente. El electrón rellena el hueco y se libera una energı́a igual a Eg .
Este proceso se llama recombinación. La frecuencia con la que ocurre este proceso
será proporcional al número de huecos existentes, ya que mientras más huecos haya,
más probabilidad tendrá un electrón de encontrarse con un hueco. Además, también
será proporcional por la misma razón al número de electrones. Podemos entonces
escribir el número de electrones y huecos que desaparecen por recombinación cada
segundo, por unidad de volumen, como

P2 = β ni pi , (18.3)
siendo β un coeficiente de proporcionalidad que depende del semiconductor considera-
do, y ni , pi respectivamente el número de electrones y huecos por unidad de volumen
en el semiconductor intrı́nseco.
En un semiconductor intrı́nseco cada vez que se crea un hueco aparece un electrón
libre (se genera un par), por lo que podemos igualar las concentraciones ni = pi , y
escribir esta la expresión (18.3) como

P2 = β ni 2 = β pi 2 . (18.4)

El equilibrio a una determinada temperatura se alcanza cuando las concentraciones ni


y pi no cambian en el tiempo, por lo que el proceso de recombinación ha de igualarse
222 Semiconductores

Ec
Eg
Ev

Figura 18.6. Diagrama de bandas ilustrando el proceso de generación y recombinación en


un semiconductor intrı́nseco. La flecha hacia arriba indica el proceso de creación, hacia abajo
el de aniquilación.

al proceso de generación. Igualando (18.2) y (18.3), obtenemos


 
Eg
ni = pi = N exp − , (18.5)
2kB T

con N = (α/β)1/2 .
Los procesos de generación y recombinación pueden describirse mediante el dia-
grama de bandas de la figura 18.6 en donde se representa la creación–aniquilación
de un par. El hueco se ha pintado como una carga positiva (ausencia de electrón en
la banda de valencia). El electrón aparece como un punto negro más pequeño (con
menos masa) en la banda de conducción. En la sección 18.5 veremos por qué se supone
menos masivo el electrón que el hueco.
La expresión (18.5) permite explicar las propiedades que mencionábamos al co-
mienzo del capı́tulo. En la tabla 18.1 podemos ver algunos valores de Eg y de la con-
centración ni para diferentes semiconductores a diferentes temperaturas. Recordemos
que cada centı́metro cúbico de un metal contiene unos 1022 electrones de conducción,
mientras que incluso en un semiconductor como el InSb, con un valor pequeño de Eg ,
el número de electrones intrı́nsecos es, a temperatura ambiente, un millón de veces
más pequeño. Es de esperar que no sea tan buen conductor. Por otro lado, un cam-
bio en la temperatura aumenta la concentración de electrones y, por consiguiente, la
conductividad. Se puede comprobar que si se aumenta la temperatura 1,7 veces, la
concentración en en caso del GaP aumenta 5,5 × 107 veces.

Semiconductor Eg (eV) T (K) ni (cm−3 )


InSb 0,17 300 1,3 × 1016
500 4,8 × 1016
Ge 0,72 300 2,4 × 1013
500 6,4 × 1015
GaAs 1,4 300 1,4 × 107
500 7,2 × 1011
GaP 2,3 300 0,8
500 4,4 × 107

Tabla 18.1. Valores caracterı́sticos de la concentración de electrones a diferentes tempera-


turas para algunos semiconductores.
Semiconductores extrı́nsecos 223

Si

As

Figura 18.7. Un átomo donador As en una red de Si.

18.4. Semiconductores extrı́nsecos


En la naturaleza no existen sustancias puras que contengan un solo tipo de átomos.
Cualquier cristal real contiene alguna impureza. Una sustancia se considera pura si
contiene un átomo extraño por cada 1000 átomos intrı́nsecos, es decir, un 0,1 % de
impurezas. Desde el punto de vista quı́mico, la sustancia será absolutamente pura
si contiene 0,001 % de impurezas. Sin embargo, supongamos que la impureza en el
semiconductor es capaz de liberar un electrón o formar un hueco con mucha facili-
dad. Esto implica que tendremos por cada centı́metro cúbico unos 1017 electrones
o huecos aproximadamente. Si miramos de nuevo la tabla 18.1, esta concentración
será mucho mayor que cualquiera de las concentraciones intrı́nsecas. Es por esto que
las impurezas juegan un papel tan importante en las propiedades del semiconductor.
El control de las mismas es de suma importancia, y por ello, su fabricación se hace
en salas esterilizadas, incluso más que los quirófanos. La gran mayorı́a de materiales
semiconductores contiene cierta cantidad controlada de impurezas para fijar el valor
necesario de la conductividad.

Impurezas donadoras
Veamos primero el caso de las impurezas donadoras. Supongamos que un átomo ex-
traño se ha alojado en un cristal y ocupado uno de los lugares de la red. Por ejemplo,
un átomo de arsénico (As) ha ocupado el lugar de un átomo de Si como puede verse
en la figura 18.7. El Si tenı́a 4 electrones de valencia pero el As tiene 5.
Cuatro de esos electrones del As formarán enlaces con los átomos de Si vecinos, y
sobra uno. Ese quinto electrón se quedará en las cercanı́as del As, pero al tratarse de
un electrón de las capas exteriores y no formar enlace, estará ligado al As débilmente.
La energı́a necesaria ∆E para que este electrón se transforme en un electrón libre
será mucho menor que la energı́a Eg necesaria para liberar uno de los electrones de
valencia del cristal. Esta energı́a de ionización se llama energı́a de activación de la
impureza. Las impurezas que pierden electrones fácilmente, como en este caso, reciben
el nombre de impurezas donadoras.
Sea Nd la densidad de impurezas y consideremos que el cristal se halla a 0 K.
El cristal se comportará como un dieléctrico ideal, ya que aunque liberar el quinto
electrón implica poca energı́a, a esa temperatura no hay ninguna disponible (recor-
demos que no hay vibraciones de la red). A temperatura mayor que cero, la densidad
de electrones libres debido a las impurezas vendrá dada por
224 Semiconductores

Si

Figura 18.8. Un átomo aceptor B en una red de Si.

 
∆E
nd = Nd exp − , (18.6)
kB T
en donde el subı́ndice d indica donadora. La expresión es análoga a la ecuación (18.5),
pero en lugar de un valor grande Eg tenemos un valor mucho menor ∆E. En el caso
del As en el Si, ∆E es igual a 0,05 eV.
Un semiconductor en el que se han introducido impurezas donadoras se llama
semiconductor de tipo n. La letra n viene de la palabra negativo, mostrando que el
semiconductor tiene muchos electrones libres.

Impurezas aceptoras
Veamos ahora el caso en el que la impureza tiene menos electrones para compartir que
el átomo intrı́nseco. En este caso recibe el nombre de impureza aceptora. Imaginemos
que en vez de As la impureza fuera boro (B). El B es trivalente, y por tanto le
faltará un electrón para poder formar un enlace completo con los cuatro vecinos de
la red.
En la figura 18.8 se pueden ver los enlaces electrónicos de un semiconductor de
Si dopado con B. Esta situación es parecida a la mostrada en la figura 18.5, ya que en
cada caso falta un enlace. Sin embargo, existe a la vez una gran diferencia: todos los
átomos de Si son idénticos por lo que, en cualquier instante, el hueco entre ellos puede
rellenarse por uno de los electrones de enlace y pasar a estar más cerca de otro vecino.
No hace falta energı́a para que el hueco viaje por el cristal. Pero el B es un átomo
extra no en la red. Para que un electrón del Si vecino rellene el hueco del B y se cree
un hueco, es necesaria una energı́a ∆E. En el caso del B en Si esta energı́a es de sólo
0,045 eV, pero aunque peque na, es distinta de cero. Ningún hueco se formará en el
cristal hasta que esta barrera energética no sea superada. Supongamos que, o bien la
vibración de la red, o la radiación exterior, ha suministrado esta energı́a de activación.
Ahora la situación será idéntica a la de la figura 18.5. Habrá un hueco o enlace vacı́o
que equivale a una carga positiva en la red. La expresión que nos dará la concentración
de estos huecos en el equilibrio será entonces
 
∆E
pa = Na exp − , (18.7)
kB T
análoga a la del caso de impurezas donadoras. Es importante tener en cuenta que la
creación de un hueco no está acompa nada de la creación de un electrón libre (de
Semiconductores extrı́nsecos 225

∼ E /2k
g B

ln n (ln p)

∼ ∆E/k
B

1/T

Figura 18.9. Dependencia tı́pica de la concentración de portadores con la temperatura. Po-


demos observar tres regiones: a bajas temperaturas la conductividad se debe principalmente
a la presencia de impurezas, conforme aumentamos la temperatura las impurezas se saturan,
y por último, los portadores intrı́nsecos son los que contribuyen a la conductividad.

forma análoga a lo que sucedı́a en el caso de impurezas donadoras con la creación de


electrones libres). Un semiconductor que ha sido dopado con impurezas aceptoras se
llama semiconductor de tipo p (la letra p viene de positivo).
Por último, queremos hacer constar que las expresiones (18.6) y (18.7) son sólo
aproximadas y válidas si el valor calculado con ellas es mucho menor que las concen-
traciones de impurezas Nd y Na respectivamente, esto es, si kB T ≪ ∆E. Si éste no es
el caso, entonces todo los átomos de impurezas estarán activos y las concentraciones
nd y pa serán iguales a las concentraciones Nd y Na .

Portadores mayoritarios

La curva de la figura 18.9 resume lo que hemos aprendido sobre las propiedades de
los semiconductores intrı́nsecos y extrı́nsecos. Representa la dependencia tı́pica de la
concentración de portadores libres (electrones o huecos) con la temperatura. Se ha
dibujado el logaritmo de las densidades frente a la inversa de la temperatura.
Para temperaturas bajas, la contribución principal o mayoritaria viene de la crea-
ción de portadores debida a la presencia de impurezas. Se puede ver que la dependencia
es lineal como predicen las expresiones (18.6) y (18.7). Conforme la temperatura au-
menta y nos acercamos hacia el origen de la gráfica, vemos que llegamos a una zona
en las que la concentración de portadores mayoritarios no depende de la temperatu-
ra. Esta zona corresponde a un rango en el que todas las impurezas, y no solo una
fracción de ellas, tienen suficiente energı́a térmica para contribuir a la aparición de
un electrón libre (o hueco). Por último, si continuamos aumentando la temperatura,
la energı́a térmica es suficiente para que los átomos del cristal puedan romper sus
enlaces y crear pares electrón-hueco. Esto está representado por una lı́nea recta de
pendiente Eg /2kB que se corresponde con la expresión (18.5).
226 Semiconductores

Portadores minoritarios
Anteriormente hemos visto cuál es la concentración de electrones debida a la presencia
de impurezas donadoras y la de huecos debida a impurezas aceptoras. Estos portadores
son los que a bajas temperaturas contribuyen mayoritariamente a la densidad de carga
libre como se aprecia en la figura 18.9. Sin embargo, las impurezas donadoras no sólo
donan electrones, sino que también afectan a la distribución de huecos. Análogamente,
las aceptoras no sólo crean huecos sino que también afectan a la concentración de
electrones.
Discutiremos ahora cuál será la concentración de huecos en un semiconductor de
tipo n, y cuál la de electrones en uno tipo p, minoritarias en ambos casos. En primer
lugar, recordemos que cuando se ionizan las impurezas, en el caso de ser de tipo n, éstas
crean un electrón pero no un hueco (para las impurezas tipo p se crean huecos pero
no electrones). Dicho de otro modo, las impurezas no crean pares. A la vista de esto,
podrı́a pensarse que el número de portadores minoritarios debe de ser el intrı́nseco ya
que las impurezas no contribuyen a crear huecos extras en el caso de ser donadoras
(semiconductor tipo n), o electrones extras si son aceptoras (semiconductores tipo
p). Esto es verdad a medias. Es cierto que la creación de pares electrón-hueco que
aparecen por cada segundo a una temperatura T en un semiconductor de tipo n o p
es el mismo que en el caso de un semiconductor intrı́nseco, pero el número de pares
que desaparecen no.
La expresión (18.2) nos daba el número de pares que aparecı́an a una deter-
minada temperatura, que era igual al que desaparecı́a, y por tanto proporcional a
n2i (T ). Sin embargo, el número de huecos en el caso de un semiconductor tipo n en el
equilibrio será menor, ya que al haber más electrones habrá mas posibilidades de que
estos se encuentren con aquellos, y por tanto que se aniquilen. De nuevo, como en la
expresión (18.3), el número de huecos que desaparecen es proporcional al producto de
las poblaciones de huecos p0 y electrones n0 . Por consiguiente, la ecuación de balance
en el equilibrio puede escribirse como
p0 n0 = n2i (T ), (18.8)
en donde el subı́ndice 0 equivale a d o a dependiendo de qué clase de semiconductor
se trate, si donador o aceptor. Si combinamos esta expresión con las ecuaciones (18.6)
o (18.7), podremos saber cuánto vale la concentración de portadores minoritarios,
huecos pd en el primer caso, o electrones na en el segundo caso.

18.5. Movimiento de electrones y huecos


En este apartado veremos cómo se mueven los portadores libres y contribuyen a la
corriente cuando se aplica un campo eléctrico al semiconductor. Veremos que podre-
mos asignar a los huecos propiedades de partı́culas positivas que se desplazan a favor
del campo aplicado. La corriente eléctrica será la suma del movimiento ordenado de
los electrones libres más el de los huecos.

Movimiento térmico
Los átomos de cualquier sustancia están en constante movimiento térmico debido a la
energı́a cinética que poseen. Las colisiones de los portadores libres con los átomos de
Movimiento de electrones y huecos 227

la red cristalina dan lugar a un movimiento caótico. El promedio energético de este


movimiento térmico es igual a 3kB T /2. Igualando este valor a la energı́a cinética de
la partı́cula mv 2 /2, podemos encontrar el módulo de la velocidad media vT de este
movimiento caótico,
 1/2
3 kB T
vT = . (18.9)
m
Cuando T = 300 K, si asumimos que la masa del portador es igual a la del electrón
en el vacı́o, resulta vT ≈ 105 m/s. Sin embargo, no habrá desplazamiento neto porque
la dirección de este movimiento es aleatoria.

Movimiento en un campo eléctrico


En presencia de un campo eléctrico, los portadores adquieren además un movimiento
en la dirección del campo aplicado. Los electrones cargados negativamente tenderán
a moverse hacia el electrodo positivo.
Veamos qué le ocurre a los huecos. Recordemos que un hueco no es una partı́cula
real, sino la ausencia de un electrón de enlace. Este hueco puede ser ocupado por un
electrón libre, con lo cual desaparecerı́a el par, o por uno de los electrones vecinos que
participan en el enlace, con lo cual el hueco permanecerı́a en la cercanı́a del mismo
átomo, ya que este electrón de enlace deja a su vez otro hueco. Debido sin embargo
a la presencia de un campo externo, los electrones de enlace deforman un poco sus
órbitas, y en general será más probable que los electrones que tiendan a ocupar el
hueco sean aquellos tales que su órbita pase más cerca, y estos pueden ser de átomos
vecinos. El movimiento de esta sucesión de huecos será en promedio paralelo al campo.
Podemos describir esta situación como un sólo hueco que se comporta eléctricamente
como el electrón pero con carga positiva. El resultado de todo esto es un movimiento
dirigido de electrones negativos en un sentido y huecos positivos en el otro, dando la
suma una corriente eléctrica.
En presencia de un campo eléctrico E la fuerza eléctrica que actúa sobre un por-
tador es Fe = qE (q = ±e, dependiendo si es un electrón o un hueco). Además las
partı́culas sufren colisiones con los átomos que componen el cristal debido a la energı́a
térmica que poseen. Después de cada colisión, el portador se puede mover en cualquier
dirección. Esto significa que en valor medio la velocidad de este movimiento será cero
justo después de la colisión. En segundo lugar, como las colisiones son también alea-
torias, el tiempo de vuelo libre del portador también será bastante diferente. Podemos
pues tomar un promedio de este tiempo entre colisión y colisión, que denotaremos
por τ0 . El valor medio de la velocidad del portador o velocidad de arrastre se puede
obtener empleando los argumentos de la sección 7.1 como
eτ0
va = |E| = ζ|E|. (18.10)
m
El coeficiente de proporcionalidad ζ en la ecuación (18.10) se llama movilidad,

ζ = eτ0 /m. (18.11)

En la tabla 18.2 podemos ver algunos valores experimentales de este coeficiente para
electrones y huecos a temperatura ambiente en distintos tipos de semiconductores.
228 Semiconductores

La proporcionalidad entre la velocidad de arrastre y el campo eléctrico como


vimos en el capı́tulo 7 se puede escribir como
σe
va = |E|, (18.12)
en0
siendo σe la conductividad eléctrica del portador considerado y n0 su número por
unidad de volumen. Las ecuaciones (18.11) y (18.12) implican una relación entre
movilidad y conductividad dada por

σe = en0 ζ. (18.13)

Mecanismos de colisión
Analizaremos ahora con más detalle el significado τ0 que aparece en la expresión
(18.11). Supongamos que un portador va chocando con los átomos vecinos de la red, de
manera que τ0 fuera el tiempo medio que tarda el portador en viajar entre dos vecinos.
Para campos externos moderados, la velocidad promedio del portador será va ≈ vT ,
ya que la velocidad térmica es del orden de 105 m/s. La distancia a0 entre dos vecinos
en el caso de una red de Si vale aproximadamente 5 × 10−10 m. Usando estos datos,
podemos ver que obtendrı́amos un valor ζ ∼ 10−3 m2 /Vs para la movilidad.
Ya que los valores de a0 y vT son aproximadamente iguales para todo sólido,
este valor de la movilidad, suponiendo colisiones entre vecinos, también serı́a un valor
universal para todos los semiconductores. Si miramos la tabla 18.2 y comparamos los
valores experimentales con nuestra predicción teórica, vemos que los valores experi-
mentales resultan al menos un orden de magnitud mayores.
Se puede pensar en el proceso inverso. Se toman los valores experimentales de
las movilidades, y con ellos se calcula τ0 . Entonces se puede estimar la distancia que
el portador debe viajar entre colisión y colisión. Tomemos por ejemplo el valor de
la movilidad de los electrones para el InSb. La distancia recorrida entre colisión y
colisión resulta del orden de 5 × 10−6 m. Como la distancia entre átomos de la red
es a0 , esta distancia corresponde a 10000 distancias interatómicas. Esto es realmente
increı́ble, ya que antes de chocar el electrón pasa 10000 átomos sin colisionar con ellos.
No podrı́amos encontrar explicación alguna si los portadores fueran partı́culas
como bolas de billar. Sin embargo, una de la principales ideas de la mecánica cuántica
es que se puede asociar a cada partı́cula un comportamiento ondulatorio. Bajo ciertas
condiciones, cualquier tipo de onda se puede propagar sin ser refractada en un medio
que contiene centros de refracción. La condición principal es que esos centros estén
colocados en una red periódica. Cualquier ligera desviación de este espaciamiento ideal

Semiconductor InSb Ge GaAs GaP


2
ζn (m /Vs) 8 0,39 1 0,05
ζp (m2 /Vs) 0,07 0,19 0,04 0,01

Tabla 18.2. Movilidades experimentales de electrones y huecos para distintos semiconduc-


tores a temperatura ambiente T = 300 K.
Movimiento de electrones y huecos 229

(el cambio de distancia entre los centros, la presencia de otro centro con diferentes
propiedades o incluso la ausencia de alguno) provocan la colisión de la onda. Por
tanto τ0 denota el tiempo entre colisiones del portador con cualquier distorsión de
la red ideal del cristal. Se puede aprender mucho sobre las causas de esta distorsión
estudiando la dependencia de la movilidad con la temperatura.

Masa efectiva
Hemos supuesto que la masa del portador entre colisiones es igual a la masa del
electrón libre en el vacı́o. Ahora sabemos que las cosas no son tan simples. En el tiem-
po que transcurre entre dos colisiones, los portadores sienten el campo creado por los
iones y los electrones de valencia, además del externo, ya que viajan a través de mu-
chas distancias interatómicas. Por consiguiente, se puede preguntar si las ecuaciones
derivadas anteriormente tienen sentido.
La respuesta a esta cuestión necesita un tratamiento cuántico. Sin embargo todo
el razonamiento es válido salvo que en las expresiones donde aparece la masa del
electrón en el vacı́o m, ésta se debe sustituir por una masa efectiva m∗ para el electrón
o el hueco. Este cambio refleja la influencia del campo creado por la red sobre el
portador que se mueve por ella. En la tabla 18.3 vemos que los valores son bastante
diferentes de los de la masa del electrón libre, y por ello las movilidades también lo
son.

Portadores calientes
Nos queda un último aspecto a discutir. Hemos asumido que el campo externo era lo
suficientemente débil para no alterar el movimiento térmico del portador de manera
significativa. Pero ¿qué ocurre si el campo externo no es débil?
El campo necesario para hacer que la velocidad de arrastre de los electrones va sea
igual a la velocidad térmica vT a temperatura ambiente es del orden de 5 × 105 V/m.
Si el campo aplicado al semiconductor es tan grande que la velocidad de arrastre se
aproxima a la térmica, se dice que los portadores están calientes. En este régimen, su
interacción con la red es diferente de lo discutido hasta ahora, y el tiempo de colisión
τ0 , la masa efectiva m∗ , y consecuentemente la movilidad empiezan a depender del
campo externo aplicado. Esencialmente, lo que ocurre es que un portador que ha
adquirido tal cantidad de energı́a entre colisión y colisión la transfiere prácticamente
totalmente a la red en la colisión siguiente. Bajo tales condiciones, tenemos que

ζ ∼ 1/|E|, va = cte. (18.14)

Semiconductor InSb Ge GaAs GaP


m∗e /m 0,013 0,12 0,07 0,35
m∗h /m 0,18 0,28 0,45 0,86

Tabla 18.3. Razón entre la masa efectiva de portadores en diversos semiconductores y la


masa del electrón en el vacı́o m = 9,1 × 10−31 kg.
230 Semiconductores

18.6. Difusión
El fenómeno de la difusión aparece en gases, lı́quidos y sólidos. El olor de un perfume
que se derrama en una habitación llena la casa incluso si las ventanas están cerradas
y el radiador apagado para que el aire esté en reposo. Al final, acabamos oliendo el
perfume por toda la casa debido al proceso de difusión. Si uno deja caer una gota de
tinta en un vaso de agua, al final todo el liquido quedará coloreado.
Si se recubre la superficie de un semiconductor que no contiene impurezas con una
sustancia que contiene muchas, al cabo de un tiempo se pueden encontrar impurezas
en el semiconductor en regiones bastante alejadas de la superficie de contacto. A
temperatura ambiente, el tiempo para que esto ocurra serı́a del orden de 10 a nos,
pero si se eleva la temperatura lo suficiente, el proceso se reduce a horas e incluso
minutos (este fenómeno se usa para la introducción de impurezas en semiconductores
desde la superficie del mismo).
Lo común de los procesos descritos anteriormente es la penetración espontánea
de una sustancia, sin ser afectada por otros agentes externos, desde una región de
mayor concentración a una región de menor concentración.

Corriente de difusión
El proceso de difusión es una consecuencia directa del movimiento caótico de los
átomos o moléculas. Supongamos que el perfume derramado está encerrado en una
semiesfera imaginaria con la base en el suelo. Las moléculas del perfume pueden
atravesar esa superficie imaginaria hacia afuera y hacia adentro. Debido a sus choques
con las moléculas del aire, las moléculas del perfume se aproximan a la semiesfera y
la cruzan. Como en el interior hay menos que en el exterior, las moléculas que cruzan
hacia afuera inicialmente son más que las que cruzan hacia adentro. El promedio es
por tanto una corriente hacia afuera de la semiesfera. Cuando la densidad se iguala
en ambos lados, la corriente se hace cero ya que sale mismo número de moléculas que
entra.
Resulta claro que cuento más grande sea la diferencia de concentración a ambos
lados, mayor será la corriente. Por consiguiente, esta diferencia por unidad de lon-
gitud será proporcional al flujo. Y matemáticamente, cuando nuestra semiesfera se
hace peque na, esto se expresa como la derivada espacial de la densidad. Podemos
ası́ escribir para el flujo de corriente

dn
JD = −D , (18.15)
dx
donde el signo menos se debe a que la corriente va de la región de mayor concentración
a la de menor. El coeficiente de proporcionalidad D se llama coeficiente de difusión.
Volvamos a los semiconductores. Asumamos que una región de un semiconductor
posee una mayor densidad de portadores que otra. Esto puede pasar si por ejemplo
cierta parte del mismo es calentada o iluminada. Entonces, como ya hemos discutido,
los portadores se moverán por difusión de esta región a la de menor concentración.
Pero este movimiento de portadores da lugar a una corriente eléctrica que vale

dn
jD = qJD = −qD . (18.16)
dx
Difusión 231

Cuando se calcula la corriente de difusión jD , se debe tener en cuenta la carga de los


portadores que se están estudiando. En el caso de electrones q = −e y el sentido de
la corriente de difusión es hacia la región de mayor densidad. En el caso de huecos
q = e y la corriente será hacia las regiones de menor concentración.
La corriente de difusión es una corriente real, igual que la debida a la presencia de
un campo eléctrico externo que ya estudiábamos anteriormente: es un movimiento neto
ordenado y produce disipación de energı́a debido al efecto Joule, causa la deflexión
de una aguja imantada, etc. Para calcular esta corriente, es necesario conocer los
coeficientes de difusión de electrones Dn y de huecos Dp .

Coeficiente de difusión
Veamos de qué cantidades microscópicas dependerá el coeficiente de difusión emplean-
do análisis dimensional. En primer lugar, es natural suponer que dependa del camino
libre l entre colisión y colisión. Sabemos que si no sufriese colisiones, una molécula con
velocidad inicial vT llegarı́a a la pared de la habitación en un tiempo menor al que
lo hace. ¿De qué otro parámetro podemos pensar que depende? Pues del tiempo que
tarda entre colisión y colisión, o si queremos, de la velocidad térmica, ya que podemos
expresar el tiempo entre colisiones en función de vT y l.
La dimensión del camino entre colisiones viene dada por [l] = L, y la de la
velocidad es [vT ] = L T−1 . Es fácil ver que para obtener la dimensión correcta del
coeficiente de difusión se deben multiplicar las dos cantidades. Si se calcula de forma
rigurosa el coeficiente de difusión empleando mecánica estadı́stica, se obtiene

1
D= l vT . (18.17)
3
Existe una relación bastante simple entre el coeficiente de difusión de cualquier tipo
de partı́cula y su movilidad. Se puede escribir la ecuación (18.17) como

1
D= τ0 v T 2 . (18.18)
3
Sustituyendo el valor de la velocidad térmica dado por la expresión (18.9) y usando
la ecuación (18.11), se obtiene
kB T
D= ζ. (18.19)
q
Se puede generalizar esta relación entre la difusión y la movilidad a partı́culas no
cargadas moviéndose en un campo gravitatorio. Esto es una consecuencia de que
cualquier movimiento ordenado de partı́culas (debido al campo externo o a la difusión)
está afectado por las colisiones aleatorias entre ellas, como predijo Einstein.

Longitud de difusión
Vamos a discutir a continuación cuál será la velocidad de difusión, o lo que es lo
mismo, el tiempo requerido para recorrer una distancia ℓ por difusión. Usaremos
primero el método dimensional como antes. Teniendo en cuenta que la respuesta debe
de depender de la distancia ℓ y del parámetro que representaba el movimiento caótico
232 Semiconductores

D, la combinación de estos parámetros para obtener un valor con dimensión de tiempo


nos da la siguiente relación,

t ∼ ℓ2 /D o ℓ ∼ Dt. (18.20)

La distancia resulta proporcional a la raı́z cuadrada del tiempo. Por tanto, a primera
vista parece que la difusión es un proceso lento. Sin embargo, hagamos una estimación
numérica para el GaAs. El tama no de los dispositivos semiconductores es a menudo
del orden de micras (10−6 m) o incluso menos. El tiempo que tardará un electrón
a temperatura ambiente en cubrir esa distancia es del orden de 4 × 10−11 s (ver
Ejercicios). Es por ello que los procesos de difusión juegan un papel muy importante.
Existe otra manera de reobtener el resultado (18.20) que se conoce como el camino
del borracho. Una persona con alguna copa de más sale de una bar y empieza a andar.
El camino que describe es bastante aleatorio, en zigzag, y la dirección de cada paso
bastante impredecible. El problema que se plantea es el de saber lo lejos que se
encontrará del bar después de haber dado N pasos, siendo de longitud l cada paso.
Este problema de camino aleatorio sirve para el caso d una molécula que colisiona
con otras moléculas, y entre colisión y colisión recorre una distancia l.
Resolvamos este problema en dos dimensiones (su generalización a más dimensio-
nes se sigue fácilmente). Supongamos que elegimos un sistema de referencia cartesiano,
con dos ejes perpendiculares x e y. Cada paso 1, 2, 3, ...i, ..., N lo descompondremos en
sus proyecciones sobre esos ejes denotándolas por ∆xi y ∆yi respectivamente. Estas
proyecciones, debido a la aleatoriedad del camino, pueden tener cualquier valor entre
−l y l, cumpliéndose necesariamente ∆x2i + ∆yi2 = l2 . El valor del cuadrado de la
distancia ℓ2N después de N pasos aleatorios será

ℓ2N = (∆x1 + ∆x2 + ∆x3 + ...∆xi + ...∆xN )2


+(∆y1 + ∆y2 + ∆y3 + ...∆yi + ...∆yN )2 . (18.21)

Desarrollando esta expresión, se obtiene

ℓ2N = ∆x21 + ∆x22 + ... + ∆y12 + ∆y22 + ... +


+2∆x1 ∆x2 + 2∆x1 ∆xN + ... +
+2∆y2 ∆y3 + 2∆y1 ∆yN . (18.22)

Debido a la aleatoriedad, cada paso puede resultar en un ∆xi positivo o negativo,


y lo mismo para ∆yi . De esta manera, cuando se ha dado un número grande de
pasos, la suma de los productos dobles se hace cero. Por otro lado, cada par de la
suma de cuadrados ∆x2i + ∆yi2 es igual a l2 como apuntábamos anteriormente. Por
consiguiente, después de un número N grande de pasos, tenemos

ℓ2N = N l2 o ℓN = l N . (18.23)

El número de “pasos” de la molécula se puede estimar como el tiempo total dividi-


do entre el tiempo medio entre colisiones N ∼ t/τ0 . La longitud del camino entre
colisiones es l = vT τ0 , y si se emplea la expresión (18.18), se reobtiene la relación
(18.20).
Ejercicios 233

18.7. Ejercicios
1. Suponiendo que el valor del módulo del campo eléctrico que mantiene unido a
los electrones en el Si se puede estimar usando la ley de Coulomb, con una carga
positiva q = 4e a una distancia a0 = 0,54 nm, demostrar que este campo es
|E| ≈ 2 × 1010 V/m. Con este valor, calcular la anchura de la banda prohibida
del Si dada por Eg = a0 e|E|.
Solución: Eg ≈ 5 eV.
2. Deducir la expresión (18.5) a partir de las ecuaciones (18.2) y (18.3).
3. Calcular cuánto vale la constante caracterı́stica N que aparece en la expresión
(18.5) para los semiconductores de la tabla 18.1 y obtener el valor de ni para
esos semiconductores a 100◦ C.
Solución: N = 3,5056 × 1017 , 2,7551 × 1019 , 8,4979 × 1018 , 1,8246 × 1019 (cm−3 ),
ni = 2,4799 × 1016 , 3,6997 × 1014 , 2,8578 × 109 , 4,9880 × 103 (cm−3 ).
4. Suponer que la densidad de un cristal es de 1022 átomos por cm3 y que se trata
de una sustancia absolutamente pura, es decir, con un 0.001 % de impurezas.
¿Cuántos átomos intrı́nsecos habrá por cada átomo de impureza? Calcular la
concentración de impurezas por cm3 .
Solución: 105 átomos intrı́nsecos/átomos de impurezas, 1017 impurezas/cm3 .
5. Suponer que a 25◦ C la concentración de portadores intrı́nsecos para un semicon-
ductor de Si es de 1,5×1016 electrones y huecos por m−3 . Se dopa el semiconductor
con impurezas donadoras siendo su densidad Nd = 1023 m−3 . A esta tempera-
tura se puede suponer que todas las impurezas se hallan ionizadas. Calcular la
densidad de huecos en el equilibrio.
Solución: pd = 2,25 × 109 m−3 .
6. Suponer que en un cristal los electrones se mueven como partı́culas clásicas a
velocidades del orden de 105 m/s. Si la constante de red del cristal es a0 =
5 × 10−10 m, estimar el valor de la movilidad del electrón.
Solución: ζ ≈ 10−3 m2 /Vs.
7. A partir del valor experimental dado en la tabla 18.2 para el InSb, calcular
la distancia recorrida por el electrón entre colisión y colisión. Comparar este
resultado con la constante de red del problema anterior.
Solución: l ≈ 5 × 10−6 m, l/a0 ≈ 104 .
8. Estimar los campos eléctricos necesarios para hacer que los portadores negativos
en InSb y en Ge se muevan a la velocidad vT ≈ 105 m/s. Los valores de las
movilidades se pueden ver en la tabla 18.2.
Solución: Para el InSb, |E| ≈ 1,2 × 104 V/m; para el Ge, |E| ≈ 2,5 × 105 V/m.
9. Demostrar las expresiones (18.18) y (18.19).
10. Usar el valor dado en la tabla 18.2 para obtener el coeficiente de difusión electróni-
ca del GaAs. Estimar el tiempo que tarda el electrón en cubrir una distancia de
10−6 m, del orden del tama no del dispositivo.
Solución: 4 × 10−11 s.
Capı́tulo 19

Barreras y Uniones

19.1. La barrera del borde


El conocimiento de las propiedades de volumen en los semiconductores no es suficiente
para comprender el funcionamiento de diodos y transistores. En el funcionamiento de
estos dispositivos, los efectos que se producen en los bordes o superficies juegan un
papel fundamental. Empezaremos estudiando las propiedades que aparecen en las
superficies en contacto con el medio que rodea al semiconductor.
Supongamos que tenemos una pieza de semiconductor o de metal. Existe un
cierto número de electrones libres en su interior (en el caso de un metal, tendrı́amos
alrededor de 1022 electrones por centı́metro cúbico) y por otro lado, prácticamente
no hay electrones libres en el aire. Debido a la diferencia de concentraciones, deberı́a
haber un flujo de electrones del material al aire y, al igual que un frasco de perfume
se evapora al dejarlo abierto, nuestro semiconductor deberı́a también evaporarse por
difusión.
Se puede estimar el tiempo en que tardarı́a un electrón en dejar el cristal como el
tiempo de difusión del electrón t ≈ L2 /D según la expresión (18.20). Para el oro (Au),
con un coeficiente de difusión de 0,80 cm2 /s a una temperatura ambiente de unos 300
K, los electrones de conducción en una pieza de 1 cm de ancho tardarı́an 1,2 s en
desaparecer. Es un hecho que esta evaporación no tiene lugar tan rápidamente. Debe
existir por tanto una fuerza F cercana al borde que se oponga a que los electrones
abandonen el cristal, y que no existe en el interior del mismo ni afuera.

Función trabajo
Supongamos que un electrón en el interior del cristal se aproxima al borde con una
energı́a cinética que llamaremos Ep . Tan pronto como se acerca a la región en donde
la fuerza en el borde F empieza a actuar, el electrón empieza a perder energı́a cinética
al moverse contra esta fuerza y entrar en una región de mayor potencial.
A mayor energı́a cinética, el electrón recorrerá una mayor distancia ∆x. Si tenı́a
suficiente energı́a cinética, será capaz de cruzar toda la región en la que la fuerza actúa
y escapar del cristal. La energı́a cinética mı́nima que debe tener el electrón para que
esto ocurra se llama función trabajo y se designa por ϕ. La función trabajo es igual
a la diferencia entre la energı́a que tiene el electrón en el exterior en reposo, y la que
tiene en reposo en el cristal, como se puede ver en la figura 19.1.

235
236 Barreras y Uniones
exterior cristal
E

ϕ Ep > ϕ
Ep < ϕ

∆x x

Figura 19.1. La barrera en la frontera del cristal. Si un electrón posee suficiente energı́a
Ep > ϕ, entonces es capaz de abandonar el cristal superando la barrera energética represen-
tada por la función trabajo ϕ.

exterior cristal
Q Q

∆x

∆x x

Figura 19.2. Capa dipolar en la frontera vacı́o-material. Si se ignora la distribución de la


carga dentro de la capa dipolar, se puede aproximar la acción de esta capa como la de un
condensador.

Los primeros intentos para explicar el origen de esta barrera de potencial se deben
a Shottky y Langimur. La idea era bastante simple: tan pronto como un electrón
deja el cristal, éste queda cargado positivamente, y por tanto tiende a ejercer una
fuerza de atracción sobre los próximos electrones que intentan escapar. Sin embargo,
el mecanismo que evita que los electrones escapen no es tan simple.
La mayorı́a de los electrones no posee suficiente energı́a cinética para superar
la barrera de potencial en el borde y dejar el cristal. Pero debido al choque de los
electrones con la barrera, en cada momento existe una nube de carga negativa más
allá del contorno del cristal, mientras que dentro existe una carga positiva no com-
pensada. Se forma ası́ una capa doble cargada según muestra la figura 19.2, llamada
capa dipolar, que tiende a evitar que el electrón se escape.
En conjunto, la capa dipolar es neutra, es decir, la carga negativa en ella es igual a
la positiva. Un electrón fuera de ella no se verá ni atraı́do ni repelido. Por el contrario,
un electrón dentro de la capa se verá repelido por la carga negativa y atraı́do por la
positiva. Como aproximación, ignorando la distribución de la carga dentro de la capa,
se puede considerar la acción de la capa dipolar como la de un condensador.

Efecto fotoeléctrico
El estudio de los fenómenos asociados a la superficie de los cristales es muy complejo.
No se conocen todos los mecanismos que intervienen en ellos y en muchos materiales
no es posible calcular la función trabajo. Sin embargo, el que no podamos calcular
La barrera del borde 237

algo no significa que no podamos medirlo. Veamos un método para medir la función
trabajo.
Si se dirige luz de longitud de onda (o color) apropiada hacia la superficie de un
metal o semiconductor, se produce una corriente debida a que los electrones empiezan
a escapar de la superficie. A mayor energı́a Eph de los fotones (que son las partı́culas
o cuantos que componen la luz), mayor velocidad de los electrones que salen de la
superficie. Este efecto fue descubierto en 1887 por Hertz y explicado en 1905 por
Einstein.
La energı́a del fotón es absorbida por los electrones. Esa energı́a la emplean los
electrones en superar la barrera dada por la función trabajo y el resto se transforma
en energı́a cinética, de modo que

mv 2
Eph = ϕ + . (19.1)
2
Si la longitud de onda aumenta, la energı́a Eph disminuye, y finalmente, para una
cierta energı́a crı́tica, los electrones no son capaces de dejar el cristal (v = 0). El
efecto fotoeléctrico extrı́nseco desaparece. Esa energı́a crı́tica es evidentemente igual
a la función trabajo ϕ.

Parámetros principales
Hemos visto que aparece una barrera de potencial debida a los efectos de separación
de carga que tienen lugar en la frontera del material. Los parámetros que caracterizan
a esta barrera son su altura, caracterizada por la función trabajo ϕ, su anchura, que
llamaremos X, y el campo eléctrico E dentro de la barrera, responsable de la fuerza
que actúa sobre los electrones. Estos parámetros son los mismos que se usan para
describir cualquier barrera energética.
De la función trabajo ya hemos hablado anteriormente. Para semiconductores
y sólidos en general, la altura ϕ oscila en un rango de fracciones decimales de eV a
varios eV.
Para determinar la anchura de la barrera y los valores caracterı́sticos del campo
dentro de ella notemos primero que estos parámetros están relacionados. Si la anchura
de la barrera es X, sabemos que la caı́da de potencial será V ≈ |E|X, y que ϕ = e V .
Ası́, para un valor de ϕ dado, el campo será proporcional a 1/X.
Veamos cómo penetra el campo eléctrico en el interior de un semiconductor. Si
ponemos un semiconductor entre las placas de un condensador, al igual que en un
dieléctrico aparecerá en la superficie una carga debida a la polarización. Por lo tanto,
la intensidad del campo en la frontera con el vacı́o o aire será εr veces más peque na
que en el vacı́o, siendo εr la permitividad relativa del semiconductor. Por otro lado, en
un semiconductor, al igual que en un conductor, existe carga libre capaz de distribuirse
libremente y apantallar el campo eléctrico que ha penetrado en el semiconductor.
En un semiconductor tipo n, hemos visto que cuando la temperatura es sufi-
cientemente grande, hay una concentración de electrones en equilibrio n0 igual a la
concentración de las impurezas donantes Nd que quedan cargadas positivamente al
perderlos. Mientras no existe campo externo, en cualquier elemento de volumen el
número de iones positivos (donantes) es igual al número de electrones. Por tanto el
semiconductor es eléctricamente neutro. Ahora bien, si lo introducimos en un campo
238 Barreras y Uniones

exterior cristal

E
Em

x
0 X
Figura 19.3. Formación de la barrera de potencial. Se puede observar la región de agota-
miento y la región de electroneutralidad.

externo, estos electrones, al igual que ocurre en el caso de un metal, se moverán hacia
la parte positiva del campo, dejando detrás una capa de donantes positivamente carga-
dos. La diferencia con un metal es que la concentración de portadores libres es mucho
menor, ası́ que los electrones deben moverse una distancia mayor para apantallar el
campo.
En la figura 19.3 podemos ver una región de un semiconductor tipo n en la que
los electrones han migrado y que ha quedado cargada positivamente. Esa región de
anchura X sin portadores libres se llama región de agotamiento. Tomemos dentro de
la región de agotamiento una sección de anchura ∆x y supongamos una densidad
volumétrica de carga uniforme igual a ρ. Aplicando el teorema de Gauss, esta sección
produce un campo eléctrico E′ igual a
ρ∆x
|E′ | = , (19.2)
2εr ε0
A la derecha de esta sección, el campo que crea apunta en sentido creciente de las
x. A la izquierda hacia las x negativas, y por consiguiente el cambio en el valor del
campo elétrico al atravesar esta región es
ρ∆x
|∆E| = 2|E′ | = . (19.3)
εr ε0
En el lı́mite ∆x → 0, en una dimensión, podemos escribir la expresión (19.3) como
dE ρ
= . (19.4)
dx ε r ε0
Esta expresión se llama ecuación de Poisson.
Para el semiconductor tipo n, la densidad de carga será ρ = eNd . Si además
suponemos que el dopaje de nuestro semiconductor es homogéneo, es decir, el valor
de Nd es el mismo en todas partes, entonces podemos ver que la pendiente de la
Uniones p-n 239

As B

As B B

As B
Si
As

Figura 19.4. Unión p-n sobre un sustrato de Si. A la derecha del cristal, se introducen
impurezas aceptoras (B). A la izquierda, impurezas donadoras (As).

figura 19.3 es constante. Si el campo tiene un valor máximo Em en la superficie y


decrece linealmente en el interior del semiconductor, como vemos en la figura 19.3,
podemos escribir la pendiente como

dE Em
= . (19.5)
dx X
Intregrando esta ecuación, se puede calcular la caı́da de potencial en esta región y
resulta V = 12 Em X, que es el área encerrada por la recta de la figura 19.3. Empleando
la expresión (19.4) se obtiene
 1/2  1/2
2εr ε0 V 2εr ε0 ϕ
X= = , (19.6)
eNd e 2 Nd

ası́ como el valor máximo del campo eléctrico,


 1/2  1/2
2eNd V 2Nd ϕ
Em = = . (19.7)
εr ε0 εr ε0

En resumen, la anchura de la barrera de potencial en un semiconductor está deter-


minada por el nivel de dopaje. Dada la altura de la barrera ϕ = e V , su anchura es
inversamente proporcional a la raı́z cuadrada de la concentración de impurezas. Para
semiconductores débilmente dopados esta anchura puede tener el tama no de miles de
capas atómicas (decenas de micras), mientras que para semiconductores fuertemente
dopados puede ser de sólo unas pocas capas atómicas (milésimas de micras).

19.2. Uniones p-n


Si un cristal semiconductor se dopa de manera que una parte sea tipo p y la otra tipo
n, se forma una unión p-n como puede verse en la figura 19.4. La frontera entre esas
dos regiones posee propiedades especı́ficas que estudiaremos.
Para obtener una unión p-n no se puede coger un semiconductor tipo p, otro
semiconductor tipo n, y pegarlos. Una condición esencial es que la red cristalina del
semiconductor se distorsione lo menos posible, ya que si no se alterarı́an las propieda-
des de conducción en la unión. Durante mucho tiempo los especialistas han intentado
obtener uniones lo más perfectas posibles. La idea para crear el tipo de unión que
240 Barreras y Uniones

queremos es la siguiente: se toma un cristal tipo n o p y se introducen impurezas


del tipo contrario. En la parte del cristal en donde se han introducido las nuevas
impurezas el tipo de conductividad (por electrones o huecos) cambia. Esto se llama
sobrecompensación de la impureza inicial. La unión p-n aparece en la frontera entre la
región en donde el tipo de conductividad ha cambiado y la región en la que permanece
igual.
Una manera de introducir impurezas es creando aleaciones. Un disco de In se
pone sobre la superficie de un cristal de Ge, que es de tipo n. El conjunto se calien-
ta lentamente hasta alcanzar la temperatura a la que el In se funde (unos 156◦ C).
Cuando la temperatura de la gota de In lı́quido sigue aumentando, la forma de la
gota cambia y se extiende sobre la superficie a una temperatura de unos 500◦ C. El Ge
cristalino se disuelve en In lı́quido a una temperatura menor de 500◦ C. La disolución
continúa hasta que se satura y ya no se disuelve más Ge en In. Entonces, al bajar
la temperatura, parte del Ge precipita de la disolución recristalizando sobre el sus-
trato de Ge que no ha sido disuelto, enriquecido con átomos de In que actúan como
impurezas aceptoras.
Otro método hace uso del proceso de difusión. Un cristal semiconductor se pone
en contacto con un gas con alta concentración de átomos que actuarán como donantes
o aceptores en el cristal. Como ya sabemos, en la superficie del cristal la red tiene la
mitad de los enlaces rotos, con lo cual las impurezas gaseosas son fácilmente captura-
das por la superficie. Los átomos capturados empiezan un proceso de difusión hacia
el interior del semiconductor. En un cristal ideal, a cero absoluto de temperatura, no
serı́a posible este movimiento atómico de difusión. Sin embargo, no existen cristales
perfectos, ya que siempre existen defectos en el cristal y las oscilaciones térmicas de
la red hacen que los iones salten y ocupen lugares vacı́os de la misma. La distancia a
la que llega la impureza hacia el interior depende del coeficiente de difusión, que a su
vez se puede controlar variando la temperatura. De esta manera se forma una unión
p-n entre la región a la que no ha llegado la impureza y la región a la cual sı́ lo ha
hecho.

La barrera de la unión

Como consecuencia de la diferencia entre el tipo de impurezas en las dos regiones de la


unión p-n, aparece una barrera de energı́a. En condiciones normales, el semiconductor
tipo p contiene huecos cargados positivamente, y el tipo n contiene electrones. Al
unirlos, una corriente de difusión de huecos tendrá lugar desde la región de tipo p
hacia la región de tipo n, y una corriente de difusión electrónica en sentido contrario
(es por esto la importancia de que la red cristalina se deforme lo menos posible al
crear la unión). En una capa del semiconductor p cercana a la frontera aparecerá una
carga neta negativa, mientras que a consecuencia de la migración de electrones, en el
semiconductor tipo n aparecerá una zona con carga neta positiva. Es claro entonces
que cerca de la unión p-n aparecerá una capa doble de carga, negativa en la región p
y positiva en la región n. Esto frena que más huecos emigren a la región n y electrones
a la región p, llegándose a un equilibrio y creándose una barrera de potencial para los
portadores libres.
En la figura 19.5 se muestra el diagrama de bandas de una unión p-n. Podemos
ver que para que los electrones de la banda de conducción en la región tipo n puedan
Uniones p-n 241
p n
EC
ϕpn
EC
EV
ϕpn
EV
X

Figura 19.5. Formación de la barrera de potencial en una unión p-n. La presencia de una
capa dipolar es equivalente a la existencia de una barrera energética como las que aparecen
en el contorno del cristal. Los electrones de la capa de conducción en la región n (cı́rculos
negros) tienen que superar esa barrera para pasar a la otra parte, mientras que los huecos
en la capa de valencia (cı́rculos blancos) tienen que bajarla.

pasar a la región tipo p, deben de superar una barrera de altura ϕpn . Los huecos de la
región p, situados en la capa de valencia, deben superar la misma barrera para pasar
de la región p a la n. En este caso, gráficamente serı́a bajar la barrera, ya que los
huecos tienen carga positiva. El valor de la altura de la barrera viene dado por

ϕpn ≈ ϕp − ϕn ≈ Eg . (19.8)

Puede entenderse esta aproximación de la siguiente manera. Un electrón en un semi-


conductor tipo p debe de superar una barrera de altura ϕp para escapar del cristal.
En un semiconductor tipo n deberı́a de saltar una altura ϕn menor. Por tanto, para
pasar de una región tipo n a una tipo p, la barrera de potencial ϕpn que debe superar
será cercana a la diferencia de energı́as para escapar del cristal en cada región.

La anchura de la barrera

Para uniones p-n en Ge, la altura tı́pica de la barrera es del orden de 0,7 eV, en Si de
1,2 eV, y en GaAs de 1,4 eV. Normalmente los electrones en la banda de conducción
tienen una energı́a del orden de kB T y a temperatura ambienten esto equivale a 0,026
eV. Está claro que la barrera que ven estos electrones es muy grande. Por consiguiente
la región de la barrera es una región prácticamente vacı́a de portadores (electrones y
huecos) y es por ello que tiene sentido el nombre de región de agotamiento.
La región de agotamiento se extiende de manera desigual por la parte tipo n
y por la parte tipo p. Para la parte p de la región de agotamiento la densidad de
carga es ρ = −eNa , mientras que para la parte n es ρ = eNd . Empleando los mismos
argumentos que llevan a la expresión (19.6), la anchura total de la barrera se puede
aproximar por
 1/2  1/2
2εr ε0 ϕpn 2εr ε0 ϕpn
X = Xp + Xn = + . (19.9)
e 2 Na e 2 Nd
242 Barreras y Uniones

19.3. Diodos
Un diodo no es más que un dispositivo semiconductor con una unión p-n asimétrica,
en donde la concentración de impurezas Na en la región p es normalmente mucho
mayor que la concentración de impurezas Nd en la región n. Consta pues de tres
regiones: la región p, la región n y la región de la barrera entre ellas.
Si intentamos medir alguna corriente eléctrica conectando las regiones p y n a los
terminales de un amperı́metro el resultado será nulo. En equilibrio, no puede existir
ningún transporte neto de carga a través del diodo, ya que no se puede obtener energı́a
gratuitamente (en los cables que se conectan al amperı́metro, si hubiera corriente,
estarı́amos disipando energı́a en forma de calor). Debido a la barrera aparece un
campo eléctrico que cancela la corriente de difusión de portadores.
En el caso de la unión existe además otro equilibrio. Se trata de la corriente de
saturación js debida a los pocos portadores minoritarios. Los electrones en la banda
de conducción en la región p y los huecos en la banda de valencia en la región n, tan
pronto como alcanzan la región de la barrera se ven favorecidos por el campo eléctrico
a cruzarla. Esta corriente se ve compensada con la debida a los portadores calientes
que poseen suficiente energı́a térmica para cruzar la barrera en la otra dirección.

19.4. Polarización inversa de un diodo


Veamos qué ocurre cuando se conecta el diodo a una fuente capaz de mantener una
diferencia de potencial U0 . En relación con esta fuente, las tres regiones del diodo
están conectadas en serie y se quiere conocer cómo se distribuye el voltaje aplicado
entre esas regiones.
Si conectamos la región p del diodo al polo negativo de la fuente, y la región
n al polo positivo como podemos ver en la figura 19.6, tenemos lo que se llama el
diodo conectado en polarización inversa. La región de la barrera está prácticamente
vacı́a de portadores, con lo cual será la región de máxima resistencia y por lo tanto
el potencial aplicado U0 cae principalmente en esta región. Debido a que la dirección
del campo externo E0 aplicado coincide con la del campo dentro de la unión E, el
voltaje de la fuente se a nade al voltaje de la unión Upn = ϕpn /e. Como resultado, la
altura energética de la barrera se hace igual a ϕpn + eU0 .
Podemos además calcular la anchura de la barrera y el campo máximo en ella. Si
suponemos que la barrera es muy asimétrica, podemos escribir usando las expresiones
(19.6) y (19.7),
 1/2
2εr ε0 (Upn + U0 )
X ≈ Xn ≈ , (19.10)
eNd
 1/2
2eNd (Upn + U0 )
Em = . (19.11)
εr ε0

Curva caracterı́stica
En la figura 19.7 podemos ver la curva caracterı́stica de un diodo polarizado inversa-
mente. En ella se representa la intensidad frente al voltaje de polarización. La primera
cosa que llama la atención es la corriente de saturación. Si tuviéramos una resistencia,
Polarización inversa de un diodo 243

EC p n

p n
eU0
ϕpn U0
I
EV
eU0 EC

ϕpn EV

X
Figura 19.6. Diagrama de bandas para un diodo polarizado inversamente. Las lı́neas discon-
tinuas representan el caso sin voltaje aplicado, las continuas el caso de polarización inversa
mediante un voltaje U0 . La altura de la barrera aumenta la cantidad eU0 .

µA I

2 Is

1
Ui U0
0
5 10 15 V
Figura 19.7. Curva caracterı́stica de corriente-voltaje de un diodo inversamente polarizado.

la curva caracterı́stica intensidad-voltaje serı́a una lı́nea recta. Sin embargo, en pola-
rización inversa, con un voltaje tan peque no como unos pocos decimales de voltio, la
corriente deja de ser dependiente del voltaje aplicado e igual a la corriente de satura-
ción. En ausencia de potencial externo, la corriente de saturación se compensa por la
corriente de portadores calientes, que al tener suficiente energı́a térmica son capaces
de saltar la barrera de potencial hacia el otro lado. Al a nadir una altura extra a la
barrera, estos portadores son incapaces de saltarla, con lo cual resulta una corriente
en un sentido no compensada por otra en sentido contrario. Esta corriente depende de
los portadores minoritarios y recordando la expresión (18.8) resulta Is proporcional
a n2i .
Existe un valor máximo del campo eléctrico que puede soportar una unión que
denotaremos por |Ei |. Si se sobrepasa, los electrones y huecos son capaces de adquirir
tanta energı́a que al colisionar con los átomos de la red generan nuevos electrones y
huecos produciéndose una avalancha de portadores. Este proceso recibe el nombre de
ionización por impacto. Para diodos de Si o GaAs, el valor máximo del campo que
pueden soportar es del orden de 3 × 105 V/cm. Aunque este valor es constante para
244 Barreras y Uniones

un tipo dado de semiconductor, el valor de lo que se denomina voltaje de ruptura Ui


depende del nivel de dopaje. Si hacemos Em = |Ei | en la ecuación (19.11), se obtiene

εr ε0 |Ei |2
Ui ≈ . (19.12)
2eNd
Existe otro proceso que da lugar a la llamada ruptura Zener. Si el campo eléctrico
en la barrera llega a ser suficientemente grande, puede liberar electrones de valencia,
produciéndose entonces un flujo masivo de portadores minoritarios. Estos procesos
explican el aumento de la corriente al final de la curva de la figura 19.7.
Los diodos Zener están dise nados para funcionar a voltajes mayores Ui . Es-
tos diodos son muy útiles como reguladores de potencia, ya que el voltaje se hace
independiente de la corriente que circula por ellos.

Reactancia capacitiva
Cuando al voltaje de polarización inversa U0 le a nadimos un voltaje alterno V (t) =
V1 cos(ωt), tal que V1 ≪ U0 , la unión p-n se comporta como un condensador. La
reactancia capacitiva de la unión p-n se define como la de cualquier condensador, es
decir Zc = 1/iωC, siendo C la capacidad de la unión. Podemos emplear la fórmula
para la capacidad de un condensador plano y estimar el valor de C como
εr ε 0 A
C= , (19.13)
X
donde A es el área de la unión y X la anchura de la barrera.
Si consideramos una unión que ha sido polarizada inversamente, la altura de
la barrera aumenta durante medio semiperiodo del voltaje alterno, la anchura de la
misma se hace mayor, y por tanto portadores libres que antes ocupaban esa región son
expulsados de ella. Por el contrario, en el siguiente semiperiodo la altura de la barrera
disminuye, la anchura se hace menor, y los portadores libres del resto del circuito
ocupan parte de la región que se encontraba vacı́a de ellos cuando el potencial era
U0 . Ası́ la unión p-n es capaz de almacenar carga y de devolverla, permitiendo la
circulación de corriente alterna por el circuito al que se conecte.
Es importante notar que la capacidad de la unión depende de la anchura de la
barrera, y por tanto del voltaje aplicado. Los condensadores cuya capacidad depende
del voltaje aplicado reciben el nombre de condensadores no lineales. Ası́ la unión
p-n se comporta como un condensador no lineal. Esta propiedad es útil en algunas
aplicaciones pero limita la operación de los diodos a altas frecuencias. Un ejemplo
son los circuitos de microondas en donde este comportamiento no es deseable. Una
manera de hacer la capacidad de la barrera lo menor posible es reducir su área, y es
éste uno de los motivos de reducir el tama no de los diodos.

19.5. Polarización directa


En la figura 19.8 se muestra un diodo polarizado directamente. El terminal positivo
de la fuente se conecta a la región p del diodo, mientras que el terminal negativo
a la región n. En este caso, el campo E0 debido al voltaje externo U0 tiene sentido
contrario al del campo en la barrera.
Polarización directa 245

p n

p n
eU0 ϕpn
EC
I
U0
ϕpn eU0 EC
EV
EV

X
Figura 19.8. Diagrama de bandas para un diodo polarizado directamente. Las lı́neas discon-
tinuas representan el caso sin voltaje aplicado, las continuas el caso de polarización directa
mediante un voltaje U0 . La altura de la barrera disminuye la cantidad eU0 .

La altura energética de la barrera disminuye en este caso a ϕpn − eU0 como pode-
mos ver en la figura 19.8. Al introducir los diodos se ha visto que existe un equilibrio
de corriente hacia un lado y otro de la barrera que hace que el transporte neto de
carga sea nulo. Al disminuir la altura de la barrera rompemos este equilibrio. Ahora
existen más electrones en la región n capaces ser inyectados en la región p debido a
que tienen suficiente energı́a térmica para ello. La concentración de tales electrones
viene dada por n1 ≈ N0 exp[−(ϕpn − eU0 )/kB T ]. En el equilibrio, el número de elec-
trones que eran capaces de saltar la barrera venı́a dado por ns ≈ N0 exp(−ϕpn /kB T ).
Ahora existe ahora un flujo de electrones no compensado proporcional a la diferencia
n1 − ns . El mismo razonamiento vale para los huecos.
Sigamos con un poco más de detalle el destino de los portadores minoritarios
responsables de la corriente al polarizar directamente un diodo. A consecuencia de
que la barrera se hace menor, electrones de la región n se inyectan en la región p, y
huecos de la región p pasan a la región n. En los diodos, las regiones n y p suelen ser
asimétricas (ver Ejercicios). Por consiguiente la cantidad de portadores que pueden ser
inyectados por la región altamente dopada es mucho mayor que la cantidad inyectada
desde la región débilmente dopada. Esto es por lo que una región altamente dopada
de un diodo recibe el nombre de emisor y una región débilmente dopada el de base.
En polarización inversa es la región menos dopada la que determina la anchura de
la barrera según la expresión (19.10). Supongamos que se trata de la región n. Si ahora
aplicamos polarización directa, habrá una inyección masiva de huecos desde el emisor
a la región n o base. Esos huecos se aniquilan cuando se difunden por la región de la
base con los electrones que provienen de la fuente externa U0 . En cada instante de
tiempo, la fuente externa introduce a través de la base el mismo número de electrones
que huecos llegan a ella. Al mismo tiempo, para mantener el estado estacionario del
emisor, el mismo número de electrones sale del emisor hacia el polo positivo de la
fuente externa a través del otro contacto metálico, dejando en el emisor el mismo
número de huecos que habı́a inicialmente. Ésta es la manera en que la corriente fluye
246 Barreras y Uniones

A I

0.5
0.25
U0
0
0.1 0.2 V

Figura 19.9. Curva caracterı́stica de corriente-voltaje de un diodo directamente polarizado.

a través de un diodo polarizado directamente.

Curva caracterı́stica
Con todo lo discutido vemos que, para un diodo polarizado directamente existe una
densidad de corriente electrónica proporcional a la diferencia n1 − ns dada por

jn ≈ n1 − ns = N0 exp[−(ϕpn − eU0 )/kB T ] − N0 exp(−ϕpn /kB T ), (19.14)

siendo N0 una constante que depende de la concentración de impurezas. Los huecos


dan lugar a una contribución de la misma forma, con lo que la densidad de corriente
total que circula por el circuito será la suma de ambas

j = jp + jn = js [exp(eU0 /kB T ) − 1], (19.15)

donde js es una constante que depende de Np , Ne y ϕpn . En la figura 19.9 podemos


ver la curva caracterı́stica de un diodo polarizado directamente. En ella se representa
la intensidad frente al voltaje de polarización y se puede observar efectivamente un
crecimiento exponencial de la corriente con el voltaje aplicado.
La expresión (19.15) vale también para el caso de polarización inversa conside-
rando que en este caso el voltaje aplicado es negativo. En polarización directa, el
voltaje U0 se debe tomar con signo positivo, pero cuando la polarización es inversa,
el voltaje cambia de signo y la corriente se satura a j = −js para valores de U0 igual
a varias veces kB T /e.

El valor mı́nimo de la barrera


Al polarizar un diodo directamente la barrera de potencial disminuya. Para el Si
por ejemplo, con U0 ≈ 1,1V , la altura de la barrera se hace cero. ¿Qué pasará si se
aumenta este valor de U0 ? ¿Se producirá una barrera de altura negativa? Veamos que
la respuesta es no.
Al empezar a hablar de la polarización de los diodos distinguı́amos tres regiones
conectadas en serie: la región tipo n, la unión y la región tipo p. Cada región presenta
una resistencia diferente. Se ha supuesto en toda la discusión anterior que la diferencia
de voltaje externo U0 cae en la región de la unión, que se encuentra vacı́a de portadores
libres. Es decir, la resistencia de esa región es mucho mayor que la resistencia de
la región n, de la región p y la de los contactos metálicos del diodo. Al polarizar
Aplicaciones de los diodos 247

directamente el diodo, con el aumento del valor de U0 la resistencia de la unión llega


a ser tan peque na que una parte importante del voltaje decae en las otras regiones
(recordemos que no sólo la altura, sino también el tama no de la barrera disminuye).
El voltaje aplicado se reparte entre todas las regiones, siendo imposible que en la
barrera se aplique un voltaje mayor que la altura inicial Upn ≈ Eg /e. Lo máximo
que se puede hacer al aumentar el valor del potencial es disminuir la altura en la
región de la unión hasta que la caı́da de potencial sea muy peque na. En ese caso, la
concentración de portadores donde “solı́a haber una barrera” se hace muy grande, al
igual que la densidad de corriente que pasa a través del diodo.

19.6. Aplicaciones de los diodos


Las propiedades de las uniones p-n son la base del funcionamiento de multitud de
dispositivos. Dependiendo de su dise no, del material del cual están hechos, del nivel
de dopaje de cada región, y del voltaje externo aplicado, los diodos tienen diversas
funciones. Se usan para rectificar corriente alterna, para transformar luz solar en
corriente eléctrica, para generar y modificar y analizar se nales eléctricas y luminosas,
etc. En este apartados discutiremos algunos ejemplos.

Fotodiodos
Los fotodiodos son dispositivos capaces de analizar la luz. Se usan en sistemas de
seguridad basados que disparan una alarma cuando un haz de luz se interrumpe, o que
detectan la presencia de fuego, o descubren la fuga de un gas tóxico, etc. También para
controlar procesos quı́micos, mantener un nivel dado de lı́quido, detectar partı́culas
nucleares o medir la temperatura. Funcionan de forma más precisa que el ojo humano
y se basan en alguna propiedad eléctrica, tal como la resistencia, corriente o voltaje,
que cambia bajo iluminación.
Un fotodiodo es una unión p-n inversamente polarizada. Si la energı́a del fotón
incidente Ef es mayor que Eg (la energı́a de la banda prohibida), entonces cada fotón
absorbido es capaz de generar un par electrón-hueco como vimos cuando tratábamos
el efecto fotoeléctrico. Si este par aparece en la región de la barrera, entonces se
verá atraı́do por el campo existente en ella. En la oscuridad, por efectos térmicos
pueden generarse electrones y huecos. Cuando se ilumina la unión con fotones de
energı́a Ef > Eg , la corriente que aparece es mucho mayor que antes, ya que el
número de portadores creados es ahora mucho mayor. Esta fotocorriente, amplificada
y transformada por el resto de la electrónica, actúa como alarma, se nal, etc, en las
aplicaciones.
En la figura 19.10 podemos ver el dise no fotodiodo. El contacto superior tiene la
forma de anillo. La región de la unión dentro del anillo recibe el nombre de ventana.
Normalmente el plano de la unión p-n está localizado a una distancia de alguna micras
de la superficie. El valor del voltaje U0 suele estar en el rango de 10 V a 30 V y el
valor de la región de vacı́o (o barrera) X es de unas pocas micras. Los semiconductores
con una banda de energı́a prohibida peque na Eg se usan para detectar luz con una
longitud de onda grande, mientras que para crear detectores de ultravioleta Eg debe
de ser mayor.
Una de las ventajas de los fotodiodos es su rápida respuesta. Si la luz que incide
248 Barreras y Uniones
luz
ventana

11
00 1
0
p
n contactos
111111111
000000000

Figura 19.10. Diodo con unión p-n polarizada inversamente.

en el diodo se apaga de repente, la fotocorriente cesa tan pronto como los electrones
y huecos creados son transportados por la acción del campo fuera de la región de la
barrera. Los valores tı́picos del campo eléctrico en la unión polarizada inversamente
son grandes, del orden 104 − 105 V/m. Cuando hemos hablado de los portadores
calientes, veı́amos que en tales campos eléctricos la velocidad de arrastre se hacı́a del
orden de la velocidad térmica, es decir de unos 107 cm/s (ver capı́tulo 18) y se hacı́a
independiente del campo aplicado. Por consiguiente, el tiempo que tarda en responder
el fotodiodo al cambio de iluminación se puede estimar como X/vs que está en el
rango de 10−10 − 10−11 s (el fotodiodo es capaz de reaccionar en 10−4 millonésimas de
segundo). Esto hace posible usarlos en sistemas de comunicación por fibra óptica, ya
que sirven como receptores de las se nales moduladas que viajan por ellas y permiten
transmitir directamente transmitir los datos recibidos a un procesador haciendo por
ejemplo que un robot “vea”.

Célula solar
En cierta manera, una célula solar no es más que un fotodiodo sin potencial externo
aplicado. Incluso sin polarización, debido al potencial de barrera existe un campo, con
lo cual cualquier par creado en la célula por la acción de la luz incidente generará una
corriente dirigida por el campo. Si unimos mediante una resistencia la región p con
la n, circulará una corriente y habremos transformado la energı́a luminosa en energı́a
eléctrica.
El problema de estos dispositivos es el de la eficiencia. Si cada fotón que incide en
la célula solar fuera capaz de crear un par electrón-hueco, entonces la eficiencia serı́a
del 100 %. Sin embargo, la eficiencia de las células está bastante lejos de este lı́mite.
La principal dificultad para aumentar la eficiencia de la célula reside en el hecho de
que la luz solar consiste en una mezcla de fotones de varias energı́as, algunos en el
ultravioleta Ef ≥ 3 eV , y otros en la región visible e infrarroja Ef ≤ 1,5 eV. La célula
solar no es capaz por separado fotones con distintas energı́as de manera eficiente.

Condensadores variables
Cuando cambiamos el potencial externo, la capacidad de la unión p-n polarizada in-
versamente varı́a: a mayor potencial menor capacidad. Cambiar la capacidad de un
Aplicaciones de los diodos 249

condensador resulta extremadamente útil (para sintonizar un receptor de radio por


ejemplo). Además el hecho de que la capacidad pueda cambiarse muy rápidamente
por medio de un potencial externo hace posible la construcción de transformadores su-
persensibles de corriente continua en alterna, la generación de se nales con frecuencias
de cientos de millones de Hertz y la amplificación de se nales muy débiles .
Uno de los parámetros más importantes de un condensador variable es su coefi-
ciente de cambio, definido como la razón Kc = Cmax /Cmin entre la capacidad máxima
y mı́nima que puede alcanzar. La máxima capacidad se consigue cuando el potencial
externo U0 se hace cero. Entonces, la caı́da de potencial en la unión es mı́nima e igual
a Upn . De acuerdo con las expresiones (19.13) y (19.10) resulta
 1/2
qεr ε0 Nd
Cmax = A . (19.16)
2Upn
Por el contrario, la capacidad mı́nima se consigue cuando el potencial externo es
máximo, y según veı́amos está limitado por el voltaje de rotura Ui del dispositivo,
con lo que
 1/2
qεr ε0 Nd qNd
Cmin = A =A . (19.17)
2Ui Ei
Por tanto el coeficiente de cambio vale
 1/2
εr ε0 Ei2
Kc = . (19.18)
2qUpn Nd
Vemos que mientras menor es el valor de la concentración de impurezas en la región
menos dopada, mayor es el coeficiente de cambio. En dispositivos reales el valor de
Kc varı́a en el rango de 2 a 15.

Diodos emisores de luz


Los anteriores ejemplos eran aplicaciones de diodos en polarización inversa. Un ejem-
plo muy importante de polarización directa es el de los diodos emisores de luz (LED
son sus iniciales en inglés). Se puede decir que, en principio, cualquier diodo pola-
rizado directamente es un emisor de luz. Cuando los portadores pasan de la región
emisora a la base, se recombinan y en ese proceso se emite un fotón. Una parte de
estos fotones se absorbe dentro del diodo, pero el resto consigue escapar. Ésta es la
luz que emite el diodo.
Para dise nar de forma óptima un diodo emisor de luz, necesitamos que la gran
mayorı́a de portadores se recombinen en la base y que tengan una gran probabilidad
de emitir un fotón en este proceso. Ge y Si por ejemplo no son buenos materiales para
esto, ya que la mayorı́a de electrones y huecos se recombinan sin emitir fotones. GaAs
y otros compuestos ternarios sı́, con probabilidad cercana a la unidad.
La longitud de onda de la luz radiada (el color) viene definida por la energı́a del
fotón emitido. Un fotón posee una energı́a

Ef = hν = hc/λ, (19.19)

donde h = 6,63 × 10−34 J · s es la constante de Planck ν es la frecuencia, c la velocidad


de la luz, y λ la longitud de onda. En la mayorı́a de los casos, la energı́a del fotón es
250 Barreras y Uniones

cercana a la diferencia de energı́as del electrón que pasa de la banda de conducción en


el emisor a la de valencia en la base, y por tanto cercana a Eg . En el caso del GaAs,
en la tabla 18.1 podemos ver que Eg = 1,4 eV, y por consiguiente, la longitud de onda
asociada con esta energı́a es invisible para el ojo humano. Para cambiar el color de
la luz, se introducen en la red de GaAs átomos de fósforo (P) o aluminio (Al), que
llevan a un incremento de Eg , y ası́ se obtienen diodos que emiten luz roja.
Estos dispositivos se usan normalmente como indicadores. El exceso de informa-
ción de nuestros dı́as hace que sean imprescindibles para resolver muchos problemas.
Ası́ nos informan si la televisión está encendida o apagada, si las puertas del coche
están cerradas, si el recibidor de ondas está sintonizado, etc.

Diodos rectificadores

Prácticamente toda la energı́a eléctrica consumida en el mundo se genera en turbinas


de centrales en forma de corriente alterna, a las llamadas frecuencias industriales de
50 o 60 Hz. Pero en muchos casos es imposible usar esa energı́a en forma alterna y
mucho instrumentos necesitan de corriente continua. Es necesario rectificar corrientes
y voltajes.
En el capı́tulo dedicado a circuitos con diodos explicaremos cómo se rectifica la
corriente de manera detallada, pero la idea es fácil de entender: el voltaje aplicado al
diodo es alterno, cambiando su polaridad en el tiempo. Cuando el voltaje es tal que
polariza al diodo directamente, podrá circular corriente por el circuito en un sentido.
Pero al cambiar el voltaje de signo, polariza al diodo inversamente. La resistencia
aumenta mucho y prácticamente no deja circular ninguna corriente por el circuito. La
corriente sólo circula entonces en un sentido: se ha rectificado.
Como anécdota, durante la II Guerra Mundial, los aliados desarrollaron la tec-
nologı́a del RADAR. Funcionaba con un diodo rectificador: el trabajo del rectificador
consistı́a en traducir la se nal alterna en la se nal continua necesaria para su visualiza-
ción en una pantalla. Los cristales semiconductores a menudo ardı́an al no ser capaces
de seguir el cambio de la se nal a altas frecuencias. Seymour Benzer descubrió que el
Germanio (Ge) podı́a soportar mayores frecuencias y voltajes que ningún otro ma-
terial. Fue el Ge y toda la tecnologı́a desarrollada para construir mejores cristales la
que llevó a la invención del transistor.

19.7. Ejercicios
1. Demuestrar las expresiones (19.2) y (19.3). Ayuda: pensar en el campo que pro-
duce un condensador.
2. Obtener las expresiones (19.6) y (19.7). Para ello, tener presente que si llamamos a
la pendiente tan α = dE/dx, entonces X = Em / tan α (considerar la figura 19.3).
3. Para rectificar alto voltaje se emplea una unión p-n en Si, cuya concentración
de impurezas en la parte p es Na = 1018 cm−3 , mientras que en la parte n es
de Nd = 1013 cm−3 . El valor de la permitividad relativa del semiconductor es
εr = 12,5 y el potencial de barrera Vpn = 1,1 V. ¿Cual será la anchura de la
barrera? Comprobar que se trata de una unión bastante asimétrica.
Solución: X ≈ Xn ≈ 12µm.
Ejercicios 251

4. Considerar de nuevo el problema anterior. Suponer que se aplica ahora un vol-


taje de polarización inversa de 1000 V. Calcula el valor máximo del campo que
atraviesa la unión y la anchura de la barrera.
Solución: Em = 54 kV/cm, X = 370 µm.
5. En un semiconductor de permitividad relativa εr = 11 determinar el voltaje de
ruptura en los casos en que Nd = 1017 cm−3 y Nd = 1014 cm−3 . Dato: el campo
máximo que puede soportar un diodo es del orden de 3 × 105 V/cm.
Solución: Ui = 2,7 V y Ui = 2700 V respectivamente.
6. ¿Cuál es la longitud de onda que el ojo no puede ver en el caso del GaAs? El ojo
humano normalmente ve entre 8 × 10−7 m (rojo) y 4 × 10−7 m (violeta). Para el
GaAs, sabemos que Eg = 1,4 eV.
Solución: λ = 8 × 10−7 m (infrarrojo).
Capı́tulo 20

Transistores bipolares

20.1. Un poco de historia


Los laboratorios Bell, uno de los laboratorios industriales más grandes del mundo,
pertenecı́an a la compa nı́a American Telephone and Telegraph (AT&T). En 1907,
AT&T se enfrentaba con la expiración de la patente del teléfono que habı́a inventado
su fundador Alexander Graham Bell. Para luchar contra la competencia que preveı́a,
contrató de nuevo al anterior presidente, Theodore Vail, ya retirado. La solución de
Vail para asegurar el negocio de la compa nı́a fue desarrollar servicios de teléfono
transcontinentales. AT&T compró la patente del invento que en 1906 habı́a desarro-
llado Lee De Forest: el triodo de tubo de vacı́o. Este dispositivo mejorado permitı́a
amplificar la se nal regularmente a lo largo de la lı́nea telefónica, con lo cual la con-
versación podı́a realizarse a cualquier distancia. Pero estos tubos fallaban demasiado
y consumı́an demasiada potencia, perdiéndose mucha en forma de calor.
En 1930, el director de investigación de los Laboratorios Bell, Mervin Kelly, re-
conociendo la necesidad de crear un dispositivo mejor para que el negocio del teléfono
siguiera creciendo, puso a un equipo a trabajar en el desarrollo de semiconductores.
Después de la segunda guerra mundial el fı́sico Bill Shockley fue asignado por Kelly
como director del proyecto. Shockley contrató Walter Brattain y a John Bardeen.
Los tres ganarı́an el premio en 1965 por la invención del transistor bipolar (Bardeen
ganarı́a más tarde otro Nobel por explicar el mecanismo de la superconductividad).
Todos eran cientı́ficos de primera clase trabajando en el mismo laboratorio y su crea-
ción en 1948 fue de las más importantes que ha dado la humanidad desde la invención
de la rueda. En 1952 Shockley inventó el transistor de efecto campo basado en otro
principio muy diferente. Además fundó una compa nia en un lugar que luego serı́a
conocido como Silicon Valley.

20.2. Transistores bipolares


La disposición de un transistor bipolar es bastante simple y puede verse en la figu-
ra 20.1. Entre dos regiones p, se construye una región n más estrecha. Los nombres de
la primera región p y de la región n ya los conocemos del capı́tulo de diodos: emisor
y base. La tercera región p recibe el nombre de colector.

253
254 Transistores bipolares

emisor base colector

p n p
e c

b
Figura 20.1. Diagrama esquemático de un transitor bipolar p-n-p.

De manera similar, uno puede obtener un transistor de tipo n-p-n. Los principios
fı́sicos de un transistor de este tipo son idénticos. Saber cómo funciona un transistor
de un tipo permite fácilmente analizar el funcionamiento del otro.
La estructura de la figura 20.1 puede describirse como una unión p-n a la que se
le ha a nadido una región p extra, o de manera alternativa como dos uniones p-n con
una base común. Veremos cómo esta estructura tan simple es capaz de cumplir con
la misión de amplificar se nales eléctricas.

Principios de operación del transistor bipolar


Para que un transistor amplifique, la unión emisor-base debe de polarizarse directa-
mente, mientras que la unión colector-base debe de estarlo de forma inversa. Debido a
la polarización directa de la unión emisor-base, el dispositivo presenta una resistencia
de entrada muy baja, mientras que la resistencia de salida será muy alta debido a
la polarización inversa de la unión base-colector (la palabra transistor resulta de la
contracción TRANSfer resISTOR, y tiene en cuenta este hecho). Esto se consigue
conectando el emisor a un voltaje mayor que la base y el colector a uno menor que la
base para un transistor tipo p-n-p.
Imaginemos que la región de la base fuera muy ancha. Esto significa que la
longitud de la base, que denotaremos por Wb , ha de ser mayor que la longitud Lh
de difusión de los huecos en esa región. En realidad los transistores se construyen
con Wb /Lh mucho menor que la unidad, pero primero queremos entender este caso
opuesto que se muestra en la figura 20.2.
En el caso de la figura 20.2 tenemos dos diodos, y el hecho de que tengan una
base común no afecta a su funcionamiento. Supongamos que arreglamos los contactos
de manera que el primer diodo emisor-base está polarizado directamente y el segundo
diodo colector-base inversamente. Una peque na corriente Ic fluye a través de la
unión base-colector hacia éste último. Esta corriente es la de saturación. La forman
electrones y huecos generados en la zona de la barrera (corriente de generación) y
portadores minoritarios de la región p (electrones) y n (huecos). Cualquier hueco que
nace en la región n a una distancia menor que la longitud de difusión Lh tiene mucha
probabilidad de alcanzar la región de agotamiento, y si eso sucede el campo eléctrico lo
mandará de la base al colector inmediatamente. Lo mismo ocurre para los electrones
en la región p, con una longitud caracterı́stica de difusión Le .
Ahora prestemos atención a lo que le pasa a la unión emisor-base polarizada
Transistores bipolares 255

Wb

Ie p Ic
p n
e c
Ib
b
Figura 20.2. Estructura p-n-p con una base ancha

directamente. El emisor siempre está dopado mucho más que la base, por lo que se
trata de una unión bastante asimétrica. El mecanismo de la corriente fluyendo del
emisor a la base es el mismo que hemos estudiado en el capı́tulo 19 y se debe a la
disminución de la altura de la barrera. El resultado es una corriente Ie fluyendo del
emisor a la base tal que Ie ≫ Ic . El número neto de portadores que entran en la
base por unidad de tiempo viene dado por (Ie − Ic )/e ≈ Ie /e. Cuando se alcanza el
equilibrio, este número se ve compensado por una corriente Ib que fluye de la base
al circuito. Los electrones que entran en la base procedentes del circuito externo a
través del electrodo de la misma se aniquilan con los huecos que entran de la región
del emisor mayoritariamente. Cada vez que un hueco entra en la base, debido a su
movimiento caótico de difusión, acaba encontrándose con un electrón, aniquilándose
mutuamente. En la estructura con una base ancha, prácticamente todos los huecos
se han recombinado después de haber viajado una distancia de varias longitudes de
difusión Lh sin poder alcanzar la barrera del colector, y por lo tanto Ib ≈ Ie .
Pero si consideramos el mismo proceso en un transistor real con Wb /Lh ≪ 1
(fabricado con la base estrecha), los huecos estarán a una distancia de la barrera
menor que la distancia de difusión, y por tanto parte de ellos pasarán a la región del
colector. Esto significa que Ic va a estar afectada, además de por las contribuciones
detalladas más arriba, por esta corriente de huecos que fluye a través de la base
proveniente del emisor. La corriente de huecos que captura el colector depende de
la corriente de huecos que salen del emisor Ie , que a su vez depende de la corriente
que sale por la base Ib . Ası́ la corriente que fluye por los tres contactos metálicos
(electrodos) de cada región son dependientes unas de otras.

Amplificación de la corriente
Hemos visto que en una estructura con la base poco ancha, no todos los huecos tienen
tiempo para recombinarse con los electrones en la base, ya que son capturados por
el campo de la barrera del colector. Mientras más peque na sea la región de la base,
mayor será el número de huecos que llegan al colector.
Sea α el factor que nos da la fracción de portadores que partiendo del emisor
llegan al colector. Nosotros lo llamaremos factor de transporte de la base. Este factor
no es más que la probabilidad que tiene un hueco de atravesar la región de la base. Es
decir, la probabilidad de supervivencia Psup cuando viaja por la base. La probabilidad
256 Transistores bipolares

se define como un número que pertenece al intervalo [0, 1]. Si vale 1 significa que con
certeza absoluta el hueco pasará la región de la base. Si vale 0, el hueco será ani-
quilado. La probabilidad de sobrevivir se puede expresar también como la certeza de
cruzar menos la probabilidad de desaparecer Pdesap , siendo esta última la fracción de
portadores que se han quedado en el camino. Esto es

α = Psup = 1 − Pdesap . (20.1)

La probabilidad de desaparecer podemos calcularla de la siguiente forma. Mientras


más tiempo pasemos en la región de la base, más posibilidades de que un hueco sea
aniquilado y no llegue nunca a la barrera del colector. Por tanto, será proporcional al
tiempo Tb de viaje a través de la base. Por otro lado, el tiempo medio entre colisiones
dado por τ0 nos da en promedio cuánto tiempo puede viajar sin colisionar con otro
portador. La probabilidad de desaparecer será inversamente proporcional a este tiem-
po. Se escribe entonces Pdesap = Tb /τ0 . El tiempo que tarda un portador en recorrer
la base debido al movimiento de difusión, según la ecuación (18.20), viene dado por
Tb ∼ Wb2 /D. Si hacemos el cociente, resulta Tb /τ0 ∼ Wb2 /Dτ0 . Dado que D = L2h /τ0 ,

Wb2
α=1− . (20.2)
2L2h
Un par de comentarios: en la expresión hemos sustituido ∼ por =, e introducido en el
cociente un factor 1/2. Este factor se debe a la dimensión geométrica del problema.
Por otro lado, hemos dicho más arriba que la probabilidad está definida entre cero
y uno. La razón por la que el cociente de tiempos nos vale como candidato para
la probabilidad de desaparecer es que la base es estrecha, esto es Wb /Lh ≪ 1. La
relación Wb /Lh normalmente está en el rango de 0,5 a 0,05. De esta manera, el valor
de α suele estar en el rango de 0,9 a 0,009. Por tanto, sólo una peque na parte de
los portadores, de 0,001 a 0,1, se recombinan con los que entran de la base con signo
contrario (en nuestro caso electrones). Esta conclusión podemos expresarla diciendo
que la corriente de la base del transistor causa la aparición de corriente en el emisor
y en el colector que es diez, cien, e incluso mil veces mayor.
Ası́, si la corriente que debe ser amplificada se aplica a la base, y la se nal de
salida se registra en el emisor o colector, esta se nal estará amplificada. El factor
de amplificación, también llamado ganancia de corriente, se denota por β y se define
como la razón entre la corriente del colector y la de la base. Podemos escribir entonces

Ic = βIb . (20.3)

Ahora ya estamos en posición de ver las relaciones entre las corrientes que fluyen por
los tres electrodos del transistor. La corriente del colector, como bien sabemos, es una
combinación de dos componentes: la debida a la polarización inversa, que es peque na,
y la debida a los portadores del emisor. En la mayorı́a de los casos, esta última es
muy grande, por lo que podemos suponer que es la única que contribuye a Ic ,

Ic ≈ αIe . (20.4)

Por otro lado, las leyes de Kirchhoff implican

Ie = Ib + Ic , (20.5)
La ecuación de Ebers-Moll 257

Ic Veb

12,5 Ω
1/pendiente = 60mV/decada 25 Ω
50 Ω

Veb 0,5 1 2
I c (mA)
Figura 20.3. La corriente que circula por el colector está controlada por la diferencia de
voltaje entre el emisor y la base. Recuerda a la curva caracterı́stica de un diodo pero con
una pendiente mayor.

ya que los huecos que dejan el emisor, o se recombinan en la base (Ib ), o se marchan
hacia el colector (Ic ). De esta manera se tiene
α
β= . (20.6)
1−α

20.3. La ecuación de Ebers-Moll


Consideremos la relación de la corriente en el transistor con el voltaje aplicado. Según
hemos visto, la corriente que sale por el colector es aproximadamente igual a la que
entra por el emisor Ic ≈ Ie . Además, bajo condiciones normales, la densidad de
corriente que circula por una unión p-n polarizada directamente viene dada por la
expresión (19.15). Por tanto, Ie está relacionada exponencialmente con la diferencia
de potencial Veb entre el emisor y la base. Si usamos entonces la expresión (20.4), se
obtiene la ecuación de Ebers-Moll,

Ic = Is [exp(eVeb /kB T ) − 1]. (20.7)

La corriente de saturación Is depende en general de la temperatura y del tipo de


transistor (densidad de portadores, tama no de las regiones, etc). Al igual que veı́amos
para el caso del diodo, el voltaje máximo aplicado a la unión base-emisor no puede
hacerse arbitrariamente grande, sino aproximadamente hasta el valor de la altura de
la barrera de la unión p-n.
Podemos ver que la diferencia de voltaje entre el emisor y la base determina la
corriente que fluye por el colector (ver la figura 20.3). A una temperatura ambiente de
20◦ C, se cumple que kB T /e = 25 mV. La ecuación de Ebers-Moll puede simplificarse
entonces a
Ic ≈ Is exp(Veb /25 mV). (20.8)
Se puede comprobar que a temperatura ambiente, Ic varı́a en un factor de 10 cada
vez que el voltaje Veb se incrementa en 60 mV, como se puede ver en la figura 20.3.
Al igual que sucedı́a en el caso de los diodos, la relación entre el voltaje aplicado
y la corriente no es lineal. En el análisis de circuitos resulta útil conocer la pendiente
258 Transistores bipolares

Ic
caliente
frio

I1
I2
V1 V2 Veb

Figura 20.4. Dependencia con la temperatura de Ic frente a Veb .

de la curva V-I, esto es la relación ∆V /∆I entre un peque no incremento de la co-


rriente y el incremento del voltaje asociado. Esta cantidad se conoce con el nombre de
resistencia de se nal peque na, o resistencia dinámica del dispositivo. Si un dispositivo
satisface la ley de Ohm, su resistencia dinámica coincide con su resistencia óhmica. En
un transistor, a temperatura ambiente, la resistencia dinámica de entrada al emisor
cuando mantenemos la base a un potencial constante resulta

25 mV
re = , (20.9)
Ic

es decir, si Ic se expresa en mA, re = (25/Ic ) Ω. Esta resistencia actúa como si


estuviera en serie con el emisor en todos los circuitos con transistores. En la figura 20.3
podemos ver el valor de la resistencia dinámica para varios valores de la corriente que
circula por el cátodo.

El efecto de la temperatura
La ecuación de Ebers-Moll (20.7) sugiere a simple vista que la dependencia de Veb con
la temperatura es una función creciente cuando se mantiene constante la corriente Ic ,
ya que el denominador de la exponencial aumenta y por tanto lo mismo tendrá que
hacer el numerador. Este razonamiento es totalmente falso, ya que nos estamos olvi-
dando de la dependencia de Is con la temperatura. En realidad, lo que ocurre es que
Veb decrece con la temperatura 2,1 mV por grado centı́grado cuando Ic se mantiene
constante. En la figura 20.4 podemos ver este efecto cuando mantenemos la corriente
del cátodo igual a I1 . Al calentar el transistor, el voltaje disminuye de V2 a V1 .
Se puede entender este efecto por el hecho de que la corriente del colector, man-
teniendo Veb constante, debe de aumentar al aumentar la temperatura (ya que la
difusión aumenta y el tiempo que pasa en la base un portador se hace menor según
la expresión (20.2)). Cuantitativamente Ic crece aproximadamente un 9 % por grado
centı́grado si se mantiene Veb constante. En la figura 20.4 podemos ver que, a V1
constante, al calentar el transistor, Ic aumenta de I2 a I1 .
Expresar el efecto de la temperatura como una variación de Veb a Ic constante, o
como una variación de Ic a Veb constante, es equivalente (ver Ejercicios). La primera
se usa más en los cálculos. La segunda es más fácil de comprender de manera intuitiva:
no se apaga un circuito encendiendo un fuego debajo, más bien al contrario.
La ecuación de Ebers-Moll 259

Ic Veb2

Veb1

Vce
Figura 20.5. Efecto Early. La curva se separa de la horizontal.

Wb
Vec
p n p c
e c e
X
Veb b Vbc
R ec

Figura 20.6. La región de la base que debe cruzar un portador se reduce al aumentar el
potencial entre la base y el colector. Una resistencia grande en paralelo entre el emisor y el
colector modela el efecto Early.

El efecto Early
Hemos visto que Ic está determinada por la corriente que entra o sale a través de la
base Ib según la expresión (20.3), o por la diferencia de potencial Veb según la ecuación
(20.7). Si se mantiene la diferencia de potencial entre la base y el emisor, la corriente
del cátodo Ic deberı́a permanecer constante. Sin embargo Ic varı́a, aumentando con
la diferencia de potencial Vec entre emisor y el cátodo (figura 20.5).
La explicación a este comportamiento reside en el hecho de que la longitud efecti-
va W de la base disminuye al aumentar la región vacı́a de portadores cuando el voltaje
Vec se incrementa. En la figura 20.6 podemos ver este efecto de manera gráfica. La
longitud efectiva de la base viene dada por W = Wb √ − X, siendo Wb la anchura de
la base y X la de la barrera, que es proporcional a Vbc según hemos demostrado
anteriormente (ver la expresión (19.10)). Según la ecuación (20.4), la corriente que
circula por el colector es proporcional a la corriente que circula por el emisor. El factor
α de proporcionalidad entre ellas depende de W como muestra la expresión (20.2).
Por tanto al variar Vec = Veb + Vbc , la corriente aumenta.
Podemos estimar la pendiente de la curva dibujada en la figura 20.5 como cons-
tante cuando se fija el valor de Veb , es decir,
dIc 1
= . (20.10)
dVec Rec
Para valores tı́picos, Rec está el rango de 104 a 105 Ω. Este efecto se suele modelar
260 Transistores bipolares

I in I in
t t

T T
Iout Iout

t0 t
Figura 20.7. Si la se nal de entrada tiene un periodo T mayor o igual que dos veces el tiempo
de subida 2t0 , entonces la se nal de salida tiene tiempo de alcanzar su estado estacionario.
Si es al contrario, no.

en los circuitos como una resistencia en paralelo entre el emisor y el colector como
muestra la figura 20.6.
De manera equivalente a como hacı́amos cuando considerábamos el efecto de la
temperatura, podemos decir que a corriente Ic constante, el efecto Early se manifiesta
en un incremento de Veb , dado por ∆Veb = −γVec , siendo γ ≈ 10−4 (ver Ejercicios).

20.4. La velocidad de respuesta del transistor


La velocidad de respuesta del transistor puede caracterizarse por su frecuencia lı́mite
fc o por el llamado tiempo de subida t0 . Si aplicamos instantáneamente un aumento
de corriente de entrada ∆Iin a un terminal del transistor y medimos la corriente que
circula por otro terminal, habrá un incremento ∆Iout , pero esto no ocurre instantánea-
mente. Pasa un tiempo t0 desde que se aumenta la se nal hasta que se alcanza el valor
estacionario a la salida. Éste es el tiempo de subida y la frecuencia de respuesta es
fc ≈ 1/t0 .
En la figura 20.7 podemos ver que si mantenemos la se nal de entrada un tiempo
t > t0 , entonces la se nal de salida puede alcanzar su máximo valor. Es claro por
tanto que si la se nal de entrada tiene un periodo T ≥ 2t0 , es decir una frecuencia
f ≤ 1/(2t0 ), entonces el transistor tendrá suficiente tiempo para amplificar la se nal.
Si por el contrario f > 1/(2t0 ), entonces la se nal de salida no tiene tiempo de alcanzar
su valor estacionario.
El tiempo de subida t0 depende de los parámetros fı́sicos del transistor y de la
configuración del circuito, es decir, sobre qué terminal o electrodo estamos aplicando
la se nal de entrada y de cuál estamos tomando la se nal de salida.

Base común
Consideremos el tiempo de subida en el caso en que la se nal se aplica al emisor y
se toma del colector. Este caso lo podemos ver dibujado en la figura 20.8 y se llama
de base común. Se puede pensar que esta configuración es poco útil, ya que sabemos
que la corriente en el colector es α veces más peque na que en el emisor, y aunque
La velocidad de respuesta del transistor 261

Ic
Ie
p n p
e c

t0 t1 t1+ t0 t
b
Figura 20.8. Se nal de entrada aplicada al emisor y tomada del colector. Fuente de corriente.

α tiene un valor cercano a la unidad (0,9 ≤ α ≤ 0,999), es no obstante menor que


1. En esta configuración no hay ganancia de corriente alguna, ya que ∆Ic = α∆Ie .
Sin embargo, que no haya ganancia de corriente no implica que no haya ganancia de
voltaje, y por tanto ganancia de potencia (esta configuración se usa para fuentes de
corriente). Además, la gran ventaja es que ésta es la configuración que permite al
transistor trabajar a la frecuencia más alta. Esto se debe a que el tiempo de subida
t0 es el menor posible.
Si cerramos el interruptor del emisor en t = 0, una corriente Ie empieza a entrar
en la base como consecuencia de la inyección de portadores. El estado estacionario,
cuando la corriente en el colector toma el valor Ic = αIe , se alcanza después de que a
los portadores les haya dado tiempo de llegar al colector, por lo que t0 ≈ tD ≈ Wb2 /Dh .
En esta expresión Wb es la anchura de la base y Dh el coeficiente de difusión de los
huecos. Si en el instante t = t1 se interrumpe la corriente en el emisor, la corriente
en el colector cae a cero cuando los últimos huecos cruzan la base. Controlando la
anchura de la base Wb es posible fabricar semiconductores cuya frecuencia crı́tica es
de hasta 10 GHz.

Emisor común
En la configuración de emisor común, la se nal de entrada, según podemos apreciar
en la figura 20.9, se aplica en la base, mientras que la se nal de salida se toma en el
colector. En este caso el transistor puede amplificar a la vez corriente y voltaje, y es
por ello por lo que esta configuración es de las más usadas. Sin embargo, la velocidad
de respuesta será β veces menor.
Supongamos que en el instante t = 0, el interruptor se cierra y se establece
la corriente Ib en la base del transistor. Esto significa que un número igual a Ib /e
electrones por segundo empiezan a entrar en la base. Como consecuencia de que la
base empieza a cargarse negativamente, huecos del emisor empiezan a entrar en la
base para recombinarse con este exceso de carga negativa. Mientras estos huecos no
han tenido tiempo de alcanzar el colector, el número de huecos que dejan el emisor es
igual al número de electrones, con lo cual inicialmente Ie = Ib . Después de un tiempo
tD ≈ Wb2 /Dh , los primeros huecos inyectados desde el emisor alcanzan el colector.
Esto es análogo a lo que ocurrı́a en el caso de base común, pero ahora, la corriente
del emisor va a crecer β + 1 veces y la del colector β veces. Veamos cómo ocurre esto
y cuánto tiempo se requiere.
262 Transistores bipolares

Ic
βI b
p n p
e c
Ib
b t0 t 1 t1+ t0 t

Figura 20.9. Se nal de entrada aplicada en la base y tomada del colector.

Supongamos que β = 99 y que el número de electrones que entran en la base


a consecuencia de Ib es de 100. Una vez que ha pasado un tiempo tD , de cada 100
huecos que se inyectan del emisor a la base, 99 son capturados por el colector y por
lo tanto sólo uno permanece en la base. Este hueco es insuficiente para neutralizar los
100 electrones que entran en la base, de modo que es necesario inyectar más huecos
desde el emisor. Si el emisor enviara 200 huecos, 198 serı́an capturados por el colector
y 2 permanecerı́an en la base para aniquilar los electrones. La corriente del emisor
seguirá incrementándose hasta que el numero de huecos que se inyecten en la base por
unidad de tiempo sea igual al de electrones en la base más la proporción capturada
βIb por el colector, esto es Ie = Ib + βIb .
Si queremos estimar el tiempo para que se alcance el estado estacionario, podemos
fijarnos en el destino de los electrones en la base. Sabemos que los electrones que
entran en la base no pueden ir hacia el emisor ni hacia el colector. Por lo tanto están
condenados a recombinarse en la base con un hueco. La vida media del exceso de
electrones en la base está entonces relacionada con la vida media de los huecos τp .
Cuando t = 0, los electrones empiezan a entrar en la base, al igual que los huecos del
emisor, pero mientras t ≪ τp , no tienen tiempo de recombinarse y se almacenan en la
base. Cuando t se hace del orden de varios τp , prácticamente todos los electrones que
han entrado en la base han tenido tiempo de recombinarse. Luego en esta configuración
t0 ≈ τp = L2h /Dh , siendo Lh la longitud de difusión de los huecos y Dh su coeficiente
de difusión.
Establecido el estado estacionario, supongamos que en el instante t1 el interruptor
de la base se abre. La corriente de la base se reducirá inmediatamente a cero. La
corriente en el colector en principio no responde de manera apreciable, ya que la
concentración de huecos no cambia. La corriente del emisor disminuye su valor en
una cantidad igual a Ib . A partir de entonces, mediante el proceso de recombinación,
en un tiempo τp los huecos que quedan en la base desaparecen y por tanto la corriente
del colector también, como se puede apreciar en la figura 20.9.

El efecto Miller

Cuando la se nal varı́a en el tiempo, el efecto de la capacidad de las uniones empieza


a jugar un papel importante. A altas frecuencias hay que tener esto en consideración.
En el capı́tulo de diodos, hemos visto el valor de esta capacidad variable y cómo se
puede controlar reduciendo el área de la unión según la expresión (19.13).
En el caso de un amplificador de emisor común, la capacidad efectiva de la unión
Ejercicios 263
Ic Ic
Vc Vcc Vc Vcc
p n p p n p
Ie Rc Ie Rc
Vb Vb
C cb C Mil
Ib Rb Ib Rb

Vbb Vbb

Figura 20.10. El efecto Miller.

base-colector aumenta debida a la propia amplificación del transistor. Este incremento


efectivo de la capacidad colector-base Ccb se conoce con el nombre de efecto Miller.
En la figura 20.10 podemos ver simbolizada la capacidad colector-base mediante un
condensador. Su efecto en los circuitos se modela como un condensador conectado a
tierra desde la base con un valor efectivo igual a CM il .
Podemos ver esto analizando qué le pasa al voltaje en un amplificador de emi-
sor común. Si la corriente del emisor permanece constante, cualquier variación de la
corriente en la base equivale a una variación en sentido opuesto de la corriente del
colector, ya que por la expresión(20.5) resulta ∆Ib = −∆Ic . Según la figura 20.10,
Ic = (Vc − Vcc )/Rc e Ib = (Vb − Vbb )/Rb , siendo Vcc y Vbb voltajes constantes. Resulta
entonces
∆Vc = −Rc ∆Vb /Rb = −G∆Vb , (20.11)
siendo G = Rc /Rb la ganancia de voltaje. Ahora bien, si queremos calcular la ca-
pacidad dinámica de la unión (análoga al concepto de resistencia dinámica discutido
anteriormente) resulta
∆Q ∆Q
Ccb = = . (20.12)
∆(Vc − Vb ) ∆Vc − ∆Vb
Por otro lado la capacidad de un condensador conectado de la base a la tierra viene
dada por ∆Q/∆Vb . Empleando las relaciones (20.11) y (20.12) se puede ver que resulta
equivalente sustituir Ccb por un condensado cuya capacidad vale

CM il = Cbc (1 + G). (20.13)

De esta manera la se nal de entrada de la base se ve afectada o filtrada por una


capacidad amplificada.

20.5. Ejercicios
1. Demostrar la expresión (20.6). Obtener una expresión que relacione Ie con Ib en
función de α.
Solución: Ie = Ib /(1 − α).
2. Si se define VT = kB T /e como un voltaje, comprobar que VT = 25 mV a una
temperatura de 20◦ C. ¿Tiene sentido sustituir la expresión (20.7) por la igualdad
Ic = Is exp(eVeb /kB T ) como una buena aproximación cuando el emisor y la base
264 Transistores bipolares

están polarizados directamente? Se necesitan al menos del orden de 0,6 V de


diferencia entre el emisor y la base para que la unión esté polarizada directamente.
3. Empleando la aproximación (20.8) a temperatura ambiente, calcular cuál ha de
ser el incremento de Veb para duplicar la corriente del colector Ic . Calcular lo
mismo para hacerla 10 veces mayor.
Solución: ∆Veb = 18 mV, 60 mV.
4. Considerando que ∆Ic ≈ ∆Ie , a partir de la expresión (20.8) obtener la relación
(20.9).

5. Demostrar que afirmar que Veb cae 2,1 mV/ C a Ic constante es equivalente
a decir que Ic crece aproximadamente un 9 %/◦ C si se mantiene Veb constante
cuando se varı́a la temperatura de un transistor, según muestra la figura 20.2.
Solución: Sean T1 > T2 las temperaturas de cada curva de la figura 20.4. Em-
pleando la expresión Ic = Is (T ) exp(eVeb /kB T ), a Ic constante para cada cur-
va se encuentra que Is (T1 ) = Is (T2 ) exp(eV2 /kB T2 − eV1 /kB T1 ), en donde po-
demos sustituir V2 = V1 + α∆T . Si consideramos a continuación el cociente
I1 /I2 = Is (T1 ) exp(eU1 /kB T1 )/Is (T2 ) exp(eU1 /kB T2 ), después de simplificar re-
sulta I1 /I2 = exp(eα∆T /kB T2 ). A temperatura ambiente, kB T2 /e = 25 mV, y
con α = 2,1 mV/◦ C, cuando ∆T = 1◦ C, resulta I1 /I2 ≈ 9 %
6. Una posible estimación de la resistencia del efecto Early viene dada por
1 WX
≈ Ie .
Rec 2L2h Vbc

Obtener esta expresión y demostrar que Rec es del orden de 104 a 105 Ω.
Solución: Si mantenemos constate Veb , podemos escribir dIc /dVec = dIc /dVbc =
−(W/L2h )Ie dW/dVbc (en donde hemos tenido en cuenta la expresión (20.4)). Con-
siderando ahora que W = Wb − X y la expresión (19.10) para X se obtiene el
resultado. Teniendo en cuenta que W/Lh está en el rango de 0,5−0,05, que X/W
es a lo máximo del mismo orden y que Ie se mide en mA y Vbc en voltios, resulta
1/Rec ∼ 10−4 .
7. Demostrar que si se mantiene constante la corriente Ic , resulta ∆Veb = −γVec ,
siendo γ ≈ 10−4 .
Solución: La corriente que circula por el colector se puede escribir como Ic =
αIe + Uec /Rec (ver la figura 20.6). Derivando en ambos lados y considerando que
d(αIe ) ≈ Ic /25mV dUeb , resulta ∆Veb = −(25mV /Ic Rec )∆Vec . Ya que Ic es del
orden de mA, γ ≈ 1/Rec .
8. Dibujar la gráfica de Ib frente al tiempo que corresponde a la situación mostrada
en la figura 20.8. Tener presente que en cada instante Ie = Ib + Ic .
9. La configuración de emisor común presenta la desventaja de que es del orden
de β veces más lenta que la configuración de base común. Comprobar que esto
es cierto. Para ello, obtener el cociente entre los tiempos de subida en las dos
configuraciones y usar las expresiones (20.6) y (20.2) en el cociente, siendo β ≈
100.
Solución: El cociente resulta (Wb /Lh )2 = 2/(1 + β) ≈ 2/β.
10. Obtener la expresión (20.13) para el efecto Miller.
Capı́tulo 21

Transistores de efecto campo

21.1. Principios básicos


En 1920, antes de que el primer transistor bipolar fuera inventado, Lilienfeld propuso
un dispositivo capaz de amplificar se nales. La idea se ilustra en la figura 21.1. El
dispositivo se parece a un condensador ordinario. Una de las placas es de metal y la
otra es de semiconductor.
Si se aplica un voltaje V1 entre las placas, se origina un campo eléctrico E1 en
el espacio entre las mismas. En la superficie interior de la otra placa, se inducirá un
campo eléctrico E2 = E1 /εr , siendo εr la permitividad relativa del semiconductor.
Sabemos que este campo penetra una cierta distancia en el material dependiendo de
la concentración de portadores libres. Controlando el sentido del campo aplicado, esto
es la polaridad del voltaje V1 entre las placas, crearemos una zona libre de portadores
(región de vacı́o) o por el contrario se enriquecerá de portadores. Si, como en la
figura 21.1, el semiconductor es de tipo n, entonces conectando el polo positivo de
nuestra baterı́a al semiconductor y el negativo a la placa metálica (serı́a una especie
de polarización inversa en la cual la placa metálica juega el papel de semiconductor
tipo p) se produce entonces una región vacı́a de carga. Si cambiamos esta polaridad
(equivalente a una polarización directa), entonces en la región del semiconductor
cercana a la placa positiva se produce un aumento de portadores libres.
La idea consiste ahora en aplicar un voltaje V0 a lo largo del semiconductor e
inducir una corriente I paralela a la placa. Si la polarización es inversa, parte del

metal
V1 W
n d

V0

Figura 21.1. La idea de transistor de efecto campo propuesta por Lilienfeld.

265
266 Transistores de efecto campo

semiconductor estará ocupado por la región vacı́a de carga por lo que la resistencia
al paso de corriente eléctrica será grande y la corriente que fluye a lo largo del mismo
será peque na. De forma inversa, si la polarización es directa, parte del semiconductor
estará enriquecido con portadores libres, por lo que su resistencia disminuirá y la
corriente I aumentará. Este truco permitirı́a controlar la corriente que fluye a lo largo
del semiconductor mediante un campo eléctrico perpendicular a la corriente. Por esto
se llama transistor de efecto campo.
En la práctica esta idea tiene un problema. Supongamos que la polaridad de V1
es negativa, produciéndose por tanto una región de vacı́o cerca de la superficie del
semiconductor. Conociendo el campo eléctrico E2 y la concentración de impurezas
Nd en el semiconductor, usando las expresiones (19.6) y (19.7) podemos calcular la
anchura de esta región,
ε r ε 0 E2
W = . (21.1)
eNd
El campo eléctrico máximo que se puede alcanzar dentro del semiconductor es el de
ruptura. Para el Ge y Si es del orden de 2 a 3 × 105 V/cm, que corresponde al voltaje
dado por la ecuación (19.12). El valor mı́nimo de dopaje Nd que se podı́a conseguir
en 1920 era Nd ≈ 1018 cm−3 , lo cual corresponde a un nivel de impurezas menor al
0,01 %. La premitividad relativa de estos semiconductores vale εr ≈ 10. Con todo ello,
el tama no de la región de vaciado como máximo se hace del orden de 0,02µm. Por otra
parte en aquellos tiempos era imposible hacer una placa de semiconductor de menos
de 50 µm de espesor. El incremente máximo que se podrı́a esperar en la resistencia
serı́a de un 0,04 %. Sin embargo, a pesar de que la resistencia se podı́a medir con
suficiente precisión, tal incremento no se observó. Si se hubiera observado, aunque no
hubiera sido posible detectar amplificación o atenuación de la se nal aplicada, la idea
habrı́a sido válida. Cristales más puros y delgados llevarı́an al efecto deseado.
La razón de no haber observado cambios en la resistencia está en que los átomos
cerca de la superficie no se comportan igual que en el interior del material. Se ha
visto en capı́tulos anteriores que cada átomo en la superficie crea un estado capaz de
capturar electrones libres (capı́tulo 19). La densidad de estos estados superficiales es
del orden de 1015 cm−2 . Imaginemos ahora que cambiamos la polaridad y el campo
E2 en el semiconductor lleva los electrones hacia la superficie. Para estimar cuántos
portadores libres habrá cerca de la superficie empleamos la fórmula del condensador
plano que da la relación entre la densidad de carga superficial y el campo aplicado,
σ = εr ε0 E2 . Sustituyendo los valores discutidos anteriormente y dividiendo entre
la carga del electrón se obtiene la densidad de portadores libres que deberı́a haber
en la superficie. Si se hace este ejercicio, la densidad de electrones en la superficie
resulta del orden de 1012 cm−2 . Este número es 1000 veces menor que la densidad
de estados superficiales capaces de capturar un electrón. Por lo tanto, no existirán
portadores libres y no es extra no que nadie hubiera sido capaz de obtener algún
resultado positivo.

21.2. JFET, transistores de efecto campo de unión p-n.


Para deshacerse de los estados superficiales se intentó sin éxito combinar diferentes
geometrı́as, tipos de semiconductores, etc. En 1952 Shockley razonó que lo que habı́a
MOSFET, transistor de campo de óxido de metal. 267
V1
S G D
p
W
n d

V0

Figura 21.2. Transistor de efecto campo de canal n. Vemos la fuente S, la puerta G y el


drenaje D.

que hacer era crear un electrodo que modulase la resistencia de la placa semiconduc-
tora no en la superficie, sino en su interior, en donde no existen estados superficiales.
La figura 21.2 ilustra la idea de Shockley. Sobre un sustrato de tipo n se crea una
región de tipo p. En el interior de la placa, a una profundidad que se puede controlar,
se crea una unión p-n. La región p se dopa mucho más que la región n por lo que la
región de vacı́o se localiza principalmente en la región n. Si se polariza inversamente
la unión, entonces la región de vacı́o que tiene una resistencia bastante grande penetra
más y crece con el campo en el interior de la región. El canal por el que puede fluir la
corriente eléctrica ID se estrecha y la corriente ID disminuye. Hemos conseguido de
esta forma regular la corriente mediante un campo perpendicular a la misma.
Estos transistores se fabrican con tecnologı́a plana. Los tres electrodos de contacto
están sobre la misma cara. Los dos que sirven para transmitir la corriente a lo largo
del semiconductor reciben el nombre de fuente (source en inglés) y drenaje (drain).
El electrodo al cual se le aplica el voltaje que modula la resistencia recibe el nombre
de puerta (gate).
El transistor que representamos en la figura 21.2 se llama de canal n, ya que la
corriente se controla en la región de agotamiento o vaciado de anchura W que aparece
en el semiconductor dopado negativamente. De forma análoga se puede construir un
transistor de efecto campo de canal p.

21.3. MOSFET, transistor de campo de óxido de metal.


Varios a nos después de la creación del transistor tipo JFET, la tecnologı́a fue capaz
de ganar una batalla que habı́a durado más de 30 a nos. Se encontró el semiconductor,
el material dieléctrico y el método de aplicarlo sobre el semiconductor de tal manera
que la densidad de estados superficiales no fuera mayor que 1010 cm−2 , es decir 100000
veces menos que en un semiconductor tı́pico. Por fin la idea de Lilienfeld podı́a llevarse
a la práctica. El semiconductor resultó Si y el dieléctrico óxido de silicio SiO2 .
En la figura 21.3 podemos ver esquemáticamente cómo se hacen estos transistores.
Sobre un sustrato poco dopado, con impurezas contrarias al canal que transmitirá la
corriente, se deposita una capa delgada de Si con la concentración de impurezas
necesarias. Esta capa constituye el canal. Entonces la superficie es oxidada y mediante
un proceso litográfico parte de este óxido se remueve creándose ventanas en la capa
de óxido. En esas ventanas se depositan los electrodos que formarán la fuente y el
268 Transistores de efecto campo

SiO2 SiO2
S G D S G D
canal n n n
p p
(a) (b)

Figura 21.3. Diferentes tipos de MOSFETs de canal n. (a) NMOS de canal permanente,
(b) NMOS de canal inducido.

drenaje. Por último sobre la parte de óxido que permanece se deposita el electrodo
que hará de puerta.
Dos de los tipos más importantes de transistores MOSFET se muestran en la
figura 21.3. Ambos son transistores de canal tipo n (NMOS) con sustrato tipo p. Sin
embargo en el segundo no existe inicialmente un canal. El primero recibe el nombre
de canal permanente, depletion mode, o normally-on. El segundo se llama de canal
inducido, enhancement mode o normally-off.
Las uniónes p-n se hace más profunda en las cercanı́as de la fuente y el drenaje. En
el NMOS de canal permanente, podemos considerarlas como dos regiones separadas,
conectadas en serie por el canal. Cuando no se aplica ningún voltaje en la puerta,
existe una conductancia distinta de cero definida por la longitud del canal, su anchura
y su conductividad. Es claro por lo que recibe el nombre de transistor de tipo on, ya
que deja pasar cierta corriente en este estado. Si se aplica un volaje positivo a la
puerta, la conductancia del canal aumentará. Si por el contrario se polariza al revés
la puerta, entonces disminuirá hasta que todo el ancho del canal se vacı́a de portadores
libres, y por tanto su conductancia se hace cero. El voltaje aplicado que hace que la
conductancia se anule recibe el nombre de pinch off VP .
En el NMOS de canal inducido no hay ningún canal entre la fuente S y el drenaje
D cuando no se conecta la puerta G a un voltaje. El nombre de transistor de canal
apagado en modo normal (normally-off channel) está por tanto justificado. Cuando
se conecta un voltaje positivo relativamente peque no a la puerta, una región vacı́a
de huecos empezará a aparecer entre la fuente y el drenaje, justo debajo de la capa
de óxido. Los huecos tienden a abandonar esa región mientras que por el contrario los
electrones se verán atraı́dos por ella. Inicialmente esto no afecta apenas la corriente
que va de la fuente al drenaje y permanece prácticamente igual a cero. Sin embargo, si
continuamos aumentando el voltaje en la puerta, finalmente se producirá una inversión
del tipo de conductividad, no siendo por huecos sino por electrones. El voltaje en el
que esta inversión tiene lugar recibe el nombre de voltaje de disparo o threshold VT . La
principal ventaja de estos dispositivos es que si no hay voltaje en la puerta, al no existir
prácticamente corriente, no se consume potencia incluso habiendo una diferencia de
voltaje entre la puerta y el drenaje.
Curvas universales caracterı́sticas de los FET 269

log ID
ID (on)
I DSS ID (on)
PMOS
enhancement 1mA NMOS enhancement
JFET
de canal n 1 µΑ JFET de canal p
VP VP VGS
−5 −3 VT 0 VT +3 +5

Figura 21.4. Curvas caracterı́ticas de los transistores de efecto campo. El eje de abscisas
representa voltios.

21.4. Curvas universales caracterı́sticas de los FET

Hemos visto que existen dos grandes familias de FET: aquellos en los que la puerta
forma una unión p-n (JFET) y aquellos en los que está aislada mediante una sepa-
ración de óxido (MOSFET). Dentro de cada familia, el canal que conduce puede ser
tipo n o tipo p. Por último, dependiendo del dopado del canal, el modo puede ser
depletion, en el que el FET conduce hasta que se aplica un voltaje para hacer que
no conduzca, o enhancement, en el que el FET no conduce hasta que no se aplica un
voltaje a la puerta. De todas las posibilidades, los JFET sólo se construyen en modo
depletion, mientras que los MOSFET vienen en todos los tipos salvo el de canal p en
modo depletion que no se fabrica.
Afortunadamente no hay recordar las propiedades de los cinco tipos de FET que
existen, ya que éstas son básicamente las mismas y se resumen en la figura 21.4. Un
tipo de FET conduce hasta que se hace algo para disminuir su conductancia vaciando
el canal de conducción (depletion). El comportamiento de estos transistores se resume
en las curvas para los JFET mostradas en la figura 21.4, válidas también para algunos
MOSFET. Si la diferencia de voltaje entre la puerta y la fuente se hace cero VGS = 0,
la corriente que circula por el drenaje ID = IDSS es casi máxima (IDSS significa la
corriente que circula por el drenaje cuando cortocircuitamos -shortcircuit- la fuente
con la puerta). Para disminuir esta corriente hace falta aplicar entre la puerta y la
fuente una diferencia de voltaje como si fuéramos a polarizar un diodo de manera
inversa. Como explicábamos antes, al alcanzar el voltaje de apagado o pinch-off VP
el transistor se apaga.
El otro tipo de FET está dise nado de manera que no conduce a menos que se
aplique un campo que sea capaz de crear un canal de conducción. Estos transistores
son los NMOS y PMOS, modo enhancement, cuyas curvas caracterı́sticas se muestran
también en la figura 21.4. El voltaje mı́nimo capaz de crear el canal es VT (voltaje de
disparo o threshold). En este caso la polarización es directa. Es por ello por lo que<