GuiaMatematicas EAUEE

UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO
MATEMÁTICAS
M en I Azucena Escobedo Izquierdo y M. en I. Elisa Viñas Reyes

27/05/2011
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía
INDICE
1. Algebra elemental
1.1 Ecuación de primer grado.
1.2 Ecuaciones algebraicas de orden mayor.
1.3 Ecuaciones trascendentes.
1.4 Soluciones numéricas.
2. Sistemas de ecuaciones lineales

2.1 Sistema de ecuaciones
2.2 Clases de sistemas de ecuaciones
2.3 Métodos de resolución
2.4 Matrices
2.5 Independencia lineal
2.6 Producto de matrices (utilizando hoja de cálculo)
3. Estadística descriptiva
3.1 Población
3.2 Muestra
3.3 Correlación
4. Variables aleatorias
4.1 Variable aleatoria discreta
4.2 Variable aleatoria continua y su función de densidad
4.3 Medidas de tendencia central de variables aleatorias discretas y continuas.
4.4 Medidas de dispersión de variables aleatorias discretas y continuas.
4.5 Medida de simetría de variables aleatorias discretas y continuas.
5. Modelos probabilísticos comunes

5.1 Distribución Binomial
5.2 Distribución Geométrica
5.3 Distribución Pascal o Binomial negativa
5.4 Distribución uniforme continua
5.5 Distribución Normal
5.6 Aproximación de la distribución binomial a la normal
6. Distribuciones muestrales
6.1 Muestra estadística
6.2 Muestra aleatoria simple
6.3 Muestreo aleatorio simple
6.4 Generación de números aleatorios
6.5 Teorema del límite central
6.6 Distribución de la media muestral
6.7 Distribución Ji-Cuadrada
6.8 Distribución t-Student
Página 2 de 105
Matemáticas
1. Algebra elemental
Una ecuación f(x)=g(x) es algebraica si cada una de las dos funciones es algebraica (racional o
irracional). De toda ecuación algebraica se puede obtener una ecuación de forma:
P(x) = anxn + a n -1x n -1 + ....... + a1x + a0 = 0 (1)
En esta manipulación de la ecuación pueden presentarse ocasiones en que P(x) = 0 tenga

soluciones que no verifiquen la ecuación inicial y se las llama raíces extrañas.
1.1 Ecuación de primer grado.
Su forma es ax + b = 0, donde a y b son constantes y números reales para a 0 y siempre tiene
solución real:
b
x (2)
a
Las ecuaciones de 1er. grado se llaman también lineales algunos ejemplos de estas son:
1. 3x-5 = 16 3. 2  x  1
3 5 4. ax+b=c
2. 
x7 x2
Su solución puede ser numérica o gráfica. Numéricamente, se resuelve

"despejando" la x, o sea ir pasando términos de un miembro a otro hasta
conseguir: x =...número
Ejemplo.
Supongamos que queremos resolver la ecuación: 3x + 1 = x - 2.
3x - x = -1 - 2; 2x = - 3; x = -3/2 ó x = -1.5.
Verificación: 3(-1.5) + 1 = -1,5 -2; -4,5 + 1 = -3.5
Solución gráfica: la línea recta dibujada representa gráficamente a la ecuación. El

valor de x donde la recta corta al eje X será la solución de la ecuación (se observa
que es x = -1,5)
y
x = -1.5
x
Página 3 de 105
Matemáticas
1.2 Ecuaciones algebraicas de orden mayor.
1.2.1 Ecuación de segundo grado

La ecuación: , donde a, b y c son números reales y a 0, se
llama ecuación cuadrática o ecuación de segundo grado en la variable x.
- Si b y c son distintos de cero, la ecuación se llama completa o afectada;
incompleta, en caso contrario.
- Así, las ecuaciones: y son cuadráticas completas,
mientras que las ecuaciones: y son cuadráticas
incompletas.
- En la ecuación cuadrática: , la cantidad: es llamada
discriminante de la ecuación y su signo determina la naturaleza de las raíces,
como lo afirma el siguiente teorema.
Teorema.
Considere la ecuación cuadrática: ; a 0.
Si , entonces, las raíces son reales y diferentes.
Si , entonces, las raíces son reales e iguales.
Si , entonces, las raíces son complejas conjugadas.
Para resolver la ecuación cuadrática, puede usarse cualquiera de

los siguientes métodos:
A. Solución por factorización.

Como toda ecuación cuadrática es equivalente a una ecuación en la cual uno
de sus miembros es un polinomio de segundo grado y el otro es cero; entonces,
cuando el polinomio de segundo grado pueda factorizarse, se procede así:
Si , , entonces, la ecuación es
equivalente a: (1).
La ecuación (1) puede resolverse usando la propiedad del sistema de los
números reales:
B. Solución por completando el cuadrado.

Este método es el más antiguo que existe para encontrar las soluciones de una
ecuación cuadrática.
Se supone que la ecuación: ,con a 0 ,es equivalente a la
ecuación cuadrática:
(1).
Página 4 de 105
Matemáticas
Sumando en ambos miembros de la ecuación (1), se obtiene:
ó
Extrayendo raíz cuadrada en ambos miembros de la última igualdad (lo cual tiene
sentido solo si ), se obtiene:
,de donde (2).
La fórmula (2) proporciona las dos soluciones (una para cada signo) de la
ecuación cuadrática (1), que es equivalente a la ecuación : .
C. Solución por la formula general
Usando el método de completación de cuadrados, demuestre que la solución de la

ecuación cuadrática : , con a ≠0 viene dada por :
(1).
Solución
La ecuación: , con a≠ 0 ,es equivalente a la ecuación :
Sumando ,en ambos miembros de la igualdad anterior, se obtiene:
O equivalentemente,
Extrayendo la raíz cuadrada en ambos miembros de la última igualdad (si b2-4ac

>= 0), se obtiene:
Página 5 de 105
Matemáticas
De donde:
(2)
La fórmula (2) se conoce como :fórmula general para resolver la ecuación

cuadrática : ; con a≠ 0.
Ejemplos
1. Resolver la ecuación 2x2 – x = 0
Factorizando x obtenemos: 2x(x – ½ )= 0
1era. solución 2x = 0 despejando x tenemos x= 0/2 entonces x1 = 0

2da. solución (x – ½ )= 0 x2 = ½
2. Resolver la ecuación x2 + 5x + 6 = 0
 5  5 2  416  5  5 2  416
x1  x2 
21 21
x1 = -3 x2 = -2
3. Resolver por factorización la ecuación 3x2 + 10x +8 =0
- Hallamos primero el producto ac= 3 x 8 = 24

- Buscamos dos números cuyo producto es 24 y cuya suma sea 10
1 x 24 = 24 1 + 24 ≠ 10
2 x 12 = 24 2 + 12 ≠ 10
4 x 6 = 24 4 + 6 = 10
Factorizando se tiene
3x2 + 4x + 6x + 8 =0
x(3x+4) + 2(3x+4) = 0
(x+2)(3x+4) = 0 igualando a cero ambos factores y resolviendo
Página 6 de 105
Matemáticas
(x+2) = 0 x = -2
(3x+4) = 0 x = - 4/3
1.2.2 Ecuación de n-ésimo grado
Las ecuaciones de la forma P(x) = 0 donde P(x) es un polinomio de grado mayor

que 4, no pueden ser resueltas por radicales, en el caso más general, y sólo es
posible aplicar métodos de aproximación, que los hay muy variados y de distinto
nivel de complejidad.
P(x) = an xn + an -1 xn-1 + ..... + a2 x2 + a1 x + a0 donde los ai, con i = 0,1,...,n
son en general, números reales, aunque pueden ser también complejos

imaginarios. A x llamamos indeterminada. Si an , an se llama coeficiente
principal y n es el grado del polinomio. A a0, denominamos término independiente,
a1x, término lineal, a2 x2, término cuadrático y así sucesivamente. Al máximo
n/an0, llamamos grado del polinomio.
El método mas frecuente de resolver ecuaciones de grado superior a 2 es

descomponer la ecuación en factores (dividiendo la ecuación por los posibles
divisores), con lo que, si tenemos suerte, la ecuación se reduce a un producto de
otras ecuaciones de grado menor que ya podemos resolver por las fórmulas
anteriores.
1.3 Ecuaciones trascendentes.
Una ecuación f(x)=g(x) es trascendente, si por lo menos una de las funciones no

es algebraica. Son ejemplos de estas ecuaciones, las exponenciales, logarítmicas,
trigonométricas, hiperbólicas. En general, las ecuaciones trascendentes sólo
pueden resolverse en forma aproximada. En algunos casos la resolución de estas
ecuaciones se reduce a la resolución de ecuaciones algebraicas con la ulterior
aplicación de valores tabulados.
1.3.2 Función exponencial y logarítmica.
Sea la función exponencial de la forma
f(x) = abx donde b>0
Siendo b un número real positivo distinto de 1 y a un número real distinto de cero.
Página 7 de 105
Matemáticas
La expresión función exponencial se reserva para la inversa de la función

logaritmo natural o, dicho en otros términos, para el caso en que a = e. Con esa
definición, su dominio es R, pero se puede ampliar al cuerpo de los complejos.
Esta función se nota exp: R → R+*
Donde e es la base de los logaritmos naturales.
y = exp x <=> x = ln y (con y >0)
La tangente en x = 1, T1, pasa por el origen. La tangente en x = 0, T 0, pasa por el

punto (-1, 0).
La inversa de la función exponencial es la función logarítmica de la misma base

así, Dados a, b R+ y b 1, se dice que el logaritmo en base b del número a es x
sí, y sólo sí, x es el exponente al que hay que elevar b para obtener a. Es decir:
logb a = x bx = a
Página 8 de 105
Matemáticas
Entonces, cuando en una ecuación, la incógnita figura en el exponente, se aplica

logaritmo a ambos miembros de la misma.
Condiciones: Si a fuera 1, sería para todo x, bx = 1, y ningún número distinto de 1

tendría logaritmo. Por razones análogas, la base debe ser también distinta de 0.
Si b = 10 anotamos log a y llamamos logaritmo decimal.

Si b es el número irracional e = 2,7182818..., anotamos ln a y llamamos logaritmo
neperiano o natural.
Como un número positivo elevado a cualquier potencia (de exponente positivo o
negativo) da un resultado positivo, resulta que, dentro del campo de los números
reales, los números negativos no tienen logaritmo.
Propiedades:
- logb 1 = 0
- logb b = 1
- logb m  logb n  m n (con lo cual la función logarítmica es creciente)
- logb m = x  log1/b m = -x  logb (1/m) = -x
- logb MN = logb m + logb n
m
- logb = logb m – logb n
n
- logb mn = nlogb m con lo que m = blogbm
log m
- logb n m  b
n
- Conociendo el logaritmo de un número en una cierta base b, se puede
determinar su logaritmo en cualquier otra base B según la fórmula:
log a 1
log b  b donde puede ser tomado como módulo de
B log B log B
b b
conversión.
Ejemplos
1. Para 32x =16 comprobar que x = 4
Despejando x
log2x = log16
xlog2 = log16
Página 9 de 105
Matemáticas
log 16
x 4
log 2
2 Encuentre el valor de x
lon(x2-9) - log(x+3)=19
Eliminando log.
log  x29 
 
 
 x3 
10  
 1019
 x2  9 
   1019 x ≠ -3
 x3 
 
Resolviendo el binomio y reduciendo
x  3x  3  1019  (x-3) = 1019  x = 1019 + 3 y x = 1019

x  3
3 Despejar y de la siguiente función y graficar en el plano x-y.
30.00
y
e  x2
25.00
Resolviendo para y
20.00
y
ln e  ln x 2
 y  ln x 2 ;
15.00
elevando al cuadrado ambos

miembros de la ecuación 10.00
y = (lnx2)2 5.00
0.00
x y 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
0.1 28.11
0.2 6.71
0.3 2.10
0.4 0.70
0.5 0.23
0.6 0.07
0.7 0.02
Página 10 de 105
Matemáticas
1.3.2 Funciones trigonométricas e hiperbólicas
A. Funciones trigonométricas
En el estudio de la trigonometría que trata con problemas que incluyen ángulos de

triángulos.
Equivalencia en medición de ángulos: Los sistemas de medición de ángulos

más usados son: el sexagesimal (DEG) y el circular (RAD), y menos usado el
centesimal (GRAD). La equivalencia entre estos sistemas es:
Y como 2 rad se corresponde con 360º, se tiene que 1 rad 57º17’44,5”
Las tres primeras se denominan funciones directas y las restantes son llamadas
funciones inversas (pues sólo son los números inversos de las otras). Estas
relaciones funcionan en los triángulos rectángulos y son útiles para hallar sus
elementos. Estas expresiones son funciones del ángulo a, esto queda asegurado
por el Corolario de Tales.
Página 11 de 105
Matemáticas
Longitud de arco: En una circunferencia de radio r, un ángulo central a determina

un arco de longitud L, dicha longitud es igual al producto de la longitud del radio
por la amplitud del ángulo central a expresado en radianes. L = r.
B. Teoremas e identidades trigonométricas:
Una notación muy conveniente para recordar las fórmulas es la que acabamos de
utilizar; consiste en nombrar a un lado y a su ángulo opuesto con la misma letra:
mayúscula para el lado y minúscula para el ángulo.
- Teorema del Seno:
Esta fórmula puede aplicarse conociendo un par de lados y el ángulo opuesto a

uno de ellos, o viceversa, un par de ángulos y el lado opuesto a uno de ellos.
Página 12 de 105
Matemáticas
- Teorema del Coseno:
A2 = B2 + C2 -2BC cos a
Esta fórmula sirve para hallar cualquiera de los lados, si se conocen los dos lados
restantes y el ángulo que forman, por lo tanto también se la puede escribir como:
B2 = A2 + C2 -2AC cos b ó C2 = A2 +B2 -2AB cos c
Si cualquiera de los ángulos es de 900 (con lo que su coseno es cero) la fórmula

en la que aparece se reduce al Teorema de Pitágoras; puesto que el último
término se anula idénticamente.
- Teorema de Pitágoras:
Para un triángulo rectángulo existe una relación muy conocida entre sus lados; es
el Teorema de Pitágoras que establece que: “El cuadrado de la hipotenusa (A) es
igual a la suma de los cuadrados de los catetos (B y C)”. La hipotenusa es el lado
opuesto al ángulo recto, y los catetos son los lados restantes. Es decir que:
A2 = B2 + C2 de donde
Que se conocen como los Corolarios del Teorema de Pitágoras.
La Relación Pitagórica de la trigonometría indica que: sen2 a + cos2 a = 1
- Teorema de las tangentes:
Esta fórmula no es muy utilizada en la resolución de triángulos, porque deben

conocerse los mismos datos que se necesitan para el Teorema del Seno, y éste
último es más manejable.
Algunas identidades trigonométricas: La definición de las funciones dadas al

principio como cociente de lados de un triángulo rectángulo sirven para ángulos
agudos, pero pueden extenderse a ángulos mayores que 90° ó menores que 0°,
según el siguiente cuadro:
Página 13 de 105
Matemáticas
Reducción al primer cuadrante: Este cuadro indica el signo que posee cada
función en los cuatro cuadrantes, y se lo utiliza junto con las fórmulas de reducción
al primer cuadrante:
- Si al 2do cuadrante se utiliza el ángulo =180º - 

- Si al 3er cuadrante, se utiliza el ángulo = - 180°
y se procede de igual manera al ejemplo anterior.
- Si al 4to cuadrante, se utiliza el ángulo = 360° - 
Funciones de ángulos notables: Los valores utilizados en el ejemplo dado en el

punto (I) pertenecen al siguiente cuadro, donde se detallan los valores numéricos
de las funciones para ángulos múltiplo de 30° y 45°, del primer cuadrante.
Relaciones entre las funciones de un mismo ángulo: También interesa hallar

los valores de las funciones conociendo una de ellas y sin la necesidad de conocer
el ángulo. Para ello se utilizan las relaciones:
Página 14 de 105
Matemáticas
Si se tiene como dato alguna de las funciones inversas, un paso previo a estos
cálculos es, precisamente, invertir este valor para hallar la función directa
correspondiente.
Funciones trigonométrica del doble ángulo y del ángulo mitad:
Si se conoce las funciones trigonométricas de un cierto ángulo y se desea conocer

las funciones correspondientes a un ángulo que mide el doble del anterior, o la
mitad de él, se utilizan las siguientes fórmulas
Página 15 de 105
Matemáticas
Funciones Trigonométricas de la suma y la diferencia de dos ángulos
C. Funciones hiperbólicas
Son análogas a las funciones trigonométricas ordinarias o funciones circulares.
Estas son:
y otras líneas:
El seno hiperbólico
cotangente hiperbólica
El coseno hiperbólico secante hiperbólica
cosecante hiperbólica
La tangente hiperbólica
1.4 Soluciones numéricas.
Uno de los problemas que se presenta con frecuencia en ingeniería es encontrar

las raíces de ecuaciones de la forma f(x) = 0, donde f(x) es una función real de una
variable x,
Como un polinomio en x. f(x) = x4 – 6x3 + 4x2 + 36x – 45
O una función trascendente f(x) = ex sen x + ln3x + x3
Existen distintos algoritmos para encontrar las raíces o ceros de f(x) = 0, pero
ninguno es general; es decir, no hay un algoritmo que funcione con todas las
Página 16 de 105
Matemáticas
ecuaciones; por ejemplo, se puede tener un algoritmo que funcione para encontrar
las raíces de f1(x) = 0, pero al aplicarlo no se puede encontrar los ceros de una
ecuación distinta f2(x) = 0.
En muy pocos casos es posible obtener las raíces exactas de f(x) = 0, como
cuando f(x) es un polinomio factorizable, como
 1  2
 
f(x)   x - x  x  x   x  x n ,
donde x , 1≤ i ≥ n denota la i-ésima raíz de f(x) = 0. Sin embargo se pueden

i
obtener soluciones aproximadas al utilizar algunos de los métodos numéricos que
aquí presentamos.
1.4.1 Método del punto fijo
Sea como inicio la ecuación general

f(x) = 0
de la cual se desea encontrar una raíz real x .
Primero, transformar algebraicamente la ecuación a la forma equivalente x = g(x)

esta transformación se puede llevar a cabo mediante operaciones algebraicas o
agregando x a cada lado de la ecuación original.
Por ejemplo para la ecuación
f(x) = x2 - 2x + 3 = 0
algunas posibilidades de x = g(x) son:
x2  3
x  2x  3 ó x
2
Una vez que se ha determinado una forma equivalente el siguiente paso es dar
una aproximación inicial a la raíz. Se denota valor de tanteo o valor de inicio como
x0. Una vez que se tiene x1, se evalúa g(x) en x0, denotándose el resultado de
esta evaluación como x0; esto es
g(x0)= x1
Este proceso se repite y se obtiene el siguiente esquema iterativo
Página 17 de 105
Matemáticas
Valor inicial: x0 f(x0)
Primera iteración x1 = g (x0) f(x1)

Segunda iteración x2 = g (x1) f(x2)
Tercera iteración x3 = g (x2) f(x3)

i-ésima iteración xi = g (xi-1) f(xi)
i+1-ésima iteración xi+1 = g (xi) f(xi+1)

Aunque hay excepciones, generalmente se encuentra que los valores x0, x1,... se
van acercando a x de manera que xi, esta más cerca de x que xi-1, o bien se van
alejando de x .
Como con otras formas iterativas, el error aproximado de la ecuación xi+1 = g (xi)
se puede determinar usando el estimador de error.
x x
a  i1 i 100%
x
i1
Ejemplo
Use iteración de punto fijo para localizar la raíz de f(x) = e-x – x.
Trasformando la ecuación en su forma equivalente y expresándola en la forma de

x
ecuación como xi1  e i . Empezando con un valor inicial de x0 = 0, se itera y
calcula:
i xi g (xi) ε%
0 0 1.0000
1 1 0.3679 100
2 0.368 0.6922 171.828
3 0.692 0.5005 46.8536
4 0.5 0.6062 38.3091
5 0.606 0.5454 17.4468
6 0.545 0.5796 11.1566
7 0.58 0.5601 5.90335
8 0.56 0.5711 3.48087
9 0.571 0.5649 1.9308
10 0.565 0.5684 1.10887
Página 18 de 105
Matemáticas
De esta manera, cada iteración acerca cada vez más al valor estimado con el
valor verdadero de la raíz, el cual es 0.5671.
- Criterio de convergencia
Un criterio de convergencia de este proceso iterativo se basa en que
g( x )= x ,
por lo cual puede suponerse que si la sucesión x0, x1, x2, ... converge a x , los
valores consecutivos xi, xi+1, irán acercándose entre sí conforme el proceso
iterativo avanza.
Un modo práctico de saber si los valores consecutivos se acercan es ir calculando

la distancia entre ellos
d  x x
i i1 1
Si la sucesión d1, d2, d3,... tiende a cero, puede pensarse que el proceso esta
convergiendo a una raíz x y debe continuarse hasta que xi < , y tomar a xi+1,
como la raíz buscada. Si d1, d2, d3,... no converge para un número “grande” de
iteraciones entonces x0, x1, x2,... diverge de x , y se detiene el proceso para iniciar
uno nuevo, modificando la función g(x), el valor inicial o ambos.
1.4.2 Método de Newton-Raphson
Este método de segundo orden de convergencia es el más ampliamente usado

cuando se trata de encontrar raíces reales no repetidas. Si el valor inicial de la raíz
es xi, entonces se puede extender una tangente desde el punto [xi, f(xi)]. El punto
donde esta tangente cruza al eje x, representa una aproximación a la raíz. El
proceso se repite comenzando con x1, se obtiene una nueva aproximación x2 y así
sucesivamente, hasta que un valor xi, satisfaga │f(xi) │≤ i│xi+1 - xi│< o ambos.
Si lo anterior no se cumple en un máximo de iteraciones, debe de iniciarse con un
nuevo valor de x0.
El método de Newton-Raphson se puede derivar geométricamente. En la figura, la
primera derivada en x es equivalente a la pendiente.
   
fx 
f x 0
1 x x
i
i i1
que se puede ordenar para obtener la ecuación central del algoritmo como
Página 19 de 105
Matemáticas
f x  
 
x x  i
i1 i f x
i
Ejemplo
Encuentre la raíz real de la ecuación empleando el método de Newton-Raphson.
f(x) = x3 + 2x2 + 10x -20
par x0, con aplicado a │xi-1+ xi) │
Se sustituyen f(x) y f´(x) en la ecuación de Newton-Raphson.
x 3  2 x 2  10 x  20
x x  i i i
i 1 i 3
3 x  4 x  10
i i
Primera iteración
13  21  101  20
2
x 1  1.41176
31  41  10
1 2
como x1 ≠ x0, se calcula x2. Durante el proceso de iteración se obtienen los

siguientes resultados.
i xi │xi+1 - xi│
0 1
1 1.4118 0.4118
2 1.3737 0.0381
3 1.3693 0.0044
4 1.3688 0.0004
5 1.3688 0.0000
Como se observa solo se requirieron de cuatro iteraciones para satisfacer el

criterio de convergencia; además se obtuvo una mejor aproximación a x que en
ejemplo anterior. Se observa que x5, ya no cambia con respecto a x4 en cinco
cifras decimales.
Página 20 de 105
Matemáticas
Fallas del método de Newton-Raphson.
Cuando el método de Newton-Raphson converge se obtienen los resultados en

relativamente pocas iteraciones, ya que para raíces no repetidas este método
converge con orden 2 y el error i+1 es proporcional al cuadrado del error anterior
i. De esto puede afirmarse que cada iteración duplica aproximadamente el
número de dígitos correctos.
Sin embargo, algunas veces el método de Newton-Raphson no converge sino

oscila. Esto ocurre si no hay raíz real, o si el valor inicial está muy alejado de la
raíz buscada y alguna otra parte de la función “atrapa” la iteración.
El método de Newton-Raphson requiere la evaluación de la primera derivada de

f(x). En la mayoría de los problemas de los textos este requisito es trivial, pero
este no es el caso en problemas reales donde, por ejemplo, la función f(x) está
dada en forma tabular.
De allí la importancia de estudiar otros métodos para resolver f(x) = 0 que no

requieran el calculo de f´(x), pero que retengan algunas de las propiedades
favorables de convergencia del método de Newton-Raphson. Alguno de estos
métodos con estas características se presentan a continuación.
1.4.3 Método de la secante
El método de la secante consiste en aproximar la derivada f´(x) de la ecuación de

Newton-Raphson por el cociente
 
f x  f  x 
i  i1  ,
x x
i i1
formado con los resultados de las dos iteraciones anteriores xi-1 y xi. De esto
resulta la formula
 x  x  f x  
i1  i  g  x 
x x 
i
 
(A)
i1 i f x  f  x   i
i  i1 
Página 21 de 105
Matemáticas
para la primera aplicación de esta ecuación e iniciar el proceso iterativo, se

requiere de los valores iniciales: x0 y x1. La siguiente aproximación, x2, está dada
por
 x  x  f x 
x  x   1 0 1
1
 
2 1 f x  f  x 
 0
la de x3 por

x x f x  
x x  2 1
   
2
3 2 f x f x
2 1
y así sucesivamente hasta que g(xi) = xi+1 o una vez
│xi+1 - xi│< 

│f(xi+1)│< 
Ejemplo
Use el método de la secante para encontrar la raíz real de la ecuación polinomial
f(x) = x3 + 2x2 + 10x -20 = 0
Con la ecuación A se obtiene
 x  x  f  x 3  2 x 2  10 x  20 
 i i1   i i i 
x x  
i1  x 3  2 x 2  10 x  20    x 3  2 x 2  10 x  20 
i
 i i i   i 1 i 1 i 1 
Mediante x0 = 0 y x1 = 1 se calcula x2
Los valores de las iteraciones subsecuentes se presentan en la tabla
Página 22 de 105
Matemáticas
i xi │xi+1 - xi│
0 0
1 1 1.0000
2 1.5385 0.5385
3 1.3503 0.1882
4 1.3679 0.0176
5 1.3688 0.0009
│xi+1 - xi│≤  = 10-3
1.4.4 Método de la posición falsa
El método de posición falsa, también llamado Regula-Falsi, al igual que el

algoritmo de la secante, aproxima la derivada f´(xi) de la ecuación de Newton-
Raphson por el cociente
 
f x  f  x 
i  i1  ,
x x
i i1
pero en este caso los valores de xi y xi-1 se encuentran en lados opuestos de la

raíz buscada y sus valores funcionales correspondientes tienen signos opuestos;
esto es
 
f x  f  x   0
i  i1 
se denota xi y xi-1como xD y xi, respectivamente.
Partimos del hecho de que se tienen dos valores iniciales xD y xi y que la función
es continúa en (xI,xD).
Se traza una línea recta que une los puntos A y B de coordenadas (xI, f(xI)) y (xD,
f(xD)), respectivamente. Se reemplaza f(x) en el intervalo (xI,xD) con el segmento
de recta AB y el punto de intersección de este segmento con el eje x, xM, será la
siguiente aproximación a x .
Página 23 de 105
Matemáticas
Se evalúa f(xM) y su signo se compara con el de f(xD). Si son iguales, se actualiza

xD sustituyendo su valor con el de xM; si los signos son diferentes, se actualiza xI
sustituyendo su valor con el de xM. El objetivo es mantener los valores descritos xD
y xi cada vez más cercanos entre sí y la raíz entre ellos.
Se traza una nueva línea secante entre los puntos actuales A y B y se repite el
proceso hasta que se satisfaga el criterio de exactitud │f(xM)│< 1 tomándose
como aproximación a x el valor último de xM. Para terminar el proceso también
puede usarse el criterio │(xD – xI)│< En este caso se toma como aproximación
a x la media entre xD y xI.
Para calcular el valor de xM se sustituye xD por xi y xI por xi-1 en la ecuación de la

secante con lo que se llaga a
x  x f xD   xI f xD  xD f xI  B)

f x  f x  f x  f x 
x x  D I
M D
D I D I
Ejemplo
Use el método de la secante para encontrar la raíz real de la ecuación polinomial
f(x) = x3 + 2x2 + 10x -20
Página 24 de 105
Matemáticas
Para obtener xD y xI se puede, por ejemplo, evaluar la función en algunos puntos

donde este cálculo sea fácil o bien se puede graficar. Así
f(0) = -20
f(1) = -7
f(-1) = -29
f(2) = 16
Podemos ver que hay una raíz real, por lo menos, en el intervalo (1,2); por tanto
xD = 1; f(xD) = -7
xI = 2; f(xI) = 16
Al aplicar la ecuación B) se obtiene xM
(1  2)(7)
x 1  1.30435
M  7  16
f(xM)= (1.30435)3 + 2(1.30435)2 + 10(1.30435) - 20
Como f(xM) < 0, (igual signo que f(xD)), se reemplaza el valor de xD con el de xM,
con lo cual queda el nuevo intervalo como (1.30435). Por tanto
xD = 1; f(xD) = -1.30435
xI = 2; f(xI) = 16
se calcula una nueva xM
La tabla muestra los cálculos llevados a cabo hasta satisfacer el criterio de

exactitud
│f(xM)│≤ 10-3
i xD xI xM │f(xM)│
0 1 2
1 1 2 1.30435 1.3348
2 1.3043 2 1.35791 0.2291
3 1.3579 2 1.36698 0.0386
4 1.3670 2 1.36850 0.0065
5 1.3685 2 1.36876 0.0011
6 1.3688 2 1.36880 0.0002
Página 25 de 105
Matemáticas
1.4.5 Método de la bisección
Este método es similar al de la posición falsa, auque algo más simple. Como en el
método de la posición falsa, también se requieren dos valores iniciales a ambos
lados de la raíz y que sus valores funcionales correspondientes sean de signos
opuestos.
En este caso el valor de xM se obtiene como el punto medio entre xD y xI.
(x  x )
x  I D
M 2
Dependiendo de la función que se tenga en particular, el método de la bisección

puede converger más rápidamente o lentamente que el método de posición falsa.
Su gran ventaja sobre el método de posición falsa es que proporciona el tamaño
exacto del intervalo en cada iteración (en ausencia de errores de redondeo). Para
aclarar esto, note que en este método después de cada iteración el tamaño del
intervalo se reduce a la mitad; después, de n iteraciones el intervalo original se ha
reducido 2n veces. Por lo tanto si el intervalo original es de tamaño a y el criterio
de convergencia aplicado al valor absoluto de la diferencia es , entonces se
requerirán n iteraciones, donde n se calcula con la igualdad de la expresión
a ln a  ln 
, donde: n
2n ln 2
Ejemplo
Utilice el método de bisección para obtener una raíz real del polinomio
f(x) = x3 + 2x2 + 10x -20
Con los valores iniciales obtenidos en el ejemplo del método anterior
xD = 1; f(xD) = -7
xI = 2; f(xI) = 16
Si  = 10-3, el número de iteraciones n será
ln a  ln  ln 2  1  ln 103
n   6.64
ln 2 ln 2
aproximadamente se requieren 7 iteraciones
Página 26 de 105
Matemáticas
Primera iteración
1 2
x   1.5 ; f(xM)) = 2.88
M 2
Como f(xM) = > 0 (distinto signo de f(xD)), se reemplaza el valor de con el de xM, con lo
cual quede un nuevo intervalo (1,1.5). Entonces
xD = 1; f(xD) = -7
xI = 1.5; f(xI) = 2.88
Segunda iteración
1  1.5
x   1.25 y f(xM)= -2.42
M 2
Como ahora f(xM) = < 0 (distinto signo de f(xD)), se reemplaza el valor de xD con el valor
de la nueva xM; de esta manera queda como intervalo (1.25, 1.5).
En la tabla se muestran los cálculos, el criterio │xi+1 – xi│ = 10-3 se satisface en diez
iteraciones; es decir, tres más de las previstas en la ecuación de la bisección,
debido principalmente a los errores de redondeo involucrados en el método.
En la tabla de resultados se nota que si  se hubiese aplicado sobre │f(xM)│, se

habría requerido 13 iteraciones en lugar de 10. En general se necesitarán más iteraciones
para satisfacer un valor de  sobre │f(xM) │ que cuando se aplica a │ xi+1 – xi│.
i xD xI xM │xMi - xMi+1│ │f(xM)│

0 1 2
1 1 2 1.5000 2.8750
2 1 1.5000 1.2500 0.2500 2.4219
3 1.2500 1.5000 1.3750 0.1250 0.1309
4 1.2500 1.3750 1.3125 0.0625 1.1687
5 1.3125 1.3750 1.3438 0.0313 0.5248
6 1.3438 1.3750 1.3594 0.0156 0.1985
7 1.3594 1.3750 1.3672 0.0078 0.0342
8 1.3672 1.3750 1.3711 0.0039 0.0483
9 1.3672 1.3711 1.3691 0.0020 0.0070
10 1.3672 1.3691 1.3682 0.0010 0.0136
11 1.3682 1.3691 1.3687 0.0005 0.0033
12 1.3687 1.3691 1.3689 0.0002 0.0019
13 1.3687 1.3689 1.3688 0.0001 0.0007
Página 27 de 105
Matemáticas
Ejemplos
Se emplea un intercambiador de calor como se indica en la figura para enfriar

105,000 de aceite empleando agua. Encuentre la temperatura de salida del aceite
y del agua de enfriamiento (TH2 y TC2, respectivamente).
Resolviendo
Un balance de calor para el aceite da
Q1 = w1Cp1 (TH1 – TH2) (1)
Un balance de calor para el agua da
Q2 = w2Cp2 (TC2 – TC1) (2)

Agua w1 = 73556 lb/h
TC1 = 80°F
Btu
Cp2 = 1
lbF
Btu
Aceite U = 120
2
TH1 = 250°F hft F
2
Btu A = 879 ft
Cp1 = 0.5 TH2 = ?°F
lbF
TC2 = ?°F
La ecuación que rige la transferencia de calor en este equipo es

Q = U A Tm (3)
donde
U = coeficiente global de transferencia de calor

A = área total de transferencia de calor
(4)
Página 28 de 105
Matemáticas
Para encontrar TH2 y TC2 debe cumplirse que Q1 = Q2, o bien
Q
1 0 (5)
Q
1
Pero Q sólo podrá calcularse cuando se conozcan todas las temperaturas. Para
resolver este problema se propone el siguiente procedimiento
Establecer que TH2 sea la única variable; entonces, Q2 puede escribirse en
función de TH2 como sigue
(6)
de donde puede despejarse TC2
(7)
Establecemos Q en función de TH2 y escribimos la ecuación 3 en función de dicha

variable.
(8)
Valores iniciales
Para estimar un valor inicial de TH2 podemos apoyarnos en la siguiente figura la
cual muestra una gráfica de temperaturas en este tipo de intercambiadores de
calor. De acuerdo con esta gráfica, se tienen las siguientes restricciones
Página 29 de 105
Matemáticas
TH1
TH2
TC2
TC1
0
L
Gráfica de temperaturas contra longitud en un intercambiador de calor con flujo a contracorriente
Empleando el método de bisección con TH2I = TC1 + 0.5 y TH2D = TH1 - 0.5 para
resolver la ecuación (8) tenemos los siguientes resultados
Resultados
TH2 =175.16°F y TC2 = 133.41°F
i xD xI xM Q Q1 │xMi - xMi+1│ f( TH 2 ) │f(TH 2 )│

0 249.50 80.50
1 249.50 80.50 165 3812270 4462500 84.50 -0.14571 0.14571
2 249.50 165.00 207.25 4296508 2244375 42.25 0.91434 0.91434
3 207.25 165.00 186.125 4055546 3353437.5 21.13 0.20937 0.20937
4 186.13 165.00 175.563 3934201 3907968.75 10.56 0.00671 0.00671
5 175.56 165.00 170.281 3873309 4185234.38 5.28 -0.07453 0.07453
6 175.56 170.28 172.922 3903773 4046601.56 2.64 -0.03530 0.03530
7 175.56 172.92 174.242 3918992 3977285.16 1.32 -0.01466 0.01466
8 175.56 174.24 174.902 3926598 3942626.95 0.66 -0.00407 0.00407
9 175.56 174.90 175.232 3930400 3925297.85 0.33 0.00130 0.00130
10 175.23 174.90 175.067 3928499 3933962.4 0.17 -0.00139 0.00139
11 175.23 175.07 175.15 3929449 3929630.13 0.08 -0.00005 0.00005
12 175.23 175.15 175.191 3929924 3927463.99 0.04 0.00063 0.00063
13 175.19 175.15 175.171 3929687 3928547.06 0.02 0.00029 0.00029
14 175.17 175.15 175.16 3929568 3929088.59 0.01 0.00012 0.00012
Página 30 de 105
Matemáticas
Ejemplo
En ingeniería eléctrica, se emplea a menudo la ley de Kirchoff para estudiar el

comportamiento de los circuitos eléctricos en estado estacionario (que no varían
con el tiempo). Otro tipo de problemas son los de corriente momentánea e implica
a los circuitos donde súbitamente suceden cambios temporales. Esta situación
ocurre cuando se cierra el interruptor de la figura. En este caso, después de cerrar
el interruptor hay un periodo de ajuste hasta que se alcanza un estado
estacionario. La longitud de este periodo de ajuste está relacionada con las
propiedades de almacenamiento de carga del capacitor y con el almacenamiento
de energía dentro del inductor. El almacenamiento de energía puede oscilar entre
estos dos elementos durante un periodo transitorio. Sin embargo, la resistencia en
el circuito disipa la magnitud de las oscilaciones.
El flujo de corriente a través de la resistencia causa una caída de voltaje (V R) dado
por:
VR = iR
en donde i es la corriente y R es la resistencia del circuito. Las unidades de i y R

son amperes y ohm respectivamente. Las unidades del V es el volt.
De manera semejante, un inductor resiste el cambio en la corriente, de forma tal

que la caída de voltaje (VL) al cruzarlo es de:
di
VL  L
dt
en donde L es la inductancia. Las unidades de L e i son henrios y amperes

respectivamente y la de t es el segundo.
La caída del voltaje a través del capacitor (VC) depende de la carga (q) sobre el
mismo.
q
VC 
C
en donde C es la capacitancia. La unidad de C es el faradio.
Página 31 de 105
Matemáticas
La segunda ley de Kirchoff indica que la suma algebraica de las caídas de voltaje
en un circuito cerrado es cero. Después de cerrar el interruptor se tiene:
di q
L  Ri   0
dt C
Sin embargo, la corriente esta dada en función de la carga como:
dq
i
dt
Por lo tanto
Esta es una ecuación diferencial ordinaria de segundo orden que se puede

resolver usando los métodos de cálculo. La solución esta dada por:
donde t = 0, q = V0C, y V0 es el voltaje de la batería. Esta ecuación describe la

variación de la carga en el capacitor en función del tiempo. La solución q(t) se
encuentra graficada en la siguiente figura.
Un típico problema en ingeniería eléctrica puede

ser que se necesita determinar la resistencia
apropiada para disipar energía a una velocidad
constante, con los valores de L y C conocidos. En
este caso se supone que la carga se debe disipar al
1% de su valor original (q/q0 = 0.01) en t = 0.05 s,
con L = 5H y C = 10-4°F.
Página 32 de 105
Matemáticas
Solución: es necesario resolver para R la ecuación anterior, usando los valores

conocidos de q, q0, l y C. Para esto emplearemos un método numérico de los aquí
vistos ya que R es una variable implícita de la ecuación. Reordenando la ecuación
y empleando el método de bisección.
o, usando los valores numéricos dados:
Un rango inicial razonable de R es de 0 a 400 (ya que 2000 – 0.01R2) debe ser
mayor de cero). Esto de acuerdo con la gráfica de la ecuación. Con veintiún
iteraciones, se obtiene R = 328.1515, con un error menor al 0.0001%.
Gráfica de la ecuación usada en la obtención de valores iniciales de R que encierran a la raíz.
De esta manera se puede especificar una resistencia con este valor en el

diagrama de la figura de la batería y esperar que la disipación sea consistente con
los requisitos del problema.
Página 33 de 105
Matemáticas
2. Sistemas de ecuaciones lineales
2.1 Sistema de ecuaciones
Un sistema de ecuaciones lineales es un conjunto de ecuaciones de la forma:
a0x + b0y + ...+ c0z.. = r0

a1x + b1y + ...+ c1z.. = r1
   
anx + bny + ...+ cnz.. = rn
donde a0 ...an , b0 ... bn ; c0 ... cn se llaman coeficientes y son números reales, r0...rn
también son números reales y se llaman términos independientes; y x, y, z las
incógnitas o variables.
Para que el sistema de ecuaciones sea lineal, debe cumplirse que ninguna de las
incógnitas esté elevada a ninguna potencia, ni entera ni fraccionaria, ni tampoco
aparezca en un denominador o como exponente o índice de una raíz. Por ejemplo,
los sistemas:
3x2+ 2y = 13
x - y2= -3
y
x + y1/3-4 z = 0,46
y
4x - +z=8 no son lineales.
z
Cada ecuación de un sistema representa, en el caso de existir dos incógnitas, la

ecuación de una recta, y en el caso de tres incógnitas, la ecuación de un plano.
Cuando el número de incógnitas es superior a tres, estamos hablando de espacios
de cuatro, cinco y más dimensiones, que son difíciles de imaginar gráficamente
pero que revisten interés teórico.
Los valores de x, y, z, y cuantas incógnitas existan se llaman conjunto solución del

sistema. También podemos llamar raíces del sistema tanto a los valores de las
incógnitas, como a la expresión literal de ellos en el caso que trabajemos con
letras y no con números. Los valores de las incógnitas no son intercambiables y
deben satisfacer individualmente a cada ecuación, con lo cual verifican todo el
sistema.
Algunas veces hay más de una solución, y entre estas soluciones deben elegirse
aquellas que vayan de acuerdo a los enunciados: por ejemplo, si el enunciado
Página 34 de 105
Matemáticas
pide que averigüemos una cierta cantidad de monedas, tendremos que descartar
entre las soluciones obtenidas aquellas que sean fraccionarias y negativas.
Por razones de convención las incógnitas se presentan ordenadas en cada

ecuación: primero x, luego y, luego z. Esta convención aparentemente arbitraria
tiene justificación cuando veamos el método de resolución por determinantes.
2.2 Clases de sistemas de ecuaciones
Podemos encontrar sistemas con tres características: compatibles determinados,

compatibles indeterminados e incompatibles.
Los sistemas compatibles determinados son aquellos que tienen solución única:
hay un solo par ordenado o conjunto solución que satisface simultáneamente a
todas las ecuaciones. Por ejemplo, el sistema:
-5x + y – z = 24
2x + 4y – 3z = 11
7x + 5y + z = 10
la segunda y tercer ecuación son equivalentes, ya que ésta última resulta de

multiplicar a la segunda por 2,5. Por lo tanto una de ellas es redundante, no aporta
información adicional por ser una combinación lineal de la otra y cualquiera de
ellas puede ser eliminada; de hecho, los métodos que veremos pronto ponen de
relieve que en caso de existir ecuaciones equivalentes estas quedan eliminadas
durante el proceso del cálculo.
Eliminemos la tercera. El sistema queda reducido a la forma:
4x + y - z = 13
4x - 2y + 6z = 42
En este sistema la cantidad de incógnitas supera a la cantidad de ecuaciones.

Supongamos que despejamos z de ambas ecuaciones:
z = 4x + y – 13
42  4x  2y
z
6
seguimos teniendo dos ecuaciones, pero igualadas a z, cuyo valor se desconoce.

Por lo tanto la cantidad de ecuaciones disponibles es insuficiente para obtener
valores definidos para las incógnitas. Por lo tanto este sistema es indeterminado.
Su resolución dependerá entonces de asignar un valor arbitrario a una de las
Página 35 de 105
Matemáticas
incógnitas y obtener para dicho valor los correspondientes a las incógnitas

restantes. Entonces, como se pueden asignar infinitos valores arbitrarios, hay
infinitas soluciones para un sistema de esa naturaleza.
Un sistema de ecuaciones puede ser compatible: esto es, cuando las ecuaciones
que lo forman se verifican necesariamente para el mismo conjunto solución. Esto
quiere decir que si reemplazamos en cada ecuación las incógnitas por sus valores
obtendremos la igualdad.
Cuando una o más ecuaciones no verifican la igualdad, se dice que el sistema es

incompatible, es decir que no hay un conjunto solución que satisfaga a todas las
ecuaciones simultáneamente. Por ejemplo este sistema:
x + y + z = 12
x + 2y + z = 19
x + y + z = 21
En este caso la incompatibilidad surge inmediatamente a la vista si observamos la

primera y la tercera ecuación: no es posible que tres valores cualquiera de x, y, z,
al ser sumados den dos totales diferentes.
2.3 Métodos de resolución
Hay cuatro métodos prácticos para la resolución de sistemas de ecuaciones

lineales, y se llaman: sustitución, igualación, reducción por suma o resta y
determinantes.
2.3.1 Método por sustitución
Consiste en despejar una de las incógnitas en una cualquiera de las ecuaciones y

reemplazar la expresión obtenida en otra ecuación del sistema:
5x + 8y = 4 (1)
4x - 3y = 22 (2)
Despejamos cualquiera de las incógnitas de (1):
4  8y 4  5x
x y
5 8
y reemplazamos el resultado en la ecuación (2):
Página 36 de 105
Matemáticas
 4  8y   4  5x 
4   3y  22 4x  3   22
 5   8 
16  32y 12  15x
 3y  22 4x   22
5 8
eliminamos los denominadores:
yyxx
y yx
94
y 188
47 x
y  2 47
x4
Verificación:
Reemplazando los valores de x e y obtenidos en las ecuaciones:
(5)(4) + 8(-2) = 4  20 - 16 = 4
(4)(4) - 3(-2) = 22 16 - (-6) = 22
vemos que el par ordenado (4;-2) es solución de la ecuación planteada.
2.3.2 Método de igualación
El método consiste en despejar la misma incógnita de ambas ecuaciones del

sistema y luego igualar las expresiones obtenidas, de modo tal de obtener una
ecuación con una sola incógnita que conjuga las dos ecuaciones originales.
Para verlo prácticamente, tomemos el sistema:
-5x + 4y = -18
2x - 3y = -4
Igualando en x Igualando en y
 4  3y  18  5x
x y
2 4
 18  4y  4  2x
x y
5 3
Página 37 de 105
Matemáticas
igualando miembro a miembro las dos expresiones en x y en y:
 4  3y  18  4y  18  5x  4  2x
 
2 5 4 3
Ahora se resuelven las ecuaciones resultantes, que son ecuaciones enteras de

primer grado con una incógnita:
5(-4 + 3y) = -2(-18 - 4y) 3(-18 + 5x) = -4(-4 - 2x)
Aplicamos propiedad distributiva de la multiplicación respecto de la suma para

eliminar los paréntesis:
-20 + 15y = 36 + 8y -54 + 15x = 16 + 8x

15y - 8y = 36 + 20 15x - 8x = 16 + 54
7y = 56 7x = 70
y=8 x = 10
Verificación: reemplazando los valores obtenidos:
(-5)(10) +(4)(8) = -18  -50 + 32 = -18

(2)(10) – (3)(8) = -4  20 - 24 = -4
vemos que se verifica la igualdad.
2.3.3 Método por reducción por suma o resta
El método se basa en la propiedad fundamental de las ecuaciones, que específica

que de cualquier ecuación se obtiene otra equivalente si se multiplican o dividen
ambos miembros por el mismo número real, distinto de cero.
Dos o más ecuaciones son equivalentes si comparten el conjunto solución. Luego

de obtener la ecuación equivalente, se busca eliminar una de las variables por
suma o resta de ambas ecuaciones entre sí. Eliminada esta incógnita resulta fácil
despejar la restante.
Consideramos el sistema de ecuaciones:
8x + 7y = 57 (1)
6x + 8y = 62 (2)
Página 38 de 105
Matemáticas
Ahora elegimos una incógnita a eliminar, y multiplicamos la primera ecuación por

el coeficiente que ésta incógnita tiene en la segunda, y la segunda ecuación, por el
coeficiente que la incógnita tiene en la primera.
Tomemos por ejemplo la x:
Coeficiente de x en (2): 6 | 8x + 7y = 57  48x + 42y = 342|

Coeficiente de x en (1): 8  | 6x + 8y = 62  48x + 64y = 496|
ahora restamos la primera de la segunda:
48x + 42y = 342

-48x + 64y = 496
-22y = -154
y=7
Ahora apliquemos el mismo método para reducir la incógnita y: vemos que los
coeficientes son 7 y 8, entonces:
Coeficiente de y en (2): 8 | 8x + 7y = 57  64x + 56y = 4
Coeficiente de y en (1): 7 | 6x + 8y = 62 42x + 56y = 4
ahora repetimos el proceso, restando ambas ecuaciones:
64x + 56y = 456

-42x + 56y = 434
-22y = -154
y=7
Verificación:


2.3.4 Determinantes de los sistemas
A cada matriz n-cuadrada A = (aij) se le asigna un escalar particular denominado

determinante de A, denotado por det (A), | A | o
Página 39 de 105
Matemáticas
Una tabla ordenada n  n de escalares situada entre dos líneas verticales, llamada
determinante de orden n, no es una matriz. La función determinante apareció por
primera vez en el estudio de los sistemas de ecuaciones lineales. Veremos que es
una herramienta indispensable en el estudio y obtención de éstas.
A. Propiedades de los determinantes
Las propiedades básicas del determinante son las siguientes:

1. El determinante de una matriz A y el de su transpuesta AT son iguales, es decir,
2. Sea A una matriz cuadrada,

- Si A posee dos filas (columnas) iguales, necesariamente = 0.
- Si A es triangular, esto es, A sólo tiene ceros por encima o por debajo de la
diagonal principal, entonces es igual al producto de los elementos de la
diagonal.
3. Supongamos que B se ha obtenido de A mediante una operación elemental
entre filas o columnas,
- Si se han intercambiado dos filas (columnas) de A, |B| = - |A|.
- Si se ha sumado un múltiplo de una fila (columna) a otra, entonces |B| = |A|.
- Si se ha multiplicado una fila (columna) de A por un escalar k, |B| = k|A|.
4. Sea A cualquier matriz n-cuadrada, son equivalentes los siguientes principios:
- A es invertible, es decir, A tiene inversa A-1.
- AX = 0 tiene solamente la solución trivial.
- El determinante de A no es nulo: |A|  0.
5. El determinante es una función multiplicativa. Es decir, el determinante del
producto de matrices A y B es el producto de los determinantes: |AB| = |A| |B|.
6. Supongamos que A y B son matrices similares, entonces: |A| = |B|.
B. Determinantes de orden uno y dos.
Los determinantes de orden uno y dos se definen como sigue:
Página 40 de 105
Matemáticas
= a11
Así, el determinante de una matriz 11A = (a11) es el propio escalar a11, es decir,
det (A) = |a11| = a11.

Ejemplos
1. Dado que el determinante de orden uno es el mismo escalar, tenemos
det (24) = 24, det(-3) = -3, det (3x+5) = 3x+5.
2.
C. Determinantes de orden tres
Consideremos una matriz 3  3 arbitraria A = (aij). El determinante de A se define

como sigue:
a12a21a33 - a32a23a11
Obsérvese que hay seis productos, cada uno formado por tres elementos de la
matriz. Tres de los productos aparecen con signo positivo (conservan su signo) y
tres con signo negativo (cambian su signo). Para calcular los determinantes de
orden tres, el siguiente diagrama puede ayudar a resolverlos:
Página 41 de 105
Matemáticas
Ejemplo:
Calcular el valor del determinante:
= 24 + 20 + 0 - (-4) - 0 - (-15) = 44 + 4 + 15 = 63
El determinante de la matriz 3  3 A = (ai j ) puede reescribirse como:
det (A) = a11(a22a33 - a23a32) - a12(a21a33 - a23a31) + a13(a21a32 - a22a31) =
que es una combinación lineal de tres determinantes de orden dos, cuyos

coeficientes (con signos alternantes) constituyen la primera fila de la matriz dada.
Esta combinación lineal puede indicarse de la forma siguiente:
Nótese que cada matriz 2  2 se obtiene suprimiendo en la matriz inicial la fila y la

columna que contienen su coeficiente.
Ejemplo:
Para demostrar que la propiedad anterior se cumple, trabajaremos con :
Página 42 de 105
Matemáticas
= 3(8+5) - 2(0-10) + 1(0+4) = 39 + 20 + 4 = 63
D. Determinante de orden arbitrario

Sea A = (ann) una matriz de orden arbitrario n  n (siendo n un número par). Para
calcular el det (A) se procede de la siguiente manera:
Los signos se van alternando según la posición que ocupen las entradas del
determinante. Es decir:
Ejemplo:
Si observamos la matriz, podemos ver que en la tercera columna hay dos ceros.
Así pues, si cogemos las entradas de la tercera columna para calcular el
determinante, nos ahorraremos calcular dos determinantes, ya que el producto de
un determinante por cero es cero.
Página 43 de 105
Matemáticas
+ = -1(-35) + 3(35) = 35 + 105 = 140.
2.4 Matrices
Las matrices se utilizan en el cálculo numérico, en la resolución de sistemas de

ecuaciones lineales, de las ecuaciones diferenciales y de las derivadas parciales.
Una matriz es una tabla ordenada de escalares ai j de la forma
La matriz anterior se denota también por (aij), i =1, ..., m, j =1, ..., n, o
simplemente por (ai j ). Los términos horizontales son las filas de la matriz y los
verticales son sus columnas. Una matriz con m filas y n columnas se denomina
matriz m por n, o matriz m  n.
Las matrices se denotarán usualmente por letras mayúsculas, A, B,..., y los

elementos de las mismas por minúsculas, a, b,...
Ejemplo:
donde sus filas son (1, -3, 4) y (0, 5, -2) y sus
2.4.1 Clases de matrices
Según el aspecto de las matrices, éstas pueden clasificarse en:
A. Matrices cuadradas
Página 44 de 105
Matemáticas
Una matriz cuadrada es la que tiene el mismo número de filas que de columnas.
Ejemplo: Sean las matrices
Donde A y B son matrices cuadradas de orden 3 y 2 respectivamente.
B. Matriz identidad
Sea A = (aij) una matriz n-cuadrada. La diagonal (o diagonal principal) de A
consiste en los elementos a11, a22,..., ann. La traza de A, escrito tr A, es la suma de
los elementos diagonales.
La matriz n-cuadrada con unos en la diagonal principal y ceros en cualquier otra

posición, denotada por I, se conoce como matriz identidad . Para cualquier matriz
A,
A· I = I ·A = A.
C. Matrices triangulares
Una matriz cuadrada A = (ai j ) es una matriz triangular superior o simplemente
una matriz triangular, si todas las entradas bajo la diagonal principal son iguales a
cero. Así pues, las matrices
son matrices triangulares superiores de órdenes 2, 3 y 4.
D. Transpuesta de una matriz

La transpuesta de una matriz A consiste en intercambiar las filas por las columnas
y se denota por AT. Así, la transpuesta de
Página 45 de 105
Matemáticas
En otras palabras, si A=(ai j ) es una matriz m n, entonces AT = es la matriz

n  m. La transposición de una matriz cumple las siguientes propiedades:
1. (A + B)T = AT + BT.
2. (AT)T = A.
3. (kA)T = kAT (si k es un escalar).
4. (AB)T = BTAT.
E. Matrices simétricas
Se dice que una matriz real es simétrica, si AT = A; y que es asimétrica, si AT = -A.
Ejemplo: Consideremos las siguientes matrices:
Podemos observar que los elementos simétricos de A son iguales, o que AT = A.

Siendo así, A es simétrica. Para B los elementos simétricos son opuestos entre sí,
de este modo B no es simétrica. A simple vista, C no es cuadrada; en
consecuencia, no es ni simétrica ni asimétrica.
F. Matrices ortogonales
Se dice que una matriz real A es ortogonal, si AAT = AT A = I. Se observa que una
matriz ortogonal A es necesariamente cuadrada e invertible, con inversa A-1 = AT.
Consideremos una matriz 3  3 arbitraria:
Si A es ortogonal, entonces:
Página 46 de 105
Matemáticas
G. Matrices normales
Una matriz es normal si conmuta con su transpuesta, esto es, si AAT = ATA.
Obviamente, si A es simétrica, asimétrica u ortogonal, es necesariamente normal.
Ejemplo:
Puesto que AAT = ATA, la matriz es normal.
2.4.2 Operaciones con matrices
A. Suma y resta de matrices

Para poder sumar o restar matrices, éstas deben tener el mismo número de filas y
de columnas. Es decir, si una matriz es de orden 3 2 y otra de 3  3, no se
pueden sumar ni restar. Esto es así ya que, tanto para la suma como para la resta,
se suman o se restan los términos que ocupan el mismo lugar en las matrices.
Ejemplo:
Para sumar o restar más de dos matrices se procede igual. No necesariamente

para poder sumar o restar matrices, éstas tienen que ser cuadradas.
Página 47 de 105
Matemáticas
Ejemplo:
B. Producto de matrices
Para poder multiplicar dos matrices, la primera debe tener el mismo número de
columnas que filas la segunda. La matriz resultante del producto quedará con el
mismo número de filas de la primera y con el mismo número de columnas de la
segunda. Es decir, si tenemos una matriz 2  3 y la multiplicamos por otra de
orden 3  5, la matriz resultante será de orden 2  5.
(2  3)  (3  5) = (2 5)
Se puede observar que el producto de matrices no cumple la propiedad

conmutativa, ya que en el ejemplo anterior, si multiplicamos la segunda por la
primera, no podríamos efectuar la operación.
3  5 por 2  3
puesto que la primera matriz no tiene el mismo número de columnas que filas la
segunda. Supongamos que A = (aij) y B = (bij) son matrices tales que el número
de columnas de A coincide con el número de filas de B; es decir, A es una matriz
m  p y B una matriz p  n. Entonces el producto AB es la matriz m  n cuya
entrada ij se obtiene multiplicando la fila i de A por la columna j de B. Esto es,
Página 48 de 105
Matemáticas
Ejemplo:
1.
2.
C. Producto por un escalar

El producto de un escalar k por la matriz A, escrito k·A o simplemente kA, es la
matriz obtenida multiplicando cada entrada de A por k:
Ejemplo:
Entonces:
C. División de matrices
La división de matrices se define como el producto del numerador multiplicado por
la matriz inversa del denominador. Es decir, sean las matrices A y B tal que A/B=
AB-1:
Si una matriz está dividida entre un escalar, todos los términos de la matriz
quedarán divididos por ese escalar.
Ejemplo:
Página 49 de 105
Matemáticas
D. Matrices invertibles
Se dice que una matriz cuadrada A es invertible, si existe una matriz B con la
propiedad de que AB = BA = I siendo I la matriz identidad. Denominamos a la
matriz B la inversa de A y la denotamos por A-1.
Ejemplo:
Puesto que AB = BA = I, A y B son invertibles, siendo cada una la inversa de la

otra.
Método de Gauss: Sea A = (aij) una matriz cuadrada de orden n. Para calcular la
matriz inversa de A, que denotaremos como A-1, seguiremos los siguientes pasos:
Paso 1. Construir la matriz n 2n M = (A I) esto es, A está en la mitad izquierda

de M y la matriz identidad I en la derecha.
Paso 2. Se deja tal y como está la primera fila de M, y debajo del primer término
de la diagonal principal, a11, que llamaremos pivote, ponemos ceros. Luego se
opera como se indica en el siguiente ejemplo.
Ejemplo: Consideremos una matriz 3  3 arbitraria
Paso 1.
Página 50 de 105
Matemáticas
Paso 2.
El siguiente paso es igual que el anterior, pero esta vez se toma como pivote el
segundo término de la diagonal principal. Al llegar al último término de la diagonal,
se procede igual que antes, pero poniendo los ceros encima del nuevo pivote. Se
observa que al tomar como pivote el último término de la diagonal, la matriz A se
transforma en una matriz triangular.
Una vez realizados todos los pasos, la mitad izquierda de la matriz M se convierte
en una matriz diagonal. En este momento hay que proceder a transformar, si es
que no lo está, la mitad izquierda en la matriz identidad, dividiendo si fuera
necesario las filas de M por un escalar.
Ejemplo:
Supongamos que queremos encontrar la inversa de
Primero construimos la matriz M = (A I),
luego tomamos como pivote a22 = -1,
Página 51 de 105
Matemáticas
La mitad izquierda de M está en forma triangular, por consiguiente, A es invertible.

Si hubiera quedado toda una fila con ceros en la mitad A de M, la operación habría
terminado (A no es invertible). A continuación, tomamos como pivote a33,
ponemos ceros encima de éste y seguimos operando hasta que nos quede una
matriz diagonal.
Ya que la matriz colocada en la mitad izquierda es diagonal, no hay que operar

más. Transformamos la matriz diagonal en una matriz identidad; para ello hay que
dividir la segunda fila entre -1:
La matriz que ha quedado en la mitad derecha de M es precisamente la matriz

inversa de A:
Para comprobar si el resultado es correcto, se procede a multiplicar AA-1, teniendo

que dar como resultado la matriz identidad I.
Comprobación:
AA-1 = I
Página 52 de 105
Matemáticas
Ejemplo
El ejercicio siguiente es un ejemplo que muestra la aplicación de matrices
Para el circuito eléctrico de la figura
su modelo matemático en forma matricial es:
 10  5 0   I 1  30
 5 13 6   I    0 
  2   
 0 6 10  I 3  V2 
Si se sabe que I1 + I2 + I3 = 0, obtenga los valores de I1, I2, I3 y V2
Ejemplo
Con los datos del diagrama siguiente (donde los porcentajes estan dados en
peso), encuentre los valores de las corrientes de M1, M2, M3 y M4.
83% etanol
M1 58% etanol
17% agua Tanque de M4 21% etanol
61% etanol 21% agua
M2 mezclado
39% agua
24% metanol
M3 55% etanol
21% agua
Página 53 de 105
Matemáticas
La resolución de estos ejemplos de aplicación se realizarán en clase
2.5 Independencia lineal
Una expresión de la forma a x  a x    an xn

11 2 2
donde a1, a2,..., an son números reales y x1, x2,..., xn son vectores de m elementos
cada uno, se llama combinación lineal de los vectores x1, x2,..., xn.
A menudo los elementos de un vector xi de una combinación lineal, tendrá dos

subíndices; el primero indica la fila al que pertenece y el segundo se refiere al
vector a que corresponde, como se indica
x 
 1i 
x 
x   2i 
i 
 
x 
 mi 
 T
Se dice que un vector x  x x  xm , depende linealmente de un conjunto
1 2
de vectores de m elementos x1, x2,..., xn, si se pueden encontrar escalares a1,
a2,..., an, tales que cumpla la siguiente ecuación vectorial
x  a x  a x    a n xn
11 2 2
Si, por el contrario, no existen escalares que satisfagan tal ecuación, x es un

vector linealmente independiente de x1, x2,..., xn si y solo si x es una combinación
lineal de x1, x2,..., xn.
2.5.1 Independencia de conjuntos de vectores
Un conjunto de vectores dado y1, y2,..., yn, es linealmente dependiente si por lo

menos uno de ellos es combinación lineal de alguno o todos los vectores
restantes. Si ninguno lo es, se dice que es un conjunto linealmente independiente.
Ejemplo
Sea el siguiente conjunto de cuatro vectores de tres elementos cada uno.
Página 54 de 105
Matemáticas
1  0.1  0.5   0.03 

       
y   4 , y   3, y   15, y   0.9,
1 2 3 4
 2 0  0   0 
       
Determine si es linealmente dependiente o independiente.
Solución
Este conjunto es linealmente dependiente, ya que y3 se obtiene de la

combinación,
0.1
 
y3 = 5 y y  5 3,
2
0
 
y y4 se obtiene de combinar y1 y y2 de la siguiente forma
 0.03  1  0.1
     
 0.9  04  0.3 3
 0   2 0
     
Si se considera el conjunto formado sólo por y1 y y2, se tiene que es linealmente

independiente, ya que ninguno se obtiene multiplicando al otro por algún escalar.
Cualquier conjunto que tenga el vector cero (vector cuyos componente son todos
cero), como uno de sus elementos, es linealmente independiente, ya que dicho
vector podrá obtenerse siempre de cualquier otro vector del conjunto por la
combinación
0  x 
   1i 
0 x 
0     0 2i 
 
   
0 x 
 ni 
Un conjunto formado por un solo vector (distinto de cero) es linealmente

independiente.
Página 55 de 105
Matemáticas
2.5.2 Interpretación geométrica de la independencia lineal.
Resulta conveniente el estudio de la independencia lineal desde el punto de vista

geométrico, aunque esto solo sea valido para vectores de dos y tres componentes.
Consideremos los siguientes tres vectores en el plano x-y (fig. A). Por la geometría
se sabe que dos vectores que se cortan forman un plano. Por tanto, es natural
pensar que si se tiene un tercer vector en el plano x-y, éste puede obtenerse de
alguna combinación de los que cortan, por ejemplo de x3, x1 y x2, aplicando la ley
del paralelogramo.
Si, por otro lado, se tienen dos vectores de dos componentes linealmente
dependientes, esto se manifiesta geométricamente como paralelismo (vea los
vectores x1 y x2 de las figuras de abajo). Puede verse que estos vectores paralelos
no forman un plano y un tercer vector x3 que no sea paralelo a ellos no puede
generarse con una combinación lineal de x1 y x2.
En conclusión, la característica geométrica de dos vectores linealmente
independientes es que se cortan en un punto. En cambio, dos vectores
linealmente dependientes son paralelos.
Página 56 de 105
Matemáticas
3 Estadística descriptiva
En la actualidad la estadística ha llegado a ser un instrumento de uso cotidiano
para todos los profesionistas que están en contacto con fenómenos de naturaleza
aleatoria, y que a partir de ciertos datos cuantitativos del fenómeno, deben tonar
decisiones sobre su comportamiento general.
Para su estudio la estadística se divide en: estadística descriptiva e inferencia

estadística.
Estadística Descriptiva: Es la parte de la Estadística que se ocupa de recopilar,

representar y condensar los datos obtenidos del sistema en estudio.
Estadística Inferencial: Es la parte de la Estadística dedicada a la formulación de

su-puestos y estimaciones, para hacer predicciones y poder sacar conclusiones de
los datos obtenidos con el estudio de las muestras. Y así, poder tomar decisiones
con base científica.
En este apartado se estudiaría la estadística descriptiva.
Para el estudio de la estadística descriptiva, se requiere definir los siguientes

conceptos:
3.1 Población
Es el conjunto de todas las muestras posibles, que pueden obtenerse del sistema
en estudio de acuerdo al método de selección empleado.
3.2 Muestra
Es un conjunto de datos obtenidos de una población cualquiera, con el método de

recopilación elegido. Se la puede imaginar como un subconjunto del conjunto
población.
Para obtener una muestra representativa, existen diferentes técnicas, entre las
cuales se encuentran las siguientes.
- Muestreo aleatorio: es recomendable cuando la población es suficientemente

pequeña, como para ser enumerada.
- Muestreo sistemático: tiene la limitación de no poderse aplicar a poblaciones
demasiado grandes, ni tampoco los datos presentan periodicidad.
- Muestreo estratificado: en esta técnica, la población se divide en clases o
estratos para hacer posteriormente una selección que puede ser aleatoria o
Página 57 de 105
Matemáticas
sistemática dentro de cada estrato. la definición de cada clase debe ser

suficientemente clara para evitar que uno de los elementos se pueda ubicar en
dos clases diferentes.
- Muestreo por conglomerados: es semejante al anterior, en el sentido de definir
grupos de elementos; sin embargo, esta técnica se aplica cuando la población
es homogénea y existen grupos ya definidos.
3.2.1 Clasificación y organización
Cuando los datos de una muestra se encuentran desordenados es difícil obtener

información directamente de ellos. Una forma de ordenarlos es de forma
ascendente o descendente, sobretodo cuando la muestra es pequeña. Sin
embargo, cunado se trata de una muestra grande, el procedimiento anterior se
hace muy laborioso.
Con un ejemplo se presentará el procedimiento que generalmente se utiliza para

presentar los datos de una muestra grande en forma resumida y ordenada.
Ejemplo
Los siguientes datos representan la longitud en centímetros de 80 piezas de

madera que fueron seleccionadas en una bodega. Se requiere presentar los datos
en una forma resumida y ordenada.
Primero, calculamos el rango de la muestra que se define como la diferencia entre

el mayor y el menor de los elementos. Así, para los datos anteriores:
rango = 53.1 – 49.1 = 4
Página 58 de 105
Matemáticas
Para ordenar los ochenta datos de la muestra, se clasifican en varios intervalos,

denominados intervalos de clase.
La fijación de los intervalos de clase depende del criterio del analista, aunque debe
de tomar en cuenta lo siguiente:
El número de intervalos que se pueden establecer depende de la cantidad de
datos que contiene la muestra (tamaño de la muestra) y de la dispersión de los
mismos.
En general se recomienda establecer entre 5 y 15 intervalos, procurando que no

queden intervalos vacíos dentro del rango de valores.
También debe tenerse cuidado e la fijación de los límites de cada intervalo para
evitar, por un lado, la posibilidad de que un mismo elemento pertenezca a dos
intervalos diferentes y, por otro, que la magnitud de los intervalos difícil de
manejar.
S los datos comprendidos en un intervalo se distribuyen de manera uniforme, se

considera que el punto medio del intervalo puede representar a todos los valores
de la muestra que se encuentra en el. A dicho punto se le denomina marca de
clase.
En la dos primeras columnas de la siguiente tabla, se muestran los intervalos y

marcas de clase (tr) de la muestra que se esta ordenando.
Al número de elementos de la muestra que pertenece a un intervalo de clase r se

le llama frecuencia del intervalo y se representa como fr. La suma de las
frecuencias deberá ser igual al número total de elementos de la muestra de
tamaño n, o sea:
Página 59 de 105
Matemáticas
donde m es el número de intervalos de clase para el ejemplo m = 5).
Al cociente de la frecuencia entre el número total de datos muéstrales se le llama

frecuencia relativa y se representa como f r esto es:
La frecuencia relativa de un intervalo de clase se puede interpretar como la

proporción de los datos que se encuentran en el intervalo correspondiente.
Finalmente, se define la frecuencia relativa acumulada Fr como la suma de las

frecuencias relativas hasta el r-ésimo intervalo, con lo cual:
r
Fr   f 
j1 j
En la tabla de arriba se presenta la muestra en forma agrupada y en ella se

encuentran los resultados de los conceptos definidos anteriormente.
3.2.2 Distribuciones empíricas.
Para determinar la distribución de probabilidad de una variable aleatoria que

representa un fenómeno en el modelo probabilístico teórico más aproximado a
ella, es útil construir la gráfica de las frecuencias, frecuencias relativas o
frecuencias relativas acumuladas.
Para representar las frecuencias o las frecuencias relativas se usa generalmente

el histograma, la frecuencia se considera constante en todos los puntos de cada
intervalo de clase, por lo que se representa como una sucesión de rectángulos del
mismo ancho y cuyas alturas corresponden a las frecuencias o a las frecuencias
relativas acumuladas de los intervalos correspondientes.
La figura representa el histograma del ejemplo que se está analizando.
Página 60 de 105
Matemáticas
El polígono de frecuencia es otra gráfica que muestra la distribución de

frecuencias. Para construirlas se marca sobre el mismo sistema de ejes del
histograma una sucesión de puntos, cuya abscisas son las marcas de clase y las
ordenadas son las frecuencias o frecuencias relativas correspondientes. Después
se unen mediante rectas todos los puntos consecutivos. Para cerrar el polígono de
frecuencias en los extremos, se consideran otros intervalos con frecuencia cero.
El polígono de frecuencias del ejemplo se muestra en la siguiente figura.
Otra gráfica de uso frecuente para estimar la distribución de probabilidad de la

variable aleatoria es el polígono de frecuencias relativas acumuladas u ojiva.
La forma de graficarlo consiste en unir, mediante rectas, una sucesión de puntos
cuyas abscisas son los límites superiores de cada intervalo de clase y las
ordenadas son las frecuencias relativas acumuladas.
Página 61 de 105
Matemáticas
En la figura se muestra el polígono de frecuencias relativas acumuladas que

corresponde al ejemplo que se esta trabajando.
F
i
3.2.3 Medidas descriptivas de una distribución de frecuencias.
Todas las medidas descriptivas que se definen a continuación para una

distribución de frecuencias se pueden definir también de manera semejante para
una distribución de probabilidad.
Las medidas descriptivas de de una distribución de frecuencias se utiliza para

estimar los parámetros correspondientes que describen a la población, debido a
que si la muestra es representativa, sus características son semejantes a las de la
población.
Generalmente se utilizan cuatro tipos de medidas descriptivas que son:
A. De tendencia central
B. De dispersión
C. De sesgo o asimetría
D. De curtosis o apuntamiento
A. Medidas de tendencia central
Con estas medidas se busca un valor que pueda representar a toda la muestra,
por encontrarse en el centro de ella, desde diferentes puntos de vista Las más
importantes medidas de tendencia central son las siguientes:
Página 62 de 105
Matemáticas
1. Media ( X )
Se define como el promedio aritmético de los datos de una muestra. Para

diferenciarla de la media de la población re representa con X en lugar de x, de
esta forma:
donde xi es el i-ésimo elemento de la muestra.
Si los datos de la muestra están agrupados en una tabla de frecuencias, se

considera que la marca de clase (tr) representa a los valores xi que se encuentran
dentro del intervalo r-ésimo, de manera que la suma de todos os valores xi que se
encuentran en un intervalo de clase, equivale a sumar f r veces tr , con lo cual la
anterior expresión se escribe como:
donde m es el número de intervalos de clase.
Para simplificar la expresión se puede tomar en cuenta que la frecuencia relativa:
entonces
La media de los datos del problema estudiado en este apartado es.
2. Mediana (Me)
La mediana es el valor central de la variable, es decir, supuesta la muestra

ordenada en orden creciente o decreciente, el valor que divide en dos partes la
muestra.
Página 63 de 105
Matemáticas
cuando la muestra es grande y sus elementos se encuentran agrupados, la

mediana puede obtenerse determinando primero el intervalos que contiene a la
mediana el cual se distinge porque es el primero que tiene una frecuencia relativa
a cumulada mayor o igual a 0.5 y posteriormente, mediante una interpolación
lineal se encuentra el valor de x que corresponde a la frecuencia relativa a
cumulada de 0.5.
Con el polígono de frecuencia relativa a cumulada se puede aproximar el valor de

la mediana, trazando una linea horizontal que parte de F´= 0.5 hasta cruzar el
poligono y, posteriormente, con otra recta vertical que parte del punto de la
intersección, se encuentra, en el eje de las absisas, el valor de la mediana.
La figura muestra la localización gráfica de la mediana sobre un polígono de

frecuencia relativa a cumulada.
Para hacer la interpolación lineal, se usa la ecuación de una recta, de la forma:
que en este caso, de acuerdo con la figura de arriba:
donde:
Página 64 de 105
Matemáticas
Sustituyendo los valores:
Despejando la mediana:
Así para nuestro ejemplo la mediana es
3. Moda
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que

más se repite, es la única medida de centralización que tiene sentido estudiar en
una variable cualitativa, pues no precisa la realización de ningún cálculo.
Por su propia definición, la moda no es única, pues puede haber dos o más
valores de la variable que tengan la misma frecuencia siendo esta máxima. En
cuyo caso tendremos una distribución bimodal o polimodal según el caso.
Cuando la muestra es pequeña, la moda se determina directamente por

inspección, mientras que en muestras grandes, con datos agrupados, se puede
aproximar con la marca de clase del intervalo modal, que es el que tiene la
máxima frecuencia.
Página 65 de 105
Matemáticas
De acuerdo con esto, se puede considerar que la moda debe pertenecer al

intervalo de clase con máxima frecuencia, pero proporcionalmente más cercano al
intervalo adyacente que le siga en frecuencia, de esta manera se puede plantear
la proporción:
donde:
despejando la moda
B. Medidas de dispersión
Las medidas de dispersión reflejan la separación o alejamiento de los elementos

de una muestra.
1. Rango
Se define como una medida de dispersión, puesto que indica la máxima
separación entre los datos.
2. Variancia
De una variable aleatoria se define como el segundo momento con respecto a la
media. De tal manera, para una distribución de frecuencias se define el momento
k-ésimo con respecto a la media como:
Y en consecuencia, la variancia muestral se define como:
Página 66 de 105
Matemáticas
Adicionalmente; si los datos están agrupados, cada marca de clase representa a

los valores que se encuentran dentro del intervalo correspondiente, con lo cual:
donde:
n = al tamaño de la muestra,
m = al número de intervalos de clase,
fr = a la frecuencia del intervalo r y
tr = a la marca de clase del intervalo r.
fr
como la frecuencia relativa fr '  , entonces:
n
La desviación estándar es otra medida de dispersión que para una distribución

de frecuencias, como en una distribución de probabilidad, es la raíz cuadrada de la
variancia:
y cuando los datos están agrupados:
3. Coeficiente de variación
Para una distribución de frecuencias), se define como el cociente de la desviación

estándar muestral entre la media muestral, esto es:
Para ilustrar este concepto tomemos el siguiente ejemplo.
Página 67 de 105
Matemáticas
La producción de mineral de fierro en siete países durante 1980, fue la siguiente:
1, 9, 7, 0, 5, 8, 7, 7, 5, 9, 16 (miles de toneladas)
Obtener
a) la media
b) la desviación estándar
c) El coeficiente de variación
a)
b)
c)
C. Medidas de asimetría
Se utilizan cuando se desea ajustar un modelo probabilístico a un fenómeno

particular. Es decir, es conveniente comparar la forma del histograma o polígono
de frecuencias de una muestra del fenómeno, con la de la función de probabilidad
del modelo teórico.
Para describir la forma de la distribución de frecuencias de una muestra, se usa,

entre otros indicadores, la asimetría o sesgo. Una distribución de frecuencias es
simétrica si el tercer momento de la muestra con respecto a la media es igual a
cero (m3 = 0). Así si una distribución de frecuencias es simétrica, la media, la
mediana y la moda coinciden en el mismo punto, ver (a). Sin embargo, cuando la
figura no es simétrica se puede presentar una asimetría positiva, siendo m 3 > 0; o
bien una asimetría negativa donde m3 < 0.
Página 68 de 105
Matemáticas
Para medir en forma adimensional la asimetría de una distribución de frecuencias,

se utiliza el coeficiente de simetría por momentos (a3):
Si los datos están agrupados, se pueden aproximar los momentos con respecto a
la media:
Página 69 de 105
Matemáticas
Otra forma de medir la asimetría es mediante el coeficiente de Pearson (s),

teniendo la desventaja de que sólo aplica cuando la distribución es unimodal y se
puede demostrar que –1< s < 1.
Curtosis es otra característica que permite describir la forma de la distribución de

frecuencias.
Para medir la curtosis se puede usar el cuarto momento con respecto a la media
(m4). Así se define el coeficiente de curtosis como:
Sea el ejemplo de la tabla siguiente
Página 70 de 105
Matemáticas
a) Determine el coeficiente de asimetría
b) El coeficiente de curtosis
3.3 Correlación
Parte de la estadística corresponde a la estadística inferencial y dentro de ella los

capítulos de correlación y regresión son muy usados en la investigación científica,
una herramienta muy útil cuando se trata de relacionar 2 o más variables,
relacionadas entre si. La correlación implica el grado de dependencia de una
variable respecto a otra y la regresión es otra técnica que ayuda en la
investigación.
La regresión como una técnica estadística, una de ellas la regresión lineal simple y
la regresión multifactorial, analiza la relación de dos o mas variables continuas,
cuando analiza las dos variables a esta se el conoce como variable bivariantes
que pueden corresponder a variables cualitativas, la regresión nos permite el
cambio en una de las variables llamadas respuesta y que corresponde a otra
conocida como variable explicativa, la regresión es una técnica utilizada para
inferir datos a partir de otros y hallar una respuesta de lo que puede suceder.
Siendo así la regresión una técnica estadística, por lo tanto para interpretar
situaciones reales, pero a veces se manipula de mala manera por lo que es
necesario realizar una selección adecuada de las variables que van a construir las
formulas matemática, que representen a la regresión, por eso hay que tomar en
cuenta variables que tiene relación.
Se pueden encontrar varios tipos de regresión, por ejemplo:
1. Regresión lineal simple

2. Regresión múltiple ( varias variables)
3. Regresión logística
a. Simple ó múltiple, etc.
La regresión lineal técnica que usa variables aleatorias, continuas se diferencia del
otro método analítico que es la correlación, por que esta última no distingue entre
Página 71 de 105
Matemáticas
las variables respuesta y la variable explicativa por que las trata en forma
simétrica.
La matematización nos da ecuaciones para manipular los datos, como por ejemplo
medir la circunferencia de los niños y niñas y que parece incrementarse entre las
edades de 2 meses y 18 años, aquí podemos inferir o predecir que las
circunferencias del cráneo cambiara con la edad, en este ejercicio la
circunferencia de la cabeza es la respuesta y la edad la variable explicativa.
En la regresión tenemos ecuaciones que nos representan las diferentes clases de

regresión:
Regresión Lineal: y = A + Bx
Regresión Logarítmica: y = A + BLn(x)
Regresión Exponencial: y = Ac(bx)
Regresión Cuadrática: y = A + Bx +Cx2
Página 72 de 105
Matemáticas
3.3.1 Coeficiente de correlación.
Para obtener un modelo de regresión es suficiente establecer la regresión para

eso se hace uso del coeficiente de correlación: R.
R = Coeficiente de correlación, este método mide el grado de relación existente

entre dos variables, el valor de R varía de -1 a 1, pero en la práctica se traba con
un valor absoluto de R.
El valor del coeficiente de relación se interpreta de modo que a media que R se

aproxima a 1, es más grande la relación entre los datos, por lo tanto R (coeficiente
de correlación) mide la aproximación entre las variables.
El coeficiente de correlación se puede clasificar de la siguiente manera:
Valores del coeficiente de correlación
1) Perfecta R = 1
2) Excelente R = 0.9 < = R < 1
3) Buena R = 0.8 < = R < 0.9
4) Regular 4) R = 0.5 < = R < 0.8
5) Mala 5) R < 0.5
3.3.2 Distribución divariante
La distribución diváriate es cuando se estudia en una población dos variables, que

forman pares correspondientes a cada individuo, como por Ejemplo:
Las notas de 10 alumnos en termodinámica y matemáticas
Termodinámica 2 4 5 5 6 6 7 7 8 9
Matemáticas 2 2 5 5 5 7 5 8 7 10
Los pares de valores son: (2, 2) (4,2) (5,5)…….(8,7) (9,10) forman una distribución
diváriate.
La correlación, método por el cual se relacionan dos variables se pude graficar con
un diagrama de dispersión de puntos, a la cual muchos autores le llaman nubes de
puntos, encuadrado dentro de un gráfico de coordenadas x-y en la cual se pude
trazar una recta y cuyos puntos mas cercanos de una recta hablaran de una
correlación mas fuerte, ha esta recta se le denomina recta de regresión, que
puede ser positiva o negativa, la primera contundencia a aumentar y la segunda
en descenso o decreciente.
Página 73 de 105
Matemáticas
También se puede describir un diagrama de dispersión en coordenadas

cartesianas valores como en la distribución diváriate, en donde la nube de puntos
representa los pares de valores.
Gráficos de recta de regresión
Por último se pueden graficar las líneas de tendencia, herramienta muy útil para
el mercadeo por que es utilizada para evaluar la resistencia que proyectan los
precios. Cuando una línea de tendencia central se rompe ya sea con tendencia al
alza o en la baja es porque ocurre un cambio en los precios, por lo tanto las líneas
de tendencia pueden ser alcista cuando se unen los puntos sucesivos y bajista
cuando se unen los puntos máximos.
También existen gráficos que representan la dispersión de datos dentro de las

coordenadas cartesianas, ósea las nubes de puntos y que pueden darse según la
relación que representa, que puede ser lineal, exponencial y sin relación, esta
última cuando los puntos están dispersos en todo el cuadro sin agruparse lo cual
sugiere que no hay relación.
Los gráficos siguientes nos muestran esta relación:
Página 74 de 105
Matemáticas
Matemáticamente las ecuaciones serían:
Ajuste Lineal: Y = Bx + A
Ajuste Logarítmico: Y =BLnX + A
Ajuste Exponencial: Y = AC BX
En el modelo de regresión lineal simple se utiliza la técnica de estimación de los

mínimos cuadrados, este modelo tiene solo una variable de predicción y se
supone una ecuación de regresión lineal.
3.3.3 Regresión lineal simple.
Tiene como objeto estudiar cómo los cambios en una variable, no aleatoria,
afectan a una variable aleatoria, en el caso de existir una relación funcional entre
ambas variables que puede ser establecida por una expresión lineal, es decir, su
representación gráfica es una línea recta. Cuando la relación lineal concierne al
valor medio o esperado de la variable aleatoria, estamos ante un modelo de
regresión lineal simple. La respuesta aleatoria al valor x de la variable controlada
se designa por Yx y, según lo establecido, se tendrá
De manera equivalente, otra formulación del modelo de regresión lineal simple

sería: si xi es un valor de la variable predictora e Yi la variable respuesta que le
corresponde, entonces
Ei es el error o desviación aleatoria de Yi .
Página 75 de 105
Matemáticas
Estimación de los parámetros de la recta de regresión. El primer problema a

abordar es obtener los estimadores de los parámetros de la recta de regresión,
partiendo de una muestra de tamaño n, es decir, n pares (x1, Y1) , (x2, Y2), ..., (xn,
Yn); que representan nuestra intención de extraer para cada xi un individuo de la
población o variable Yi .
Una vez realizada la muestra, se dispondrá de n pares de valores o puntos del

plano (x1, y1), (x2, y2), ..., (xn, yn). El método de estimación aplicable en regresión,
denominado de los mínimos cuadrados, permite esencialmente determinar la recta
que "mejor" se ajuste o mejor se adapte a la nube de n puntos. Las estimaciones
de los parámetros de la recta de regresión obtenidas con este procedimiento son:
Por tanto la recta de regresión estimada será:
Estimación de los coeficientes de regresión por mínimos cuadrados. La

muestra de tamaño n: (x1, Y1) , (x2, Y2), ..., (xn, Yn), determinaría n pares de
observaciones (x1, y1), (x2, y2), ..., (xn, yn), que permiten definir los residuales o
residuos, respecto de la recta de regresión estimada:
Los residuos miden de alguna forma la cantidad que la regresión no es capaz de

explicar.
El método de estimación de los mínimos cuadrados establece los valores de los

parámetros de la recta de regresión muestral que minimizan SSE, la suma de
cuadrados de los residuos:
Página 76 de 105
Matemáticas
Igualando a cero las derivadas parciales de SSE respecto de los dos parámetros
de la recta de regresión y resolviendo el correspondiente sistema de dos
ecuaciones se obtendrían:
4. Variables aleatorias
La variable aleatoria es usada para describir eventos y una función de distribución
acumulativa será usada para determinar las probabilidades de cierto evento
definido en términos de variables aleatorias.
La ventaja de manejar variables aleatorias en lugar de los eventos de un espacio

muestral, se hace evidente cuando el resultado del experimento es cualitativo.
Se define como una función real que asocia un elemento numérico con cada uno
de los eventos elementales del espacio muestral. Al término variable aleatoria
también se le conoce como variable posible, cantidad incierta o variable
estocástica.
S R
X
A
x
En la figura anterior se observa la tranformación X: S  R, donde al punto muestral

A se le asigna el número x. La naturaleza del experimento no representa ningún
problema para asignar valores numéricos a los elementos del espacio muestral;
por ejemplo:
Si un experimento consiste en observar en un día, si llueve o no, se puede hacer

la asignación:
Página 77 de 105
Matemáticas
S = {no llueve, llueve}  X {0,1}
Mediante la variable aleatoria X se asigna el número uno al evento llueve y el cero

al evento no llueve; sin embargo, ésta no es la única forma de hacer la asignación
y se podría asignar también los número {-1,1} respectivamente.
Cuando el resultado del experimento aleatorio es un número, generalmente se le

asigna ese mismo valor. Por ejemplo, en un experimento que consiste en observar
la temperatura de una máquina de combustión interna, la variable aleatoria X
puede tomar los mismo valores (x) observados en el termómetro, es decir X = x.
4.1 Variable aleatoria discreta
El evento de estudio en una encuesta con respecto a la preferencia de los

votantes no es la gente en particular de la muestra, ni el orden en el cual se
obtuvieron las preferencias, sino el número de votantes en favor de cierto
candidato o resultado. Este evento da lugar a una variable aleatoria, el número de
votantes de la muestra a favor de cierto candidato o resultado, que solamente
puede tomar un número finito de valores con una probabilidad diferente de cero.
Es decir, el valor observado de la variable aleatoria de interés tiene que ser un
número entero entre cero y el tamaño de la muestra. Una variable aleatoria de
este tipo se dice que es discreta.
“Una variable aleatoria X se dice discreta si solamente puede tomar un conjunto

numerable de valores”.
Para mejor entendimiento los valores de las variables aleatorias discretas son los
que provienen de conteos:
 Número de hombres en un estado determinado

 Número de mujeres con un nivel mayor de estudios al de su pareja
 La demanda mensual de automóviles en una distribuidora
 El número de personas que visita anualmente una localidad
En estos ejemplos no tiene sentido hablar de resultados fraccionarios y por

consiguientes sólo se definen para valores enteros de x.
Ejemplo.
Se lanza una moneda dos veces de tal forma que el espacio muestral es J = {CC,
CS, SC, SS}. Representándose por X el número de caras que pueden resultar.
Con cada punto muestral podemos asociar un número para X como se muestra en
Página 78 de 105
Matemáticas
la siguiente tabla. Así en el caso de CC (dos caras) X = 2 y para SC (una cara) X

= 1. X es la variable aleatoria.
Punto muestral CC CS SC SS
X 2 1 1 0
Es importante mencionar que también podrían definirse otras variables aleatorias

en este espacio muestral, por ejemplo el número de soles, el cuadrado del número
de caras, el número de caras mayores a 0, etc.
4.1.1 Función de probabilidad de una variable aleatoria discreta
El comportamiento de una variable aleatoria discreta X puede estudiarse a través

de su función de probabilidad, la cual relaciona los resultados de un experimento
aleatorio con su probabilidad de ocurrencia y se denota P X (x), P(X=x) o P(x) y se
interpreta como la probabilidad de que la variable aleatoria X tome el valor
particular x.
Sea X una variable aleatoria discreta y supóngase que los valores posibles que
puede tomar están dados por x1, x2, x3,….., ordenadas en orden creciente de
magnitud. Supóngase también que los valores se asumen con probabilidades
dadas por
P(X=xk) = f(xk) k = 1,2,………..
Para x = xk , f(x) = 0
En general f(x) es una función de probabilidad si
1. f(x) ≥ 0
2. ∑ f(x) = 1
x
Ejemplo.
Hallar la función de probabilidad correspondiente a la variable aleatoria X del

ejemplo anterior y construir la gráfica de probabilidad.
a) Suponiendo que la moneda no está cargada de uno de sus lados
P(CC) = ¼ P(CS)= ¼ P(SC)= ¼ P(SS)= ¼
Página 79 de 105
Matemáticas
P(X=0) = P(SS) = ¼
Que en una de las tiradas de los dados NO salga cara
P(X=1) = P(CS U SC) = P(CS) + P(SC) = ¼ + ¼ = ½

Que en una de las tiradas de los dados salga una cara
P(X=2) = P(CC) = ¼
Que en una de las tiradas de los dados salgan dos cara
La función de probabilidad está dada en la siguiente tabla
x 0 1 2
f(x) 1/4 1/2 1/4
b) La gráfica de probabilidad puede representarse como se indica en la figura

o por un histograma
4.1.2 Función de distribución de una variable aleatoria discreta
La función de distribución acumulada, o simplemente la función de distribución

para una variable aleatoria X se define por
P( X  x)  F ( x)
Donde x es cualquier número real, es decir -  < x < . La función de distribución
puede obtenerse de la función de probabilidad notando que
F ( x)  P( X  x)   f (u )
u x
Donde la suma a la derecha se toma para todos los valores de u para los cuales u
x. Así la función de probabilidad puede obtenerse de distribución.
Página 80 de 105
Matemáticas
Si X únicamente toma un número finito de valores x1, x2,….xn entonces la función

de distribución será
0 -< x < x1
f(x1) x1  x < x2
f(x1)+f(x2) x2  x < x3
F(x) = . .
. .
. .
f(x1)+….+f(xn) xn  x < 
Ejemplo.
Hallar la función de distribución para la variable aleatoria X del ejemplo anterior y

la representación gráfica.
0 -< x < 0
F(x) = ¼ 0x<1
¾ 1x<2
1 2x<
4.2 Variable aleatoria continua y su función de densidad
Una variable aleatoria es continua si su dominio de definición es el conjunto de los

números reales; es decir, cuando la variable puede tomar cualquier valor dentro de
cierto intervalo.
Este tipo de variables se presenta con más frecuencia en los sistemas físicos que
las variables discretas, debido a que la masa, el calor, el volumen, el tiempo y
otras características, pueden tomar cualquier nivel, dentro de una escala continua.
Página 81 de 105
Matemáticas
Una variable aleatoria continua puede tomar una infinidad de valores en un

pequeño intervalo; en consecuencia la probabilidad de que Y tome un valor
particular es prácticamente cero y para estudiar el comportamiento de la variable
se debe hablar de subintervalos, dentro de los cuales puede encontrarse el valor
de X.
Una variable aleatoria como la cantidad de lluvia diaria implica que cada intervalo
de números reales positivos tiene una probabilidad positiva de incluir un valor
observado. De esta manera si X, la variable aleatoria correspondiente a la
cantidad de lluvia diaria, tiene una función de densidad F(x). La densidad de
probabilidad es un concepto que indica cuáles son los subintervalos con mayor o
menor probabilidad, sin proporcionarla directamente.
La función de densidad de probabilidad denotada por f(x) se define de tal manera

que la probabilidad del evento (x1 ≤ X  x2) es igual a la integral definida de f(x) en
el intervalo [x1, x2]
x2
P(x1 ≤ X  x2) =  f ( x)dx

x1
Por la interpretación geométrica de la integral, también se puede relacionar la
probabilidad de que X se encuentre en el intervalo [x1, x2] con el área bajo la
función de distribución, como se muestra a continuación
La probabilidad de que X tome un valor específico x, sería el área bajo un punto

de la función de distribución.
Propiedades de la función de distribución
f(x) ≥ 0 ≦x
Página 82 de 105
Matemáticas
 f ( x)dx  1

De esta manera la función de distribución acumulada queda de la siguiente forma
x
F ( x)  P( x  x0 )   f ( x)dx

Ejemplo.
Se ha observado el tránsito en la intersección de dos avenidas de mucha

afluencia, y se determinó la función de densidad de probabilidad del tiempo que
transcurre para que un automóvil logre pasar por el crucero; la función está dada
por:
0.1 0.1x x≥0
f (x)  0 x<0
Calcular la probabilidad de que un automóvil tarde en pasar cuando
menos cinco minutos.

P(X≥5)= 0.1 
0.1 x
dx 
0.1
 0.1
 
0   0.1(5)  0.6065
5
4.3 Medidas de tendencia central de variables aleatorias discretas y

continuas.
Entre los parámetros más importantes de tendencia central se encuentra la media,

el primer momento con respecto al origen, que generalmente se presenta por μx,
Página 83 de 105
Matemáticas
conociendo la media de la distribución se tiene una idea del valor central de la

distribución.
Sea X una variable aleatoria. La media de X, denotada por μx, o E[X], está definida
por:
EX    xi f ( x)   xi PX  x
Si X es discreta con puntos x1, x2,……y

EX    xf ( x)dx

Si X es continua con función de densidad de probabilidad f(x).
Para una variable aleatoria es la suma de todos los valores de la variable dividida
entre el número total de elementos.
x  x2  x3  ....xn1  xn x i
X  EX   1  i 1
n n
La moda en una variable aleatoria es el valor que más se repite. Si una variable
aleatoria toma valores dentro del conjunto {x1, x2, ..., xn}, la moda será aquel xi que
dé el máximo en la función de probabilidad.
Se define la moda de una variable aleatoria X como el valor que hace máxima la
distribución de probabilidad o la función de densidad:
Mo = xk si P[X = xk] = máx. P[X = xi] si X es discreta
Mo = x0 si f(x0) = máx. f(x) si X es continua
La mediana es un valor que divide en dos mitades la integral de una función de

densidad de probabilidades. En el caso de la función de densidad de
probabilidades sea simétrica, es igual a la media.
Se define la mediana de X como:
Página 84 de 105
Matemáticas
Me = xk / F(xk-1) < ½ y F(xk) ≥ ½ si X es discreta;

x
Me = x /F(x) =  f ( x)dx

si X es continua:
Para el caso de variables aleatorias la mediana es el valor sobre el que hay igual
número de datos por encima y por debajo de él. La mediana puede definirse como
el valor central de los observados. Se ordenan los n datos de menor a mayor.
Cuando n es impar, la mediana es el valor del elemento que está a la mitad.

Cuando n es par, la mediana es la media de los dos elementos que están más
próximos a la mitad.
4.4 Medidas de dispersión de variables aleatorias discretas y

continuas.
Las medidas de dispersión dan una idea sobre la representatividad de las

medidas centrales, a mayor dispersión menor representatividad.
La llamada desviación típica o varianza, mide la dispersión con respecto a media

(lo que se podría desviar el resultado de la observación del experimento aleatorio
respecto a la media). La varianza se representa generalmente como σ2 o VAR[X]
y se define como:
Si se considera que a la esperanza como un promedio y a la diferencia (X-μx)

como la distancia entre un valor particular de X y su media, entonces se interpreta
a la varianza como el promedio de los cuadrados de las diferencias entre el valor
medio (μx) y los posibles valores de la variable aleatoria.
Como una medida de dispersión, la varianza tiene el inconveniente de

proporcionar valores con unidades que son el cuadrado de las que tiene la
variable aleatoria. Otra medida de dispersión es la desviación estándar, denotada
Página 85 de 105
Matemáticas
por σ o σx y definida como la raíz cuadrada como la raíz cuadrada de la

varianza.

 x  E  X   x 2 
Si se desea comparar la varianza o la desviación estándar de varias variables con
diferentes unidades entre si, la comparación es válida, debido a que las
distribuciones de variables aleatorias, con unidades pequeñas, tendrán
aparentemente menos variación.
Para hacer este tipo de comparaciones se define otro indicador, denominado

coeficiente de variación, como el cociente de la desviación estándar entre la
media,
x
C.V . 
x
4.5 Medida de simetría de variables aleatorias discretas y continuas.
Existen también medidas que indican de la simetría o asimetría de la distribución y

del achatamiento o no de la misma. Empezando con la simetría, es lógico pensar
que si la distribución tiene una única moda y es simétrica, entonces las tres
medidas de centralización coinciden. Si no es simétrica, suele suceder que la
mediana esté comprendida entre la moda y la media. Medidas de simetría o
asimetría miden la mayor o menor simetría de la distribución.
Existen dos medidas de este tipo, el Índice de simetría de Fisher
 x i  
3
1  i 1
3
Página 86 de 105
Matemáticas
Si la distribución es simétrica, γ1 = 0; si es asimétrica a la derecha, γ1 > 0; y si es

asimétrica a la izquierda, γ1 < 0. Medidas de Curtosis. Miden la mayor o menos
concentración de datos alrededor de la media. Se suele medir con el coeficiente
de Curtosis.
n
 x i  
4
2  i 1
3
N 4
Si γ2= 0, la distribución recibe el nombre de mesocúrtica. Si el γ2> 0, la

distribución se llama leptocúrtica, mas puntiaguda que la anterior. Hay una mayor
concentración de los datos en torno a la media. Si γ2< 0, la distribución se llama
platicúrtica y hay una menor concentración de datos en torno a la media será más
achatada que la primera.
Ejemplo.
Sea X una variable aleatoria discreta con la siguiente distribución de probabilidad:
x -2 3 5 7
P(x) 0.2 0.4 0.3 0.1
Determinar:
a) La media
b) La desviación estándar
c) EL coeficiente de variación
Página 87 de 105
Matemáticas
Para el cálculo de la media
EX    xi f ( x)   xi PX  x = (-2)(0.2)+(3)(0.4)+(5)(0.3)+(7)(.1)=3
Para la desviación estándar
 
   2  E ( X   )  EX 2    2
2
En donde:
E[X2]= (-2)2(0.2)+32(0.4)+52(0.3)+72(0.1)=16.8
Por lo tanto
  16.8  32  2.79
Con los resultados anteriores y de la expresión se calcula el coeficiente de

variación.
 x 2.79
C.V .    0.93
x 3
5. Modelos probabilísticos comunes

Cuando se estudia un experimento aleatorio mediante la teoría de la probabilidad
y la estadística es necesario definir el comportamiento de las variables
involucradas. Una forma de hacerlo es mediante su función de probabilidad, sin
embargo, encontrar para cada variable su verdadera distribución de probabilidad
no es nada fácil, por lo tanto, se han desarrollado una gran cantidad de modelos
probabilísticas que explican satisfactoriamente el comportamiento de muchas
variables aleatorias.
Algunos de los modelos se ha desarrollado a partir de un experimento

denominado ensayo de Bernoulli, en el cual sólo se pueden presentar dos posibles
resultados, éxito y fracaso. La probabilidad de que ocurra un éxito se representa
con p y la probabilidad de que ocurra un fracaso con q o 1-p.
5.1 Distribución Binomial
Página 88 de 105
Matemáticas
Sea X una variable aleatoria que representa el número de éxitos en una secuencia
de n ensayos de Bernoulli con probabilidad p de éxito y 1-p de fracaso, entonces x
tiene distribución binomial con parámetros n y p.
A la función de una variable aleatoria X resultado de contar el número de éxitos al

repetir n veces una experiencia aleatoria con probabilidad de éxito p la llamamos
distribución binomial y la representamos por
B (n,p)
Para esta distribución se verifica que la variable X pueda tomar los valores
0,1,2,…….n. Y que la variable toma cada uno de estos valores con probabilidad
n
P X  x     p x 1  p 
n x
 x
La media está dada por:
μx = np
La varianza está dada por

σ2 = np(1-p) = n p q
La desviación estándar está dada por   npq
Ejemplo.
En una fábrica de automóviles se ha observado que el 10% de las unidades salen

defectuosos de la línea de producción. Si se selecciona un lote de cinco para ser
inspeccionado.
a) La probabilidad de no encontrar unidades defectuosas en un lote de

cuatro automóviles.
b) El número esperado de unidades defectuosas en el mismo lote
c) La varianza y la desviación estándar de la distribución
La variable X que representa el número de unidades defectuosas que hay en un

lote, tiene distribución binomial con parámetros n=4 y p=0.1
4
P X  0   0.10 1  0.1
4 0
= 0.9 4= 0.656
0
Página 89 de 105
Matemáticas
μx = np = 4(0.1)= 0.4
σ2 = np(1-p) = n p q = (4)(0.1)(0.9)= 0.36
  npq = 0.36 = 0.6
5.2 Distribución Geométrica
Esta distribución es un caso especial de la Binomial negativa o Pascal, en donde

la variable aleatoria representa el número de ensayos necesarios para encontrar el
primer éxito en la secuencia de Bernoulli.
La función de probabilidad
P X  x   pq x1

1

p
q
2 
p2
La desviación estándar está dada por

q

p2
Ejemplo.
El propietario de diez terrenos campestres en un centro turístico, está tratando de

venderlos por medio de entrevistas personales con los posibles compradores.
Considere que al entrevistarse con un posible comprador, existe la misma
probabilidad de vender o no vender y que el resultado de una entrevista es
independiente de lo que ocurre en las demás.
a) La probabilidad de que la cuarta persona entrevistada sea la primera en

comprar
Página 90 de 105
Matemáticas
b) La media de la variable X que representa el número de clientes que se

tienen que entrevistar para realizar la primera venta
c) La varianza de X
Considerando como éxito realizar una venta p=0.5, entonces q=1-0.5=0.5
P X  4  0.5(0.5) 41 = 0.0625
La media sería
1
 2 entrevistas
0.5
La varianza sería
0.5
2  2
0.5 2
5.3 Distribución Pascal o binomial negativa
Sea X una variable aleatoria que representa el número de ensayos necesarios

para encontrar x éxitos en una secuencia de Bernoulli con probabilidad de éxito p,
entonces X tiene distribución Pascal con parámetros x y p. El último ensayo de la
secuencia tiene que ser un éxito para completar los x éxitos.
La función de probabilidad queda como sigue
P( x)  C (n  1, x  1) p x q n x
x

p
xq
2 
p2
Página 91 de 105
Matemáticas
Ejemplo.
En una fábrica de automóviles se ha observado que el 10% de las unidades salen

defectuosos de la línea de producción. Si se selecciona un lote de cinco para ser
inspeccionado.
a) La probabilidad de que la quinta unidad observada sea la segunda

defectuosa
b) El número promedio de unidades que se debe observar para encontrar
cinco defectuosas
n=5 x= 2 p=0.1
P(2)  C (5  1,2  1)0.12 (1  0.1)52 = 0.02916
Ahora son 5 defectuosas x=5
5
 = 50 unidades
0.1
5.4 Distribución uniforme continua
Sea X una variable que puede tomar, con la misma probabilidad, cualquier valor
en el intervalo [a, b] entonces X tiene distribución uniforme con parámetros a y b.
En la realidad existen muy pocos experimentos cuyos resultados tengan la misma

probabilidad de ocurrencia. Sin embargo, en algunos casos se utiliza esta
distribución cuando no se cuenta con la información necesaria y se tienen que
asignar probabilidades a los eventos.
 f x dx  1

f x  
1
para a  x  b
ab

ab

2
Página 92 de 105
Matemáticas
2 
b  a 2
12
Ejemplo.
Un inversionista considera que al aportar cierta cantidad de dinero (I) en un

negocio, puede perder todo lo invertido, recibir el triple de la inversión o quedar en
una situación intermedia, todo con la misma posibilidad.
a) La probabilidad de que reciba cuando menos 1.5 veces lo que invirtió

b) La utilidad esperada (utilidad = cantidad recibida – cantidad aportada)
c) El coeficiente de variación de la cantidad que recibirá
Si X representa la cantidad de dinero recibido, a=0 b= 3I
3I
x
3I
P X  1.5I  
1 1.5I

1.5 I
3I  0
dx    
 3I  1.5 I 3I
P X  1.5I   0.5
Si la utilidad es la diferencia X-I
Entonces:
E[utilidad] = E [X] – E[I]
E[X] = ½ (31-0) =1.5 I
E[utilidad] = 1.5 I –I = 0.5 I
El coeficiente de variación está definido por:

CV 

 
2 b  a
2

(3I  0) 2 9 I 2 3I 2
 
12 12 12 4
Página 93 de 105
Matemáticas
2
  3I 4  0.866 I
0.866 I
CV   1.732
0.5I
5.5 Distribución Normal
La distribución normal o de Gauss es uno de los modelos probabilísticas de más

utilidad debido entre razones, a que en la realidad muchas variables aleatorias
pueden representase adecuadamente mediante esta distribución.
Pero en general se dice que si la función densidad de probabilidad de una variable

aleatoria X está dado por:

 x  2
1
f ( x)  e 2 2
para toda x
 2
Entonces X tiene distribución normal, con parámetros μ y σ.
En la siguiente gráfica de la función se observa que es simétrica con respecto a la

media; su punto máximo está en X= μ y es asintótica con el eje X (en ambos
lados).
Para calcular la probabilidad de que la variable aleatoria X tome un valor se torna

complicado, por lo tanto se hace un cambio de variable, lo que se denomina
estandarizar a la variable.
Página 94 de 105
Matemáticas
x
Z

La estandarización se lleva a cabo con una μ=0 y σ=1
Con el cambio de variable la ecuación se transforma a:

z2
1 2
f ( x)  e para cualquier valor de z
2
A continuación se muestran distribuciones normales con la misma media, pero

diferentes desviaciones estándar.
En la parte a) de la figura muestra dos distribuciones normales con la misma

media, peor diferente desviación. En la b) la misma desviación pero con diferente
media y en la c) ilustra dos distribuciones normales con medias y desviaciones
diferentes.
En la práctica, se encuentran áreas situadas debajo de curvas normales en tablas

especiales, Ver el anexo de las tablas. Debido a que resulta físicamente imposible,
Página 95 de 105
Matemáticas
y también innecesario, construir tablas separadas de áreas de curvas normales

para todas las parejas de valores de μ y σ posibles, estas áreas se tabulan sólo
en relación con la distribución normal μ=0 y σ=1, llamada distribución normal
estandarizada. Se obtienen áreas situadas debajo de una curva normal cualquiera
al efectuar el cambio de escala.
Ejemplo.
Determine el área situada debajo de la curva normal estándar que está:
a) a la izquierda de z=0.94
El área a la izquierda de z=0.94 es

0.50000 más la entrada de la tabla
que corresponde al valor de z=0.94, es
decir, 0.50000+0.3264=0.8264.
b) a la izquierda de z= -0.85
El área a la izquierda de z=-0.85 es

0.5000 menos la entrada de la tabla
que corresponde al valor z= -0.85, es
decir, 0.5000-0.3023= 0.1977.
Página 96 de 105
Matemáticas
5.6 Aproximación de la distribución binomial a la normal
La distribución normal es una distribución continua que proporciona una

aproximación muy exacta de la distribución binomial cuando n, el número de
ensayos, es grande y p, la probabilidad de lograr un acierto en un ensayo
individual, está próxima a ½. De hecho una distribución normal con μ = np y
σ  np1  p  se puede utilizar a menudo para determinar el valor aproximado de
una distribución binomial aunque n sea muy pequeña y p difiera de ½. Un método
práctico adecuado consiste en utilizar esta aproximación solamente cuando np y
n(1-p) sean mayores a 5. np > 5 y n(1-p) >5.
Ejemplo.
Determine la probabilidad exacta de obtener seis águilas y 10 soles en 16

lanzamientos al aire de una moneda equilibrada y utilice también una curva normal
para determinar el valor aproximado de esta probabilidad.
Sustituyendo n=16, p=1/2 y x=6 en la fórmula de distribución binomial, la

probabilidad de obtener seis águilas y 10 soles en 16 lanzamientos de una
moneda equilibrada es:
 16 
P X  6   (1 / 2) 6 1  1 / 2 = 0.1222
166
6
Para determinar la aproximación de la curva normal a esta probabilidad, se
emplea la corrección de continuidad y se representan seis águilas por medio del
intervalo 5.5 a 6.5. Como μ = np = 16 (1/2) = 8
σ  np1  p   161 / 21  1 / 2 =2, la estandarización de 5.5 y 6.5 son:
5.5  8
z  1.25
2
6.5  8
z  0.75
2
Página 97 de 105
Matemáticas
De la tabla los valores para z son:
(0.5-.1210) -0.2734= 0.1210
La diferencia en los resultados es de 0.0012 del valor que se obtiene con la

función de la distribución binomial.
El ejercicio de aplicación será entregado para su resolución en clase
6. Distribuciones muestrales
Una muestra es un subconjunto de casos o individuos de una población

estadística. Las muestras se obtienen con la intención de inferir propiedades de la
totalidad de la población, para lo cual deben ser representativas de la misma.
Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir

una técnica de muestreo. Por otra parte, en ocasiones, el muestreo puede ser más
exacto que el estudio de toda la población porque el manejo de un menor número
de datos provoca también menos errores en su manipulación.
El número de sujetos que componen la muestra suele ser inferior que el de la

población, pero suficiente para que la estimación de los parámetros determinados
tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea
idóneo es preciso recurrir a su cálculo.
Se define muestreo como el procedimiento estadístico para seleccionar la muestra

a partir de la población, con el objeto de estudiar en ella alguna característica, y
generalizar los resultados a la población de origen. El muestreo es una alternativa
que para captar información de la realidad.
6.1 Muestra estadística

Una muestra es un subconjunto de casos o individuos de una población
estadística. Las muestras se obtienen con la intención de inferir propiedades de la
totalidad de la población, para lo cual deben ser representativas de la misma.
Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir
una técnica de muestreo.
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de
toda la población porque el manejo de un menor número de datos provoca
también menos errores en su manipulación. El número de sujetos que componen
Página 98 de 105
Matemáticas
la muestra suele ser inferior que el de la población, pero suficiente para que la
estimación de los parámetros determinados tenga un nivel de confianza adecuado.
Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.
6.2 Muestra aleatoria simple
O muestra al azar. Los sujetos de la muestra se eligen mediante un sorteo con

medios mecánicos (sin intervención humana) o usando una “tabla de números
aleatorios”. Para que sea realmente aleatoria dicha muestra, todos los sujetos de
la “población blanco” deben tener la misma probabilidad de ser elegidos.
Siempre que hay intervención humana existe la probabilidad que se produzcan

“errores sistemáticos”. Por ejemplo, hacer un sorteo con papelitos que se sacan de
un sombrero; primero habría que verificar la forma en que se plegó cada papel; en
segundo lugar los números que quedaron al fondo o en las orillas tienen escasa
probabilidades de ser elegidos.
6.3 Muestreo aleatorio simple
El muestreo aleatorio simple es el tipo de muestreo más simple para una

población, pues no se necesita mucha información para poderlo implantar en un
caso práctico. Una muestra aleatoria simple es seleccionada de tal manera que
cada muestra posible del mismo tamaño tiene igual probabilidad de ser
seleccionada de la población. Para obtener una muestra aleatoria simple, cada
elemento en la población tenga la misma probabilidad de ser seleccionado.
Los pasos a seguir:

 Obtener un listado de todos los integrantes de la población.
 Numerar a todos los sujetos de la población (o unidades de muestreo).
 Utilizar una Tabla de Números Aleatorios o un procedimiento similar para
seleccionar a los sujetos de la muestra
El muestreo aleatorio es recomendable cuando la población es suficientemente

pequeña, como para ser enumerada.
6.4 Generación de números aleatorios
Una vez construido un modelo, debemos experimentar sobre él y para poder

ejecutarlo necesitamos dar valores a las variables. De esta forma podremos
obtener valores de salida y pasaremos a realizar un análisis de los mismos.
Algunas de las variables de entrada son de tipo aleatorio por lo que se tendrán
que generar valores que simulen dichas entradas. Para generar variables
Página 99 de 105
Matemáticas
aleatorias que sigan determinadas funciones de probabilidad necesitamos partir de

series de números que cumplan ciertas características de aleatoriedad.
Seleccionar una muestra aleatoria de la población de interés no es tan sencillo

como puede parecer. Entonces, ¿cómo podemos seleccionar una muestra de una
población, de tal manera que cada muestra posible de tamaño n tenga la misma
probabilidad de ser seleccionada? Se podría usar el criterio para seleccionar
“aleatoriamente” la muestra. Otra opción, seleccionar una muestra que se
considere típica o representativa. Cualquiera de estos podría tener sesgo.
Muestras aleatorias pueden ser seleccionadas usando tablas de números

aleatorios, una tabla de números aleatorios es un conjunto de enteros generados
de modo que, comúnmente, la tabla contendrá todos los diez enteros (0,1,2,….9)
en proporciones aproximadamente iguales, sin tendencias ni patrones.
Para seleccionar los números es importante fijar ciertos parámetros de selección,
las líneas pares quitando el último dígito, por ejemplo.
Ejemplo.
Por simplicidad, supóngase que existen N=1000 registros de pacientes, de los

cuales será seleccionada una muestra aleatoria de n=20. Sabemos que una
muestra será obtenida si cada muestra posible n=20 registros tiene la misma
probabilidad de ser seleccionada. Los dígitos en la tabla de números aleatorios,
son generados para satisfacer las condiciones del muestreo aleatorio. Determinar
cuáles registros van a ser incluidos en una muestra de tamaño n= 20.
Podemos considerar que las cuentas son los números 001, 002,…….,999, 000.
Tenemos 1000 números de tres dígitos, donde 001 representa el primer registro,
999 el registro del paciente 999 y 000 el milésimo.
Usando la tabla de números aleatorios, utilizando la primera columna, no tomando

en cuenta los últimos dos dígitos de cada número, el primer número formando tres
dígitos es el 104, el segundo es el 223, el tercero es el 241, y así sucesivamente.
Tomando una muestra aleatoria de 20 dígitos, obtenemos los siguientes números:
104 779 289 510

223 995 635 023
241 963 094 010
421 895 103 521
375 854 071 070
Página 100 de 105

Matemáticas
Si los registros están numerados, solamente seleccionado los registros con los
números correspondientes, y estos registros representan una muestra aleatoria de
n=20 de N=1000.
6.5 Teorema del límite central
El teorema del límite central dice que si una muestra es lo bastante grande (n >
30), sea cual sea la distribución de la variable de interés, la distribución de la
media muestral será aproximadamente una normal. Además, la media será la
misma que la de la variable de interés, y la desviación típica de la media muestral
será aproximadamente el error estándar.
Cuando el muestreo se efectúa a partir de una población que no sigue una

distribución normal se utiliza el Teorema del límite central. Dada una población de
cualquier forma funcional no normal con media μ y varianza σ 2, la distribución
muestral de la media, calculada a partir de muestras de tamaño n de dicha
población será casi normal con media μ y varianza σ 2/n cuando la muestra es muy
grande.
x ~ f(x) y n > 30 → x ~ N(μ, σ2/n)
z
 X     N (0,1)
/ n
Ejemplo. Los resultados de las pruebas finales de todos los alumnos del último
año de las preparatorias de cierto estado tienen una media de 60 y una varianza
de 64. Una generación específica de cierta preparatoria de n=100 alumnos tuvo
una media de 58. ¿Puede afirmarse que esta preparatoria sea inferior? (calcule la
probabilidad de que la media muestral sea a lo más 58 cuando n=100)
Sea Y la media de una muestra aleatoria de n=100 calificaciones de una población

con μ=60 y σ2 = 64. Se desea aproximar P( Y 58). Sabemos del teorema de límite
central que
 X    es aproximadamente una variable aleatoria normal estándar,
/ n
que denotaremos por Z. Por tanto
 58  60 
P(Y  58)  P   Pz  2.5  0.0062
 64 / 100 
Mediante la tabla de valores z, se obtiene el valor de 0.0062. Debido a que la

probabilidad es pequeña, es poco probable que se pueda considerar a esa
Página 101 de 105

Matemáticas
generación estudiada como una muestra aleatoria de una población con μ=60 y σ2
= 64. Se puede afirmar que la calificación promedio para esta preparatoria es
menor que el promedio global de μ=60.
6.6 Distribución de la media muestral
La distribución de medias muestrales son las probabilidades de todas las medias

posibles de las muestras de una población finita. Toda distribución de probabilidad
puede describirse mediante su media y su desviación estándar.
Al tomar las muestras aleatorias se cometen ciertos errores que se reflejan en que
la media y la distribución de cada muestra no son iguales, y por lo tanto la media y
la desviación estándar de la población tampoco coinciden con los de la muestra.
Por esta razón, la desviación estándar de la distribución de un estadístico muestral
recibe el nombre de error estándar estadístico. El error estándar no solamente
indica el tamaño del error accidental, sino también la exactitud que alcanzaremos
si usamos un estadístico muestral para estimar un parámetro de la población.
La media muestral es una estadística denotada por X y definida como sigue
1 n
x   xi
n i 1
Ejemplo
De una población cuyos elementos son ( 1, 3, 5, 7, 9 ), formar el número de

muestras aleatorias de 2 elementos, construir la distribución de medias
muestrales, determinar la media de la distribución de medias ( μ- ); determinar la
desviación estándar de la distribución de medias y comparar estos resultados con
los parámetros de la población.
n=2
N=5
1  3  5  7  9 25
  5
5 5
5¡
Número de muestras C 25   10
2¡(5  2)
Conjunto de muestras
Página 102 de 105

Matemáticas
{(1, 3), (1, 5), (1, 7), (1, 9), (3, 5), (3, 7), (3, 9), (5, 7), (5, 9), (7, 9)}
Conjunto de medias muestrales

{2, 3, 4, 5, 4, 5, 6, 6, 7, 8}
Probabilidad de las medias muestrales
1 1 2 2 2 1 1

 x  2   3   4   5   6   7   8   5
 10   10   10   10   10   10   10 
La media de la distribución de medias μx es igual a la media poblacional ( μ )
6.7 Distribución Ji-Cuadrada
En realidad la distribución ji-cuadrada es la distribución muestral de s2. O sea que

si se extraen todas las muestras posibles de una población normal y a cada
muestra se le calcula su varianza, se obtendrá la distribución muestral de
varianzas.
Para estimar la varianza poblacional o la desviación estándar, se necesita conocer

el estadístico X2. Si se elige una muestra de tamaño n de una población normal
con varianza σ2, el estadístico:
X2 
n  1s 2
2
Donde n es el tamaño de la muestra, s2 la varianza muestral y la varianza σ2 de la
población de donde se extrajo la muestra.
El estadístico tiene una distribución muestral que es una distribución ji-cuadrada

con gl=n-1 grados de libertad y se denota X2.
Propiedades de las distribuciones ji-cuadrada
1. Los valores de X2 son mayores o iguales que 0.

2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay
un número infinito de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se
extienden a la derecha; esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
Página 103 de 105

Matemáticas
6. El valor modal de una distribución X2 se da en el valor (n-3).
Ejemplo.
Suponga que los tiempos requeridos por un cierto autobús para alcanzar uno de
sus destinos en una ciudad grande forman una distribución normal con una
desviación estándar σ =1 minuto. Si se elige al azar una muestra de 17 tiempos,
encuentre la probabilidad de que la varianza muestral sea mayor que 2.
Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como sigue:
El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad

(17-1) y se encuentra que a este valor (0.99) le corresponde un área a la derecha
de (1-0.99) 0.01. En consecuencia, el valor de la probabilidad es P(s2>2)
6.8 Distribución t Student
En probabilidad y estadística, la distribución-t o distribución t de Student es una

distribución de probabilidad que surge, en la mayoría de los estudios estadísticos
prácticos, cuando la desviación típica de una población se desconoce y debe ser
estimada a partir de los datos de una muestra.
Con n-1 denominado el número de grados de libertad. La distribución depende de

los grados de libertad, pero no de μ o σ; la independencia de μ y σ es lo que hace
a la distribución t tan importante en la teoría y en la práctica. Los grados de
libertad se interpretan como el número de valores que podemos elegir libremente.
Ejemplo.
Página 104 de 105

Matemáticas
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de
tamaño 15 que se selecciona de una distribución normal.
Solución:
Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos

cuenta que a este valor le corresponde un área de 0.05 a la izquierda, por ser
negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de 0.005
Luego se busca el valor de 0.005 en el primer renglón con 14 grados de libertad y

se obtiene un valor de t = 2.977, pero como el valor de está en el extremo
izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto:
P(-2.977 < t < -1.761) = 0.045
Página 105 de 105

GuiaMatematicas EAUEE

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

GuiaMatematicas EAUEE

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO

M en I Azucena Escobedo Izquierdo y M. en I. Elisa Viñas Reyes

2. Sistemas de ecuaciones lineales

5. Modelos probabilísticos comunes

P(x) = anxn + a n -1x n -1 + ....... + a1x + a0 = 0 (1)

En esta manipulación de la ecuación pueden presentarse ocasiones en que P(x) = 0 tenga

1.1 Ecuación de primer grado.

Su solución puede ser numérica o gráfica. Numéricamente, se resuelve

Verificación: 3(-1.5) + 1 = -1,5 -2; -4,5 + 1 = -3.5

Solución gráfica: la línea recta dibujada representa gráficamente a la ecuación. El

1.2 Ecuaciones algebraicas de orden mayor.

1.2.1 Ecuación de segundo grado

Para resolver la ecuación cuadrática, puede usarse cualquiera de

A. Solución por factorización.

B. Solución por completando el cuadrado.

Sumando en ambos miembros de la ecuación (1), se obtiene:

,de donde (2).

C. Solución por la formula general

Usando el método de completación de cuadrados, demuestre que la solución de la

Sumando ,en ambos miembros de la igualdad anterior, se obtiene:

Extrayendo la raíz cuadrada en ambos miembros de la última igualdad (si b2-4ac

La fórmula (2) se conoce como :fórmula general para resolver la ecuación

1. Resolver la ecuación 2x2 – x = 0

Factorizando x obtenemos: 2x(x – ½ )= 0

1era. solución 2x = 0 despejando x tenemos x= 0/2 entonces x1 = 0

3. Resolver por factorización la ecuación 3x2 + 10x +8 =0

- Hallamos primero el producto ac= 3 x 8 = 24

1.2.2 Ecuación de n-ésimo grado

Las ecuaciones de la forma P(x) = 0 donde P(x) es un polinomio de grado mayor

P(x) = an xn + an -1 xn-1 + ..... + a2 x2 + a1 x + a0 donde los ai, con i = 0,1,...,n

son en general, números reales, aunque pueden ser también complejos

El método mas frecuente de resolver ecuaciones de grado superior a 2 es

1.3 Ecuaciones trascendentes.

Una ecuación f(x)=g(x) es trascendente, si por lo menos una de las funciones no

1.3.2 Función exponencial y logarítmica.

Sea la función exponencial de la forma

f(x) = abx donde b>0

Siendo b un número real positivo distinto de 1 y a un número real distinto de cero.

La expresión función exponencial se reserva para la inversa de la función

Esta función se nota exp: R → R+*

Donde e es la base de los logaritmos naturales.

y = exp x <=> x = ln y (con y >0)

La tangente en x = 1, T1, pasa por el origen. La tangente en x = 0, T 0, pasa por el

La inversa de la función exponencial es la función logarítmica de la misma base

Entonces, cuando en una ecuación, la incógnita figura en el exponente, se aplica

Condiciones: Si a fuera 1, sería para todo x, bx = 1, y ningún número distinto de 1

Si b = 10 anotamos log a y llamamos logaritmo decimal.

1. Para 32x =16 comprobar que x = 4

Resolviendo el binomio y reduciendo

x  3x  3  1019  (x-3) = 1019  x = 1019 + 3 y x = 1019

elevando al cuadrado ambos

x y 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8

1.3.2 Funciones trigonométricas e hiperbólicas

En el estudio de la trigonometría que trata con problemas que incluyen ángulos de

Equivalencia en medición de ángulos: Los sistemas de medición de ángulos

Y como 2 rad se corresponde con 360º, se tiene que 1 rad 57º17’44,5”

Longitud de arco: En una circunferencia de radio r, un ángulo central a determina

B. Teoremas e identidades trigonométricas:

- Teorema del Seno:

Esta fórmula puede aplicarse conociendo un par de lados y el ángulo opuesto a

- Teorema del Coseno:

B2 = A2 + C2 -2AC cos b ó C2 = A2 +B2 -2AB cos c

Si cualquiera de los ángulos es de 900 (con lo que su coseno es cero) la fórmula