Está en la página 1de 105

UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO

MATEMÁTICAS

M en I Azucena Escobedo Izquierdo y M. en I. Elisa Viñas Reyes


27/05/2011
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

INDICE

1. Algebra elemental
1.1 Ecuación de primer grado.
1.2 Ecuaciones algebraicas de orden mayor.
1.3 Ecuaciones trascendentes.
1.4 Soluciones numéricas.

2. Sistemas de ecuaciones lineales


2.1 Sistema de ecuaciones
2.2 Clases de sistemas de ecuaciones
2.3 Métodos de resolución
2.4 Matrices
2.5 Independencia lineal
2.6 Producto de matrices (utilizando hoja de cálculo)

3. Estadística descriptiva
3.1 Población
3.2 Muestra
3.3 Correlación

4. Variables aleatorias
4.1 Variable aleatoria discreta
4.2 Variable aleatoria continua y su función de densidad
4.3 Medidas de tendencia central de variables aleatorias discretas y continuas.
4.4 Medidas de dispersión de variables aleatorias discretas y continuas.
4.5 Medida de simetría de variables aleatorias discretas y continuas.

5. Modelos probabilísticos comunes


5.1 Distribución Binomial
5.2 Distribución Geométrica
5.3 Distribución Pascal o Binomial negativa
5.4 Distribución uniforme continua
5.5 Distribución Normal
5.6 Aproximación de la distribución binomial a la normal

6. Distribuciones muestrales
6.1 Muestra estadística
6.2 Muestra aleatoria simple
6.3 Muestreo aleatorio simple
6.4 Generación de números aleatorios
6.5 Teorema del límite central
6.6 Distribución de la media muestral
6.7 Distribución Ji-Cuadrada
6.8 Distribución t-Student
Página 2 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

1. Algebra elemental

Una ecuación f(x)=g(x) es algebraica si cada una de las dos funciones es algebraica (racional o
irracional). De toda ecuación algebraica se puede obtener una ecuación de forma:

P(x) = anxn + a n -1x n -1 + ....... + a1x + a0 = 0 (1)

En esta manipulación de la ecuación pueden presentarse ocasiones en que P(x) = 0 tenga


soluciones que no verifiquen la ecuación inicial y se las llama raíces extrañas.

1.1 Ecuación de primer grado.

Su forma es ax + b = 0, donde a y b son constantes y números reales para a 0 y siempre tiene
solución real:

b
x (2)
a

Las ecuaciones de 1er. grado se llaman también lineales algunos ejemplos de estas son:

1. 3x-5 = 16 3. 2  x  1

3 5 4. ax+b=c
2. 
x7 x2

Su solución puede ser numérica o gráfica. Numéricamente, se resuelve


"despejando" la x, o sea ir pasando términos de un miembro a otro hasta
conseguir: x =...número

Ejemplo.
Supongamos que queremos resolver la ecuación: 3x + 1 = x - 2.

3x - x = -1 - 2; 2x = - 3; x = -3/2 ó x = -1.5.

Verificación: 3(-1.5) + 1 = -1,5 -2; -4,5 + 1 = -3.5

Solución gráfica: la línea recta dibujada representa gráficamente a la ecuación. El


valor de x donde la recta corta al eje X será la solución de la ecuación (se observa
que es x = -1,5)
y

x = -1.5
x

Página 3 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

1.2 Ecuaciones algebraicas de orden mayor.

1.2.1 Ecuación de segundo grado


La ecuación: , donde a, b y c son números reales y a 0, se
llama ecuación cuadrática o ecuación de segundo grado en la variable x.
- Si b y c son distintos de cero, la ecuación se llama completa o afectada;
incompleta, en caso contrario.
- Así, las ecuaciones: y son cuadráticas completas,
mientras que las ecuaciones: y son cuadráticas
incompletas.
- En la ecuación cuadrática: , la cantidad: es llamada
discriminante de la ecuación y su signo determina la naturaleza de las raíces,
como lo afirma el siguiente teorema.

Teorema.
Considere la ecuación cuadrática: ; a 0.
Si , entonces, las raíces son reales y diferentes.
Si , entonces, las raíces son reales e iguales.
Si , entonces, las raíces son complejas conjugadas.

Para resolver la ecuación cuadrática, puede usarse cualquiera de


los siguientes métodos:

A. Solución por factorización.


Como toda ecuación cuadrática es equivalente a una ecuación en la cual uno
de sus miembros es un polinomio de segundo grado y el otro es cero; entonces,
cuando el polinomio de segundo grado pueda factorizarse, se procede así:
Si , , entonces, la ecuación es
equivalente a: (1).
La ecuación (1) puede resolverse usando la propiedad del sistema de los
números reales:

B. Solución por completando el cuadrado.


Este método es el más antiguo que existe para encontrar las soluciones de una
ecuación cuadrática.
Se supone que la ecuación: ,con a 0 ,es equivalente a la
ecuación cuadrática:
(1).

Página 4 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Sumando en ambos miembros de la ecuación (1), se obtiene:

ó
Extrayendo raíz cuadrada en ambos miembros de la última igualdad (lo cual tiene
sentido solo si ), se obtiene:

,de donde (2).

La fórmula (2) proporciona las dos soluciones (una para cada signo) de la
ecuación cuadrática (1), que es equivalente a la ecuación : .

C. Solución por la formula general

Usando el método de completación de cuadrados, demuestre que la solución de la


ecuación cuadrática : , con a ≠0 viene dada por :

(1).

Solución
La ecuación: , con a≠ 0 ,es equivalente a la ecuación :

Sumando ,en ambos miembros de la igualdad anterior, se obtiene:

O equivalentemente,

Extrayendo la raíz cuadrada en ambos miembros de la última igualdad (si b2-4ac


>= 0), se obtiene:

Página 5 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

De donde:

(2)

La fórmula (2) se conoce como :fórmula general para resolver la ecuación


cuadrática : ; con a≠ 0.

Ejemplos

1. Resolver la ecuación 2x2 – x = 0

Factorizando x obtenemos: 2x(x – ½ )= 0

1era. solución 2x = 0 despejando x tenemos x= 0/2 entonces x1 = 0


2da. solución (x – ½ )= 0 x2 = ½

2. Resolver la ecuación x2 + 5x + 6 = 0

 5  5 2  416  5  5 2  416
x1  x2 
21 21
x1 = -3 x2 = -2

3. Resolver por factorización la ecuación 3x2 + 10x +8 =0

- Hallamos primero el producto ac= 3 x 8 = 24


- Buscamos dos números cuyo producto es 24 y cuya suma sea 10

1 x 24 = 24 1 + 24 ≠ 10
2 x 12 = 24 2 + 12 ≠ 10
4 x 6 = 24 4 + 6 = 10

Factorizando se tiene

3x2 + 4x + 6x + 8 =0
x(3x+4) + 2(3x+4) = 0
(x+2)(3x+4) = 0 igualando a cero ambos factores y resolviendo

Página 6 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

(x+2) = 0 x = -2
(3x+4) = 0 x = - 4/3

1.2.2 Ecuación de n-ésimo grado

Las ecuaciones de la forma P(x) = 0 donde P(x) es un polinomio de grado mayor


que 4, no pueden ser resueltas por radicales, en el caso más general, y sólo es
posible aplicar métodos de aproximación, que los hay muy variados y de distinto
nivel de complejidad.

P(x) = an xn + an -1 xn-1 + ..... + a2 x2 + a1 x + a0 donde los ai, con i = 0,1,...,n

son en general, números reales, aunque pueden ser también complejos


imaginarios. A x llamamos indeterminada. Si an , an se llama coeficiente
principal y n es el grado del polinomio. A a0, denominamos término independiente,
a1x, término lineal, a2 x2, término cuadrático y así sucesivamente. Al máximo
n/an0, llamamos grado del polinomio.

El método mas frecuente de resolver ecuaciones de grado superior a 2 es


descomponer la ecuación en factores (dividiendo la ecuación por los posibles
divisores), con lo que, si tenemos suerte, la ecuación se reduce a un producto de
otras ecuaciones de grado menor que ya podemos resolver por las fórmulas
anteriores.

1.3 Ecuaciones trascendentes.

Una ecuación f(x)=g(x) es trascendente, si por lo menos una de las funciones no


es algebraica. Son ejemplos de estas ecuaciones, las exponenciales, logarítmicas,
trigonométricas, hiperbólicas. En general, las ecuaciones trascendentes sólo
pueden resolverse en forma aproximada. En algunos casos la resolución de estas
ecuaciones se reduce a la resolución de ecuaciones algebraicas con la ulterior
aplicación de valores tabulados.

1.3.2 Función exponencial y logarítmica.

Sea la función exponencial de la forma

f(x) = abx donde b>0

Siendo b un número real positivo distinto de 1 y a un número real distinto de cero.

Página 7 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

La expresión función exponencial se reserva para la inversa de la función


logaritmo natural o, dicho en otros términos, para el caso en que a = e. Con esa
definición, su dominio es R, pero se puede ampliar al cuerpo de los complejos.

Esta función se nota exp: R → R+*

Donde e es la base de los logaritmos naturales.

y = exp x <=> x = ln y (con y >0)

La tangente en x = 1, T1, pasa por el origen. La tangente en x = 0, T 0, pasa por el


punto (-1, 0).

La inversa de la función exponencial es la función logarítmica de la misma base


así, Dados a, b R+ y b 1, se dice que el logaritmo en base b del número a es x
sí, y sólo sí, x es el exponente al que hay que elevar b para obtener a. Es decir:

logb a = x bx = a

Página 8 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Entonces, cuando en una ecuación, la incógnita figura en el exponente, se aplica


logaritmo a ambos miembros de la misma.

Condiciones: Si a fuera 1, sería para todo x, bx = 1, y ningún número distinto de 1


tendría logaritmo. Por razones análogas, la base debe ser también distinta de 0.

Si b = 10 anotamos log a y llamamos logaritmo decimal.


Si b es el número irracional e = 2,7182818..., anotamos ln a y llamamos logaritmo
neperiano o natural.
Como un número positivo elevado a cualquier potencia (de exponente positivo o
negativo) da un resultado positivo, resulta que, dentro del campo de los números
reales, los números negativos no tienen logaritmo.

Propiedades:
- logb 1 = 0
- logb b = 1
- logb m  logb n  m n (con lo cual la función logarítmica es creciente)
- logb m = x  log1/b m = -x  logb (1/m) = -x
- logb MN = logb m + logb n
m
- logb = logb m – logb n
n
- logb mn = nlogb m con lo que m = blogbm
log m
- logb n m  b
n
- Conociendo el logaritmo de un número en una cierta base b, se puede
determinar su logaritmo en cualquier otra base B según la fórmula:

log a 1
log b  b donde puede ser tomado como módulo de
B log B log B
b b
conversión.

Ejemplos

1. Para 32x =16 comprobar que x = 4

Despejando x

log2x = log16
xlog2 = log16

Página 9 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

log 16
x 4
log 2

2 Encuentre el valor de x

lon(x2-9) - log(x+3)=19

Eliminando log.

log  x29 
 
 

 x3 
10  
 1019

 x2  9 
   1019 x ≠ -3
 x3 
 

Resolviendo el binomio y reduciendo

x  3x  3  1019  (x-3) = 1019  x = 1019 + 3 y x = 1019


x  3
3 Despejar y de la siguiente función y graficar en el plano x-y.
30.00
y
e  x2
25.00

Resolviendo para y
20.00

y
ln e  ln x 2
 y  ln x 2 ;
15.00

elevando al cuadrado ambos


miembros de la ecuación 10.00

y = (lnx2)2 5.00

0.00

x y 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8

0.1 28.11
0.2 6.71
0.3 2.10
0.4 0.70
0.5 0.23
0.6 0.07
0.7 0.02

Página 10 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

1.3.2 Funciones trigonométricas e hiperbólicas

A. Funciones trigonométricas

En el estudio de la trigonometría que trata con problemas que incluyen ángulos de


triángulos.

Equivalencia en medición de ángulos: Los sistemas de medición de ángulos


más usados son: el sexagesimal (DEG) y el circular (RAD), y menos usado el
centesimal (GRAD). La equivalencia entre estos sistemas es:

Y como 2 rad se corresponde con 360º, se tiene que 1 rad 57º17’44,5”

Las tres primeras se denominan funciones directas y las restantes son llamadas
funciones inversas (pues sólo son los números inversos de las otras). Estas
relaciones funcionan en los triángulos rectángulos y son útiles para hallar sus
elementos. Estas expresiones son funciones del ángulo a, esto queda asegurado
por el Corolario de Tales.

Página 11 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Longitud de arco: En una circunferencia de radio r, un ángulo central a determina


un arco de longitud L, dicha longitud es igual al producto de la longitud del radio
por la amplitud del ángulo central a expresado en radianes. L = r.

B. Teoremas e identidades trigonométricas:

Una notación muy conveniente para recordar las fórmulas es la que acabamos de
utilizar; consiste en nombrar a un lado y a su ángulo opuesto con la misma letra:
mayúscula para el lado y minúscula para el ángulo.

- Teorema del Seno:

Esta fórmula puede aplicarse conociendo un par de lados y el ángulo opuesto a


uno de ellos, o viceversa, un par de ángulos y el lado opuesto a uno de ellos.

Página 12 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

- Teorema del Coseno:

A2 = B2 + C2 -2BC cos a
Esta fórmula sirve para hallar cualquiera de los lados, si se conocen los dos lados
restantes y el ángulo que forman, por lo tanto también se la puede escribir como:

B2 = A2 + C2 -2AC cos b ó C2 = A2 +B2 -2AB cos c

Si cualquiera de los ángulos es de 900 (con lo que su coseno es cero) la fórmula


en la que aparece se reduce al Teorema de Pitágoras; puesto que el último
término se anula idénticamente.

- Teorema de Pitágoras:

Para un triángulo rectángulo existe una relación muy conocida entre sus lados; es
el Teorema de Pitágoras que establece que: “El cuadrado de la hipotenusa (A) es
igual a la suma de los cuadrados de los catetos (B y C)”. La hipotenusa es el lado
opuesto al ángulo recto, y los catetos son los lados restantes. Es decir que:

A2 = B2 + C2 de donde

Que se conocen como los Corolarios del Teorema de Pitágoras.

La Relación Pitagórica de la trigonometría indica que: sen2 a + cos2 a = 1

- Teorema de las tangentes:

Esta fórmula no es muy utilizada en la resolución de triángulos, porque deben


conocerse los mismos datos que se necesitan para el Teorema del Seno, y éste
último es más manejable.

Algunas identidades trigonométricas: La definición de las funciones dadas al


principio como cociente de lados de un triángulo rectángulo sirven para ángulos
agudos, pero pueden extenderse a ángulos mayores que 90° ó menores que 0°,
según el siguiente cuadro:

Página 13 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Reducción al primer cuadrante: Este cuadro indica el signo que posee cada
función en los cuatro cuadrantes, y se lo utiliza junto con las fórmulas de reducción
al primer cuadrante:

- Si al 2do cuadrante se utiliza el ángulo =180º - 


- Si al 3er cuadrante, se utiliza el ángulo = - 180°

y se procede de igual manera al ejemplo anterior.

- Si al 4to cuadrante, se utiliza el ángulo = 360° - 

Funciones de ángulos notables: Los valores utilizados en el ejemplo dado en el


punto (I) pertenecen al siguiente cuadro, donde se detallan los valores numéricos
de las funciones para ángulos múltiplo de 30° y 45°, del primer cuadrante.

Relaciones entre las funciones de un mismo ángulo: También interesa hallar


los valores de las funciones conociendo una de ellas y sin la necesidad de conocer
el ángulo. Para ello se utilizan las relaciones:

Página 14 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Si se tiene como dato alguna de las funciones inversas, un paso previo a estos
cálculos es, precisamente, invertir este valor para hallar la función directa
correspondiente.

Funciones trigonométrica del doble ángulo y del ángulo mitad:

Si se conoce las funciones trigonométricas de un cierto ángulo y se desea conocer


las funciones correspondientes a un ángulo que mide el doble del anterior, o la
mitad de él, se utilizan las siguientes fórmulas

Página 15 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Funciones Trigonométricas de la suma y la diferencia de dos ángulos

C. Funciones hiperbólicas
Son análogas a las funciones trigonométricas ordinarias o funciones circulares.
Estas son:

y otras líneas:
El seno hiperbólico
cotangente hiperbólica

El coseno hiperbólico secante hiperbólica

cosecante hiperbólica
La tangente hiperbólica

1.4 Soluciones numéricas.

Uno de los problemas que se presenta con frecuencia en ingeniería es encontrar


las raíces de ecuaciones de la forma f(x) = 0, donde f(x) es una función real de una
variable x,

Como un polinomio en x. f(x) = x4 – 6x3 + 4x2 + 36x – 45

O una función trascendente f(x) = ex sen x + ln3x + x3

Existen distintos algoritmos para encontrar las raíces o ceros de f(x) = 0, pero
ninguno es general; es decir, no hay un algoritmo que funcione con todas las

Página 16 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

ecuaciones; por ejemplo, se puede tener un algoritmo que funcione para encontrar
las raíces de f1(x) = 0, pero al aplicarlo no se puede encontrar los ceros de una
ecuación distinta f2(x) = 0.

En muy pocos casos es posible obtener las raíces exactas de f(x) = 0, como
cuando f(x) es un polinomio factorizable, como

 1  2
 
f(x)   x - x  x  x   x  x n ,

donde x , 1≤ i ≥ n denota la i-ésima raíz de f(x) = 0. Sin embargo se pueden


i
obtener soluciones aproximadas al utilizar algunos de los métodos numéricos que
aquí presentamos.

1.4.1 Método del punto fijo

Sea como inicio la ecuación general


f(x) = 0

de la cual se desea encontrar una raíz real x .

Primero, transformar algebraicamente la ecuación a la forma equivalente x = g(x)


esta transformación se puede llevar a cabo mediante operaciones algebraicas o
agregando x a cada lado de la ecuación original.

Por ejemplo para la ecuación

f(x) = x2 - 2x + 3 = 0

algunas posibilidades de x = g(x) son:

x2  3
x  2x  3 ó x
2

Una vez que se ha determinado una forma equivalente el siguiente paso es dar
una aproximación inicial a la raíz. Se denota valor de tanteo o valor de inicio como
x0. Una vez que se tiene x1, se evalúa g(x) en x0, denotándose el resultado de
esta evaluación como x0; esto es

g(x0)= x1

Este proceso se repite y se obtiene el siguiente esquema iterativo

Página 17 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Valor inicial: x0 f(x0)

Primera iteración x1 = g (x0) f(x1)


Segunda iteración x2 = g (x1) f(x2)
Tercera iteración x3 = g (x2) f(x3)

i-ésima iteración xi = g (xi-1) f(xi)
i+1-ésima iteración xi+1 = g (xi) f(xi+1)

Aunque hay excepciones, generalmente se encuentra que los valores x0, x1,... se
van acercando a x de manera que xi, esta más cerca de x que xi-1, o bien se van
alejando de x .

Como con otras formas iterativas, el error aproximado de la ecuación xi+1 = g (xi)
se puede determinar usando el estimador de error.

x x
a  i1 i 100%
x
i1
Ejemplo

Use iteración de punto fijo para localizar la raíz de f(x) = e-x – x.

Trasformando la ecuación en su forma equivalente y expresándola en la forma de


x
ecuación como xi1  e i . Empezando con un valor inicial de x0 = 0, se itera y
calcula:

i xi g (xi) ε%
0 0 1.0000
1 1 0.3679 100
2 0.368 0.6922 171.828
3 0.692 0.5005 46.8536
4 0.5 0.6062 38.3091
5 0.606 0.5454 17.4468
6 0.545 0.5796 11.1566
7 0.58 0.5601 5.90335
8 0.56 0.5711 3.48087
9 0.571 0.5649 1.9308
10 0.565 0.5684 1.10887

Página 18 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

De esta manera, cada iteración acerca cada vez más al valor estimado con el
valor verdadero de la raíz, el cual es 0.5671.

- Criterio de convergencia

Un criterio de convergencia de este proceso iterativo se basa en que

g( x )= x ,

por lo cual puede suponerse que si la sucesión x0, x1, x2, ... converge a x , los
valores consecutivos xi, xi+1, irán acercándose entre sí conforme el proceso
iterativo avanza.

Un modo práctico de saber si los valores consecutivos se acercan es ir calculando


la distancia entre ellos

d  x x
i i1 1

Si la sucesión d1, d2, d3,... tiende a cero, puede pensarse que el proceso esta
convergiendo a una raíz x y debe continuarse hasta que xi < , y tomar a xi+1,
como la raíz buscada. Si d1, d2, d3,... no converge para un número “grande” de
iteraciones entonces x0, x1, x2,... diverge de x , y se detiene el proceso para iniciar
uno nuevo, modificando la función g(x), el valor inicial o ambos.

1.4.2 Método de Newton-Raphson

Este método de segundo orden de convergencia es el más ampliamente usado


cuando se trata de encontrar raíces reales no repetidas. Si el valor inicial de la raíz
es xi, entonces se puede extender una tangente desde el punto [xi, f(xi)]. El punto
donde esta tangente cruza al eje x, representa una aproximación a la raíz. El
proceso se repite comenzando con x1, se obtiene una nueva aproximación x2 y así
sucesivamente, hasta que un valor xi, satisfaga │f(xi) │≤ i│xi+1 - xi│< o ambos.
Si lo anterior no se cumple en un máximo de iteraciones, debe de iniciarse con un
nuevo valor de x0.
El método de Newton-Raphson se puede derivar geométricamente. En la figura, la
primera derivada en x es equivalente a la pendiente.

   
fx 
f x 0
1 x x
i
i i1

que se puede ordenar para obtener la ecuación central del algoritmo como

Página 19 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

f x  
 
x x  i
i1 i f x
i

Ejemplo

Encuentre la raíz real de la ecuación empleando el método de Newton-Raphson.

f(x) = x3 + 2x2 + 10x -20

par x0, con aplicado a │xi-1+ xi) │

Se sustituyen f(x) y f´(x) en la ecuación de Newton-Raphson.

x 3  2 x 2  10 x  20
x x  i i i
i 1 i 3
3 x  4 x  10
i i

Primera iteración

13  21  101  20
2
x 1  1.41176
31  41  10
1 2

como x1 ≠ x0, se calcula x2. Durante el proceso de iteración se obtienen los


siguientes resultados.

i xi │xi+1 - xi│
0 1
1 1.4118 0.4118
2 1.3737 0.0381
3 1.3693 0.0044
4 1.3688 0.0004
5 1.3688 0.0000

Como se observa solo se requirieron de cuatro iteraciones para satisfacer el


criterio de convergencia; además se obtuvo una mejor aproximación a x que en
ejemplo anterior. Se observa que x5, ya no cambia con respecto a x4 en cinco
cifras decimales.

Página 20 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Fallas del método de Newton-Raphson.

Cuando el método de Newton-Raphson converge se obtienen los resultados en


relativamente pocas iteraciones, ya que para raíces no repetidas este método
converge con orden 2 y el error i+1 es proporcional al cuadrado del error anterior
i. De esto puede afirmarse que cada iteración duplica aproximadamente el
número de dígitos correctos.

Sin embargo, algunas veces el método de Newton-Raphson no converge sino


oscila. Esto ocurre si no hay raíz real, o si el valor inicial está muy alejado de la
raíz buscada y alguna otra parte de la función “atrapa” la iteración.

El método de Newton-Raphson requiere la evaluación de la primera derivada de


f(x). En la mayoría de los problemas de los textos este requisito es trivial, pero
este no es el caso en problemas reales donde, por ejemplo, la función f(x) está
dada en forma tabular.

De allí la importancia de estudiar otros métodos para resolver f(x) = 0 que no


requieran el calculo de f´(x), pero que retengan algunas de las propiedades
favorables de convergencia del método de Newton-Raphson. Alguno de estos
métodos con estas características se presentan a continuación.

1.4.3 Método de la secante

El método de la secante consiste en aproximar la derivada f´(x) de la ecuación de


Newton-Raphson por el cociente

 
f x  f  x 
i  i1  ,
x x
i i1

formado con los resultados de las dos iteraciones anteriores xi-1 y xi. De esto
resulta la formula

 x  x  f x  
i1  i  g  x 
x x 
i
 
(A)
i1 i f x  f  x   i
i  i1 

Página 21 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

para la primera aplicación de esta ecuación e iniciar el proceso iterativo, se


requiere de los valores iniciales: x0 y x1. La siguiente aproximación, x2, está dada
por
 x  x  f x 
x  x   1 0 1
1
 
2 1 f x  f  x 
 0

la de x3 por


x x f x  
x x  2 1
   
2
3 2 f x f x
2 1

y así sucesivamente hasta que g(xi) = xi+1 o una vez

│xi+1 - xi│< 

│f(xi+1)│< 

Ejemplo

Use el método de la secante para encontrar la raíz real de la ecuación polinomial

f(x) = x3 + 2x2 + 10x -20 = 0

Con la ecuación A se obtiene

 x  x  f  x 3  2 x 2  10 x  20 
 i i1   i i i 
x x  
i1  x 3  2 x 2  10 x  20    x 3  2 x 2  10 x  20 
i
 i i i   i 1 i 1 i 1 

Mediante x0 = 0 y x1 = 1 se calcula x2
Los valores de las iteraciones subsecuentes se presentan en la tabla

Página 22 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

i xi │xi+1 - xi│
0 0
1 1 1.0000
2 1.5385 0.5385
3 1.3503 0.1882
4 1.3679 0.0176
5 1.3688 0.0009
│xi+1 - xi│≤  = 10-3

1.4.4 Método de la posición falsa

El método de posición falsa, también llamado Regula-Falsi, al igual que el


algoritmo de la secante, aproxima la derivada f´(xi) de la ecuación de Newton-
Raphson por el cociente

 
f x  f  x 
i  i1  ,
x x
i i1

pero en este caso los valores de xi y xi-1 se encuentran en lados opuestos de la


raíz buscada y sus valores funcionales correspondientes tienen signos opuestos;
esto es

 
f x  f  x   0
i  i1 

se denota xi y xi-1como xD y xi, respectivamente.

Partimos del hecho de que se tienen dos valores iniciales xD y xi y que la función
es continúa en (xI,xD).

Se traza una línea recta que une los puntos A y B de coordenadas (xI, f(xI)) y (xD,
f(xD)), respectivamente. Se reemplaza f(x) en el intervalo (xI,xD) con el segmento
de recta AB y el punto de intersección de este segmento con el eje x, xM, será la
siguiente aproximación a x .

Página 23 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Se evalúa f(xM) y su signo se compara con el de f(xD). Si son iguales, se actualiza


xD sustituyendo su valor con el de xM; si los signos son diferentes, se actualiza xI
sustituyendo su valor con el de xM. El objetivo es mantener los valores descritos xD
y xi cada vez más cercanos entre sí y la raíz entre ellos.

Se traza una nueva línea secante entre los puntos actuales A y B y se repite el
proceso hasta que se satisfaga el criterio de exactitud │f(xM)│< 1 tomándose
como aproximación a x el valor último de xM. Para terminar el proceso también
puede usarse el criterio │(xD – xI)│< En este caso se toma como aproximación
a x la media entre xD y xI.

Para calcular el valor de xM se sustituye xD por xi y xI por xi-1 en la ecuación de la


secante con lo que se llaga a

x  x f xD   xI f xD  xD f xI  B)


f x  f x  f x  f x 
x x  D I
M D
D I D I

Ejemplo

Use el método de la secante para encontrar la raíz real de la ecuación polinomial

f(x) = x3 + 2x2 + 10x -20

Página 24 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Para obtener xD y xI se puede, por ejemplo, evaluar la función en algunos puntos


donde este cálculo sea fácil o bien se puede graficar. Así

f(0) = -20
f(1) = -7
f(-1) = -29
f(2) = 16

Podemos ver que hay una raíz real, por lo menos, en el intervalo (1,2); por tanto

xD = 1; f(xD) = -7
xI = 2; f(xI) = 16

Al aplicar la ecuación B) se obtiene xM

(1  2)(7)
x 1  1.30435
M  7  16

f(xM)= (1.30435)3 + 2(1.30435)2 + 10(1.30435) - 20

Como f(xM) < 0, (igual signo que f(xD)), se reemplaza el valor de xD con el de xM,
con lo cual queda el nuevo intervalo como (1.30435). Por tanto

xD = 1; f(xD) = -1.30435
xI = 2; f(xI) = 16

se calcula una nueva xM

La tabla muestra los cálculos llevados a cabo hasta satisfacer el criterio de


exactitud

│f(xM)│≤ 10-3

i xD xI xM │f(xM)│
0 1 2
1 1 2 1.30435 1.3348
2 1.3043 2 1.35791 0.2291
3 1.3579 2 1.36698 0.0386
4 1.3670 2 1.36850 0.0065
5 1.3685 2 1.36876 0.0011
6 1.3688 2 1.36880 0.0002

Página 25 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

1.4.5 Método de la bisección

Este método es similar al de la posición falsa, auque algo más simple. Como en el
método de la posición falsa, también se requieren dos valores iniciales a ambos
lados de la raíz y que sus valores funcionales correspondientes sean de signos
opuestos.

En este caso el valor de xM se obtiene como el punto medio entre xD y xI.

(x  x )
x  I D
M 2

Dependiendo de la función que se tenga en particular, el método de la bisección


puede converger más rápidamente o lentamente que el método de posición falsa.
Su gran ventaja sobre el método de posición falsa es que proporciona el tamaño
exacto del intervalo en cada iteración (en ausencia de errores de redondeo). Para
aclarar esto, note que en este método después de cada iteración el tamaño del
intervalo se reduce a la mitad; después, de n iteraciones el intervalo original se ha
reducido 2n veces. Por lo tanto si el intervalo original es de tamaño a y el criterio
de convergencia aplicado al valor absoluto de la diferencia es , entonces se
requerirán n iteraciones, donde n se calcula con la igualdad de la expresión

a ln a  ln 
, donde: n
2n ln 2

Ejemplo

Utilice el método de bisección para obtener una raíz real del polinomio

f(x) = x3 + 2x2 + 10x -20

Con los valores iniciales obtenidos en el ejemplo del método anterior

xD = 1; f(xD) = -7
xI = 2; f(xI) = 16

Si  = 10-3, el número de iteraciones n será

ln a  ln  ln 2  1  ln 103
n   6.64
ln 2 ln 2

aproximadamente se requieren 7 iteraciones

Página 26 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Primera iteración

1 2
x   1.5 ; f(xM)) = 2.88
M 2
Como f(xM) = > 0 (distinto signo de f(xD)), se reemplaza el valor de con el de xM, con lo
cual quede un nuevo intervalo (1,1.5). Entonces

xD = 1; f(xD) = -7
xI = 1.5; f(xI) = 2.88

Segunda iteración

1  1.5
x   1.25 y f(xM)= -2.42
M 2
Como ahora f(xM) = < 0 (distinto signo de f(xD)), se reemplaza el valor de xD con el valor
de la nueva xM; de esta manera queda como intervalo (1.25, 1.5).

En la tabla se muestran los cálculos, el criterio │xi+1 – xi│ = 10-3 se satisface en diez
iteraciones; es decir, tres más de las previstas en la ecuación de la bisección,
debido principalmente a los errores de redondeo involucrados en el método.

En la tabla de resultados se nota que si  se hubiese aplicado sobre │f(xM)│, se


habría requerido 13 iteraciones en lugar de 10. En general se necesitarán más iteraciones
para satisfacer un valor de  sobre │f(xM) │ que cuando se aplica a │ xi+1 – xi│.

i xD xI xM │xMi - xMi+1│ │f(xM)│


0 1 2
1 1 2 1.5000 2.8750
2 1 1.5000 1.2500 0.2500 2.4219
3 1.2500 1.5000 1.3750 0.1250 0.1309
4 1.2500 1.3750 1.3125 0.0625 1.1687
5 1.3125 1.3750 1.3438 0.0313 0.5248
6 1.3438 1.3750 1.3594 0.0156 0.1985
7 1.3594 1.3750 1.3672 0.0078 0.0342
8 1.3672 1.3750 1.3711 0.0039 0.0483
9 1.3672 1.3711 1.3691 0.0020 0.0070
10 1.3672 1.3691 1.3682 0.0010 0.0136
11 1.3682 1.3691 1.3687 0.0005 0.0033
12 1.3687 1.3691 1.3689 0.0002 0.0019
13 1.3687 1.3689 1.3688 0.0001 0.0007

Página 27 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Ejemplos

Se emplea un intercambiador de calor como se indica en la figura para enfriar


105,000 de aceite empleando agua. Encuentre la temperatura de salida del aceite
y del agua de enfriamiento (TH2 y TC2, respectivamente).

Resolviendo

Un balance de calor para el aceite da

Q1 = w1Cp1 (TH1 – TH2) (1)

Un balance de calor para el agua da

Q2 = w2Cp2 (TC2 – TC1) (2)


Agua w1 = 73556 lb/h
TC1 = 80°F
Btu
Cp2 = 1
lbF

Btu
Aceite U = 120
2
TH1 = 250°F hft F
2
Btu A = 879 ft
Cp1 = 0.5 TH2 = ?°F
lbF

TC2 = ?°F

La ecuación que rige la transferencia de calor en este equipo es


Q = U A Tm (3)

donde

U = coeficiente global de transferencia de calor


A = área total de transferencia de calor

(4)

Página 28 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Para encontrar TH2 y TC2 debe cumplirse que Q1 = Q2, o bien

Q
1 0 (5)
Q
1

Pero Q sólo podrá calcularse cuando se conozcan todas las temperaturas. Para
resolver este problema se propone el siguiente procedimiento
Establecer que TH2 sea la única variable; entonces, Q2 puede escribirse en
función de TH2 como sigue

(6)

de donde puede despejarse TC2

(7)

Establecemos Q en función de TH2 y escribimos la ecuación 3 en función de dicha


variable.

(8)
Valores iniciales
Para estimar un valor inicial de TH2 podemos apoyarnos en la siguiente figura la
cual muestra una gráfica de temperaturas en este tipo de intercambiadores de
calor. De acuerdo con esta gráfica, se tienen las siguientes restricciones

Página 29 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

TH1

TH2
TC2
TC1

0
L
Gráfica de temperaturas contra longitud en un intercambiador de calor con flujo a contracorriente

Empleando el método de bisección con TH2I = TC1 + 0.5 y TH2D = TH1 - 0.5 para
resolver la ecuación (8) tenemos los siguientes resultados

Resultados

TH2 =175.16°F y TC2 = 133.41°F

i xD xI xM Q Q1 │xMi - xMi+1│ f( TH 2 ) │f(TH 2 )│


0 249.50 80.50
1 249.50 80.50 165 3812270 4462500 84.50 -0.14571 0.14571
2 249.50 165.00 207.25 4296508 2244375 42.25 0.91434 0.91434
3 207.25 165.00 186.125 4055546 3353437.5 21.13 0.20937 0.20937
4 186.13 165.00 175.563 3934201 3907968.75 10.56 0.00671 0.00671
5 175.56 165.00 170.281 3873309 4185234.38 5.28 -0.07453 0.07453
6 175.56 170.28 172.922 3903773 4046601.56 2.64 -0.03530 0.03530
7 175.56 172.92 174.242 3918992 3977285.16 1.32 -0.01466 0.01466
8 175.56 174.24 174.902 3926598 3942626.95 0.66 -0.00407 0.00407
9 175.56 174.90 175.232 3930400 3925297.85 0.33 0.00130 0.00130
10 175.23 174.90 175.067 3928499 3933962.4 0.17 -0.00139 0.00139
11 175.23 175.07 175.15 3929449 3929630.13 0.08 -0.00005 0.00005
12 175.23 175.15 175.191 3929924 3927463.99 0.04 0.00063 0.00063
13 175.19 175.15 175.171 3929687 3928547.06 0.02 0.00029 0.00029
14 175.17 175.15 175.16 3929568 3929088.59 0.01 0.00012 0.00012

Página 30 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Ejemplo

En ingeniería eléctrica, se emplea a menudo la ley de Kirchoff para estudiar el


comportamiento de los circuitos eléctricos en estado estacionario (que no varían
con el tiempo). Otro tipo de problemas son los de corriente momentánea e implica
a los circuitos donde súbitamente suceden cambios temporales. Esta situación
ocurre cuando se cierra el interruptor de la figura. En este caso, después de cerrar
el interruptor hay un periodo de ajuste hasta que se alcanza un estado
estacionario. La longitud de este periodo de ajuste está relacionada con las
propiedades de almacenamiento de carga del capacitor y con el almacenamiento
de energía dentro del inductor. El almacenamiento de energía puede oscilar entre
estos dos elementos durante un periodo transitorio. Sin embargo, la resistencia en
el circuito disipa la magnitud de las oscilaciones.
El flujo de corriente a través de la resistencia causa una caída de voltaje (V R) dado
por:
VR = iR

en donde i es la corriente y R es la resistencia del circuito. Las unidades de i y R


son amperes y ohm respectivamente. Las unidades del V es el volt.

De manera semejante, un inductor resiste el cambio en la corriente, de forma tal


que la caída de voltaje (VL) al cruzarlo es de:

di
VL  L
dt

en donde L es la inductancia. Las unidades de L e i son henrios y amperes


respectivamente y la de t es el segundo.

La caída del voltaje a través del capacitor (VC) depende de la carga (q) sobre el
mismo.

q
VC 
C

en donde C es la capacitancia. La unidad de C es el faradio.

Página 31 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

La segunda ley de Kirchoff indica que la suma algebraica de las caídas de voltaje
en un circuito cerrado es cero. Después de cerrar el interruptor se tiene:

di q
L  Ri   0
dt C

Sin embargo, la corriente esta dada en función de la carga como:

dq
i
dt

Por lo tanto

Esta es una ecuación diferencial ordinaria de segundo orden que se puede


resolver usando los métodos de cálculo. La solución esta dada por:

donde t = 0, q = V0C, y V0 es el voltaje de la batería. Esta ecuación describe la


variación de la carga en el capacitor en función del tiempo. La solución q(t) se
encuentra graficada en la siguiente figura.

Un típico problema en ingeniería eléctrica puede


ser que se necesita determinar la resistencia
apropiada para disipar energía a una velocidad
constante, con los valores de L y C conocidos. En
este caso se supone que la carga se debe disipar al
1% de su valor original (q/q0 = 0.01) en t = 0.05 s,
con L = 5H y C = 10-4°F.

Página 32 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Solución: es necesario resolver para R la ecuación anterior, usando los valores


conocidos de q, q0, l y C. Para esto emplearemos un método numérico de los aquí
vistos ya que R es una variable implícita de la ecuación. Reordenando la ecuación
y empleando el método de bisección.

o, usando los valores numéricos dados:

Un rango inicial razonable de R es de 0 a 400 (ya que 2000 – 0.01R2) debe ser
mayor de cero). Esto de acuerdo con la gráfica de la ecuación. Con veintiún
iteraciones, se obtiene R = 328.1515, con un error menor al 0.0001%.

Gráfica de la ecuación usada en la obtención de valores iniciales de R que encierran a la raíz.

De esta manera se puede especificar una resistencia con este valor en el


diagrama de la figura de la batería y esperar que la disipación sea consistente con
los requisitos del problema.

Página 33 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

2. Sistemas de ecuaciones lineales

2.1 Sistema de ecuaciones

Un sistema de ecuaciones lineales es un conjunto de ecuaciones de la forma:

a0x + b0y + ...+ c0z.. = r0


a1x + b1y + ...+ c1z.. = r1
   
anx + bny + ...+ cnz.. = rn

donde a0 ...an , b0 ... bn ; c0 ... cn se llaman coeficientes y son números reales, r0...rn
también son números reales y se llaman términos independientes; y x, y, z las
incógnitas o variables.

Para que el sistema de ecuaciones sea lineal, debe cumplirse que ninguna de las
incógnitas esté elevada a ninguna potencia, ni entera ni fraccionaria, ni tampoco
aparezca en un denominador o como exponente o índice de una raíz. Por ejemplo,
los sistemas:

3x2+ 2y = 13
x - y2= -3
y
x + y1/3-4 z = 0,46
y
4x - +z=8 no son lineales.
z

Cada ecuación de un sistema representa, en el caso de existir dos incógnitas, la


ecuación de una recta, y en el caso de tres incógnitas, la ecuación de un plano.
Cuando el número de incógnitas es superior a tres, estamos hablando de espacios
de cuatro, cinco y más dimensiones, que son difíciles de imaginar gráficamente
pero que revisten interés teórico.

Los valores de x, y, z, y cuantas incógnitas existan se llaman conjunto solución del


sistema. También podemos llamar raíces del sistema tanto a los valores de las
incógnitas, como a la expresión literal de ellos en el caso que trabajemos con
letras y no con números. Los valores de las incógnitas no son intercambiables y
deben satisfacer individualmente a cada ecuación, con lo cual verifican todo el
sistema.

Algunas veces hay más de una solución, y entre estas soluciones deben elegirse
aquellas que vayan de acuerdo a los enunciados: por ejemplo, si el enunciado

Página 34 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

pide que averigüemos una cierta cantidad de monedas, tendremos que descartar
entre las soluciones obtenidas aquellas que sean fraccionarias y negativas.

Por razones de convención las incógnitas se presentan ordenadas en cada


ecuación: primero x, luego y, luego z. Esta convención aparentemente arbitraria
tiene justificación cuando veamos el método de resolución por determinantes.

2.2 Clases de sistemas de ecuaciones

Podemos encontrar sistemas con tres características: compatibles determinados,


compatibles indeterminados e incompatibles.
Los sistemas compatibles determinados son aquellos que tienen solución única:
hay un solo par ordenado o conjunto solución que satisface simultáneamente a
todas las ecuaciones. Por ejemplo, el sistema:

-5x + y – z = 24
2x + 4y – 3z = 11
7x + 5y + z = 10

la segunda y tercer ecuación son equivalentes, ya que ésta última resulta de


multiplicar a la segunda por 2,5. Por lo tanto una de ellas es redundante, no aporta
información adicional por ser una combinación lineal de la otra y cualquiera de
ellas puede ser eliminada; de hecho, los métodos que veremos pronto ponen de
relieve que en caso de existir ecuaciones equivalentes estas quedan eliminadas
durante el proceso del cálculo.

Eliminemos la tercera. El sistema queda reducido a la forma:

4x + y - z = 13
4x - 2y + 6z = 42

En este sistema la cantidad de incógnitas supera a la cantidad de ecuaciones.


Supongamos que despejamos z de ambas ecuaciones:

z = 4x + y – 13

42  4x  2y
z
6

seguimos teniendo dos ecuaciones, pero igualadas a z, cuyo valor se desconoce.


Por lo tanto la cantidad de ecuaciones disponibles es insuficiente para obtener
valores definidos para las incógnitas. Por lo tanto este sistema es indeterminado.
Su resolución dependerá entonces de asignar un valor arbitrario a una de las

Página 35 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

incógnitas y obtener para dicho valor los correspondientes a las incógnitas


restantes. Entonces, como se pueden asignar infinitos valores arbitrarios, hay
infinitas soluciones para un sistema de esa naturaleza.

Un sistema de ecuaciones puede ser compatible: esto es, cuando las ecuaciones
que lo forman se verifican necesariamente para el mismo conjunto solución. Esto
quiere decir que si reemplazamos en cada ecuación las incógnitas por sus valores
obtendremos la igualdad.

Cuando una o más ecuaciones no verifican la igualdad, se dice que el sistema es


incompatible, es decir que no hay un conjunto solución que satisfaga a todas las
ecuaciones simultáneamente. Por ejemplo este sistema:

x + y + z = 12
x + 2y + z = 19
x + y + z = 21

En este caso la incompatibilidad surge inmediatamente a la vista si observamos la


primera y la tercera ecuación: no es posible que tres valores cualquiera de x, y, z,
al ser sumados den dos totales diferentes.

2.3 Métodos de resolución

Hay cuatro métodos prácticos para la resolución de sistemas de ecuaciones


lineales, y se llaman: sustitución, igualación, reducción por suma o resta y
determinantes.

2.3.1 Método por sustitución

Consiste en despejar una de las incógnitas en una cualquiera de las ecuaciones y


reemplazar la expresión obtenida en otra ecuación del sistema:

5x + 8y = 4 (1)
4x - 3y = 22 (2)

Despejamos cualquiera de las incógnitas de (1):

4  8y 4  5x
x y
5 8

y reemplazamos el resultado en la ecuación (2):

Página 36 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

 4  8y   4  5x 
4   3y  22 4x  3   22
 5   8 

16  32y 12  15x
 3y  22 4x   22
5 8

eliminamos los denominadores:

yyxx
y yx
94
y 188
47 x
y  2 47
x4

Verificación:

Reemplazando los valores de x e y obtenidos en las ecuaciones:

(5)(4) + 8(-2) = 4  20 - 16 = 4
(4)(4) - 3(-2) = 22 16 - (-6) = 22

vemos que el par ordenado (4;-2) es solución de la ecuación planteada.

2.3.2 Método de igualación

El método consiste en despejar la misma incógnita de ambas ecuaciones del


sistema y luego igualar las expresiones obtenidas, de modo tal de obtener una
ecuación con una sola incógnita que conjuga las dos ecuaciones originales.

Para verlo prácticamente, tomemos el sistema:

-5x + 4y = -18
2x - 3y = -4

Igualando en x Igualando en y

 4  3y  18  5x
x y
2 4

 18  4y  4  2x
x y
5 3

Página 37 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

igualando miembro a miembro las dos expresiones en x y en y:

 4  3y  18  4y  18  5x  4  2x
 
2 5 4 3

Ahora se resuelven las ecuaciones resultantes, que son ecuaciones enteras de


primer grado con una incógnita:

5(-4 + 3y) = -2(-18 - 4y) 3(-18 + 5x) = -4(-4 - 2x)

Aplicamos propiedad distributiva de la multiplicación respecto de la suma para


eliminar los paréntesis:

-20 + 15y = 36 + 8y -54 + 15x = 16 + 8x


15y - 8y = 36 + 20 15x - 8x = 16 + 54
7y = 56 7x = 70
y=8 x = 10

Verificación: reemplazando los valores obtenidos:

(-5)(10) +(4)(8) = -18  -50 + 32 = -18


(2)(10) – (3)(8) = -4  20 - 24 = -4

vemos que se verifica la igualdad.

2.3.3 Método por reducción por suma o resta

El método se basa en la propiedad fundamental de las ecuaciones, que específica


que de cualquier ecuación se obtiene otra equivalente si se multiplican o dividen
ambos miembros por el mismo número real, distinto de cero.

Dos o más ecuaciones son equivalentes si comparten el conjunto solución. Luego


de obtener la ecuación equivalente, se busca eliminar una de las variables por
suma o resta de ambas ecuaciones entre sí. Eliminada esta incógnita resulta fácil
despejar la restante.

Consideramos el sistema de ecuaciones:

8x + 7y = 57 (1)
6x + 8y = 62 (2)

Página 38 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Ahora elegimos una incógnita a eliminar, y multiplicamos la primera ecuación por


el coeficiente que ésta incógnita tiene en la segunda, y la segunda ecuación, por el
coeficiente que la incógnita tiene en la primera.

Tomemos por ejemplo la x:

Coeficiente de x en (2): 6 | 8x + 7y = 57  48x + 42y = 342|


Coeficiente de x en (1): 8  | 6x + 8y = 62  48x + 64y = 496|

ahora restamos la primera de la segunda:

48x + 42y = 342


-48x + 64y = 496
-22y = -154
y=7

Ahora apliquemos el mismo método para reducir la incógnita y: vemos que los
coeficientes son 7 y 8, entonces:
Coeficiente de y en (2): 8 | 8x + 7y = 57  64x + 56y = 4
Coeficiente de y en (1): 7 | 6x + 8y = 62 42x + 56y = 4

ahora repetimos el proceso, restando ambas ecuaciones:

64x + 56y = 456


-42x + 56y = 434
-22y = -154
y=7

Verificación:




2.3.4 Determinantes de los sistemas

A cada matriz n-cuadrada A = (aij) se le asigna un escalar particular denominado


determinante de A, denotado por det (A), | A | o

Página 39 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Una tabla ordenada n  n de escalares situada entre dos líneas verticales, llamada
determinante de orden n, no es una matriz. La función determinante apareció por
primera vez en el estudio de los sistemas de ecuaciones lineales. Veremos que es
una herramienta indispensable en el estudio y obtención de éstas.

A. Propiedades de los determinantes

Las propiedades básicas del determinante son las siguientes:


1. El determinante de una matriz A y el de su transpuesta AT son iguales, es decir,

2. Sea A una matriz cuadrada,


- Si A posee dos filas (columnas) iguales, necesariamente = 0.
- Si A es triangular, esto es, A sólo tiene ceros por encima o por debajo de la
diagonal principal, entonces es igual al producto de los elementos de la
diagonal.
3. Supongamos que B se ha obtenido de A mediante una operación elemental
entre filas o columnas,
- Si se han intercambiado dos filas (columnas) de A, |B| = - |A|.
- Si se ha sumado un múltiplo de una fila (columna) a otra, entonces |B| = |A|.
- Si se ha multiplicado una fila (columna) de A por un escalar k, |B| = k|A|.
4. Sea A cualquier matriz n-cuadrada, son equivalentes los siguientes principios:
- A es invertible, es decir, A tiene inversa A-1.
- AX = 0 tiene solamente la solución trivial.
- El determinante de A no es nulo: |A|  0.
5. El determinante es una función multiplicativa. Es decir, el determinante del
producto de matrices A y B es el producto de los determinantes: |AB| = |A| |B|.
6. Supongamos que A y B son matrices similares, entonces: |A| = |B|.

B. Determinantes de orden uno y dos.

Los determinantes de orden uno y dos se definen como sigue:

Página 40 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

= a11

Así, el determinante de una matriz 11A = (a11) es el propio escalar a11, es decir,

det (A) = |a11| = a11.


Ejemplos

1. Dado que el determinante de orden uno es el mismo escalar, tenemos

det (24) = 24, det(-3) = -3, det (3x+5) = 3x+5.

2.

C. Determinantes de orden tres

Consideremos una matriz 3  3 arbitraria A = (aij). El determinante de A se define


como sigue:

a12a21a33 - a32a23a11

Obsérvese que hay seis productos, cada uno formado por tres elementos de la
matriz. Tres de los productos aparecen con signo positivo (conservan su signo) y
tres con signo negativo (cambian su signo). Para calcular los determinantes de
orden tres, el siguiente diagrama puede ayudar a resolverlos:

Página 41 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Ejemplo:

Calcular el valor del determinante:

= 24 + 20 + 0 - (-4) - 0 - (-15) = 44 + 4 + 15 = 63

El determinante de la matriz 3  3 A = (ai j ) puede reescribirse como:

det (A) = a11(a22a33 - a23a32) - a12(a21a33 - a23a31) + a13(a21a32 - a22a31) =

que es una combinación lineal de tres determinantes de orden dos, cuyos


coeficientes (con signos alternantes) constituyen la primera fila de la matriz dada.
Esta combinación lineal puede indicarse de la forma siguiente:

Nótese que cada matriz 2  2 se obtiene suprimiendo en la matriz inicial la fila y la


columna que contienen su coeficiente.

Ejemplo:

Para demostrar que la propiedad anterior se cumple, trabajaremos con :

Página 42 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

= 3(8+5) - 2(0-10) + 1(0+4) = 39 + 20 + 4 = 63

D. Determinante de orden arbitrario


Sea A = (ann) una matriz de orden arbitrario n  n (siendo n un número par). Para
calcular el det (A) se procede de la siguiente manera:

Los signos se van alternando según la posición que ocupen las entradas del
determinante. Es decir:

Ejemplo:

Si observamos la matriz, podemos ver que en la tercera columna hay dos ceros.
Así pues, si cogemos las entradas de la tercera columna para calcular el
determinante, nos ahorraremos calcular dos determinantes, ya que el producto de
un determinante por cero es cero.

Página 43 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

+ = -1(-35) + 3(35) = 35 + 105 = 140.

2.4 Matrices

Las matrices se utilizan en el cálculo numérico, en la resolución de sistemas de


ecuaciones lineales, de las ecuaciones diferenciales y de las derivadas parciales.

Una matriz es una tabla ordenada de escalares ai j de la forma

La matriz anterior se denota también por (aij), i =1, ..., m, j =1, ..., n, o
simplemente por (ai j ). Los términos horizontales son las filas de la matriz y los
verticales son sus columnas. Una matriz con m filas y n columnas se denomina
matriz m por n, o matriz m  n.

Las matrices se denotarán usualmente por letras mayúsculas, A, B,..., y los


elementos de las mismas por minúsculas, a, b,...

Ejemplo:

donde sus filas son (1, -3, 4) y (0, 5, -2) y sus

2.4.1 Clases de matrices

Según el aspecto de las matrices, éstas pueden clasificarse en:

A. Matrices cuadradas

Página 44 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Una matriz cuadrada es la que tiene el mismo número de filas que de columnas.

Ejemplo: Sean las matrices

Donde A y B son matrices cuadradas de orden 3 y 2 respectivamente.

B. Matriz identidad
Sea A = (aij) una matriz n-cuadrada. La diagonal (o diagonal principal) de A
consiste en los elementos a11, a22,..., ann. La traza de A, escrito tr A, es la suma de
los elementos diagonales.

La matriz n-cuadrada con unos en la diagonal principal y ceros en cualquier otra


posición, denotada por I, se conoce como matriz identidad . Para cualquier matriz
A,

A· I = I ·A = A.

C. Matrices triangulares
Una matriz cuadrada A = (ai j ) es una matriz triangular superior o simplemente
una matriz triangular, si todas las entradas bajo la diagonal principal son iguales a
cero. Así pues, las matrices

son matrices triangulares superiores de órdenes 2, 3 y 4.

D. Transpuesta de una matriz


La transpuesta de una matriz A consiste en intercambiar las filas por las columnas
y se denota por AT. Así, la transpuesta de

Página 45 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

En otras palabras, si A=(ai j ) es una matriz m n, entonces AT = es la matriz


n  m. La transposición de una matriz cumple las siguientes propiedades:
1. (A + B)T = AT + BT.
2. (AT)T = A.
3. (kA)T = kAT (si k es un escalar).
4. (AB)T = BTAT.

E. Matrices simétricas
Se dice que una matriz real es simétrica, si AT = A; y que es asimétrica, si AT = -A.

Ejemplo: Consideremos las siguientes matrices:

Podemos observar que los elementos simétricos de A son iguales, o que AT = A.


Siendo así, A es simétrica. Para B los elementos simétricos son opuestos entre sí,
de este modo B no es simétrica. A simple vista, C no es cuadrada; en
consecuencia, no es ni simétrica ni asimétrica.

F. Matrices ortogonales
Se dice que una matriz real A es ortogonal, si AAT = AT A = I. Se observa que una
matriz ortogonal A es necesariamente cuadrada e invertible, con inversa A-1 = AT.
Consideremos una matriz 3  3 arbitraria:

Si A es ortogonal, entonces:

Página 46 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

G. Matrices normales
Una matriz es normal si conmuta con su transpuesta, esto es, si AAT = ATA.
Obviamente, si A es simétrica, asimétrica u ortogonal, es necesariamente normal.

Ejemplo:

Puesto que AAT = ATA, la matriz es normal.

2.4.2 Operaciones con matrices

A. Suma y resta de matrices


Para poder sumar o restar matrices, éstas deben tener el mismo número de filas y
de columnas. Es decir, si una matriz es de orden 3 2 y otra de 3  3, no se
pueden sumar ni restar. Esto es así ya que, tanto para la suma como para la resta,
se suman o se restan los términos que ocupan el mismo lugar en las matrices.

Ejemplo:

Para sumar o restar más de dos matrices se procede igual. No necesariamente


para poder sumar o restar matrices, éstas tienen que ser cuadradas.

Página 47 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Ejemplo:

B. Producto de matrices
Para poder multiplicar dos matrices, la primera debe tener el mismo número de
columnas que filas la segunda. La matriz resultante del producto quedará con el
mismo número de filas de la primera y con el mismo número de columnas de la
segunda. Es decir, si tenemos una matriz 2  3 y la multiplicamos por otra de
orden 3  5, la matriz resultante será de orden 2  5.

(2  3)  (3  5) = (2 5)

Se puede observar que el producto de matrices no cumple la propiedad


conmutativa, ya que en el ejemplo anterior, si multiplicamos la segunda por la
primera, no podríamos efectuar la operación.
3  5 por 2  3

puesto que la primera matriz no tiene el mismo número de columnas que filas la
segunda. Supongamos que A = (aij) y B = (bij) son matrices tales que el número
de columnas de A coincide con el número de filas de B; es decir, A es una matriz
m  p y B una matriz p  n. Entonces el producto AB es la matriz m  n cuya
entrada ij se obtiene multiplicando la fila i de A por la columna j de B. Esto es,

Página 48 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Ejemplo:

1.

2.

C. Producto por un escalar


El producto de un escalar k por la matriz A, escrito k·A o simplemente kA, es la
matriz obtenida multiplicando cada entrada de A por k:

Ejemplo:

Entonces:

C. División de matrices
La división de matrices se define como el producto del numerador multiplicado por
la matriz inversa del denominador. Es decir, sean las matrices A y B tal que A/B=
AB-1:
Si una matriz está dividida entre un escalar, todos los términos de la matriz
quedarán divididos por ese escalar.

Ejemplo:

Página 49 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

D. Matrices invertibles
Se dice que una matriz cuadrada A es invertible, si existe una matriz B con la
propiedad de que AB = BA = I siendo I la matriz identidad. Denominamos a la
matriz B la inversa de A y la denotamos por A-1.

Ejemplo:

Puesto que AB = BA = I, A y B son invertibles, siendo cada una la inversa de la


otra.

Método de Gauss: Sea A = (aij) una matriz cuadrada de orden n. Para calcular la
matriz inversa de A, que denotaremos como A-1, seguiremos los siguientes pasos:

Paso 1. Construir la matriz n 2n M = (A I) esto es, A está en la mitad izquierda


de M y la matriz identidad I en la derecha.
Paso 2. Se deja tal y como está la primera fila de M, y debajo del primer término
de la diagonal principal, a11, que llamaremos pivote, ponemos ceros. Luego se
opera como se indica en el siguiente ejemplo.

Ejemplo: Consideremos una matriz 3  3 arbitraria

Paso 1.

Página 50 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Paso 2.

El siguiente paso es igual que el anterior, pero esta vez se toma como pivote el
segundo término de la diagonal principal. Al llegar al último término de la diagonal,
se procede igual que antes, pero poniendo los ceros encima del nuevo pivote. Se
observa que al tomar como pivote el último término de la diagonal, la matriz A se
transforma en una matriz triangular.

Una vez realizados todos los pasos, la mitad izquierda de la matriz M se convierte
en una matriz diagonal. En este momento hay que proceder a transformar, si es
que no lo está, la mitad izquierda en la matriz identidad, dividiendo si fuera
necesario las filas de M por un escalar.

Ejemplo:

Supongamos que queremos encontrar la inversa de

Primero construimos la matriz M = (A I),

luego tomamos como pivote a22 = -1,

Página 51 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

La mitad izquierda de M está en forma triangular, por consiguiente, A es invertible.


Si hubiera quedado toda una fila con ceros en la mitad A de M, la operación habría
terminado (A no es invertible). A continuación, tomamos como pivote a33,
ponemos ceros encima de éste y seguimos operando hasta que nos quede una
matriz diagonal.

Ya que la matriz colocada en la mitad izquierda es diagonal, no hay que operar


más. Transformamos la matriz diagonal en una matriz identidad; para ello hay que
dividir la segunda fila entre -1:

La matriz que ha quedado en la mitad derecha de M es precisamente la matriz


inversa de A:

Para comprobar si el resultado es correcto, se procede a multiplicar AA-1, teniendo


que dar como resultado la matriz identidad I.

Comprobación:

AA-1 = I

Página 52 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Ejemplo

El ejercicio siguiente es un ejemplo que muestra la aplicación de matrices

Para el circuito eléctrico de la figura

su modelo matemático en forma matricial es:

 10  5 0   I 1  30
 5 13 6   I    0 
  2   
 0 6 10  I 3  V2 

Si se sabe que I1 + I2 + I3 = 0, obtenga los valores de I1, I2, I3 y V2

Ejemplo

Con los datos del diagrama siguiente (donde los porcentajes estan dados en
peso), encuentre los valores de las corrientes de M1, M2, M3 y M4.

83% etanol
M1 58% etanol
17% agua Tanque de M4 21% etanol
61% etanol 21% agua
M2 mezclado
39% agua

24% metanol
M3 55% etanol
21% agua
Página 53 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

La resolución de estos ejemplos de aplicación se realizarán en clase

2.5 Independencia lineal

Una expresión de la forma a x  a x    an xn


11 2 2
donde a1, a2,..., an son números reales y x1, x2,..., xn son vectores de m elementos
cada uno, se llama combinación lineal de los vectores x1, x2,..., xn.

A menudo los elementos de un vector xi de una combinación lineal, tendrá dos


subíndices; el primero indica la fila al que pertenece y el segundo se refiere al
vector a que corresponde, como se indica

x 
 1i 
x 
x   2i 
i 
 
x 
 mi 

 T
Se dice que un vector x  x x  xm , depende linealmente de un conjunto
1 2
de vectores de m elementos x1, x2,..., xn, si se pueden encontrar escalares a1,
a2,..., an, tales que cumpla la siguiente ecuación vectorial

x  a x  a x    a n xn
11 2 2

Si, por el contrario, no existen escalares que satisfagan tal ecuación, x es un


vector linealmente independiente de x1, x2,..., xn si y solo si x es una combinación
lineal de x1, x2,..., xn.

2.5.1 Independencia de conjuntos de vectores

Un conjunto de vectores dado y1, y2,..., yn, es linealmente dependiente si por lo


menos uno de ellos es combinación lineal de alguno o todos los vectores
restantes. Si ninguno lo es, se dice que es un conjunto linealmente independiente.

Ejemplo

Sea el siguiente conjunto de cuatro vectores de tres elementos cada uno.

Página 54 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

1  0.1  0.5   0.03 


       
y   4 , y   3, y   15, y   0.9,
1 2 3 4
 2 0  0   0 
       

Determine si es linealmente dependiente o independiente.

Solución

Este conjunto es linealmente dependiente, ya que y3 se obtiene de la


combinación,

0.1
 
y3 = 5 y y  5 3,
2
0
 

y y4 se obtiene de combinar y1 y y2 de la siguiente forma

 0.03  1  0.1
     
 0.9  04  0.3 3
 0   2 0
     

Si se considera el conjunto formado sólo por y1 y y2, se tiene que es linealmente


independiente, ya que ninguno se obtiene multiplicando al otro por algún escalar.
Cualquier conjunto que tenga el vector cero (vector cuyos componente son todos
cero), como uno de sus elementos, es linealmente independiente, ya que dicho
vector podrá obtenerse siempre de cualquier otro vector del conjunto por la
combinación
0  x 
   1i 
0 x 
0     0 2i 
 
   
0 x 
 ni 

Un conjunto formado por un solo vector (distinto de cero) es linealmente


independiente.

Página 55 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

2.5.2 Interpretación geométrica de la independencia lineal.

Resulta conveniente el estudio de la independencia lineal desde el punto de vista


geométrico, aunque esto solo sea valido para vectores de dos y tres componentes.
Consideremos los siguientes tres vectores en el plano x-y (fig. A). Por la geometría
se sabe que dos vectores que se cortan forman un plano. Por tanto, es natural
pensar que si se tiene un tercer vector en el plano x-y, éste puede obtenerse de
alguna combinación de los que cortan, por ejemplo de x3, x1 y x2, aplicando la ley
del paralelogramo.

Si, por otro lado, se tienen dos vectores de dos componentes linealmente
dependientes, esto se manifiesta geométricamente como paralelismo (vea los
vectores x1 y x2 de las figuras de abajo). Puede verse que estos vectores paralelos
no forman un plano y un tercer vector x3 que no sea paralelo a ellos no puede
generarse con una combinación lineal de x1 y x2.
En conclusión, la característica geométrica de dos vectores linealmente
independientes es que se cortan en un punto. En cambio, dos vectores
linealmente dependientes son paralelos.

Página 56 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

3 Estadística descriptiva
En la actualidad la estadística ha llegado a ser un instrumento de uso cotidiano
para todos los profesionistas que están en contacto con fenómenos de naturaleza
aleatoria, y que a partir de ciertos datos cuantitativos del fenómeno, deben tonar
decisiones sobre su comportamiento general.

Para su estudio la estadística se divide en: estadística descriptiva e inferencia


estadística.

Estadística Descriptiva: Es la parte de la Estadística que se ocupa de recopilar,


representar y condensar los datos obtenidos del sistema en estudio.

Estadística Inferencial: Es la parte de la Estadística dedicada a la formulación de


su-puestos y estimaciones, para hacer predicciones y poder sacar conclusiones de
los datos obtenidos con el estudio de las muestras. Y así, poder tomar decisiones
con base científica.

En este apartado se estudiaría la estadística descriptiva.

Para el estudio de la estadística descriptiva, se requiere definir los siguientes


conceptos:

3.1 Población

Es el conjunto de todas las muestras posibles, que pueden obtenerse del sistema
en estudio de acuerdo al método de selección empleado.

3.2 Muestra

Es un conjunto de datos obtenidos de una población cualquiera, con el método de


recopilación elegido. Se la puede imaginar como un subconjunto del conjunto
población.

Para obtener una muestra representativa, existen diferentes técnicas, entre las
cuales se encuentran las siguientes.

- Muestreo aleatorio: es recomendable cuando la población es suficientemente


pequeña, como para ser enumerada.
- Muestreo sistemático: tiene la limitación de no poderse aplicar a poblaciones
demasiado grandes, ni tampoco los datos presentan periodicidad.
- Muestreo estratificado: en esta técnica, la población se divide en clases o
estratos para hacer posteriormente una selección que puede ser aleatoria o

Página 57 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

sistemática dentro de cada estrato. la definición de cada clase debe ser


suficientemente clara para evitar que uno de los elementos se pueda ubicar en
dos clases diferentes.
- Muestreo por conglomerados: es semejante al anterior, en el sentido de definir
grupos de elementos; sin embargo, esta técnica se aplica cuando la población
es homogénea y existen grupos ya definidos.

3.2.1 Clasificación y organización

Cuando los datos de una muestra se encuentran desordenados es difícil obtener


información directamente de ellos. Una forma de ordenarlos es de forma
ascendente o descendente, sobretodo cuando la muestra es pequeña. Sin
embargo, cunado se trata de una muestra grande, el procedimiento anterior se
hace muy laborioso.

Con un ejemplo se presentará el procedimiento que generalmente se utiliza para


presentar los datos de una muestra grande en forma resumida y ordenada.

Ejemplo

Los siguientes datos representan la longitud en centímetros de 80 piezas de


madera que fueron seleccionadas en una bodega. Se requiere presentar los datos
en una forma resumida y ordenada.

Primero, calculamos el rango de la muestra que se define como la diferencia entre


el mayor y el menor de los elementos. Así, para los datos anteriores:

rango = 53.1 – 49.1 = 4

Página 58 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Para ordenar los ochenta datos de la muestra, se clasifican en varios intervalos,


denominados intervalos de clase.

La fijación de los intervalos de clase depende del criterio del analista, aunque debe
de tomar en cuenta lo siguiente:
El número de intervalos que se pueden establecer depende de la cantidad de
datos que contiene la muestra (tamaño de la muestra) y de la dispersión de los
mismos.

En general se recomienda establecer entre 5 y 15 intervalos, procurando que no


queden intervalos vacíos dentro del rango de valores.

También debe tenerse cuidado e la fijación de los límites de cada intervalo para
evitar, por un lado, la posibilidad de que un mismo elemento pertenezca a dos
intervalos diferentes y, por otro, que la magnitud de los intervalos difícil de
manejar.

S los datos comprendidos en un intervalo se distribuyen de manera uniforme, se


considera que el punto medio del intervalo puede representar a todos los valores
de la muestra que se encuentra en el. A dicho punto se le denomina marca de
clase.

En la dos primeras columnas de la siguiente tabla, se muestran los intervalos y


marcas de clase (tr) de la muestra que se esta ordenando.

Al número de elementos de la muestra que pertenece a un intervalo de clase r se


le llama frecuencia del intervalo y se representa como fr. La suma de las
frecuencias deberá ser igual al número total de elementos de la muestra de
tamaño n, o sea:

Página 59 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

donde m es el número de intervalos de clase para el ejemplo m = 5).

Al cociente de la frecuencia entre el número total de datos muéstrales se le llama


frecuencia relativa y se representa como f r esto es:

La frecuencia relativa de un intervalo de clase se puede interpretar como la


proporción de los datos que se encuentran en el intervalo correspondiente.

Finalmente, se define la frecuencia relativa acumulada Fr como la suma de las


frecuencias relativas hasta el r-ésimo intervalo, con lo cual:

r
Fr   f 
j1 j

En la tabla de arriba se presenta la muestra en forma agrupada y en ella se


encuentran los resultados de los conceptos definidos anteriormente.

3.2.2 Distribuciones empíricas.

Para determinar la distribución de probabilidad de una variable aleatoria que


representa un fenómeno en el modelo probabilístico teórico más aproximado a
ella, es útil construir la gráfica de las frecuencias, frecuencias relativas o
frecuencias relativas acumuladas.

Para representar las frecuencias o las frecuencias relativas se usa generalmente


el histograma, la frecuencia se considera constante en todos los puntos de cada
intervalo de clase, por lo que se representa como una sucesión de rectángulos del
mismo ancho y cuyas alturas corresponden a las frecuencias o a las frecuencias
relativas acumuladas de los intervalos correspondientes.

La figura representa el histograma del ejemplo que se está analizando.

Página 60 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

El polígono de frecuencia es otra gráfica que muestra la distribución de


frecuencias. Para construirlas se marca sobre el mismo sistema de ejes del
histograma una sucesión de puntos, cuya abscisas son las marcas de clase y las
ordenadas son las frecuencias o frecuencias relativas correspondientes. Después
se unen mediante rectas todos los puntos consecutivos. Para cerrar el polígono de
frecuencias en los extremos, se consideran otros intervalos con frecuencia cero.

El polígono de frecuencias del ejemplo se muestra en la siguiente figura.

Otra gráfica de uso frecuente para estimar la distribución de probabilidad de la


variable aleatoria es el polígono de frecuencias relativas acumuladas u ojiva.
La forma de graficarlo consiste en unir, mediante rectas, una sucesión de puntos
cuyas abscisas son los límites superiores de cada intervalo de clase y las
ordenadas son las frecuencias relativas acumuladas.

Página 61 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

En la figura se muestra el polígono de frecuencias relativas acumuladas que


corresponde al ejemplo que se esta trabajando.
F
i

3.2.3 Medidas descriptivas de una distribución de frecuencias.

Todas las medidas descriptivas que se definen a continuación para una


distribución de frecuencias se pueden definir también de manera semejante para
una distribución de probabilidad.

Las medidas descriptivas de de una distribución de frecuencias se utiliza para


estimar los parámetros correspondientes que describen a la población, debido a
que si la muestra es representativa, sus características son semejantes a las de la
población.

Generalmente se utilizan cuatro tipos de medidas descriptivas que son:

A. De tendencia central
B. De dispersión
C. De sesgo o asimetría
D. De curtosis o apuntamiento

A. Medidas de tendencia central

Con estas medidas se busca un valor que pueda representar a toda la muestra,
por encontrarse en el centro de ella, desde diferentes puntos de vista Las más
importantes medidas de tendencia central son las siguientes:

Página 62 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

1. Media ( X )

Se define como el promedio aritmético de los datos de una muestra. Para


diferenciarla de la media de la población re representa con X en lugar de x, de
esta forma:

donde xi es el i-ésimo elemento de la muestra.

Si los datos de la muestra están agrupados en una tabla de frecuencias, se


considera que la marca de clase (tr) representa a los valores xi que se encuentran
dentro del intervalo r-ésimo, de manera que la suma de todos os valores xi que se
encuentran en un intervalo de clase, equivale a sumar f r veces tr , con lo cual la
anterior expresión se escribe como:

donde m es el número de intervalos de clase.

Para simplificar la expresión se puede tomar en cuenta que la frecuencia relativa:

entonces

La media de los datos del problema estudiado en este apartado es.

2. Mediana (Me)

La mediana es el valor central de la variable, es decir, supuesta la muestra


ordenada en orden creciente o decreciente, el valor que divide en dos partes la
muestra.

Página 63 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

cuando la muestra es grande y sus elementos se encuentran agrupados, la


mediana puede obtenerse determinando primero el intervalos que contiene a la
mediana el cual se distinge porque es el primero que tiene una frecuencia relativa
a cumulada mayor o igual a 0.5 y posteriormente, mediante una interpolación
lineal se encuentra el valor de x que corresponde a la frecuencia relativa a
cumulada de 0.5.

Con el polígono de frecuencia relativa a cumulada se puede aproximar el valor de


la mediana, trazando una linea horizontal que parte de F´= 0.5 hasta cruzar el
poligono y, posteriormente, con otra recta vertical que parte del punto de la
intersección, se encuentra, en el eje de las absisas, el valor de la mediana.

La figura muestra la localización gráfica de la mediana sobre un polígono de


frecuencia relativa a cumulada.

Para hacer la interpolación lineal, se usa la ecuación de una recta, de la forma:

que en este caso, de acuerdo con la figura de arriba:

donde:

Página 64 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Sustituyendo los valores:

Despejando la mediana:

Así para nuestro ejemplo la mediana es

3. Moda

La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que


más se repite, es la única medida de centralización que tiene sentido estudiar en
una variable cualitativa, pues no precisa la realización de ningún cálculo.

Por su propia definición, la moda no es única, pues puede haber dos o más
valores de la variable que tengan la misma frecuencia siendo esta máxima. En
cuyo caso tendremos una distribución bimodal o polimodal según el caso.

Cuando la muestra es pequeña, la moda se determina directamente por


inspección, mientras que en muestras grandes, con datos agrupados, se puede
aproximar con la marca de clase del intervalo modal, que es el que tiene la
máxima frecuencia.

Página 65 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

De acuerdo con esto, se puede considerar que la moda debe pertenecer al


intervalo de clase con máxima frecuencia, pero proporcionalmente más cercano al
intervalo adyacente que le siga en frecuencia, de esta manera se puede plantear
la proporción:

donde:

despejando la moda

B. Medidas de dispersión

Las medidas de dispersión reflejan la separación o alejamiento de los elementos


de una muestra.

1. Rango
Se define como una medida de dispersión, puesto que indica la máxima
separación entre los datos.

2. Variancia
De una variable aleatoria se define como el segundo momento con respecto a la
media. De tal manera, para una distribución de frecuencias se define el momento
k-ésimo con respecto a la media como:

Y en consecuencia, la variancia muestral se define como:

Página 66 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Adicionalmente; si los datos están agrupados, cada marca de clase representa a


los valores que se encuentran dentro del intervalo correspondiente, con lo cual:

donde:
n = al tamaño de la muestra,
m = al número de intervalos de clase,
fr = a la frecuencia del intervalo r y
tr = a la marca de clase del intervalo r.

fr
como la frecuencia relativa fr '  , entonces:
n

La desviación estándar es otra medida de dispersión que para una distribución


de frecuencias, como en una distribución de probabilidad, es la raíz cuadrada de la
variancia:

y cuando los datos están agrupados:

3. Coeficiente de variación

Para una distribución de frecuencias), se define como el cociente de la desviación


estándar muestral entre la media muestral, esto es:

Para ilustrar este concepto tomemos el siguiente ejemplo.

Página 67 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

La producción de mineral de fierro en siete países durante 1980, fue la siguiente:

1, 9, 7, 0, 5, 8, 7, 7, 5, 9, 16 (miles de toneladas)

Obtener
a) la media
b) la desviación estándar
c) El coeficiente de variación

a)

b)

c)

C. Medidas de asimetría

Se utilizan cuando se desea ajustar un modelo probabilístico a un fenómeno


particular. Es decir, es conveniente comparar la forma del histograma o polígono
de frecuencias de una muestra del fenómeno, con la de la función de probabilidad
del modelo teórico.

Para describir la forma de la distribución de frecuencias de una muestra, se usa,


entre otros indicadores, la asimetría o sesgo. Una distribución de frecuencias es
simétrica si el tercer momento de la muestra con respecto a la media es igual a
cero (m3 = 0). Así si una distribución de frecuencias es simétrica, la media, la
mediana y la moda coinciden en el mismo punto, ver (a). Sin embargo, cuando la
figura no es simétrica se puede presentar una asimetría positiva, siendo m 3 > 0; o
bien una asimetría negativa donde m3 < 0.

Página 68 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Para medir en forma adimensional la asimetría de una distribución de frecuencias,


se utiliza el coeficiente de simetría por momentos (a3):

Si los datos están agrupados, se pueden aproximar los momentos con respecto a
la media:

Página 69 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Otra forma de medir la asimetría es mediante el coeficiente de Pearson (s),


teniendo la desventaja de que sólo aplica cuando la distribución es unimodal y se
puede demostrar que –1< s < 1.

Curtosis es otra característica que permite describir la forma de la distribución de


frecuencias.

Para medir la curtosis se puede usar el cuarto momento con respecto a la media
(m4). Así se define el coeficiente de curtosis como:

Sea el ejemplo de la tabla siguiente

Página 70 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

a) Determine el coeficiente de asimetría

b) El coeficiente de curtosis

3.3 Correlación

Parte de la estadística corresponde a la estadística inferencial y dentro de ella los


capítulos de correlación y regresión son muy usados en la investigación científica,
una herramienta muy útil cuando se trata de relacionar 2 o más variables,
relacionadas entre si. La correlación implica el grado de dependencia de una
variable respecto a otra y la regresión es otra técnica que ayuda en la
investigación.

La regresión como una técnica estadística, una de ellas la regresión lineal simple y
la regresión multifactorial, analiza la relación de dos o mas variables continuas,
cuando analiza las dos variables a esta se el conoce como variable bivariantes
que pueden corresponder a variables cualitativas, la regresión nos permite el
cambio en una de las variables llamadas respuesta y que corresponde a otra
conocida como variable explicativa, la regresión es una técnica utilizada para
inferir datos a partir de otros y hallar una respuesta de lo que puede suceder.

Siendo así la regresión una técnica estadística, por lo tanto para interpretar
situaciones reales, pero a veces se manipula de mala manera por lo que es
necesario realizar una selección adecuada de las variables que van a construir las
formulas matemática, que representen a la regresión, por eso hay que tomar en
cuenta variables que tiene relación.

Se pueden encontrar varios tipos de regresión, por ejemplo:

1. Regresión lineal simple


2. Regresión múltiple ( varias variables)
3. Regresión logística

a. Simple ó múltiple, etc.

La regresión lineal técnica que usa variables aleatorias, continuas se diferencia del
otro método analítico que es la correlación, por que esta última no distingue entre

Página 71 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

las variables respuesta y la variable explicativa por que las trata en forma
simétrica.

La matematización nos da ecuaciones para manipular los datos, como por ejemplo
medir la circunferencia de los niños y niñas y que parece incrementarse entre las
edades de 2 meses y 18 años, aquí podemos inferir o predecir que las
circunferencias del cráneo cambiara con la edad, en este ejercicio la
circunferencia de la cabeza es la respuesta y la edad la variable explicativa.

En la regresión tenemos ecuaciones que nos representan las diferentes clases de


regresión:

Regresión Lineal: y = A + Bx

Regresión Logarítmica: y = A + BLn(x)

Regresión Exponencial: y = Ac(bx)

Regresión Cuadrática: y = A + Bx +Cx2

Página 72 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

3.3.1 Coeficiente de correlación.

Para obtener un modelo de regresión es suficiente establecer la regresión para


eso se hace uso del coeficiente de correlación: R.

R = Coeficiente de correlación, este método mide el grado de relación existente


entre dos variables, el valor de R varía de -1 a 1, pero en la práctica se traba con
un valor absoluto de R.

El valor del coeficiente de relación se interpreta de modo que a media que R se


aproxima a 1, es más grande la relación entre los datos, por lo tanto R (coeficiente
de correlación) mide la aproximación entre las variables.

El coeficiente de correlación se puede clasificar de la siguiente manera:

Valores del coeficiente de correlación

1) Perfecta R = 1
2) Excelente R = 0.9 < = R < 1
3) Buena R = 0.8 < = R < 0.9
4) Regular 4) R = 0.5 < = R < 0.8
5) Mala 5) R < 0.5

3.3.2 Distribución divariante

La distribución diváriate es cuando se estudia en una población dos variables, que


forman pares correspondientes a cada individuo, como por Ejemplo:

Las notas de 10 alumnos en termodinámica y matemáticas

Termodinámica 2 4 5 5 6 6 7 7 8 9
Matemáticas 2 2 5 5 5 7 5 8 7 10

Los pares de valores son: (2, 2) (4,2) (5,5)…….(8,7) (9,10) forman una distribución
diváriate.

La correlación, método por el cual se relacionan dos variables se pude graficar con
un diagrama de dispersión de puntos, a la cual muchos autores le llaman nubes de
puntos, encuadrado dentro de un gráfico de coordenadas x-y en la cual se pude
trazar una recta y cuyos puntos mas cercanos de una recta hablaran de una
correlación mas fuerte, ha esta recta se le denomina recta de regresión, que
puede ser positiva o negativa, la primera contundencia a aumentar y la segunda
en descenso o decreciente.

Página 73 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

También se puede describir un diagrama de dispersión en coordenadas


cartesianas valores como en la distribución diváriate, en donde la nube de puntos
representa los pares de valores.

Gráficos de recta de regresión

Por último se pueden graficar las líneas de tendencia, herramienta muy útil para
el mercadeo por que es utilizada para evaluar la resistencia que proyectan los
precios. Cuando una línea de tendencia central se rompe ya sea con tendencia al
alza o en la baja es porque ocurre un cambio en los precios, por lo tanto las líneas
de tendencia pueden ser alcista cuando se unen los puntos sucesivos y bajista
cuando se unen los puntos máximos.

También existen gráficos que representan la dispersión de datos dentro de las


coordenadas cartesianas, ósea las nubes de puntos y que pueden darse según la
relación que representa, que puede ser lineal, exponencial y sin relación, esta
última cuando los puntos están dispersos en todo el cuadro sin agruparse lo cual
sugiere que no hay relación.

Los gráficos siguientes nos muestran esta relación:

Página 74 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Matemáticamente las ecuaciones serían:

Ajuste Lineal: Y = Bx + A
Ajuste Logarítmico: Y =BLnX + A
Ajuste Exponencial: Y = AC BX

En el modelo de regresión lineal simple se utiliza la técnica de estimación de los


mínimos cuadrados, este modelo tiene solo una variable de predicción y se
supone una ecuación de regresión lineal.

3.3.3 Regresión lineal simple.

Tiene como objeto estudiar cómo los cambios en una variable, no aleatoria,
afectan a una variable aleatoria, en el caso de existir una relación funcional entre
ambas variables que puede ser establecida por una expresión lineal, es decir, su
representación gráfica es una línea recta. Cuando la relación lineal concierne al
valor medio o esperado de la variable aleatoria, estamos ante un modelo de
regresión lineal simple. La respuesta aleatoria al valor x de la variable controlada
se designa por Yx y, según lo establecido, se tendrá

De manera equivalente, otra formulación del modelo de regresión lineal simple


sería: si xi es un valor de la variable predictora e Yi la variable respuesta que le
corresponde, entonces

Ei es el error o desviación aleatoria de Yi .

Página 75 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Estimación de los parámetros de la recta de regresión. El primer problema a


abordar es obtener los estimadores de los parámetros de la recta de regresión,
partiendo de una muestra de tamaño n, es decir, n pares (x1, Y1) , (x2, Y2), ..., (xn,
Yn); que representan nuestra intención de extraer para cada xi un individuo de la
población o variable Yi .

Una vez realizada la muestra, se dispondrá de n pares de valores o puntos del


plano (x1, y1), (x2, y2), ..., (xn, yn). El método de estimación aplicable en regresión,
denominado de los mínimos cuadrados, permite esencialmente determinar la recta
que "mejor" se ajuste o mejor se adapte a la nube de n puntos. Las estimaciones
de los parámetros de la recta de regresión obtenidas con este procedimiento son:

Por tanto la recta de regresión estimada será:

Estimación de los coeficientes de regresión por mínimos cuadrados. La


muestra de tamaño n: (x1, Y1) , (x2, Y2), ..., (xn, Yn), determinaría n pares de
observaciones (x1, y1), (x2, y2), ..., (xn, yn), que permiten definir los residuales o
residuos, respecto de la recta de regresión estimada:

Los residuos miden de alguna forma la cantidad que la regresión no es capaz de


explicar.

El método de estimación de los mínimos cuadrados establece los valores de los


parámetros de la recta de regresión muestral que minimizan SSE, la suma de
cuadrados de los residuos:

Página 76 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Igualando a cero las derivadas parciales de SSE respecto de los dos parámetros
de la recta de regresión y resolviendo el correspondiente sistema de dos
ecuaciones se obtendrían:

4. Variables aleatorias
La variable aleatoria es usada para describir eventos y una función de distribución
acumulativa será usada para determinar las probabilidades de cierto evento
definido en términos de variables aleatorias.

La ventaja de manejar variables aleatorias en lugar de los eventos de un espacio


muestral, se hace evidente cuando el resultado del experimento es cualitativo.

Se define como una función real que asocia un elemento numérico con cada uno
de los eventos elementales del espacio muestral. Al término variable aleatoria
también se le conoce como variable posible, cantidad incierta o variable
estocástica.

S R
X
A
x

En la figura anterior se observa la tranformación X: S  R, donde al punto muestral


A se le asigna el número x. La naturaleza del experimento no representa ningún
problema para asignar valores numéricos a los elementos del espacio muestral;
por ejemplo:

Si un experimento consiste en observar en un día, si llueve o no, se puede hacer


la asignación:

Página 77 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

S = {no llueve, llueve}  X {0,1}

Mediante la variable aleatoria X se asigna el número uno al evento llueve y el cero


al evento no llueve; sin embargo, ésta no es la única forma de hacer la asignación
y se podría asignar también los número {-1,1} respectivamente.

Cuando el resultado del experimento aleatorio es un número, generalmente se le


asigna ese mismo valor. Por ejemplo, en un experimento que consiste en observar
la temperatura de una máquina de combustión interna, la variable aleatoria X
puede tomar los mismo valores (x) observados en el termómetro, es decir X = x.

4.1 Variable aleatoria discreta

El evento de estudio en una encuesta con respecto a la preferencia de los


votantes no es la gente en particular de la muestra, ni el orden en el cual se
obtuvieron las preferencias, sino el número de votantes en favor de cierto
candidato o resultado. Este evento da lugar a una variable aleatoria, el número de
votantes de la muestra a favor de cierto candidato o resultado, que solamente
puede tomar un número finito de valores con una probabilidad diferente de cero.
Es decir, el valor observado de la variable aleatoria de interés tiene que ser un
número entero entre cero y el tamaño de la muestra. Una variable aleatoria de
este tipo se dice que es discreta.

“Una variable aleatoria X se dice discreta si solamente puede tomar un conjunto


numerable de valores”.

Para mejor entendimiento los valores de las variables aleatorias discretas son los
que provienen de conteos:

 Número de hombres en un estado determinado


 Número de mujeres con un nivel mayor de estudios al de su pareja
 La demanda mensual de automóviles en una distribuidora
 El número de personas que visita anualmente una localidad

En estos ejemplos no tiene sentido hablar de resultados fraccionarios y por


consiguientes sólo se definen para valores enteros de x.

Ejemplo.

Se lanza una moneda dos veces de tal forma que el espacio muestral es J = {CC,
CS, SC, SS}. Representándose por X el número de caras que pueden resultar.
Con cada punto muestral podemos asociar un número para X como se muestra en

Página 78 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

la siguiente tabla. Así en el caso de CC (dos caras) X = 2 y para SC (una cara) X


= 1. X es la variable aleatoria.

Punto muestral CC CS SC SS

X 2 1 1 0

Es importante mencionar que también podrían definirse otras variables aleatorias


en este espacio muestral, por ejemplo el número de soles, el cuadrado del número
de caras, el número de caras mayores a 0, etc.

4.1.1 Función de probabilidad de una variable aleatoria discreta

El comportamiento de una variable aleatoria discreta X puede estudiarse a través


de su función de probabilidad, la cual relaciona los resultados de un experimento
aleatorio con su probabilidad de ocurrencia y se denota P X (x), P(X=x) o P(x) y se
interpreta como la probabilidad de que la variable aleatoria X tome el valor
particular x.
Sea X una variable aleatoria discreta y supóngase que los valores posibles que
puede tomar están dados por x1, x2, x3,….., ordenadas en orden creciente de
magnitud. Supóngase también que los valores se asumen con probabilidades
dadas por
P(X=xk) = f(xk) k = 1,2,………..

Para x = xk , f(x) = 0

En general f(x) es una función de probabilidad si

1. f(x) ≥ 0
2. ∑ f(x) = 1
x

Ejemplo.

Hallar la función de probabilidad correspondiente a la variable aleatoria X del


ejemplo anterior y construir la gráfica de probabilidad.

a) Suponiendo que la moneda no está cargada de uno de sus lados

P(CC) = ¼ P(CS)= ¼ P(SC)= ¼ P(SS)= ¼

Página 79 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

P(X=0) = P(SS) = ¼
Que en una de las tiradas de los dados NO salga cara

P(X=1) = P(CS U SC) = P(CS) + P(SC) = ¼ + ¼ = ½


Que en una de las tiradas de los dados salga una cara

P(X=2) = P(CC) = ¼
Que en una de las tiradas de los dados salgan dos cara

La función de probabilidad está dada en la siguiente tabla

x 0 1 2
f(x) 1/4 1/2 1/4

b) La gráfica de probabilidad puede representarse como se indica en la figura


o por un histograma

4.1.2 Función de distribución de una variable aleatoria discreta

La función de distribución acumulada, o simplemente la función de distribución


para una variable aleatoria X se define por

P( X  x)  F ( x)
Donde x es cualquier número real, es decir -  < x < . La función de distribución
puede obtenerse de la función de probabilidad notando que

F ( x)  P( X  x)   f (u )
u x

Donde la suma a la derecha se toma para todos los valores de u para los cuales u
x. Así la función de probabilidad puede obtenerse de distribución.

Página 80 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Si X únicamente toma un número finito de valores x1, x2,….xn entonces la función


de distribución será

0 -< x < x1
f(x1) x1  x < x2
f(x1)+f(x2) x2  x < x3
F(x) = . .
. .
. .
f(x1)+….+f(xn) xn  x < 

Ejemplo.

Hallar la función de distribución para la variable aleatoria X del ejemplo anterior y


la representación gráfica.

0 -< x < 0
F(x) = ¼ 0x<1
¾ 1x<2
1 2x<

4.2 Variable aleatoria continua y su función de densidad

Una variable aleatoria es continua si su dominio de definición es el conjunto de los


números reales; es decir, cuando la variable puede tomar cualquier valor dentro de
cierto intervalo.

Este tipo de variables se presenta con más frecuencia en los sistemas físicos que
las variables discretas, debido a que la masa, el calor, el volumen, el tiempo y
otras características, pueden tomar cualquier nivel, dentro de una escala continua.

Página 81 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Una variable aleatoria continua puede tomar una infinidad de valores en un


pequeño intervalo; en consecuencia la probabilidad de que Y tome un valor
particular es prácticamente cero y para estudiar el comportamiento de la variable
se debe hablar de subintervalos, dentro de los cuales puede encontrarse el valor
de X.

Una variable aleatoria como la cantidad de lluvia diaria implica que cada intervalo
de números reales positivos tiene una probabilidad positiva de incluir un valor
observado. De esta manera si X, la variable aleatoria correspondiente a la
cantidad de lluvia diaria, tiene una función de densidad F(x). La densidad de
probabilidad es un concepto que indica cuáles son los subintervalos con mayor o
menor probabilidad, sin proporcionarla directamente.

La función de densidad de probabilidad denotada por f(x) se define de tal manera


que la probabilidad del evento (x1 ≤ X  x2) es igual a la integral definida de f(x) en
el intervalo [x1, x2]
x2

P(x1 ≤ X  x2) =  f ( x)dx


x1
Por la interpretación geométrica de la integral, también se puede relacionar la
probabilidad de que X se encuentre en el intervalo [x1, x2] con el área bajo la
función de distribución, como se muestra a continuación

La probabilidad de que X tome un valor específico x, sería el área bajo un punto


de la función de distribución.

Propiedades de la función de distribución

f(x) ≥ 0 ≦x

Página 82 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

 f ( x)dx  1


De esta manera la función de distribución acumulada queda de la siguiente forma

x
F ( x)  P( x  x0 )   f ( x)dx

Ejemplo.

Se ha observado el tránsito en la intersección de dos avenidas de mucha


afluencia, y se determinó la función de densidad de probabilidad del tiempo que
transcurre para que un automóvil logre pasar por el crucero; la función está dada
por:

0.1 0.1x x≥0

f (x)  0 x<0
Calcular la probabilidad de que un automóvil tarde en pasar cuando
menos cinco minutos.


P(X≥5)= 0.1 
0.1 x
dx 
0.1
 0.1
 
0   0.1(5)  0.6065
5

4.3 Medidas de tendencia central de variables aleatorias discretas y


continuas.

Entre los parámetros más importantes de tendencia central se encuentra la media,


el primer momento con respecto al origen, que generalmente se presenta por μx,

Página 83 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

conociendo la media de la distribución se tiene una idea del valor central de la


distribución.

Sea X una variable aleatoria. La media de X, denotada por μx, o E[X], está definida
por:

EX    xi f ( x)   xi PX  x

Si X es discreta con puntos x1, x2,……y


EX    xf ( x)dx


Si X es continua con función de densidad de probabilidad f(x).

Para una variable aleatoria es la suma de todos los valores de la variable dividida
entre el número total de elementos.

x  x2  x3  ....xn1  xn x i
X  EX   1  i 1
n n
La moda en una variable aleatoria es el valor que más se repite. Si una variable
aleatoria toma valores dentro del conjunto {x1, x2, ..., xn}, la moda será aquel xi que
dé el máximo en la función de probabilidad.

Se define la moda de una variable aleatoria X como el valor que hace máxima la
distribución de probabilidad o la función de densidad:

Mo = xk si P[X = xk] = máx. P[X = xi] si X es discreta

Mo = x0 si f(x0) = máx. f(x) si X es continua

La mediana es un valor que divide en dos mitades la integral de una función de


densidad de probabilidades. En el caso de la función de densidad de
probabilidades sea simétrica, es igual a la media.

Se define la mediana de X como:

Página 84 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Me = xk / F(xk-1) < ½ y F(xk) ≥ ½ si X es discreta;


x

Me = x /F(x) =  f ( x)dx

si X es continua:

Para el caso de variables aleatorias la mediana es el valor sobre el que hay igual
número de datos por encima y por debajo de él. La mediana puede definirse como
el valor central de los observados. Se ordenan los n datos de menor a mayor.

Cuando n es impar, la mediana es el valor del elemento que está a la mitad.


Cuando n es par, la mediana es la media de los dos elementos que están más
próximos a la mitad.

4.4 Medidas de dispersión de variables aleatorias discretas y


continuas.

Las medidas de dispersión dan una idea sobre la representatividad de las


medidas centrales, a mayor dispersión menor representatividad.

La llamada desviación típica o varianza, mide la dispersión con respecto a media


(lo que se podría desviar el resultado de la observación del experimento aleatorio
respecto a la media). La varianza se representa generalmente como σ2 o VAR[X]
y se define como:

Si se considera que a la esperanza como un promedio y a la diferencia (X-μx)


como la distancia entre un valor particular de X y su media, entonces se interpreta
a la varianza como el promedio de los cuadrados de las diferencias entre el valor
medio (μx) y los posibles valores de la variable aleatoria.

Como una medida de dispersión, la varianza tiene el inconveniente de


proporcionar valores con unidades que son el cuadrado de las que tiene la
variable aleatoria. Otra medida de dispersión es la desviación estándar, denotada

Página 85 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

por σ o σx y definida como la raíz cuadrada como la raíz cuadrada de la


varianza.


 x  E  X   x 2 
Si se desea comparar la varianza o la desviación estándar de varias variables con
diferentes unidades entre si, la comparación es válida, debido a que las
distribuciones de variables aleatorias, con unidades pequeñas, tendrán
aparentemente menos variación.

Para hacer este tipo de comparaciones se define otro indicador, denominado


coeficiente de variación, como el cociente de la desviación estándar entre la
media,

x
C.V . 
x
4.5 Medida de simetría de variables aleatorias discretas y continuas.

Existen también medidas que indican de la simetría o asimetría de la distribución y


del achatamiento o no de la misma. Empezando con la simetría, es lógico pensar
que si la distribución tiene una única moda y es simétrica, entonces las tres
medidas de centralización coinciden. Si no es simétrica, suele suceder que la
mediana esté comprendida entre la moda y la media. Medidas de simetría o
asimetría miden la mayor o menor simetría de la distribución.

Existen dos medidas de este tipo, el Índice de simetría de Fisher

 x i  
3

1  i 1
3

Página 86 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Si la distribución es simétrica, γ1 = 0; si es asimétrica a la derecha, γ1 > 0; y si es


asimétrica a la izquierda, γ1 < 0. Medidas de Curtosis. Miden la mayor o menos
concentración de datos alrededor de la media. Se suele medir con el coeficiente
de Curtosis.
n

 x i  
4

2  i 1
3
N 4

Si γ2= 0, la distribución recibe el nombre de mesocúrtica. Si el γ2> 0, la


distribución se llama leptocúrtica, mas puntiaguda que la anterior. Hay una mayor
concentración de los datos en torno a la media. Si γ2< 0, la distribución se llama
platicúrtica y hay una menor concentración de datos en torno a la media será más
achatada que la primera.

Ejemplo.

Sea X una variable aleatoria discreta con la siguiente distribución de probabilidad:

x -2 3 5 7
P(x) 0.2 0.4 0.3 0.1

Determinar:
a) La media
b) La desviación estándar
c) EL coeficiente de variación

Página 87 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Para el cálculo de la media

EX    xi f ( x)   xi PX  x = (-2)(0.2)+(3)(0.4)+(5)(0.3)+(7)(.1)=3

Para la desviación estándar

 
   2  E ( X   )  EX 2    2
2

En donde:

E[X2]= (-2)2(0.2)+32(0.4)+52(0.3)+72(0.1)=16.8

Por lo tanto

  16.8  32  2.79

Con los resultados anteriores y de la expresión se calcula el coeficiente de


variación.

 x 2.79
C.V .    0.93
x 3

5. Modelos probabilísticos comunes


Cuando se estudia un experimento aleatorio mediante la teoría de la probabilidad
y la estadística es necesario definir el comportamiento de las variables
involucradas. Una forma de hacerlo es mediante su función de probabilidad, sin
embargo, encontrar para cada variable su verdadera distribución de probabilidad
no es nada fácil, por lo tanto, se han desarrollado una gran cantidad de modelos
probabilísticas que explican satisfactoriamente el comportamiento de muchas
variables aleatorias.

Algunos de los modelos se ha desarrollado a partir de un experimento


denominado ensayo de Bernoulli, en el cual sólo se pueden presentar dos posibles
resultados, éxito y fracaso. La probabilidad de que ocurra un éxito se representa
con p y la probabilidad de que ocurra un fracaso con q o 1-p.

5.1 Distribución Binomial

Página 88 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Sea X una variable aleatoria que representa el número de éxitos en una secuencia
de n ensayos de Bernoulli con probabilidad p de éxito y 1-p de fracaso, entonces x
tiene distribución binomial con parámetros n y p.

A la función de una variable aleatoria X resultado de contar el número de éxitos al


repetir n veces una experiencia aleatoria con probabilidad de éxito p la llamamos
distribución binomial y la representamos por

B (n,p)

Para esta distribución se verifica que la variable X pueda tomar los valores
0,1,2,…….n. Y que la variable toma cada uno de estos valores con probabilidad

n
P X  x     p x 1  p 
n x

 x
La media está dada por:
μx = np

La varianza está dada por


σ2 = np(1-p) = n p q

La desviación estándar está dada por   npq

Ejemplo.

En una fábrica de automóviles se ha observado que el 10% de las unidades salen


defectuosos de la línea de producción. Si se selecciona un lote de cinco para ser
inspeccionado.

a) La probabilidad de no encontrar unidades defectuosas en un lote de


cuatro automóviles.
b) El número esperado de unidades defectuosas en el mismo lote
c) La varianza y la desviación estándar de la distribución

La variable X que representa el número de unidades defectuosas que hay en un


lote, tiene distribución binomial con parámetros n=4 y p=0.1
4
P X  0   0.10 1  0.1
4 0
= 0.9 4= 0.656
0

Página 89 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

μx = np = 4(0.1)= 0.4

σ2 = np(1-p) = n p q = (4)(0.1)(0.9)= 0.36

  npq = 0.36 = 0.6

5.2 Distribución Geométrica

Esta distribución es un caso especial de la Binomial negativa o Pascal, en donde


la variable aleatoria representa el número de ensayos necesarios para encontrar el
primer éxito en la secuencia de Bernoulli.

La función de probabilidad
P X  x   pq x1

La media está dada por:


1

p
La varianza está dada por
q
2 
p2

La desviación estándar está dada por


q

p2

Ejemplo.

El propietario de diez terrenos campestres en un centro turístico, está tratando de


venderlos por medio de entrevistas personales con los posibles compradores.
Considere que al entrevistarse con un posible comprador, existe la misma
probabilidad de vender o no vender y que el resultado de una entrevista es
independiente de lo que ocurre en las demás.

a) La probabilidad de que la cuarta persona entrevistada sea la primera en


comprar

Página 90 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

b) La media de la variable X que representa el número de clientes que se


tienen que entrevistar para realizar la primera venta
c) La varianza de X

Considerando como éxito realizar una venta p=0.5, entonces q=1-0.5=0.5

P X  4  0.5(0.5) 41 = 0.0625

La media sería

1
 2 entrevistas
0.5
La varianza sería

0.5
2  2
0.5 2

5.3 Distribución Pascal o binomial negativa

Sea X una variable aleatoria que representa el número de ensayos necesarios


para encontrar x éxitos en una secuencia de Bernoulli con probabilidad de éxito p,
entonces X tiene distribución Pascal con parámetros x y p. El último ensayo de la
secuencia tiene que ser un éxito para completar los x éxitos.

La función de probabilidad queda como sigue

P( x)  C (n  1, x  1) p x q n x
La media está dada por:
x

p
La varianza está dada por
xq
2 
p2

Página 91 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Ejemplo.

En una fábrica de automóviles se ha observado que el 10% de las unidades salen


defectuosos de la línea de producción. Si se selecciona un lote de cinco para ser
inspeccionado.

a) La probabilidad de que la quinta unidad observada sea la segunda


defectuosa
b) El número promedio de unidades que se debe observar para encontrar
cinco defectuosas

n=5 x= 2 p=0.1
P(2)  C (5  1,2  1)0.12 (1  0.1)52 = 0.02916

Ahora son 5 defectuosas x=5

5
 = 50 unidades
0.1

5.4 Distribución uniforme continua

Sea X una variable que puede tomar, con la misma probabilidad, cualquier valor
en el intervalo [a, b] entonces X tiene distribución uniforme con parámetros a y b.

En la realidad existen muy pocos experimentos cuyos resultados tengan la misma


probabilidad de ocurrencia. Sin embargo, en algunos casos se utiliza esta
distribución cuando no se cuenta con la información necesaria y se tienen que
asignar probabilidades a los eventos.

 f x dx  1


f x  
1
para a  x  b
ab

La media está dada por:


ab

2

Página 92 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

La varianza está dada por

2 
b  a 2
12

Ejemplo.

Un inversionista considera que al aportar cierta cantidad de dinero (I) en un


negocio, puede perder todo lo invertido, recibir el triple de la inversión o quedar en
una situación intermedia, todo con la misma posibilidad.

a) La probabilidad de que reciba cuando menos 1.5 veces lo que invirtió


b) La utilidad esperada (utilidad = cantidad recibida – cantidad aportada)
c) El coeficiente de variación de la cantidad que recibirá
Si X representa la cantidad de dinero recibido, a=0 b= 3I

3I
x
3I
P X  1.5I  
1 1.5I

1.5 I
3I  0
dx    
 3I  1.5 I 3I

P X  1.5I   0.5

Si la utilidad es la diferencia X-I

Entonces:

E[utilidad] = E [X] – E[I]

E[X] = ½ (31-0) =1.5 I

E[utilidad] = 1.5 I –I = 0.5 I

El coeficiente de variación está definido por:


CV 

 
2 b  a
2

(3I  0) 2 9 I 2 3I 2
 
12 12 12 4

Página 93 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

2
  3I 4  0.866 I

0.866 I
CV   1.732
0.5I

5.5 Distribución Normal

La distribución normal o de Gauss es uno de los modelos probabilísticas de más


utilidad debido entre razones, a que en la realidad muchas variables aleatorias
pueden representase adecuadamente mediante esta distribución.

Pero en general se dice que si la función densidad de probabilidad de una variable


aleatoria X está dado por:


 x  2
1
f ( x)  e 2 2
para toda x
 2
Entonces X tiene distribución normal, con parámetros μ y σ.

En la siguiente gráfica de la función se observa que es simétrica con respecto a la


media; su punto máximo está en X= μ y es asintótica con el eje X (en ambos
lados).

Para calcular la probabilidad de que la variable aleatoria X tome un valor se torna


complicado, por lo tanto se hace un cambio de variable, lo que se denomina
estandarizar a la variable.

Página 94 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

x
Z

La estandarización se lleva a cabo con una μ=0 y σ=1

Con el cambio de variable la ecuación se transforma a:


z2
1 2
f ( x)  e para cualquier valor de z
2

A continuación se muestran distribuciones normales con la misma media, pero


diferentes desviaciones estándar.

En la parte a) de la figura muestra dos distribuciones normales con la misma


media, peor diferente desviación. En la b) la misma desviación pero con diferente
media y en la c) ilustra dos distribuciones normales con medias y desviaciones
diferentes.

En la práctica, se encuentran áreas situadas debajo de curvas normales en tablas


especiales, Ver el anexo de las tablas. Debido a que resulta físicamente imposible,

Página 95 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

y también innecesario, construir tablas separadas de áreas de curvas normales


para todas las parejas de valores de μ y σ posibles, estas áreas se tabulan sólo
en relación con la distribución normal μ=0 y σ=1, llamada distribución normal
estandarizada. Se obtienen áreas situadas debajo de una curva normal cualquiera
al efectuar el cambio de escala.

Ejemplo.

Determine el área situada debajo de la curva normal estándar que está:

a) a la izquierda de z=0.94

El área a la izquierda de z=0.94 es


0.50000 más la entrada de la tabla
que corresponde al valor de z=0.94, es
decir, 0.50000+0.3264=0.8264.

b) a la izquierda de z= -0.85

El área a la izquierda de z=-0.85 es


0.5000 menos la entrada de la tabla
que corresponde al valor z= -0.85, es
decir, 0.5000-0.3023= 0.1977.

Página 96 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

5.6 Aproximación de la distribución binomial a la normal

La distribución normal es una distribución continua que proporciona una


aproximación muy exacta de la distribución binomial cuando n, el número de
ensayos, es grande y p, la probabilidad de lograr un acierto en un ensayo
individual, está próxima a ½. De hecho una distribución normal con μ = np y
σ  np1  p  se puede utilizar a menudo para determinar el valor aproximado de
una distribución binomial aunque n sea muy pequeña y p difiera de ½. Un método
práctico adecuado consiste en utilizar esta aproximación solamente cuando np y
n(1-p) sean mayores a 5. np > 5 y n(1-p) >5.

Ejemplo.

Determine la probabilidad exacta de obtener seis águilas y 10 soles en 16


lanzamientos al aire de una moneda equilibrada y utilice también una curva normal
para determinar el valor aproximado de esta probabilidad.

Sustituyendo n=16, p=1/2 y x=6 en la fórmula de distribución binomial, la


probabilidad de obtener seis águilas y 10 soles en 16 lanzamientos de una
moneda equilibrada es:

 16 
P X  6   (1 / 2) 6 1  1 / 2 = 0.1222
166

6
Para determinar la aproximación de la curva normal a esta probabilidad, se
emplea la corrección de continuidad y se representan seis águilas por medio del
intervalo 5.5 a 6.5. Como μ = np = 16 (1/2) = 8
σ  np1  p   161 / 21  1 / 2 =2, la estandarización de 5.5 y 6.5 son:

5.5  8
z  1.25
2

6.5  8
z  0.75
2

Página 97 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

De la tabla los valores para z son:

(0.5-.1210) -0.2734= 0.1210

La diferencia en los resultados es de 0.0012 del valor que se obtiene con la


función de la distribución binomial.

El ejercicio de aplicación será entregado para su resolución en clase

6. Distribuciones muestrales

Una muestra es un subconjunto de casos o individuos de una población


estadística. Las muestras se obtienen con la intención de inferir propiedades de la
totalidad de la población, para lo cual deben ser representativas de la misma.

Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir


una técnica de muestreo. Por otra parte, en ocasiones, el muestreo puede ser más
exacto que el estudio de toda la población porque el manejo de un menor número
de datos provoca también menos errores en su manipulación.

El número de sujetos que componen la muestra suele ser inferior que el de la


población, pero suficiente para que la estimación de los parámetros determinados
tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea
idóneo es preciso recurrir a su cálculo.

Se define muestreo como el procedimiento estadístico para seleccionar la muestra


a partir de la población, con el objeto de estudiar en ella alguna característica, y
generalizar los resultados a la población de origen. El muestreo es una alternativa
que para captar información de la realidad.

6.1 Muestra estadística


Una muestra es un subconjunto de casos o individuos de una población
estadística. Las muestras se obtienen con la intención de inferir propiedades de la
totalidad de la población, para lo cual deben ser representativas de la misma.
Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir
una técnica de muestreo.

Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de
toda la población porque el manejo de un menor número de datos provoca
también menos errores en su manipulación. El número de sujetos que componen

Página 98 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

la muestra suele ser inferior que el de la población, pero suficiente para que la
estimación de los parámetros determinados tenga un nivel de confianza adecuado.
Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.

6.2 Muestra aleatoria simple

O muestra al azar. Los sujetos de la muestra se eligen mediante un sorteo con


medios mecánicos (sin intervención humana) o usando una “tabla de números
aleatorios”. Para que sea realmente aleatoria dicha muestra, todos los sujetos de
la “población blanco” deben tener la misma probabilidad de ser elegidos.

Siempre que hay intervención humana existe la probabilidad que se produzcan


“errores sistemáticos”. Por ejemplo, hacer un sorteo con papelitos que se sacan de
un sombrero; primero habría que verificar la forma en que se plegó cada papel; en
segundo lugar los números que quedaron al fondo o en las orillas tienen escasa
probabilidades de ser elegidos.

6.3 Muestreo aleatorio simple

El muestreo aleatorio simple es el tipo de muestreo más simple para una


población, pues no se necesita mucha información para poderlo implantar en un
caso práctico. Una muestra aleatoria simple es seleccionada de tal manera que
cada muestra posible del mismo tamaño tiene igual probabilidad de ser
seleccionada de la población. Para obtener una muestra aleatoria simple, cada
elemento en la población tenga la misma probabilidad de ser seleccionado.

Los pasos a seguir:


 Obtener un listado de todos los integrantes de la población.
 Numerar a todos los sujetos de la población (o unidades de muestreo).
 Utilizar una Tabla de Números Aleatorios o un procedimiento similar para
seleccionar a los sujetos de la muestra

El muestreo aleatorio es recomendable cuando la población es suficientemente


pequeña, como para ser enumerada.

6.4 Generación de números aleatorios

Una vez construido un modelo, debemos experimentar sobre él y para poder


ejecutarlo necesitamos dar valores a las variables. De esta forma podremos
obtener valores de salida y pasaremos a realizar un análisis de los mismos.
Algunas de las variables de entrada son de tipo aleatorio por lo que se tendrán
que generar valores que simulen dichas entradas. Para generar variables

Página 99 de 105
Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

aleatorias que sigan determinadas funciones de probabilidad necesitamos partir de


series de números que cumplan ciertas características de aleatoriedad.

Seleccionar una muestra aleatoria de la población de interés no es tan sencillo


como puede parecer. Entonces, ¿cómo podemos seleccionar una muestra de una
población, de tal manera que cada muestra posible de tamaño n tenga la misma
probabilidad de ser seleccionada? Se podría usar el criterio para seleccionar
“aleatoriamente” la muestra. Otra opción, seleccionar una muestra que se
considere típica o representativa. Cualquiera de estos podría tener sesgo.

Muestras aleatorias pueden ser seleccionadas usando tablas de números


aleatorios, una tabla de números aleatorios es un conjunto de enteros generados
de modo que, comúnmente, la tabla contendrá todos los diez enteros (0,1,2,….9)
en proporciones aproximadamente iguales, sin tendencias ni patrones.
Para seleccionar los números es importante fijar ciertos parámetros de selección,
las líneas pares quitando el último dígito, por ejemplo.

Ejemplo.

Por simplicidad, supóngase que existen N=1000 registros de pacientes, de los


cuales será seleccionada una muestra aleatoria de n=20. Sabemos que una
muestra será obtenida si cada muestra posible n=20 registros tiene la misma
probabilidad de ser seleccionada. Los dígitos en la tabla de números aleatorios,
son generados para satisfacer las condiciones del muestreo aleatorio. Determinar
cuáles registros van a ser incluidos en una muestra de tamaño n= 20.

Podemos considerar que las cuentas son los números 001, 002,…….,999, 000.
Tenemos 1000 números de tres dígitos, donde 001 representa el primer registro,
999 el registro del paciente 999 y 000 el milésimo.

Usando la tabla de números aleatorios, utilizando la primera columna, no tomando


en cuenta los últimos dos dígitos de cada número, el primer número formando tres
dígitos es el 104, el segundo es el 223, el tercero es el 241, y así sucesivamente.
Tomando una muestra aleatoria de 20 dígitos, obtenemos los siguientes números:

104 779 289 510


223 995 635 023
241 963 094 010
421 895 103 521
375 854 071 070

Página 100 de 105


Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Si los registros están numerados, solamente seleccionado los registros con los
números correspondientes, y estos registros representan una muestra aleatoria de
n=20 de N=1000.

6.5 Teorema del límite central

El teorema del límite central dice que si una muestra es lo bastante grande (n >
30), sea cual sea la distribución de la variable de interés, la distribución de la
media muestral será aproximadamente una normal. Además, la media será la
misma que la de la variable de interés, y la desviación típica de la media muestral
será aproximadamente el error estándar.

Cuando el muestreo se efectúa a partir de una población que no sigue una


distribución normal se utiliza el Teorema del límite central. Dada una población de
cualquier forma funcional no normal con media μ y varianza σ 2, la distribución
muestral de la media, calculada a partir de muestras de tamaño n de dicha
población será casi normal con media μ y varianza σ 2/n cuando la muestra es muy
grande.

x ~ f(x) y n > 30 → x ~ N(μ, σ2/n)

z
 X     N (0,1)
/ n

Ejemplo. Los resultados de las pruebas finales de todos los alumnos del último
año de las preparatorias de cierto estado tienen una media de 60 y una varianza
de 64. Una generación específica de cierta preparatoria de n=100 alumnos tuvo
una media de 58. ¿Puede afirmarse que esta preparatoria sea inferior? (calcule la
probabilidad de que la media muestral sea a lo más 58 cuando n=100)

Sea Y la media de una muestra aleatoria de n=100 calificaciones de una población


con μ=60 y σ2 = 64. Se desea aproximar P( Y 58). Sabemos del teorema de límite
central que
 X    es aproximadamente una variable aleatoria normal estándar,
/ n
que denotaremos por Z. Por tanto

 58  60 
P(Y  58)  P   Pz  2.5  0.0062
 64 / 100 

Mediante la tabla de valores z, se obtiene el valor de 0.0062. Debido a que la


probabilidad es pequeña, es poco probable que se pueda considerar a esa

Página 101 de 105


Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

generación estudiada como una muestra aleatoria de una población con μ=60 y σ2
= 64. Se puede afirmar que la calificación promedio para esta preparatoria es
menor que el promedio global de μ=60.

6.6 Distribución de la media muestral

La distribución de medias muestrales son las probabilidades de todas las medias


posibles de las muestras de una población finita. Toda distribución de probabilidad
puede describirse mediante su media y su desviación estándar.

Al tomar las muestras aleatorias se cometen ciertos errores que se reflejan en que
la media y la distribución de cada muestra no son iguales, y por lo tanto la media y
la desviación estándar de la población tampoco coinciden con los de la muestra.
Por esta razón, la desviación estándar de la distribución de un estadístico muestral
recibe el nombre de error estándar estadístico. El error estándar no solamente
indica el tamaño del error accidental, sino también la exactitud que alcanzaremos
si usamos un estadístico muestral para estimar un parámetro de la población.

La media muestral es una estadística denotada por X y definida como sigue

1 n
x   xi
n i 1
Ejemplo

De una población cuyos elementos son ( 1, 3, 5, 7, 9 ), formar el número de


muestras aleatorias de 2 elementos, construir la distribución de medias
muestrales, determinar la media de la distribución de medias ( μ- ); determinar la
desviación estándar de la distribución de medias y comparar estos resultados con
los parámetros de la población.

n=2
N=5

1  3  5  7  9 25
  5
5 5


Número de muestras C 25   10
2¡(5  2)

Conjunto de muestras

Página 102 de 105


Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

{(1, 3), (1, 5), (1, 7), (1, 9), (3, 5), (3, 7), (3, 9), (5, 7), (5, 9), (7, 9)}

Conjunto de medias muestrales


{2, 3, 4, 5, 4, 5, 6, 6, 7, 8}

Probabilidad de las medias muestrales

1 1 2 2 2 1 1


 x  2   3   4   5   6   7   8   5
 10   10   10   10   10   10   10 

La media de la distribución de medias μx es igual a la media poblacional ( μ )

6.7 Distribución Ji-Cuadrada

En realidad la distribución ji-cuadrada es la distribución muestral de s2. O sea que


si se extraen todas las muestras posibles de una población normal y a cada
muestra se le calcula su varianza, se obtendrá la distribución muestral de
varianzas.

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer


el estadístico X2. Si se elige una muestra de tamaño n de una población normal
con varianza σ2, el estadístico:

X2 
n  1s 2
2
Donde n es el tamaño de la muestra, s2 la varianza muestral y la varianza σ2 de la
población de donde se extrajo la muestra.

El estadístico tiene una distribución muestral que es una distribución ji-cuadrada


con gl=n-1 grados de libertad y se denota X2.

Propiedades de las distribuciones ji-cuadrada

1. Los valores de X2 son mayores o iguales que 0.


2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay
un número infinito de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se
extienden a la derecha; esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).

Página 103 de 105


Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

6. El valor modal de una distribución X2 se da en el valor (n-3).

Ejemplo.

Suponga que los tiempos requeridos por un cierto autobús para alcanzar uno de
sus destinos en una ciudad grande forman una distribución normal con una
desviación estándar σ =1 minuto. Si se elige al azar una muestra de 17 tiempos,
encuentre la probabilidad de que la varianza muestral sea mayor que 2.

Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como sigue:

El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad


(17-1) y se encuentra que a este valor (0.99) le corresponde un área a la derecha
de (1-0.99) 0.01. En consecuencia, el valor de la probabilidad es P(s2>2)

6.8 Distribución t Student

En probabilidad y estadística, la distribución-t o distribución t de Student es una


distribución de probabilidad que surge, en la mayoría de los estudios estadísticos
prácticos, cuando la desviación típica de una población se desconoce y debe ser
estimada a partir de los datos de una muestra.

Con n-1 denominado el número de grados de libertad. La distribución depende de


los grados de libertad, pero no de μ o σ; la independencia de μ y σ es lo que hace
a la distribución t tan importante en la teoría y en la práctica. Los grados de
libertad se interpretan como el número de valores que podemos elegir libremente.
Ejemplo.

Página 104 de 105


Matemáticas
Especialidad en Ahorro y Uso Eficiente de la Energía

Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de
tamaño 15 que se selecciona de una distribución normal.

Solución:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos


cuenta que a este valor le corresponde un área de 0.05 a la izquierda, por ser
negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de 0.005

Luego se busca el valor de 0.005 en el primer renglón con 14 grados de libertad y


se obtiene un valor de t = 2.977, pero como el valor de está en el extremo
izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto:
P(-2.977 < t < -1.761) = 0.045

Página 105 de 105

También podría gustarte