Está en la página 1de 146

PROBABILIDADES

Muchas decisiones administrativas se apoyan en las


probabilidades. Al establecer la posibilidad o probabilidad
de eventos futuros, se puede reducir ampliamente el
riesgo en la toma de decisiones.

ALGUNOS CONCEPTOS
BSICOS
En general, la probabilidad es la posibilidad de que algo
suceda. Las probabilidades se expresan como fracciones (1/6)
o como decimales (0.167) que estn entre cero y uno. Tener la
probabilidad de cero (0), significa que nunca va a suceder. Una
probabilidad de uno (1), suceder siempre.
EVENTO.- Es uno o ms posibles resultados de hacer algo. Es
un subconjunto del Espacio Muestral. Un evento se indica con
letras maysculas del alfabeto. Ejemplo
Al lanzar una moneda, si cae cruz es un evento y si cae cara es
otro.

EXPERIMENTO.- Es la actividad que origina uno de dichos


eventos. Ejemplo;
Lanzamiento de un dado
En un hotel se desea detectar personas que prefieren un lugar
turstico ce un grupo de 100.
Un da se decide tomar una muestra 10 empleados del hotel,
eligiendo al azar
ESPACIO IVIUESTRAL (Q).- Conjunto de todos los resultados
posibles de un experimento. Ejemplo:
Para el experimento 1:0 = {1,2,3,4,5,6}
Para el experimento 3: Q = {0,1,2,...,100}
Para el experimento 4: O = {empleados del hotel}

DEFINICIONES DE
PROBABILIDAD
CONCEPCIN CLSICA.- Se define la probabilidad a prior", de
una manera terica:

Nota: La probabilidad clsica supone una especie de simetra


en el mundo, posicin que ocasiona muchos problemas. Por
las situaciones de la vida real, desordenadas y poco probables
como son a menudo, hace que definamos la probabilidad de
otras maneras.
CONCEPCIN SUBJETIVA.- La probabilidad es el grado de
confianza que cada persona atribuye a un evento aleatorio.
Tiene sentido intuitivo, no proporciona una definicin estricta
de probabilidad.

CONCEPCION ESTADSTICA .- Se define la probabilidad "a


posteriori, despus de haber hecho muchos experimentos.
Parte del concepto de frecuencia relativa, utiliza el concepto
emprico que resulta al contar m eventos simples favorables
producidos en n pruebas.

Nota: La definicin estadstica aunque til en la prctica, tiene


dificultades desde el punto de vista matemtico, puesto que
puede no existir un nmero lmite. Por esta razn, la moderna
teora de probabilidad ha sido desarrollada
AXIOMTICAMENTE.

CONCEPCIN AXIOMATICA.- Se fundamenta en el lgebra


Abstracta.

REGLA DE ADICION
a) Sucesos mudamente excluyentes
Dos sucesos se dicen mutuamente excluyentes si la ocurrencia
de uno cualquiera de ellos imposibilita la ocurrencia de los
otros. As, si Ei y E2 son mutuamente excluyentes, P{ Ei E2} = O
P{E, + E2}=P{E,}+P{E2}
P{ E, OE2}-P{E1}+P{E2}
P{ E| u E2}=P{E,}+P{E2}

Si Ei, E2, E3, entonces: P{ E1 + E2 + E3} = P{ E1} + P{E2} + P{E3}


En general: P{ E1 + E2 + ...+En} = P{ E1} + P{E2} +...+ P{En}
Ejemplo: Cinco profesionales por igual capaces esperan la
fecha en que se les realice una entrevista para trabajar en una
empresa, el Gerente ha anunciado que contratar a slo uno
de los cinco, mediante una eleccin aleatoria. El grupo est
formado por: Mara, Vanessa, Cristian, Paola y Adriana.
Se pregunta, cul es la probabilidad que Mara sea elegida?
Solucin: P(Mara) = 1/5 = 0.2
Cul es la probabilidad que Vanessa sea elegida?.
Solucin: P(Vanessa) = 1/5 = 0.2
Cul es la probabilidad de que Mara o Vanessa sean elegidas?
Solucin: P{ Ei + E2} = P{ Ei} + P{E2}
P{Mara o Vanessa} = P(Mara} + P{Vanessa} = 1/5 + 1/5 =2/5 =
0.4

b) Sucesos que no son mutuamente excluyentes


Dos sucesos no son mutuamente excluyentes cuando la
probabilidad de que ocurra un suceso no impide la ocurrencia
del otro.
P{ El U E2} = P{ El} + P{E2} - P{ El n
E2} P{EI + E2} = P{EI} + P{E2}-P{EIE2}
P{Ei} = Probabilidad de que suceda
Ei P{E2} = Probabilidad de que
suceda E2 P{ E1E2} = Probabilidad
de que E1 y E2 sucedan untos
Para el clculo de la probabilidad de la unin de tres sucesos
cualesquiera:
P{ E1 u e2 + e3} = P{ Ei} + P{E?} + p{e3} - p{ E1 n e2} - P{Ei n e3} P{e2 n e3} - P{Ei n e2 n e3}

Ejemplo: En una empresa trabajan 12 empleados, de los


cuales 6 son economistas, 4 Ingenieros comerciales y 1
empleado tiene los dos ttulos. Cul es la probabilidad
de que un empleado sea economista o ingeniero o tenga
ambos ttulos?
Solucin:

REGLA DE LA
MULTIPLICACIN
Sucesos independientes
Dos eventos son independientes cuando la ocurrencia o no
ocurrencia de un evento no tiene ningn efecto en la
probabilidad de ocurrencia del otro evento. Las reglas de la
multiplicacin se refieren a la determinacin de !a
probabilidad de ocurrencia conjunta de Ay B = A n B.
P(AyB) = P(A).P(B) P(APlB) = P(A).P(B)
P(A.B) = P(A).P(B)
P(ABC) = P(A). P(B). P(C)

Ejemplo: De cada 100 nios nacidos se pudo determinar en


una investigacin que 42 tienen el tipo sanguneo 0. Cul es la
probabilidad de ser varn y tener tipo sanguneo O?.
P(VyO)=P(V).P(O)=(1/2).(42/100)=(0,50).(0,42)=0,21
Ejemplo 4.4: En una fbrica de calzado se manufacturan
independientemente la costura (parte superior del zapato),
suela y tacn, se arman aleatoriamente en cada zapato. Se
sabe que tienen fallas, el 5% en la costura, el 3% en la suela y
el 2% en los tacones. Qu porcentaje de pares ele zapatos
resultan: a) con fallas en sus tres componentes y b) no tienen
fallas en sus tres componentes?
a) P(CySyT)=(0,05)(0,03)(0,02)=0,00003=0,003%
b) P(C) = 1 -0.05 = 0.95; P(s) = 1 -0.03 = 0.97; P(T) = 1 -0.02 =
0.98 P(sin fallas) = (0.95). (0.97). (0.98) = 0.90307 = 90.3%

Ejemplo: En general, la probabilidad de recetar un medicamento es


dei 40 %. Cul es la probabilidad de que tres mdicos receten
dichp^ medicamento?. Construya un diagrama de rbol.

0,40

Evento

Probabilidad

3 mdicos
2 mdicos

0,064
0,096

R 2 mdicos
N 1 mdicos

0,096
0,144

0,60

R 2 mdicos
1 mdicos

0,096
0,144

0,40

0,60

R 1 mdicos
N 0 mdicos

0,40

R
0,40

R
N

0,60
0,40
0,60

N
0,60

0,60

0,40

0,40

N
0,60

0,144
0,216
1,00

La probabilidad de recetar Al menos1 dos mdicos.


P(al menos 2 mdicos)
= P(R y R y R) + P(R y R y N) + P(R y N y R) + P(N y R y R)
= (0,064)+(0,096) + (0,096) + (0,096) = 0,352
La probabilidad de recetar al menos un mdico:
P(al menos 1 mdico)
= 1 - P(no R)
= 1 - P(N y N y N)
= 1 - 0.216 = 0.784

Sucesos dependientes
Dos eventos son dependientes cuando la ocurrencia o no
ocurrencia de un evento afecta a la probabilidad de ocurrencia
del otro evento. La probabilidad de ocurrencia conjunta de A y
B se da por:
P(AyB) = P(A).P(B/A)
P(AB) = P(A).P(B/A)
P(ADB) = P(A).P(B/A)
Las frmulas anteriores suele llamarse regla general de la
multiplicacin, porque para eventos independientes la
probabilidad condicional P(B/A) = P(B)

Ejemplo: Se sabe que en un conjunto de 10 partes de


repuestos de equipo hospitalario, contiene 8 partes
aceptables (A) y 2 partes defectuosas (D). Dada la seleccin
aleatoria sin reemplazo de dos partes. Cul es la probabilidad
de que las dos partes seleccionadas sean aceptables?
Solucin: P(A y D) = P(A ).P(A/D) =(8/10)(7/9)=56/90
Utilizando el diagrama de rbol tenemos:

c) Probabilidad condicional
Cuando dos eventos son dependientes, se emplea el concepto
de probabilidad condicional para designar la probabilidad de
ocurrencia del avent relacionado. Dado un experimento
aleatorio cualquiera que puede dar lugar, entre otros, a los
sucesos A y B, se denomina probabilidad del suceso B
condicionada al suceso A, y se representa mediante P(B/A) a la
probabilidad que ocurra el suceso B sabiendo que el suceso A
ha ocurrido.

P(B/A) = Probabilidad del suceso B condicionada al suceso A


P(B n A) = Probabilidad de que se verifiquen a la vez los
sucesos A y B
P(A) = Probabilidad de que se produzca el suceso A.
P(A/BC)= (P(A).P(B).P(C) )/(P(B).P(C) )
NOTA: En evento independientes, las expresiones de
probabilidad condicional no se requiere, pues por definicin
tenemos: P(B/A) = P (B) P(A/B) = P (A)
Ejemplo 4.7: El 20% de familias de un barrio tienen automvil,
el 25% tienen casa propia y el 15% tienen automvil y casa.
Cul es la probabilidad de tener casa si se tiene automvil?.
A = propietario de automvil
C = propietario de casa
A' = no propietario de automvil
C' = no propietario de casa

A
A
Total

C
0.14
0.11
0.25

C'
0.06
0.69
0.75

P(C/A) = (0.14/0,20) = 0.70

Total
0.20
0.80
1.00

TEOREMA DE BAYES (O
TEOREMA DE LAS CAUSAS)
El Teorema de Bayes establece, que si sucede cierto evento,
que depende de la ocurrencia de los eventos A o B o C
correspondientes a un conjunto de sucesos mutuamente
excluyentes, la probabilidad de que E haya ocurrido a
consecuencia de A ( P(A/E) ), corresponda al producto de las
probabilidades individuales del evento A y del evento E,
dividido por la probabilidad alternativa del evento E con
respecto a cada uno de los eventos independientes de A, B y
C. La frmula es:

Ejemplo: En una fbrica de televisores los ensamblan tres


personas A, B, C y producen respectivamente el 25%, el 35% y
el 40 %. Dentro de cada una de estas producciones el 5%, el
4% y el 2% son defectuosos. Se toma al azar un televisor del
total y se encuentra que es defectuoso. Cul es la
probabilidad de que haya sido producido por A?.
Solucin:
Definimos los eventos:
A: el anlisis es producido por la persona A , con P(A) = 0.25
B: el anlisis es producido por la persona M2 con P(B) = 0.35
C: el anlisis es producido por la persona M3 con P(C) = 0.40
Sea E: el anlisis es defectuoso

Probabilidades condicionales tenemos: P(Ei/A) = 0.05, P(E2/B)


= 0.04, P(E3/C) = 0.02

COMBINACIONES Y
PERMUTACIONES
a) Permutaciones
Es una forma de ordenar o arreglar a la totalidad de los
elementos de un conjunto.

Sabiendo que:
0! = 1 (por definicin)
1! = 1
2! = 1.2 = 2
3! = 1.2.3 = 6

n! = 1.2.3.4...(n - 2) (n-1) n
(n-1)! = 1.2.3.4.... (n-2) (n-1)
(n-2)! = 1.2.3.4.... (n-2)
Ejemplo: En una empresa se dispone de 5 tcnicos en una
especialidad determinada. De cuntas maneras distintas se
puede disponer para que manejen las 5 mquinas?

Variaciones
Son permutaciones en las que importa el orden de colocacin
de los elementos, pero con la diferencia de las permutaciones,
porque se toma una parte de los elementos del conjunto.
Simblicamente:

Sabiendo que:
Ve,3 = Nmero de variaciones de 8 elementos tomados de 3
en 3
V83 = 8.7.6 = 336
Vn,4 = n (n-1) (n-2) (n-3)
Ejemplo: En una empresa trabajan 10 personas y se desea
elegir al Presidente, Vicepresidente y Secretario. Cul es el
nmero de maneras que pueden ser elegidos entre las 10
personas?.

Combinaciones
Las combinaciones son un arreglo de los elementos sin
importar el orden en que se dispongan.

Ejemplo: Cuntos equipos de 4 tcnicos se pueden formar con


17 tcnicos de una empresa para realizar un nuevo proyecto.
Solucin:

Ejemplo: Es necesario elegir un comit de 10 personas entre 6


abogados, 8 economistas y 5 ingenieros. Si el comit debe
estar integrado por 4 abogados, 3 economistas y 3 ingenieros

DISTRIBUCIONES DE
PROBABILIDAD
En este captulo se
explica como las
distribuciones de
probabilidad
se
utilizan
para
solucionar muchos
problemas de los
negocios,
utilizando
variables discretas
y continuas.

DISTRIBUCIN BINOMIAL O
DE BERNOULLI
Definicin.- Sea X una v.a. que representa el nmero de xitos
de n pruebas y p la probabilidad de xito. Se dice entonces
que X tiene una distribucin binomial con funcin de
probabilidad. Se aplica como modelo en la toma de decisiones
en condiciones de incertidumbre.

Donde: p = Probabilidad de tener xito


q = 1 - p = probabilidad de fracaso
x = nmero de xitos deseados
n = nmero total de Intentos

Caractersticas de un experimento binomial:


El experimento consta de n pruebas idnticas. La
distribucin binomial se utiliza cuando se tiene n
repeticiones independientes de un experimento de
Bernoulli (resultados de: xito y fracaso, positivo y
negativo, etc.)
Se sugiere utilizar la distribucin binomial cuando n es
pequeo (n < 30).
Se usar siempre esta distribucin, si las extracciones son
con reemplazamiento y p = constante.
Se podr usar tambin una binomial si las extracciones
son sin reemplazamiento pero la poblacin es infinita o
con
muchos
elementos

Uso de la distribucin binomial


Se utiliza en Gentica, para el modelo de herencia de un
rasgo particular
Para estimar la ocurrencia de una reaccin determinada
como una descarga (liberacin cuntica) de acetilcolina
en la unin neuromuscular.
Para estimar la muerte de una clula cancerosa en una
prueba in vitro de un agente quimioteraputico nuevo.
La ley binomial es til en el control de calidad. SI se
desea determinar entre anlisis defectuosos y no
defectuosos.
Nota: El trmino binomial proviene de las
probabilidades p(x;n,p) son trminos del desarrollo del
binomio.

Propiedades de la distribucin binomial:

EJERCICIOS
1.- En una fbrica de bebidas, ocho dcimos de las botellas se
llenan de manera correcta (xitos). Si queremos calcular la
probabilidad de obtener exactamente 3 botellas llenas de
manera correcta de una muestra de 6 botellas..
Solucin: P = 0.8 q = 0.2 x = 3 n = 6
METODO 1. Utilizando la frmula

METODO 2: (Leyendo en la tabla de distribucin binomial)


P(x/n,p) = P(x = 3/n = 6, p = 0.8) = 0.08192 =* 8.19%
Nota: Para leer en la tabla, si P > 0.5, el problema debe
replantearse para definir el evento en trminos de fracasos
donde X - n - x; q = 1 - p . Por ejemplo: P(x=3/n=8, p=0.70) =
P(X=5/n=8,q=0.30) = 0.0467
2.- Supongamos que el 30 % de turistas estudiados ingieren
licor. Hallar la probabilidad de que en una muestra aleatoria
de 15 turistas, 5 hayan ingerido licor:
Solucin: Exactamente 5 P(X = 5)

METODO 2: (Leyendo en la tabla de distribucin binomial)


P(x/n,p) = P(x = 5/n = 15, p = 0.3) = 0.2061 = 20.61 %

En general, la probabilidad de que prefieran un lugar turstico


es del 20%. De una muestra aleatoria de 6 turistas. Cual es la
probabilidad de que prefieran:
A.- Exactamente 4 P(X = 4)
B.- Mayor que 4 P(X > 4)
C.- Menor que 4 P(X < 4)
D.- Cuatro o menos P(X 4)
E.- Cuatro o ms P(X 4)
F.- Un nmero comprendido entre 3 y 5. P(3 x 5)
Soluciones:
A.- Exactamente 4 P(X = 4)
P(x/n,p) = P(x = 4/n = 6, p = 0.2) = 0.0154 => 1.54%
B.- Mayor que 4 P(X > 4)
P(x/n,p) = P(x > 4/n = 6, p = 0.2) = P(x = 5) + P(x = 6)
= 0.0015 + 0.0001 = 0.0016

C.- Menor que 4 P(X < 4)


P(x/n,p) = P(x < 4/n = 6, p = 0.2) = P(x = 0) + P(x = 1) + P(x = 2)
+ p(x = 3)
= 0.2621 + 0.3932 + 0.2458 + 0.0819 = 0.983
D.- Cuatro o menos P(X 4)
P(x/n,p) = P(x 4/n = 6, p = 0.2) = P(x = 0) + P(x = 1) + P(x = 2)
+ P(x = 3) + P(x = 4)
= 0.2621 + 0.3932 + 0.2458 + 0.0819 + 0.0154 = 0.9984
E.- Cuatro o ms P(X 4)
P(x/n,p) = P(x 4/n = 6, p = 0.2) = P(x = 4) + P(x = 5) + P(x = 6)
= 0.0154 + 0.0015 + 0.0001 =0.017
Un nmero comprendido entre 3 y 5. P(3 x 5)
P(3 x 5/n = 6, p ~ 0.2) = P(x = 3) + P(x = 4) + P(x = 5)
= 0.0819 + 0.0154 + 0.0015 = 0.0988

DISTRIBUCIN DE POISSON
Es muy til donde la variable aleatoria representa el nmero
de eventos independientes que ocurren a una velocidad
constante. Desde la teora de los lmites la distribucin
binomial se aproxima a la distribucin de Poisson Cuando el
nmero de repeticiones de un experimento es muy grande (n
30) y se hace muy laboriosa la aplicacin de la frmula
binomial. Cuando esto ocurre existen dos distribuciones
tericas que se aproximan a la distribucin binomial, una de
ellas es cuando p es muy pequea, la cual se conoce como
distribucin de Poisson y se define as:

Casos donde se utiliza:


El nmero de artculos defectuosos en una hora de produccin
El nmero de automviles que llegan a una caseta de cobro en 1
hora.
El nmero de llamadas telefnicas en una central, durante ciertas
horas.
El nmero de accidentes registrados en la interseccin de dos calles.
Atencin mdica que requieren los pacientes en un hospital en una
hora determinada., etc.

Caractersticas:
El experimento consiste en contar el nmero de veces que
ocurre un evento, en particular durante una unidad de tiempo
dada, o en un rea o volumen (o peso, distancia o cualquier
otra medida) dada.
La probabilidad de que un evento ocurra en una unidad dada
de tiempo, rea o volumen es la misma para todas.
El nmero de eventos que ocurren en una unidad de tiempo,
rea o volumen es independiente del nmero de los que
ocurren en otras unidades.
El nmero medio (o esperado) de eventos en cada unidad se
denota por la letra griega LAMBDA ().

EJERCICIOS
1.- En una fbrica se realizan ciertos anlisis y la probabilidad
de que una pieza sea defectuosa es del 0.02. Calcular la
probabilidad de encontrar en un lote de 100 piezas que 2 sean
defectuosas.
Solucin: n = 100, p = 0.02,x = 2
= np = (100) (0.02) = 2 (2 < 5, portanlo la aproximacin es
adecuada)
METOD01: utilizando la frmula

METODO 2: utilizando la tabla de Poisson: P(x = 2/ = 2) =


0.2707
METODO 3: utilizando tablas acumulativas de distribucin de
Poisson P(x, ) = F(x )-F(x-1, )
Para = 2, P(x = 2) = P(x 2)- P(x 1) = 0.677 - 0.406 = 0.271
2.- La probabilidad de que un equipo que se utiliza en un hotel
se descomponga al cabo de 900 horas de trabajo es 0.004. si
se seleccionan al azar 1000 equipos con 900 horas o ms de
trabajo, calcular la probabilidad de que se descompongan 4
equipos.
Solucin: n=1000, p=0.004, x=4 =n.p 1000. 0,004=4<5

METODO 2: Utilizando las tablas acumulativas de la


distribucin de Poisson P(x, ) = F(x, )-F(x-1, )
Para = 4, P(x = 4) = P(x 4) - P(x 3) = 0.629 - 0.433 = 0.196
3.- Se sabe en un banco, que dos clientes en promedio por
mes, dan informacin incorrecta. Cul es la probabilidad de
que en un mes:
A.- Ningn cliente de informacin incorrecta (x = 0).
B.- Un cliente de informacin incorrecta (x = 1)..
C.- Dos cliente den informacin incorrecta (x = 2).
D.- Tres cliente den informacin incorrecta (x = 3).
Solucin:
Datos: =2

Distribucin Normal
Llamada tambin como Distribucin Laplace-Gauss,
Gaussiana, Laplaciana, curva normal, curva de error, curva de
campana o curva de Moivre. Aparentemente descubierta por
Moivre (1756) como forma lmite de la Distribucin Binomial.
Todo ejercicio de Binomial se puede resolver mediante la
Distribucin Normal, conocida como mtodo aproximado.
Existen dos razones bsicas para que ocupe un lugar
importantsimo en la estadstica. Primero, tiene algunas
propiedades que la hacen aplicable a un gran nmero de
situaciones en las que es necesario hacer inferencias mediante
la toma de muestras. Segundo, la distribucin normal casi se
ajusta a la distribucin de frecuencias reales observadas en
muchos fenmenos naturales.

Caractersticas de la distribucin normal


El diagrama nos ayudar a determinar ciertas caractersticas
importantes:

Segn el valor de , habr mayor o menor concentracin de


los datos respecto al valor central que es .
La funcin est definida en todo para el eje X.
Para todos los valores de x, la funcin toma valores positivos,
es decir, la curva normal est situada sobre el eje X.
Es asntota respecto al eje X, es decir, los dos extremos de la
curva se extienden indefinidamente y nunca tocan el eje
horizontal.
La curva tiene un solo pico; por tanto es unimodal. Tiene la
forma de campana.
la media, mediana y moda tienen el mismo valor, coinciden en
el punto medio y dividen en dos partes iguales la curva.
Es simtrica respecto al eje y.
El rea bajo la curva vale 1.

No existe una sola distribucin normal, sino una familia


de distribuciones normales.
Tres curvas con la misma media pero diferente
desviacin estndar:

reas bajo la curva norman


El rea bajo la curva normal vale 1, sin importar los valores de
y . En
trminos matemticos podemos pensar en reas bajo las
curvas como si fueran probabilidades. La relacin ms
importante entre la desviacin tipica o estndar y la curva
normal, lo observamos en el siguiente grfico. En la
distribucin normal, la desviacin estndar es usada como
unidad para determinar el porcentaje de poblacin.
El 68.27 % de las observaciones caen dentro de -1 y + 1
El 95.45 % de las observaciones caen dentro de -2 y + 2
El 99.73 % de las observaciones caen dentro de -3 y + 3

C.- Medida estndar o valor tipificado z


El valor tipificado z sirve para convertir observaciones
individuales en unidades disponibles en funcin de la
desviacin tpica. La frmula para medir las distancias bajo la
curva normal es:

Por qu utilizamos z en lugar del nmero de desviaciones


estndar"?
Las variables aleatorias normalmente distribuidas tienen muchas
unidades diferentes de medicin: dlares, pulgadas, kilogramos,
segundos. Para determinar el rea bajo la curva normal,
trabajaremos en trminos de puntuaciones estndares o tpicas
(z) y emplearemos. El uso de z permite solamente cambiar la
escala de medicin del eje horizontal. Algunos textos trabajan con
la tabla de distribucin acumulada, cuya lectura tambin es fcil.
Cmo utilizar la tabla de distribucin normal?
La tabla del apndice 1, da los valores de la mitad del rea bajo la
curva normal, empezando en 0.00 en la media. Como la curva
normal es simtrica, los valores para la una mitad son vlidos
tambin para la otra mitad de la curva. Para hallar el rea de
z=2.47, se procede as: por la columna encabezada por z se baja
hasta 2.4 luego en esa fila hacia la derecha hasta la interseccin
de la columna del 7 en el encabezado superior, se lee 0.4934, en
trminos de porcentaje representa el 49.34 %.

d) Casos que se presentan en el clculo de


reas.
1. El valor de z se halla a la derecha de z - 0.
Ejemplo: Cul es el valor de z = 2.34?
Solucin: rea = 0.4904 => 49.04 %
2. El valor de z se halla a la izquierda de z = 0
Ejemplo: Cul es el valor de z = -1.2
Solucin: En la tabla de reas se lee 0.3849
rea = 0.3849 => 38.49 %
3. z1 y Z2 se encuentra a la derecha de z = 0
Ejemplo:
Cul es el rea entre z1 = 1.2 y Z2 = 2.7?
Solucin:
A = (rea z=0 y z2=2.7) - (rea z-0 y z=l .2)
rea = 0.4965 - 0.3849
rea = 0.1116 => 11.16%

4. z1 y Z2 se encuentra a la izquierda de z = 0
Ejemplo:
Cul es el rea entre z1 = -0,6 y Z2 = -1,9?
Solucin:
A = (rea z=0 y z2=1,9) - (rea z-0 y z1=-0,6)
rea = 0.4713 - 0.2258
rea = 0.2258 => 24,55%
5. z1 se encuentra a la izquierda y z2 se
encuentra a la derecha de z = O
Ejemplo:
Cul es el valor de z1 = -1.2 y z2 = 2.3?
Solucin:
A = (rea z=0 y z=-l .2) + (rea z=0 y z= 2.3)
rea = 0.3849 + 0.4893
rea = 0.8742 => 87.42 %

8. El valor se encuentra a la derecha de -z1


Ejemplo:
Cul es el rea a la derecha de z = -1.52?
Solucin:
rea = 0.4357 + 0,5000
rea = 0.9357 =
93.57% '

Ejercicio
Un programa de entrenamiento diseado para mejorar la
calidad de habilidades de los empleados. Debido a que el
programa es auto administrado, los empleados requieren un
nmero diferente de horas para terminarlo. Un estudio de los
participantes anteriores indica que el tiempo medio que se
lleva completar el programa es de 500 horas, y que la variable
aleatoria normalmente distribuida tiene desviacin estndar
de 100 horas.
a) Cul es la probabilidad de que un empleados elegido al
azar requiera ms de 500 horas para completar el programa.
El rea sombreada de la figura nos indica la probabilidad que
demore ms de 500 horas. El rea a la derecha de la media es
0.5, lo que corresponde al 50 %

B) Cul es la probabilidad de que un candidato elegido al azar


se tome entre 500 y 650 horas para completar el programa de
entrenamiento?

C) Cul es la probabilidad de que un candidato elegido al azar


se tome ms de 700 horas para completar el programa de
entrenamiento?

PRUEBA DE HIPOTESIS
El propsito de la prueba o docimasia de hiptesis es
determinar si el valor supuesto (hipottico) de un parmetro
poblacional, debe aceptarse como verosmil con base en
evidencias mustrales. Por ejemplo en la medicina si un
medicamento disminuye o no el tiempo de restablecimiento
de un paciente; en la agricultura cuando se quiere decidir si un
nuevo fertilizante eleva el rendimiento o no; en la tcnica si
una maquina aumenta o no su tiempo de servicio sin roturas;
en los servicios si el tiempo de espera en un centro de
prestacin de servicios a variado o no; etc.

Hiptesis
Hiptesis es una proposicin enunciada para contestar una pregunta
sin saber an si las observaciones, hechos, datos la comprobarn o
rechazarn. Es una proposicin comprobable que podra ser la
solucin de un problema. La funcin de la hiptesis es orientar
nuestra bsqueda de orden en los hechos. Se emplea una hiptesis
para establecer una relacin entre dos o ms variables. Debe tener
las siguientes cualidades:
Ser una respuesta probable a un problema.
Relacionar dos o ms variables.
Tener una redaccin clara.
Debe fundamentarse en la realidad para poder ser observada y
comprobada.
Disponer de referencias tericas.
Estar al alcance del investigador. Disponer de conocimientos y
recursos.

Partes de una hiptesis.- Se tiene generalmente una variable


independiente y una dependiente (Causa y efecto, estmulo y
respuesta, antecedente y consecuente).
Ejemplo: el suministro de una mala alimentacin influye en el
bajo peso del nio. Variable independiente (x): El suministro
de una mala alimentacin" (causa) Variable dependiente (y):
Bajo peso del nio" (efecto)
EJEMPLOS TOMADOS DE ALGUNAS INVESTIGACIONES
HIPOTESIS

VARIABLE
INDEPENDIENTE
Adiccin o no
adiccin de la
madre
Historia de abuso
sexual

Los lactantes de madres adictas a la


herona tienen menor peso neonatal
que los hijos de no adictas.
Los adolescentes que sufrieron abuso
sexual durante la infancia tienen un
riesgo mayor de depresin y suicidio que
aquellos que no lo sufrieron.
Existe una relacin positiva entre el lazo Grado de apego
madre-hija y un lazo madre-feto de la entre madre e hija
embarazada. (Zachariach, 1994)

VARIABLE
DEPENDIENTE (Y)
Peso neonatal del
lactante

Riesgo de
depresin, riesgo
de suicidio
Grado de apego
entre madre y feto

TIPOS DE HIPTESIS
Tipos de hiptesis segn la funcin en la investigacin: algunos tipos
ms usuales de hiptesis segn Hernndez y et.al (2004) son:
HIPTESIS DESCRIPTIVAS. Analiza las variables que se van a observar
en un contexto o en la manifestacin de otra variable. Este tipo de
hiptesis puede o no relacionar variables y finalmente no toda
investigacin descriptiva puede tener hiptesis. Ejemplo:
"existe un alto porcentaje de egresados que no alcanzan el xito
profesional"
"la mayora de ingresantes a la universidad estn entrenados en la
memorizacin mecnica y de corto plazo"
HIPTESIS CORRELACIONALES. Especifican la relacin entre dos o
ms variables; estas investigaciones establecen relaciones de dos o
ms variables (correlacin bivariada o correlacin mltiple).
Alcanzan un nivel predictivo y parcialmente explicativo. En la
correlacin no se habla de la variable dependiente y la
independiente, esta es propia de investigaciones causales. Estas
hiptesis se contextualizan en la realidad y se someten a pruebas
empricas.

HIPTESIS DE DIFERENCIA ENTRE GRUPOS. Se formulan en


investigaciones cuyo fin es comparar grupos. Son un tipo de
investigacin correlacional que relacionan dos o ms variables,
adems si establecen la diferencia entre grupos. Si se establece la
diferencia entre grupos adems de explicar el porqu de las
diferencias, entonces son hiptesis de estudios explicativos. Una
investigacin que se inicia como correlacional puede terminar como
explicativa. Ejemplo:
HIPTESIS QUE ESTABLECEN RELACIONES DE CAUSALIDAD. Todas estas
hiptesis establecen relaciones causa-efecto. Afirma las relaciones de
dos o ms variables, cmo se dan stas, adems proponen como se da
su entendimiento. La correlacin y la causalidad son conceptos
asociados pero distintos. Dos variables pueden estar correlacionados
pero no implica la relacin causa efecto. Para poder establecer
causalidad antes debe haberse demostrado correlacin, pero adems
la causa debe ocurrir antes que el efecto. En las hiptesis causales las
supuestas causas se les conoce como variable independiente y a los
efectos como variable dependiente.
Hiptesis causales bivariadas: cuando se plantea una relacin entre la
variable independiente y una variable dependiente.

Hiptesis Estadsticas
Una hiptesis estadstica es una aseveracin sobre los parmetros
de una o ms poblaciones. Pueden ser probadas o rechazadas en
base a datos cuantitativos: nmeros, porcentajes, promedios,
dispersiones u otros parmetros de una o ms poblaciones dadas.
Distinguiremos dos tipos de hiptesis estadsticas: la hiptesis nula
(H0) y la hiptesis alternativa (Ha).
Hiptesis nula (H0).- Se especifica en forma opuesta a la que se
supone cierta. Generalmente se plantea con el propsito de
rechazarla y aceptar la de investigacin. Ejemplo:
H0: La desnutricin de los estudiantes no es un factor que provoca
dificultades de aprendizaje' .
Nota: Las hiptesis nulas pueden ser expresadas como una funcin
de los parmetros igualados a cero y de aqu la terminologa de
hiptesis nula (1 - 2=0
p-0,06=0

Hiptesis alternativa (Ha).- La alternativa es cualquier hiptesis


que excluya la hiptesis nula, a menudo, es la hiptesis
contraria o la negacin de H0. Ejemplo:
Ha. "La desnutricin de los estudiantes es un factor que
provoca dificultades de aprendizaje".
Si H0 resulta verdadera, el investigador rechaza Ha
Si H0 resulta falsa, el investigador acepta Ha

Tipos de Errores
Al aceptar o rechazar una hiptesis se puede cometer dos tipos de
error:
a) Error tipo (): Rechazar la hiptesis cuando ha debido
aceptarse.
b) Error tipo i! (): Aceptar la hiptesis cuando ha debido
rechazarse.
Si se acepta una hiptesis verdadera la decisin es correcta
S se acepta una hiptesis falsa, cometemos un error de tipo Il
Si rechazamos una hiptesis verdadera, cometemos error de tipo I
Si rechazamos una hiptesis falsa, la decisin es correcta.
Nota: La probabilidad de cometer el error tipo I ocurre mientras ms
alto sea su valor, es entonces ms probable que la hiptesis nula sea
rechazada equivocadamente. La probabilidad de cometer un error
del tipo II aumenta cuando el tamao de la muestra es pequeo, a
medida que el tamao de la muestra se Incrementa esta
probabilidad disminuir.

Prueba unilateral y bilateral


Prueba de hiptesis unilateral.- la zona de rechazo o zona critica esta
comprendida en uno de los extremos de la distribucin y son:
Unilateral derecha, la hiptesis alternativa utiliza trminos como:
mayor, superior, mejor. Unilateral izquierda, la hiptesis alternativa
utiliza trminos como: menor, bajo, inferior
Prueba de hiptesis bilateral.- Cuando las zonas de rechazo estn en los
dos extremos de la distribucin. La hiptesis alternativa es diferente;
por lo tanto se omiten los trminos: superior, mayor, mejor, inferior,
bajo, menor, etc. La hiptesis alternativa puede definirse por los
siguientes tres casos:
Ha: 1 2 ; Define una hiptesis bilateral a dos colas
Ma: 1 >2 ; Define una hiptesis unilateral o a una cola a la derecha.
Ha: 1 <2 Define una hiptesis unilateral o a una cola a la izquierda

Nivel de significacin o puntos


crticos
Es el valor de la probabilidad que el investigador escoge por la
estimacin que hace de la importancia o del posible
significado prctico de su investigacin. El nivel de significancia
se simboliza por alfa (O) siendo generalmente del 1%, 5%
10%, pero se puede utilizar cualquier nivel, dependiendo del
tipo de investigacin. El trabajo es altamente significativo,
cuando se trabaja con el 1%; es significativo si es el 5% y poco
significativo si se trabaja con el 10%.
a) Dcima unilateral hacia la derecha (=0.05)

b) Dcima unilateral hacia la izquierda ( =0.05)

c) Dcima bilateral ( =0.05)

Etapas en la prueba de
hiptesis estadsticas
Se debe tener en cuenta las siguientes alternativas:
1, Formular la hiptesis nula (H0) y alternativa (Ha)

2, Seleccionar e nivel de significacin (elegir el riesgo: = %)


= 1% = 0.01 (Investigacin altamente significativa)
= 5% = 0.05 (investigacin significativa)
=10% = 0.10 (Investigacin poco significativa)
3, Conocer o estimar la varianza
La muestra es aleatoria
La poblacin es normal
La varianza poblacional es conocida (en la mayora de casos se
debe estimar)
4, Determine la tcnica y la prueba estadstica
Distribucin normal:

Distribucin de medias mustrales

Distribucin de proporciones mustrales

Distribucin de diferencias entre dos medias mustrales:

Distribuciones de diferencias entre dos proporciones


muestrales

Determine los valores crticos y sus regiones de rechazo:


Para un nivel de significacin del 5% de dcima bilateral: Zs =
1.96, z = -1.96
Para un nivel de significacin del 5% de dcima unilateral:
Dcima unilateral izquierda: z = -1.64,
Dcima unilateral izquierda: Zs = 1.64
Calcular los datos mustrales, utilizando as frmulas
correspondientes: Supongamos que se producen 100
nacimientos, de los cuales 60 son mujeres, se tendr: = n.p
=100.(0.50) = 50

Tomar la decisin estadstica:


Se acepta o se rechaza la hiptesis nula, al nivel de
significacin dado. En e! ejemplo anterior, z = 2, se sita en la
zona de aceptacin, por lo tanto se acepta la hiptesis nula
(Ho: = 50), es decir, la diferencia no es significativa.

PRUEBAS CUANDO SE:CONOCE


OLA MUESTRA ES GRANDE
En el paso 3, se deca que la varianza poblaclonal (2) es
conocida. Si no se conoce debe ser sustituida por la varianza
muestral (si n > 30), considerada muestra grande.
Una mquina est programada para empacar la cantidad
media de 56 gramos de un producto, se toma la muestra
aleatoria de 36 cajas; resulta una media de 54.2 gramos y
desviacin tpica de 5.3 gramos, Al nivel del 5%, se podr
afirmar que no se est cumpliendo con el empaque?

Distribucin de medias
En general, despus de calcular el tamao de la muestra, y su
media, vendr la identificacin de la desviacin tpica
poblacional.
En una empresa de lcteos, un inspector de calidad investiga
las acusaciones, por el deficiente llenado que debe ser en
promedio, de cm. Para ello toma una muestra de 60 botellas,
encontrando que el contenido medio es de 71.9 cm3 de
lquido. Se sabe que la mquina debe producir un llenado con
una desviacin tpica de 3.6 cm3. Puede el inspector llegar a
la conclusin, a un nivel de significancia del 5%, que se estn
llenando las botellas, por debajo de su especificacin de
contenido?

Una mquina est programada para empacar la cantidad


media de 56 gramos de un producto, se toma la muestra
aleatoria de 36 cajas; resulta una media de 54.2 gramos y
desviacin tpica de 5.3 gramos, Al nivel del 5%, se podr
afirmar que no se est cumpliendo con el empaque?

Decisin: Observamos que z = -1.29, se sita en la regin de


aceptacin, es vlida la hiptesis nula. El inspector no puede
concluir que se est llenando el producto por debajo de su
especificacin, al nivel del 5%,

Los investigadores suponen que el gasto diario en


alimentacin de los turistas tiene una media igual a 9.9
dlares, con desviacin estndar de 66. Ellos estudiaron 43
turistas y encontraron una media de gasto de dlares. Quieren
saber si la media de la muestra en estudio es diferente del
valor medio de la poblacin de 9.9 dlares.

Decisin: como z = -3.97, se sita en la regin de rechazo, se


rechaza la hiptesis nula y se aceptar la hiptesis alternativa.
Se concluye que los turistas tienen gastos diferentes de 9.9
dlares, al nivel del 5%.

Distribucin de proporciones
El proceso es similar a lo explicado para las medias,
considerando que por lo general la desviacin tpica y por
ende el error estndar de la proporcin se calcula con datos
obtenidos en la muestra donde n > 30 elementos.
Se ha podido establecer en las estadsticas que el 40% de los
turistas toman un determinado paquetes. Una muestra
aleatoria de 450 turistas revel que 200 de ellos solan tomar
dicho paquete. Cul podra ser la conclusin al nivel del 1%,
acerca de lo que muestran las estadsticas?

Decisin: z = 1.71 se ubica en la zona de aceptacin, se acepta


el 40% que arrojan las estadsticas, al nivel del 5%.
El gerente de una empresa afirma que el porcentaje de atrasos
en las horas de llegada al trabajo es del 20% de los empleados.
Solicita al jefe de personal la revisin de 40 tarjetas marcadas
con las horas de llegada, en el mes, y encuentra que 6 han
llegado tarde. Al nivel del 5%, hay razn para concluir que el
gerente est exagerando?.

e) Decisin: z = -0.89 se ubica en la zona de aceptacin; por


tanto al nivel del 5% el gerente no est exagerando.

c) Distribucin de diferencias
entre dos medias
Se utiliza esta prueba cuando se tiene dos poblaciones
independientes y se extrae dos muestras para establecer sus
diferencias. Si una media es mayor o menor que la otra, son
significativas.
Una empresa tiene dos fbricas y desea establecer el
promedio de antigedad que tienen sus empleados. Se toma
de la primera fbrica una muestra de 60 empleados, la cual
reflej un promedio de trabajo de 16.4 aos con desviacin
estndar de 5 aos; mientras que en ia segunda fbrica una
muestra de 40, fue de 15.8 aos, con desviacin estndar de
4.2 aos. Al nivel del 5% se podr afirmar que hay una
diferencia significativa en cuanto a la antigedad de los
empleados?

Decisin: Como z = 0.65, no hay diferencia significativa, al nivel


del 5%

d) Distribucin de diferencias
entre dos proporcione
Las proporciones son aplicadas como medidas a caractersticas
cualitativas (atributos). La prueba de hiptesis, que implica el
uso de la distribucin normal, permite establecer si hay o no
diferencia entre dos proporciones obtenidas en dos
poblaciones independientes, o si un grupo tuvo una
proporcin mayor que el otro.
Utilizando una muestra aleatoria de 350 profesionales que
trabajan y otra muestra Independente de 325 que son
profesionales y no trabajan. En el primer caso 105
manifestaron que compran el diario. En el segundo, la
respuesta fue de 130 que no lo compraban. Al nivel del 1% se
podr afirmar que los profesionales que trabajan leen menos
que los profesionales que no trabajan?.

Decisin: Como z = -2.73, se ubica en la zona de rechazo. Se


puede afirmar que los profesionales que trabajan leen menos
que las que no trabajan, al nivel del 1%.

Un investigador en el campo del turismo realiza dos muestras de


tamao de 120 trabajadores, una en cada hotel, con el fin de
determinar el porcentaje de faltas en el trimestre. En el primer
hotel se observ que se presentaron 12 casos en el trimestre,
mientras que en el segundo 16. Al nivel del 5% se podr afirmar
que los contagios son iguales en los dos hoteles?

Decisin: Como z = -0.73, se ubica en la zona de aceptacin. Se puede


afirmar que el nivel de faltas es igual en los dos hoteles, al nivel del 5%.

Dos grupos A y B de 100 personas cada uno tiene determinada


enfermedad. Un suero es dado al grupo A, pero no al B. Por
otra parte, los grupos son tratados por igual. Si encontramos
que en el grupo A, 75. personas se recobran de la enfermedad y
en el B, 65, pruebe la hiptesis de que el suero cura la
enfermedad? (5%)

Decisin: Como z= 1,64


No podemos aceptar que el suero cure la enfermedad, al nivel del 5%.

Distribucin t de Student
Esta distribucin es simtrica en forma de campana, pero la
curva es achatada y se extiende a los extremos a las reas
crticas o de rechazo. Existe una familia de distribuciones T, a
medida que se incrementa e. tamao de la muestra se acerca
a la normal. La funcin es:

Distribucin de medias mustrales


Cuando la muestra es pequea (n < 30) la desviacin tpica se
tendr que corregir, para luego ser aplicada en la variante
estadstica t.

Ejercicio: En una empresa de lcteos, un inspector de calidad


investiga las acusaciones de no llenar bien los envases,
afirmando que contienen 35 onzas de lquido, se muestrean
28 cartones de leche, encontrando un contenido medio de
33,2 onzas, con una desviacin estndar de 2,2 onzas.
Debe llegar el inspector a la conclusin, al nivel del 5%, que
se est exagerando su contenido?

Distribucin de una proporcin


muestral
En una investigacin en la Universidad se determin que el 42% de
alumnos tiene dificultad en aprender matemtica. El vicerrectorado
desea disminuir este porcentaje; para ello debe comprobar ese
porcentaje, y decide realizar una investigacin por muestreo a 25
estudiantes encontrando que 13 de ellos tienen dificultad de
aprendizaje. A nivel del 1% el vicerrectorado puede aceptar el 42%
como indicador?

Distribucin de diferencia
entre dos medias
Para investigar sobre el rendimiento de los alumnos en la
seccin diurna y nocturna se obtuvo una muestra de sus
calificaciones promedio:
Diurno: 14.0, 16.8, 15.2, 14.4, 16.0, 14.4, 16.8, 19.2, 16.0, 14.4
Nocturno: 12.8, 14.4, 13.6, 15.2, 16.0, 12.8, 14.4, 13,6
Los anteriores resultados permiten concluir que hay
diferencia en el rendimiento diurno y nocturno?

Distribucin de diferencia
entre dos proporciones
Una empresa desea realizar una investigacin sobre el
consumo de aceite marca A. En una muestra probabilstica de
14 amas de casa, el 20% indic la preferencia por la marca A.
Posterior a una campaa publicitaria intensiva de radio y
televisin, se seleccion una nueva muestra entre amas de
casa del mismo tamao y clase social. En esta muestra el 25%
indic preferencia por la marca A. De acuerdo con estos
resultados y a un nivel del 5%, podra rechazarse la hiptesis
de que la campaa publicitaria no fue efectiva?
Solucin: m = 14, n2 = 14, pi = 0.20, p? = 0.25, = 0.05,

OTRAS PRUEBAS DE
HIPOTESIS
PRUEBA EN OBSERVACIONES APAREADAS
Se debe tomar una muestra aleatoria de pares, de manera que cada
observacin, est asociada con alguna observacin en particular. La
muestra de pares de observaciones da base para considerar dos
muestras dependientes, donde las observaciones de un par estarn
relacionadas entre si. Sus frmulas son:

En una escuela pblica se escogieron 10 pares de nios de


primer ao para comparar similitud de inteligencia y
preparacin. Un nio de cada par fue enseado a leer con un
mtodo y el otro nio con otro mtodo. Despus del perodo
de aprendizaje, ios nios fueron sometidos a una prueba de
lectura con los siguientes resultados, (el puntaje fue de 0 a
100). A un nivel de significacin del 5%, existe alguna
diferencia significativa en la mayor efectividad de alguno de
los mtodos aplicados?

e) Decisin: t = -0.63 se ubica en la zona de aceptacin y se


acepta la hiptesis nula, por lo tanto se concluye que ningn
mtodo es superior al otro, al nivel del 5%.
Supongamos que se quiere estudiar la efectividad de una dieta
y se nos proporciona la siguiente informacin referente a los
pesos, antes y despus en una muestra al azar de 8 mujeres
adultas con edades de 35 a 40 aos o ms (dado en libras).
Docimar al nivel del 5% que la dieta fue efectiva

PRUEBA DE CHI-CUADRAD
(Ji-cuadrada
Esta distribucin fue introducida por F.R Helmert en 1876 y
redescubierta en 1900 por Kart Pearson. Tiene muchos usos
importantes, incluyendo ensayos de hiptesis acerca de
proporciones y clculo de intervalos de confianza para
varianzas. Hay una distribucin ji cuadrada diferente segn el
valor de n-1, lo cual representa los grados de libertad (gl). Asi:

Cmo leer en la tabla?.


Se busca en la primera fila x2 primera columna gl, en la interseccin
de la fila y la columna correspondiente se encuentra el valor de x2
correspondiente. Ejercicio Si se tiene una variable aleatoria que
sigue una distribucin x2 con 20 grados de libertad, obtener x

Proceso para la prueba Ji-cuatisrada


Formular la hiptesis
Establecer las diferencias entre las frecuencias observadas y las
esperadas, se eleva la cuadrado y se divide cada una de ellas
para la frecuencia terica esperada.
Se suma y se obtiene Ji-cuadrada
Ecuacin sin correccin

Ecuacin con correccin de Yates

Nota: La correccin de yates se utiliza cuando la tabla es de


2x2, es decir, v = 1 y la variables es discreta. En muestras
grandes se obtienen prcticamente los mismos resultados. La
correccin de Yates hoy es muy poco utilizada por cuanto se ha
demostrado que, en la mayora de casos la hiptesis nula no se
rechaza.
1. Durante una epidemia se obtuvieron los siguientes datos
sobre la efectividad de una vacuna como medida preventiva
para los mdicos. Estos datos, indican la efectividad de la
vacunacin con base en el nivel significativo del 1%
TRATAMIENTO ENFERMOS NO ENFERMOS TOTAL

Vacunados

192

196

No vacunados

113

34

147

TOTAL

305

38

343

DISTRIBUCIN F
En diversos problemas de inferencia que se discutirn
pasterformente, tales como comparar las varianzas de dos
poblaciones normales, comparar los efectos de dos o ms
tratamientos, y otros muchos, es til la funcin de densidad
de probabilidades conocidas como distribucin de F. su
definicin formal se da enseguida.
Definicin: Sean X2 (m) y X2 (n) dos variables aleatorias
independientes distribuidas como Ji-Cuadrada con m y n
grados de libertad, respectivamente. Entonces la variable
aleatoria definida como:

Tiene la distribucin F con m y n grados de libertad.


La distribucin F est completamente determinada por los
parmetros m y n, los grados de libertad de las variables
aleatorias Ji-Cuadradas que le dan origen. En ocasiones se
identifica a F diciendo que tiene m grados de libertad en el
numerador y n grados de libertad en el denominador. La
notacin ser: F ~ F mn
La distribucin F est ligada con la distribucin t de Student,
como se asienta enseguida. Sea t una variable aleatoria
distribuida como t de Student con o grados de libertad;
entonces, el cuadrado de t se distribuye como F con 1 y v
grados de libertad. En smbolos:

Uso de las tablas de F


Las tabJas F, G, H e I estn integradas de la siguiente forma: la primera
hilera tiene los grados de libertad (m) de la variable X2 en el numerador,
mientras que en la primera columna estn los grados de libertad (n) de
la variable X en el denominador. El resto del cuerpo de la tabla presenta
valores de la variable F tales que:
P(F>= Fmn,) = a
La tabla F proporciona valores de F m n/ix para valor de: a = 0,10, la tabla
G para a 0.05, la tabla H para = 0,025, y la tabla I para a = 0,01
Ejemplo: Se quiere encontrar F 4is;o.o5, es decir, el valor de F tal que la
probabilidad de un valor mayor es 0,05, con 4 y 15 grados de libertad.
De la tabla G leemos en la interseccin de la fila m = 4 y la columna con
n = 15, el valor 3,055o. Por lo tanto, F4i5.o.m., = 3,0556. Es decir, P(F415,
>3.0556)=0.05
De la definicin de la distribucin de F se deduce fcilmente la
siguiente propiedad
Si a variable aleatoria F es tal que F a Fmn entonces la variable aleatoria
^ tiene la distribucin F nm

Dcimas de homogeneidad e
independencia
Prueba de independencia, se extrae una sola muestra de la
poblacin y slo nos interesa probar si existe alguna relacin
entre los criterios de clasificacin establecidos.
Prueba de homogeneidad, al contrario de la de
independencia, se extraen dos o ms muestras provenientes
de dos o ms poblaciones; algunas veces de una muestra se
pueden obtener dos o ms categoras y el inters es probar s
las poblaciones tienen cierta identidad con respecto a las
caractersticas analizadas.
Un almacn vende lavadoras y aspiradoras elctricas y tiene
tres vendedores. Las Ventas realizadas en un mes por dichos
vendedores se resumen en la tabla. Demuestra este
resultado que la habilidad de cada vendedor depende del tipo
de artculo que vende?. Pruebe la hiptesis

APARATOS
Lavadoras
Aspiradoras
TOTAL

VEN
1
20
17
37

DEDO
2
8
16
24

RES
3
15
5
20

TOTAL
43
38
81

ANLISIS DE REGRESIN Y
CORRELACION

CONCENTOS BSICOS
Regresin.- Se utiliz por primera vez como trmino estadstico en
1877 por Sir Francis Gaiton. Este realiz un estudio y mostr que los
nios nacidos de padres altos tienden a retroceder o "regresar
hacia la altura media de la poblacin. Design la palabra regresin
como el proceso general de predecir una variable (la altura de los
nios) de otra (la altura de los padres).
Regresin mltiple- se utiliza para estimar el valor de una variable
dependiente con base a dos o ms variables independientes.
(Cuando aadimos ms de una variable independiente, mejoramos
la exactitud de nuestra prediccin).
fAnlisis de regresin.- nos permite desarrollar una ecuacin de
estimacin, frmula matemtica que relaciona la variable conocida
(x) con la variable desconocida (y).
Anlisis de correlacin.- Determina el grado que estn relacionadas
las variables.
Variable independiente (x).- Es la variable (o variables) conocidas.
Variable dependiente (y).- Es la variable que tratamos de predecir.

DIAGRAMA DE DISPERSIN
El primer paso para ver s existe relacin entre dos variables es
examinar la grfica de los datos observados (o conocidos). Esta
grfica se llama diagrama de dispersin. Una de las razones
para dibujar grficas de puntos como parte del anlisis inicial
es identificar las relaciones no lineales. Por otra parte, si el
coeficiente de correlacin se calcula sin analizar los datos, es
posible ignorar una relacin importante, pero no lineal.

LINEA DE REGRESION

Por medio de una ecuacin matemtica podemos expresar de


manera prctica la relacin entre dos variables, siendo la ms
simple la ecuacin lineal cuya grfica es la lnea recta. De
hecho muchas relaciones pueden representarse
aproximadamente por lneas rectas.
Ecuacin de la recta: y = bx + a
Donde: y = variable dependiente x = variable independiente b
= pendiente de la recta (inclinacin) a = interseccin de la
recta sobre el eje y (si x = 0)

METODOS PARA AJUSTAR UNA


RECTA
Mtodo libre.- Es el mtodo ms simple, que consiste en
graficar el diagrama de dispersin y utilizando una regla trazar
una lnea entre los puntos dispersos, de modo que tomando
dos puntos de ella y resolviendo un sistema de ecuaciones se
puede encontrar la ecuacin de regresin. (No se sugiere por
cuanto cada persona es libre de escoger los puntos y
tendremos diferentes ecuaciones, para evitar se utiliza el
mtodo mnimos cuadrados

Mtodo de mnimos cuadrados


De todas las curvas de aproximacin a una serie de datos
puntuales la curva que tiene la propiedad de que D21 + D22 +
D23 +... + D2n es mnimo, se conoce como mejor curva de
ajuste.

Resolviendo el sistema de ecuaciones podemos hallar a y b

Podemos simplificar los clculos utilizado las ecuaciones

Anlisis de Correlacin
Se utiliza para determinar el grado de relacin que existe
entre las variables x e y. En cualquier investigacin seria, se
debe utilizar junto al anlisis de regresin. Para describir la
correlacin entre variables se utiliza dos medidas; el
coeficiente de determinacin y el coeficiente de correlacin.
Coeficiente de correlacin (r)
El coeficiente de determinacin (r2) es muy fcil de interpretar,
pero no se presta para realizar una prueba estadstica.
Mientras que el coeficiente de correlacin (r) si permite
(puede servir para definir una estadstica de prueba con
distribucin t cuando la correlacin poblacional equivale a
cero). El coeficiente de correlacin para datos mustrales,
cuyo signo aritmtico es el

Interpretacin errnea de r y r2, El coeficiente de correlacin


(r) es mal interpretado como un porcentaje. Si r = 0.70, es
incorrecto afirmar que la ecuacin de regresin explica" 70%
de la variacin total en y. Ms bien, si r = 0.70, entonces r2 =
(0.70)(0.70) = 0.49. Solo el 49% de la variacin total es
explicada por la lnea de regresin".
Error estndar de la estimacin (Se)
Mide la variabilidad o dispersin de los valores observados
alrededor de la lnea de regresin. Indica la confiabildad de la
ecuacin de estimacin. El denominador n - 2 porque
perdemos dos grados de" libertad (para los valores de a y b) al
estimar la lnea de regresin. (Mtodo de atajo)

Ejemplo: La distribucin corresponde a las alturas en pulgadas


de 10 padres y sus hijos

Altura de los padres (x)


Altura de los hijos (y)

65 63 67 68 62 70 66 68 67 69
68 66 68 69 66 68 65 71 67 68

Construir un diagrama de dispersin


Hallar la recta de regresin de los mnimos cuadrados
Graficar la ecuacin de regresin
Estimar el valor de y para x = 78 pulgadas.
Calcular el coeficiente de correlacin (r).
Calcular el coeficiente de determinacin (r2).
Solucin:
Construir un diagrama de dispersin

Xy

Hallar la recta de regresin de los


mnimos cuadrados

65
63
67

68
66
68

68

69

62
70

66
68

66
68

65
71
67

67
69

X2

*y

y2

4225
3969
4489
4624
3844
4900
4356
4624
4489
4761

4420
4158
4556
4692
4092
4760
4290
4828
4489
4692

4624
4356
4624
4761
4356
4624
4225
5041
4489
4624

68
665 676 44281 44977 45724
Ix Ey Ex 2 Zxy Ey 2

Calcular el coeficiente de correlacin

d) Calcular el coeficiente de determinacin (r2): r2 = 0.5852 =


0.3424 El 34.24% de la varianza de la estatura de los hijos es
estadsticamente explicado de la estatura de los padres.
1.Supngase que los antecedentes histricos del nmero de
turistas (en miles) atendidos en un hotel desde el ao 1998 es:
AO
1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
No. de turistas (miles) 12 20 32 47 72 92 127 150 180 222 271

a) Construir un diagrama de dispersin


b) Hallar la recta de regresin de los mnimos cuadrados
c) Proyectar el nmero de pacientes con cncer hasta el ao
2013
d) Calcular el coeficiente de correlacin (r).
e) Calcular el error estndar de la estimacin (Se)

Solucin:
Construir un diagrama de dispersin

b) Hallar la recta de regresin de los mnimos cuadrados

Calcular el coeficiente de determinacin (r2): r2 = (0.9792)2 =


0.9588 Significa que el 95.88% de la variacin total de la
demanda se explica por el ao, queda el 4.12% restante sin
explicar, Este es un caso tpico de servicios hoteleros cuya
demanda depende fuertemente de la poblacin, pues la tasa
de crecimiento se expresa como funcin anual.
Calcular el error estndar de la estimacin (Se)

Si se desea que la prediccin sea confiable en un 95.88%, el


intervalo de confianza de la demanda estimada sera: +
2(18.49). La mayor precisin se asocia con los errores
estndares pequeos.

RELACIONES CURVILINEAS
Las relaciones curvilneas se presentan con frecuencia en
investigaciones, se puede ajustar los puntos a una lnea recta y
= a + bx.
La ecuacin es:
y - a.xb
En el campo empresarial se puede aplicar cuando se considera
lo siguiente:
y = costo medio por persona en la atencin de un grupo
humano, x = nmero de personas atendidos
a = se relaciona con el porcentaje de reduccin del costo por
cada persona adicional atendido, b = costo de atencin de la
primera persona

Mtodo 1:

Mtodo 2:

Ejemplo: Los datos corresponden al nmero de turistas


atendidos en un hotel desde el ao 2003 hasta el 2008
ANO

2003 2004 2005 2006 2007 2008

No. de turistas 200 500

1400 4000 12500 18000

Construir un diagrama de dispersin


Hallar la recta de regresin de los mnimos cuadrados
Graficar la ecuacin de regresin
Calcular el coeficiente de correlacin (r).

Solucin.
a) Construir un diagrama de dispersin

b) Hallar la recta de regresin de los mnimos cuadrados

Graficar la ecuacin de regresin

Mtodo 2

Funcin exponencial

Esta funcin es muy utilizada en el campo de la Economa, en


problemas de negocios (inters compuesto), en Biologia, en la
reproduccin de bacterias; en Fsica, en la disminucin de la
radiacin de un istopo radiactivo.

Expresado en forma de logaritmos:


log y = log a + bx.(log e) log y = log a + (b.log e).x.
Si decimos que: Y = log y; A = log a; B = b.(log e); X = x.
Luego la ecuacin de la recta es: Y = A + BX
Ejemplo: en una investigacin se obtienen los siguientes
datos. Calcular la ecuacin exponencial.
x
y

0
2

1
5

2
18

3
55

4
105

5
250

Tabla de distribucin t

Tabla de distribucin de Ji
Cuadrado

También podría gustarte