Está en la página 1de 113

CONTENIDO.

MDULO I: TEORIA DE CONJUNTOS Y PROBABILIDAD


MDULO II: VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
MDULO III: ESTIMACION
MDULO IV: CONTRASTE DE HIPOTESIS
MDULO V: REGRESION Y CORRELACION LINEAL SIMPLE

10

11

12

13

14

15

16

Smbolos Matemticos

Smbolos

AB
P(A)
x<y
x y
[a, )
( , b]
(a, )
(- , b)
[a, b]
(a, b)
(x, y)
AxB

Descripcin
Pertenece
No pertenece a
Contenido en
Estrictamente Contenido
No est contenido
Igual
Diferente
Unin
Interseccin
Diferencia
Conjuntos de Partes de A
x menor que y
x menor o igual a y
Intervalo Cerrado por la izquierda
Intervalo Cerrado por la derecha
Intervalo Abierto por la izquierda
Intervalo Abierto por la derecha
Intervalo Cerrado
Intervalo Abierto
Par ordenado
Producto Cartesiano

17

Interpretaciones de la Probabilidad 1
A pesar de que el concepto de probabilidad es una parte tan comn y natural de la experiencia
de la gente, no existe una nica interpretacin cientfica del trmino probabilidad aceptada por
todos los estadsticos, filsofos y dems autoridades cientficas. A travs de los aos, cada
interpretacin de la probabilidad propuesta por unos expertos ha sido criticada por otros. De
hecho, el verdadero significado de la probabilidad es todava un trmino muy conflictivo y
surge en muchas discusiones filosficas actuales sobre los fundamentos de la estadstica.
Se expondrn tres interpretaciones (o definiciones) diferentes de la probabilidad, cada una de
estas interpretaciones puede ser til en la aplicacin de la teora de la probabilidad a
problemas prcticos.

Interpretacin Clsica de la Probabilidad (o Probabilidad a priori)


La teora de la probabilidad en sus comienzos estuvo asociada a los juegos de azar. Esta
asociacin impulsa la interpretacin clsica. Por ejemplo, supngase que se quiere conocer la
probabilidad de que al lanzar una moneda salga cara. Puede argumentarse de la siguiente
manera: Como hay solamente dos formas en que la moneda puede caer, cara o sello, y como la
moneda esta balanceada, podra esperarse que sea tan probable que salga cara como sello, as
la probabilidad de cara estar dada por el valor 1/2.
Esta interpretacin de la probabilidad esta basada en el concepto de resultados igualmente
probables que son mutuamente excluyentes. Generalizando, si el resultado de algn proceso
debe ser uno de n resultados diferentes y estos n resultados son igualmente probables y
mutuamente excluyentes, entonces la probabilidad de cada resultado es 1/n.
Considrese otro ejemplo: Si un dado es lanzado (hay seis posibles resultados) cualquiera de
las seis caras numeradas pueden salir. Estos seis resultados son mutuamente excluyentes dado
que dos o ms caras no pueden salir simultneamente,
1

Basado en los siguientes textos: DeGroot, Morris. Probabilidad y Estadstica. Pgs. 2-6; Mood, Graybill y

Boes. Introduction to the Theory of Statistics. Pgs. 3-5.

18

y si el dado es justo2, los seis resultados son igualmente probables, es decir que por la
naturaleza del proceso, por su simetra, todas las caras tienen la misma oportunidad de
aparecer.
Ahora se quiere la probabilidad de que el resultado de un lanzamiento sea un nmero par.
Tres de los seis posibles resultados tienen este atributo. La probabilidad de que un nmero
par aparecer cuando el dado es lanzado es 3/6 1/2. Similarmente, la probabilidad que un
cinco aparecer cuando un dado es lanzado es 1/6. La probabilidad que el resultado de un
lanzamiento ser mayor que 2 es 2/3.
De este modo, se tiene de manera ms general que, si los n resultados de un fenmeno
aleatorio son mutuamente excluyentes e igualmente probables y si n(A) de estos resultados
presentan el atributo A, entonces la probabilidad de A es la proporcin n (A)/n.

Debe notarse que por la interpretacin clsica, la probabilidad de A es un nmero entre 0 y


1 (ambos inclusive). La proporcin n (A)/n debe ser menor que o igual a1, ya que el
nmero total de posibles resultados no puede ser menor que el nmero de resultados con un
atributo especfico. Si es seguro que un suceso ocurra, su probabilidad es 1; si es imposible
que ocurra, su probabilidad es cero. De esta manera, la probabilidad de obtener un 7 al
lanzar un dado es 0. La probabilidad que al lanzar un dado se obtenga un nmero menor
que 8 es igual a 1.
Las probabilidades determinadas por la definicin clsica son llamadas probabilidades a
priori, debido a que se llega al resultado solamente por razonamiento deductivo.
Hay algunas limitaciones en la interpretacin clsica:
1. No proporciona un mtodo sistemtico para asignar probabilidades a resultados que no
sean igualmente probables.

19

Por ejemplo, es lanzada una moneda sabiendo que esta sesgada a favor de las caras, es
decir, es ms probable que aparezca una cara que un sello. Los dos posibles resultados
del lanzamiento de la moneda no son igualmente probables 3. Cul es la probabilidad
de cara? La definicin clsica no tiene la posibilidad de ayudar aqu.

2. Hay otra dificultad cuando a la interpretacin clsica se le hacen preguntas como:


Cul es la probabilidad de que nazca un varn en Barinas?
Cul es la probabilidad de que un hombre muera antes de los 50 aos?
Cul es la probabilidad de que una persona se case?
Todas estas son preguntas legtimas que se quieren traer al campo de la teora de
probabilidad. Sin embargo, las nociones de simetra, igualmente probable, etc., no
pueden ser utilizadas como lo son en los juegos de azar.
3. Otro inconveniente surge cuando los resultados del proceso no son finitos. Esto aparece
muchas veces cuando el nmero de resultados posibles del proceso es posiblemente
muy grande. Por ejemplo, Cul es la probabilidad de que lleguen a una interseccin
vial ms de 500 automviles entre las 12 PM y la 1 PM?
Nota 1:
Hay que tener cuidado y poner atencin a las calificaciones de mutuamente excluyente,
igualmente probables y aleatorio. Supngase que se desea calcular la probabilidad de
obtener dos caras si una moneda es lanzada dos veces. Pudiera razonarse que hay tres
posibles resultados para los dos lanzamientos: dos caras, dos sellos o una cara y un sello.
Uno de estos tres resultados tiene el atributo deseado, es decir, dos caras; Adems la
probabilidad es 1/3. Este razonamiento es incorrecto ya que los tres resultados dados no
son igualmente probables. El tercer resultado, una cara y un sello, puede ocurrir de dos
maneras debido a que la cara puede aparecer en el primer lanzamiento y el sello en el
segundo; o la
2

Es decir, el dado es un cubo perfecto en el sentido de que es simtrico y no est arreglado para que alguna

de sus caras tenga ms chance de ocurrir.

20

Esto se conoce con la expresin: la moneda no est balanceada, no es simtrica o no es justa

21

cara puede aparecer en el segundo lanzamiento y el sello en el primero. As hay cuatro


resultados igualmente probables: (cara, cara), (cara, sello), (sello, cara) y (sello, sello)4. El
primero de estos tiene el atributo deseado, mientras los otros no. La probabilidad correcta
es entonces 1/4. El resultado debera ser el mismo si dos monedas balanceadas fueran
lanzadas simultneamente.
Ahora, supngase que se desea calcular la probabilidad que una carta extrada de una baraja
de bridge5 ser un as o una espada. En la enumeracin de los resultados favorables, pueden
contarse 4 ases y trece espadas y se concluye que hay 17 resultados con el atributo deseado.
Esto es claramente incorrecto ya que estos 17 resultados no son mutuamente excluyentes
debido a que el as de espadas es tanto as como espada. Hay 16 resultados que son
favorables a un as o una espada, as la probabilidad correcta es 16/52 o 4/13.

Interpretacin Frecuentista de la Probabilidad (Probabilidad a Posteriori)


En muchos problemas, la probabilidad de obtener algn resultado especifico de un proceso
puede ser interpretado en el sentido de la frecuencia relativa con la que se obtendra ese
resultado si el proceso se repitiera un nmero grande de veces en condiciones similares.
Supngase que una moneda simtrica la cual parece estar bien balanceada fue lanzada 100
veces, los resultados fueron los siguientes:

Tabla 1. Resultados obtenidos al lanzar una moneda 100 veces.


Resultado

Frecuencia

Frecuencia relativa observada

observada

C
S
TOTAL

56
44
100

Frecuencia relativa esperada


a largo plazo

0.56
0.44
1

0.50
0.50
1

Obsrvese que la frecuencia relativa de caras esta cerca de 1/2. Esto era lo que se esperaba
ya que la moneda era simtrica.
Supngase ahora que un dado fue lanzado 300 veces, con los siguientes resultados:
Tabla 2. Resultados obtenidos al lanzar un dado 300 veces.
Resultado

1
2
3
4
5
6
TOTAL

Frecuencia

Frecuencia relativa

Frecuencia relativa esperada a largo

observada

observada

plazo

51
54
48
51
49
47
300

0.170
0.180
0.160
0.170
0.163
0.157
1

0.1667
0.1667
0.1667
0.1667
0.1667
0.1667
1

Ntese ahora que la frecuencia relativa de la cara con 1 esta cerca de 1/6; de manera similar
para 2, 3, 4, 5 y 6. Estos resultados no son inesperados, ya que el dado estaba balanceado;
era de esperarse que cada cara ocurriera con aproximadamente la misma frecuencia en el
largo plazo.

Esto sugiere que se pueden usar las frecuencias relativas como una aproximacin para la
probabilidad. En otras palabras, se supone que la proporcin de lanzamientos en los que se
obtiene una cara en el lanzamiento de una moneda o de los nmeros de un dado se puede
usar como una aproximacin de la respectiva probabilidad. Advirtase que aunque las
frecuencias relativas de los diferentes resultados son predecibles, el resultado actual de un
lanzamiento individual es impredecible.
En los ejemplos anteriores puede usarse la interpretacin clsica o la frecuentista y se
obtienen aproximadamente los mismos resultados. Esto se debe a que la moneda y el dado
estn bien balanceados y son simtricos. Supngase ahora que la moneda no est
balanceada, as que los dos casos: cara y sello, no son igualmente probables que ocurran.
Aqu la definicin clsica no es til en la misin de encontrar el valor de una probabilidad.
Entonces, podra utilizarse la interpretacin de la frecuencia relativa o posiblemente algn
anlisis fsico de la moneda no balanceada.
En muchas investigaciones cientficas, se toman observaciones las cuales tienen un
elemento de incertidumbre o son impredecibles. Como un ejemplo, supngase que se quiere
predecir, si al nacer un bebe en cierta localidad ser varn o hembra. Esto es
individualmente un evento incierto, pero los resultados de grupos de nacimientos pueden
ser satisfactorios. Se ha encontrado que existe una cierta regularidad a largo plazo, la cual
es similar a la regularidad a largo plazo de la frecuencia relativa de una cara cuando una
moneda es lanzada. Si por ejemplo es encontrado, examinando registros, que alrededor de
51% de los nacimientos en esta localidad son masculinos, este nmero puede ser tomado
como una aproximacin a la probabilidad de que nazca un varn en esa localidad.
Para hacer esta idea mas concreta, se asumir que una serie de observaciones pueden ser
obtenidas bajo condiciones uniformes. Es decir, una observacin de un experimento
aleatorio es hecha; entonces el experimento se repiti bajo las mismas condiciones y se
tom otra observacin. Esto se repite muchas veces, y mientras las condiciones son
similares cada vez, hay una variacin incontrolable la cual es aleatoria, as que las

observaciones son individualmente impredecibles. En muchos de estos casos las


observaciones caen dentro de ciertas clases en donde las frecuencias relativas son muy
estables. Esto sugiere que se postule un numero p, llamado la probabilidad del evento, y
p ser aproximado por la frecuencia relativa con la cual las observaciones repetidas
satisfacen el evento en particular.
En la Figura 1 se muestran los resultados de efectuar en cinco oportunidades, el
experimento de lanzar 150 veces una moneda balanceada y graficar el comportamiento de
la respectiva frecuencia relativa de cara. Como era de esperarse, en los cinco casos, al
principio existe cierta fluctuacin en las respectivas frecuencias relativas. A medida que
aumenta el nmero de lanzamientos, esta frecuencia relativa se va estabilizando mostrando
una tendencia clara hacia la frecuencia relativa 0,5. Ntese que algunas de las curvas
tienden ms rpido a 0,5 que otras. Por tanto, segn la interpretacin frecuentista de la
probabilidad, p=0,5; que es el mismo valor

de la probabilidad de cara que se obtiene bajo la interpretacin clsica. Esta es una


ilustracin de cmo se comporta la frecuencia relativa en el largo plazo6.

De este modo para calcular la probabilidad p de que un suceso A ocurra, se realiza el


experimento sucesivamente bajo condiciones similares y se va contando el nmero de
veces que ocurre A. Sea n(A) el nmero de veces que ocurre el suceso A en las primeras n
repeticiones. Entonces la frecuencia relativa de ocurrencia de A en las primeras n
repeticiones del experimento viene dada por:

La probabilidad de A es el lmite de este cociente, cuando n tiende a infinito, si este lmite


existe:

Esta claro que las condiciones mencionadas son muy vagas para servir como base de una
definicin cientfica de probabilidad. Por tanto, este criterio de la probabilidad a posteriori
recibe varias crticas, entre las cuales se pueden mencionar las siguientes:
1. Se menciona un nmero grande de repeticiones de un proceso, pero no hay una
identificacin clara del nmero especfico que podra considerarse suficientemente grande.
2. Se afirma que la moneda debera ser lanzada cada vez en condiciones similares, pero
estas condiciones no se describen con precisin. Las condiciones en la cual se lanza la
moneda no pueden ser completamente idnticas para cada lanzamiento porque entonces los
resultados serian todos iguales y se obtendran slo caras o slo sellos. De hecho, una
persona experimentada puede lanzar una moneda repetidamente y cogerla de tal manera
que obtenga una cara en casi todos los lanzamientos. En consecuencia, los lanzamientos no
deben ser completamente controlados sino que deben tener una caracterstica aleatoria.

1
3. Se asevera, adems, que la frecuencia relativa de caras sera aproximadamente 1/2,
pero no se especifica un lmite para la variacin posible respecto al valor 1/2. Si una

moneda fuese lanzada 1.000.000 de veces, no se esperara obtener exactamente 500.000


caras. En realidad, sera muy sorprendente si se obtuvieran exactamente 500.000 caras. Por
otro lado, tampoco se espera que el nmero de caras difiriera mucho de 500.000.
4. Otro inconveniente de la interpretacin frecuentista de la probabilidad es que slo puede
utilizarse para un problema en el que pueda haber, al menos en principio, un nmero grande
de repeticiones similares de cierto proceso. Muchos problemas importantes no son de este
tipo. Por ejemplo, la interpretacin frecuentista de la probabilidad no puede ser aplicada
directamente a la probabilidad de que un determinado conocido contraiga matrimonio en
los prximos dos aos.

Interpretacin Subjetiva de la Probabilidad


De acuerdo con la interpretacin subjetiva o personal de la probabilidad, la probabilidad
que una persona asigna a uno de los posibles resultados de un proceso representa su propio
juicio sobre la probabilidad de que se obtenga el resultado. Este juicio estar basado en las
opiniones e informacin de la persona acerca del proceso. Otra persona que puede tener
diferentes opiniones o informacin distinta puede asignar una probabilidad diferente al
mismo resultado. Por esta razn, resulta ms apropiado hablar de la probabilidad subjetiva
que asigna cierta persona a un resultado, que de la verdadera probabilidad de ese resultado.
Con el objeto de que una persona sea capaz de asignar probabilidades subjetivas a los
resultados, debe expresar su grado de creencia en trminos numricos. La interpretacin
subjetiva de la probabilidad puede ser formalizada, en general, si los juicios de una persona
acerca de las probabilidades de diversas combinaciones de resultados satisfacen ciertas
condiciones de consistencia. Entonces puede demostrarse que sus probabilidades subjetivas
para los diferentes sucesos posibles pueden ser determinadas en forma nica.

La interpretacin subjetiva tiene, sin embargo, dos dificultades:

1. El requisito de que los juicios de una persona sobre las probabilidades de un nmero
infinito de sucesos sean completamente consistentes y libres de contradicciones no
parece humanamente posible.
2. La interpretacin subjetiva no proporciona bases objetivas para que dos o ms
cientficos que trabajan juntos obtengan una evaluacin conjunta de su estado de
conocimiento en un rea cientfica de inters comn.
La evaluacin por un determinado cientfico de la probabilidad de algn resultado incierto
debe ser, en ltima instancia, su propia evaluacin, basada en todas las evidencias de que
dispone. Esta evaluacin puede estar parcialmente basada en la interpretacin frecuentista
de la probabilidad, ya que el cientfico puede tener en cuenta la frecuencia relativa de la
ocurrencia de este resultado o de resultados similares en el pasado. Tambin puede basarse
parcialmente en la interpretacin clsica de la probabilidad, puesto que el cientfico puede
tener en cuenta el nmero total de resultados posibles que considera igualmente probables.
Sin embargo, la asignacin final de probabilidades numricas es responsabilidad del propio
cientfico.

La Teora de la Probabilidad y las Interpretaciones de Probabilidad


La teora de la probabilidad y la estadstica se pueden desarrollar, sin considerar la
controversia en torno a las diferentes interpretaciones del trmino probabilidad. Esta teora
es correcta y puede ser aplicada tilmente, con independencia de la interpretacin de
probabilidad que se utilice en un problema particular. Una vez asignadas las probabilidades
a algunos resultados de algn proceso, todos los expertos estn completamente de acuerdo
en que la teora matemtica de la probabilidad proporciona la metodologa apropiada para
ampliar el estudio de estas probabilidades.

Probabilidad de un evento
Las probabilidades se plantean con respecto a algn evento. El evento en cuestin puede ser
que llueva, haya ganancias, caiga cara, se obtenga un rendimiento de por lo menos 6%, se
termine el curso, se obtengan buenas calificaciones, entre otros.
Las probabilidades pueden expresarse en mltiples formas, incluyendo decimales,
fracciones y porcentajes. Por ejemplo, la posibilidad de lluvia se puede establecer como
20%, 2 de 10, 0.20, o bien 1/5.
La probabilidad de que un evento ocurra est dada mediante un nmero que va de 0 a 1.
La probabilidad de algn evento A, se representa por P(A), es un nmero que va del 0 al 1,
y que indica cuan probable es la ocurrencia del evento A. Cuanto mas cerca se encuentre el
nmero de uno (1), tanto mayor es la probabilidad de que dicho evento A ocurra; cuanto
mas cercano sea el numero a cero (0) menor es la probabilidad de que el evento A ocurra. A
un evento imposible se le asigna una probabilidad 0, mientras que a un evento del cual se
tiene la certeza que ocurrir se le asigna una probabilidad de 1.

Espacio Muestral y Eventos


Uno de los conceptos matemticos fundamentales, utilizados en el estudio de la
probabilidad es el conjunto. Este es un grupo de objetos o elementos que tienen ciertas
caractersticas comunes. Por ejemplo, los habitantes de Barinas, los ros del Municipio
Pedraza, los estudiantes de la UBV-Barinas, entre otros.
Espacio Muestral, es el conjunto de todos los resultados posibles de un experimento o
muestra. Vamos a denotar al Espacio Muestral con la letra S. Tambin el espacio
muestral se denota con la letra griega Omega().
Evento, son los posibles resultados de un Experimento Aleatorio.

Experimento Aleatorio, es todo aquel experimento que satisface los siguientes


requerimientos:
a. Puede repetirse un nmero ilimitado de veces bajo las mismas condiciones.
b. Es posible conocer por adelantado todos los posibles resultados a que pueda dar
origen.
c. No puede predecirse con exactitud el resultado en una realizacin particular de ese
experimento.
Ejemplos:

Si lanzamos una moneda al aire, el resultado puede ser cara o sello, pero no

sabemos de antemano cual de ello va a salir. El proceso de lanzamiento de la


moneda es un experimento aleatorio.
Su espacio muestral es S = { cara, sello}

Lanzamiento de un dado y registrar el numero de puntos que aparecen en el

lado de arriba. El espacio muestral es: S = { 1,2,3,4,5,6}. El experimento es:


lanzamiento del dado.
Si el dado es un cubo simtrico y balanceado, entonces todos sus lados tienen la misma
posibilidad de ocurrencia, es decir, sus probabilidades son: P(1) = P(2) = P(3) = P(4) P(5) =
P(6) = 1/6. Sea cualquier evento A de ese experimento, por ejemplo, A: nmero par,
entonces A = { 2,4,6}, obsrvese que A tiene tres puntos muestrales, en consecuencia su
probabilidad de A viene dada por: numero de elementos de A dividido por nmero de
elementos del espacio muestral S, es decir: P(A) = 3/6 = = 0.5
Por su dimensin un espacio muestral puede ser: finito, infinito numerable, infinito no numerable.

La estadstica tiene dos objetivos inmediatos, describir e inferir, cuya finalidad es satisfacer
un objetivo mucho mas exigente: predecir.

La prediccin est relacionada de una manera indisoluble con las probabilidades, y aquel
que no estudia los postulados de probabilidades para comprender profundamente su
significado, no podr interpretar cabalmente los resultados de la estadstica.
Es por esta razn que categricamente afirmamos que con la estadstica no se puede mentir.
Vincular a la estadstica, en tanto que disciplina matemtica, con la capacidad de
manipulacin para engaar, es tan osado como acusar al espaol, como lenguaje verbal, de
herramienta susceptible de ser usada para decir mentiras. Es slo la falta de informacin de
un individuo lo que faculta a otro para engaarlo, con o sin intencin, tanto con letras como
con nmeros.
Operaciones con eventos:
Tratndose los eventos de subconjuntos del espacio muestral, es natural que satisfagan todas las
caractersticas de los conjuntos. Sean A y B dos eventos pertenecientes a un espacio muestral S.

La interseccin, que se denota A B , es el evento que consta de todos los resultados en S que
pertenecen tanto a A como a B. Por tanto, la interseccin A B ocurre si y slo si tanto A
como B ocurren.
De manera ms general, dados k eventos A1, A2, ..., Ak, su interseccin A1 A2 Ak es el
conjunto de todos los resultados bsicos que pertenecen a todo Ai (i = 1, 2, ..., k)

La unin, que se denota A B , es el evento que consta de todos los resultados en S que
pertenecen al menos a uno de estos eventos. Por lo tanto, la unin A B ocurre si y slo si A
y/o B ocurren.
De manera ms general, dados k eventos A1, A2, ..., Ak, su unin A1 A2 Ak es el
conjunto de todos los resultados que pertenecen al menos a uno de estos k eventos.

El complemento de A (con respecto al espacio muestral S ), que se representa por Ac


(dependiendo de la literatura tambin se usa A A ), es el evento que consta de todos los
resultados pertenecientes a S pero no a A.

Definiciones complementarias:

Si A y B no tienen puntos muestrales en comn se denominan excluyentes y su interseccin A


B es el conjunto vaco , lo que significa que A B no puede ocurrir.
De manera ms general, dados k eventos A1, A2, ..., Ak, se dicen mutuamente excluyentes si cada
par de estos eventos es excluyente, es decir Ai A j = para todo i j.

Dados k eventos E1, E2, ..., Ek en el espacio muestral S , si su unin E 1 E2 ... Ek = S se


dice que estos k eventos son colectivamente exhaustivos.

Ejercicios

1. Los artculos provenientes de una lnea de produccin se clasifican como defectuosos o no


defectuosos. Se observan los artculos y se anota su condicin. Este proceso se contina hasta
que se produzcan dos artculos defectuosos consecutivos o se verifiquen cuatro artculos, lo que
ocurra primero. Describir el espacio muestral para este experimento aleatorio.
2. Considrense cuatro objetos, a, b, c y d. Supngase que el orden en el cual se anotan esos
objetos representa el resultado de un experimento. Sean los eventos A = {a est en el primer
lugar} y B = {b est en el segundo lugar}.
a. Describir el espacio muestral.

b. Describir todos los elementos de los eventos A B y A B .


3. Considerando el espacio muestral S = {a, b, c}, construya todos los eventos posibles.
4. Sean A, B y C tres eventos asociados con un experimento. Expresar las siguientes
proposiciones verbales en notacin de conjuntos. Puede ayudarse con diagramas de Venn.
a. Al menos uno de los eventos ocurre.
b. Exactamente uno de los eventos ocurre.
c. Exactamente dos de los eventos ocurren.

Desarrollo Axiomtico de las Probabilidades


El desarrollo terico anterior se ha efectuado con la finalidad de plantear formalmente el
siguiente problema: si A es un evento asociado con el experimento aleatorio E y el espacio
muestral S , no podemos indicar con certeza, en principio, si A ocurrir o no.

Surge entonces la siguiente pregunta: cmo podemos asociar un nmero con el evento A
que mida de alguna manera la posibilidad de que A ocurra?
Para ello vamos a estudiar a fondo un modelo de pensamiento que utilizamos
constantemente sin importar nuestra cultura probabilstica.
Suponga que se repite n veces el experimento aleatorio E. Sean A y B dos eventos
relacionados con E. Sean nA y nB el nmero de veces que A y B ocurren respectivamente en
las n repeticiones.
Frecuencia Relativa: para el evento A se define como f A =

nA
.
n

Propiedades de la frecuencia relativa:


1. 0 f A 1
2.

f A =1 si y slo si A ocurre en cada una de las n repeticiones de E.

3.

f A = 0 si y slo si A no ocurre nunca en las n repeticiones de E.

4. Si A y B son eventos mutuamente excluyentes entonces f AB = f A + f B


5. Regularidad estadstica: la frecuencia relativa f A tiende a estabilizarse en cierto
valor (que luego bautizaremos como P(A)) a medida que el nmero de repeticiones
de un experimento aumenta.
Ejemplo: Lanzamiento de una moneda.
Sea E = lanzamiento de una moneda. El espacio muestral es S = {C,S} y consideremos el
evento A = {C}.
Observemos esta realizacin particular del experimento, repetido varias veces:
n
nA
fA

1
0
0

2
0
0

3
1
0.3

4
1
0.2

5
2
0.2

6
3
0.5

7
4
0.5

8
5
0.6

9
6
0.6

Esta frecuencia relativa aparece graficada a continuacin:

10
6
0.6

11
6
0.5
5

12
6
0.5

13
7
0.5
4

Frecuencia relativa

F
re
c
u
e
n
c
iare
la
tiv
ae
ne
lla
n
z
a
m
ie
n
tod
eu
n
am
o
n
e
d
a
1
0
,9
0
,8
0
,7
0
,6
0
,5
0
,4
0
,3
0
,2
0
,1
0
1

1
0

1
1

1
2

1
3

L
a
n
z
a
m
ie
n
to

Vamos a usar las propiedades de la frecuencia relativa como esquema para las condiciones
que le exigiremos que cumpla a una medida de la posibilidad de que un evento ocurra.

Probabilidad
Consideraremos la probabilidad como el lmite de la frecuencia relativa, de forma tal que se
convierte en una funcin que va del espacio de todos los eventos posibles al conjunto de los
nmeros reales en el intervalo entre 0 y 1 inclusive:
P ( A) = lim f A
n

Sea E un experimento aleatorio y

S un espacio muestral asociado a ste. Considerado

como el lmite anterior, la probabilidad es una funcin que asigna a cada evento A de S un
nmero real denotado por P(A) y llamado probabilidad de A, que satisface las siguientes
propiedades:
1. 0 P ( A) 1
2. P(S ) = 1
3. Si A y B son mutuamente excluyentes entonces P(A B) = P(A) + P(B)
4. (terico) Si cada par de eventos de la secuencia infinita E1,E2,..., Ek,..., es

mutuamente excluyente, entonces


P Ai = P( Ai )
i =1 i =1

Los anteriores se conocen como Postulados de Probabilidades, si bien, debido a que en la


prctica slo aparecen los tres primeros, esos son los mas conocidos en la literatura bsica.
Hasta ahora hemos postulado la existencia de P(A) y las propiedades que debe cumplir,
pero no hemos indicado una forma de obtener en la prctica una funcin P que satisfaga las
propiedades. A partir de este momento vamos a establecer suposiciones que conduzcan a un
mtodo vlido para evaluar probabilidades.
Vamos a iniciar el trabajo suponiendo que el experimento E tiene slo un nmero finito de
elementos, y bajo supuestos adicionales muy simples (y verificables) vamos a construir una
P(A) vlida.

Caracterizacin de P(A) bajo un Espacio Muestral Finito


Suposicin: espacio muestral finito, es decir S = {a1,a2,..., ak}
Definiremos como evento elemental ( simple, resultado elemental) al evento constituido
por un slo resultado, es decir Ai = {ai} para i = 1,,k.
Asignamos un nmero pi a cada Ai mediante P(Ai) = pi tal que:
1.

pi 0

2.

p1 + + pk =1

Estos nmeros son consistentes, por definicin, con los postulados de probabilidades, lo
cual se puede verificar fcilmente.

As,

A = {a j1 ,, a jr }

para 1 r k entonces

P ( A) = P ( Aj1 A j2 A jr ) = P ( A j1 ) + P ( Aj 2 ) + + P ( A jr ) = p j1 + p j2 + + p jr

Ahora vamos a darle valores a los pi


Suposicin: resultados equiprobables o igualmente probables.
Si los k resultados son equiprobables entonces
1 = p1 + p2 + + pk = pi + pi + + pi = kpi

Lo cual implica que pi =

1
para i = 1,,k.
k

As, si consideramos el evento A definido anteriormente, P ( A) =

r
k

Esta forma de pensar nos lleva a la conocida frmula de casos favorables entre casos
totales para calcular probabilidades. Formalmente se escribe:
P ( A) =

nmero de puntos de S en A
nmero de puntos de S

Tcnicas de Conteo
Definiciones previas:
El nmero de posibles ordenaciones de x objetos es x! = x(x-1)(x-2)...(2)(1), es decir el
producto de todos los nmeros inferiores a x. Este nmero se lee x factorial.
Regla m x n:
La regla del producto se aplica a situaciones en las que se busca un nmero de maneras
distintas que las que se pueden formar pares de objetos, en donde los objetos se seleccionan
de dos grupos distintos.
Este principio se conoce tambin como regla de multiplicacin regla m por n.
Permutaciones:
El nmero de permutaciones de n objetos tomados de k en k es el nmero de posibles
ordenaciones cuando k objetos han de ser seleccionados de un total de n y dispuestos en

n!

n
orden. Este nmero se calcula por la frmula Pk =n Pk = ( n k )! y se lee permutaciones

de n en k. En realidad se trata de una extensin de la regla m x n.

Combinaciones:
El nmero de combinaciones de n objetos tomados de k en k es el nmero de subconjuntos
de tamao k que se pueden formar de un conjunto de n elementos. Este nmero se calcula
por la frmula n Ck =

Pk
n!
=
y se lee combinaciones de n en k. Generalmente se
k!
k!(n k )!

aplica en situaciones en las que el orden no es importante.

Muestreo
Muestra al azar:
Supongamos que tenemos n objetos. Escoger al azar k objetos entre los n objetos originales
( 0 k n ) significa que cada subconjunto de tamao k tiene la misma probabilidad de ser
elegida que cualquier otro subconjunto.
Muestreo con reemplazo ( o con reposicin):
Consiste en seleccionar un objeto de una coleccin y devolverlo a la misma despus de
anotar su caracterstica de inters.
Muestreo sin reemplazo (o sin reposicin):
Consiste en seleccionar un objeto de una coleccin sin devolverlo a la misma despus de
anotar su caracterstica de inters.
En principio, al efectuar un muestreo con reemplazo el espacio muestral no cambia, de
forma que en caso de seleccionar otra muestra posteriormente, las probabilidades originales

no cambian. En cambio en el muestreo sin reemplazo el espacio muestral se modifica, y


con el se modifica tambin la probabilidad.

Ejercicios
1. Un candado de combinacin abre slo cuando la combinacin correcta de los tres
dgitos es seleccionada. Cada dgito puede ser cualquier nmero entre 0 y 9. Si una
combinacin particular de dgitos representa a un punto muestral, cuntas puntos se
estn utilizando para definirlo?
2. El presidente, vicepresidente, secretario y tesorero de una determinada asociacin, se
elegirn de entre 10 candidatos. Encuentre el nmero de maneras distintas en que estos
puestos pueden ocuparse.
3. Un experimento consiste en asignar 10 trabajadores para 10 tareas distintas (un
trabajador por tarea y viceversa). De cuantas maneras se pueden asignar las 10 tareas a
los 10 trabajadores?
4. Si se seleccion una muestra de 10 enfermeras de un total de 90 de un hospital,
cuntas posibles muestras haba?
5. Si se seleccionan cinco cartas con reposicin (esto es, se selecciona al azar la primera y
se regresa al conjunto de cartas, etc.) de un mazo de 52 cartas, cuntas selecciones
posibles hay?
6. Para el ejercicio anterior suponga que no hay reposicin. Cuntas selecciones posibles
hay?
7. En un departamento con 18 empleados, se debe efectuar una reduccin de un tercio del
personal. Si todos los empleados tienen igual desempeo, de cuntas formas se pueden
elegir los grupos de despidos?
8. En una habitacin 25 personas tienen insignias numeradas del 1 al 25. Se eligen 5
personas al azar y se les pide que dejen la habitacin inmediatamente y se anotan los
nmeros de sus insignias.
a. Cul es la probabilidad de que el nmero menor de las insignias sea 7?
b. Cul es la probabilidad de que el nmero mayor de las insignias sea 7?

c. Cul es la probabilidad de que los nmeros de las cinco insignias estn


comprendidas entre 9 y 21?

Teorema de Probabilidad
Sean A y B dos eventos, y Ac el complementario. Siempre se satisfacen las frmulas
siguientes:

P(Ac) = 1 P(A)

P(B) = P(A B) + P(Ac B)

P(A B) = P(A) + P(Ac B)

Teorema de la suma de probabilidades


La probabilidad de la unin de dos eventos cualesquiera A y B es
P(A B) = P(A) + P(B) - P(A B)

Probabilidad Condicional
Dados dos eventos A y B, se define la probabilidad condicional de A dado B como
P( A | B) =

P( A B)
, siempre que P(B) > 0
P( B)

Similarmente se define
P ( B | A) =

P( A B )
, siempre que P(A) > 0
P ( A)

Propiedades de la probabilidad condicional


1. 0 P( A | B) 1
2. P ( S | A) =1
3. P( A | S ) = A

i =1

i =1

4. P ( Ai | B ) = P ( Ai | B )

si Ai A j = 0 para i j

En general tenemos dos formas de calcular P ( A | B ) :


a. Directamente, considerando la probabilidad de A respecto al espacio muestral S.
b. Usando la definicin, donde P ( A B ) y P(B) se calculan respecto al espacio
muestral original S.

Regla del producto de probabilidadeds


Tambin conocido como Teorema de Multiplicacin, se puede ver como una consecuencia
de la definicin de probabilidad condicional, indica que la probabilidad de la interseccin
de dos eventos cualesquiera A y B es:
P(A B) = P(A|B)P(B) = P(B|A)P(A)
La generalizacin de esta regla para n eventos nos lleva a:
P ( A1 An ) = P ( An | A1 An1 ) P ( An1 | A1 An2 ) P ( A3 | A1 A2 ) P ( A2 | A1 ) P ( A1 )

Independencia de Eventos
Dados dos eventos A y B se dice que son independientes estadsticamente, o simplemente
independientes, si y slo si
P(A B) = P(A)P(B)
En otras palabras, A y B son independientes si y solo si P(A|B) = P(A) siempre que P(A)
sea diferente de 0 y tambin si P(B|A) = P(B) siempre que P(B) sea diferente de 0.
En general n eventos A1 , , An , se dicen independientes si y slo si
P( A1 An ) = P( A1 ) P( A2 ) ... P( An )
En general n eventos A1 , , An , se dicen mutuamente independientes si y slo si para
cualquier valor k = 2, 3, 4, , n se tiene:
P( Ai1 Ai k ) = P( Ai1 ) P( Ai 2 ) ... P( Ai k )

Particin
Los eventos A1 , , An conforman una particin del espacio muestral S si
1. Ai A j = para i j
n

2. Ai = S
i =1

3. P ( Ai ) > 0 para todo i

Teorema de Bayes
Teorema de Bayes para dos eventos:
Dados los eventos A y B, entonces se cumple que
P ( B | A) =

P( A | B) P( B)
P ( A)

Teorema de Bayes para k eventos:


Dados k eventos E1, E2, ..., Ek, mutuamente excluyentes y colectivamente exhaustivos, y otro
evento A, entonces se cumple que
P ( Ei | A) =

P( A | Ei ) P ( Ei )
P ( A | Ei ) P( Ei )
=
P( A)
P ( A | E1 ) P ( E1 ) + + P ( A | Ek ) P ( Ek )

Probabilidades Bivariadas
Supngase que al realizar un experimento los resultados puedan ser clasificados segn dos
reglas de clasificacin diferentes. Por ejemplo, un grupo de personas puede ser clasificado
por su edad y por su sexo.

Sea un experimento aleatorio y A1, A2, ..., Ah y B1, B2, ..., Bk dos grupos de eventos donde los
Ai son mutuamente excluyentes y colectivamente exhaustivos, as como los B j. Estos
grupos de eventos se denominan eventos bivariantes.
Las probabilidades conjuntas son las que se obtienen mediante P(Ai Bj)
Las probabilidades marginales son la que se obtienen mediante P(Ai) P(Bj)
Los aspectos importantes de esta forma de clasificar los datos est en que facilita el
planteamiento de los problemas donde hay dos formas de clasificar los resultados.
Las tablas de frecuencia que se arman previo al clculo de probabilidades se conocen como
tablas de contingencia. Cuando las frecuencias son sustituidas por probabilidades se habla
de las probabilidades bivariadas o bivariantes.
Si a las reglas de clasificacin las llamamos atributos A y B respectivamente como
representantes de cada uno de sus grupos de eventos mutuamente excluyentes y
colectivamente exhaustivos, decimos que dichos atributos son independientes si todo
evento Ai es independiente de todo evento Bj.
Ejercicios:
1. Un estudio sobre los estudiantes de la Universidad X revel que el 20% fuma. La
probabilidad de enfermedad pulmonar, si una persona fuma es diez veces mayor que la
probabilidad de que se enferme del pulmn si no lo hace. Si la probabilidad de
enfermedad pulmonar es de 0.014 en nuestro pas, cul es la probabilidad de que un
estudiante de la Universidad X sufra enfermedades pulmonares si fuma?
2. Supongamos que lanzamos dos dados. Se definen los eventos de la manera siguiente:
A = {el primer dado muestra un nmero par}
B = {el segundo dado muestra un nmero impar}
C = {ambos dados muestran nmeros pares nmeros impares}
Halle la probabilidad de cada evento, de cada par de eventos y de la interseccin de
todos los eventos. Los eventos son mutuamente independientes?

3. Cada vez que se realiza un experimento, la ocurrencia de un evento particular A es igual


a 0.2. El experimento se repite, independientemente, hasta que A ocurre. Calcular la
probabilidad de que sea necesario ejecutar un cuarto experimento.
4. Un conjunto electrnico consta de dos subsistemas, digamos A y B. A partir de una
serie de pruebas previas, se presuponen las siguientes probabilidades:
P(A falle) = 0.20
P(slo B falle) = 0.15
P(A y B fallen) = 0.15
Calcular las probabilidades siguientes:
a. P(A falle | B haya fallado)
b. P(A falle solamente)
5. En la fabricacin de cierto artculo se presenta un tipo de defectos con una probabilidad
de 0.1 y defectos de un segundo tipo con probabilidad de 0.05. Suponiendo
independencia entre los tipos de defectos, calcule la probabilidad de:
a. Un artculo no tenga ambas clases de defectos.
b. Un artculo sea defectuosos.
c. Suponiendo que un artculo sea defectuoso, tenga slo un tipo de defecto
6. Tres componentes de un mecanismo, digamos C1, C2 y C3 estn colocados en serie (en
una lnea recta). Supngase que estos mecanismos estn agrupados en orden aleatorio.
Sea R el evento {C2 est a la derecha de C1}, y S el evento {C3 est a la derecha de
C1}. Los eventos R y S son independientes?

Ejercicios
1. Suponga que se tira un dado no cargado una sola vez. A) Cul es la probabilidad
de obtener un par?. B) Cul es la probabilidad de obtener un nmero mayor que 4?.
Sol: (a) 3/6, (b) 2/6.
2. Se lanza una vez un par de dados no cargados, a) cul es la probabilidad de que la
suma de los dos nmeros sea 2 (b) sea 7?,(C) sea 11?.
Sol: (a) 1/36, (b) 6/36, (c) 2/36.

En determinado grupo hay 20 estudiantes, 7 son chicas rubias de ojos azules, 4 tienen
cabello castao y ojos azules, 5 son muchachos rubios de ojos azules y los 4 restantes son
muchachos de cabello castao y ojos cafs. Si se selecciona un estudiante al azar: a) cul
es la probabilidad de que el estudiante elegido sea una chica (b) que tenga ojos azules?, (c)
que tenga cabello castao?, (d) que sea rubia y

tenga ojos cafs?. Se supone que los 20

estudiantes estn numerados en algn orden especfico.


Sol: (a) 11/20, (b) 16/20, (c) 8/20, (d) 0.
3. Una caja contiene 7 fichas rojas y 3 blancas; si se sacan tres fichas de la caja una
despus de la otra sin reemplazo, encontrar la probabilidad de que la dos primeras sean
rojas y la otra blanca.
Sol: 7/40.
4. Tres cartas son sacadas en forma aleatoria sin reemplazo de un juego de cartas
ordinarias. Cul es la probabilidad de que todas las cartas sean reyes?.
Sol: 4/22.100.
5. Cuntas manos diferentes de 5 naipes pueden darse con un juego de barajas
ordinarias?.
Sol: 2.598.960.
6. Si de una caja se sacan al azar 4 bolas rojas y 2 blancas y se colocan en una hilera;
(a) cul es la probabilidad de que la de los extremos sean blancas?. (B) de qu no
sean blancas?. (C) de qu las dos blancas estn juntas?.
Sol: (a) 1/15, (b) 14/15, (c) 240/720.
7. Una ensambladora de partes elctricas usa motores de dos orgenes; de una
compaa A, que le suministra el 90% de los motores y de una compaa B, que le
suministra el otro 10% de los motores. Supngase que es conocido que, el 5% de los
motores suministrados por la compaa A son detectados como defectuosos y 7% de
los suministrados por la compaa B son defectuosos. La ensambladora de partes
elctricas encontr un motor defectuoso. Cul es la probabilidad de que este motor sea
suministrado por la compaa B?.
Sol: 0,134653.
8. Nos entregan tres cajas que contienen lo siguiente:
Caja A contiene 3 bolas rojas y 5 blancas

Caja B

2 bolas rojas y 1 blanca

Caja C

2 bolas rojas y 3 blancas.

Una caja es seleccionada aleatoriamente y se extrae una bola que resulta ser roja. Cul
es la probabilidad de que provenga de la caja A?.
Sol: 45/173.
9. De cuntas maneras pueden ser colocados 10 automviles en u stock, si 3 de ellos
son Fiat, 4 son Ford, 2 Toyota y 1 BMW?.
Sol: 12.600
10. De cuntas maneras pueden ser seleccionadas 4 personas provenientes de 5 parejas
de casados, si la seleccin consiste de 2 damas y 2 caballeros?.
Sol: 100.
11. Se lanza un par de dados no cargados una vez, y se establece que los dos nmeros
que aparecen no son los mismos. (A) Calcular la probabilidad de que la suma sea 7. (B)
Calcular la probabilidad de que la suma sea 4. (C) Que la suma sea 12.
Sol: (a) 1/5 (b) 1/15 (c) 0.
12. Con base a su experiencia un mdico ha recabado la siguiente informacin relativa a
las enfermedades de sus pacientes: 5% creen tener un virus infeccioso y lo tienen, 45%
creen tener el virus y no lo tienen, 10% creen no tener el virus pero s lo tienen y
finalmente 40% creen no tenerlo, lo cual es cierto. Hallar: (a) la probabilidad de que un
paciente si cree tenerlo, (b) la probabilidad de que tenga virus si no cree tenerlo, (c) la
probabilidad de que crea tener virus y no lo tenga y (d) la probabilidad de que crea tener
el virus y s lo tiene.
Sol: (a) 0,10 (b) 0,20 (c) 0,53 (d) 0,33
13. Cul es la probabilidad de encontrar solamente un 6 en el lanzamiento de un dado
tres veces?.
Sol: 75/216.

Variables Aleatorias Discretas y Continuas


Muchas veces se desea resumir con un nmero el resultado de un experimento aleatorio.
En muchos de los ejemplos relativos a experimentos aleatorios que han sido considerados
hasta ahora, el espacio muestral es slo una descripcin de los posibles resultados. En
algunos casos tales descripciones son suficientes, pero en otros se hace til asociar un
nmero con cada resultado del espacio muestral. Es as como se llega a la definicin de
variable aleatoria.
Una variable aleatoria X es una funcin que asigna un nmero real a cada resultado en el
espacio muestral S de un experimento aleatorio. El conjunto de los posibles valores de la
variable aleatoria X se denomina rango. Diremos que la variable aleatoria es discreta si su
rango es finito (o infinito contable).
Variable aleatoria discreta
Una variable aleatoria es discreta cuando puede tomar un nmero finito o infinito contable
de valores, es decir que pueden ordenarse en secuencia.
Ejemplos de variables aleatorias discretas:

Nmero de hermanos de una persona seleccionada al azar

Nmero de accidentes que ocurren en una autopista en un tiempo determinado

Nmero de veces que se lanza una moneda hasta que aparezca la primera cara, etc.

Variable aleatoria continua

Una variable aleatoria es continua cuando toma cualquier valor dentro de un intervalo de
nmero reales.
Ejemplos de variables aleatorias continuas: edad, estatura, peso, temperatura, ingreso, etc.

Distribucin de probabilidad de una variable aleatoria discreta


Diremos que la funcin p(x)=P(X=x) que va del conjunto de valores posibles de la variable
aleatoria X al intervalo [0, 1] es la funcin distribucin de probabilidad para X si y slo
si se satisfacen las siguientes propiedades:
0 p(x) 1 , para todo x

p( x) =1
x

Se define la distribucin acumulada F(x) para la variable aleatoria X como


p( t)
F(x) = P(X x) = t
x

Ejemplo 1
Experimento aleatorio: se lanza una moneda 3 veces
S = { ccc, ccs, csc, css, scc, scs, ssc, sss }
Sea X : Nmero de caras observadas
x
p(x)

1
8

1
8

La distribucin anterior es una distribucin de probabilidades para la variable aleatoria X,


en efecto 0 p(x) 1 para todo x (x = 0, 1, 2 y 3) y adems

p( x) =1. Para
x

determinar la distribucin acumulada de probabilidad observe que

P(X 0) = P(X = 0) =

1
8

P(X 1) = P(X = 0) + P(X = 1) =

1 +3 = 1
8
8
2

P(X 2) = P(X = 0) + P(X = 1) + P(X = 2) =

1 +3 +3 =7
8
8
8
8

P(X 3) = P(X= 0) + P(X= 1) + P(X= 2) + P(X= 3) =


Se tiene entonces,
x
F(x)

1
8

1 + 3 + 3 + 1 =1
8
8
8
8

1
2

7
8

3
1

Si X es una variable aleatoria, y el experimento aleatorio que determina el valor de X se


repite muchas veces, entonces se obtiene una secuencia de valores para X. A partir de esta
secuencia de valores se puede identificar el valor promedio o valor esperado de la variable
aleatoria X, que denotamos E(X) , y se define en la forma siguiente:
E(X)

xp( x)
x

Propiedades:
a) E(k)=k
b) E(kX)=kE(X)
c) E(X Y)=E(X) E(Y)
d) E(g(X))=g(x)p(x)
Para el ejemplo dado, E(X) = xp( x) = 0 p( 0 ) +1p( 1) +2p( 2) + 3p( 3)
x

1
3
3
1 12 3
= 0 . + 1. + 2. + 3. = =
8
8
8
8 8 2

A veces, el inters es determinar la variabilidad de la variable aleatoria. Definimos entonces


la varianza de la variable aleatoria X, denotada V(X) , 2 mediante la siguiente ecuacin:
V(X)=E[(X-E(X))2] y su forma reducida es:
V(X)

( )

= E X2 [ E( X)]2

donde,

E X2

x2 p( x)
)=
x

Para el ejemplo dado,

E X2

) = 0 2 p( 0) +12 p(1) +22 p(2) +32 p( 3)

1
8

3
8

3
8

1 24
=3
8 8

= 0 . + 1. + 4. + 9. =

2
12 9 3
3
Entonces, V(X) = 3 =
=

Propiedades de la Varianza:
a) V(k)=0
b) V(kX)=k2V(X)
c) V(X Y)=V(X)+V(Y) si X y Y son independientes
d)
La desviacin estndar de la variable aleatoria X es la raz cuadrada positiva de la varianza,
es decir, = V(X) .

Modelos discretos de probabilidad:


Distribucin Binomial
Un ensayo Bernoulli, es un experimento aleatorio que slo admite dos posibles resultados,
denotados xito y fracaso. La probabilidad de xito se denota p y la probabilidad de
fracaso por q.
Por lo tanto si denotamos el xito por 1 y el fracaso por 0 se tiene:
P (1) = p

P (0) = 1-p = q

Adems se cumple: E (X) = p V(X) = pq


Un proceso Bernoulli es un proceso en el cual se verifican las siguientes condiciones:
El experimento aleatorio se repite n veces en idnticas condiciones
Hay slo dos posibles resultados en cada repeticin del experimento, llamados
arbitrariamente xito y fracaso
La probabilidad de xito, denotada p, es la misma para cada repeticin (permanece
constante entre repeticiones)

las n repeticiones del experimento aleatorio son independientes entre s.


Consideremos ahora la variable aleatoria X: Nmero de xitos observados en n
repeticiones. Suponga que se quiere determinar la probabilidad de observar x xitos en n
repeticiones; esto es, se desea determinar P(X = x). Como lo importante es observar x
xitos en n repeticiones, el orden de ocurrencia de los mismos es irrelevante; as, para
contar de cuntas formas pueden observarse x xitos en n repeticiones empleamos las
n

combinaciones
x
. Por otro lado, como las n repeticiones del experimento son

independientes entre s y calcular P(X = x) equivale a calcular la probabilidad de una
interseccin de eventos (en las que cada evento corresponde a un xito o a un fracaso),
tenemos que la probabilidad de un punto muestral cualquiera asociado al experimento es
px qnx;

en definitiva:
n

x n x
parax = 0 , 1, 2,...,n
P(X = x) = x p q

x n x
Dado que 0 x p q 1 y

x px qn x =1, resulta que


x=0

una variable aleatoria X se distribuye Binomial con parmetros n y p si su funcion de


probabilidad es:
n

x n x
parax = 0 , 1, 2,...,n
P(X = x) = x p q

En resumen X B ( n , p ) se lee la variable aleatoria X se distribuye Binomial

con parmetro n y p.
O, la variable aleatoria X tiene distribucin binomial si su funcin distribucin de
probabilidad est dada por

n x n x
p q
p( x) = x

si x = 0 , 1 , ... , n
otros valores

Se puede demostrar que para una variable aleatoria con distribucin binomial
E(X)

= = n.p ( Valor esperado de X o esperanza matemtica de X )

V(X)

= n.p.q ( Varianza de X )

Ejemplo 1
Una mquina fabrica una determinada pieza y se sabe que produce un 7 por 1000 de piezas
defectuosas. Hallar la probabilidad de que al examinar 50 piezas slo haya una defectuosa.
Solucin :
Se trata de una distribucin binomial de parmetros B (50, 0'007) y debemos calcular la
probabilidad p(X=1).

Ejemplo 2
La probabilidad de xito de una determinada vacuna es 0,72. Calcular la probabilidad de
que una vez administrada a 15 pacientes:
a) Ninguno sufra la enfermedad
b) Todos sufran la enfermedad
c) Dos de ellos contraigan la enfermedad
Solucin :
Se trata de una distribucin binomial de parmetros B(15, 0'72)

Ejemplo 3
La probabilidad de que el carburador de un coche salga de fbrica defectuoso es del 4 por
100. Hallar :
a) El nmero de carburadores defectuosos esperados en un lote de 1000
b) La varianza y la desviacin tpica.
Solucin :

Distribucin Normal
Sea una variable aleatoria X que toma todos los valores reales, y que posee una esperanza o
media y una desviacin estndar . Esa variable tiene una Distribucin Normal o
Gaussiana si su funcin de densidad de probabilidad es de la forma:

f(x) =

1 ( x )2
1
exp
2
2
2

, < x <

Los parmetros y deben satisfacer las condiciones < < y > 0 . Puesto
que tendremos diversas ocasiones para referirnos a la distribucin anterior; utilizaremos la
siguiente notacin: X tiene la distribucin N ( , 2 ) s y slo si su funcin de densidad est
dada por la expresin anterior.
El grfico de f se denomina Curva Normal, la cual es simtrica respecto a un eje vertical
que pasa por el punto x = , donde f toma su valor mximo. La forma de la curva es
acampanada, positiva a lo largo del Eje X, creciente en ( , ) y decreciente en ( , ) .
La curva no corta al Eje X, sino que es asinttica en ambos extremos.
La posicin o localizacin de la curva vara con el valor de , y su forma cambia con el
valor de . Mientras ms pequea sea la desviacin estndar (o dispersin con respecto a

la media), ms alta y esbelta es la curva; mientras ms pequea sea la varianza ms


achatada ser la curva.
La denominacin que tiene esta distribucin viene del hecho de que al principio se
consideraba que todos los fenmenos en su estado normal deban seguirla. Actualmente,
esta se considera tan corriente como cualquier otro tipo de distribucin.
reas bajo la Curva Normal
La mayor parte del rea de la curva normal se concentra alrededor de . El grfico
siguiente muestra que hay aproximadamente 68,26% del rea dentro del intervalo

[ + , + ] , 95,45% del rea dentro del intervalo [ 2 + , 2 + ] , y 99,73% del


rea dentro del intervalo [ 3 + , 3 + ] . No se puede calcular ms all del ltimo
intervalo ya que casi el 100% de los datos o valores est contenido all. El rea total bajo la
curva normal y sobre el Eje X es la probabilidad total, la cual es igual a 1 o 100%. Estas
consideraciones numricas se conocen bajo el nombre de la Regla Emprica, la cual es
mucho ms precisa que la Regla de Tchebyshev .

Fig. 1
Entre la media y una desviacin estndar por encima de la media, se encuentra el 34,13%
de todos los casos. Anlogamente, el 34,13% de todos los casos se encuentran entre la
media y una desviacin estndar por debajo de la media. Dicho de otra manera, 34,13% del
rea bajo la curva se encuentra entre la media y una desviacin estndar por encima de la
media, y 34,13% del rea est comprendida entre la media y menos una desviacin
estndar.
Entre la media y dos desviaciones estndar por encima de la media, se encuentra el 47,72%
de los casos. Anlogamente, por debajo de la media y menos dos desviaciones estndar se
encuentran el 47,72% de los datos.
Finalmente, entre la media y tres desviaciones estndar por encima de la media se
encuentra el 49,87% de los casos. Anlogamente, el 49,87% de los casos se encuentra
entre la media y menos tres desviaciones estndar.

Distribucin Normal Estndar y Estandarizacin de una Normal no estndar


Para diferentes valores de y los respectivos grficos son todos similares entre s ms
all de sus particularidades propias. Las respectivas distribuciones normales se pueden
reducir todas a una especial denominada Distribucin Normal Estndar.
La funcin de densidad de esta distribucin asociada a cierta variable Z est dada por:

f (Z ) =

Z2
1
exp
2
2

, < Z <

Vemos que para esta distribucin la esperanza es = 0 y la varianza es = 1, por lo que


la variable Z tiene la distribucin N(0,1).
Una porcin de las probabilidades que representan reas de diferentes tamaos bajo la
curva normal estndar se presentan en la siguiente tabla, donde aparecen los valores de Z a
intervalos de 0,25 unidades de longitud, desde Z = 0 hasta z = 4.

Funcin de Distribucin
de una Curva Normal Estndar
Z
0,00
0,25
0,50
0.75
1,00
1,25
1,50
1,75

F(Z)
0,00000
0,09871
0,19146
0,27337
0,34134
0,39435
0,43319
0,45994

2,00
2,25
2,50
2,75
3,00
3,25
3,50
3,75
4,00

0,47725
0,48778
0,49379
0,49702
0,49865
0,49942
0,49977
0,49991
0,49997

Aqu F es la funcin de distribucin de f, y F(Z) es la probabilidad de que el resultado del


experimento aleatorio sea mayor que cero (en este caso es la media = 0) y menor que Z.
Para cualquier otra distribucin N ( , 2 ) de una variable X, con

0, 1 y funcin

de densidad f X , esta se puede estandarizar si aplicamos el cambio de variable Z =


X
, y por tanto:

fX ( X ) =

1 ( X ) 2
1
exp
2
2
2

1
Z2
1
=

exp
2
2

1
= f ( z )

Para cada valor x que asume X se calcula el respectivo valor Z que asume Z usando la
esperanza y la desviacin estndar de X, se revisa la tabla de la curva normal estndar, y as
se ubica el valor del rea del grfico de f X que sea anterior a x.
Ahora, al transformar los datos X de una variable normalmente distribuida en datos
estandarizados Z, en realidad expresamos estos datos en unidades de la curva normal
estndar. La importancia de esta transformacin radica en que podemos expresar cualquier
dato que provenga de una distribucin normal como un valor porcentual. Adems, puesto
que los datos estandarizados z representan nmeros abstractos (adimensionales) en
oposicin a las unidades concretas de los datos, podemos comparar la posicin de un dato
en una variable con su posicin en una segunda variable.

Puesto que cualquier forma de curva normal puede ser convertida en la forma de la curva
normal estndar, esta es la nica que se requiere para encontrar la probabilidad de una
cierta rea bajo la primera curva.

La Distribucin Normal como aproximacin de una distribucin discreta o continua


Generalmente, el grfico poligonal de una distribucin discreta de probabilidad tiende a ser
parecido al de una curva normal. A cada distribucin discreta de cualquier variable X con
parmetros conocidos y , se le puede asociar una distribucin normal N ( , 2 ) , y la
funcin de probabilidad f definida con dichos parmetros se asemeja bastante a la lnea
poligonal en cuestin.
Habindose mostrado la manera como toda distribucin normal se puede representar por
medio de la distribucin estndar N(0,1), se puede definir la forma como toda distribucin
discreta se asocia con aquella.
En ese sentido, cada valor Pj de la funcin de probabilidad P de la variable discreta X puede
ser relativamente aproximado en cada valor Xj mediante la siguiente frmula:

Yj =

n
f(Z j ), j = 1, , n

Al graficar la distribucin {(X1, Y1), (X2, Y2),, (Xn, Yn)} uniendo esos pares con trazos
curvos y no lineales, se obtiene un grfico muy cercano al de la funcin de probabilidad de
la distribucin N ( , 2 ) .
Con el fin de entender mejor la frmula y facilitar posteriores clculos, para cada j = 1,,
n tenemos que:

n
d j = X j
Yj

Zj = d j
f(zj)

Nmero de datos de la poblacin


Distancia entre el dato y la media
Altura del punto Xj en la curva normal
Normalizacin de la distancia dj
Funcin de probabilidad de Zj

Bsicamente, la curva normal se construye de acuerdo con las alturas Y. Para X = se


alcanza la altura mxima en esa curva ya construida, y la cual es Y0 =
n n
n
1
f
= f (0 ) =
. As como a ambos lados de z = 0 se ubica el 50% del

2

rea total de la curva f de la distribucin N(0,1), tambin a ambos lados de Y0 se ubica el


50% del rea total de la curva normal de la distribucin N ( , 2 ) .
Ejemplo 1:
Supongamos que X indica el monto de ingresos de 10.000 trabajadores de PDVSA, cuyo
promedio mensual de ingreso es $500 y la desviacin estndar es $100. Vamos a construir
una curva normal.
Aqu n = 10.000, = 500, = 100 y n = 10.000

100 = 100.

Consideremos el intervalo [ , 3 + ] = [500, 800], y nos moveremos en este con pasos de


tamao 50. As obtenemos un conjunto de puntos Xj, j = 1,, 7, el cual es {500, 550, 600,
650, 700, 750, 800} [500, 800]
Usando los valores de la funcin de distribucin de la curva normal, y aplicando la frmula
para hallar los valores de las ordenadas de la curva normal, obtenemos la siguiente tabla.

d=X

500
550
600
650
700
750
800

0
50
100
150
200
250
300

Z=

0.0
0.5
1.0
1.5
2.0
2.5
3.0

f(Z)
0,39894
0,35207
0,24197
0,12952
0,05399
0,01753
0,00443

Y =

n
f(Z)

39,894
35,207
24,197
12,952
5,399
1,753
0,443

Puesto que la curva normal es simtrica, la altura de la ordenada hacia el lado izquierdo de
la media debe ser la misma que la del lado derecho de ese valor. Definimos RXj como
aquel punto que est a la misma distancia de la media pero en direccin opuesta a Xj. Por
ejemplo, para X2 = 550 y RX2 = 450, tenemos d2 = RX2 = 450 500 = 50, Z2 =
50
= 0,5 y f(Z2) = f(0,5) = f(0,5) = 0,35207, por lo que RY2 = 32,207 = Y2. As, los
100

valores de las ordenadas para RX2 = 450 y X2 = 550, son los mismos puesto que ambos
datos se encuentran a la misma distancia de la media.
Ahora procedemos a dibujar la curva normal correspondiente.

Fig. 2
Como puede observarse, esta curva tiene forma acampanada adems de ser simtrica
respecto a la media , es decir, es como si el segmento punteado fuese un espejo.

Ejercicio: construyamos una curva normal igual que en el ejemplo anterior pero tomando
la media en $600.
Ejemplo 2:
Supongamos que el ingreso mensual promedio de 10.000 trabajadores de PDVSA es $500
y la desviacin estndar es $100. Si la distribucin es normal, encontraremos el nmero de
trabajadores que tiene un ingreso mensual
a) Inferior a $500.
b) Superior a $500 pero inferior a $600.
c) Superior a $600.
Antes de usar la tabla de reas de la curva normal, el valor de X debe ser transformado
en Z =

X
. En este ejemplo, = 500 y

= 100. Por otro lado, tengamos en cuenta

que el 100% del rea de la distribucin N(500, 100) est asociada al ingreso de 10.000
trabajadores, por lo que un rea menor representa menos trabajadores.
a)
z=

El rea requerida es la inferior a X = 500, la cual es equivalente al punto


500 500
= 0.
100

Debido a que la mxima ordenada Y0 est localizada en el punto X = donde Z = 0, la


regin ubicada a la izquierda de Y0 tiene un rea que representa el 0,5 o 50% del total del
rea de la distribucin. Por lo tanto, el nmero aproximado de trabajadores que tiene un
ingreso mensual inferior a $500 es 10.000 (0,5) = 5.000.
b)

Cuando X = 500 entonces Z = 0, y para X = 600 se tiene que Z = 1.

El rea o probabilidad entre Z = 0 y Z = 1 es F(1) = 0,34134 o 34,134%. Por lo tanto, el


nmero aproximado de trabajadores que tienen un ingreso mensual superior a $500 pero
inferior a $600 es n F(1) = 10.000 (0,34134) = 3.413,4 3.414. Grficamente, el rea
est representada por la regin sombreada.

Fig. 3
c)

Para X = 600 tenemos Z = 1. La zona de inters es un intervalo donde z > 1,

y esa rea est representada por la regin sombreada en el siguiente grfico.

Fig. 4
Para calcular esa rea procedemos de la siguiente manera: el rea por encima de Z = 0 es
0,5 o 50%, y el rea por debajo de Z = 1 es F(1) = 0,34134 o 34,134 %. Luego, el rea
sombreada se obtiene de la diferencia 0,5 0,34134 = 0,15866 o 15.866%. As, el nmero
aproximado de trabajadores que perciben un sueldo por encima de $600 es
10.000 (0,15866) =1.586,6 1.587.
Ejemplo 3:
Siguiendo con el ejemplo anterior, si = $400 y = $100, hallaremos la probabilidad
(rea) de que los 10.000 trabajadores ganen entre $250 y $500. Dicha probabilidad es la
suma del rea entre $250 y = $400 ms el rea entre = $400 y $500.
El rea entre 250 y 400 se calcula como sigue:
Cuando X = 250 entonces Z =

250 400
400 400
= 1,5, y para X = 400 queda Z =
=
100
100

0. Luego, el rea entre Z = 1,5 y z = 0 es la misma que el rea entre Z = 0 y Z = 1,5


debido a que la curva normal es perfectamente simtrica, y usando la tabla se tiene que
parte del rea buscada es A1 = F(1,5) = F(1,5) = 0,43319.
El rea entre 400 y 500 se calcula como sigue:

Cuando X = 400 entonces Z =

400 400
500 400
= 0, y para X = 500 queda z =
= 1,0.
100
100

Por la tabla, parte del rea buscada es A2 = F(1,0) = 0,34134.


En consecuencia, el rea total buscada entre 250 y 500 es A1 + A2 = 0,43319 + 0,34134 =
0,77453 o 77,453%. Esto quiere decir que hay un 77,453% de que los 10.000 trabajadores
de PDVSA ganen entre $250 y $500.

Fig. 5

Ejercicios :
1) Hallar el rea bajo la curva normal tipificada:
a) Entre Z = 0 y Z = 1,2 Sol: 0,3849
b) Entre Z = -0,68 y Z = 0 Sol: 0,2517
c) Entre Z = -0,46 y Z = 2,21 Sol: 0,6636
d) Entre Z = 0,81 y Z = 1,94 Sol: 0,1828
e) A la derecha de Z = -1,28 Sol: 0,8997
2) Si "rea" se refiere al rea bajo la curva normal tipificada, hallar el valor o los valores de
Z
tales que:
a) El rea entre 0 y Z sea 0,3770 Sol: Z = 1,16
b) El rea a la izquierda de Z sea 0,8621 Sol: Z = 1,09
c) El rea entre -1,5 y Z sea 0,0217 Sol: Z = -1,695 y Z = -1,35
3) El peso medio de 500 estudiantes varones de una universidad es de 68,5 Kg. y la
desviacin

tpica es de 10 Kg. Suponiendo que los pesos estn distribuidos normalmente, hallar el
nmero de estudiantes que pesan:
a) Entre 48 y 71 kg. Sol: entre 289 y 290 estudiantes.
b) Ms de 91 kg. Sol: entre 6 o 7 estudiantes.
4) La media del dimetro interior de una muestra de 200 lavadoras producidas por una
mquina es 1,275 cm. y la desviacin tpica de 0,0125 cm. El propsito para el cual se han
diseado las lavadoras permite una tolerancia mxima en el dimetro de 1,26cm. a 1,29
cm., de otra forma las lavadoras se consideran defectuosas. Determinar el porcentaje de
lavadoras defectuosas producidas por la mquina, suponiendo que los dimetros estn
distribuidos normalmente.
Sol: 23,02%
5) Si X est distribuida normalmente con media 5 y desviacin tpica 2, hallar P (X > 8).
Sol: 0,0668
6) Se tiene un programador de entrenamiento diseado para mejorar la calidad de las
habilidades de los supervisores de la lnea de produccin. Debido a que el programa es auto
administrativo, los supervisores requieren un nmero diferente de horas para terminarlo. Un
estudio de los participantes anteriores indica que el tiempo medio que se lleva completar el
programa es de 500 h. y que esta variable aleatoria normalmente distribuida tiene una
desviacin estndar de 100 h.
a) Cul es la probabilidad de que un participante elegido al azar requiera ms de 500 h.
para
completar el programa?. Sol: 0,5
b) Cul es la probabilidad de que un candidato elegido al azar se tome entre 500 h. y 650
h. para completar el programa de entrenamiento?. Sol: 0,4332
c) Cul es la probabilidad de que un candidato elegido al azar se tome ms de 700 h. en
completar el programa?. Sol: 0,0228

d) Suponga que el director del programa de entrenamiento desea saber la probabilidad de


que un participante escogido al azar requiera entre 550 y 650 h. para completar el trabajo
requerido en el programa. Cunto ha de ser ese valor? Sol: 0,2417
e) Cul es la probabilidad de que un candidato elegido al azar se tomar menos de 580 h.
para completar el programa? Sol; 0,7881

Teora de la Estimacin Estadstica


La inferencia estadstica es el proceso de usar resultados muestrales para obtener
conclusiones respecto a las caractersticas de una poblacin. En esta seccin estudiaremos
los procedimientos estadsticos que permitan estimar dos parmetros de una poblacin: la
media y la proporcin.
Razn para estimar
Los administradores utilizan las estimaciones porque se deben tomar decisiones racionales,
sin que tengan la informacin pertinente completa y con una gran incertidumbre acerca de
lo que pueda deparar el futuro, pero con la intencin de que las estimaciones constituyan
una buena aproximacin de los parmetros desconocidos de la poblacin.
Estimador
Es la regla o procedimiento, expresado en general por medio de una frmula, que se utiliza
para deducir la estimacin.
Estimacin
Es un valor especfico observado de un estimador, por lo que asigna uno o varios valores
numricos a un parmetro de una poblacin sobre la base de datos de muestra.
Tipos de estimacin
a) Estimacin puntual: consiste en un solo estadstico muestral que se usa para estimar el
valor verdadero de un parmetro de una poblacin que es desconocido.

Por ejemplo, la media muestral


la proporcin muestral

es una estimador puntual de la media poblacional y

es un estimador puntual de la verdadera proporcin poblacional p

.
Cuando usamos una estimacin puntual, sabemos que aunque usemos un mtodo bueno de
estimacin es prcticamente improbable que el valor de la estimacin coincida con el
verdadero valor del parmetro, as que sera conveniente acompaar nuestra estimacin con
alguna medida que nos permitiera expresar la cercana del estimador al parmetro. Una
solucin a ello no los brindan los estimadores por Intervalos de Confianza.
b) Estimacin por intervalo: es la estimacin de un parmetro de la poblacin dado por dos
nmeros que forman un intervalo que contiene al parmetro con una cierta probabilidad.

Conceptos bsicos.
Nivel de Confianza
Est asociado con la probabilidad de que el intervalo de confianza contenga al parmetro de
la poblacin y es expresado en porcentaje. Los niveles de confianza que ms se utilizan son
90%, 95% y 99%.

Interpretacin de los intervalos de confianza


Un intervalo de confianza se puede interpretar de dos maneras diferentes.
Ejemplo: una directora de tiendas cree que el gasto medio de sus clientes en el ltimo ao
se encuentra en el intervalo de 35 a 38 dlares y concede una confianza del 95% a ese
intervalo.

Intervalos de confianza para la media poblacional y la proporcin (muestras grandes)


Con el objeto de mostrar cmo se construyen los intervalos de confianza, realizaremos la
deduccin de uno de ellos. Para el resto de los intervalos el procedimiento es similar as que
se darn slo las expresiones para el clculo de los mismos.

Para la construccin de los Intervalos es necesario tener en cuenta la distribucin muestral


de los estimadores de inters, as que diferenciaremos los casos de manera anloga a como
lo hicimos para estudiar las distribuciones en el muestreo.

I ) Intervalos de Confianza para la Media de una poblacin con varianza conocida.

_ _________

___________

Ejemplo.1
Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de una
muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro.
Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de zinc
en el ro. Suponga que los datos siguen una distribucin normal con una desviacin
estndar de 0.3.

Como se puede observar en los resultados del ejercicio se tiene un error de estimacin
mayor cuando el nivel de confianza es del 99% y ms pequeo cuando se reduce a un nivel
de confianza del 95%
Ejemplo 2

Ejemplo 3
Una empresa elctrica fabrica 3000 focos con una duracin aproximadamente distribuida
de forma normal con una desviacin estndar de 40 horas. Si una muestra de 300 focos
tiene una duracin promedio de 780 horas, encuentre un intervalo de confianza de 96%
para la media de la poblacin de todos los focos que produce esta empresa.
Solucin:
En este caso la varianza de la poblacin es conocida, la poblacin es finita, as que:

Ejemplo 4
Un bilogo quiere estimar el peso promedio de los capibaras cazados en el estado Apure.
Un estudio anterior de diez capibaras cazados mostr que la desviacin estndar de sus
pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el bilogo tenga el
95% de confianza de que el error de estimacin es a lo ms de 4 libras?

En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza en


que m difiere en menos de 4 libras de

Ejemplo 5
Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal
con una desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se
desea tener 95% de confianza que la media real est dentro de 10 horas de la media real?

Ejemplo 3.6
1.Una legisladora estatal desea encuestar a los residentes de su municipio para conocer qu
proporcin del electorado conoce la opinin de ella, respecto al uso de fondos estatales para
pagar abortos, ella supone que el 50% del electorado conoce su opinin.Qu tamao de
muestra se necesita si se requiere una confianza del 95% y un error mximo de estimacin
de 0.10?
Solucin:
La proporcin de residentes que conoce la opinin de la legisladora es de 0.5, as
que:

Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la
estimacin tenga un error mximo de 0.10.
Control de la anchura del intervalo
Es evidente que si se estrecha el intervalo, se suministrar al investigador una estimacin
ms exacta del valor del parmetro. Hay dos mtodos corrientes para estrechar un intervalo,
pero para ambos se debe hacer un sacrificio adicional. Estos procedimientos
son:
a) Ajuste del nivel de confianza: por la propia naturaleza de los intervalos de confianza, si
se acepta un nivel de confianza ms bajo, se podra generar un intervalo ms preciso,
menos amplio, pero eso aumenta la probabilidad de error.
b) Ajuste del tamao de la muestra: el aumentar el tamao de la muestra disminuye el error
esperado y es ms probable que se d una estimacin ms ajustada del valor verdadero del
parmetro, con ello se puede conservar un nivel de confianza determinado y al mismo
tiempo disminuir la anchura del intervalo; pero el sacrificio es un aumento ya sea de
tiempo, del gasto, etc.; que se exige para recoger los datos para una muestra mayor.

Contraste de Hiptesis1
La prueba de hiptesis y la estimacin son dos de las ramas principales de la inferencia
estadstica2

El objetivo de la estimacin es obtener una aproximacin al valor de cierto parmetro de la


poblacin y la finalidad de la prueba de hiptesis es decidir si una afirmacin acerca de
una caracterstica de la poblacin es verdadera.

Otros nombres de contraste de hiptesis utilizados en la bibliografa estadstica son: Prueba de hiptesis,
docimasia de hiptesis, test de hiptesis, prueba de significacin.
2 Estos Apuntes estn basados principalmente en: Newbold, Paul. Estadstica para los Negocios y la
Economa. Y en Stevenson,. W. Estadstica para Administracin y Economa.

Ejemplo 1:
Es posible desear determinar si afirmaciones como las siguientes son ciertas: 3
1. Un fabricante que produce cereales de desayuno afirma que, en promedio, el contenido
de cada caja pesa al menos 200 gramos. Para verificar esta afirmacin, se pesa el contenido
de una muestra aleatoria y se infiere el resultado a partir de la informacin muestral.
2. Una compaa recibe un gran cargamento de piezas. Slo puede aceptar el envo si no
hay ms de un 5% de piezas defectuosas. La decisin de aceptar la remesa puede basarse en
el examen de una muestra aleatoria de piezas.
3. Un profesor est interesado en valorar la utilidad de realizar regularmente pruebas cortas
en un curso de estadstica. La asignatura consta de dos partes y el profesor realiza esta
prueba slo en una de ellas. Cuando acaba el curso, compara los conocimientos de los
estudiantes en las dos partes de la materia mediante un examen final y analiza su hiptesis
de que las pruebas cortas aumentan el nivel medio de conocimientos.
Los ejemplos propuestos tienen algo en comn. La hiptesis se formula sobre la poblacin,
y las conclusiones sobre la validez de esta hiptesis se basan en la informacin muestral.

Hiptesis Estadstica
Es cualquier enunciado, teora, conjetura, tentativa, afirmacin que se haga sobre una o ms
caractersticas poblacionales como un parmetro, la distribucin de probabilidad de una
poblacin, etc.

____________________
3

Newbold, Paul. Estadstica para los Negocios y la Economa. Pg. 281.

Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no
ser que se examine toda la poblacin. Esto, por supuesto, sera imprctico en la mayora de
las situaciones. En su lugar, se toma una muestra aleatoria de la poblacin de inters y se
utilizan los datos que contiene tal muestra para proporcionar evidencias que confirmen o no
la hiptesis.
La evidencia de la muestra que es inconsistente con la hiptesis planteada conduce a un
rechazo de la misma, mientras que la evidencia que apoya la hiptesis conduce a su
aceptacin. De ah que el aspecto principal de la prueba de hiptesis sea determinar si la
diferencia entre un valor propuesto de un parmetro poblacional y el valor estadstico de
la muestra se debe razonablemente a la variabilidad del muestreo. O si la discrepancia es
demasiado grande para ser considerada de esa manera, lo cual en el argot estadstico es
conocido como que la diferencia es significativa.
Considrese la siguiente situacin:
Se inspecciona una muestra de 150 productos de un enorme lote y se observa que el 7% de
ellos est defectuoso. El proveedor de dichos productos garantiz que un porcentaje igual al
5% de cualquier cargamento tendra defectos. La pregunta que se habr de contestar
mediante la prueba de hiptesis es si la informacin proporcionada por el proveedor es
verdadera.
Si la proposicin realmente es cierta, Cul sera la causa del hecho de que una muestra
sealara un 7% de partes defectuosas? Una posibilidad es que la causa sea la variabilidad
del muestreo. Si la decisin despus de efectuar el anlisis es aceptar la afirmacin del
proveedor, significa que la discrepancia entre el porcentaje de productos defectuosos
observado en la muestra y el porcentaje de elementos defectuosos propuesto se debe
razonablemente a la variabilidad del muestreo (al azar). Por el contrario, la decisin de
rechazar la afirmacin del proveedor, significa que la diferencia entre el valor observado y
el propuesto es demasiado grande como para deberse nicamente al azar.

Hiptesis Nula (H0)


Es la hiptesis que se considera cierta a no ser que se produzca suficiente evidencia en
contra, lo cual puede entenderse como mantener la hiptesis. Es la hiptesis que se plantea
para juzgar si puede ser o no rechazada. En general, se enuncia como hiptesis nula lo que
se viene aceptando, creyendo o asumiendo como lo que es cierto con anterioridad al
estudio.

Hiptesis Alternativa (H1)


Es la hiptesis que se plantea para oponerla a la hiptesis nula. Es un enunciado que ofrece
una alternativa a la proposicin en H0, es decir, afirma que la proposicin en la hiptesis
nula es falsa. En general, se enuncia en H1 lo que se presume que est sucediendo
(actualmente) y que ha cambiado con respecto a lo que se supona como verdadero
(anteriormente). En la prctica, esta es la hiptesis de inters para el investigador debido a
que representa generalmente la proposicin hipottica que l desea probar.

Ejemplo 2:
Supngase que una persona es llevada a juicio en un tribunal de justicia. Las hiptesis nula
y alternativa son:
H0: Es inocente
H1: Es culpable
Cuando la persona acusada es llevada ante un tribunal de justicia, en principio, goza de la
presuncin de inocencia (toda persona es inocente hasta que se demuestre lo contrario).
Como en la hiptesis nula se enuncia lo que se asume como cierto, en este caso H0: Es
inocente.
Por otra parte, en la hiptesis alternativa se plantea lo que se presume o se cree que es la
situacin actual y que ha cambiado con respecto a lo enunciado en H0 y es lo que se quiere
probar. De esta manera, debe plantearse bajo esta circunstancia que H1: Es culpable.

Por lo tanto, la acusacin debe presentar evidencia suficientemente clara como para
conseguir un veredicto de culpabilidad. Puede darse el caso de que no se rechace que el
enjuiciado sea inocente dado que no se han presentado suficientes evidencias.
En el contexto del contraste de hiptesis clsico, la hiptesis nula se considera cierta
inicialmente. La tarea de persuadirnos de lo contrario corresponde a los datos de la muestra.
La aceptacin de una hiptesis nula implica tan slo que los datos de la muestra no
proporcionan evidencia suficiente para rechazarla. Por otro lado, el rechazo implica que la
evidencia muestral la refuta.

Tipos de Hiptesis Nula y Alternativa


Para hacer ms general la exposicin, se denotar por al parmetro poblacional de inters
(por ejemplo, la media poblacional, la varianza o una proporcin) y por 0 para designar un
valor que puede tomar el parmetro .
Una hiptesis nula o alternativa, puede designar un nico valor, llamado 0, para el
parmetro poblacional . En este caso, se dice que la hiptesis es simple. La notacin
simblica para una hiptesis de este tipo es
H0: = 0
que se lee La hiptesis nula es que el parmetro poblacional es igual al valor especfico
0. Por ejemplo, en la situacin de los productos defectuosos de un gran lote, el
investigador podra comenzar el estudio con la hiptesis simple de que el porcentaje de
artculos defectuosos es igual a 5%.
Una hiptesis tambin puede designar un rango de valores para el parmetro poblacional
desconocido. Una hiptesis de este tipo se denomina compuesta y ser cierta para ms de
un valor del parmetro poblacional. Por ejemplo, la hiptesis nula de que el peso medio de
las cajas de cereales es al menos 200 gramos es compuesta. La hiptesis es cierta para
cualquier peso medio poblacional mayor o igual que 200 gramos.

En muchas situaciones, se contrasta una hiptesis nula simple, digamos, H0: = 0, frente a
una alternativa compuesta. En algunos casos, slo interesan alternativas a un lado de la
hiptesis nula. Por ejemplo, podra quererse contrastar esta hiptesis nula frente a la
hiptesis alternativa de que el verdadero valor de es mayor que 0, lo cual puede escribirse
como:

H1: > 0

Por el contrario, la alternativa de inters puede ser: H1: < 0


Las hiptesis alternativas de este tipo se denominan alternativas unilaterales. Otra
posibilidad es que se quiera contrastar esta hiptesis nula simple frente a la alternativa
general de que el valor de es cualquiera distinto de 0, es decir: H1: 0
sta se conoce como alternativa bilateral.
En resumen, se pueden tener las siguientes combinaciones de hiptesis nulas y alternativas:
1 1. H0: = 0 vs. H1: > 0
2 2. H0: = 0 vs. H1: < 0
3 3. H0: = 0 vs. H1: 0
4 4. H0: 0 vs. H1: > 0
5 5. H0: 0 vs. H1: < 0
6

Obsrvese que en la hiptesis nula siempre se encuentra la posibilidad de la igualdad del


planteamiento. Esto se debe a que, como se mencion anteriormente, la hiptesis nula
inicialmente se considera cierta.
Nota 1:
La especificacin de las hiptesis nula y alternativa apropiadas depende del problema.
Ejemplo 3:
Para ilustrar estos conceptos, se considerarn los ejemplos enunciados al principio de estas
notas:
1. Sea el peso medio poblacional (en gramos) de cereales por caja. La hiptesis nula es
que esta media es al menos 200 gramos, luego se tiene la hiptesis nula compuesta:
H0: 200

La alternativa obvia es que el verdadero peso medio es inferior a 200 gramos, es decir,
H1: < 200
1

2. La compaa resuelve aceptar envos de piezas siempre que no tenga evidencia para
sospechar que ms del 5% son defectuosas. Denotando por la proporcin poblacional
de piezas defectuosas. La hiptesis nula aqu es que esta proporcin es como mucho
0.05, es decir, H0: 0,05.

2
Basndose en la informacin muestral, se contrasta esta hiptesis frente a la alternativa
H1: > 0,05.
La hiptesis nula, entonces, es que el cargamento de piezas tiene una calidad adecuada,
mientras que la hiptesis alternativa es que no la tiene.
1

3. Supngase que la conjetura del profesor es que la realizacin de pruebas cortas


regularmente no produce diferencias en el promedio de las puntuaciones del examen
final. Denotando por la diferencia entre las puntuaciones medias poblacionales para
las dos partes del curso, con y sin pruebas cortas regulares. La hiptesis nula es,
entonces, una hiptesis simple:
H0: = 0
Sin embargo, el profesor puede sospechar que posiblemente los controles produzcan un
incremento en el promedio y, en consecuencia, querr contrastar la hiptesis nula frente
a la hiptesis alternativa:
H1: > 0

Despus de especificar las hiptesis nula y alternativa, y de recoger informacin muestral,


debe tomarse una decisin sobre la hiptesis nula. Las dos posibilidades son no rechazar
(aceptar) la hiptesis nula o rechazarla en favor de la alternativa. Con el fin de llegar a una
de estas conclusiones, se adopta una regla de decisin basada en la evidencia muestral.
Ms adelante se estudiaran reglas de decisin concretas.

Tipos de Errores que se pueden cometer en un Contraste de Hiptesis


Si slo se dispone de una muestra de la poblacin, entonces el parmetro poblacional no se
conocer con exactitud (Por qu?). Por consiguiente, no se puede saber con seguridad si la
hiptesis nula es cierta o falsa. Por tanto, cualquier regla de decisin adoptada tiene cierta
probabilidad de llegar a una conclusin errnea sobre el parmetro poblacional de inters.
Existen dos tipos de errores que son inherentes al proceso de contraste de hiptesis:
Error Tipo I: Consiste en rechazar la hiptesis nula (H0) cuando realmente es cierta
Error Tipo II: Consiste en aceptar la hiptesis nula (H0) cuando realmente es falsa
Si la regla de decisin es tal que P(cometer Error Tipo I ) = , es decir, la probabilidad de
rechazar la hiptesis nula cuando es cierta es , entonces se llama nivel de significacin
del contraste. Ntese que es una probabilidad condicional,
P(Rechazar H0 / H0 es cierta) =
Puesto que la hiptesis nula tiene que ser aceptada o rechazada, la probabilidad de aceptar
la hiptesis nula cuando es cierta es (1 ), es decir,
P(Aceptar H0 / H0 es cierta) = 1.
Por otro lado, la P(cometer Error Tipo II) = , es decir, la probabilidad de aceptar una
hiptesis nula falsa se denota por . Tambin puede verse como,
P(Aceptar H0 / H0 es falsa) =
Entonces, la probabilidad de rechazar una hiptesis nula falsa es (1), y se denomina
potencia del contraste. Visto como una probabilidad condicional,
P(Rechaza H0 / H0 es falsa) = 1.
En la Tabla 1 se resumen las situaciones posibles en un contraste de hiptesis al tomar la
decisin sobre la hiptesis nula.

Tabla 1.Situacin Real y decisiones sobre la hiptesis nula, con las probabilidades
Asociadas a cada decisin, dada una determinado situacin real

SITUACIN REAL
DECISIONES SOBRE LA HIPTESIS NULA

ACEPTAR H0
RECHAZAR H0

H0 VERDADERA
Decisin correcta

H0 FALSA
Error Tipo II

Probabilidad = 1

Probabilidad =

Error Tipo I

Decisin correcta

Probabilidad =

Probabilidad = 1

Ejemplo 4:
Haciendo referencia al ejemplo del juicio, se aclararn estas ideas. Se tiene que determinar
si la persona llevada a juicio a un tribunal de justicia es inocente o culpable. Como se
estableci ms atrs, se consider como hiptesis nula el que esta persona es inocente
contrastndose con la hiptesis alternativa de que es culpable. Cuando la decisin es
tomada se est en presencia de las situaciones expuestas en la Tabla 1.
Si el veredicto es que el acusado es declarado culpable, es decir, se rechaza H0, entonces
esta decisin puede ser la correcta si efectivamente esta persona es culpable. O por el
contrario, se puede estar ante la presencia de un Error Tipo I que en este caso significa que
se est condenando a una persona inocente!
Pero, si el veredicto declara que el acusado es inocente, en otras palabras, se acepta H0, esta
puede ser la decisin correcta si ciertamente esta persona no cometi el delito. O se puede
estar cometiendo un Error Tipo II, lo cual implica que se est declarando inocente a una
persona que realmente es culpable!

Ejercicio
Cul de los dos errores anteriores es ms grave? Justifique su respuesta.

Influencia de las Probabilidades y sobre una Prueba de Hiptesis


Evidentemente, lo ideal sera que las probabilidades de los dos tipos de error fuesen lo ms
pequeas posible. Sin embargo, hay una clara compensacin entre las dos. Cuando se ha
tomado una muestra, cualquier modificacin de la regla de decisin que haga menos
probable rechazar una hiptesis nula cierta, inevitablemente, se traducir en mayor
probabilidad de aceptar esta hiptesis cuando es falsa. En otras palabras, cuando decrece,
aumenta y viceversa.
Supngase que se quiere contrastar, basndose en una muestra aleatoria, la hiptesis nula
de que el verdadero peso medio del contenido de las cajas de cereales es al menos de 200
gramos: H0: 200. Dado un tamao muestral especfico, digamos n = 30 observaciones,
se puede adoptar la regla de decisin de rechazar la hiptesis nula si el peso medio en la
muestra es inferior a 185 gramos. Ahora, es fcil encontrar otra regla de decisin para la
cual, la probabilidad de cometer un error de Tipo I es menor. Si se modifica la regla de
decisin anterior para rechazar la hiptesis nula si el peso medio en la muestra es inferior a
180 gramos, se conseguir este objetivo.
Sin embargo, hay que pagar un precio. Si se usa la regla de decisin modificada, ser ms
probable aceptar la hiptesis nula, tanto si es cierta como si es falsa (Por qu?) Por tanto,
al disminuir la probabilidad de cometer un error de Tipo I, se ha aumentado la probabilidad
de cometer un error de Tipo II. La nica manera de disminuir simultneamente las dos
probabilidades de error ser obtener ms informacin sobre la verdadera media de la
poblacin, tomando una muestra mayor. Habitualmente, lo que se hace en la prctica, es
fijar la probabilidad de cometer un error de Tipo I a un nivel deseado, es decir, se fija el
nivel de significacin . Esto determina, entonces, la regla de decisin adecuada, que a su
vez determina la probabilidad de un error de Tipo II. Este procedimiento se ilustra en la
Figura 2.
Para ilustrar este procedimiento, considrese de nuevo el problema de contrastar, a partir de
una muestra de 30 observaciones, si el verdadero peso medio de las cajas de cereales es al

menos de 200 gramos. Dada una regla de decisin, se pueden determinar las probabilidades
de los errores de Tipo I y de Tipo II asociadas al contraste. Sin embargo, en realidad, se
procede fijando primero la probabilidad de error de Tipo I. Supngase, por ejemplo, que se
quiere asegurar que la probabilidad de rechazar la hiptesis nula cuando es cierta sea como
mucho 0,05. Esto se puede conseguir eligiendo un nmero, k, apropiado a la regla de
decisin rechazar la hiptesis nula si la media muestral es inferior a k gramos (ms
adelante se explicar cmo se puede hacer esto). Una vez elegido el nmero k, pueden
calcularse las probabilidades del error de Tipo II usando los procedimientos que se
expondrn ms adelante. As se puede observar que la regla de decisin queda determinada
por el nivel de significacin elegido.4
1

Nota 2:

Al usar el criterio de fijar la probabilidad de error Tipo I, , para encontrar una regla de
decisin; implcitamente se est considerando a este error ms grave que el error Tipo II.
As, al fijar en un valor pequeo, el investigador est controlando directamente la
probabilidad de cometer un error Tipo I. Por tal razn, al plantear las hiptesis siempre hay
que hacerlo tomando en cuenta esto ltimo, es decir, que rechazar la hiptesis nula cuando
es cierta es un error ms grave que aceptar la hiptesis nula cuando es falsa.

Terminologa adicional en el contraste de hiptesis


Estadstico de Contraste (o de Prueba)
Es aquella funcin de las observaciones muestrales que se usa para determinar si la
hiptesis nula debe ser aceptada o rechazada.

Regla de Decisin
Una regla de decisin define las condiciones que llevan a la aceptacin o rechazo de la
hiptesis nula.

Regin de Aceptacin
Es un rango de valores, tal que si el estadstico de prueba queda dentro, la hiptesis nula se
declara aceptable.

Regin de Rechazo
Es un rango separado de valores, tal que si el estadstico de prueba queda dentro, la
hiptesis nula se rechaza.

Valor(es) Crtico(s)
Los valores crticos son los nmeros que definen las fronteras de la regin de rechazo.
Cmo establecer los valores crticos?
Va a depender del:
1 1. nivel de significacin, .
2 2. tipo de distribucin de probabilidad del estadstico de contraste
3 3. tipo de hiptesis alternativa que se est contrastando (bilateral o unilateral)
Los valores crticos pertenecen a la regin de rechazo. En la Figura 3 de forma ilustrativa se
pueden apreciar las regiones de aceptacin y rechazo, como tambin los valores crticos
para las diferentes hiptesis alternativas.

Nota 3:
Los trminos aceptar (no rechazar) y rechazar son comnmente usados para las posibles
decisiones sobre la hiptesis nula en los resmenes formales de los resultados de un
contraste particular. Sin embargo, estos trminos no reflejan adecuadamente las
consecuencias de un procedimiento en el que se fija el nivel de significacin y no se
controla la probabilidad de un error de Tipo II. Como ya se ha sealado, la hiptesis nula
tiene estatus de hiptesis mantenida, una hiptesis que se considera cierta salvo que los
datos contengan suficiente evidencia en contra. Adems, al fijar el nivel de significacin,
generalmente en alguna probabilidad pequea, se est asegurando que el riesgo de rechazar
una hiptesis nula cierta sea pequeo.
Con esta estructura, una pequea cantidad de datos no ser suficiente para poderse colocar
en posicin de rechazar una hiptesis nula, aunque sea completamente errnea. Cuando
aumenta el nmero de observaciones, es decir, aumenta el tamao de la muestra, tambin lo

hace la capacidad de la tcnica de contraste para detectar una hiptesis nula falsa. Por tanto,
al aceptar una hiptesis nula, no se est asegurando necesariamente, que haya mucho en
su favor. Una afirmacin ms precisa sobre la situacin es los datos disponibles no
proporcionan suficiente evidencia para rechazar la hiptesis nula en lugar de se acepta la
hiptesis nula.
Se seguir usando aceptar como una manera eficiente de expresar esta idea, pero es
importante tener en cuenta la interpretacin de la frase. La situacin es muy similar a la de
un tribunal de justicia, donde el acusado, al principio, goza de la presuncin de inocencia, y
la acusacin debe presentar evidencia contraria lo suficientemente clara como para
conseguir un veredicto de culpabilidad. En el contexto del contraste de hiptesis clsico, la
hiptesis nula se considera cierta inicialmente. La tarea de persuadir de lo contrario
corresponde a los datos de la muestra.5

Casos Particulares
A continuacin se introducir la metodologa del contraste de hiptesis clsico. Supngase
que se dispone de una muestra aleatoria de n observaciones, X1, X2, , Xn, proveniente de
una poblacin con media y varianza 2. ( Tambin la varianza se denota S2 )

1. Contrastes para la Media Poblacional


El objetivo es contrastar una hiptesis sobre la media poblacional desconocida.
Asumiendo:
Poblacin con distribucin normal
Varianza poblacional, 2, conocida

Se comenzar con el problema de contrastar la hiptesis nula de que la media poblacional


es igual a cierto valor, 0. Esta hiptesis se representa:
H0: = 0
Supngase que la hiptesis alternativa de inters es que la media poblacional supera este
valor especfico, es decir, H1: > 0

Es natural que el contraste sobre la media poblacional, se base en la media muestral

. En

este caso particular, el investigador desconfiar de la veracidad de una hiptesis nula, frente
a esta alternativa, si la media muestral observada fuese mucho mayor que 0.
La idea es buscar la forma de un contraste con un nivel de significacin prefijado.

digamos representada por la v. a. X, se distribuye normalmente, X ~ N(, 2). Por tal


razn, la variable aleatoria ( v . a).

Cuando la hiptesis nula es cierta, es igual 0, y en consecuencia, la variable aleatoria

La variable Z de la ecuacin (1) es lo que se llamar Estadstico de Contraste en este caso


particular.
Ahora, se rechazar la hiptesis nula si la media muestral es mucho mayor que el valor 0
postulado para la media poblacional. Por tanto, H0 ser rechazada si se observa un valor alto
para el estadstico de contraste en la ecuacin (1)
Se quiere fijar en la probabilidad de rechazar la hiptesis nula cuando es cierta. Al igual
que en la parte correspondiente a intervalos de confianza, se denotar por z el nmero para
el cual P(Z > z) =
que significa, que cuando la hiptesis nula es cierta, la probabilidad de que el estadstico de
prueba Z sea mayor que z es .
Por tanto, denotando por
de decisin:

a la media muestral observada y si se adopta la siguiente regla

entonces la probabilidad de rechazar H0 cuando es cierta ser , luego es el nivel de


significacin del contraste basado en esta regla de decisin.
Esta situacin se observa en la Figura 4, la cual ilustra la distribucin muestral del
estadstico de contraste en ecuacin (1) cuando la hiptesis nula es cierta, mediante un
grfico de su funcin de densidad. En la figura se seala el valor crtico z, tal que la
probabilidad de superarlo, cuando la hiptesis nula es cierta, es el nivel de significacin del
contraste. Esto significa que la probabilidad de obtener un resultado muestral en la
correspondiente regin de rechazo, rea sombreada de la figura, debe ser cuando la
hiptesis nula es cierta

Ejemplo 5:
Cuando un proceso de produccin de bolas de rodamiento funciona correctamente, el peso
de las bolas tiene una distribucin normal con media cinco gramos y desviacin estndar
0,1 gramos. Se lleva a cabo una modificacin del proceso, y el director de la fbrica
sospecha que esto ha incrementado el peso medio de las bolas producidas, sin modificar la
desviacin estndar. Se toma una muestra aleatoria de 16 bolas, y se comprueba que su
peso medio es de 5,038 gramos.
a. Son vlidas las sospechas del director de la fbrica? Use un nivel de significacin del
5%
b. Responda la pregunta anterior usando, ahora, un nivel de significacin del 10%
Solucin:
a. Poblacin: Peso (en gramos) de las bolas de rodamiento producidas en una fbrica
Denotando por el peso medio (en gramos) de las bolas de rodamientos, se quiere
contrastar H0: = 5 frente a H1: > 5
Por qu son esas las hiptesis?
La regla de decisin es:

De esta manera,

Para un contraste de nivel 5%, en las tablas estadsticas se puede hallar que
Z0,05 = 1,645
Como 1,52 no es mayor que 1,645, no se puede rechazar la hiptesis nula para un nivel de
significacin del 5%, es decir, se acepta la hiptesis nula con este nivel de significacin. En
otras palabras, si se usa un contraste que nos asegure que la probabilidad de rechazar la
hiptesis nula cuando es cierta es 0,05; los datos de la muestra no contienen suficiente
evidencia como para rechazar esta hiptesis.
En trminos del problema, se puede decir que no se han encontrado evidencias en la
muestra que apoyen la sospecha del director de la fbrica en cuanto a que las
modificaciones en el proceso han incrementado el peso medio de las bolas de rodamiento
producidas.
b. Para un contraste de nivel 10%, se tiene que
Z0,10 = 1,28
Como 1,52 es mayor que 1,28, se rechaza la hiptesis nula para un nivel de significacin
del 10%. Hasta aqu, existe una cierta evidencia en los datos que sugiere que el verdadero
peso medio supera los 5 gramos.
Qu es lo que se entiende por el rechazo de una hiptesis nula?
En el ejemplo anterior, la hiptesis de que el peso medio en la poblacin es 5 gramos fue
rechazada por un contraste con nivel de significacin 0,1. Desde luego, esto no significa
que se haya probado que la verdadera media supera los 5 gramos. Partiendo slo de la
informacin muestral, nunca ser posible asegurar nada sobre un parmetro poblacional.
Por el contrario, se puede pensar que los datos suscitan cierta duda sobre la veracidad de la
hiptesis nula. Si esta hiptesis fuese cierta, entonces el valor observado representara
una observacin de una distribucin normal estndar

.Al contrastar hiptesis, lo que realmente se est cuestionando es la verosimilitud


(probabilidad) de observar un valor tan extremo si la hiptesis nula fuese cierta.
En el ejemplo anterior, se vio que la probabilidad de observar un valor mayor que 1,28 es
0,1. Por tanto, al rechazar la hiptesis nula, se est diciendo que la hiptesis nula es falsa o
que se ha observado un suceso poco verosmil (que ocurrira slo con la probabilidad que
especifica el nivel de significacin). Es en este sentido en el que la informacin muestral
despierta dudas sobre la hiptesis nula.
Obsrvese que en el ltimo ejemplo, la hiptesis nula fue rechazada al nivel de
significacin 0,10 pero no fue rechazada al menor nivel 0,05. Al rebajar el nivel de
significacin, se est reduciendo la probabilidad de rechazar un hiptesis nula cierta y, en
consecuencia, se est modificando la regla de decisin para hacer menos verosmil que se
rechace la hiptesis nula, tanto si es cierta como si no.
Obviamente, cuanto menor sea el nivel de significacin al cual puede rechazarse una
hiptesis nula, mayor ser la duda sobre su veracidad. En lugar de contrastar hiptesis con
niveles de significacin asignados de antemano, los investigadores suelen determinar el
menor nivel de significacin al cual puede rechazarse la hiptesis nula.

Valor p
Es el nivel de significacin ms pequeo que conduce al rechazo de la hiptesis nula H0.
El valor p seala la probabilidad (suponiendo que H0 sea cierta) de obtener un valor del
estadstico de prueba, por lo menos tan extremo como el obtenido.
Por tanto, de acuerdo con la regla de decisin en el problema anterior, se rechaza la
hiptesis nula para cualquier nivel de significacin tal que z sea mayor que 1,52. El
valor p del contraste viene dado en este caso por p = P(Z>1.52), que al usar las tablas
estadsticas se encuentra que p = 0,0643. La implicacin es que la hiptesis nula puede ser
rechazada para todos los niveles de significacin mayores que 6,43%.

Este procedimiento compara la probabilidad, llamada valor p, con el nivel de significancia


. Si el citado valor p es menor que dicho nivel, H0 se rechaza. Si tal valor es mayor que el
nivel en cuestin, H0 se acepta.

Interpretacin del peso de las evidencias contra H0


Si el valor p es menor que6:
a. 0.10, se tiene regular evidencia de que H0 no es verdadera.
b. 0.05, se tiene fuerte evidencia de que H0 no es verdadera.
c. 0.01, se tiene muy fuerte evidencia de que H0 no es verdadera.
d. 0.001, se tiene evidencia extremadamente fuerte de que H0 no es verdadera.
Nota 4:
En los ltimos aos este concepto ha adquirido gran relevancia. Todos los programas
estadsticos modernos proporcionan valores p, y algunas calculadoras de bolsillo permiten
su cmputo. En consecuencia, actualmente, los estudios aplicados suelen proporcionar
valores p.
Supngase ahora, que en lugar de una hiptesis nula simple, se quiere contrastar la
hiptesis nula compuesta frente a la alternativa: H0: 5 vs H1: > 5
al nivel de significacin . Para la regla de decisin desarrollada en el caso de la hiptesis
nula simple, se vio que si la media de la poblacin es precisamente 0, entonces la
probabilidad de rechazar la hiptesis nula es . Para esta misma regla de decisin, si la
verdadera media de la poblacin es menor que 0, parece an menos verosmil rechazar la
hiptesis nula. Por tanto, usar esta regla de decisin en el presente contexto garantiza que la
probabilidad de rechazar la hiptesis nula compuesta cuando es cierta es como mucho .
Supngase ahora, que en lugar de una hiptesis nula simple, se quiere contrastar la
hiptesis nula compuesta H0: 5 frente a alternativa H1: > 5
al nivel de significacin . Para la regla de decisin desarrollada en el caso de la hiptesis
nula simple, se vio que si la media de la poblacin es precisamente 0, entonces la
probabilidad de rechazar la hiptesis nula es . Para esta misma regla de decisin, si la

verdadera media de la poblacin es menor que 0, parece an menos verosmil rechazar la


hiptesis nula. Por tanto, usar esta regla de decisin en el presente contexto garantiza que la
probabilidad de rechazar la hiptesis nula compuesta cuando es cierta es como mucho .
6 Tomado

de Mason-Lind-Marchal. Estadstica para Administracin y Economa. Pg. 322.

Procedimiento general para la prueba de hiptesis


Pasos para la contratacin de una hiptesis:
1

1. Formulacin de hiptesis

2. Especificacin de un valor de probabilidad crtico o nivel de significacin.

3. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba


las hiptesis.

4. Establecimiento de una zona de rechazo para Ho.

5. Cmputos necesarios.

6. Decisin.
Tabla 1 Parmetros y estadsticos de prueba mas comunes

Tabla 2 Estadsticos de prueba para algunos parmetros poblacionales

Prueba de hiptesis acerca de la media poblacional cuando la muestra


proviene de una poblacin distribuida normalmente y con varianza conocida.
Ejemplo. Un mdico traumatlogo afirma que el contenido de calcio en
los huesos de mujeres que padecen osteoporosis despus de aplicrsele
cierto tratamiento es mayor al valor promedio observado para la
poblacin femenina que padece est enfermedad, el cual se sabe es
igual a 270 mg/g con una desviacin de 120 mg/g. Para probar su
premisa el investigador determin el contenido de calcio en los huesos
de 36 individuos que fueron sometidos al tratamiento y pudo determinar
que dicha muestra arroja un valor promedio de calcio igual a 310 mg/g.
La

concentracin

de

calcio

es

una

variable

que

se

distribuye

normalmente.
Las hiptesis de investigacin son las siguientes:
Ho : El tratamiento para la osteoporosis no tiene ningn efecto
H1 : El tratamiento para la osteoporosis aumenta los niveles de calcio en
los huesos.
Prueba de las hiptesis estadsticas
a. Formulacin de hiptesis. Ho : = 270 frente a H1 : > 270
b. Especificacin de un valor de probabilidad crtico o nivel de
significacin. = 0.05
c. Eleccin de un estadstico de la muestra y de su distribucin para
someter a prueba las hiptesis.
Puesto que el parmetro involucrado en la docimasia es la media
poblacional , y la variable se distribuye normalmente con varianza
conocida lo ms conveniente es usar como estadstico de prueba la
media muestral en su forma derivada Z.

d. Establecer una zona de aceptacin para Ho.


Como H1: > o se trata de una prueba de una cola hacia la derecha,
siendo la zona de

aceptacin la siguiente: ZA = {Z / Z < z

(1)

e. Cmputos (clculos) necesarios:

f. Decisin:
Como z = 2 > z(0.95) = 1.65 el valor del estadstico de prueba se
encuentra dentro de la zona de rechazo. Por lo tanto se concluye que
los datos proporcionan suficiente evidencia para rechazar Ho.
La informacin obtenida de la muestra permite afirmar que se tiene
un 95% de confianza que el tratamiento aplicado a los pacientes
enfermos de osteoporosis aumenta el nivel de calcio en los tejidos
seos.

La informacin obtenida de la muestra permite afirmar que se tiene un 95% de confianza


que el tratamiento aplicado a los pacientes enfermos de osteoporosis aumenta el nivel de
calcio en los tejidos seos.

Prueba de hiptesis acerca de la media poblacional cuando la muestra


proviene de una poblacin distribuida normalmente, con varianza desconocida
y tamao de muestra grande (n > 30).
Ejemplo. Un entomlogo sospecha que en cierta zona endmica para el
dengue el valor de la tasa neta reproductiva (Ro) de una poblacin del
mosquito Aedes aegypti vector de dicha enfermedad, ha cambiado en
relacin con el valor determinado hace 5 aos el cual era igual a 205
individuos. Con tal propsito determin el valor de Ro a 40 hembras
criadas en el laboratorio y pertenecientes a una cepa desarrollada a
partir de mosquitos capturados en la zona estudiada. Los resultados
fueron los siguientes:

El investigador sabe que la variable se distribuye normalmente y quiere someter a prueba su


hiptesis no queriendo equivocarse en ms del 5% de las veces.
Las hiptesis de investigacin son las siguientes:
Ho : La tasa neta de reproduccin no ha cambiado
H1 : La tasa neta de reproduccin se modific despus de cinco aos.
Prueba de las hiptesis estadsticas
a. Formulacin de hiptesis
Ho : = 205
H1 : 205 (Analice porque la hiptesis alternativa es de diferencia)
b. Especificacin de un valor de probabilidad crtico o nivel de significacin.
El nivel de significacin especificado es = 0.05
c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las
hiptesis.
Puesto que el parmetro involucrado en la docimasia es la media poblacional , y la
variable se distribuye normalmente con varianza desconocida y el tamao de la muestra
grande lo ms conveniente es usar como estadstico de prueba la media muestral en su
forma derivada Z. El valor de la desviacin de la muestra se usa para estimar el
valor de .

d. Establecer una zona de aceptacin para Ho.


Como H1: o se trata de una prueba de dos colas, siendo la zona de aceptacin la
siguiente:
ZR = {Z / -z(1/2) < Z < z (1/2)}
e. Cmputos necesarios.
e.1) Media: 202.9

e.2) Desviacin estndar: s = 36.17


e.3) Estadstico de prueba:

e.4) Zona de aceptacin:


ZA = {Z / -z(1/2) < Z < z

} = {Z / -z (0.975) < Z < z


Z < + 1.96}

(1/2)

} = {Z / -1.96 <

(0.975)

f. Decisin:
Como z = -0.35, el valor del estadstico de prueba se encuentra dentro de la zona de
aceptacin de Ho. Por lo tanto se concluye que los datos no proporcionan suficiente
evidencia para rechazar Ho

La sospecha del investigador que la tasa de reproduccin de la poblacin de mosquito se


haba modificado fue rechazada con un 95% de confianza a la luz de la informacin
proporcionada por la muestra.

Prueba de hiptesis acerca de la media poblacional cuando la muestra proviene de


una poblacin distribuida normalmente, con varianza desconocida y tamao de
muestra pequeo (n < 30).

Ejemplo. Un ecofisilogo vegetal desea verificar si el contenido de nitrgeno en las hojas


jvenes de la especie Rhizophora mangle, es menor en las plantas que viven en una zona
ambientalmente protegida con relacin al de plantas que viven en una zona que est siendo
afectada por la contaminacin con fertilizantes y cuyo valor promedio se cuantific en 14.6
mg/g de nitrgeno. El anlisis de 25 hojas jvenes provenientes de la zona protegida
produjo los resultados siguientes:

Si la concentracin de nitrgeno se distribuye normalmente, apoya la evidencia


proporcionada por la muestra la presuncin que las plantas de la zona protegida contienen
menos nitrgeno?. El error tipo I no debe ser mayor al 1%.
Las hiptesis de investigacin son las siguientes:
Ho : La concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle en ambas
regiones es la misma
H1 : La concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle es menor en
la regin protegida.
Prueba de las hiptesis estadsticas
a. Formulacin de hiptesis
Ho : = 14.6
H1 : < 14.6
b. Especificacin de un valor de probabilidad crtico o nivel de significacin.
El nivel de significacin especificado es = 0.01
c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las
hiptesis.

Puesto que el parmetro involucrado en la docimasia es la media poblacional , y la


variable se distribuye normalmente con varianza desconocida y el tamao de la muestra
es pequeo lo ms conveniente es usar como estadstico de prueba la media muestral en
su forma derivada T. El valor de la desviacin de la muestra se usa para estimar el
valor de .
1
d. Establecer una zona de aceptacin para Ho.
Como H1: < o se trata de una prueba de una cola hacia la izquierda, siendo la zona
de aceptacin la siguiente:

ZA = {T / T > - t ( 1; n-1) }
e. Cmputos necesarios.
e.1) Media: x= 10.48
e.2) Desviacin estndar: s = 2.41
e.3) Estadstico de prueba:

e.4) Zona de aceptacin:


ZA = {T / T > -t(1; n-1) } = {T / T > -t(0.99; 24)} = {T / T > -2.492}
1 f. Decisin:
Como t = - 8.55 < -t(0.99; 24) = -2.492 el valor del estadstico de prueba se encuentra
dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos
proporcionan suficiente evidencia para rechazar Ho
De acuerdo a la informacin obtenida de la muestra se puede afirmar con un 99%
de confianza que la concentracin de nitrgeno en las hojas jvenes de
Rhizophora mangle en ambas regiones es la misma.

Regresin y Correlacin Lineal Simple


Si sabemos que existe una relacin entre una variable denominada dependiente y otras
denominadas independientes (como por ejemplo las existentes entre: la experiencia
profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de
personas, la produccin agraria y la cantidad de fertilizantes utilizados, etc.), puede
darse el problema de que la dependiente asuma mltiples valores para una combinacin
de valores de las independientes.
La dependencia a la que hacemos referencia es relacional matemtica y no
necesariamente de causalidad. As, para un mismo nmero de unidades producidas,
pueden existir niveles de costo, que varan empresa a empresa.
Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresin en los cuales
se obtiene una nueva relacin pero de un tipo especial denominado funcin, en la cual la
variable independiente se asocia con un indicador de tendencia central de la variable
dependiente. Cabe recordar que en trminos generales, una funcin es un tipo de
relacin en la cual para cada valor de la variable independiente le corresponde uno y
slo un valor de la variable dependiente.

Regresin Lineal Simple y Correlacin


La Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar para
solucionar problemas comunes.
Muchos estudios se basan en la creencia de que es posible identificar y cuantificar
alguna Relacin Funcional entre dos o ms variables, donde una variable depende de la
otra variable.
Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un
modelo de Regresin Simple.
"Y es una funcin de X"
Y = f(X)
Como Y depende de X, Y es la variable dependiente, y X es la variable independiente.

En el Modelo de Regresin es muy importante identificar cul es la variable


dependiente y cul es la variable independiente.
En el Modelo de Regresin Simple se establece que Y es una funcin de slo una
variable independiente, razn por la cual se le denomina tambin Regresin Bivariada
porque slo hay dos variables, una dependiente y otra independiente y se representa as:
Y = f (X)
"Y depende de X"
La variable dependiente es la variable que se desea explicar, predecir. Tambin se le
llama Variable Respuesta.
La variable Independiente X se le denomina Variable Explicativa y se le utiliza para
Explicar Y.

Anlisis Estadstico: Regresin Lineal Simple


En el estudio de la relacin funcional entre dos variables poblacionales, una variable X,
llamada independiente, explicativa o de prediccin y una variable Y, llamada
dependiente o variable respuesta, presenta la siguiente notacin:
Y=A+BX+E
Donde:
A es el valor de la ordenada donde la lnea de regresin se intercepta con el eje
Y.
B es el coeficiente de regresin poblacional (pendiente de la lnea recta)
E es el error.

Suposicin de la regresin Lineal


1.Los valores de la variable independiente X son fijos, medidos sin error.
2.La variable Y es aleatoria

3.Para cada valor de X, existe una distribucin normal de valores de Y


(subpoblaciones Y)
4.Las variancias de las subpoblaciones Y son todas iguales.
5.Todas las medias de las subpoblaciones de Y estn sobre la recta.
6.Los valores de Y estn normalmente distribuidos y son estadsticamente
independientes.
Estimacin de la ecuacin de regresin muestral
Consiste en determinar los valores de "a" y "b" a partir de la muestra, es decir, encontrar
los valores de a y b con los datos observados de la muestra. El mtodo de estimacin es
el de Mnimos Cuadrados, mediante el cual se obtiene:

Luego, la ecuacin de regresin muestral estimada es:

Interpretacin de:
a es el estimador de A. Es el valor estimado de la variable Y cuando la variable X = 0
b es el estimador de B , es el coeficiente de regresin. Est expresado en las mismas
unidades de Y por cada unidad de X. Indica el nmero de unidades en que vara Y
cuando se produce un cambio, en una unidad, en X (pendiente de la recta de regresin).
Un valor negativo de b sera interpretado como la magnitud del decremento en Y por
cada unidad de aumento en X.

Ejemplo
Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de
una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observ el
peso de una persona seleccionada de entre el grupo con dicha estatura, resultando:

X 152 155 152 155 157 152 157 165 162 178 183 178
Y

50 61.5 54.5 57.5 63.5 59

61

72

66

72

84 82

Con estos datos vamos a plantear una ecuacin de regresin simple que nos permita
pronosticar los pesos conociendo las estaturas.
Desarrollo:

Representacin matemtica y grfica de los datos:


Representacin Matemtica
I.C. para la I. C. individual
media

estatura

pesos

Regresin Lineal

datos

x ^2

y ^2

xy

y est.

Residual

152

50

23104

2500

7600

56.43

155

61.5

24025

3782.3

9532.5

152

54.5

23104

2970.3

155

57.5

24025

157

63.5

152

L. S.

L. I.

L. S.

-6.43

53.07 59.79

47.30

65.56

59.03

2.47

56.09 61.97

50.05

68.02

8284

56.43

-1.93

53.07 59.79

47.30

65.56

3306.3

8912.5

59.03

-1.53

56.09 61.97

50.05

68.02

24649

4032.3

9969.5

60.77

2.73

58.05 63.48

51.85

69.68

59

23104

3481

8968

56.43

2.57

53.07 59.79

47.30

65.56

157

61

24649

3721

9577

60.77

0.23

58.05 63.48

51.85

69.68

165

72

27225

5184

11880

67.71

4.29

65.17 70.24

58.85

76.57

162

66

26244

4356

10692

65.11

0.89

62.65 67.56

56.27

73.94

10

178

72

31684

5184

12816

78.99

-6.99

74.65 83.33

69.45

88.52

11

183

84

33489

7056

15372

83.32

0.68

78.01 88.64

73.31

93.34

12

178

82

31684

6724

14596

78.99

3.01

74.65 83.33

69.45

88.52

Representacin Grfica

L. I.

De acuerdo al desarrollo matemtico hemos obtenido los siguientes clculos:

Lo que nos permite obtener los coeficientes a y b.


Luego,
b = 1223 / 1409.667 = 0.8676
a = 65.25 (0.8676) (162.167) = -75.446
Interpretacin:

La ecuacin de regresin estimada es:

Coeficiente de correlacin: R= 0.9379


Coeficiente de determinacin: R=0.8796

El valor de b = 0.8676 indica el incremento del peso en kilogramos, en promedio, por


cada centmetro de aumento en la estatura de los hombres adultos.
El valor de a, no tiene interpretacin prctica en el ejemplo, se interpretara como el
valor obtenido, en promedio, para el peso Y, cuando la estatura es 0.
Utilizando la ecuacin de regresin para estimar o predecir valores de la variable Y:
Para una talla de 180 se obtiene un peso de 80.7 kg.
Cunto se espera que pese (en promedio) una persona que mide 1.60 m?
Sustituyendo el valor de inters en la ecuacin:

Se obtiene:

Conclusin:
De acuerdo a la grfica de dispersin y la ecuacin de Regresin Lineal estimada para
las variables estatura y peso muestran, que las variables peso y estatura estn
correlacionadas.
Esta relacin se ha estimado en un R = 93.7, que indica una fuerte relacin positiva.
Adems si consideramos el coeficiente de determinacin R = 87.9 podemos indicar que
el 87.9% de las variaciones que ocurren en el peso se explicaran por las variaciones en
la variable estatura.

FUENTES CONSULTADAS:
1

Armas, J. (1992) Estadstica Sencilla. Probabilidades. Mrida:

FACES-ULA.
2

Newbold, P. (1998) Estadstica para los Negocios y la

Economa. Madrid: Prentice Hall.


3

Ya-Lun Chou. (1992) Anlisis Estadstico. Mxico: Editorial

Interamericana.
4

Walpole, R. y Myers, R. (1992) Probabilidad y Estadstica.

Mxico, D.F.: Editorial Interamericana.


5

Canavos, G. (1988) Probabilidad y Estadstica. Aplicaciones y

Mtodos. Espaa: McGraw-Hill / Interamericana.


6

Berenson, M., Levine, D. y Krehbiel, T. (2001) Estadstica

para Administracin. Mxico: Pearson Educacin.


7

Mason, R., Lind, D. y Marchal, W. (2001) Estadstica para

Administracin y Economa. Mxico, D.F.: Alfaomega.


8

Stevenson,. W. (1981) Estadstica para Administracin y

Economa. Mxico, D.F.: Harla.


9

Montgomery, D. y Runger, G. (2000) Probabilidad y

Estadstica: aplicadas a la Ingeniera. Mxico, D.F.: McGraw-Hill /


Interamericana.
10

amsey, F. y Schafer, D. (2002) The Statistical Sleuth. USA:


Duxbury.

11

Pgina WEB.

También podría gustarte